新四季網

一種語音識別方式獲取出版物內容的方法

2023-09-10 04:40:40 2

專利名稱:一種語音識別方式獲取出版物內容的方法
技術領域:
本發明涉及智能終端和系統軟體,語音識別技術領域,更具體地說,涉及一種語音識別方式獲取出版物內容的方法。
背景技術:
隨著移動通信業務的發展,特別是第三代移動通信業務技術的發展,移動通信與網際網路結合越來越緊密,移動增值業務益發豐富。在這種移動通信業務大發展的情況下,各個運營商都在大力進軍增值業務領域,嘗試建立各種移動通信增值業務平臺。傳統出版物媒體非常豐富,各種媒體刊物內容繁多,很多用戶想保存部分或全部內容,傳統方式是複印或購買出版物進行保存,對於用戶來說非常不便,而移動終端的發展可以方便的獲取出版物對應的電子版本的內容和進行小額的計費,同時,語音識別技術的發展,提供了基於終端和系統的語音識別能力,通過語音獲取文本進行自動化的搜索和內容的推送,解決了用戶快速獲取出版物內容的需求。

發明內容
通過用戶口述出版物部分內容在終端或請求系統進行語音識別和解析斷句獲取對應文本內容,並通過系統後臺進行內容的搜索,獲取出版物電子版本並推送到用戶預設或系統的存儲空間,為用戶提供了使用簡單快捷的一種語音識別方式獲取出版物內容的方法。
具體來說具有以下優點 使用方式簡單
用戶簡單地口述出版物部分語句即可獲取對應出版物內容,無需出版物進行編碼等配合,系統自動進行語句的識別,解析和識別,實現方式簡單便捷。雲模式識別
滿足不同能力的終端,可以在終端進行語音的識別,也可以通過系統端的語音識別服務進行語音識別,滿足了不同硬體層次能力的終端。存儲方式靈活
存儲方式滿足多種方式,用戶可以靈活指定各種方式存儲系統推送的電子化內容,包含郵件,網上空間(網絡硬碟等)。多層次獲取粒度
根據識別出版物內容所在部分,如正文,標題,書籍封面文字,系統判斷內容是整個出版物還是出版物的一部分,如一本書中的一篇文章。自動推送和保存
用戶觸發業務後,系統將自動推送內容到用戶綁定的存儲空間或者用戶設定的郵箱等個人存儲空間,獲取的內容的粒度多樣,根據用戶的選擇可以是出版物的部分內容也可以是全部出版物的內容。


此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用於解釋本發明,並不構成對本發明的不當限定。在附圖中
圖1為本發明系統模塊結構的示意圖。圖2為本發明業務流程示意圖。圖3為本發明用戶註冊流程。圖4為本發明用戶計費流程示意圖。圖5為本發明語音識別流程示意圖。
具體實施例方式下面參照附圖對本發明進行更全面的描述,其中說明本發明的示例性實施例。為實現上述目的,提出了一種語音識別方式獲取出版物內容的方法。以下通過結合附圖,對本發明的實施方式進行描述實現一種語音識別方式獲取出版物內容的方法的關鍵點如下 語音獲取
用戶通過終端麥克風錄下用戶選取和口述的出版物部分片段內容並編碼壓縮成語音識別接受的語音格式,內容範圍包含封面,標題,正文內容的一部分,對應整本書,一篇文章,系統約定用戶選取範圍為一個以上的完整的句子,以保證斷句和選取關鍵語句,關鍵詞的成功率。語音識別
用戶口述文字啟動語音識別,識別模塊在終端或系統端,根據終端能力在終端安裝語音識別庫進行語音識別,或系統端提供語音識別能力並以服務形式進行開放,終端請求系統端的語音識別服務,提交記錄的語音數據,系統進行語音識別。智能斷句
在識別部分文字後,系統將根據文字語義和標點符號,截取完整的句子或多個詞語作為搜索的關鍵詞,智能進行斷句和提取搜索關鍵詞。全文檢索
系統在獲取用戶掃描的文本並進行斷句後的關鍵句或關鍵詞,在系統資料庫進行全文檢索,搜索系統內和和系統具有接口的第三方存儲系統,並將搜索結果提供給業務邏輯模塊進行處理。網絡推送和保存
用戶觸發請求數字資源業務,系統成功查詢和獲取到用戶請求的數字資源後,系統根據用戶預置的推送邏輯將數字內容進行推送到用戶預置的媒體空間或者根據用戶的選擇保存在系統,系統為用戶分配對應數字資源的訪問權限,用戶通過系統分配的權限對該資源進行存取。
分布式查詢
內容存儲系統由集中式存儲和分布式存儲構成,用戶的請求首先在本地集中存儲系統進行查詢,如未查詢到則根據用戶請求的內容定向到對應的存儲平臺進行獲取,獲取成功後保存該對象的副本在本地集中式存儲系統中供其他用戶的快速獲取。
主要功能模塊如圖1所示 移動終端側
終端是指具備移動網際網路網功能和相機的各種智能終端設備,包含智慧型手機,帶移動數據功能的平板電腦等設備; 終端本地存儲100
保存終端數據的資料庫,包含各種應用數據,系統數據等,並提供數據存取的接口。業務邏輯101
終端業務邏輯,執行和完成各個業務的邏輯功能,並與周邊的各個功能模塊進行數據的傳遞和功能的調用。錄音模塊102
調用終端音頻功能和麥克風記錄用戶語音,並轉換為識別服務模塊要求的語音格式, 提供給識別模塊進行內容的識別。語音識別模塊103
終端側可選模塊,負責識別用戶口述的語音內容,並將其轉換為文字提供給搜索等其他功能模塊。消息模塊104
終端側負責收發系統各種消息,並提供給其他邏輯模塊,給用戶進行消息的提示和查看。服務請求模塊105:
與系統遠程服務的接口,終端通過請求遠程系統提供各種服務功能,包含識別服務等。認證模塊106:
負責管理用戶的鑑權認證數據,發起和提交終端的鑑權和認證數據到系統進行鑑權, 並接收對應的鑑權認證消息。接口模塊 107:
終端與系統之間的數據接口,通過接口發送和接收系統端的服務響應消息的各種數據。用戶參數配置管理模塊108
終端側用戶進行各種用戶參數和業務參數的配置,包含用戶數據配置,業務參數配置, 包含保存內容空間的設置,用戶的付費參數等。傳輸通道109
包含移動網和網際網路,承載數據傳輸通道和各種業務,傳輸終端和系統之間的各種數據。用戶資源空間110 用戶設定的用於保存數字資源的網絡空間,可以是郵件、網絡空間, 網絡硬碟等可以通過網絡進行存取的網絡空間,用戶需授權系統進行用戶空間的存取或者將資源保存在系統平臺,系統平臺分配用戶的訪問權限。資源資料庫111:
系統中負責保存本地的數字資源的資料庫,提供各種資料庫的管理功能如信息的查詢,增加,刪除等功能。數據接口模塊Il2 :
負責與移動終端通過數據網進行通信,獲取移動終端提交的編碼信息和系統與業務請求交互的各種數據信息。行動網路接口 113:
負責與移動通信網的網元,與行動網路核心網各個網元進行通訊,包含核心網計費系統,客戶管理系統等。外部內容系統接口 114:
系統與第三方內容系統如出版內容系統之間的接口,可以是自動化的消息傳遞、文件同步或者手動的消息或文件同步,負責傳送和同步系統為出版內容對應數字資源的電子版本。安全模塊115:
負責系統業務安全管理,對應終端側的鑑權認證模塊的用戶鑑權認證的驗證,數據傳輸的安全,包含數據的加密解密等涉及業務安全的各種功能。數據推送模塊116:
系統中負責將查詢到的數字資源的內容推送到用戶預置的保存空間並將推送的結果狀態返回給調用模塊。業務邏輯模塊117:
根據用戶提交的各種信息和數據執行對應的業務邏輯的各種功能並負責與其周邊的模塊進行通信並交換各種數據。用戶管理模塊118:
管理系統用戶的各種數據,設置用戶的各種權限及參數,對終端用戶提供終端參數設置界面和設置功能,管理和設置用戶空間地址,空間管理參數如轉發,容量等參數。系統計費模塊119:
根據用戶獲取的內容對發起業務的移動終端進行計費並生成消費記錄,計費方式可以是運營商計費或第三方支付系統計費。系統識別模塊120
系統負責識別終端側發送的原始數據內容,通過接口服務,終端遠程調用系統識別模塊的識別服務,並將識別結果提交給其他功能模塊以繼續下一步流程。數據搜索模塊121
根據用戶的搜索請求進行查詢或搜索,搜索範圍是本地資料庫或者分布式資料庫,並將搜索結果返回給系統。消息模塊122 負責發送各種消息給終端,系統端的各個功能模塊通過消息模塊與終端進行消息的傳遞。第三方支付系統123
第三方支付系統,提供系統外的支付方式,通過支付系統的各種調用方式接口完成支付的請求和支付狀態的獲取,以及資金的劃轉。系統管理模塊124
對整個系統進行管理和配置,包含用戶管理,日誌記錄和管理,業務邏輯的管理等等。終端門戶125
提供終端業務入口,為終端用戶使用業務提供業務使用和管理界面的各種數據,是終端登入的顯示門戶。系統門戶126
提供業務平臺用戶的入口,為平臺用戶管理平臺提供業務管理界面、 參數配置等管理功能;
下面舉一個例子來說明本發明系統的移動終端通過語音方式觸發業務的流程,該實施例中,業務包括以下步驟
前置條件用戶在系統進行註冊並安裝客戶端。步驟1 用戶打開終端客戶端,口述出版物部分內容;
步驟2 終端通過麥克風記錄用戶語音,轉換成音頻格式數據,提交終端或系統進行語音的識別;
步驟3 系統進行語音識別,解析包含的內容,轉換成文字,並進行分析,解析出一個完整的句子;
步驟4.系統將獲取的句子作為搜索參數發起全文查找;
步驟5.系統檢索到包含該句子的內容後,執行對應的業務邏輯,並將結果的摘要和標題等信息推送到終端並提示用戶進行內容和計費確認;;
步驟6.用戶進行內容和計費的確認,系統推送用戶選擇確認的電子版本的內容到用戶預設的網絡空間。步驟7.管理模塊將本次業務的各種數據記錄到資料庫。
本發明的描述是為了示例和說明起見而給出的,而並不是無遺漏的或者將本發明限於所公開的形式。很多修改和變化對於本領域的普通技術人員而言是顯然的。選擇和描述實施例是為了更好說明本發明的原理和實際應用,並且使本領域的普通技術人員能夠理解本發明從而設計適於特定用途的帶有各種修改的各種實施例。
權利要求
1.一種語音識別方式獲取出版物內容的方法,其特徵在於,通過用戶口述出版物部門內容,移動終端或系統進行語音識別,轉換為文字並以識別結果為關鍵詞發起內容搜索,獲取對應出版物內容的電子版本並推送到用戶預置的保存空間。
2.如權利要求1所述,移動終端是包含各種移動便攜的終端設備,其特徵在於,移動終端包含了手機,平板電腦等支持相機和移動網際網路功能的各種移動終端智能設備。
3.如權利要求1所述,用戶口述出版物部分內容片段,終端記錄該語音並進行識別,其特徵在於,用戶口述出版物部分內容片段,以句子為單位進行口述,終端通過麥克風獲取和記錄用戶語音數據,轉換為語音識別要求的語音格式和數據,根據終端設備軟硬體識別能力選擇在終端進行語音識別,或通過以服務方式開放的系統端語音識別接口請求系統進行語音識別,獲取語音對應的文本。
4.如權利要求3所述,用戶口述以句子為單位的內容,系統對其進行解析,其特徵在於,用戶口述以標點符號分隔的語句片段,語音解析將識別語音停頓,獲取以標點符號為分隔的其中一個或多個完整句子組成部分,並以獲取的文字部分作為搜索關鍵詞進行搜索, 並通過識別部分所處的位置,獲取對應出版物內容範圍,包含正文,標題,封面等不同層級, 對應一篇文章和整本內容,以此控制獲取內容的範圍。
5.如權利要求3所述,終端獲取語音內容後在終端本地或系統進行識別,其特徵在於, 根據終端軟硬體環境和能力,終端可以加載語音識別模塊,也可以通過發送獲取的音頻內容到系統在線語音識別服務進行內容的識別,識別後的內容通過識別的標點符號進行斷句或通過語句語義分析,獲取一個以上的完整語句片段,語句片段是指在兩個標點符號如逗號或句號之間的一個完整的語句。
6.如權利要求4所述,終端獲取語音對應的文本內容後發起內容的搜索,其特徵在於, 系統通過以識別的語句文字為關鍵詞進行對應內容的搜索,系統搜索到對應的內容如果多於一個以上,則通過提示用戶再次口述更多內容的方式或提供內容選擇列表提示用戶選取對應的對象,通過多次過濾精確獲得對應的內容,並在獲取內容後系統自動推送到用戶預置的目標地址空間。
7.如權利要求6所述,系統識別和搜索到對應的內容後根據系統內置的對象屬性對內容進行自動分類和加上屬性標籤並觸發內容用戶空間推送,其特徵在於,內容在推送到用戶保存空間後系統根據出版物的數字資源編碼辨別屬性自動進行內容的分類保存到不同的目錄,如類別屬性、時間屬性等。
8.如權利要求6所述,系統在獲取識別語音對應片段的內容作為搜索參數在系統內進行搜索,其特徵在於,系統將出版物的電子版本的內容以本地或在線分布式資料庫形式保存,並建立全文數據索引,查詢本地或分布式第三方系統的內容平臺。
9.如權利要求7所述,系統搜索獲取文字內容觸發獲取內容業務流程請求獲取對應內容的電子版本,系統根據用戶或系統的設定進行推送,其特徵在於,系統根據用戶設定推送內容的電子版本到用戶設定的網絡空間,郵箱、網絡硬碟等,如用戶未設置和綁定郵箱或者網絡空間,系統自動為用戶分配一個系統的存儲空間或者提示用戶進行保存空間的設定, 在計費的情況下系統對該內容進行計費處理,並標記用戶獲取內容的狀態屬於該用戶所有,用戶可以隨後登陸系統進行保存空間的設定以獲取該對應的電子版本的內容。
10.如權利要求9所述,系統可對終端用戶獲取內容的電子版本進行計費處理,其特徵在於,系統通過返回的推送的內容的結果狀態碼和具體推送的內容和收費策略對移動終端進行業務計費,免費業務計費數據為零,通過各種計費方式,包含移動運營商計費系統,第三方支付系統等方式進行扣費,並獲取扣費狀態回執確認計費結果,整個業務流程完成後, 對應業務完成狀態將通過數據方式或者簡訊、彩信、PUSH方式將結果下發到手機,用戶此時可獲知內容獲取結果和計費結果狀態。
全文摘要
本發明揭示了一種語音識別方式獲取出版物內容的方法,包含移動終端客戶端,接口模塊、業務邏輯模塊,語音識別模塊,數據搜索模塊、資源推送模塊等模塊。本發明通過後臺內容系統預先抓取和保存出版物內容,用戶口述出版物部分內容,終端或系統進行語音的識別,將用戶口述的語音片段轉換為文本內容,並以該部分文字內容為關鍵詞搜索後臺資料庫系統,系統搜索到對應的完整內容後推送該部分內容到用戶的系統空間或用戶自定義空間,從而幫助用戶快速獲取對應出版物內容的數字資源。 本發明通過移動終端用戶口述部分出版物內容進行搜索獲取對應出版物電子版本,為用戶便捷獲取和保存出版物內容提供了一種高效的方法。
文檔編號G06Q30/00GK102486801SQ20111026233
公開日2012年6月6日 申請日期2011年9月6日 優先權日2011年9月6日
發明者顧健 申請人:上海博路信息技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀