新四季網

一種語音識別系統和方法

2023-07-07 03:08:21 1

專利名稱:一種語音識別系統和方法
技術領域:
本發明涉及語音識別技術領域,特別涉及一種語音識別系統和方法。
背景技術:
目前多種智能音視頻設備都添加了語音識別功能。圖I是現有的一種音視頻設備的組成結構的示意圖。如圖I所示,該音視頻設備包括麥克風陣列101、音頻編碼電路102、攝像頭103、視頻處理電路104、主控集成電路105、系統主控微控制單元(系統主控MCU)106、揚聲器107及顯示屏108。其中,麥克風陣列101負責語音信號的拾取並轉換成模擬音頻信號後輸出給音頻編碼電路102,音頻編碼電路102將從麥克風陣列101接收的模擬音頻信號進行數字編碼,
然後輸出給主控集成電路105 ;攝像頭103用於捕獲視頻信號並輸出給視頻處理電路104,視頻處理電路104用於對攝像頭103輸出的信號進行編碼處理後輸出給主控集成電路105 ;主控集成電路105匯集視頻信號和音頻信號後,合成音視頻數據流輸出給系統主控微控制單元106。系統主控微控制單元106為該音視頻設備的核心器件,負責音視頻數據鏈路的管理。從系統主控微控制單元106輸出的音頻信號通過音頻揚聲器107變成聲音信號,從系統主控微控制單元106.輸出的視頻信號通過顯示屏108進行顯示。此外,圖I所示的音視頻設備還包括作為外圍接口的USB接口和負責整個系統的穩定供電的電源電路等,這裡不再贅述。在現有的如圖I所示的具有語音識別功能的音視頻設備中,不論採用全指向麥克風陣列還是採用單指向麥克風音陣列,都有一定的識別距離,所以只能進行近距離語音識別,而對遠距離語音無能為力。

發明內容
本發明提供了一種語音識別系統和方法,以解決只有麥克風陣列作為音頻輸入的語音識別系統無法對遠距離語音進行識別的問題。為達到上述目的,本發明的技術方案是這樣實現的本發明公開了一種語音識別系統,包括麥克風陣列、音頻編碼電路、主控集成電路、藍牙接收模塊和藍牙發射模塊,其中麥克風陣列,用於接收語音信號並轉換成模擬音頻信號後輸出給音頻編碼電路;音頻編碼電路,用於將所接收的模擬音頻信號轉換成數字音頻信號後輸出給主控集成電路;藍牙發射模塊,用於接收語音信號並轉換成數字音頻信號後通過藍牙方式發送給藍牙接收模塊;藍牙接收模塊,用於將所接收的數字音頻信號發送給主控集成電路;主控集成電路,用於選擇接收來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。
在上述語音識別系統中,具有一個藍牙接收模塊和一個以上的藍牙發射模塊。在上述語音識別系統中,所述主控集成電路具有按鍵,所述主控集成電路根據用戶對該按鍵的操作選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。上述語音識別系統還包括系統主控微控制單元,用於接收來自主控集成電路的音頻數據流;該系統主控微控制單元具有按鍵,該系統主控微控制單元根據用戶對該按鍵的操作向主控集成電路發送選擇來自音頻編碼電路的數字音 頻信號的指令或選擇來自藍牙接收模塊的數字音頻信號的指令;主控集成電路根據系統主控微控制單元的指令選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。本發明還公開了一種語音識別的方法,該方法包括通過麥克風陣列接收語音信號並轉換成模擬音頻信號,然後將該模擬音頻信號轉換成數字音頻信號,得到第一路數字音頻信號;通過藍牙音頻鏈路接收語音信號並轉換成數字音頻信號,得到第二路數字音頻信號;選擇第一路數字音頻信號或第二路數字音頻信號進行語音識別處理。在上述方法中,所述藍牙音頻鏈路包括藍牙發射模塊和藍牙接收模塊;所述通過藍牙音頻鏈路接收語音信號並轉換成數字音頻信號包括通過藍牙發射模塊接收語音信號並轉換成數字音頻信號後發送給藍牙接收模塊,藍牙接收模塊將所接收的數字音頻信號作為所述第二路數字音頻信號輸出。所述藍牙音頻鏈路包括一個以上的藍牙發射模塊和一個藍牙接收模塊。在上述方法中,所述選擇第一路數字音頻信號或第二路數字音頻信號進行語音識別處理包括根據用戶的按鍵操作選擇第一路數字音頻信號或第二路數字音頻信號,對並所選擇的數字音頻信號進行語音識別處理。由上述可見,在本發明的方案中,由於語音識別系統包括麥克風陣列鏈路和藍牙鏈路兩路語音輸入鏈路,在進行語音識別時在兩路鏈路中進行選擇,其中的藍牙鏈路可以實現遠距離語音的接收,因此可以對遠距離的語音進行識別。


圖I是現有的一種音視頻設備的組成結構的示意圖;圖2為本發明實施例中的包含語音識別系統的音視頻設備的組成結構的示意圖。
具體實施例方式本發明中,通過麥克風陣列接收語音信號並轉換成模擬音頻信號,然後將該模擬音頻信號轉換成數字音頻信號,得到第一路數字音頻信號;並且通過藍牙音頻鏈路接收語音信號並轉換成數字音頻信號,得到第二路數字音頻信號;然後選擇第一路數字音頻信號或第二路數字音頻信號進行語音識別處理。這樣,對於較近的一些語音可以通過麥克風陣列進行拾取,而對於較遠局域的語音,則可以通過的藍牙鏈路實現接收,因此解決了只有麥克風陣列作為音頻輸入的語音識別系統無法對遠距離語音進行識別的問題。為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明實施方式作進一步地詳細描述。圖2為本發明實施例中的包含語音識別系統的音視頻設備的組成結構的示意圖。如圖2所示,該系統包括麥克風陣列101、音頻編碼電路102、攝像頭103、視頻處理電路104、主控集成電路205、系統主控微控制單元206、揚聲器107、顯示屏108、藍牙接收模塊201和藍牙發射模塊202。這裡藍牙發射模塊202的個數為一個或多個,圖2中示意出了多個藍牙發射模塊202。另外由於本發明的實施例中對主控集成電路和系統主控微控制單元的功能都進行了改進,因此採用了與圖I中不同的附圖標記。其中,麥克風陣列101,用於接收語音信號並轉換成模擬音頻信號後輸出給音頻編碼電路102。音頻編碼電路102,用於將所接收的模擬音頻信號轉換成數字音頻信號後輸出給主控集成電路205。攝像頭103用於捕獲視頻信號並輸出給視頻處理電路104,視頻處理電路104用於對攝像頭103輸出的信號進行編碼處理後輸出給主控集成電路205 ;·藍牙發射模塊202,用於接收語音信號並轉換成數字音頻信號後通過藍牙方式發送給藍牙接收模塊201 ;藍牙接收模塊201,用於將所接收的數字音頻信號發送給主控集成電路205 ;主控集成電路205,用於選擇來自音頻編碼電路102的數字音頻信號或來自藍牙接收模塊201的數字音頻信號進行語音識別處理。即主控集成電路205先在來自音頻編碼電路102的數字音頻信號和來自藍牙接收模塊102的數字音頻信號之間進行選擇,然後將選擇的數字音頻信號與來自視頻處理電路104的數字視頻信號匯集,合成音視頻數據流後輸出給系統主控微控制單元206。系統主控微控制單元206負責音視頻數據鏈路的管理。從系統主控微控制單元206輸出的音頻信號通過音頻揚聲器107變成聲音信號,從系統主控微控制單元206輸出的視頻信號通過顯示屏108進行顯示。可見,在圖2所示的實施例中有兩條音頻輸入鏈路,分別為麥克風陣列音頻鏈路和藍牙音頻鏈路。其中,麥克風陣列音頻鏈路包括麥克風陣列101和音頻編碼電路102,麥克風陣列101接收語音信號並轉換成模擬音頻信號後輸出給音頻編碼電路102,音頻編碼電路102將所接收的模擬音頻信號轉換成數字音頻信號後作為第一路數字音頻信號輸出給主控集成電路205。藍牙音頻鏈路包括藍牙發射模塊202和藍牙接收模塊201 ;通過藍牙發射模塊202接收語音信號並轉換成數字音頻信號後發送給藍牙接收模塊201,藍牙接收模塊201將所接收的數字音頻信號作為第二路數字音頻信號輸出給主控集成電路205。主控集成電路205在第一路數字音頻信號和第二路數字音頻信號之間進行選擇。在本法明的上述實施中,保留了麥克風陣列,以實現近距離的語音識別。在此基礎上增加了藍牙語音輸入方式,以實現遠程語音識別。藍牙傳輸技術支持一對多的通信,即可以設置一個藍牙接收模塊和多個的藍牙發射模塊。實踐中可以根據需要配備多個藍牙發射模塊,以實現多點語音識別。由於用藍牙方式可以遠距離傳輸信號,故本系統可以進行遠程語音識別。在本發明的實施例中,可以通過按鍵控制主控集成電路205的對數字音頻信號的選擇。
例如,可以在主控集成電路205上設置一個按鍵式的控制端,主控集成電路205根據用戶對該按鍵的操作選擇來自音頻編碼電路102的數字音頻信號或來自藍牙接收模塊201的數字音頻信號進行語音識別處理。或者,也可以在系統主控微控制單元206上設置按鍵式的控制端,系統主控微控制單元206根據用戶對該按鍵的操作向主控集成電路205發送選擇來自音頻編碼電路102的數字音頻信號的指令或選擇來自藍牙接收模塊201的數字音頻信號的指令;主控集成電路205根據系統主控微控制單元206的指令選擇來自音頻編碼電路102的數字音頻信號或來自藍牙接收模塊201的數字音頻信號進行語音識別處理。本發明實施例中對系統主控微控制單元的改進也正是在於此。綜上所述,在本發明的方案中,由於語音識別系統包括麥克風陣列鏈路和藍牙鏈路兩路語音輸入鏈路,在進行語音識別時在兩路鏈路中進行選擇,其中的藍牙鏈路可以實現遠距離語音的接收以及實現多點語音控制,因此可以對多個遠距離的語音進行識別,使用戶更好的體會語音識別的優越性。 以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。
權利要求
1.一種語音識別系統,其特徵在於,包括麥克風陣列、音頻編碼電路、主控集成電路、藍牙接收模塊和藍牙發射模塊,其中 麥克風陣列,用於接收語音信號並轉換成模擬音頻信號後輸出給音頻編碼電路; 音頻編碼電路,用於將所接收的模擬音頻信號轉換成數字音頻信號後輸出給主控集成電路; 藍牙發射模塊,用於接收語音信號並轉換成數字音頻信號後通過藍牙方式發送給藍牙接收模塊; 藍牙接收模塊,用於將所接收的數字音頻信號發送給主控集成電路; 主控集成電路,用於選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。
2.根據權利要求I所述的語音識別系統,其特徵在於該系統具有一個藍牙接收模塊和一個以上的藍牙發射模塊。
3.根據權利要求I或2所述的語音識別系統,其特徵在於,所述主控集成電路具有按鍵,所述主控集成電路根據用戶對該按鍵的操作選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。
4.根據權利要求I或2所述的語音識別系統,其特徵在於,該語音識別系統還包括系統主控微控制單元,用於接收來自主控集成電路的音頻數據流; 該系統主控微控制單元具有按鍵,該系統主控微控制單元根據用戶對該按鍵的操作向主控集成電路發送選擇來自音頻編碼電路的數字音頻信號的指令或選擇來自藍牙接收模塊的數字音頻信號的指令; 主控集成電路根據系統主控微控制單元的指令選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。
5.一種語音識別的方法,其特徵在於,該方法包括 通過麥克風陣列接收語音信號並轉換成模擬音頻信號,然後將該模擬音頻信號轉換成數字音頻信號,得到第一路數字音頻信號; 通過藍牙音頻鏈路接收語音信號並轉換成數字音頻信號,得到第二路數字音頻信號; 選擇第一路數字音頻信號或第二路數字音頻信號進行語音識別處理。
6.根據權利要求5所述的語音識別方法,其特徵在於,所述藍牙音頻鏈路包括藍牙發射模塊和藍牙接收模塊; 所述通過藍牙音頻鏈路接收語音信號並轉換成數字音頻信號包括通過藍牙發射模塊接收語音信號並轉換成數字音頻信號後發送給藍牙接收模塊,藍牙接收模塊將所接收的數字音頻信號作為所述第二路數字音頻信號輸出。
7.根據權利要求6所述的方法,其特徵在於,所述藍牙音頻鏈路包括一個以上的藍牙發射模塊和一個藍牙接收模塊。
8.根據權利要求5或6所述的語音識別方法,其特徵在於,所述選擇對第一路數字音頻信號或二路數字音頻信號進行語音識別處理包括 根據用戶的按鍵操作選擇第一路數字音頻信號或第二路數字音頻信號,並對所選擇的數字音頻信號進行語音識別處理。
全文摘要
本發明公開了一種語音識別系統和方法。其中語音識別系統包括麥克風陣列,接收語音信號並轉換成模擬音頻信號後輸出給音頻編碼電路;音頻編碼電路,用於將所接收的模擬音頻信號轉換成數字音頻信號後輸出給主控集成電路;藍牙發射模塊,用於接收語音信號並轉換成數字音頻信號後通過藍牙方式發送給藍牙接收模塊;藍牙接收模塊,用於將所接收的數字音頻信號發送給主控集成電路;主控集成電路,用於選擇來自音頻編碼電路的數字音頻信號或來自藍牙接收模塊的數字音頻信號進行語音識別處理。本發明的技術方案解決了只有麥克風陣列作為音頻輸入的語音識別系統無法對遠距離語音進行識別的問題。
文檔編號G10L15/02GK102820032SQ201210290828
公開日2012年12月12日 申請日期2012年8月15日 優先權日2012年8月15日
發明者王平平, 郄勇 申請人:歌爾聲學股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀