新四季網

語音偵測方法

2023-10-07 17:38:09

專利名稱:語音偵測方法
技術領域:
本發明關於一種語音偵測方法,特別是一種應用雙收音裝置的語音偵測方法。
背景技術:
近年來,免持式語音通訊系統已經普遍的受到使用。一般而言,免持式語音通訊系統可通過藍牙通訊模塊與行動通訊裝置相連接。經過數位化與調變後,免持式語音通訊系統可將語音信號轉換成一個一個的封包,再利用藍牙通訊模塊傳送這些封包至行動通訊模塊。然而,在現實的環境下,免持式語音通訊系統會因為受到環境噪聲的幹擾,而原本語音信號的清晰度降低。舉例而言,當使用者在車輛來往頻繁的道路旁邊或是人潮擁擠的捷運站使用免持式語音通訊系統時,免持式語音通訊系統的麥克風會接收到許多的背景噪聲。若是這些背景噪聲的音量大於使用者本身說話時的音量,背景噪聲將會嚴重的幹擾此使用者所發出的語音信號。此外,根據使用者使用行為的相關研究可知,在整段通話的期間中,由使用者在說話只佔不到整段通話期間的一半。若是在整段通話期間,免持式語音通訊系統一值不斷地持續傳送封包,將會使免持式語音通訊系統產生不必要的電力消耗。因為免持式語音通訊系統是使用電池的電力以提供電能,若是持續產生不必要的電力消耗,將會是免持式語音通訊系統的通話時間或是待機時間大幅的被降低,進而減低此免持式語音通訊系統在市場上的競爭力。

發明內容
鑑於以上的問題,本發明提出一種語音偵測方法,用以當使用者發出語音信號時, 準確地偵測此語音信號。本發明所提出的語音偵測方法包括以下步驟由一第一收音裝置取樣一第一信號,並由一第二收音裝置取樣一第二信號,其中第一收音裝置比第二收音裝置較靠近一語音信號源;計算第一信號在一區間內所對應的一第一能量,計算第二信號在區間內所對應的一第二能量,並根據第一能量與第二能量計算一第一比值;轉換第一比值為一第二比值; 設定一臨界值;根據第二比值與臨界值的大小,判斷語音信號源是否被偵測。除了上述的方法之外,本發明另揭露一種語音偵測方法,包括由一第一收音裝置取樣一第一信號,並由一第二收音裝置取樣一第二信號,其中第一收音裝置比第二收音裝置較靠近一語音信號源;執行一語音能量判斷步驟,得到一第一判斷結果;執行一語音方向判斷步驟,得到一第二判斷結果;根據第一判斷結果與第二判斷結果,判斷語音信號源是否被偵測。其中,語音能量判斷步驟包括計算第一信號在一區間內所對應的第一能量,計算第二信號在區間內所對應的第二能量,並根據第一能量與第二能量計算第一比值;轉換第一比值為第二比值;設定臨界值;判斷第二比值與該臨界值的大小,輸出第一判斷結果。
另一方面,語音方向判斷步驟包括根據第一信號與第二信號,計算第一方向上的第一相關值與第二方向上的第二相關值;根據第一相關值與第二相關值,輸出第二判斷結果。其中,第一方向為語音信號源對應的一方向,第二方向為該第一方向以外的一方向。根據本發明所提出的語音方向判斷,可依背景環境噪音的大小進行門坎值的調整,以提高偵測的準確率。此外,更可以經由語音方向的步驟進行輔助的判斷,以更進一步的增加偵測的準確度。以下結合附圖和具體實施例對本發明進行詳細描述,但不作為對本發明的限定。


圖1A、圖IB與圖1C,為本發明所提出的免持式語音通訊系統的外觀示意圖;圖2為本發明所提出的語音偵測方法第一實施例的流程圖;圖3A與圖3B,為本發明的仿真信號波形圖;圖4為本發明所提出的語音偵測方法第二實施例的流程圖;圖5為本發明所提出的免持式語音通訊系統的側視圖。其中,附圖標記10免持式語音通訊系統11 第一面12 第二面20第一收音裝置30第二收音裝置100 線段200 線段300 線段
具體實施例方式下面結合附圖和具體實施例對本發明技術方案進行詳細的描述,以更進一步了解本發明的目的、方案及功效,但並非作為本發明所附權利要求保護範圍的限制。請參照圖1A、圖IB與圖1C,為免持式語音通訊系統的外觀示意圖。圖1A、圖IB為第一實施例的外觀示意圖。免持式語音通訊系統10包括第一收音裝置20與第二收音裝置30。第一收音裝置20與第二收音裝置30各自可為一個麥克風。 免持式語音通訊系統10具有第一面11與第二面12。當使用者使用免持式語音通訊系統 10時,第一面11會較為靠近人臉,且第二面12會較為遠離人臉。在此實施例中,第一收音裝置20位於第一面11,且第二收音裝置30位於第二面12。此外,第一收音裝置20比第二收音裝置30較靠近語音信號源,語音信號源通常為使用者的嘴巴。圖IC為第二實施例的外觀示意圖。免持式語音通訊系統10包括第一收音裝置20 與第二收音裝置30。免持式語音通訊系統10具有第一面11與第二面12。當使用者使用免持式語音通訊系統10時,第一面11會較為靠近人臉,且第二面12會較為遠離人臉。在此實施例中,第一收音裝置20與第二收音裝置30皆位於第一面10。並且,第一收音裝置 20比第二收音裝置30較靠近語音信號源,語音信號源通常為使用者的嘴巴。
請參照圖2為本發明所提出的語音偵測方法第一實施例的流程圖。此方法為語音能量判斷流程,包括以下步驟由一第一收音裝置取樣一第一信號,並由一第二收音裝置取樣一第二信號(Slio);計算第一信號在一區間內所對應的第一能量,計算第二信號在此區間內所對應的第二能量(S120);根據第一能量與第二能量計算第一比值(S130);轉換第一比值為第二比值(S140);設定臨界值(S150);根據第二比值與臨界值的大小,判斷語音信號源是否被偵測(S160)。在步驟SllO中,在擷取到聲音信號後,第一收音裝置20與第二收音裝置30會將擷取到的聲音信號經過周期性的取樣(sampling)和模擬/數字(Analog/Digital)轉換之後,第一收音裝置20會輸出第一信號,且第二收音裝置30會輸出第二信號。在此實施例中, 取樣頻率需至少為語音信號最高頻率的二倍以上。而一般而言,取樣頻率可為8,OOOHz (赫茲)。若是要得到更好的效果,取樣頻率也可以為更高的16,OOOHz或是32,000Hz。另一方面,模擬/數字轉換一般可為8位的模擬/數字轉換,或是也可為更高的12位、16位的模擬 /數字轉換。為了方便表示,第一信號標示為P [t],第二信號標示為R[t]。其中t為正整數,代表離散時間上的順序。舉例而言,當取樣頻率為8,OOOHz時,且取樣時間為一秒,則t為1 到8000的之間的正整數。在步驟S120中,計算第一信號P[t]與第二信號R[t]在一段區間內的第一能量 EP[η]與第二能量ER[n]的方法如下EP[n] =,ER[n]= ΣΙ 衝]I;
t=D*(n~\)+\I=DHn-W其中D為上述區段的長度。舉例而言,區段的長度為64個取樣點,也就是D為 64。在此步驟中,EP[1]為P[1]、P[2]、-,P[64]個別平方後的總和,而EP[2]為P[65]、 P[66],…、P[128]個別平方後的總和,第一能量的其它數值也可以此類推。第二能量的計
算方式與第一能量相同。上述的第一能量EP[η]與第二能量ER[n]於時間域(time-domain)上進行運算。 另一方面,第一能量EP[n]與第二能量ER[n]也可於頻率域(frequency-domain)上進行運算。若是在頻率域上運算時,時間域上的信號P[1]、P[2]、…、PW4]會經由快速傅立葉轉換(Fast Fourier Transformation, FFT)轉換成頻率域上的信號 P,[1]、P,[2]、…、 P,[64]。同樣地,時間域上的信號R[1]、R[2]、…、對64]會經由快速傅立葉轉換(Fast Fourier Transformation, FFT)轉換成頻率域上的信號 R,[1]、R,[2]、...、R,[64]。之後,再以下述的方法計算第一能量EP[n]與第二能量ER[n]
權利要求
1.一種語音偵測方法,其特徵在於,包括由一第一收音裝置取樣一第一信號,並由一第二收音裝置取樣一第二信號,其中該第一收音裝置比該第二收音裝置較靠近一語音信號源;計算該第一信號在一區間內所對應的一第一能量,計算該第二信號在該區間內所對應的一第二能量,並根據該第一能量與該第二能量計算一第一比值; 轉換該第一比值為一第二比值; 設定一臨界值;以及根據該第二比值與該臨界值的大小,判斷該語音信號源是否被偵測。
2.如權利要求1所述的語音偵測方法,其特徵在於,在轉換該第一比值的該步驟中,利用一指數加權位移平均法,轉換該第一比值為該第二比值。
3.如權利要求1所述的語音偵測方法,其特徵在於,在設定一臨界值的該步驟中,該臨界值為該第二比值的一區域最大值乘以一係數β再乘以一衰減參數σ,其中0 < β < 1,0 < σ ^ I0
4.如權利要求3所述的語音偵測方法,其特徵在於,判斷該第二比值與該臨界值的大小的該步驟中,若是該第二比值小於該臨界值時,則代表該語音信號源已被偵測。
5.一種語音偵測方法,其特徵在於,包括由一第一收音裝置取樣一第一信號,並由一第二收音裝置取樣一第二信號,其中該第一收音裝置比該第二收音裝置較靠近一語音信號源; 執行一語音能量判斷步驟,包括計算該第一信號在一區間內所對應的一第一能量,計算該第二信號在該區間內所對應的一第二能量,並根據該第一能量與該第二能量計算一第一比值; 轉換該第一比值為一第二比值; 設定一臨界值;以及判斷該第二比值與該臨界值的大小,輸出一第一判斷結果; 執行一語音方向判斷步驟,包括根據該第一信號與該第二信號,計算一第一方向上的一第一相關值與一第二方向上的一第二相關值,其中該第一方向為該語音信號源對應的一方向,該第二方向為該第一方向以外的一方向;以及根據該第一相關值與該第二相關值,輸出一第二判斷結果;以及根據該第一判斷結果與該第二判斷結果,判斷該語音信號源是否被偵測。
6.如權利要求5所述的語音偵測方法,其特徵在於,在該第一判斷結果與該第二判斷結果,判斷該語音信號源是否被偵測的步驟中,當該第二比值小於該臨界值並且該第一相關值大於該第二相關值時,則代表該語音信號源已被偵測。
7.如權利要求5所述的語音偵測方法,其特徵在於,在該第一判斷結果與該第二判斷結果,判斷該語音信號源是否被偵測的步驟中,當該第二比值小於該臨界值或是該第一相關值大於該第二相關值時,則代表該語音信號源已被偵測。
8.如權利要求5所述的語音偵測方法,其特徵在於,在轉換該第一比值的該步驟中,利用一指數加權位移平均法,轉換該第一比值為該第二比值。
9.如權利要求5所述的語音偵測方法,其特徵在於,在設定一臨界值的該步驟中,該臨界值為該第二比值的一區域最大值乘以一係數β再乘以一衰減參數σ,其中0 < β < 1,0 < σ ^ I0
全文摘要
本發明揭露一種語音偵測方法,此語音偵測方法包括以下步驟由第一收音裝置取樣第一信號,並由第二收音裝置取樣第二信號,其中第一收音裝置比第二收音裝置較靠近一語音信號源;計算第一信號在一區間內所對應的第一能量,計算第二信號在區間內所對應的第二能量,並根據第一能量與第二能量計算第一比值;轉換第一比值為第二比值;設定臨界值;根據第二比值與臨界值的大小,判斷語音信號源是否被偵測。根據本發明所提出的語音偵測方法,可以在使用者發出語音信號時,準確地偵測此語音信號。
文檔編號G10L15/04GK102201231SQ20101013985
公開日2011年9月28日 申請日期2010年3月23日 優先權日2010年3月23日
發明者丁永禎, 林穎聰, 金判燮 申請人:創傑科技股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀