新四季網

噪聲估計的方法和設備的製作方法

2023-07-31 06:26:56 1

專利名稱:噪聲估計的方法和設備的製作方法
技術領域:
本發明一般涉及用於噪聲水平/頻譜估計和語音活動檢測的方法和設備,且更特定來說,涉及用於估計噪聲水平和檢測語音的存在的概率模型的使用。
背景技術:
通信技術在許多領域中不斷演進,從而經常呈現較新的挑戰。隨著行動電話和無線耳機的出現,現可在非常嘈雜的環境(即,具有低信噪比(SNR)的環境)中進行真正的全雙工對話。信號增強和噪聲抑制在這些情形中變得關鍵。所要語音的可理解度通過在將信號發送到另一端的收聽者之前抑制非所要的有噪聲信號而得以增強。檢測語音在有噪聲背景內的存在為信號增強和噪聲抑制的重要分量。為實現改進的語音檢測,一些系統將傳入信號劃分成多個不同時間/頻率幀,且估計語音在每一幀中的存在的概率。
檢測語音的存在的最大挑戰中的一者為追蹤噪聲下限,特定來說,使用單一麥克風/感應器的非靜態噪聲水平。語音活動檢測廣泛用於現代通信裝置中,尤其用於在低信噪比的情況下操作的現代移動裝置,例如,手機和無線耳機裝置。在這些裝置中的大多數中,在將有噪聲信號發送到另一端的收聽者之前對所述有噪聲信號執行信號增強和噪聲抑制;進行此操作以改進所要語音的可理解度。在信號增強/噪聲抑制中,使用語音或話音活動檢測器(VAD)來檢測所要語音在混有噪聲的信號中的存在。此檢測器可產生語音的存在或不存在的二元決策(binary decision),或還可產生語音存在的概率。
檢測語音的存在的一個挑戰為確定信號中的背景噪聲的水平的上界限和下界限, 其還稱為噪聲「上限」和「下限」。在使用單一麥克風輸入的非靜態噪聲的情況下尤為如此。 另外,追蹤噪聲水平歸因於裝置或使用所述裝置的人員的物理移動的快速變化而更具挑戰性。

發明內容
在特定實施例中,揭示一種用於估計音頻信號的當前幀中的噪聲水平的方法。所述方法包含確定多個音頻幀的噪聲水平以及計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差。使用從所述平均值減去所述標準偏差的值來計算當前幀的噪聲水平估計。
在特定實施例中,揭示一種噪聲確定系統。所述系統包含經配置以確定多個音頻幀的噪聲水平的模塊;以及經配置以計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差的一個或一個以上模塊。所述系統還可包括經配置以將所述當前幀的噪聲水平估計計算為從所述平均值減去所述標準偏差的值的模塊。
在一些實施例中,揭示一種用於估計信號在多個時間-頻率頻段中的噪聲水平的方法,所述方法可在一個或一個以上計算機系統上實施。對於所述信號的每一頻段,所述方法確定多個音頻幀的噪聲水平,估計所述時間-頻率頻段中的所述噪聲水平,確定所述時間-頻率頻段中的初級噪聲水平,從所述初級噪聲水平確定所述時間-頻率頻段中的次級噪聲水平,和從所述時間-頻率頻段中的所述次級噪聲水平確定經定界限的噪聲水平。
一些實施例揭示一種用於估計音頻信號的當前幀中的噪聲水平的系統。所述系統可包含用於確定多個音頻幀的噪聲水平的裝置;用於計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差的裝置;以及用於將所述當前幀的噪聲水平估計計算為從所述平均值減去所述標準偏差的值的裝置。
在特定實施例中,揭示一種計算機可讀媒體,其包含在處理器上執行以執行方法的指令。所述方法包含確定多個音頻幀的噪聲水平;計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差;以及將當前幀的噪聲水平估計計算為從所述平均值減去所述標準偏差的值。


各種配置在附圖中以實例方式而非以限制方式進行說明。
圖1為根據本發明的原理的VAD的簡化方框圖; 圖2為說明頻域VAD的頻率選擇性加權向量的曲線圖; 圖3為說明所提議的時域VAD在粉紅噪聲環境下的性能的曲線圖; 圖4為說明所提議的時域VAD在串音噪聲環境下的性能的曲線圖; 圖5為說明所提議的時域VAD在交通噪聲環境下的性能的曲線圖;以及 圖6為說明所提議的時域VAD在聚會噪聲環境下的性能的曲線圖。
具體實施例方式本發明的實施例包含用於確定信號中的噪聲水平且在一些例子中隨後檢測語音的方法和系統。這些實施例包含優於現有技術的多個顯著進步。一項改進涉及基於來自先前和當前音頻幀的背景噪聲的平均值執行對語音信號中的背景噪聲的估計。此不同於基於來自較早和目前音頻幀的最小噪聲值來計算語音的幀的目前背景噪聲水平的其它系統。傳統上,研究者已著眼於先前噪聲值的最小值來估計目前噪聲水平。然而,在一個實施例中, 從若干過去的幀計算所估計的噪聲信號電平,計算此整體的平均值,而非最小值,且從所述整體中減去經縮放的標準偏差。所得值與通常使用整體最小值所提供的值相比有利地提供對當前音頻幀的噪聲水平的更準確的估計。
此外,可基於傳入信號電平對此所估計的噪聲水平動態地定界限,以便維持對噪聲的較準確的估計。所估計的噪聲水平可另外用先前值進行「平滑」或「平均化」,以使不連續性最小化。所估計的噪聲水平可接著用以識別具有高於噪聲水平的能級的幀中的語音。此可通過計算後驗信噪比(SNR)來確定,所述後驗SNR又可由非線性S形啟動函數 (sigmoidal activation function)用來產生語音的存在的經校正概率。
參看圖1,傳統的話音活動檢測(VAD)系統100接收傳入信號101,所述傳入信號 101包含具有背景噪聲的區段,和具有背景噪聲和語音兩者的區段。VAD系統100將時間信號101分成若干幀103a到103d。這些幀103a到103d中的每一者接著被傳遞到分類模塊 104,所述分類模塊104確定將給定幀置於何類別(噪聲或語音)中。
分類模塊104計算給定信號的能量,且將所述能量與對應於噪聲下限的估計的時變閾值進行比較。那個噪聲下限估計可由每一傳入幀進行更新。在一些實施例中,所述幀在幀信號的所估計的能級比特定幀內的經測量的噪聲下限高的情況下被分類為語音活動。 由此,在此模塊中,噪聲頻譜估計為語音辨識和(如果需要)後續增強的基本分量。所述系統的穩健性(特定來說,在低SNR和非靜態噪聲環境下)最主要受到可靠地追蹤噪聲統計中的快速變化的能力影響。
基於VAD的常規噪聲估計方法將對噪聲估計的更新限於不存在語音的周期。然而,這些VAD的可靠性對於弱的語音分量和低輸入SNR來說嚴重惡化。基於功率譜密度直方圖的其它技術在計算上較昂貴,需要大量存儲器資源,在低SNR條件下表現不好,且因此不適用於手機和藍牙耳機應用。最小值統計為用於噪聲頻譜估計的另一種方法,其通過將多個過去幀的最小值取為噪聲估計而操作。遺憾的是,此方法對於靜態噪聲起到良好作用, 但當應對非靜態環境時表現較差。
一個實施例包含噪聲頻譜估計系統和方法,其在追蹤許多類型的非所要的音頻信號(包括例如「聚會噪聲」或「串音噪聲」的高度非靜態噪聲環境)中非常有效。所述系統甚至在無益於所述估計的環境中還產生準確的噪聲下限。此所估計的噪聲下限用於計算後驗SNR,所述後驗SNR又用於S形函數「邏輯函數」中以確定語音的存在的概率。在一些實施例中,語音確定模塊用於此功能。
使x[n]和d[n]分別表示所要語音和不相關的加性噪聲信號。觀察到的信號或受汙染信號y[n]簡單地為以上兩者的相加,其由下式給出 y[n] = x[n]+d[n](1) 兩個假設Hjn]和&[11]分別指示第η個時間幀中的語音不存在和存在。在一些實施例中,可在語音不存在的周期期間遞歸地平均化噪聲測量的過去能級值。相比而言,在語音存在期間估計可保持恆定。特定來說, H0 [η]:λ [η] = adAd[n-l] + {l-ad) G2y [η] Ηχ[η\:λ [η\ = λ [η-\]
η , ,2 其中σ γ |外]|為有噪聲信號在時間幀η處的能量,且ad表示 與1之間
/= -100
的平滑參數。然而,由於並不始終清楚何時存在語音,因此,可能並不清楚何時應用方法Htl 或氏中的每一者。可替代地使用「有條件的語音存在概率」,其通過隨時間更新平滑因子a s 來估計遞歸平均值 Xd[n] = as[η]λ [η-1] + (l-as[η])σ][η] (4) 其中 a s[n] = a d+(l-a d)prob [n] (5) 以此方式,當不知曉語音的存在時,可具有更準確的估計。
他人先前已考慮基於最小值統計的方法以用於噪聲水平估計。舉例來說,可著眼於(比如)過去100個幀的所估計的有噪聲信號電平Xd,計算整體的最小值,且將其宣告為所估計的噪聲水平,即
權利要求
1.一種用於估計音頻信號的當前幀中的噪聲水平的方法,其包含 確定多個音頻幀的所述噪聲水平;計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差;以及將所述當前幀的噪聲水平估計計算為從所述平均值中減去所述標準偏差的值。
2.根據權利要求1所述的方法,其進一步包含在從所述平均值中減去之前縮放所述標準偏差。
3.根據權利要求1所述的方法,其進一步包含通過確定多個噪聲水平估計的最小值來確定所述當前噪聲水平估計。
4.根據權利要求1所述的方法,其中所述多個音頻幀包含約100個幀。
5.根據權利要求1所述的方法,其中計算所述噪聲水平估計包含使用平滑因子。
6.根據權利要求5所述的方法,其中在語音活動的周期期間保持所述噪聲水平估計恆定。
7.根據權利要求5所述的方法,其中通過使用第二平滑因子在語音在所述當前幀中的一概率與1之間進行內插來遞歸地平均化所述平滑因子。
8.根據權利要求1所述的方法,其中所述噪聲水平估計包含多個先前所確定的噪聲水平的最小值。
9.根據權利要求1所述的方法,其中通過用目前噪聲水平內插所述噪聲水平的先前所計算的平均值來估計所述噪聲水平的所述平均值。
10.根據權利要求1所述的方法,其進一步包含將所述所計算的噪聲水平估計定界限為比所要信號電平低12到MdB之間。
11.根據權利要求1所述的方法,其進一步包含通過將所述當前幀識別為具有無噪聲區段來檢測語音活動。
12.根據權利要求11所述的方法,其中當對於所有τe ^).2,1],語音的所述概率> τ時,宣告語音活動。
13.—種噪聲確定系統,其包含第一模塊,其經配置以確定多個音頻幀的噪聲水平;第二模塊,其經配置以計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差;以及第三模塊,其經配置以將當前幀的噪聲水平估計計算為從所述平均值中減去所述標準偏差的值。
14.根據權利要求13所述的噪聲確定系統,其中所述第三模塊經配置以在從所述平均值中減去之前縮放所述標準偏差。
15.根據權利要求13所述的噪聲確定系統,其中計算所述噪聲水平估計包含使用平滑因子。
16.根據權利要求15所述的噪聲確定系統,其中所述噪聲水平估計在語音活動的周期期間保持恆定。
17.根據權利要求15所述的噪聲確定系統,其中所述平滑因子是通過使用第二平滑因子在語音在所述當前幀中的一概率與值1之間進行內插而被遞歸地平均化。
18.一種用於估計信號在所述信號的多個時間-頻率頻段中的噪聲水平的方法,其包含,對於所述信號的所述頻段中的每一者 確定多個音頻幀的所述噪聲水平; 估計所述時間-頻率頻段中的所述噪聲水平; 確定所述時間-頻率頻段中的初級噪聲水平;從所述初級噪聲水平確定所述時間-頻率頻段中的次級噪聲水平;以及從所述時間-頻率頻段中的所述次級噪聲水平確定經定界限的噪聲水平。
19.根據權利要求18所述的方法,其中確定所述經定界限的噪聲水平包含將所述所估計的噪聲水平定界限為比有效的所要信號電平低12到MdB之間。
20.根據權利要求18所述的方法,其進一步包含通過取得每一頻率的語音在當前幀中的概率的經加權和來計算語音在所述當前幀中的所述概率。
21.根據權利要求20所述的方法,其中向600Hz到1550Hz範圍內的權重給予至少0.02 的值。
22.一種用於估計音頻信號的當前幀中的噪聲水平的系統,其包含 用於確定多個音頻幀的所述噪聲水平的裝置;用於計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差的裝置;以及用於將所述當前幀的噪聲水平估計計算為從所述平均值中減去所述標準偏差的值的裝置。
23.根據權利要求22所述的噪聲確定系統,其中所述用於計算所述當前幀的噪聲水平估計的裝置在從所述平均值中減去之前縮放所述標準偏差。
24.根據權利要求22所述的系統,其中所述用於確定所述噪聲水平的裝置包含經配置以確定信號的能級的模塊。
25.根據權利要求22所述的系統,其中所述用於計算所述噪聲水平的所述平均值和所述標準偏差的裝置包含經配置以執行數學運算的模塊。
26.根據權利要求22所述的系統,其中所述用於計算噪聲水平估計的裝置包含經配置以執行數學運算的模塊。
27.一種計算機可讀媒體,其包含當在處理器上執行時執行方法的指令,所述方法包含確定多個音頻幀的噪聲水平;計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差;以及將當前幀的噪聲水平估計計算為從所述平均值中減去所述標準偏差的值。
28.根據權利要求27所述的方法,其進一步包含在從所述平均值中減去之前縮放所述標準偏差。
29.—種處理器,其經編程以執行方法,所述方法包含 確定多個音頻幀的噪聲水平;計算所述多個音頻幀上的所述噪聲水平的平均值和標準偏差;以及將當前幀的噪聲水平估計計算為從所述平均值中減去所述標準偏差的值。
30.根據權利要求四所述的方法,其進一步包含在從所述平均值中減去之前縮放所述標準偏差。
全文摘要
本發明揭示一種用於噪聲水平/頻譜估計和語音活動檢測的系統和方法。一些實施例包括用以估計噪聲水平並隨後檢測語音的存在的概率模型。這些實施例勝過標準的話音活動檢測器(VAD),從而在多種有噪聲環境中產生改進的檢測。
文檔編號G10L11/02GK102187388SQ200980141212
公開日2011年9月14日 申請日期2009年10月15日 優先權日2008年10月15日
發明者阿西夫·I·穆罕默德, 迪內希·拉馬克裡希南 申請人:高通股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀