新四季網

一種用於對聲音編碼、同時抑制聲學背景噪聲的系統和方法

2023-06-16 03:09:46

專利名稱:一種用於對聲音編碼、同時抑制聲學背景噪聲的系統和方法
技術領域:
本發明涉及對語音編碼的系統和方法,更特殊地,涉及集成有聲學噪聲抑制的聲音編碼器。
背景技術:
儘管語音在本質上是模擬的,但是常常需要在數字通訊信道上傳輸或在數字媒體中存儲。在這種情況下,語音信號必須通過多種方法或技術中的一種來採樣和編碼。每種編碼技術都有一種相關的解碼器,用來根據所傳輸和存儲的值而合成或重構語音。編碼器和解碼器的組合通常稱作編一解碼器或coder。
在語音編碼領域有很多已知的技術。這些技術大致分為兩類波形編碼和參數編碼。波形編碼器嘗試自己對語音進行量化和編碼。這些技術被用於大多數現代的公共電話網中,並且以相對較低的複雜度產生高質量的語音。然而,波形編碼器並不是特別有效,意思是,為了獲得期望的重構語音質量,必須傳輸或存儲相對大量的信息。在某些傳輸帶寬或存儲容量有限的應用中,這一點是不可接受的。
通常,參數編碼器能夠以低于波形編碼器的信息率來產生期望的語音質量。每種類型的參數編碼器都為語音信號假設一個特殊的模型,該模型包括一些參數。在大多數情況中,參數模型被針對人類語音而高度最優化。參數編碼器接收語音信號的樣本,將樣本放入模型,然後量化並編碼這些值作為模型參數值。傳輸參數值而不是波形值使得參數編碼器能高效工作。然而,當非聲音信號存在或者除了聲音還存在其它信號時,聲音模型的最優化會造成問題。例如,當存在來自汽車環境的背景噪聲時,很多參數編碼器產生令人討厭的可聽人工痕跡。
由於重構語音中的這些人工痕跡對於聽眾來說可能不可接受,必須採用測量值來消除或至少減少背景噪聲。一種方法是,使用噪聲抑制設備作為語音編碼器的預處理器。噪聲抑制器從麥克風和其它的設備接收含噪聲語音信號的樣本,並處理這些樣本,然後輸出背景噪聲電平降低的語音樣本。輸出樣本是時域的,因此可以輸入到語音編碼器或直接送到數模轉換器(DAC)設備來合成可聽的語音。
用於噪聲抑制的一種通常的方法是譜相減。在該方法中,背景噪聲的模型和組合信號(或語音加噪聲)的模型被用來構造線形噪聲抑制濾波器。這些模型通常作為功率譜密度(PSDs)保持在頻率域中。當聲音活動檢測器(VAD)表明語音存在或不存在時,噪聲模型和組合模型被分別更新。噪聲抑制輸入樣本被變換到頻域,這些樣本被施加噪聲抑制濾波器,並且在輸出到語音編碼器和DAC之前,樣本被變換回時域。
參數聲音編碼器可以進一步劃分成時域和頻域類型。大多數時域參數編碼器基於包括線形預測係數(LPCs)的模型。代表性的頻域類型是多波段激勵(MBE)編碼器,該編碼器包括已知的IMBETM和AMBETM方法。MBE類編碼器使用頻率模型,該模型包括一些參數,如基頻(或音調)、在基頻和其諧波上計算的一組譜幅度、劃分每個頻段中清音或濁音能量的一組布爾值。一般地,在各個譜幅度和清/濁音判斷之間存在一對一的對應關係。MBE類編碼器通過分析語音信號樣本幀或樣本組來計算參數值。這些參數值然後被量化和編碼用以傳輸或存儲。
在仔細觀察之後,在譜相減技術和例如上面描述的MBE類頻域聲音編碼器之間存在清晰的類似性。兩者都使用頻率模型。實際上,在計算模型的頻率方面和模型格式方面,這些模型可能非常相似。而且,兩者的功能都不考慮輸入信號的相位。譜相減輸入和輸出之間的相位是一樣的,而頻域解碼器可以加上任意的相位,因為該信息並不在所發送的模型參數中。最後兩種方法都使用了VAD,因為,可能很有利的是使編碼器在不連續發送(DTX)模式下工作。該發明的目標是通過在頻域語音編碼器中引入譜相減噪聲抑制來利用這些類似性。與使用噪聲抑制器作為語音編碼器預處理器相比,這種技術或設備複雜度明顯很低。
發明概要根據本發明,這裡給出用於抑制聲音編碼器中噪聲的方法。
概括來說,這裡描述了一種集成有噪聲抑制的用於對聲音編碼的系統,該系統包括一個採樣器,它將模擬音頻信號轉換成時域音頻樣本幀。與採樣器相連的聲音活動檢測器確定當前幀中是否存在語音。變換器與採樣器相連用來將時域音頻樣本幀變換成頻域表示。如果聲音活動檢測器確定不存在語音的話,與聲音活動檢測器和變換器相關的噪聲模型調整器利用當前的音頻幀來更新噪聲模型。變換器和濾波器創建器創建噪聲抑制濾波器。與變換器和噪聲模型調整器相連的譜估計器從當前幀的頻域表示中除去噪聲特性,並推導出一組譜幅度。
本發明的另一個特徵是變換器包括一個離散傅立葉變換,該變換計算間隔均勻的離散頻率點上的複數譜。變換器還計算當前幀的組合功率譜密度估計值。
本發明的另一個特徵是噪聲模型調整器計算背景噪聲的模型。
本發明的另一個特徵是變換和濾波器計算塊計算一個增強濾波器以抑制聲學背景噪聲。
本發明的又一個特徵是變換和濾波器計算塊包括一個變換對,變換對中一個元素將當前幀的功率譜估計值變換成模型矢量。當不存在語音時,該模型矢量被用於自適應地更新噪聲模型矢量。變換對的另一個元素將更新後的噪聲模型矢量變換成噪聲功率譜的估計值。
本發明的又一個特徵是變換和濾波器計算塊使用更新後的噪聲功率譜估計和音頻樣本當前幀的功率譜估計值來計算前面提到的增強濾波器。
本發明的另一個特徵是噪聲模型調整器給出噪聲模型參數的長時平滑。
本發明的另一個特徵是譜估計器包括一個譜增強器,該增強器從當前的語音功率譜密度中減去一部分噪聲功率譜密度。
特別地,這裡描述了一種多波段激勵聲音編碼器,該編碼器集成了噪聲抑制功能。這種集成提高了遠端聽眾的主觀音頻質量,並且比功能分開的算法實現起來複雜度更低。MBE聲音編碼器已經包括譜相減噪聲抑制器所需的很多功能。這些功能包括時頻變換,音頻信號的譜模擬。這種最佳協和作用樣明顯地降低了實現所需的存儲器。集成方案計算要求較低,因為時頻變換對已經被消除了。
本發明的其它特徵和優點從細則和附圖中可以明顯看出。
附圖描述

圖1是以前技術的語音編碼系統的方框圖;圖2是以前技術的MBE類語音編碼器的方框圖;圖3根據本發明集成有聲音抑制的語音編碼器的方框圖;圖4是圖3中變換和濾波器計算塊的擴大後的方框圖;以及圖5是另一個變換和濾波器計算塊的擴大的方框圖。
本發明詳細描述先參考圖1,這裡給出了典型的以前技術的語音編碼系統10。語音編碼系統10包括噪聲抑制器12和語音編碼器14。噪聲抑制器12和語音編碼器14一般由微處理器或數位訊號處理器中運行的算法實現。在一種形式中,語音編碼器14可以包括一個多波段激勵(MBE)類語音編碼器如圖2所示。MBE類語音編碼器包括分析塊16,該塊利用基頻ω0、由矢量M表示的在基頻和諧波頻率上計算的輸入音頻譜的一組幅度,以及由矢量V表示的每個頻段的一組濁/清音判斷在頻域為語音建模。這些參數被輸入到量化和編碼塊18,該塊將它們量化成一組離散值,並將它們編碼成用於數字傳輸的比特。
該發明特別針對抑制聲音編碼器中的背景噪聲的方法和集成有噪聲抑制的聲音編碼器裝置。聲音編碼器必須基於頻域模型。因此,本發明將被利用MBE聲音編碼器而描述,因為MBE編碼器是該類編碼器的代表。注意到這些概念可以外推到其它的頻域聲音編碼器,例如正弦變換編碼器(STCs)。
參考圖3,這裡給出了集成有噪聲抑制的多波段激勵聲音編碼器20。聲音編碼器20最好以沒有給出的微處理器或數位訊號處理器中的適當算法實現。編碼器20包括分析功能塊22和量化及編碼功能塊24。
音頻信號通過麥克風或類似設備輸入到系統的採樣器26,該採樣器將模擬音頻信號轉換成時域音頻樣本幀。聲音活動檢測器(VAD)28接收音頻樣本並確定當前幀中是否存在語音,並且用所謂的″vadFlag″標誌的狀態來表示這種判斷。濾波器組分析器38接收音頻樣本的當前幀並計算一組由矢量V表示的濁/清音判斷,以及由標量ω0表示的基頻的估計值。變換器功能塊32也接收音頻樣本的當前幀。變換器32計算這些樣本的功率譜估計值。如果vadFlag指出不存在語音的話,噪聲模型調整器功能塊34利用當前幀的估計功率譜來更新噪聲模型矢量N。噪聲模型調整器34根據更新後的噪聲模型矢量N和當前幀的估計功率譜計算譜增強濾波器。譜估計器功能塊36將譜增強濾波器應用於當前幀的估計功率譜以便除去或降低背景噪聲。此外,塊36從濾波後的功率譜估計值中推導出一組由矢量M表示的譜幅度。量化器和編碼器功能塊24將濁/清音判斷、基頻和譜幅度變換成編碼比特幀。
更具體的,時域音頻樣本幀或樣本決被編碼器20利用採樣器26捕捉。幀的大小由音頻信號的定性指標給出,一般為20毫秒到40毫秒長。這樣給出例如在8KHz採樣率下的160-320個樣本。
音頻樣本被輸入到分析濾波器組38。濾波器組38計算濁/清音判斷矢量V和基頻ω0的估計值。分析濾波器組38可以採用任何已知的形式。這種分析濾波器組38的一個例子在Griffin歐洲專利號EP722,165中描述。
音頻樣本還輸入到聲音活動檢測器28。vadFlag輸出是一個布爾值,在當前幀中存在語音時該值為1,當前幀中不存在語音時該值為0。VAD功能塊28可以用任何已知的方式實現以獲得期望的功能。這包括在ETSI文檔GSM-06.82中描述的方法,該方法描述了用於GSM增強的全速率聲音編碼器的聲音活動檢測器。
變換器功能塊32包括離散傅立葉變換(DFT)42,該部分接收時域音頻樣本幀。DFT42計算以間隔K均勻間隔的離散頻率上的複數譜S(ejω),ω=πi/K,O≤i<K。注意到在給定實值輸入信號如音頻產生的複數對稱性的條件下,單邊頻域表示是合理的。DFT一般由快速傅立葉變換算法(FFT)實現,快速傅立葉變換給出某些實現方面的改進。DFT或FFT的大小取決於音頻樣本幀的大小。例如,當來自以前幀的96個樣本被包括進來時,160樣本的音頻幀可以通過256點的FFT來變換。DFT42的輸出被輸入到塊44,該塊計算當前幀的功率譜密度(PSD)估計值,由|S(ejω)|2表示。該PSD估計值是在相同於S(ejω)的離散頻率組上計算的。
將噪聲抑制集成到MBE語音編碼器20的一個重要方面是背景噪聲模型的計算。圖3中的噪聲模型被表示為噪聲模型自適應塊46輸出的矢量N。本發明並不限於任何模擬背景噪聲的特定方法,這裡討論了幾種可能的方法。噪聲模型被噪聲模型自適應塊46存儲,並且當vadFlag設置為0,表明不存在語音時被更新。自適應過程涉及模型參數的平滑以便降低噪聲估計值的方差。這一點可以利用移動平均(MA),自回歸(AR)或組合ARMA過程來實現。AR平滑是優選技術,因為它對於低階濾波器給出更好的平滑。這降低了噪聲抑制算法的內存存儲要求。具有一階AR平滑的噪聲模型自適應由下述等式給出N(i)=αN(i-1)+(1-α)S,其中α的範圍可以是0≤α≤1,在本發明的優選實施方案中進一步限制到0.8≤α≤0.95。矢量S來自變換和濾波計算塊56並輸入到塊46。塊56還接收塊46輸出的噪聲矢量N和塊44輸出的PSD估計|S(ejω)|2作為輸入。除了S之外,塊56還輸出濾波器函數|H(ejω)|,該函數在離散頻率點ω=πi/K,O≤i<K上被採樣。
圖4給出變換和濾波器計算塊56的內部結構。該塊包括一對互補變換塊G和G-1,分別由48和50表示,以及由58表示的方差降低塊和由60表示的濾波器計算塊。反變換G-1將PSD估計|S(ejω)|2轉換成噪聲模型自適應使用的矢量S。前向變換G將噪聲矢量N變換成噪聲PSD估計值|N(ejω)|2。
方差降低塊接收| S(ejω)|2作為輸入並在頻域施加平滑函數以產生輸出|S^(ejω)|2。這種平滑降低了功率譜估計值|S(ejω)|2中的噪聲方差。這種方差是由於用於計算該估計值的音頻幀中的有限的樣本數造成的。隨著輸入幀的大小增加,在塊58中就需要更少的平滑。一種示例平滑函數由下式給出ωi=1/n.o≤i<n其中n針對所需的平滑度而被選擇。這種平滑功能是通過在頻域與|S(ejω)|2做線性或圓形卷積而施加的。其它的其中所有值都不一樣的平滑函數也可使用。
平滑後的估計值|S^(ejω)|2從塊58輸出到塊60,後者還從塊50接收|N(ejω)|2。這兩個信號被用來根據下述方法計算增強濾波器|H(ejω)|。fori=O…K-1, end其中各種r和s的組合可以被選擇。幾種可能的組合包括{r=1,s=1},{r=1,s=2}和{ r=2,s=1},但是其它組合併不在本發明範圍之外。減法因子δ的值設定了要減去的噪聲PSD的量,減法下限η限制了對於任何頻率的相減量。並不需要η的固定值,實際上,對於某些類型的背景噪聲來說,作為頻率函數的變化η可能是優選方案。δ和η的值是相關的,應該基於每種應用的需求而聯合選擇。
塊60計算的增強濾波器|H(ejω)|被輸入到塊52,在此,它被施加到|S(ejω)|2以便抑制PSD估計值中的背景噪聲。增強的PSD估計|X(ejω)|2是根據下式產生的|X(ejω)|2=|H(ejω)||S(ejω)|2.
在傳統操作中,增強後的PSD估計值|X(ejω)|2從塊52輸出到譜幅度估計塊54。塊54計算一組幅度參數,由矢量M表示,該矢量作為輸入被輸入到量化和編碼塊24。
如上面提到的,噪聲模型可以用多種不同的方式實現。每種都有一個唯一的G/G-1變換對,各種不同模型之間的主要平衡是變換對的複雜度對存儲噪聲模型矢量N所需內存之間的平衡。可能的噪聲模型包括下面的選項1.噪聲模型N與|N(ejω)|2相同。在這種情況中,變換G/G-1是一樣的。變換僅僅是相似性的映射。這種噪聲模型需要最大的存儲器用於存儲;或者2.噪聲模型N包括譜幅度|N(ejω)|2。而噪聲模型是相同於選項1中數量的離散頻率上計算的,通過使用幅度而不是PSD,動態範圍需求被減半。這降低了存儲器需求。在這種情況下,G/G-1變換是平方根和平方函數,並被施加到模型的每個元素上;或3.噪聲模型N包括以對數表示的PSD值|N(ejω)|2。在這種情況中,變換對由下式給出G(N)=(KN)2G-1(|N(ej)|2)=0.5logk(|S(ej)|2)]]>其中對數基數k是基於實現考慮而選擇的。功率和對數算子被應用於它們各個矢量參數的每個元素上;或者4.噪聲模型N包括在少於選項1到3中的離散頻率數上計算的PSDs。如果|N(ejω)|2在頻率間隔ω1上計算並且N是在均勻頻率間隔ω2上計算的,那麼變換G/G-1分別是比例為ω2/ω1的內插器和抽取器。例如,N可以用相同於MBE編碼器使用的譜幅度M同樣的格式存儲。在這種情況下,變換G-1與圖3中的譜幅度估計塊54一樣。對於噪聲模型N並不需要均勻的頻率間隔;實際上,對數間隔可能更有利。噪聲模型N所需的內存存儲按照比例ω2/ω1而降低;或者5.噪聲模型N並不限於頻域;實際上,時域模型可能更有利。例如,N可以是背景噪聲自相關函數(ACF)的第一L值的單邊估計值。在這種情況中,G是離散餘弦變換(DCT)。噪聲PSD的元素|N(ejω)|2是由下式計算的 反變換G-1也是DCT,S的元素由下式計算 該領域的技術人員將認識到DCT或FFT可以用於實現變換G和G-1;或6.N的另一個可能的時域模型是一組線性預測係數(LPC)。在這種情況下,噪聲被模擬為AR隨機過程。變換G-1引入了選項5中的G-1,接下來進行如Levinson-Durbin算法的變換來根據估計ACF而計算LPCs。前向變換G由下式給出G-(N-)=1DCT{N-}]]>其中的倒數計算是一個元素一個元素計算的。細心的讀者會認識到這是對選項5中G的元素-元素的倒數計算。
儘管塊56的功能對於所有的噪聲模型都是適用的,可以預測通過使用另外可選版本的變換和濾波器計算塊,特殊的模型可能更有利。這種另外可選的版本由塊62表示並在圖5中給出。塊62對塊56的主要新穎性在於增強濾波器是在噪聲模型領域計算的,並且被變換到採樣後的頻域。在圖5中,信號模型矢量S被輸入到方差降低塊64,該塊輸出由S^表示的S被平滑後的版本。矢量S^和噪聲模型矢量N被輸入到增強濾波器計算塊66。塊66計算增強濾波器矢量H,該矢量與兩個輸入矢量N和S^具有同樣的形式。濾波器矢量H從塊66輸出到G變換塊50,該塊計算以離散頻率點ω=πi/K,O≤i<K採樣的增強濾波器|H(ejω)|。如果噪聲模型矢量N的元素數少於採樣頻率點數K,那麼使用塊62而不是塊56在計算上更有利。上面在選項4中描述的噪聲模型是這樣一種模型對於該模型塊62的方法更有利。
如所給出的,分析塊22的輸出是濁/清音判斷矢量V,選出的基頻ω0和幅度矢量M。這些被輸入到量化和編碼塊24。量化和編碼塊24可以採用任何已知的形式並且可以類似於在Hardwick et al,世界專利號WO9412972中描述的形式。
這樣,根據本發明,這裡給用於對聲音編碼同時抑制聲學背景噪聲的系統和用於抑制聲音編碼器中的聲學背景噪聲的方法。
權利要求
1.集成了噪聲抑制的用於對聲音編碼的系統,包括將模擬音頻信號轉換成時域音頻樣本幀的採樣器;與採樣器操作性相連用於確定當前幀中是否存在語音的聲音活動檢測器;與採樣器操作性相連用於將時域音頻樣本幀變換到頻域表示的變換器;與聲音活動檢測器和變換器相關的、當聲音活動檢測器確定不存在語音時用於利用當前幀來更新噪聲模型的噪聲模型調整器;與變換器和噪聲模型調整器操作性相連用於創建噪聲抑制濾波器的變換器和濾波器創建器;以及與變換器和噪聲模型調整器操作性相連用於從當前幀的頻域表示中除去噪聲特性並得到一組譜幅度的譜估計器。
2.權利要求1的系統,還包括用於將所推出的譜幅度變換成編碼比特幀的量化器和編碼器。
3.權利要求1的系統,其中的系統包括多波段激勵聲音編碼器。
4.權利要求1的系統,其中的系統包括正弦變換聲音編碼器。
5.權利要求1的系統,其中所述的變換器包括離散傅立葉變換(DFT),該變換根據音頻樣本幀計算均勻間隔的離散頻率點上的複數譜。
6.權利要求5的系統,其中所述的DFT以快速傅立葉變換計算。
7.權利要求1的系統,其中變換器的輸出包括採樣PSD估計值並且變換器和濾波器創建器包括用於在噪聲模型調整器域和採樣PSD估計值域之間進行轉換的變換對;用於平滑當前音頻幀的採樣PSD估計值的方差降低器;以及用於計算噪聲抑制濾波器的濾波器創建器。
8.權利要求7的系統,其中濾波器創建器利用噪聲的PSD估計值和當前幀的PSD估計值來計算所述的噪聲抑制濾波器。
9.權利要求7的系統,其中方差降低器在當前幀的PSD估計值被用於計算噪聲抑制濾波器之前在頻域平滑該PSD估計值。
10.權利要求9的系統,其中方差降低器利用對PSD估計值進行操作的移動平均濾波器來平滑當前幀的PSD估計值。
11.權利要求1的系統,其中噪聲模型調整器存儲噪聲模型參數的矢量。
12.權利要求11的系統,其中噪聲模型參數以相同於變換器輸出的當前幀的採樣PSD估計值的格式被存儲。
13.權利要求12的系統,其中噪聲模型以相同於PSD估計值的點數來存儲,但是所存儲的值表示實際用於PSD估計的值的平方根。
14.權利要求12的系統,其中噪聲模型以相同於PSD估計值的點數來存儲,但是所存儲的值表示用於PSD估計的值的對數。
15.權利要求12的系統,其中噪聲模型包括一組譜幅度,所述幅度在頻域的間隔相等並且該組包括數量比PSD估計值少的幅度。
16.權利要求12的系統,其中噪聲模型包括一組譜幅度,所述幅度在頻域被進行對數分隔並且該組包括數量比PSD估計值少的幅度。
17.權利要求11的系統,其中噪聲模型參數矢量包括時域模型如自相關函數(ACF)或一組線性預測係數(LPC)。
18.權利要求11的系統,其中聲音編碼器包括多波段激勵(MBE)聲音編碼器並且其中噪聲模型以相同於MBE模型的譜幅度的格式存儲。
19.權利要求1的系統,其中噪聲模型調整器給出噪聲模型參數的長時平滑。
20.權利要求19的系統,其中所述的平滑是通過自回歸、移動平均或組合自回歸移動平均濾波器來實現的。
21.權利要求1的系統,其中譜估計器包括一個譜增強器,該增強器將噪聲抑制濾波器應用於當前音頻幀的PSD估計值,創建增強的PSD估計值。
22.權利要求21的系統,其中譜估計器包括一個譜幅度估計器,該估計器接收增強的PSD估計值作為輸入並計算一組譜幅度。
23.抑制聲音編碼器中噪聲的方法,包括以下步驟將所接收的模擬音頻信號轉換成時域音頻樣本幀;確定時域音頻樣本的當前幀中是否存在語音;將時域音頻樣本幀變換成頻域表示;如果不存在語音,則利用變換後的當前幀更新噪聲模型;根據頻域表示創建噪聲抑制濾波器;從當前幀的頻域表示中除去噪聲特性並推導一組譜幅度。
24.權利要求23的方法,還包括將所推出的譜幅度變換成編碼比特幀的步驟。
25.權利要求23的方法,其中所述的變換步驟使用了離散傅立葉變換(DFT),該變換根據音頻樣本幀計算均勻間隔的離散頻率點上的複數譜。
26.權利要求25的方法,其中所述的DFT以快速傅立葉變換計算。
27.權利要求23的方法,其中變換步驟推導出採樣後的PSD估計值並且創建步驟使用用於在噪聲模型域和採樣PSD估計值域之間進行轉換的變換對;用於平滑當前幀的採樣PSD估計值的方差降低器;以及用於計算噪聲抑制濾波器的濾波器創建器。
28.權利要求27的方法,其中濾波器創建器利用噪聲的PSD估計值和當前幀的PSD估計值來計算所述的噪聲抑制濾波器。
29.權利要求27的方法,其中方差降低器在PSD估計值被用於計算噪聲抑制濾波器之前在頻域平滑當前幀的PSD估計值。
30.權利要求29的方法,其中方差降低器利用對PSD估計值進行操作的移動平均濾波器來平滑當前幀的PSD估計值。
31.權利要求23的方法,其中更新步驟存儲噪聲模型參數的矢量。
32.權利要求31的方法,其中噪聲模型參數以相同於變換步驟推導出的當前音頻幀的採樣PSD估計值的格式被存儲。
33.權利要求32的方法,其中噪聲模型以相同於PSD估計值的點數來存儲,但是所存儲的值表示實際用於PSD估計的值的平方根。
34.權利要求32的方法,其中噪聲模型以相同於PSD估計值的點數來存儲,但是所存儲的值表示用於PSD估計的值的對數。
35.權利要求32的方法,其中噪聲模型是一組譜幅度,所述幅度在頻域的間隔相等並且該組包括數量比PSD估計值更少的幅度。
36.權利要求32的方法,其中噪聲模型是一組譜幅度,所述幅度在頻域被進行對數劃分並且該組包括數量比PSD估計值更少的幅度。
37.權利要求31的方法,其中噪聲模型參數矢量包括時域模型如自相關函數(ACF)或一組線性預測係數(LPCs)。
38.權利要求31的方法,其中聲音編碼器包括多波段激勵(MBE)聲音編碼器並且其中噪聲模型以相同於MBE模型譜幅度的格式存儲。
39.權利要求23的方法,其中更新步驟給出噪聲模型參數的長時平滑。
40.權利要求39的方法,其中所述的平滑是通過自回歸、移動平均或組合自回歸移動平均濾波器來實現的。
41.權利要求23的方法,其中除去步驟使用了譜增強器,該增強器將噪聲抑制濾波器應用於當前音頻幀的PSD估計值,創建增強的PSD估計值。
42.權利要求41的系統,其中譜估計器包括一個譜幅度估計器,該估計器接收增強的PSD估計值作為輸入並計算一組譜幅度。
全文摘要
這裡描述了一種用於對聲音編碼,同時抑制聲學噪聲的系統和用於抑制聲音編碼器中聲學背景噪聲的方法。其中的聲音編碼器包括一個採樣器,它捕捉音頻信號的時域樣本幀。與採樣器連接的聲音活動檢測器確定當前幀中是否存在語音。變換器連接到採樣器用來將時域音頻樣本幀變換成該幀的功率譜估計值。如果聲音活動檢測器表明該幀中不存在語音的話,與變換器相關的噪聲模型調整器基於當前幀的功率譜估計來更新頻域噪聲模型。與噪聲模型調整器和變換器相連的濾波器計算塊根據當前的功率譜估計和調整後的噪聲模型來計算譜增強濾波器。與變換器和濾波器計算塊相連的譜增強塊將譜增強濾波器應用於當前功率譜估計值。量化器和編碼器塊將聲音編碼模型參數,包括增強的譜幅度變換成編碼比特幀。
文檔編號G10L19/00GK1285945SQ98812990
公開日2001年2月28日 申請日期1998年12月3日 優先權日1998年1月7日
發明者L·S·布勒鮑姆, P·M·約翰森 申請人:艾利森公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀