用於減小音頻噪聲的系統和方法

2023-12-02 10:53:46 5

專利名稱：用於減小音頻噪聲的系統和方法
技術領域：
本發明總地涉及信號處理，更具體地涉及用於減小例如語音通信信號的信號中的音頻噪聲的系統和方法。
背景技術：
背景噪聲和幹擾聲會降低語音通信系統中的語音質量和可識度。在沒有語音的情況下，背景噪聲和幹擾聲的存在是惱人的。為了解決這些問題，已經提出了多種語音增強和噪聲減小(NR) 技術，以期望信噪比(SNR)的改進將提升語音質量和可識度。然而， SNR和語音質量的改進之間存在衝突。儘管改進SNR會使語音中的噪聲減小，然而與多個可用噪聲減小和語音增強算法相關的假象或失真將會降低語音質量，從而使得語音變得不悅耳。發明內容上述問題中至少一些能夠由這裡公開的用於減小音頻噪聲的系統和方法的各種實施例來解決。可以基於從時域信號中獲得的功率譜來檢測例如噪聲和網絡信號聲音的一個或更多個聲音分量。該檢測的結果可以用於做出決策，確定能夠應用於功率譜的調整譜。可以把調整後的譜變換回基本上去除了不希望的噪聲和/或考慮到例如網絡信號聲音的已知聲音分量的時域信號。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系統包括輸入組件，其被配置為接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜。所述系統還包括至少一個檢測組件，每一個檢測組件被配置為檢測所述功率譜中選定聲音分量的存在。所述系統還包括調整組件，其被配置為基於所述至少一個選定聲音分量的所述存在檢測而產生調整功率譜，並把所述調整功率譜與所述輸入頻域信號進行組合以產生輸出頻域信號。所述系統還包括輸出組件，其被配置為基於所述輸出頻域信號而產生輸出時域信號。在一個實施例中，所述輸入時域信號包括語音通信信號。在一個實施例中，所述至少一個檢測組件包括噪聲活動性檢測器、白噪聲檢測器和網絡信號聲音檢測器中至少一種。在一個實施例中，所述功率譜包括N個頻率區，並與所述輸入時域信號的N個採樣值相對應。在一個實施例中，所述噪聲活動性檢測器被配置為把所述N個頻率區的一個或更多個組的幅度與相應的選定值進行比較，並產生噪聲活動性指示符，該噪聲活動性指示符指示所述功率譜中是否存在噪聲活動性。在一個實施例中，所述噪聲活動性檢測器被配置為把所述N 個頻率區分為多個頻帶；獲得所述多個頻帶中每一個頻帶的幅度值；針對所述多個頻帶中每一個頻帶，把所述幅度值與閾值進行比較；以及如果針對所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾值，則確定存在所述噪聲活動性。在一個實施例中，所述白噪聲檢測器被配置為基於所述N個頻率區之和，獲得當前能量值；獲得所述當前能量值與先前能量值之間的差，所述差具有正值；以及如果所述差大於選定值，則產生白噪聲指示符，該指示符指示所述功率譜中存在白噪聲。在一個實施例中，所述網絡信號聲音檢測器被配置為從所述N 個頻率區中識別具有最大值的選定區；以及如果所述選定區滿足一個或更多個條件，則產生網絡信號聲音指示符，該網絡信號聲音指示符指示所述功率譜中存在網絡信號聲音。在一個實施例中，如果所述選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率範圍內，則產生所述網絡信號聲音指示符。在一個實施例中，所述調整功率譜包括所估計的功率譜，基於一個或更多個所述選定聲音分量的所述檢測而調整所述所估計的功率譜。在一個實施例中，所述所估計的功率譜的調整包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音且所述噪聲活動性檢測器
檢測到噪聲活動性，則利用選定量對所述所估計的功率譜進行縮放。在一個實施例中，所述所估計的功率譜的調整還包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音且所述白噪聲檢測器檢測到白噪聲，則對白噪聲進行調整。在一個實施例中，所述系統還包括再收斂組件，所述再收斂組件被配置為允許基於所述輸入時域信號，繞過所述至少一個檢測組件和所述調整組件。在一個實施例中，如果代表所述輸入時域信號的選定值在選定時段中持續小於閾值，則執行所述繞過。在一個實施例中，所述閾值大致為零。本發明的一個實施例涉及一種用於減小音頻噪聲的方法。所述方法包括接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜。所述方法還包括檢測所述功率譜中一個或更多個聲音分量的存在。所述方法還包括基於所述一個或更多個聲音分量的所述存在檢測，產生調整功率譜。所述方法還包括把所述調整功率譜與所述輸入頻域信號進行組合，以產生輸出頻域信號。所述方法還包括基於所述輸出頻域信號而產生輸出時域信號。在一個實施例中，所述輸入時域信號包括語音通信信號。在一個實施例中，所述一個或更多個聲音分量包括噪聲活動性、白噪聲和網絡信號聲音中至少一種。在一個實施例中，所述功率譜包括N個頻率區，並與所述輸入時域信號的N個採樣值相對應。在一個實施例中，通過如下方式來檢測所述噪聲活動性把所述 N個頻率區的一個或更多個組的幅度與相應的選定值進行比較，並產生噪聲活動性指示符，該指示符指示所述功率譜中是否存在噪聲活動性。在一個實施例中，通過如下方式來檢測所述噪聲活動性把所述N個頻率區分為多個頻帶；獲得所述多個頻帶中每一個頻帶的幅度值；針對所述多個頻帶中每一個頻帶，把所述幅度值與閾值進行比較；以及如果針對所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾值，則確定存在所述噪聲活動性。在一個實施例中，通過如下方式來檢測所述白噪聲基於所述N 個頻率區之和，獲得當前能量值；獲得所述當前能量值與先前能量值
之間的差，所述差具有正值；以及如果所述差大於選定值，則產生白噪聲指示符，該指示符指示所述功率譜中存在白噪聲。在一個實施例中，通過如下方式來檢測所述網絡信號聲音從所述N個頻率區中識別具有最大值的選定區；以及如果所述選定區滿足一個或更多個條件，則產生網絡信號聲音指示符，該網絡信號聲音指示符指示所述功率譜中存在網絡信號聲音。在一個實施例中，如果所述選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率範圍內，則產生所述網絡信號聲音指示符。在一個實施例中，所述調整功率譜包括所估計的功率譜，基於一個或更多個聲音分量的所述檢測而調整所述所估計的功率譜。在一個實施例中，所述所估計的功率譜的調整包括如果沒有檢測到網絡信號聲音且檢測到噪聲活動性，則利用選定量對所述所估計的功率譜進行縮放。在一個實施例中，所述所估計的功率譜的調整還包括如果沒有檢測到網絡信號聲音且檢測到白噪聲，則對白噪聲進行調整。在一個實施例中，所述方法還包括基於所述輸入時域信號繞過所述檢測。在一個實施例中，如果代表所述輸入時域信號的選定值在選定時段中持續小於閾值，則執行所述繞過。在一個實施例中，所述閾值大致為零。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系統包括輸入組件，其被配置為接收輸入信號並產生與所述輸入信號相對應的功率譜，所述輸入信號具有信噪比。所述系統還包括檢測器，其被配置為檢測所述功率譜中一個或更多個聲音分量的存在。當所述輸入信號的所述信噪比維持在大致相同的水平上時，執行所述檢測。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系統包括用於產生與輸入信號相對應的功率譜的裝置。所述系統還包括用於檢測所述功率譜中的一個或更多個聲音分量的裝置。所述系統還包括用於根據所述一個或更多個聲音分量的檢測而調整所述輸入信號的裝置。

圖l示出了具有各種組件的系統的一個實施例的框圖，所述各種組件被配置為識別例如音頻通信信號的信號中的一個或更多個聲音分圖2示出了圖1中的系統能夠執行的過程的一個實施例；圖3示出了圖1中的系統的一個示例實施例；圖4A和4B示出了可以用於對信號進行調整以做進一步處理的示例性濾波組件的示例響應；圖5示出了可被配置為檢測與信號相對應的功率譜中的白噪聲的檢測器組件的一個實施例；圖6示出了可被配置為檢測與信號相對應的功率譜中的噪聲活動性的檢測器組件的一個實施例；圖7示出了可被配置為檢測與信號相對應的功率譜中的網絡信號聲音(network tone)的檢測器組件的一個實施例；圖8示出了在一個實施例中，從不同檢測器組件獲得的結果可以用於確定可用於信號的調整功率譜；以及圖9示出了圖1中的系統的另一個示例實施例。通過閱讀下文參考附圖的詳細描述，本教導的這些和其他方面、優點和新穎特徵將會變得明顯。在附圖中，相似的元素具有相似的附圖標記。
具體實施方式
本發明大體上涉及噪聲減小技術。在一些實施例中，本發明的各種特徵和技術可以在語音通信設備上實現，例如電話設備(基於無線或有線)、基於無線電的設備、助聽器等。圖1示出了具有各種組件的系統100的一個實施例的框圖，所述各種組件有助於檢測輸入信號中的一個或更多個選定聲音分量，並基於該檢測到的聲音分量來調整輸入信號。在一個實施例中，選定聲音分量可以包括噪聲。在一個實施例中，選定聲音分量可以包括人為引入的聲音，例如網絡信號聲音。為了在這裡進行描述，時域信號被標記為S (n)，而相應頻域部分被標記為S (k)。 S (k)包括幅度和相位信息；因而可以被稱作矢量量或覆信號。S (k)的幅度部分的平方通常稱作功率譜，並被標記為PowS (k)。為了在這裡進行描述，"功率譜"可以從幅度、幅度的平方或任意基於幅度的數量中獲得。因此，如圖l所示，系統100的一個實施例接收輸入信號X (n)，獲得覆信號X (k)，確定X (k)的功率譜PowX (k)，基於PowX (k)確定調整功率譜PowA (k)，並基於調整功率譜PowA (k)來調整X (k)以產生調整後的覆信號Y (k)。調整後的覆信號Y (k)可以被轉換回其相應時域部分Y (n)。在一個實施例中，系統100包括能夠提供上述功能的輸入組件102、檢測組件104、調整組件106和輸出組件110。在一個實施例中，系統還可以包括旁路組件112。這些組件在下文中詳細描述。在一些實施例中，這裡描述的各種特徵的功能由處理器、組件、和/或模塊來實現或加以促進。為了在這裡進行描述，處理器可以包括一個或更多個處理器件和/或一個或更多個過程。類似地，組件或模塊可以包括一個或更多個器件和/或一個或更多個過程。此外，不同的組件能夠作為分立器件或相同器件的部分而共存。此外，某些組件能夠以一個器件的部分而共存，同時其他組件是一個或更多個器件的部分。如圖1所示，所示的輸入信號X (n)由輸入組件102接收，輸入組件102產生相應的覆信號X(k)及其功率譜PowX(k)。所示的功率譜PowX (k)由檢測組件104接收，檢測組件104產生一個或更多個檢測結果。所示一個或更多個檢測結果由調整組件106接收，調整組件106基於一個或更多個檢測結果而產生調整功率譜PowA(k)。調整功率譜PowA(k) 可以和覆信號X (k)進行組合，以產生調整後的覆信號Y (k)。所示調整後的覆信號Y (k)由輸出組件110接收，輸出組件110產生輸出的時域信號Y (n)， Y (n)與調整後的覆信號Y (k)相對應。在一個實施例中，如圖1所示，輸入組件102可以向旁路組件112 提供信號X' (n)， X' (n)可以與輸入X (n)相同也可以不同，旁路組件112能夠確定是對X (k)進行調整(由箭頭114所示)還是復位系統狀態並繞開調整過程(由箭頭116所示)。圖2示出了圖1中的系統100的一個實施例能夠執行的過程120的一個實施例。在過程塊122中，從輸入的時域信號中獲得復頻域信號。在過程塊124中，獲得復頻域信號的功率譜。在過程塊126中，基於功率譜來檢測至少一個選定聲音分量的存在。在過程塊128中，基於對至少一個選定聲音分量的檢測而產生調整功率譜。在過程塊130中，把復頻域信號和調整功率譜進行組合，以產生輸出的復頻域信號。在過程塊 132中，從輸出的復頻域信號中產生輸出的時域信號。圖3示出了能夠執行圖2中的過程120的系統100的一個示例實施例。在圖3的示例中，上文參考圖l所述的各種組件沒有必要標出。然而可以理解的是，過程120的各種功能可以由圖3所示的示例來實現。在一個實施例中，能夠把輸入的時域信號採樣為幀。圖3所示的示例配置在對輸入信號的幀142的處理之後。為了在這裡進行描述，假定輸入幀142在8kHz採樣率的情況下具有64個採樣值。然而可以理解，其他採樣值也是可能的。在圖3中，信號的輸入幀被表示為X (n)。在這裡的描述中，X (n)有時被簡稱為輸入信號或輸入的時域信號。在一個實施例中，可以對輸入信號X (n)進行濾波以去除特定噪聲。例如，可以執行高通濾波(HPF，由塊144表示)以濾出DC分量和某些低頻噪聲。在一些應用中，例如數字增強無繩電信(DECT)系統中，輸入信號可以具有約100Hz處的信號聲音噪聲。為了處理這個示例噪聲，示例 HPF 144可以被配置為在其頻率響應中大約100Hz處具有谷，如圖4A和 4B所示。在一個實施例中，濾波後的信號X' (n)可以被分解為具有N/2 (N =128)採樣交疊的N個採樣的幀。在一個實施例中，對這樣的幀進行漢寧(harming)加窗(塊146)禾卩128-FFT (塊148)，以獲得覆信號(也被稱作復頻譜)X (k)(塊150)。在一個實施例中，如圖3進一步所示，可以基於N點FFT (塊148) 來獲得功率譜PowX (k) (k=l、 2、…、N/2)(塊152)，其中k表示值為 k*fs/N (Hz)的頻率區(frequency bin), fs是採樣率。基於輸入功率譜PowX(k)，示例檢測器-噪聲活動性檢測器(154)、白噪聲檢測器(塊156)以及網絡信號聲音檢測器(塊158)-可以確定噪聲活動性、白噪聲以及網絡信號聲音。基於該確定，檢測器154、 156 和158可以分別產生輸出標誌N—Flag、 W—Flag和T—Flag。這些示例檢測器在下文中詳細描述。在一個實施例中，噪聲活動性檢測器152和白噪聲檢測器可被設計用於殘留噪聲的減小。在一個實施例中，來自噪聲活動性檢測器154、白噪聲檢測器156和網絡信號聲音檢測器158中任意一個或任意組合的輸出可以用於噪聲功率估計及其頻譜增益估計。例如，在一個實施例中，來自所有的三個檢測器154、 156、 158的輸出可以用於噪聲功率估計及其頻譜增益估計。在一個實施例中，來自網絡信號聲音檢測器158 的輸出可以用於噪聲功率估計及其頻譜增益估計。在一個實施例中，如圖3中進一步示出，所示的檢測器154、 156、 158的輸出(包括其各自的輸出標誌)被提供給調整功率譜發生器160。所示的功率譜PowX (k)也被提供給調整功率譜發生器160。所示的調整功率譜發生器160包括如下的功能多決策匯合(塊 162)、噪聲功率譜估計(164)、以及頻譜增益估計(塊166)。儘管圖3 示出了特定的示例"流"(通過示例箭頭)，然而可以理解的是，調整功率譜發生器160的各種功能不必一定遵循這些路徑。在一個實施例中，調整功率譜發生器160首先產生噪聲功率譜164 的估計。在一個實施例中，噪聲功率譜可以通過如下示例技術來估計 (1)獲得M個幀的功率譜(例如M二8，包括當前幀的PowX (k)和7個先前的幀)；針對每一個頻率區，獲得M個幀中的最小值；並通過收集頻率區的最小值而形成所估計的噪聲功率譜。例如，如果區-l具有來自幀-7的最小值2.2，區-2具有來自幀-2的最小值1.5，等等，那麼所估計的噪聲功率譜的值對於區-l為2.2，對於區-2為1.5，等等。在一個實施例中，調整功率譜發生器160通過頻譜增益(166)來調整所估計的噪聲功率譜(164)。頻譜增益可以基於某些已知技術來確定，和/或基於某些涉及檢測器154、 156和158的輸出的決策(162) 而確定。例如，頻譜增益(對於每一個區為mSpectralGain (k))可以基於如下文獻中所示的方法而計算，並將該文件的全體通過引用結合於此"Speech enhancement using a minimum mean square error short-time spectral amplitude estimator" ， by Y.Ephraim and D. Malah， IEEE Trans. Acoust. ， Speech, SignalProcessing, vol. ASSP-32(6)， pp. 1109-1121， Dec. 1984。下文更加詳細地描述用於調整噪聲功率譜的基於檢測的增益確定的示例。在一個實施例中，如圖3進一步示出，可以對輸入的復頻譜X (k) (來自塊150)進行頻域濾波(塊166)，在此處把獲得的頻譜增益(塊 164中)應用於X (k)。例如，針對第k個頻率區的頻譜增益可以計算如下.'mSpectralGain (k， m) 二Ratio (k，m) /[Ratio (k， m) +1]， k=l、 2、…、64其中，Ratio (k, ra) 二" mSpectralGain (k， m-1) *PowX(k)* Y+ (1-a ) *P[PowX(k)]。參數a是所謂的"忘記因數"(0<a<l， a^0.98是一個示例)；Y是常數(例如0.0243)。 P[PowX(k)]是糾正函數，其中一個示例可以是max(0.0， PowX(k)* Y/EstimatedNoisePow(k)-1 )。在這個示例中， mSpectralGain (k， 0)被初始化為零。濾波166的輸出被示出為輸出的復頻譜(也被稱作覆信號)Y (k)。在一個實施例中，如圖3進一步所示，輸出的復頻譜Y (k)可以通過例如N點IFFT (塊168)進一步處理，以映射到時域上。在一個實施例中，疊加(overlap add)(塊170)技術可以用於重建表示噪聲減小的時域信號Y (n)的採樣的幀(塊172)。在一個實施例中，如圖3進一步所示，旁路或再收斂機制可以按照如下方式工作。在塊180中可以計算X' (n)幀的絕對值之和 InstantLevelS咖。也可以獲得一個或更多個先前幀的類似值。決策塊 182基於當前值和一個或更多個先前值，確定值InstantLevelSum是否等於0.0或小於針對特定時段(例如80ms)的選定值。如果"是"，則可以復位系統狀態，並繞過噪聲減小處理。在該情況下，Y (k)可以
被指定為X (k)，並被處理以產生上文所述的Y (n)。如果"否"，則可以基於上文所述的功率譜PowX (k)來執行噪聲功率譜估計和/或頻譜增益確定。圖5示出了上文參考圖3 (156)所述的白噪聲檢測器200的一個實施例。所示的求和組件202接收功率譜PowX (k),對區求和(在這個示例中是64個區)，並向平滑器204提供和ZpowX (k)。所示的平滑器204k=l接收參數kAlphaW以及和gpowx (k)，從而產生如下表示的量mSmoothedlnstantEnergy : mSmoothedInstantEnergy=kAlphaW*mSmoothedInstantEnergy+(l-kAlphaW)* gp。wxa〉。在一個實施例中，參數kAlphaW的值為大約k=l0. 94818，而量mSmoothedlnstantEnergy被初始化為零。如圖5進一步所示，mSmoothedlnstantEnergy禾口舊值 oldSmoothedInstantEnergy之間的差(206)的絕對值(208)被示出為具有值"A"。把值"B"定義為oldSmoothedInstantEnergy與參數 kEnvelopeRatio的乘積(214)。在一個實施例中，kEnvelopeRatio的值為大約0.0284。在決策塊210中對值A和B進行比較。如果A小於B，則計數器mWhiteNoiseFrameCount (被初始化為零)遞增l (216)。否則，計數器mWhiteNoiseFrameCount被重置為零(218)。如圖5進一步所示，在決策塊220中把計數器 mWhiteNoiseFrameCount 的當前值與選定計數值 kNumWhiteNoiseFrames進行比較。在一個實施例中， kNumWhiteNoiseFrames具有值38。如果mWhiteNoiseFrameCount大於或等於kNumWhiteNoiseFrames，則認為存在白噪聲，且標誌W一Flag被設置為示例值"l" (222)。計數器mWhiteNoiseFrameCount還被設置為值 kNumWhiteNoiseFrames 。如果 mWhiteNoiseFrameCoimt 小於 kNumWhiteNoiseFrames，則認定不存在白噪聲，且標誌W—Flag被設置為"0 " ( 224 )。現在，針對下一幀的分析，當前值mSmoothedlnstantEnergy變為舊值oldSmoothedlnstantEnergy(226)。圖6示出了上文參考圖3 (154)所描述的噪聲活動性檢測器230的一個實施例。具有示例性的64個區的功率譜PowX (k) (232)被示出為把該64個區分為4個示例頻帶(1=1至4) (234)。對於每一個頻帶(第i 個頻帶)，通過平方根運算塊236來處理帶內區的功率和，以產生第i 頻帶的值Magj。在一個實施例中，把值Mag一I提供給平滑器塊238，而平滑器塊238還接收參數kAlphaNad(240)。在一個實施例中，kAlphaNad 的值大約為O. 55。平滑器238基於Mag—i和kAlphaNad來計算平滑後的幅度值sMag—i:sMag—i二kAlphaNad氺sMag—i+ (1_ kAlphaNad) ,ag—i注意，針對4個示例頻帶，1=1至4。在一個實施例中，sMag—i的值被初始化為大約0.925。在一個實施例中，針對選定時段(例如30幀)保持和更新sMag—i 的最小值。因此，來自平滑器238的sMag一i的當前值可以和現有的最小值進行比較，以査看是否應當更新最小值MinMag一i (242)。 sMag—i的當前值和閾值(246)(例如選定參數乘以MinMag一i)進行比較(244)。如果sMag—i大於閾值，則認為存在噪聲活動性，且針對這裡描述的決策匯合把標誌N—Flag設置為"1"。否則，把N—Flag設置為"0"。圖7示出了參考圖3 (158)描述的網絡信號聲音檢測器250的一個實施例。如這裡所述，網絡信號聲音檢測器250或其變體可以提供簡單且有效的網絡信號聲音檢測算法。網絡信號聲音檢測器250所提供的一個或更多個功能還可以與基於頻譜相減的噪聲減小技術相結合，以實現有效的噪聲減小，同時保持例如電話系統的系統中的網絡信號聲音信息。此外，網絡信號聲音檢測算法可以被一般化為和回聲消除方案相集成，以提供更好的回聲消除且不會丟失任何有用的信息。在一個實施例中，為了描述圖7而定義如下參數。參數 mlnPsdMaxIndex是當前幀的頻率區編號，其中該區具有示例性的64個頻率區中的最大能量。參數oldlnPsdMaxIndex表示對於先前幀具有最大能量的頻率區。參數mMaxPsdRatio是O. O和l. O之間的可調正因數。參數kNLow和kNHigh定義了網絡信號聲音所處的頻率範圍；kNLow定義
了最小頻率，而kNHigh定義了最大頻率。參數mToneFrameCount是表示滿足網絡信號聲音要求的連續幀的個數的計數器。參數 kNumToneFrames是閾值。T—Flag是所檢測的標誌，其中值為l意味著當前幀被認為具有網絡信號聲音；否則，當前值被認為沒有網絡信號聲音在一個實施例中，如圖7所示，能夠以如下方式來檢測網絡信號聲音。在過程塊252中，可以確定具有PowX (k)(在示例配置中，k二l至 64)的最大值的區，並把相應的區編號k表示為mlnPsdMaxIndex。 mlnPsdMaxIndex和oldlnPsdMaxIndex之間的差(254)的絕對值(256) 被表示為"A"。因此，A二lmlnPsdMaxIndex-oldInPsdMaxIndexl 。 HiInPsdMaxIndex和mMaxPsdRatio的乘積(258)被表示為"B"。因此， B=mInPsdMaxIndex*mMaxPsdRatio。在決策塊260 ，檢査如下條件(A〈B ) 和 (kNLow〈二m工nPsdMaxIndex〈二kNHigh)。檢查條件(A〈B)以確定具有最大值的當前區與先前的區相比有多大的變化。檢查條件 (kNLow〈二mlnPsdMaxIndexOkNHigh)以確定最大值區是否處於已知的網絡信號聲音頻率範圍內。如果同時滿足這兩個條件，則認為當前幀具有網絡信號聲音，且幀計數器mToneFrameCount遞增l (264)。否則，認為當前幀沒有網絡信號聲音，並把幀計數器mToneFrameCount復位至零(262)。決策塊266確定把T—Flag設置為"1"(信號中存在網絡信號聲音) 還是"0 "(信號中不存在網絡信號聲音)。如果 mToneFrameCount〉二kNumToneFrames，則把T—Flag設置為"1" (268)，否則設置為"0" (270)。對於這兩種情況，為了對下一幀進行分析，把mlnPsdMaxIndex的當前值設置為舊值oldlnPsdMaxIndex (272)。在一個實施例中，可以使用如下值mMaxPsdRatio=0. 21 ; kNumToneFrames=19; kNLow二2且kNHigh二15 (針對示例的128-FFT)。圖8示出了上文參考圖3所提到的基於檢測的增益確定的示例的一個實施例(280)。 mSpectralGain (k)是第k個區的增益，其可以應用於具有在圖3中的塊164中所估計的噪聲功率譜的相同區。基於決策塊
282的結果來調整所示的mSpectralGain (k)，其中對如下條件進行測試((T_Flag=0)和(N_Flag=l))或(當前幀是前M個幀？)。在一個實施例中，M=9。如果決策塊282的結果是"是"，則通過因數mNoiseActivityGain (在一個示例中，0. 2<mNoiseActivityGain<=l. 0)對mSpectralGain (k)進行縮放(284)。在一個實施例中，mNoiseActivityGain的值大約是O. 50。然後，在決策塊286對另一組條件進行測試。如果決策塊282 的結果是"否"，則直接調用決策塊286。該決策塊測試如下條件(T一Flag二0)和(W_Flag=l)。如果結果是"是"，則向mSpectralGain (k)分配值mWhiteNoiseSpectralGain，其可被估計為mMinSpectralGair^mGainW (288)。在一個實施例中， mMinSpectralGain的值大約是O. 25，而mGainW的值大約是O. 891。如果結果是"否"，則以如下方式使mSpectralGain(k)經過限幅器(clipper) 290。如果mSpectralGain(k)小於mMinSpectralGain，卯JmSpectralGain (k) 二mMinSpectralGain;如果mSpectralGain (k)大於l.O，則對於所有k的值(在這個示例中為1至64)， mSpectralGain (k) 二l. 0。圖9示出了在一個實施例中，可以類似於上述系統100而對系統300 進行配置。所示的系統300具有網絡信號聲音檢測器302，其能夠提供用於決策制定的乙Flag，其中基於功率譜PowX (k)來確定該標誌。如同示例系統100，該決策制定可以包括基於是否存在網絡信號聲音而對選定頻譜增益進行調整。在一個實施例中，可以使用類似於圖8的決策制定過程-其中基於T—Flag而不基於其他檢測器標誌來做出決策-以確定頻譜增益調整的不同值。基於上文可以看出，待應用於每一個頻率區中的頻譜增益不僅可取決於噪聲功率估計，而且還取決於一個或更多個檢測及其相應的決策。儘管上文討論白噪聲、噪聲活動性和網絡信號聲音作為示例，然而也可以處理其他類型的噪聲-例如殘留噪聲、強噪聲、中度噪聲和弱噪聲。利用這些決策的信息匯合，總決策錯誤得以減小或最小化，而且可以獲得針對特定系統的增強或優化的濾波增益。通過實現本發明的特徵的各種組合，可以獲得非常良好的語音質
量，對於靜態噪聲可獲得12-20dB的有效噪聲抑制(抑制量可調整)，這是因為頻譜濾波中使用的增益不僅來自噪聲估計，而且可以通過噪聲功率估計與其他的一個或更多個檢測及其相應決策的整合而決定。此外，以下是本發明的非限制性新穎特徵(1)本發明的各種特徵大體上與輸入電平無關，因而可以使用來自檢測和決策的信息對有關功率估計進行歸一化；(2)本發明的各種特徵大體上可避免與AGC (自動增益控制，其中在應用噪聲減小處理之前改變輸入信號的信噪比)相關的失真；(3)由於本發明的技術基於功率譜而不是很多其他可用NR系統(包括計算密集的AGC)中使用的幅度譜，所以計算複雜度低；(4)因為提供了有效的網絡信號聲音檢測和有關的功能，所以可以保留電話應用的接收路徑中的網絡信號聲音；(5)因為可以根據各種決策結果來適應性地改變各種相關參數，所以可以實現快速和可調整的收斂時間、靈活的控制性、再收斂以及初始收斂。在一個實施例中，這裡描述的一個或更多個特徵還可以在多信道通信系統中實現。在多信道的情況下，不僅對一個信道、而且還對多個信道的多檢測進行信息匯合。關於網絡信號聲音檢測器，應注意如下事項。如果出現網絡信號聲音，則噪聲減小方案可以把輸入看作有用的信號，並切換為使用不同的頻譜增益以保持網絡信號聲音不會減小。對此，噪聲減小方案不僅能夠增大SNR，而且還能夠保持網絡信號聲音信息在其他可用的噪聲減小算法中可用。此外，由於網絡信號聲音檢測器基於在基於頻譜相減的噪聲減小算法中可用的頻譜，所以不需要額外的計算以獲得功率(或幅度)譜。結果，網絡信號聲音檢測器可以是簡單的，而且可以在很多應用中容易地實現。此外，網絡信號聲音檢測器可以簡單地被添加到現有的信號信道噪聲減小方案中。此外，網絡信號聲音檢測器和有關的算法可被整合到可在某些電話系統中找到的基於頻域的回聲消除方案中。此外，該技術還可以用於信令檢測器，等等。通常可以理解的是，該處理器例如可以包括計算機、程序邏輯或其他表示數據和指令的基礎配置，其以這裡描述的方式操作。在其他
實施例中，該處理器可以包括控制器電路、處理器電路、處理器、通用單片或多片微處理器、數位訊號處理器、嵌入式微處理器、微控制器等。此外可以理解的是，在一個實施例中，程序邏輯可以有利地作為一個或更多個組件而實現。所述組件可以有利地被配置為在一個或更多個處理器上執行。所述組件包括但不限於硬體或軟體組件、例如軟體模塊的模塊、面向對象的軟體組件、類組件和任務組件、處理方法、函數、屬性、過程、子例程、程序代碼段、驅動器、固件、微代碼、電路、數據、資料庫、數據結構、表、數組和變量。儘管上述實施例示出、描述並指出了應用於上述實施例的本發明的基本的新穎特徵，應當理解的是，在不背離本發明的範圍的前提下，本領域的技術人員可以對所示設備、系統和/或方法的細節的形式做出各種省略、替換和改變。因此，本發明的範圍不應被限制為上文描述，而應當由所附權利要求來限定。本申請要求2005年4月21日遞交的、標題為"SYSTEMS AND METHODS FOR REDUCING AUDIO NOISE"的美國臨時申請No. 60/673， 671的優先權，將其全體內容通過引用結合於此。
權利要求
1.一種用於減小音頻噪聲的系統，包括輸入組件，被配置為接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜；至少一個檢測組件，每一個被配置為檢測所述功率譜中選定聲音分量的存在；調整組件，被配置為基於所述至少一個選定聲音分量的所述存在檢測，產生調整功率譜；把所述調整功率譜與所述輸入頻域信號進行組合，以產生輸出頻域信號；輸出組件，被配置為基於所述輸出頻域信號而產生輸出時域信號。
2. 根據權利要求1所述的系統，其中，所述輸入時域信號包括語音通信信號。
3. 根據權利要求l所述的系統，其中，所述至少一個檢測組件包括噪聲活動性檢測器、白噪聲檢測器和網絡信號聲音檢測器中的至少一種。
4. 根據權利要求3所述的系統，其中，所述功率譜包括N個頻率區，並與所述輸入時域信號的N個採樣值相對應。
5. 根據權利要求4所述的系統，其中，所述噪聲活動性檢測器被配置為把所述N個頻率區的一個或更多個組的幅度與相應的選定值進行比較，並產生噪聲活動性指示符，該噪聲活動性指示符指示所述功率譜中是否存在噪聲活動性。
6. 根據權利要求5所述的系統，其中，所述噪聲活動性檢測器被配置為把所述N個頻率區分為多個頻帶；獲得所述多個頻帶中每一個頻帶的幅度值；針對所述多個頻帶中每一個頻帶，把所述幅度值與閾值進行比較；以及如果所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾值，則確定存在所述噪聲活動性。
7. 根據權利要求4所述的系統，其中，所述白噪聲檢測器被配置為基於所述N個頻率區之和，獲得當前能量值；獲得所述當前能量值與先前能量值之間的差，所述差具有正值；以及如果所述差大於選定值.，則產生白噪聲指示符，該白噪聲指示符指示所述功率譜中存在白噪聲。
8. 根據權利要求4所述的系統，其中，所述網絡信號聲音檢測器被配置為從所述N個頻率區中識別具有最大值的選定區；以及如果所述選定區滿足一個或更多個條件，則產生網絡信號聲音指示符，該網絡信號聲音指示符指示所述功率譜中存在網絡信號聲音。
9. 根據權利要求8所述的系統，其中，如果所述選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率範圍內，則產生所述網絡信號聲音指示符。
10. 根據權利要求4所述的系統，其中，所述調整功率譜包括所估計的功率譜，基於一個或更多個所述選定聲音分量的所述檢測而調整所述所估計的功率譜。
11. 根據權利要求10所述的系統，其中，所述所估計的功率譜的調整包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音且所述噪聲活動性檢測器檢測到噪聲活動性，則利用選定量對所述所估計的功率譜進行縮放。
12. 根據權利要求ll所述的系統，其中，所述所估計的功率譜的調整還包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音且所述白噪聲檢測器檢測到白噪聲，則對所述白噪聲進行調整。
13. 根據權利要求l所述的系統，還包括再收斂組件，所述再收斂組件被配置為允許基於所述輸入時域信號，繞過所述至少一個檢測組件和所述調整組件。
14. 根據權利要求13所述的系統，其中，如果代表所述輸入時域信號的選定值在選定時段中持續小於閾值，則執行所述繞過。
15. 根據權利要求14所述的系統，其中，所述閾值大致為零。
16. —種用於減小音頻噪聲的方法，包括接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜；檢測所述功率譜中一個或更多個聲音分量的存在；基於所述一個或更多個聲音分量的所述存在檢測，產生調整功率譜；把所述調整功率譜與所述輸入頻域信號進行組合，以產生輸出頻域信號；以及基於所述輸出頻域信號而產生輸出時域信號。
17. 根據權利要求16所述的方法，其中，所述輸入時域信號包括語音通信信號。
18. 根據權利要求16所述的方法，其中，所述一個或更多個聲音分量包括噪聲活動性、白噪聲和網絡信號聲音中至少一種。
19. 根據權利要求18所述的方法，其中，所述功率譜包括N個頻率區，並與所述輸入時域信號的N個採樣值相對應。
20. 根據權利要求19所述的方法，其中，通過如下方式來檢測所述噪聲活動性:把所述N個頻率區的一個或更多個組的幅度與相應的選定值進行比較，並產生噪聲活動性指示符，該噪聲活動性指示符指示所述功率譜中是否存在所述噪聲活動性。
21. 根據權利要求20所述的方法，其中，通過如下方式來檢測所述噪聲活動性把所述N個頻率區分為多個頻帶；獲得所述多個頻帶中每一個頻帶的幅度值；針對所述多個頻帶中每一個頻帶，把所述幅度值與閾值進行比較；以及如果所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾值，則確定存在所述噪聲活動性。
22. 根據權利要求19所述的方法，其中，通過如下方式來檢測所述白噪聲基於所述N個頻率區之和，獲得當前能量值；獲得所述當前能量值與先前能量值之間的差，所述差具有正值；以及如果所述差大於選定值，則產生白噪聲指示符，該白噪聲指示符指示所述功率譜中存在白噪聲。
23. 根據權利要求19所述的方法，其中，通過如下方式來檢測所述網絡信號聲音從所述N個頻率區中識別具有最大值的選定區；以及如果所述選定區滿足一個或更多個條件，則產生網絡信號聲音指示符，該指示符指示所述功率譜中存在網絡信號聲音。
24. 根據權利要求23所述的方法，其中，如果所述選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率範圍內，則產生所述網絡信號聲音指示符。
25. 根據權利要求19所述的方法，其中，所述調整功率譜包括所估計的功率譜，基於一個或更多個所述聲音分量的所述檢測而調整所述所估計的功率譜。
26. 根據權利要求25所述的方法，其中，所述所估計的功率譜的調整包括如果沒有檢測到網絡信號聲音且檢測到噪聲活動性，則利用選定量對所述所估計的功率譜進行縮放。
27. 根據權利要求26所述的方法，其中，所述所估計的功率譜的調整還包括如果沒有檢測到網絡信號聲音且檢測到白噪聲，則對所述白噪聲進行調整。
28. 根據權利要求16所述的方法，還包括基於所述輸入時域信號繞過所述檢測。
29. 根據權利要求28所述的方法，其中，如果代表所述輸入時域信號的選定值在選定時段中持續小於閾值，則執行所述繞過。
30. 根據權利要求29所述的方法，其中，所述閾值大致為零。
31. —種用於減小音頻噪聲的系統，包括輸入組件，被配置為接收輸入信號並產生與所述輸入信號相對應的功率譜，所述輸入信號具有信噪比；以及檢測器，被配置為檢測所述功率譜中一個或更多個聲音分量的存在；其中，當所述輸入信號的所述信噪比維持在大致相同的水平上時，執行所述檢測。
32. —種用於減小音頻噪聲的系統，包括用於產生與輸入信號相對應的功率譜的裝置；用於檢測所述功率譜中的一個或更多個聲音分量的裝置；以及用於基於所述一個或更多個聲音分量的檢測而調整所述輸入信號的裝置。
全文摘要
公開了用於減小音頻噪聲的系統和方法的各種實施例。可以基於從時域信號(142)中獲得的功率譜(152)來檢測例如噪聲(154、156)和網絡信號聲音(158)的一個或更多個聲音分量。該檢測的結果可以用於做出決策(162)，確定能夠應用於功率譜的調整譜(164、166)。可以把調整功率譜變換回大致去除了不希望的噪聲和/或考慮到例如網絡信號聲音的已知聲音分量的時域信號(172)。
文檔編號G10L21/02GK101164105SQ200680013388
公開日2008年4月16日申請日期2006年4月21日優先權日2005年4月21日
發明者鈞楊, 裡克·奧利弗申請人:Srs實驗室有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

用於減小音頻噪聲的系統和方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法