新四季網

用於減小音頻噪聲的系統和方法

2023-12-02 10:53:46 4

專利名稱:用於減小音頻噪聲的系統和方法
技術領域:
本發明總地涉及信號處理,更具體地涉及用於減小例如語音通信 信號的信號中的音頻噪聲的系統和方法。
背景技術:
背景噪聲和幹擾聲會降低語音通信系統中的語音質量和可識度。 在沒有語音的情況下,背景噪聲和幹擾聲的存在是惱人的。為了解決這些問題,已經提出了多種語音增強和噪聲減小(NR) 技術,以期望信噪比(SNR)的改進將提升語音質量和可識度。然而, SNR和語音質量的改進之間存在衝突。儘管改進SNR會使語音中的噪聲 減小,然而與多個可用噪聲減小和語音增強算法相關的假象或失真將 會降低語音質量,從而使得語音變得不悅耳。發明內容上述問題中至少一些能夠由這裡公開的用於減小音頻噪聲的系 統和方法的各種實施例來解決。可以基於從時域信號中獲得的功率譜 來檢測例如噪聲和網絡信號聲音的一個或更多個聲音分量。該檢測的 結果可以用於做出決策,確定能夠應用於功率譜的調整譜。可以把調 整後的譜變換回基本上去除了不希望的噪聲和/或考慮到例如網絡信 號聲音的已知聲音分量的時域信號。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系 統包括輸入組件,其被配置為接收輸入時域信號並產生輸入頻域信號 和所述輸入頻域信號的功率譜。所述系統還包括至少一個檢測組件, 每一個檢測組件被配置為檢測所述功率譜中選定聲音分量的存在。所 述系統還包括調整組件,其被配置為基於所述至少一個選定聲音分量 的所述存在檢測而產生調整功率譜,並把所述調整功率譜與所述輸入 頻域信號進行組合以產生輸出頻域信號。所述系統還包括輸出組件, 其被配置為基於所述輸出頻域信號而產生輸出時域信號。在一個實施例中,所述輸入時域信號包括語音通信信號。 在一個實施例中,所述至少一個檢測組件包括噪聲活動性檢測 器、白噪聲檢測器和網絡信號聲音檢測器中至少一種。在一個實施例中,所述功率譜包括N個頻率區,並與所述輸入時域信號的N個採樣值 相對應。在一個實施例中,所述噪聲活動性檢測器被配置為把所述N個頻 率區的一個或更多個組的幅度與相應的選定值進行比較,並產生噪聲 活動性指示符,該噪聲活動性指示符指示所述功率譜中是否存在噪聲活動性。在一個實施例中,所述噪聲活動性檢測器被配置為把所述N 個頻率區分為多個頻帶;獲得所述多個頻帶中每一個頻帶的幅度值; 針對所述多個頻帶中每一個頻帶,把所述幅度值與閾值進行比較;以 及如果針對所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾 值,則確定存在所述噪聲活動性。在一個實施例中,所述白噪聲檢測器被配置為基於所述N個頻 率區之和,獲得當前能量值;獲得所述當前能量值與先前能量值之間 的差,所述差具有正值;以及如果所述差大於選定值,則產生白噪聲 指示符,該指示符指示所述功率譜中存在白噪聲。在一個實施例中,所述網絡信號聲音檢測器被配置為從所述N 個頻率區中識別具有最大值的選定區;以及如果所述選定區滿足一個 或更多個條件,則產生網絡信號聲音指示符,該網絡信號聲音指示符 指示所述功率譜中存在網絡信號聲音。在一個實施例中,如果所述選 定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相 對應的頻率範圍內,則產生所述網絡信號聲音指示符。在一個實施例中,所述調整功率譜包括所估計的功率譜,基於一 個或更多個所述選定聲音分量的所述檢測而調整所述所估計的功率 譜。在一個實施例中,所述所估計的功率譜的調整包括如果所述網 絡信號聲音檢測器沒有檢測到網絡信號聲音且所述噪聲活動性檢測器
檢測到噪聲活動性,則利用選定量對所述所估計的功率譜進行縮放。 在一個實施例中,所述所估計的功率譜的調整還包括如果所述網絡 信號聲音檢測器沒有檢測到網絡信號聲音且所述白噪聲檢測器檢測到 白噪聲,則對白噪聲進行調整。在一個實施例中,所述系統還包括再收斂組件,所述再收斂組件 被配置為允許基於所述輸入時域信號,繞過所述至少一個檢測組件 和所述調整組件。在一個實施例中,如果代表所述輸入時域信號的選 定值在選定時段中持續小於閾值,則執行所述繞過。在一個實施例中, 所述閾值大致為零。本發明的一個實施例涉及一種用於減小音頻噪聲的方法。所述方 法包括接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的 功率譜。所述方法還包括檢測所述功率譜中一個或更多個聲音分量的 存在。所述方法還包括基於所述一個或更多個聲音分量的所述存在檢 測,產生調整功率譜。所述方法還包括把所述調整功率譜與所述輸入 頻域信號進行組合,以產生輸出頻域信號。所述方法還包括基於所述 輸出頻域信號而產生輸出時域信號。在一個實施例中,所述輸入時域信號包括語音通信信號。在一個實施例中,所述一個或更多個聲音分量包括噪聲活動性、 白噪聲和網絡信號聲音中至少一種。在一個實施例中,所述功率譜包 括N個頻率區,並與所述輸入時域信號的N個採樣值相對應。在一個實施例中,通過如下方式來檢測所述噪聲活動性把所述 N個頻率區的一個或更多個組的幅度與相應的選定值進行比較,並產生 噪聲活動性指示符,該指示符指示所述功率譜中是否存在噪聲活動性。 在一個實施例中,通過如下方式來檢測所述噪聲活動性把所述N個頻 率區分為多個頻帶;獲得所述多個頻帶中每一個頻帶的幅度值;針對 所述多個頻帶中每一個頻帶,把所述幅度值與閾值進行比較;以及如 果針對所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾值, 則確定存在所述噪聲活動性。在一個實施例中,通過如下方式來檢測所述白噪聲基於所述N 個頻率區之和,獲得當前能量值;獲得所述當前能量值與先前能量值
之間的差,所述差具有正值;以及如果所述差大於選定值,則產生白 噪聲指示符,該指示符指示所述功率譜中存在白噪聲。在一個實施例中,通過如下方式來檢測所述網絡信號聲音從所 述N個頻率區中識別具有最大值的選定區;以及如果所述選定區滿足一 個或更多個條件,則產生網絡信號聲音指示符,該網絡信號聲音指示 符指示所述功率譜中存在網絡信號聲音。在一個實施例中,如果所述 選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音 相對應的頻率範圍內,則產生所述網絡信號聲音指示符。在一個實施例中,所述調整功率譜包括所估計的功率譜,基於一 個或更多個聲音分量的所述檢測而調整所述所估計的功率譜。在一個 實施例中,所述所估計的功率譜的調整包括如果沒有檢測到網絡信 號聲音且檢測到噪聲活動性,則利用選定量對所述所估計的功率譜進 行縮放。在一個實施例中,所述所估計的功率譜的調整還包括如果 沒有檢測到網絡信號聲音且檢測到白噪聲,則對白噪聲進行調整。在一個實施例中,所述方法還包括基於所述輸入時域信號繞過所 述檢測。在一個實施例中,如果代表所述輸入時域信號的選定值在選 定時段中持續小於閾值,則執行所述繞過。在一個實施例中,所述閾 值大致為零。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系 統包括輸入組件,其被配置為接收輸入信號並產生與所述輸入信號相 對應的功率譜,所述輸入信號具有信噪比。所述系統還包括檢測器, 其被配置為檢測所述功率譜中一個或更多個聲音分量的存在。當所述 輸入信號的所述信噪比維持在大致相同的水平上時,執行所述檢測。本發明的一個實施例涉及一種用於減小音頻噪聲的系統。所述系 統包括用於產生與輸入信號相對應的功率譜的裝置。所述系統還包括 用於檢測所述功率譜中的一個或更多個聲音分量的裝置。所述系統還 包括用於根據所述一個或更多個聲音分量的檢測而調整所述輸入信號 的裝置。


圖l示出了具有各種組件的系統的一個實施例的框圖,所述各種 組件被配置為識別例如音頻通信信號的信號中的一個或更多個聲音分圖2示出了圖1中的系統能夠執行的過程的一個實施例; 圖3示出了圖1中的系統的一個示例實施例;圖4A和4B示出了可以用於對信號進行調整以做進一步處理的示例性濾波組件的示例響應;圖5示出了可被配置為檢測與信號相對應的功率譜中的白噪聲的檢測器組件的一個實施例;圖6示出了可被配置為檢測與信號相對應的功率譜中的噪聲活動 性的檢測器組件的一個實施例;圖7示出了可被配置為檢測與信號相對應的功率譜中的網絡信號 聲音(network tone)的檢測器組件的一個實施例;圖8示出了在一個實施例中,從不同檢測器組件獲得的結果可以用於確定可用於信號的調整功率譜;以及圖9示出了圖1中的系統的另一個示例實施例。通過閱讀下文參考附圖的詳細描述,本教導的這些和其他方面、 優點和新穎特徵將會變得明顯。在附圖中,相似的元素具有相似的附 圖標記。
具體實施方式
本發明大體上涉及噪聲減小技術。在一些實施例中,本發明的各 種特徵和技術可以在語音通信設備上實現,例如電話設備(基於無線 或有線)、基於無線電的設備、助聽器等。圖1示出了具有各種組件的系統100的一個實施例的框圖,所述各 種組件有助於檢測輸入信號中的一個或更多個選定聲音分量,並基於 該檢測到的聲音分量來調整輸入信號。在一個實施例中,選定聲音分 量可以包括噪聲。在一個實施例中,選定聲音分量可以包括人為引入 的聲音,例如網絡信號聲音。為了在這裡進行描述,時域信號被標記為S (n),而相應頻域部分 被標記為S (k)。 S (k)包括幅度和相位信息;因而可以被稱作矢量量 或覆信號。S (k)的幅度部分的平方通常稱作功率譜,並被標記為PowS (k)。為了在這裡進行描述,"功率譜"可以從幅度、幅度的平方或任 意基於幅度的數量中獲得。因此,如圖l所示,系統100的一個實施例接收輸入信號X (n),獲 得覆信號X (k),確定X (k)的功率譜PowX (k),基於PowX (k)確定 調整功率譜PowA (k),並基於調整功率譜PowA (k)來調整X (k)以產 生調整後的覆信號Y (k)。調整後的覆信號Y (k)可以被轉換回其相應 時域部分Y (n)。在一個實施例中,系統100包括能夠提供上述功能的輸入組件102、 檢測組件104、調整組件106和輸出組件110。在一個實施例中,系統還 可以包括旁路組件112。這些組件在下文中詳細描述。在一些實施例中,這裡描述的各種特徵的功能由處理器、組件、 和/或模塊來實現或加以促進。為了在這裡進行描述,處理器可以包括 一個或更多個處理器件和/或一個或更多個過程。類似地,組件或模塊 可以包括一個或更多個器件和/或一個或更多個過程。此外,不同的組件能夠作為分立器件或相同器件的部分而共存。 此外,某些組件能夠以一個器件的部分而共存,同時其他組件是一個 或更多個器件的部分。如圖1所示,所示的輸入信號X (n)由輸入組件102接收,輸入組 件102產生相應的覆信號X(k)及其功率譜PowX(k)。所示的功率譜PowX (k)由檢測組件104接收,檢測組件104產生一個或更多個檢測結果。 所示一個或更多個檢測結果由調整組件106接收,調整組件106基於一 個或更多個檢測結果而產生調整功率譜PowA(k)。調整功率譜PowA(k) 可以和覆信號X (k)進行組合,以產生調整後的覆信號Y (k)。所示調 整後的覆信號Y (k)由輸出組件110接收,輸出組件110產生輸出的時 域信號Y (n), Y (n)與調整後的覆信號Y (k)相對應。在一個實施例中,如圖1所示,輸入組件102可以向旁路組件112 提供信號X' (n), X' (n)可以與輸入X (n)相同也可以不同,旁路組 件112能夠確定是對X (k)進行調整(由箭頭114所示)還是復位系統 狀態並繞開調整過程(由箭頭116所示)。圖2示出了圖1中的系統100的一個實施例能夠執行的過程120的一 個實施例。在過程塊122中,從輸入的時域信號中獲得復頻域信號。在 過程塊124中,獲得復頻域信號的功率譜。在過程塊126中,基於功率 譜來檢測至少一個選定聲音分量的存在。在過程塊128中,基於對至少 一個選定聲音分量的檢測而產生調整功率譜。在過程塊130中,把復頻 域信號和調整功率譜進行組合,以產生輸出的復頻域信號。在過程塊 132中,從輸出的復頻域信號中產生輸出的時域信號。圖3示出了能夠執行圖2中的過程120的系統100的一個示例實施 例。在圖3的示例中,上文參考圖l所述的各種組件沒有必要標出。然 而可以理解的是,過程120的各種功能可以由圖3所示的示例來實現。在一個實施例中,能夠把輸入的時域信號採樣為幀。圖3所示的示 例配置在對輸入信號的幀142的處理之後。為了在這裡進行描述,假定 輸入幀142在8kHz採樣率的情況下具有64個採樣值。然而可以理解,其他採樣值也是可能的。在圖3中,信號的輸入幀被表示為X (n)。在這裡的描述中,X (n)有時被簡稱為輸入信號或輸入的時域信號。在一個實施例中,可以對輸入信號X (n)進行濾波以去除特定噪 聲。例如,可以執行高通濾波(HPF,由塊144表示)以濾出DC分量和 某些低頻噪聲。在一些應用中,例如數字增強無繩電信(DECT)系統中,輸入信 號可以具有約100Hz處的信號聲音噪聲。為了處理這個示例噪聲,示例 HPF 144可以被配置為在其頻率響應中大約100Hz處具有谷,如圖4A和 4B所示。在一個實施例中,濾波後的信號X' (n)可以被分解為具有N/2 (N =128)採樣交疊的N個採樣的幀。在一個實施例中,對這樣的幀進行 漢寧(harming)加窗(塊146)禾卩128-FFT (塊148),以獲得覆信號(也 被稱作復頻譜)X (k)(塊150)。在一個實施例中,如圖3進一步所示,可以基於N點FFT (塊148) 來獲得功率譜PowX (k) (k=l、 2、…、N/2)(塊152),其中k表示值為 k*fs/N (Hz)的頻率區(frequency bin), fs是採樣率。基於輸入功率譜PowX(k),示例檢測器-噪聲活動性檢測器(154)、 白噪聲檢測器(塊156)以及網絡信號聲音檢測器(塊158)-可以確定 噪聲活動性、白噪聲以及網絡信號聲音。基於該確定,檢測器154、 156 和158可以分別產生輸出標誌N—Flag、 W—Flag和T—Flag。這些示例檢測 器在下文中詳細描述。在一個實施例中,噪聲活動性檢測器152和白噪聲檢測器可被設計 用於殘留噪聲的減小。在一個實施例中,來自噪聲活動性檢測器154、 白噪聲檢測器156和網絡信號聲音檢測器158中任意一個或任意組合的輸出可以用於噪聲功率估計及其頻譜增益估計。例如,在一個實施例 中,來自所有的三個檢測器154、 156、 158的輸出可以用於噪聲功率估 計及其頻譜增益估計。在一個實施例中,來自網絡信號聲音檢測器158 的輸出可以用於噪聲功率估計及其頻譜增益估計。在一個實施例中,如圖3中進一步示出,所示的檢測器154、 156、 158的輸出(包括其各自的輸出標誌)被提供給調整功率譜發生器160。 所示的功率譜PowX (k)也被提供給調整功率譜發生器160。所示的調整功率譜發生器160包括如下的功能多決策匯合(塊 162)、噪聲功率譜估計(164)、以及頻譜增益估計(塊166)。儘管圖3 示出了特定的示例"流"(通過示例箭頭),然而可以理解的是,調整 功率譜發生器160的各種功能不必一定遵循這些路徑。在一個實施例中,調整功率譜發生器160首先產生噪聲功率譜164 的估計。在一個實施例中,噪聲功率譜可以通過如下示例技術來估計 (1)獲得M個幀的功率譜(例如M二8,包括當前幀的PowX (k)和7個先 前的幀);針對每一個頻率區,獲得M個幀中的最小值;並通過收集頻 率區的最小值而形成所估計的噪聲功率譜。例如,如果區-l具有來自 幀-7的最小值2.2,區-2具有來自幀-2的最小值1.5,等等,那麼所估 計的噪聲功率譜的值對於區-l為2.2,對於區-2為1.5,等等。在一個實施例中,調整功率譜發生器160通過頻譜增益(166)來 調整所估計的噪聲功率譜(164)。頻譜增益可以基於某些已知技術來 確定,和/或基於某些涉及檢測器154、 156和158的輸出的決策(162) 而確定。例如,頻譜增益(對於每一個區為mSpectralGain (k))可以 基於如下文獻中所示的方法而計算,並將該文件的全體通過引用結合 於此"Speech enhancement using a minimum mean square error short-time spectral amplitude estimator" , by Y.Ephraim and D. Malah, IEEE Trans. Acoust. , Speech, SignalProcessing, vol. ASSP-32(6), pp. 1109-1121, Dec. 1984。下文更加詳細地描述用於調整噪聲功率譜的基於檢測的增益確定的示例。在一個實施例中,如圖3進一步示出,可以對輸入的復頻譜X (k) (來自塊150)進行頻域濾波(塊166),在此處把獲得的頻譜增益(塊 164中)應用於X (k)。例如,針對第k個頻率區的頻譜增益可以計算如 下.'mSpectralGain (k, m) 二Ratio (k,m) /[Ratio (k, m) +1], k=l、 2、…、64其中,Ratio (k, ra) 二" mSpectralGain (k, m-1) *PowX(k)* Y+ (1-a ) *P[PowX(k)]。參數a是所謂的"忘記因數"(0<a<l, a^0.98是一個示例);Y是常 數(例如0.0243)。 P[PowX(k)]是糾正函數,其中一個示例可以是max(0.0, PowX(k)* Y/EstimatedNoisePow(k)-1 )。在這個示例中, mSpectralGain (k, 0)被初始化為零。濾波166的輸出被示出為輸出 的復頻譜(也被稱作覆信號)Y (k)。在一個實施例中,如圖3進一步所示,輸出的復頻譜Y (k)可以通 過例如N點IFFT (塊168)進一步處理,以映射到時域上。在一個實施 例中,疊加(overlap add)(塊170)技術可以用於重建表示噪聲減小 的時域信號Y (n)的採樣的幀(塊172)。在一個實施例中,如圖3進一步所示,旁路或再收斂機制可以按照 如下方式工作。在塊180中可以計算X' (n)幀的絕對值之和 InstantLevelS咖。也可以獲得一個或更多個先前幀的類似值。決策塊 182基於當前值和一個或更多個先前值,確定值InstantLevelSum是否 等於0.0或小於針對特定時段(例如80ms)的選定值。如果"是",則 可以復位系統狀態,並繞過噪聲減小處理。在該情況下,Y (k)可以
被指定為X (k),並被處理以產生上文所述的Y (n)。如果"否",則可 以基於上文所述的功率譜PowX (k)來執行噪聲功率譜估計和/或頻譜 增益確定。圖5示出了上文參考圖3 (156)所述的白噪聲檢測器200的一個實 施例。所示的求和組件202接收功率譜PowX (k),對區求和(在這個示例中是64個區),並向平滑器204提供和ZpowX (k)。所示的平滑器204k=l接收參數kAlphaW以及和gpowx (k),從而產生如下表示的量mSmoothedlnstantEnergy : mSmoothedInstantEnergy=kAlphaW*mSmoothedInstantEnergy+(l-kAlphaW)* gp。wxa〉。在一個實施例中,參數kAlphaW的值為大約k=l0. 94818,而量mSmoothedlnstantEnergy被初始化為零。如圖5進 一 步所示,mSmoothedlnstantEnergy禾口舊值 oldSmoothedInstantEnergy之間的差(206)的絕對值(208)被示出 為具有值"A"。把值"B"定義為oldSmoothedInstantEnergy與參數 kEnvelopeRatio的乘積(214)。在一個實施例中,kEnvelopeRatio的 值為大約0.0284。在決策塊210中對值A和B進行比較。如果A小於B,則 計數器mWhiteNoiseFrameCount (被初始化為零)遞增l (216)。否則, 計數器mWhiteNoiseFrameCount被重置為零(218)。如圖5進 一 步所示,在決策塊220中把計數器 mWhiteNoiseFrameCount 的當前值與選定計數值 kNumWhiteNoiseFrames進行比較。在 一 個實施例中, kNumWhiteNoiseFrames具有值38。如果mWhiteNoiseFrameCount大於或 等於kNumWhiteNoiseFrames,則認為存在白噪聲,且標誌W一Flag被設 置為示例值"l" (222)。計數器mWhiteNoiseFrameCount還被設置為值 kNumWhiteNoiseFrames 。 如果 mWhiteNoiseFrameCoimt 小於 kNumWhiteNoiseFrames,則認定不存在白噪聲,且標誌W—Flag被設置 為"0 " ( 224 )。現在,針對下 一 幀的分析,當前值mSmoothedlnstantEnergy變為舊值oldSmoothedlnstantEnergy(226)。 圖6示出了上文參考圖3 (154)所描述的噪聲活動性檢測器230的 一個實施例。具有示例性的64個區的功率譜PowX (k) (232)被示出為 把該64個區分為4個示例頻帶(1=1至4) (234)。對於每一個頻帶(第i 個頻帶),通過平方根運算塊236來處理帶內區的功率和,以產生第i 頻帶的值Magj。在一個實施例中,把值Mag一I提供給平滑器塊238,而 平滑器塊238還接收參數kAlphaNad(240)。在一個實施例中,kAlphaNad 的值大約為O. 55。平滑器238基於Mag—i和kAlphaNad來計算平滑後的幅 度值sMag—i:sMag—i二kAlphaNad氺sMag—i+ (1_ kAlphaNad) ,ag—i注意,針對4個示例頻帶,1=1至4。在一個實施例中,sMag—i的值 被初始化為大約0.925。在一個實施例中,針對選定時段(例如30幀)保持和更新sMag—i 的最小值。因此,來自平滑器238的sMag一i的當前值可以和現有的最小 值進行比較,以査看是否應當更新最小值MinMag一i (242)。 sMag—i的 當前值和閾值(246)(例如選定參數乘以MinMag一i)進行比較(244)。 如果sMag—i大於閾值,則認為存在噪聲活動性,且針對這裡描述的決 策匯合把標誌N—Flag設置為"1"。否則,把N—Flag設置為"0"。圖7示出了參考圖3 (158)描述的網絡信號聲音檢測器250的一個 實施例。如這裡所述,網絡信號聲音檢測器250或其變體可以提供簡單 且有效的網絡信號聲音檢測算法。網絡信號聲音檢測器250所提供的一 個或更多個功能還可以與基於頻譜相減的噪聲減小技術相結合,以實 現有效的噪聲減小,同時保持例如電話系統的系統中的網絡信號聲音 信息。此外,網絡信號聲音檢測算法可以被一般化為和回聲消除方案 相集成,以提供更好的回聲消除且不會丟失任何有用的信息。在一個實施例中,為了描述圖7而定義如下參數。參數 mlnPsdMaxIndex是當前幀的頻率區編號,其中該區具有示例性的64個 頻率區中的最大能量。參數oldlnPsdMaxIndex表示對於先前幀具有最 大能量的頻率區。參數mMaxPsdRatio是O. O和l. O之間的可調正因數。 參數kNLow和kNHigh定義了網絡信號聲音所處的頻率範圍;kNLow定義
了最小頻率,而kNHigh定義了最大頻率。參數mToneFrameCount是表示滿足網絡信號聲音要求的連續幀的個數的計數器。參數 kNumToneFrames是閾值。T—Flag是所檢測的標誌,其中值為l意味著當前幀被認為具有網絡信號聲音;否則,當前值被認為沒有網絡信號聲音在一個實施例中,如圖7所示,能夠以如下方式來檢測網絡信號聲 音。在過程塊252中,可以確定具有PowX (k)(在示例配置中,k二l至 64)的最大值的區,並把相應的區編號k表示為mlnPsdMaxIndex。 mlnPsdMaxIndex和oldlnPsdMaxIndex之間的差(254)的絕對值(256) 被表示為"A"。因此,A二lmlnPsdMaxIndex-oldInPsdMaxIndexl 。 HiInPsdMaxIndex和mMaxPsdRatio的乘積(258)被表示為"B"。因此, B=mInPsdMaxIndex*mMaxPsdRatio。在決策塊260 ,檢査如下條件(A〈B ) 和 (kNLow〈二m工nPsdMaxIndex〈二kNHigh)。檢查條件(A〈B)以確定具有最大值的當前區與先前的區相比有多大的變化。檢查條件 (kNLow〈二mlnPsdMaxIndexOkNHigh)以確定最大值區是否處於已知的網絡信號聲音頻率範圍內。如果同時滿足這兩個條件,則認為當前幀具有網絡信號聲音,且 幀計數器mToneFrameCount遞增l (264)。否則,認為當前幀沒有網絡 信號聲音,並把幀計數器mToneFrameCount復位至零(262)。決策塊266確定把T—Flag設置為"1"(信號中存在網絡信號聲音) 還是"0 "(信號中不存在網絡信號聲音)。如果 mToneFrameCount〉二kNumToneFrames,則把T—Flag設置為"1" (268), 否則設置為"0" (270)。對於這兩種情況,為了對下一幀進行分析, 把mlnPsdMaxIndex的當前值設置為舊值oldlnPsdMaxIndex (272)。在一個實施例中,可以使用如下值mMaxPsdRatio=0. 21 ; kNumToneFrames=19; kNLow二2且kNHigh二15 (針對示例的128-FFT)。圖8示出了上文參考圖3所提到的基於檢測的增益確定的示例的一 個實施例(280)。 mSpectralGain (k)是第k個區的增益,其可以應用 於具有在圖3中的塊164中所估計的噪聲功率譜的相同區。基於決策塊
282的結果來調整所示的mSpectralGain (k),其中對如下條件進行測 試((T_Flag=0)和(N_Flag=l))或(當前幀是前M個幀?)。在一 個實施例中,M=9。如果決策塊282的結果是"是",則通過因數mNoiseActivityGain (在一個示例中,0. 2<mNoiseActivityGain<=l. 0)對mSpectralGain (k)進行縮放(284)。在一個實施例中,mNoiseActivityGain的值大 約是O. 50。然後,在決策塊286對另一組條件進行測試。如果決策塊282 的結果是"否",則直接調用決策塊286。該決策塊測試如下條件(T一Flag二0)和(W_Flag=l)。如果結果 是"是",則向mSpectralGain (k)分配值mWhiteNoiseSpectralGain, 其可被估計為mMinSpectralGair^mGainW (288)。在一個實施例中, mMinSpectralGain的值大約是O. 25,而mGainW的值大約是O. 891。如果 結果是"否",則以如下方式使mSpectralGain(k)經過限幅器(clipper) 290。如果mSpectralGain(k)小於mMinSpectralGain,卯JmSpectralGain (k) 二mMinSpectralGain;如果mSpectralGain (k)大於l.O,則對於 所有k的值(在這個示例中為1至64), mSpectralGain (k) 二l. 0。圖9示出了在一個實施例中,可以類似於上述系統100而對系統300 進行配置。所示的系統300具有網絡信號聲音檢測器302,其能夠提供 用於決策制定的乙Flag,其中基於功率譜PowX (k)來確定該標誌。如 同示例系統100,該決策制定可以包括基於是否存在網絡信號聲音而對 選定頻譜增益進行調整。在一個實施例中,可以使用類似於圖8的決策 制定過程-其中基於T—Flag而不基於其他檢測器標誌來做出決策-以確 定頻譜增益調整的不同值。基於上文可以看出,待應用於每一個頻率區中的頻譜增益不僅可 取決於噪聲功率估計,而且還取決於一個或更多個檢測及其相應的決 策。儘管上文討論白噪聲、噪聲活動性和網絡信號聲音作為示例,然 而也可以處理其他類型的噪聲-例如殘留噪聲、強噪聲、中度噪聲和弱 噪聲。利用這些決策的信息匯合,總決策錯誤得以減小或最小化,而 且可以獲得針對特定系統的增強或優化的濾波增益。通過實現本發明的特徵的各種組合,可以獲得非常良好的語音質
量,對於靜態噪聲可獲得12-20dB的有效噪聲抑制(抑制量可調整), 這是因為頻譜濾波中使用的增益不僅來自噪聲估計,而且可以通過噪 聲功率估計與其他的一個或更多個檢測及其相應決策的整合而決定。此外,以下是本發明的非限制性新穎特徵(1)本發明的各種特徵大體上與輸入電平無關,因而可以使用來自檢測和決策的信息對有關功率估計進行歸一化;(2)本發明的各種特徵大體上可避免與AGC (自動增益控制,其中在應用噪聲減小處理之前改變輸入信號的信噪 比)相關的失真;(3)由於本發明的技術基於功率譜而不是很多其他 可用NR系統(包括計算密集的AGC)中使用的幅度譜,所以計算複雜度 低;(4)因為提供了有效的網絡信號聲音檢測和有關的功能,所以可 以保留電話應用的接收路徑中的網絡信號聲音;(5)因為可以根據各 種決策結果來適應性地改變各種相關參數,所以可以實現快速和可調 整的收斂時間、靈活的控制性、再收斂以及初始收斂。在一個實施例中,這裡描述的一個或更多個特徵還可以在多信道 通信系統中實現。在多信道的情況下,不僅對一個信道、而且還對多 個信道的多檢測進行信息匯合。關於網絡信號聲音檢測器,應注意如下事項。如果出現網絡信號 聲音,則噪聲減小方案可以把輸入看作有用的信號,並切換為使用不 同的頻譜增益以保持網絡信號聲音不會減小。對此,噪聲減小方案不 僅能夠增大SNR,而且還能夠保持網絡信號聲音信息在其他可用的噪聲 減小算法中可用。此外,由於網絡信號聲音檢測器基於在基於頻譜相減的噪聲減小 算法中可用的頻譜,所以不需要額外的計算以獲得功率(或幅度)譜。 結果,網絡信號聲音檢測器可以是簡單的,而且可以在很多應用中容 易地實現。此外,網絡信號聲音檢測器可以簡單地被添加到現有的信 號信道噪聲減小方案中。此外,網絡信號聲音檢測器和有關的算法可 被整合到可在某些電話系統中找到的基於頻域的回聲消除方案中。此 外,該技術還可以用於信令檢測器,等等。通常可以理解的是,該處理器例如可以包括計算機、程序邏輯或 其他表示數據和指令的基礎配置,其以這裡描述的方式操作。在其他
實施例中,該處理器可以包括控制器電路、處理器電路、處理器、通 用單片或多片微處理器、數位訊號處理器、嵌入式微處理器、微控制器等。此外可以理解的是,在一個實施例中,程序邏輯可以有利地作為 一個或更多個組件而實現。所述組件可以有利地被配置為在一個或更 多個處理器上執行。所述組件包括但不限於硬體或軟體組件、例如 軟體模塊的模塊、面向對象的軟體組件、類組件和任務組件、處理方 法、函數、屬性、過程、子例程、程序代碼段、驅動器、固件、微代 碼、電路、數據、資料庫、數據結構、表、數組和變量。儘管上述實施例示出、描述並指出了應用於上述實施例的本發明 的基本的新穎特徵,應當理解的是,在不背離本發明的範圍的前提下, 本領域的技術人員可以對所示設備、系統和/或方法的細節的形式做出 各種省略、替換和改變。因此,本發明的範圍不應被限制為上文描述, 而應當由所附權利要求來限定。本申請要求2005年4月21日遞交的、標題為"SYSTEMS AND METHODS FOR REDUCING AUDIO NOISE"的美國臨時申請No. 60/673, 671的優先權, 將其全體內容通過引用結合於此。
權利要求
1.一種用於減小音頻噪聲的系統,包括輸入組件,被配置為接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜;至少一個檢測組件,每一個被配置為檢測所述功率譜中選定聲音分量的存在;調整組件,被配置為基於所述至少一個選定聲音分量的所述存在檢測,產生調整功率譜;把所述調整功率譜與所述輸入頻域信號進行組合,以產生輸出頻域信號;輸出組件,被配置為基於所述輸出頻域信號而產生輸出時域信號。
2. 根據權利要求1所述的系統,其中,所述輸入時域信號包括語 音通信信號。
3. 根據權利要求l所述的系統,其中,所述至少一個檢測組件包 括噪聲活動性檢測器、白噪聲檢測器和網絡信號聲音檢測器中的至少 一種。
4. 根據權利要求3所述的系統,其中,所述功率譜包括N個頻率 區,並與所述輸入時域信號的N個採樣值相對應。
5. 根據權利要求4所述的系統,其中,所述噪聲活動性檢測器被 配置為把所述N個頻率區的一個或更多個組的幅度與相應的選定值進 行比較,並產生噪聲活動性指示符,該噪聲活動性指示符指示所述功 率譜中是否存在噪聲活動性。
6. 根據權利要求5所述的系統,其中,所述噪聲活動性檢測器被 配置為把所述N個頻率區分為多個頻帶; 獲得所述多個頻帶中每一個頻帶的幅度值; 針對所述多個頻帶中每一個頻帶,把所述幅度值與閾值進行比較;以及如果所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾 值,則確定存在所述噪聲活動性。
7. 根據權利要求4所述的系統,其中,所述白噪聲檢測器被配置為基於所述N個頻率區之和,獲得當前能量值;獲得所述當前能量值與先前能量值之間的差,所述差具有正值;以及如果所述差大於選定值.,則產生白噪聲指示符,該白噪聲指示符 指示所述功率譜中存在白噪聲。
8. 根據權利要求4所述的系統,其中,所述網絡信號聲音檢測器 被配置為從所述N個頻率區中識別具有最大值的選定區;以及如果所述選定區滿足一個或更多個條件,則產生網絡信號聲音指 示符,該網絡信號聲音指示符指示所述功率譜中存在網絡信號聲音。
9. 根據權利要求8所述的系統,其中,如果所述選定區的變化量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率範 圍內,則產生所述網絡信號聲音指示符。
10. 根據權利要求4所述的系統,其中,所述調整功率譜包括所 估計的功率譜,基於一個或更多個所述選定聲音分量的所述檢測而調 整所述所估計的功率譜。
11. 根據權利要求10所述的系統,其中,所述所估計的功率譜的 調整包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音且所述噪聲活動性檢測器檢測到噪聲活動性,則利用選定量對所述所估 計的功率譜進行縮放。
12. 根據權利要求ll所述的系統,其中,所述所估計的功率譜的調整還包括如果所述網絡信號聲音檢測器沒有檢測到網絡信號聲音 且所述白噪聲檢測器檢測到白噪聲,則對所述白噪聲進行調整。
13. 根據權利要求l所述的系統,還包括再收斂組件,所述再收斂組件被配置為允許基於所述輸入時域信號,繞過所述至少一個檢 測組件和所述調整組件。
14. 根據權利要求13所述的系統,其中,如果代表所述輸入時域信號的選定值在選定時段中持續小於閾值,則執行所述繞過。
15. 根據權利要求14所述的系統,其中,所述閾值大致為零。
16. —種用於減小音頻噪聲的方法,包括接收輸入時域信號並產生輸入頻域信號和所述輸入頻域信號的功率譜;檢測所述功率譜中一個或更多個聲音分量的存在; 基於所述一個或更多個聲音分量的所述存在檢測,產生調整功率譜;把所述調整功率譜與所述輸入頻域信號進行組合,以產生輸出頻 域信號;以及基於所述輸出頻域信號而產生輸出時域信號。
17. 根據權利要求16所述的方法,其中,所述輸入時域信號包括語音通信信號。
18. 根據權利要求16所述的方法,其中,所述一個或更多個聲音 分量包括噪聲活動性、白噪聲和網絡信號聲音中至少一種。
19. 根據權利要求18所述的方法,其中,所述功率譜包括N個頻 率區,並與所述輸入時域信號的N個採樣值相對應。
20. 根據權利要求19所述的方法,其中,通過如下方式來檢測所 述噪聲活動性:把所述N個頻率區的一個或更多個組的幅度與相應的選 定值進行比較,並產生噪聲活動性指示符,該噪聲活動性指示符指示 所述功率譜中是否存在所述噪聲活動性。
21. 根據權利要求20所述的方法,其中,通過如下方式來檢測所述噪聲活動性把所述N個頻率區分為多個頻帶;獲得所述多個頻帶中每一個頻帶的幅度值;針對所述多個頻帶中每一個頻帶,把所述幅度值與閾值進行比 較;以及 如果所述多個頻帶中選定數量的頻帶的所述幅度值超過所述閾 值,則確定存在所述噪聲活動性。
22. 根據權利要求19所述的方法,其中,通過如下方式來檢測所述白噪聲基於所述N個頻率區之和,獲得當前能量值; 獲得所述當前能量值與先前能量值之間的差,所述差具有正值;以及如果所述差大於選定值,則產生白噪聲指示符,該白噪聲指示符 指示所述功率譜中存在白噪聲。
23. 根據權利要求19所述的方法,其中,通過如下方式來檢測所述網絡信號聲音從所述N個頻率區中識別具有最大值的選定區;以及 如果所述選定區滿足一個或更多個條件,則產生網絡信號聲音指示符,該指示符指示所述功率譜中存在網絡信號聲音。
24. 根據權利要求23所述的方法,其中,如果所述選定區的變化 量不大於選定量且所述選定區處於與所述網絡信號聲音相對應的頻率 範圍內,則產生所述網絡信號聲音指示符。
25. 根據權利要求19所述的方法,其中,所述調整功率譜包括所 估計的功率譜,基於一個或更多個所述聲音分量的所述檢測而調整所 述所估計的功率譜。
26. 根據權利要求25所述的方法,其中,所述所估計的功率譜的調整包括如果沒有檢測到網絡信號聲音且檢測到噪聲活動性,則利 用選定量對所述所估計的功率譜進行縮放。
27. 根據權利要求26所述的方法,其中,所述所估計的功率譜的 調整還包括如果沒有檢測到網絡信號聲音且檢測到白噪聲,則對所 述白噪聲進行調整。
28. 根據權利要求16所述的方法,還包括基於所述輸入時域信號 繞過所述檢測。
29. 根據權利要求28所述的方法,其中,如果代表所述輸入時域 信號的選定值在選定時段中持續小於閾值,則執行所述繞過。
30. 根據權利要求29所述的方法,其中,所述閾值大致為零。
31. —種用於減小音頻噪聲的系統,包括輸入組件,被配置為接收輸入信號並產生與所述輸入信號相對應 的功率譜,所述輸入信號具有信噪比;以及檢測器,被配置為檢測所述功率譜中一個或更多個聲音分量的存在;其中,當所述輸入信號的所述信噪比維持在大致相同的水平上 時,執行所述檢測。
32. —種用於減小音頻噪聲的系統,包括 用於產生與輸入信號相對應的功率譜的裝置; 用於檢測所述功率譜中的一個或更多個聲音分量的裝置;以及 用於基於所述一個或更多個聲音分量的檢測而調整所述輸入信號的裝置。
全文摘要
公開了用於減小音頻噪聲的系統和方法的各種實施例。可以基於從時域信號(142)中獲得的功率譜(152)來檢測例如噪聲(154、156)和網絡信號聲音(158)的一個或更多個聲音分量。該檢測的結果可以用於做出決策(162),確定能夠應用於功率譜的調整譜(164、166)。可以把調整功率譜變換回大致去除了不希望的噪聲和/或考慮到例如網絡信號聲音的已知聲音分量的時域信號(172)。
文檔編號G10L21/02GK101164105SQ200680013388
公開日2008年4月16日 申請日期2006年4月21日 優先權日2005年4月21日
發明者鈞 楊, 裡克·奧利弗 申請人:Srs實驗室有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀