基於信噪比軟掩蔽語音增強方法
2023-10-10 21:26:34 3
基於信噪比軟掩蔽語音增強方法
【專利摘要】本發明公開了一種基於信噪比軟掩蔽語音增強方法,該方法包括:構建分頻帶時變係數的噪聲功率譜更新,對不同頻率點採用不同的門限更新平滑譜,突出語音,抑制噪聲;由噪聲功率譜確定後驗信噪比,由後驗信噪比與前一幀的先驗信噪比迭代計算當前幀的先驗信噪比,依先驗信噪比的大小獲得每個頻率點是掩蔽域還是目標信號域;掩蔽值大小由假設檢驗獲得的概率分布計算。利用相鄰幀間的相關性提取信息,實現增強語音譜平滑迭代估計方法;對非平穩噪聲和強背景噪聲下,給出一套基於信噪比軟掩蔽語音增強算法;快速跟蹤噪聲算法對非平穩噪聲進行逐幀平滑更新,較好的估計噪聲譜;本發明提出的算法能更有效地抑制背景噪聲,提高去噪後的語音質量與可懂度。
【專利說明】基於信噪比軟掩蔽語音增強方法
【技術領域】
[0001]本發明屬於語音信號處理【技術領域】,特別是指一種基於信噪比軟掩蔽語音增強方法。
【背景技術】
[0002]語音是人類溝通的基本手段;人類的各種社會活動和行為給語音信號研究帶來了許多新的問題,同時,語音處理技術的發展時時刻刻改變著人類日常生活方式;例如,語音編碼技術的出現使得人們可以在有限的通信帶寬資源中聆聽遠處的聲音,近來,寬帶語音編碼的發展令我們通信中的話音更加自然,更具有可理解性,減輕或降低了溝通中產生的誤解;大詞彙量連續語音識別難題的突破導致了人們有著新的語音輸入方式和人機互動模式,人們可以解放雙手直接口述,使指示機器工作或者理解我們的話語,大大提高工作效率。
[0003]在日常生活中使用的語音處理技術如語音編碼和語音識別等技術都不可避免要面對各種背景噪聲的幹擾;噪聲的存在大大降低了這些技術使用的性能或直接導致使用者不可忍受而放棄使用;環境噪聲如現場存在的背景談話聲、汽車駕駛倉的機器振動噪音、高速行駛中的汽車引擎聲,室內牆壁的反響噪聲等,都會對原始語音信號造成汙染;背景噪聲的存在及其特性對考慮人類語音特性的參數語音處理技術影響尤其嚴重,破壞了預先假定的參數模型和聽覺特性;現有的語音識別系統在無噪聲環境下都可以很好地使用,一旦在嘈雜的環境場所中使用,其識別性能急劇下降。顯然,在噪聲的幹擾下,識別系統中使用的語音特徵之間的區分性被減弱,導致系統識別錯誤增加。
[0004]隨著移動通信的普及變成現實,移動通信技術帶給人們無約束和便利的語音溝通的同時,更是把語音通信帶到了一個充滿複雜噪聲的應用環境;而在吵雜的環境中手提電話的語音編碼不可避免會增大編碼誤差。
[0005]如何消除加性噪聲帶來的不便,語音增強的出現可以降低或解決噪聲的不利影響;語音增強(speech enhancement)通常用作前端處理模塊出現在各種實際應用的語音處理系統中;它通過對含噪語音進行濾波,近似還原純淨語音信號,使得語音處理不直接面對含噪語音信號,增強了語音系統的魯棒性,而高魯棒性的語音增強技術可有效地擴大語音處理系統的應用場所。
[0006]
【發明內容】
[0007](一)要解決的技術問題
有鑑於此,本發明的主要目的在於提出一種基於信噪比軟掩蔽語音增強方法,對收聽人而言主要是改善語音質量,提高語音可懂度,減少疲勞感;對語音處理系統(識別器、聲碼器、手機)而言是提高系統的識別率和抗幹擾能力。擬解決的關鍵科學問題:實現含噪聲語音增強,提高信噪比,減少增強後的語音信息失真與損傷,儘量實用於多種噪聲環境。具體有噪聲功率譜更新、先驗信噪比計算、掩蔽域還與目標信號域確定、掩蔽值大小計算等。
[0008](二)技術方案
為達到上述目的,本發明提供了一種基於信噪比軟掩蔽語音增強方法,該方法包括:
1)頻帶時變係數的噪聲功率譜更新,含噪語音第I幀功率譜|Y(l,k)|2,k為頻率序號,
第I幀預估噪聲功率譜m,k) ,P(l, k)為語音平滑功率譜,η平滑係數,
PQM = TjPQ-U)+ (1-V) I Y(hk) I2 』含噪語音功率譜最小值,
【權利要求】
1.一種基於信噪比軟掩蔽語音增強方法,其特徵在於該方法包括: 針對非平穩噪聲和強背景噪聲下聲音信號難以提取的實際問題,該算法設計了分頻帶時變係數的噪聲功率譜更新,給出了依先驗信噪比的大小獲得每個頻率點是掩蔽域還是目標信號域;掩蔽值大小由假設檢驗獲得的概率分布計算及具體實施方案。
2.根據權利要求1所述的基於信噪比軟掩蔽語音增強方法,其特徵在於,所述頻帶時變係數的噪聲功率譜更新,含噪語音第I幀功率譜I Y(l,k) I2,k為頻率序號,第I幀預估噪聲功率譜乃(/,幻,P(l,k)為語音平滑功率譜,^平滑係數,i^A:) = ,(/-U) + (li)|r(U)P , PsJm為含噪語音功率譜最小值,如果
3.根據權利要求1所述的基於信噪比軟掩蔽語音增強方法,其特徵在於,所述依先驗信噪比的大小獲得每個頻率點是掩蔽域還是目標信號域;時域'y¥) = _七_, y(n)表示含噪語音信號,X(η)和d(n)分別表示乾淨的語音和噪聲信號;Y(n)的短時傅立葉變換: Υ(ω,)= X(Wk)+D(mk),其極坐標表示:=+DkAm, HDk)和咚⑷為㈦為?}分別表示第k個頻率點對應的幅度與相位;
4.根據權利要求1所述的基於信噪比軟掩蔽語音增強方法,其特徵在於,所述掩蔽值大小由假設檢驗獲得的概率分布計算: Xk == -1 St-1,其中
▲ ,ΛΑ3 (*) = σ/ (i) Vfc =管
~,Yk =: Ιτττ3(λ) ^(k) ξ S{Dk} 0
% (k) ad (t)
【文檔編號】G10L21/0232GK103594093SQ201210290074
【公開日】2014年2月19日 申請日期:2012年8月15日 優先權日:2012年8月15日
【發明者】王景芳 申請人:王景芳