數字助聽器中語音增強和頻響補償相融合方法
2023-05-02 15:13:41 1
數字助聽器中語音增強和頻響補償相融合方法
【專利摘要】本發明提出了數字助聽器中語音增強和頻響補償相融合方法。該方法首先,採用MCRA法獲得估計噪聲和初步增強語音;將估計噪聲和初步增強語音分別通過gammatone濾波器組進行濾波處理,利用耳蝸對信號的感知機理,把信號分為M個頻帶,同時得到信號的時頻表示形式;然後,利用人耳的聽覺掩蔽特性和頻帶信噪比等因素計算各個頻帶的掩蔽閾值;其次,利用耳障者的聽力曲線動態地計算含噪語音在時頻域的掩蔽值,使語音增強和頻響補償同時處理;最後,利用掩蔽值合成助聽器輸出語音。該算法充分利用了人耳的工作機理,保留了語音特徵,去除了譜減法引入的「音樂噪聲」,使助聽器輸出信號的可懂度得到很大的提高,低複雜度,低功耗。
【專利說明】數字助聽器中語音增強和頻響補償相融合方法
【技術領域】
[0001]本發明屬於語音信號處理【技術領域】,涉及到數字助聽器中語音增強和頻響補償兩個關鍵的語音信號處理技術。
【背景技術】
[0002]耳障已經成為世界性問題,但在目前的醫療條件下,對於大多數耳障者,選配合適的數字助聽器是有效提高其聽力水平的最好的方法。隨著近幾十年來科學技術的迅速發展,數字助聽器的性能得到了不斷的完善,數字助聽器的基本工作原理,如圖2所示,外界的聲音信號,進入麥克風從聲能轉化成電能,通過模/數轉化器轉化為數位訊號,然後在數字微處理器和數字濾波器中運用預先設置好的運算法則對這一數位訊號進行計算,一個計算法則是一系列確認和計算的過程,數位化助聽器需要有儘可能多的字符,利用不同的運算關係的數據符來進行計算與判斷,以獲得對某種聽力損失性質的再現。計算法則同樣被用於標定數位化助聽器中的處理器,以滿足在特定條件中應進行的切換或調整。助聽器獨立執行的分析通過應用計算法則來實施和鑑定。處理後的數字電信號需要經過數/模轉換器轉換成模擬電信號,最後由受話器再將其轉化為聲能輸入至佩戴者耳中。
[0003]在整個數字助聽器工作過程中,DSP中的算法是數字助聽器的核心內容,而算法也是根據耳障者的病症提出的。比如,耳障者的病症主要病症為:聽域上升,言語識別率降低。對於以上症狀,提出頻響補償算法來解決耳障者聽域上升的問題,但是,在噪聲環境下,僅採用頻響補償算法還是不能提高數字助聽器佩戴者的言語可懂度,因此,在頻響補償算法之前還需要採用語音增強算法消除背景噪聲,從而實現更好的提高數字助聽器佩戴者的言語可懂度。另外,為了保持數字助聽器的穩定性,還需反饋消除算法,防止數字助聽器「嘯叫」。除此之外,在高性能的助聽器還有一些聲源定位等算法。在以上分析的算法中,頻響補償和語音增強是數字助聽器中十分重要和關鍵的兩項技術,這兩種技術直接決定著數字助聽器性能的優劣。
[0004]在噪聲環境下,一些語音增強算法對言語可懂度的提高程度仍十分有限。因此,環境噪聲是數字助聽器設計中的最大障礙。目前大多數數字助聽器中採用的語音增強方法是譜減法,該方法在去除噪聲的同時會產生「音樂噪聲」,導致在數字助聽器的頻響補償階段,語音幅度放大的同時噪聲也放大,不利於助聽器提高耳障者對言語的可懂度,嚴重影響助聽器的效果。對於頻響補償技術,幾乎所有的數字助聽器都採用了多通道頻響補償的方案。多通道頻響補償方法利用濾波器組將信號整個頻段分為N通道,然後在各個通道內,根據患者聽力損傷的情況對不同頻段加以不同的放大處理,最後再將不同頻率的聲音段合成在一起,形成完整的聲音。由於多通道不同的壓縮比率使聽力補償更吻合患者聽力損失情況。但是,由於子帶劃分會在頻帶交界處帶來的信號失真,同時使語音的共振峰發生形變,破壞了語音的結構,不利於可懂度的提高。共振峰是區別不同元音最主要的特徵,對提高耳聾患者的語言識別率具有重要意義。
[0005]由於數字助聽器是一種可攜式設備,同時它也需要很高的實時性,因此,數字助聽器對算法有一定的特殊要求,比如,算法低複雜度,低功耗和實時性等要求。最終讓數字助聽器佩戴者有最高的言語可懂度和聽覺舒適度。其中語音增強和頻響補償兩個技術是影響數字助聽器佩戴者舒適度和可懂度十分關鍵的技術。對於大多數數字助聽器中的語音增強和頻響補償兩種技術是相互獨立的,這無形中增加了數字助聽器算法的複雜度。
[0006]本發明提出一種語音增強和頻響補償相融合的數字助聽器算法,該算法結合譜減法和時頻掩蔽的優點,首先,分析非平穩噪聲的時頻特性,研究在不同噪聲環境下的噪聲估計準確度,並優化時頻掩蔽閾值,減少語音信號的失真;然後,依據耳障者的病變機理,結合VAD和耳障者的聽力曲線動態地調整不同通道的掩蔽值,使語音增強和頻響補償同時處理,減少算法複雜度;最後,利用掩蔽值合成語音信號。
【發明內容】
[0007]本發明針對現有的數字助聽器語音增強算法在非平穩噪聲環境下,殘留大量背景噪聲還引入了 「音樂噪聲」,同時大多數多通道頻響補償算法使語音結構發生失真,致使數字助聽器佩戴者對言語可懂度和舒適度不理想等問題,提出了一種語音增強和頻響補償兩種技術相融合的方法,該算法充分利用了人耳的工作機理,保留了語音特徵,去除了譜減法引入的「音樂噪聲」,使助聽器輸出信號的可懂度得到很大的提高;由於此算法是在譜減法的基礎上進行了,因此,算法實現簡單,低複雜度,低功耗。
[0008]為了解決以上所述的問題,本發明採用的技術方案是:基於可以模擬人耳聽覺系統中的基底膜和聽覺神經的工作機理的gammatone濾波器和meddis的內毛細胞模型,把信號頻帶非均勻地分為N個通道的頻響補償算法,以及利用人耳聽覺感知理論,結合人耳的聽覺特性和耳蝸的工作機理,最終實現語音增強和頻響補償相融合。具體過程包括步驟如下:
[0009]步驟一,數字助聽器的輸入信號進行預處理,首先對輸入信號進行分幀處理,然後計算每幀信號的頻譜;
[0010]步驟二,提取含噪語音信號的相位信息,利用人耳對相位信息的改變並不敏感,因此,利用含噪語音信號的相位信息代替最終合成的語音信號的相位;
[0011]步驟三,在每幀信號的頻域範圍內,估計含噪信號的噪聲幅度譜;
[0012]步驟四,利用譜減法的基本思想,讓含噪語音信號的幅度譜減去估計噪聲的幅度譜,得到初步增強的語音幅度譜;
[0013]步驟五,傅立葉逆變換,初步增強的語音幅度譜和估計噪聲幅度譜分別乘以含噪語音的相位,然後通過傅立葉逆變換分別得到初步增強的語音信號和估計噪聲信號;
[0014]步驟六,時頻分析,利用人耳聽覺感知理論,結合人耳的聽覺特性和耳蝸的工作機理,把初步增強的語音信號和估計噪聲信號的頻譜範圍非均勻地分為M個頻帶;
[0015]步驟七,計算頻帶信噪比,計算初步增強語音信號通過時頻分析得到的M個頻帶的信噪比;
[0016]步驟八,計算掩蔽域值,利用由步驟七得到每個頻帶的信噪比和人耳對不同頻帶的感知特性,計算不同頻帶的掩蔽域值;
[0017]步驟九,測試耳障者的聽域曲線和痛域曲線,利用不同頻率特徵點測試耳障者的聽域聲壓級和痛域聲壓級,然後利用插值的方法得到整個頻率範圍的聽力曲線;[0018]步驟十,計算掩蔽值,利用步驟八和步驟九得到的掩蔽閾值和聽力曲線,動態地調整掩蔽值的大小;
[0019]步驟十一,時頻掩蔽,利用步驟十得到的掩蔽值得到最終的輸出信號。
[0020]本發明提出了數字助聽器中語音增強和頻響補償相融合方法。該方法利用人耳聽覺感知理論,結合人耳的聽覺特性和耳蝸的工作機理。首先,採用最小值控制遞歸平均(Minima-Controlled Recursive Averaging, MCRA)算法獲得估計噪聲和初步增強語音;接著,將估計噪聲和初步增強語音分別通過可以模擬人工耳蝸模型的ga_atone濾波器組進行濾波處理,利用耳蝸對信號的感知機理,把信號分為M個頻帶,同時得到信號的時頻表示形式;然後,利用人耳的聽覺掩蔽特性和頻帶信噪比等因素計算各個頻帶的掩蔽閾值;其次,利用耳障者的聽力曲線和VAD(Voice Activity Detection)動態地計算含噪語音在時頻域的掩蔽值,使語音增強和頻響補償同時處理;最後,利用掩蔽值合成助聽器輸出語音。該算法充分利用了人耳的工作機理,保留了語音特徵,去除了譜減法引入的「音樂噪聲」,使助聽器輸出信號的可懂度得到很大的提高;由於此算法是在譜減法的基礎上進行了,因此,算法實現簡單,低複雜度,低功耗。
【專利附圖】
【附圖說明】
[0021]圖1本發明的實現流程圖
[0022]圖2gammatone濾波器組中每個濾波器的頻率相應
[0023]圖3gammatone濾波器組中每個濾波器合成後的頻率相應
【具體實施方式】
[0024]步驟一,數字助聽器輸入的含噪信號進行預處理,首先對輸入的含噪信號進行分幀處理,然後計算每幀信號的頻譜;
[0025](I)數字助聽器輸入的含噪信號y(t),t表示時間,在模數轉換過程中,採用16kHz的米樣率,輸出表不為時域數位訊號y (η), η表不的序列號;
[0026](2)含噪信號y(n)通過哈明窗進行分幀,取320點即20ms為一幀,幀移為160點即10ms,可採用式(I)進行分幀,得到每幀信號yU,n);
[0027]
【權利要求】
1.數字助聽器中語音增強和頻響補償相融合方法,其特徵在於包括步驟如下: 步驟一,數字助聽器的輸入信號進行預處理,首先對輸入信號進行分幀處理,然後計算每幀信號的頻譜; 步驟二,提取含噪語音信號的相位信息,利用人耳對相位信息的改變並不敏感,因此,利用含噪語音信號的相位信息代替最終合成的語音信號的相位; 步驟三,在每幀信號的頻域範圍內,估計含噪信號的噪聲幅度譜; 步驟四,利用譜減法的基本思想,讓含噪語音信號的幅度譜減去估計噪聲的幅度譜,得到初步增強的語音幅度譜; 步驟五,傅立葉逆變換,初步增強的語音幅度譜和估計噪聲幅度譜分別乘以含噪語音的相位,然後通過傅立葉逆變換分別得到初步增強的語音信號和估計噪聲信號; 步驟六,時頻分析,利用人耳聽覺感知理論,結合人耳的聽覺特性和耳蝸的工作機理,把初步增強的語音信號和估計噪聲信號的頻譜範圍非均勻地分為M個頻帶; 步驟七,計算頻帶信噪比,計算初步增強語音信號通過時頻分析得到的M個頻帶的信噪比; 步驟八,計算掩蔽域值,利用由步驟七得到每個頻帶的信噪比和人耳對不同頻帶的感知特性,計算不同頻帶的掩蔽域值; 步驟九,測試耳障者的聽域曲線和痛域曲線,利用不同頻率特徵點測試耳障者的聽域聲壓級和痛域聲壓級,然後利用插值的方法得到整個頻率範圍的聽力曲線; 步驟十,計算掩蔽值,利用步驟八和步驟九得到的掩蔽閾值和聽力曲線,動態地調整掩蔽值的大小; 步驟十一,時頻掩蔽,利用步驟十得到的掩蔽值得到最終的輸出信號。
2.根據權利要求1所述的數字助聽器中語音增強和頻響補償相融合方法,其特徵在於包括步驟如下: 步驟一,數字助聽器輸入的含噪信號進行預處理,首先對輸入的含噪信號進行分幀處理,然後計算每幀信號的頻譜; (1)數字助聽器輸入的含噪信號y(t),t表示時間,在模數轉換過程中,採用16kHz的米樣率,輸出表不為時域數位訊號y (η), η表不時域的序列號; (2)含噪信號y(n)通過哈明窗進行分幀,取320點即20ms為一幀,幀移為160點即10ms,採用式(I)進行分幀,得到每幀信號 (λ,η);
【文檔編號】G10L21/02GK103778920SQ201410049180
【公開日】2014年5月7日 申請日期:2014年2月12日 優先權日:2014年2月12日
【發明者】李如瑋, 曹龍濤, 鮑長春, 吳水才 申請人:北京工業大學