數字助聽器語音頻率壓縮方法
2023-05-17 04:03:26
專利名稱:數字助聽器語音頻率壓縮方法
技術領域:
本發明屬於語音信號處理技術領域,涉及一種數字助聽器的語音處理方法,具體涉及用於治療高頻聽力嚴重損失的數字助聽器語音處理方法。
背景技術:
言語交流是人類社會的基本交流方式,也是個人基本生活能力之一。然而對於那些耳聾患者,由於聽力下降而導致的言語交流障礙嚴重影響了他們的生活質量。這不僅給其本人和家庭帶來了巨大的痛苦,同時也給整個社會增加了負擔。根據中國殘疾人聯合會2002年2月7日公布的一項統計表明,我國有聽力言語障礙的殘疾人2057萬,佔全國6000萬殘疾人總數的34.3%。另外,由於遺傳、藥物、感染、噪聲、意外事故等原因,每年還會新增聾兒3萬名。如此眾多的聽障人群以及他們的生活痛苦,促使著相關領域的工作者去盡一份努力來幫助這些聾人重新回到有聲世界,像正常人一樣生活,以此來體現我們和諧社會的人文關愛。
在對感音神經性耳聾患者的治療方案中,佩戴助聽器是一種常用的治療手段。這種方法適用於聽力受損但仍具有殘餘聽力的耳聾患者。聽力受損人士相對於正常人的一個主要特徵是聽閾明顯上升,痛閾變化不大,因而整個聽力範圍變窄;另一個主要特徵是在不同頻率處聽力損失程度不同。當前在臨床上廣泛使用的數字助聽器所採用的頻響補償技術正是為了解決上述問題而提出的。頻響補償技術能夠根據病人在各個頻率上的聽力損失程度,分別對各個頻帶的語音信號進行動態範圍壓縮,將正常人可聽到的聲音信號放大到患者的聽力範圍之內,從而使患者能夠恢復正常聽力。
但有研究認為當高頻聽力損失大於60dB時,放大這些頻段的聲音不但不能改善言語的識別,反而會產生負面效果。為了解決這一問題一種新的頻移助聽器方法被提出,這種助聽器將語音的頻帶範圍壓縮到聽障患者的殘餘聽力頻帶範圍內,使得患者能夠利用殘餘的低頻聽力感受到高頻段的語音信息,以增強對語音的可懂度。
本發明正是基於這種新的助聽策略,提出了一種新的助聽器頻帶壓縮方法,以解決高頻聽力嚴重損失患者的聽力恢復問題。
發明內容
本發明中所提出的數字助聽器語音頻率壓縮方法通過對信號的短時頻譜係數進行處理,將寬帶語音信號壓縮為窄帶語音信號。
根據本發明的數字助聽器語音頻率壓縮方法,主要包括以下技術1)進行時頻域的轉換;本發明中採用加窗傅氏變換的方法。
2)通過信號對數譜的斜率來判斷語音信號的能量分布,並動態地調整語音頻譜。將信號的對數譜與一段斜率為1的線段作內積,內積結果即為對數譜的斜率。如果斜率小於某一預定門限,說明該幀信號的能量主要分布在低頻,通常為語音的濁音段,則採用低通濾波的方法;反之,對高頻能量較高的信號幀,通常為語音的清音段,採用頻譜包絡壓縮的方法。
3)通過去除高頻譜係數的方法,實現低通濾波。
4)通過頻譜包絡調整的方法,壓縮語音頻帶。首先利用線性預測分析求出短時信號的譜包絡,並將其從原頻譜中去除,得到白化譜。再將寬帶包絡壓縮為窄帶包絡,並對白化譜的低頻段譜線進行調製,同時將高頻譜去除。
上述技術方案的優點在於只通過調整信號頻譜包絡來壓縮信號帶寬,這種方法相當於對信號進行線性處理,避免了非線性頻移方法給語音信號帶來的聽覺失真,而動態的頻譜調整又能儘量地保證語音的低頻段信息不受破壞,因此利用該方案能夠產生高質量的清晰語音。
下面結合附圖對本發明進一步詳細地說明圖1是頻率壓縮方法的實現流程圖;圖2是壓縮前後的語音時頻圖對比,其中圖2a是原語音信號的時頻圖;圖2b是壓縮後的語音信號時頻圖。
具體實施例方式
下面參照本發明的附圖,更詳細地描述本發明的最佳實施例。
以下結合實例介紹本發明所提出的數字助聽器頻率壓縮方法,該方法的實現流程如圖1所示。所輸入的信號為16bit量化16000Hz採樣率的語音信號,信號帶寬8000Hz,輸出信號帶寬為2000Hz,採樣率及量化精度不變。具體實現步驟如下1.時頻變換利用加漢寧窗傅氏變換方法將一幀短時信號(512個樣點)轉換到頻域。並通過傅氏變換係數Xi,進一步得到信號的功率譜。
2.求頻譜斜率,並動態地調整語音頻譜對短時信號的功率譜取對數,得到對數譜Pi,然後與斜率為1長度為語音頻譜帶寬的線段Li作內積,以內積結果作為該幀信號的頻譜斜率λ。其中Li=i-128 0≤i≤256=i=1256LiPi]]>當λ小於預定門限th時,信號的能量主要集中在低頻段,需要對信號進行低通濾波;當λ大於th時,信號的能量在高頻段分布較多,需要對信號頻譜進行壓縮。
3.頻譜處理根據上一步的判斷結果,對信號進行低通濾波或頻譜壓縮處理。
低通濾波將信號的復頻譜中高頻段內的係數置為零,低頻段保持不變,用公式表達如下Yi=Xi0i64,448i511064i448]]>頻譜包絡壓縮(1)對當前短時幀信號進行線性預測分析,並通過線性預測係數得到信號的譜包絡Ei。
(2)將信號的傅氏變換係數除以相應的頻譜包絡值,即得到去包絡後的頻譜,或稱白化譜Wi。
Wi=Xi/Ei(3)將頻譜包絡按壓縮比例壓縮為窄帶包絡,簡單的實現方法是每隔4個頻譜抽取一個包絡值,即
Ei′=E4*i0≤i<64(4)將壓縮後的窄帶包絡乘以白化譜係數,並將高頻段譜係數置為零,得到壓縮後的語音頻譜YiYi=WiEi0i64,448i511064i448]]>4.時域恢復將處理後的頻譜係數Yi經反傅氏變換恢復到時域,加漢寧窗後與以前結果進行混疊相加。幀移1/4幀長後繼續第一步操作,處理下一幀信號。
附圖2是處理前後的語音信號時頻圖。從圖中可以看到,處理後的語音頻帶被限制在了2000Hz以內。對於濁音信號,頻譜只是被濾去了高頻段,而對清音信號,頻譜則明顯地被成比例地壓縮了。
儘管為說明目的公開了本發明的具體實施例和附圖,其目的在於幫助理解本發明的內容並據以實施,但是本領域的技術人員可以理解在不脫離本發明及所附的權利要求的精神和範圍內,各種替換、變化和修改都是可能的。因此,本發明不應局限於最佳實施例和附圖所公開的內容。
權利要求
1.一種數字助聽器語音頻率壓縮方法,具體包括以下步驟1)將語音信號進行時頻域轉換;2)通過信號對數譜的斜率來判斷語音信號的能量分布,並動態地調整語音頻譜;3)通過去除高頻譜係數的方法,實現低通濾波;4)通過頻譜包絡調整的方法,壓縮語音頻帶。
2.如權利要求1所述的數字助聽器語音頻率壓縮方法,其特徵在於語音信號時頻域轉換採用加窗傅氏變換的方法。
3.如權利要求1所述的數字助聽器語音頻率壓縮方法,其特徵在於,步驟進一步為將信號的對數譜與一段斜率為1的線段作內積,內積結果即為對數譜的斜率,如果斜率小於某一預定門限,則採用低通濾波的方法;反之,採用頻譜包絡壓縮的方法。
4.如權利要求1所述的數字助聽器語音頻率壓縮方法,其特徵在於,頻譜包絡調整的方法首先利用線性預測分析求出短時信號的譜包絡,並將其從原頻譜中去除,得到白化譜;再將寬帶包絡壓縮為窄帶包絡,並對白化譜的低頻段譜線進行調製,同時將高頻譜去除。
5.如權利要求3所述的數字助聽器語音頻率壓縮方法,其特徵在於,頻譜包絡壓縮包括以下步驟1)對當前短時幀信號進行線性預測分析,並通過線性預測係數得到信號的譜包絡;2)將信號的傅氏變換係數除以相應的頻譜包絡值,得到去包絡後的頻譜,或稱白化譜;3)將頻譜包絡按壓縮比例壓縮為窄帶包絡;4)將壓縮後的窄帶包絡乘以白化譜係數,並將高頻段譜係數置為零,得到壓縮後的語音頻。
6.如權利要求3所述的數字助聽器語音頻率壓縮方法,其特徵在於低通濾波處理將信號的復頻譜中高頻段內的係數置為零,低頻段保持不變。
7.如權利要求1-6中任意一項所述的數字助聽器語音頻率壓縮方法,其特徵在於對信號進行時域恢復時,將處理後的頻譜係數經反傅氏變換恢復到時域,加漢寧窗後與以前結果進行混疊相加。
全文摘要
本發明中提出一種數字助聽器語音頻率壓縮方法,通過對信號的短時頻譜係數進行處理,將寬帶語音信號壓縮為窄帶語音信號。根據本發明的方法包括以下技術1)利用加窗傅氏變換進行時頻域的轉換;2)通過信號對數譜的斜率來判斷語音信號的能量分布,並動態地調整語音頻譜;3)通過去除高頻譜係數的方法,實現低通濾波;4)通過頻譜包絡調整的方法,壓縮語音頻帶。本發明只通過調整信號頻譜包絡來壓縮信號帶寬,這種方法相當於對信號進行線性處理,避免了非線性頻移方法給語音信號帶來的聽覺失真,而動態的頻譜調整又能儘量地保證語音的低頻段信息不受破壞,因此利用該方案能夠產生高質量的清晰語音。
文檔編號H04R25/00GK1870133SQ200510011780
公開日2006年11月29日 申請日期2005年5月24日 優先權日2005年5月24日
發明者遲惠生, 吳璽宏, 張志平, 陳婧 申請人:北京大學科技開發部