語音增強方法、裝置及頭戴式降噪通信耳機的製作方法
2023-05-12 20:47:01 1
專利名稱:語音增強方法、裝置及頭戴式降噪通信耳機的製作方法
技術領域:
本發明涉及語音信號處理技術領域,更為具體地,涉及一種送話端的語音增強方法、裝置和頭戴式降噪通信耳機。
背景技術:
隨著技術的進步和社會信息化程度的提高,人與人之間的通信交流方式也越來越快捷和方便,各種各樣的通信設備和技術的廣泛應用極大地方便了人們的生活和提高了工作效率。但是,伴隨社會的發展而隨之產生的噪聲問題也嚴重影響到通信語音的清晰度和可懂度,當噪聲高到一定程度時,不但通信根本就無法進行,而且會傷害到人的聽力和身心健康。尤其是在一些特殊的地方,如機場、車站、大型工業工廠車間等場合,對通信的實時性和通信語音的清晰度和可懂度要求非常高,然而在這些特殊場合,外界噪聲的強度往往都會達到100分貝以上,在這種極限噪聲情況下進行送話,遠端用戶接受到的語音信號會完全被環境噪聲淹沒,根本得不到任何有用的信息。因此有必要在通信設備的送話端採取有效的語音增強方法來提高送話端語音的信噪比。目前常用的通信設備送話端的語音增強方法包括兩大類,一類是採用單個或多個普通麥克風拾取信號,然後採用聲學信號處理方法來達到語音增強的目的;另一類是採用特殊聲學傳聲器,如近講麥克風和振動傳聲器來達到有效拾取語音信號和抑制噪聲的目的。單個麥克風語音增強一般稱之為單通道譜減語音增強技術(參見中國發明專利申請公開說明書CN1684143A,CN101477800A),這種技術一般通過對歷史數據的分析來估計當前語音中噪聲的能量,然後通過頻譜相減的方法消除語音中的噪聲來達到語音增強的目的。採用兩個或多個麥克風組成的麥克風陣列語音增強技術(參見中國發明專利申請公開說明書CN101466055A,CN1967158A)則通常是用一個麥克風接收到的信號作為參考信號, 通過自適應濾波的方法實時的估計並抵消另外一個麥克風拾取信號中的噪聲成分,保留語音成分,從而達到語音增強的目的。採用單個或多個普通麥克風的語音增強方法,其性能很大程度上依賴於對語音狀態的檢測和判斷,否則不但不能很好的消除噪聲,而且還會給語音信號帶來較大的損傷。在低噪聲環境中,對語音狀態的檢測和判斷是可行和準確的,但在強噪聲環境中,語音信號將會完全被噪聲所淹沒,在這種極低信噪比情況下,採用普通麥克風的語音增強技術將得不到較好效果或者根本無法適用。另一類是採用一些特殊的聲學傳聲器,如近講麥克風、振動傳聲器等,以在噪聲環境下提高拾取語音信噪比,從而達到語音增強的目的。近講麥克風又稱之為降噪麥克風,是採用壓差原理進行設計的麥克風,具有指向性和「近講效應」,對噪聲尤其是遠場低頻噪聲有大約15dB左右的降噪效果,現在一般的話務耳機和一些專業通信領域的耳機較多採用近講麥克風。振動傳聲器需要與振動面有較好耦合來拾取有用信號,對空氣傳導過來的噪聲信號則有20 30dB的降噪效果。但近講麥克風的降噪量有限並且不能有效抑制風噪聲; 振動傳聲器(參見中國實用新型專利說明書C擬810077Y)雖然對噪聲(包括風噪聲)在全頻帶有20 30dB的降噪量,但其頻響特性差,不能有效拾取語音的高頻信息,通話語音的自然度和可懂度不能保證,因此這兩類特殊的聲學傳聲器都不能較好應用於高強度噪聲環境下的通信耳機。
發明內容
鑑於上述問題,本發明的目的是提供一種能夠有效結合振動傳聲器和聲學信號處理技術的語音增強方案,用來提升高強度噪聲環境下通信送話端的語音信噪比和語音質量。本發明公開了一種語音增強裝置,該裝置包括聲學語音增強單元和電子語音增強單元;其中,聲學語音增強單元包括具有特定相對位置關係的主振動傳聲器和輔振動傳聲器;所述特定相對位置關係使得主振動傳聲器拾取通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播進來的外界環境噪聲信號,輔振動傳聲器主要拾取從空氣中傳播進來的外界環境噪聲信號,並且主振動傳聲器和輔振動傳聲器所拾取的從空氣中傳播進來的外界環境噪聲信號具有相關性;電子語音增強單元包括語音檢測模塊、自適應濾波模塊和後處理模塊;其中,語音檢測模塊,用於根據所述主振動傳聲器和輔振動傳聲器輸出的聲音信號確定所述自適應濾波模塊的更新速度並輸出控制參數;自適應濾波模塊,用於根據所述輔振動傳聲器輸出的聲音信號和所述語音檢測模塊輸出的控制參數對所述主振動傳聲器輸出的聲音信號進行降噪濾波,並輸出降噪濾波後的語音信號;後處理模塊,用於對所述自適應濾波模塊輸出的降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。本發明還公開了一種頭戴式降噪通信耳機,該通信耳機包括語音信號傳送埠和如上所述的語音增強裝置;所述語音信號傳送埠,用於接收所述語音增強裝置降噪後的語音信號,並傳送給遠端用戶。本發明還公開了一種語音增強方法,該方法包括利用具有特定相對位置關係的主振動傳聲器和輔振動傳聲器,分別拾取第一聲音信號和第二聲音信號;所述第一聲音信號包括通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播近來的外界環境噪聲信號,所述第二聲音信號主要為從空氣中傳播進來的外界環境噪聲信號,並且所述第一聲音信號和第二聲音信號中的外界環境噪聲信號具有相關性;根據所述第一聲音信號和第二聲音信號確定控制自適應濾波器更新速度的控制參數;根據所述第二聲音信號和所述控制參數對所述第一聲音信號進行降噪濾波,輸出降噪濾波後的語音信號;對所述降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。由上述可見,在本發明的技術方案中,對送話端的語音在聲學層面和電子層面分別進行了語音增強。具體來說在聲學層面上,利用具有特定相對位置關係的主振動傳聲器和輔振動傳聲器,分別拾取包括使用者的語音信號和外界環境噪聲信號的第一語音信號和以外界環境噪聲信號為主的第二聲音信號,由於採用了振動傳聲器結構,因此在拾取時就能將外界噪聲衰減20 30dB,並且第一聲音信號和第二聲音信號的外界環境噪聲具有高度的相關性,這為電子層面上的語音增強算法提供了較好的噪聲參考信號;在電子層面上首先根據第一聲音信號和第二聲音信號,確定控制自適應濾波器更新速度的控制參數,然後根據第二聲音信號和所述控制參數對所述第一聲音信號進行降噪濾波得到信噪比較高的語音信號,最後對降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理,從而大大改善了送話端語音的可懂度和清晰度。可見通過上述的聲學層面和電子層面的語音增強處理,最終能夠在通信的送話端提供高達40 50dB的降噪量,極大地提高通信送話端的語音信噪比,並較好地改善了送話端語音的自然度和可懂度,極大提高了高強度噪聲環境下的語音信噪比和語音質量。
圖1為帶有膠套的麥克風構成的振動傳聲器的結構示意圖;圖2為根據本發明的語音增強裝置中裝配在支杆上的主、輔振動傳聲器的結構示意圖;圖3A為主振動傳聲器與耳機佩戴者頭部耦合位置示意圖;圖;3B為應用本發明的帶有傳聲器支杆的耳機與佩戴者腮部耦合的效果示意圖;圖4為本發明中電子層面語音增強的系統方框圖;圖5為本發明的語音增強方法的具體流程示意圖;圖6為本發明的語音增強裝置的方框圖;圖7為本發明的頭戴式降噪通信耳機的方框圖。在所有附圖中相同的標號指示相似或相應的特徵或功能。
具體實施例方式以下將結合附圖對本發明的具體實施例進行詳細描述。本發明的語音增強方法包括兩大部分,第一部分是聲學層面上進行語音增強,並為電子層面上的語音增強算法提供較好信噪比的主信號和與主信號具有高度相關性的噪聲參考信號;第二部分是採用聲學信號處理方法,進一步對信號進行語音增強處理,提高語音的信噪比,改善送話端語音的可懂度和舒適度。下面將對聲學層面和電子層面上的語音增強技術方案分別進行闡述。在聲學層面上,本發明採用雙振動傳聲器結構,主振動傳聲器和輔振動傳聲器具有相似的結構並且在空間位置上相互靠近,即主振動傳聲器和輔振動傳聲器具有特定相對位置關係。該特定相對位置關係使得主振動傳聲器拾取通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播進來的外界環境噪聲信號,而輔振動傳聲器主要拾取從空氣中傳播進來的外界環境噪聲信號,並且分別從空氣中傳播進主振動傳聲器和輔振動傳聲器的外界環境噪聲信號具有相關性。具體來說,主振動傳聲器與耳機佩戴者直接接觸,通過耦合振動的方式有效拾取耳機佩戴者的語音信號,輔振動傳聲器不與耳機佩戴者直接接觸,不耦合通過振動傳過來的語音信號。對於空氣中傳播過來的噪聲信號,主、輔振動傳聲器都會大約20 30dB的衰減,並且通過調整主、輔傳聲器的位置可以保證兩個振動傳聲器拾取到的噪聲信號有比較好的相關性。在本發明的一個具體實施方式
中,採用具有密閉膠套結構的麥克風作為振動傳聲器。圖1為麥克風放在密閉膠套中構成振動傳聲器的結構示意圖,如圖1所示,麥克風 (MIC) 10放置在密閉膠套20中,並且在麥克風10的振膜與膠套20之間保留一定的密閉空氣腔30以供聲音信號通過。從空氣當中傳播過來的外界環境噪聲因為要經過膠套20的衰減才能被麥克風10的振膜拾取到,所以噪聲會被大大降低;而對於耦合在膠套20上表面的振動信號,膠套20表面的振動會直接導緻密閉空氣腔30體積的變化,從而引起麥克風10 振膜的振動,所以膠套20上表面的振動信號會被麥克風10有效的拾取到。另外,帶有膠套20的麥克風10在隔離外界噪聲的同時必須有效耦合耳機佩戴者的語音信號,一般人講話時,人頭部的很多部分都會包含一定的語音振動信號(尤其是低頻信息),而這其中又以喉部和腮部振動包含的語音頻譜信息較豐富。因此,考慮到耳機的佩戴方便和美觀,在本發明的一個優選實施方式中,設計如圖2所示的傳聲器支杆,支桿頭部的正反兩面各放置一個帶有膠套的麥克風,分別稱為主振動傳聲器112和輔振動傳聲器 114,其中主振動傳聲器112設置在貼近佩戴者面部的一面,輔振動傳聲器114設置在與主振動傳聲器112相背的另一面。主振動傳聲器112與耳機佩戴者頭部的耦合位置可以有多種選擇,圖3A示出了主振動傳聲器與頭部耦合的可能位置示意圖,包括頭頂301、額部302、 腮部303、鬟部304、耳內305、耳後306、喉部307等,帶有傳聲器支杆的耳機與佩戴者腮部耦合效果如圖3B所示。主振動傳聲器112的膠套正面與耳機佩戴者的腮部保持較好的耦合,從而能較好拾取耳機佩戴者的語音信息。而輔振動傳聲器114不與人臉直接耦合,所以對耳機佩戴者語音信號不敏感。並且,採用如圖1所示的膠套結構和如圖2、圖;3B所示的支杆和耳機佩戴方式,能夠保證主振動傳聲器112拾取到的是較好的語音信號和被衰減大約20 30dB的外界噪聲信號,輔振動傳聲器114拾取到的主要是被衰減大約20 30dB的外界噪聲信號,輔振動傳聲器114拾取到的較純淨的外界噪聲信號可以為下一步電子層面的降噪提供較好的外界噪聲參考信號。在空間上主振動傳聲器112、輔振動傳聲器114距離相對較近,並有相似的膠套結構,保證洩露進兩個膠套的外界噪聲信號具有較好的相關性,以確保電子層面對噪聲信號能夠進一步降低。另外為了避免輔振動傳聲器114拾取到較多的振動語音信號,從而導致在電子層面損傷主振動傳聲器112中的語音信號,最好能夠在主振動傳聲器112、輔振動傳聲器114 之間採取較好的隔振處理措施。在本發明的一個優選實施方式中,採用在主、輔傳聲器膠套之間增加一些墊片來達到隔振的目的。經過聲學層面的語音增強後,主振動傳聲器112中信號的信噪比有了大約20dB提高,但還是不能滿足在極限噪聲情況下通信的要求。所以在本發明中,採用聲學信號處理的技術進一步提高語音信號的信噪比,並改善通過振動拾取的語音信號的自然度和清晰度。需要說明的是,本發明中的振動傳聲器並不僅限於上述具有密閉膠套結構的麥克風,也可以採用現有的骨導傳聲器,或者採用普通的駐極體(ECM)麥克風增加特殊聲學結構設計來達到類振動傳聲器的效果。本發明後續會針對採用普通麥克風加特殊聲學結構設計來闡述。圖4為對經過聲學層面語音增強後的信號進行電子層面語音增強的系統方框圖。 如圖4所示,電子層面的語音增強,主要包括語音檢測模塊210、自適應濾波模塊220和後處理模塊230,其中語音檢測模塊210用於根據主振動傳聲器112和輔振動傳聲器114輸出的聲音信號確定自適應濾波模塊220的更新速度並輸出控制參數α ;自適應濾波模塊220則根據輔振動傳聲器114輸出的聲音信號和語音檢測模塊210輸出的控制參數α對主振動傳聲器112輸出的聲音信號進行降噪濾波,並輸出降噪後的語音信號;後處理模塊230用於對採用自適應濾波模塊220輸出的降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。當存在語音信號時,主振動傳聲器112直接耦合佩戴者腮部的振動拾取到較大的語音信號;雖然輔振動傳聲器114不與腮部直接耦合,但因為其與佩戴者嘴部距離較近,當佩戴者大聲講話時,通過空氣洩露而被輔振動傳聲器114拾取到的語音信號也不能夠被忽略。這時如果把輔振動傳聲器114的信號直接作為濾波參考信號來更新自適應濾波器並進行濾波,將有可能對語音造成損傷,所以必須先由語音檢測模塊210根據主振動傳聲器112 和輔振動傳聲器114輸出的聲音信號確定自適應濾波模塊220中自適應濾波器的更新速度,並輸出表示控制自適應濾波器221更新速度的控制參數α。在本發明的一個具體實施方式
中,控制參數α的值是採用計算在低頻範圍內主振動傳聲器112與輔振動傳聲器114的統計能量比值?_1~站10來確定的,能量比值P_ratio 越大表示主振動傳聲器112所拾取的聲音信號中存在目標語音的比例越大,α的值就越小,自適應濾波器的更新速度就越慢;反之,能量比值P_ratio越小則表示表示主振動傳聲器112所拾取的聲音信號中存在目標語音的比例越小、存在環境噪聲的比例越大,α的值就越大,自適應濾波器221的更新速度就越快。低頻範圍是指500Hz以下的頻率範圍。α 的取值範圍為α < 1,在本發明的一個優選實施方式中,設定P_ratio大於IOdB時,認為主振動傳聲器112所拾取的聲音信號全部為目標語音信號,α =0,自適應濾波器停止更新;P_rati0小於OdB時,認為主振動傳聲器112所拾取的聲音信號全部為環境噪聲信號, α = 1,自適應濾波器以最快速度更新。自適應濾波模塊220包括一個自適應濾波器221和一個減法器222,在本發明的一個具體實施方式
中,採用一個階長為P(P > 1)的HR濾波器作為降噪濾波的自適應濾波
器,濾波器的權值是^ = 1^(0),^(1),...,^(7-1)]本實施方案P = 64,階長主要取決於系統
,
採樣頻率和主、輔傳聲器之間聲學傳遞路徑的複雜性。假設主振動傳聲器112和輔振動傳聲器114所拾取並輸出的聲音信號分別為第一聲音信號si (η)和第二聲音信號s2 (η),自適應濾波器221的輸入信號為輔振動傳聲器114 所拾取的聲音信號s2 (η),在控制參數α的更新速度控制下,自適應濾波器221濾波輸出信號s3 (η),減法器222將s3 (η)與主振動傳聲器112所拾取的聲音信號si (η)相減得到噪聲抵消後的信號y (η),y(n)反饋回自適應濾波器221進行濾波器權值的再次更新。自適應濾波器221的更新速度受控制參數α的控制,當α = 1,即sl(n)、s2(n) 中全是噪聲成分,自適應濾波器221快速收斂到噪聲從輔振動傳聲器114到主振動傳聲器 112的傳遞函數!1_1101^,使得83(11)與sl(n)相同,抵消後的y(n)很小,從而消除噪聲。當α =0jPsl(n)、s2(n)中全是目標語音成分,自適應濾波器停止更新,從而自適應濾波器不會收斂到語音從輔振動傳聲器114到主振動傳聲器112的傳遞函數H_speech,s3 (η) 與sl(n)不同,從而相減後的語音成分不會被抵消,輸出y(n)保留了語音成分。當0 < α < 1時,即主振動傳聲器112所拾取到的聲音信號中同時有語音成分和環境噪聲成分,這時自適應濾波器221的更新速度由語音成分和環境噪聲成分的多少來控制,以保證消除噪聲的同時保留語音成分。另外,由於噪聲從輔振動傳聲器114到主振動傳聲器112的傳遞函數H_noiSe與語音從輔傳聲器114到主振動傳聲器112的傳遞函數H_speech有相似性,因此即使自適應濾波器221收斂到H_noiSe仍然會對語音造成一定程度的損害,因此需要採用α來約束自適應濾波器221的權值。在本發明的一個具體實施方式
中所做的約束是a*G,當α = 1,即認為主振動傳聲器112所拾取到的聲音信號中全是環境噪聲成分,自適應濾波器221不做約束,環境噪聲被完全消除;當α =0,即認為主振動傳聲器112所拾取到的聲音信號中全是語音成分,自適應濾波器221完全約束,語音完全保留;當0 < α < 1時,即認為主振動傳聲器112所拾取到的聲音信號中同時有語音成分和環境噪聲成分,自適應濾波器221部分約束,環境噪聲部分消除而將語音完全保留,通過這種處理方式達到在降噪的同時很好地保護語音的效果。需要說明的是,雖然在上述具體實施方式
中是利用時域自適應濾波器進行降噪, 但本領域技術人員應當明了,在濾波時所採用的濾波器並不限於時域自適應濾波器,也可利用頻域(子帶)自適應濾波器降噪,進一步可通過主振動傳聲器112與輔振動傳聲器114 的每個頻率子帶的統計能量比P_rati0i得到每個頻率子帶的控制參數α 並獨立控制頻率自適應濾波器每個頻率子帶的更新。i為頻率子帶的標識,其中每個頻率子帶的統計能量比越大,該頻率子帶對應的Cii的值越小,Cii的取值範圍為0彡Cii彡1,即CiiW取指範圍為0到1。在本發明的一個優選實施方式中,後處理模塊230包括單通道降噪子模塊231和語音高頻增強子模塊232。單通道降噪子模塊231首先根據噪聲平穩的特性統計出自適應濾波模塊220的輸出信號y(n)中殘留的平穩噪聲的能量;另外,由于振動方式拾取到的語音信號高頻能量較小,導致處理後的語音的清晰度和可懂度不高,因此再採用語音高頻增強子模塊232對經過單通道降噪子模塊231做單通道降噪處理後的語音信號進行高頻成分的增強,從而極大的改善輸出語音信號的清晰度和可懂度,使得用戶獲得足夠清晰的語音信號。在本發明的一個具體實施方式
中,單通道降噪子模塊231利用平滑平均的方法統計出噪聲能量,並在信號y (η)中減去這部分噪聲能量,從而進一步降低自適應濾波模塊 220所輸出的y (η)中的噪聲成分並保留其中的語音成分,以達到提高語音信號信噪比的效果。
結合上述對本發明的技術方案的表述,圖5為本發明提供的語音增強方法的具體流程示意圖。如圖5所示,本發明的語音增強方法包括如下步驟首先,在步驟S510中,利用主振動傳聲器112和輔振動傳聲器114分別拾取第一聲音信號si (η)和第二聲音信號s2 (η),其中第一聲音信號si (η)包括通過耦合振動方式傳過來的使用者的語音信號和從膠套洩露進麥克風的外界環境噪聲信號,第二聲音信號s2(n)主要為從膠套洩露進麥克風的外界環境噪聲信號,並且由于振動傳聲器的位置設置使得第一聲音信號sl(ri)和第二聲音信號s2(n)中的外界環境噪聲信號具有相關性;在步驟S520中,根據第一聲音信號si (η)和第二聲音信號s2(n)確定自適應濾波器的更新速度並輸出控制參數α,0 < α < 1 ;在步驟S530中,根據第一聲音信號sl(n)、第二聲音信號s2 (η)和所述控制參數 α利用自適應濾波器對第一聲音信號si (η)進行降噪處理;在S540中,進一步消除自適應濾波器進行降噪處理後的聲音信號中殘留的平穩噪聲的能量;最後,在步驟S550中,對上述消除殘留的平穩噪聲的能量後的聲音信號進行高頻成分的增強。本發明的上述語音增強方法,採用軟體和硬體組合的方式實現。圖6示出了本發明的與上述語音增強方法相對應的語音增強裝置的邏輯結構示意圖。如圖6所示,本發明提供的語音增強裝置600包括聲學語音增強單元610和電子語音增強單元620。其中,聲學語音增強單元610包括主振動傳聲器112和輔振動傳聲器114。主振動傳聲器112用於拾取通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播進來的外界環境噪聲信號;輔振動傳聲器114用於拾取從空氣中傳播進來的外界環境噪聲信號;並且分別從空氣中傳播進主振動傳聲器112和輔振動傳聲器114的外界環境噪聲信號具有相關性。電子語音增強單元620包括語音檢測模塊210、自適應濾波模塊220和後處理模塊230,其中,語音檢測模塊210用於根據所述主振動傳聲器112和輔振動傳聲器114輸出的聲音信號確定所述自適應濾波模塊220的更新速度並輸出控制參數α ;自適應濾波模塊220根據所述輔振動傳聲器114輸出的聲音信號和所述語音檢測模塊210輸出的控制參數α對所述主振動傳聲器112輸出的聲音信號進行降噪濾波,並輸出降噪濾波後的語音信號;所述後處理模塊230用於對所述自適應濾波模塊220輸出的降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。這裡需要說明的是當自適應濾波器221為時域自適應濾波器時語音檢測模塊210,用於通過計算在低頻範圍內的主振動傳聲器112輸出的聲音信號和輔振動傳聲器114輸出的聲音信號的統計能量比值來確定自適應濾波器221的控制參數;其中統計能量比值越大,所述控制參數的值越小,且所述控制參數的取值範圍為0到1 ;當自適應濾波器221為頻域自適應濾波器時語音檢測模塊21α,用於通過計算主振動傳聲器112輸出的聲音信號和輔振動傳聲器114輸出的聲音信號在每個頻率子帶的統計能量比值來確定每個頻率子帶的控制參數α i ;其中頻率子帶的統計能量比值越大,該頻率子帶對應的控制參數α i的值越小,且每個頻率子帶對應的控制參數α i的取值範圍為 0 至 Ij 1 ο語音增強裝置600各組成結構間的具體工作流程與前述對圖4以及圖5中所表述的工作流程完全相同,在此不再贅述。圖7示出了具有根據本發明的語音增強裝置的頭戴式降噪通信耳機700的方框
10圖。如圖7所示,所述頭戴式降噪通信耳機700包括語音信號傳送埠 701以及如圖 6所示的所述語音增強裝置600,其中語音信號傳送埠 701用於把近端語音信號傳送到遠端用戶,即接收採用語音增強裝置600降噪後的語音信號,然後採用有線或者是無線的方式發送給遠端用戶。所述語音增強裝置600的各個組成部件的功能及其描述與上面針對圖 4以及圖6進行的描述完全相同,在此不再進行描述。綜合來講,本發明能夠從聲學層面和電子層面消除環境噪聲,極大提高高強度噪聲環境下語音信噪比和語音質量原因如下1)雙振動傳聲器能有效隔離外界從空氣中傳播過來的噪聲;並且對於洩露進來的噪聲,因為主、輔振動傳聲器具有相似的結構和相互靠近的空間位置,所以洩露進主、輔振動傳聲器的外界噪聲信號具有很好的相關性。2)對於耳機佩戴者講話時的有用的語音信號,因為主振動傳聲器是直接和人的頭部耦合的,而且主、輔振動傳聲器之間較好隔離,所以主振動傳聲器能較好拾取耳機佩戴者的振動語音信號,而輔振動傳聲器只能拾取洩露進來的語音信號。3)經過聲學層面的語音增強,得到較高信噪比的語音信號和較純淨的外界噪聲參考信號,在電子層面採用自適應噪聲消除技術和單通道語音增強技術進一步提高語音信號的信噪比。4)在電子層面對經過語音增強後的語音信號進行高頻成分的增強,從而極大的改善輸出語音信號的清晰度和可懂度,使得用戶獲得足夠清晰的語音信號。5)與採用近講麥克風作為送話器的通信耳機相比,本發明對噪聲的方向性和所處位置不敏感,對近、遠場的各個方向的噪聲都有穩定的降噪量,而且對風噪聲也有較好的降噪效果。如上參照附圖以示例的方式描述根據本發明的語音增強方法、裝置和降噪耳機。 但是,本領域技術人員應當理解,對於上述本發明所提出的語音增強方法、裝置和降噪耳機,還可以在不脫離本發明內容的基礎上做出各種改進。因此,本發明的保護範圍應當由所附的權利要求書的內容確定。
權利要求
1.一種語音增強裝置,其特徵在於,該裝置包括聲學語音增強單元和電子語音增強單元;其中,聲學語音增強單元包括具有特定相對位置關係的主振動傳聲器和輔振動傳聲器;所述特定相對位置關係使得主振動傳聲器拾取通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播進來的外界環境噪聲信號,輔振動傳聲器主要拾取從空氣中傳播進來的外界環境噪聲信號,並且主振動傳聲器和輔振動傳聲器所拾取的從空氣中傳播進來的外界環境噪聲信號具有相關性;電子語音增強單元包括語音檢測模塊、自適應濾波模塊和後處理模塊;其中,語音檢測模塊,用於根據所述主振動傳聲器和輔振動傳聲器輸出的聲音信號確定所述自適應濾波模塊的更新速度並輸出控制參數;自適應濾波模塊,用於根據所述輔振動傳聲器輸出的聲音信號和所述語音檢測模塊輸出的控制參數對所述主振動傳聲器輸出的聲音信號進行降噪濾波,並輸出降噪濾波後的語音信號;後處理模塊,用於對所述自適應濾波模塊輸出的降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。
2.根據權利要求1所述的裝置,其特徵在於,所述主振動傳聲器由麥克風放在密閉的膠套中構成,並且麥克風的振膜與膠套之間設置有密閉空氣腔;所述輔振動傳聲器的結構與所述主振動傳聲器的結構相同。
3.根據權利要求1所述的裝置,其特徵在於,所述主振動傳聲器和輔振動傳聲器分別放置在傳聲器支杆的正反兩面,且主振動傳聲器和輔振動傳聲器之間有隔振處理結構。
4.根據權利要求1所述的裝置,其特徵在於,所述後處理模塊包括單通道降噪子模塊,用於統計出自適應濾波模塊輸出的降噪濾波後的語音信號中殘留的平穩噪聲的能量,並從自適應濾波模塊輸出的降噪濾波後的語音信號中減去這部分噪聲能量,然後輸出給語音高頻增強子模塊;語音高頻增強子模塊,用於對單通道降噪子模塊降噪處理後的語音信號進行高頻成分的增強處理。
5.根據權利要求1所述的裝置,其特徵在於,所述語音檢測模塊,用於通過計算在低頻範圍內的主振動傳聲器輸出的聲音信號和輔振動傳聲器輸出的聲音信號的統計能量比值來確定所述控制參數;其中統計能量比值越大,所述控制參數的值越小,且所述控制參數的取值範圍為0到1 ;或者,所述語音檢測模塊,用於通過計算主振動傳聲器輸出的聲音信號和輔振動傳聲器輸出的聲音信號在每個頻率子帶的統計能量比值來確定每個頻率子帶的控制參數;其中頻率子帶的統計能量比值越大,該頻率子帶對應的控制參數的值越小,且每個頻率子帶對應的控制參數的取值範圍為0到1。
6.根據權利要求1所述的裝置,其特徵在於,所述自適應濾波模塊包括自適應濾波器和減法器;其中,自適應濾波器,用於在所述控制參數的控制下對輔振動傳聲器輸出的聲音信號進行濾波,並輸出給減法器;減法器,用於將主振動傳聲器輸出的聲音信號與自適應濾波器輸出的信號相減後輸出降噪濾波後的語音信號,並且將該降噪濾波後的語音信號反饋給自適應濾波器。
7.一種頭戴式降噪通信耳機,其特徵在於,該通信耳機包括語音信號傳送埠和如權利要求1-6中任一項所述的語音增強裝置;所述語音信號傳送埠,用於接收所述語音增強裝置降噪後的語音信號,並傳送給遠端用戶。
8.一種語音增強方法,其特徵在於,該方法包括利用具有特定相對位置關係的主振動傳聲器和輔振動傳聲器,分別拾取第一聲音信號和第二聲音信號;所述第一聲音信號包括通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播近來的外界環境噪聲信號,所述第二聲音信號主要為從空氣中傳播進來的外界環境噪聲信號,並且所述第一聲音信號和第二聲音信號中的外界環境噪聲信號具有相關性;根據所述第一聲音信號和第二聲音信號確定控制自適應濾波器更新速度的控制參數;根據所述第二聲音信號和所述控制參數對所述第一聲音信號進行降噪濾波,輸出降噪濾波後的語音信號;對所述降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。
9.根據權利要求8所述的方法,其特徵在於,對所述降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理包括統計出所述降噪濾波後的語音信號中殘留的平穩噪聲的能量,並從所述降噪濾波後的語音信號中減去這部分噪聲能量,然後再進行高頻成分的增強處理。
10.根據權利要求8或9所述的方法,其特徵在於,所述根據所述第一聲音信號和第二聲音信號確定控制自適應濾波器更新速度的控制參數包括通過計算在低頻範圍內的第一聲音信號和第二聲音信號的統計能量比值來確定所述控制參數,其中統計能量比值越大,所述控制參數的值越小,且所述控制參數的取值範圍為 0到1 ;或者,通過計算第一聲音信號和第二聲音信號的在每個頻率子帶的統計能量比值來確定每個頻率子帶的控制參數,其中頻率子帶的統計能量比值越大,該頻率子帶對應的控制參數的值越小,且每個頻率子帶對應的控制參數的取值範圍為O到1。
全文摘要
本發明公開了一種語音增強方法、裝置及頭戴式降噪通信耳機。在本發明的方案中,利用具有特定相對位置關係的主振動傳聲器和輔振動傳聲器,分別拾取通過耦合振動方式傳過來的使用者的語音信號和從空氣中傳播進來的外界環境噪聲信號的第一聲音信號,和拾取主要從空氣中傳播進來的外界環境噪聲信號的第二聲音信號,且兩振動傳聲器拾取的外界環境噪聲信號具有相關性;根據第一聲音信號和第二聲音信號確定控制自適應濾波器更新速度的控制參數;根據第二聲音信號和控制參數對第一聲音信號進行降噪濾波;對降噪濾波後的語音信號做進一步的降噪和語音高頻增強處理。本發明的技術方案,能夠有效提升高強度噪聲環境下的語音信噪比和語音質量。
文檔編號H04R1/10GK102411936SQ20111038193
公開日2012年4月11日 申請日期2011年11月25日 優先權日2010年11月25日
發明者劉崧, 華洋, 李波, 趙劍 申請人:歌爾聲學股份有限公司