麥克風陣列語音波束形成方法、語音信號處理裝置及系統的製作方法
2023-09-16 01:14:20 1
專利名稱:麥克風陣列語音波束形成方法、語音信號處理裝置及系統的製作方法
技術領域:
本發明涉及複雜聲學環境中室內/外音頻信號獲取例如噪聲汙染大或室內混響 (room reverberation)嚴重情等況下的遠距離拾音數字麥克風陣列(digital microphone array, DMA)技術,尤其涉及一種麥克風陣列語音波束形成方法、語音信號處理裝置及系統。
背景技術:
由於目標聲源可能受到背景噪聲(汽車、說話的人及爆炸聲等)以及多徑反射和混響等因素的影響,導致單個麥克風接收的信號信噪比降低,從而使得語音通信質量嚴重惡化,致使感興趣的說話人的聲音難以聽清。在噪聲處理上,傳統的單個孤立麥克風一般採用頻域譜抵消(spectral subtraction)和濾波等技術來抑制噪聲。遺憾的是,這些接收到的信號和噪聲往往在時間和頻譜上相互重疊,尤其是在室內語音條件下,牆壁和其它物體的反射信號實際上就是原信號的複製,要去除這些多徑反射極其困難。因此,使用傳統的單一麥克風及其相應的數位訊號處理方法來增強感興趣的聲音並有效抑制背景噪聲、方向性強幹擾(如不感興趣的聲音等)和室內混響相當困難。針對單個孤立麥克風的以上不足,人們使用麥克風陣列(Microphone Array, MA ) 來提高語音通信的質量,所謂麥克風陣列,就是由多個麥克風按照一定的拓撲結構組成一個陣列,現有常見的有麥克風均勻線列陣、均勻圓陣等一維或二維陣列。然而,在實際的應用中,更多的則是使用具有任意拓撲結構的麥克風陣列,也即三維空間的麥克風陣列。因此,與麥克風陣列均勻線陣及圓陣模型相比,建立一個通用的可指向三維空間位置的目標聲源的麥克風陣列語音信號處理模型更具有普遍的意義。
發明內容
本發明實施例所要解決的技術問題在於,建立一種通用的、更具有普遍的意義麥克風陣列語音信號處理模型,提供一種麥克風陣列語音波束形成方法、語音信號處理裝置及系統。為了解決上述技術問題,本發明實施例提出了一種麥克風陣列語音波束形成方法,包括數位訊號轉換步驟對由至少兩個麥克風組成的麥克風陣列獲取的麥克風信號轉換為數位訊號;頻域信號獲取步驟獲取所述數位訊號的頻域信號;時延獲取步驟對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延;時延補償步驟根據所述時延對所述頻域信號進行時延補償;加權疊加步驟對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號。相應地,本發明實施例還提供了一種語音信號處理裝置,用於對由至少兩個麥克風組成的麥克風陣列獲取的麥克風信號進行語音增強處理,所述語音信號處理裝置包括 用於將所述麥克風陣列獲取的麥克風信號轉換為數位訊號的數位訊號轉換模塊;用於獲取所述數位訊號的頻域信號的頻域信號獲取模塊;用於對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延的時延獲取模塊;用於根據所述時延對所述頻域信號進行時延補償的時延補償模塊;用於對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號的加權疊加模塊。進一步地,本發明實施例還提供了一種語音信號處理系統,該系統包括由至少兩個麥克風組成的、用於獲取麥克風信號的麥克風陣列;用於對所述麥克風信號進行語音增強處理的語音信號處理裝置,其中,所述語音信號處理裝置包括用於將所述麥克風陣列獲取的麥克風信號轉換為數位訊號的數位訊號轉換模塊;用於獲取所述數位訊號的頻域信號的頻域信號獲取模塊;用於對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延的時延獲取模塊;用於根據所述時延對所述頻域信號進行時延補償的時延補償模塊;用於對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號的加權疊加模塊。本發明實施例的麥克風陣列語音波束形成方法通過數位訊號轉換步驟、頻域信號獲取步驟、時延獲取步驟、時延補償步驟及加權疊加步驟,尤其在時延獲取步驟採用基於相位轉換的時延估計,從而獲得了增強處理後的指向目標聲源空間位置的波束形成信號,相對於現有技術提升了三維空間的定位精度以及指向性,大大增強了在複雜聲學環境中的遠距離拾音能力,獲得了高質量的語音信號,減少了噪聲和其它幹擾。
圖1是本發明實施例的麥克風陣列的語音信號處理流程示意圖。圖2是本發明實施例的麥克風陣列語音波束形成流程示意圖。圖3是圖2所示的麥克風陣列語音波束對應的三維空間麥克風陣列模型示意圖。圖4是本發明實施例的語音信號處理系統的功能模塊示意圖。
具體實施例方式下面結合附圖,對本發明實施例進行詳細說明。請參考圖1,本發明實施例的麥克風陣列有麥克風(Γ4組成,各個麥克風獲得的語音信號依次經過數位訊號轉換、頻域信號獲取及時延獲取後,分別進行對應的時延補償 (Γ4,然後再經過加權疊加,最後得到語音信號增強的語音波束。具體地,本發明實施例的麥克風陣列語音波束形成方法,包括
數位訊號轉換步驟對由至少兩個麥克風組成的麥克風陣列獲取的麥克風信號轉換為數位訊號;
頻域信號獲取步驟獲取所述數位訊號的頻域信號;
時延獲取步驟對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延;
時延補償步驟根據所述時延對所述頻域信號進行時延補償; 加權疊加步驟對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號。具體地,所述頻域信號獲取步驟中,通過如下公式來獲取所述數位訊號的頻域信號
權利要求
1.一種麥克風陣列語音波束形成方法,其特徵在於,包括數位訊號轉換步驟對由至少兩個麥克風組成的麥克風陣列獲取的麥克風信號轉換為數位訊號;頻域信號獲取步驟獲取所述數位訊號的頻域信號;時延獲取步驟對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延;時延補償步驟根據所述時延對所述頻域信號進行時延補償; 加權疊加步驟對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號。
2.如權利要求1所述的麥克風陣列語音波束形成方法,其特徵在於,所述頻域信號獲取步驟中,通過如下公式來獲取所述數位訊號的頻域信號即經過J點的快速傅立葉變換變換得到頻域信號Zd (□,□) (k=l,……N,w=l,…… J),其中,J為512的正整數倍,1表示第1對麥克風對,1 = 1,……L;r表示聲源到麥克風的距離;S表示對應聲源的頻譜變換;V表示通道及背景噪聲的頻譜;□表示傅立葉變換函數。
3.如權利要求2所述的麥克風陣列語音波束形成方法,其特徵在於,所述時延獲取步驟包括如下子步驟互功率譜獲取子步驟通過如下公式來獲取2路所述頻域信號之間的互功率譜其中,E表示數學期望;2》(□,□)表示復共軛;反傅立葉變換子步驟通過如下公式來對所述互功率譜做反傅立葉變換其中,R表示互功率譜的反傅立葉變換;ω為300Hz - 2kHz的語音信號頻率範圍; 為加權函數即相位變換函數,也即互功率譜的模的倒數;搜索最大值子步驟通過如下公式來搜索出所述反傅立葉變換所得數據中的最大值, 對應的時延點即為求出的時延
4.如權利要求3所述的麥克風陣列語音波束形成方法,其特徵在於,所述時延補償步驟通過如下公式來對L路多通道頻域信號直接進行時延補償
5.如權利要求4所述的麥克風陣列語音波束形成方法,其特徵在於,所述加權疊加步驟中,通過如下公式來對所述頻域信號進行加權疊加,並進行反傅立葉變換
6.一種語音信號處理裝置,用於對由至少兩個麥克風組成的麥克風陣列獲取的麥克風信號進行語音增強處理,其特徵在於,所述語音信號處理裝置包括用於將所述麥克風陣列獲取的麥克風信號轉換為數位訊號的數位訊號轉換模塊; 用於獲取所述數位訊號的頻域信號的頻域信號獲取模塊;用於對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延的時延獲取模塊;用於根據所述時延對所述頻域信號進行時延補償的時延補償模塊; 用於對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號的加權疊加模塊。
7.如權利要求6所述的語音信號處理裝置,其特徵在於,所述頻域信號獲取模塊通過如下公式來獲取所述數位訊號的頻域信號
8.如權利要求7所述的語音信號處理裝置,其特徵在於,所述時延獲取模塊包括如下子模塊
9.如權利要求8所述的語音信號處理裝置,其特徵在於,所述時延補償模塊通過如下公式來對L路多通道頻域信號直接進行時延補償
10. 一種語音信號處理系統,其特徵在於,該系統包括 由至少兩個麥克風組成的、用於獲取麥克風信號的麥克風陣列; 用於對所述麥克風信號進行語音增強處理的語音信號處理裝置,其中,所述語音信號處理裝置包括用於將所述麥克風陣列獲取的麥克風信號轉換為數位訊號的數位訊號轉換模塊; 用於獲取所述數位訊號的頻域信號的頻域信號獲取模塊;用於對所述頻域信號進行廣義相關分析獲取目標聲源相對兩個所述麥克風的相對時延的時延獲取模塊;用於根據所述時延對所述頻域信號進行時延補償的時延補償模塊; 用於對時延補償後的信號進行加權疊加增強處理後獲得指向所述目標聲源空間位置的波束形成信號的加權疊加模塊。
全文摘要
本發明實施例公開了一種麥克風陣列語音波束形成方法,包括數位訊號轉換步驟、頻域信號獲取步驟、時延獲取步驟、時延補償步驟及加權疊加步驟,尤其在時延獲取步驟採用基於相位轉換的時延估計,從而獲得了增強處理後的指向目標聲源空間位置的波束形成信號,相對於現有技術提升了三維空間的定位精度以及指向性,大大增強了在複雜聲學環境中的遠距離拾音能力,獲得了高質量的語音信號,減少了噪聲和其它幹擾。本發明實施例還公開了一種語音信號處理裝置及系統。
文檔編號G10L21/02GK102324237SQ201110142759
公開日2012年1月18日 申請日期2011年5月30日 優先權日2011年5月30日
發明者舒暢, 鍾雄虎 申請人:深圳市華新微聲學技術有限公司