估計聲音波達方向的系統和方法
2024-01-21 21:13:15 2
專利名稱:估計聲音波達方向的系統和方法
技術領域:
本發明涉及聲音方向探測領域。
背景技術:
與申請號為 PCT/AU2007/000764 (W02007/1 37364)禾口 PCT/ AU2009/001566 (W02010/051606)的國際專利申請說明書中的信息以引用方式併入本文。一種用於在頭部可佩戴設備的波達方向系統採用的技術是將來自頭部左側和右側的麥克風輸出信號結合以確定麥克風輸出信號中的聲音延遲。當聲音從佩戴者的中間(前或後)區域發出時,麥克風輸出信號之間的延遲很小。 但是,當聲音從頭部的一側發出時,延遲最大。該延遲從中間區域到任意一側區域單調遞增。參照兩耳間的中線位置,這種單調遞增可被轉化為聲音的波達方向。另一技術依賴於人類頭部的遮蔽效應。頭部對來自兩側的聲音產生遮蔽效應。由於該遮蔽效應,麥克風輸出信號之間會有大於20dB的聲級差。隨著聲音從側面移動至兩耳間的中線位置,該聲級差也單調遞減。這兩種基本機制已用於基於可佩戴聽覺設備的波達方向算法。已嘗試多種技術來對比左邊和右邊的麥克風輸出信號,得到波達方向的估計。這些技術包括關聯法,最大似然法(協方差最小化),多信號分類法(MUSIC),採用旋轉不變性技術的信號參量估計(ESPRIT)或特徵分解法,以及採用陣列流形或三角測量的矩陣束法。但是,這些技術僅能在相對安靜的環境中順利地運行。例如,波達方向的常見技術依賴於傳感麥克風陣列,其中計算麥克風輸出信號之間的互相關性以確定最大輸出功率或峰值處的延遲。存在多重聲源時,這些系統不能持續和精確地估計出現在環境中的目標聲音的波達方向。取而代之,此估計反映了主導聲音的波達方向。但是由於不同聲源的時間波動特徵,主導聲音通常隨時改變,使估計含糊不清。這是一個特定的應用問題,其中要求對空間中出現在任意空間位置的目標聲源進行持續和精確的探測。例如,諸如助聽器和聽力防護器之類的頭部可佩戴設備可結合雙側波束形成器技術以提高收聽者可獲得的信噪(S/N)比,且在該過程中去除本地信號。在這樣的系統中,會需要所期望的目標聲音的波達方向來重現本地信號。在這樣的系統中,所期望的目標聲音的波達方向可能會用於重構本地信號以供收聽者使用,例如,虛擬聽覺空間重構技術。在此仍然存在對改進的波達方向技術的需求。
發明內容
第一方面,本發明提供了一種估計聲音波達方向的方法,該方法包括以下步驟生成參考信號;採用兩個或多個空間分離的、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算兩個或多個的輸出信號中的每一個與參考信號之間的關係;以及基於該關係的差異估計波達方向。
參考信號通過採用專用的參考信號麥克風探測聲音生成。參考信號通過波束形成器技術生成。基於關係之間差異的估計波達方向的步驟包括計算兩耳間時差的步驟。計算兩耳間時差的步驟可包括使用時間相關技術。基於關係之間差異的估計波達方向的步驟包括計算兩耳間聲級差的步驟。計算兩耳聲級差的步驟可包括使用功率差測量。計算關係的步驟對多頻率通道執行。上述方法可進一步包括將基於高頻聲音的波達方向估計的分布與來源於低頻聲音的波達方向估計的分布相比較的步驟。第二方面,本發明提供了一種用來估計聲音波達方向的系統,該系統包括生成裝置,用於生成參考信號;探測裝置,用於採用兩個或多個空間分離的、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算裝置,用於計算兩個或多個輸出信號中的每一個與參考信號之間的關係;以及估計裝置,用於基於關係之間的差異估計波達方向。第三方面,本發明提供了一種估計聲音波達方向的方法,包括以下步驟採用兩個或多個空間分離的、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號; 計算兩個或多個輸出信號之間的時差和聲級差;以及基於時差和聲級差的組合估計波達方向。計算時差和聲級差的步驟在可在多頻率通道中執行。將時差和聲級差組合的步驟可包括時間延遲和聲級差測量的加權組合。計算聲級差的步驟主要對高頻聲音執行。計算時差的步驟主要對低頻聲音執行。該方法進一步包括將基於高頻聲音的波達方向估計的分布和與來源於低頻聲音的波達方向估計的分布相比較的步驟。第四方面,本發明提供了一種用於估計聲音波達方向的系統,包括探測裝置,用於採用兩個或多個空間分離的、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算裝置,用於計算兩個或多個輸出信號之間的時差和聲級差;以及估計裝置,用於基於時差和聲級差的組合估計波達方向。第五方面本發明提供了一個電腦程式產品,包括使計算機設備根據本發明第一至第四方面中的任意一項來執行方法或實現系統的軟體指令。在眾所周知的聲源的聲跟蹤時,例如脈衝列或純音,通過使用模板可以任意地生成參考信號。可選地,在例如脈衝列或純音的眾所周知的聲源的聲跟蹤過程中,可通過採用模板生成參考信號。當通過雙邊波束形成器生成參考信號時,可在空間上將波束的瞄準方向調整至預期方向,對波束的寬度而言,包括瞄準方向附近的一系列方向。可選地,多個並行雙邊波束形成器可運行生成多個參考信號,多個參考信號中的每一個都能夠用於在給定的空間區域內確定主導聲源的波達方向。當參考信號由多個無線鏈路產生時,可產生多個參考信號,其中每一個都能夠用來確定在每個無線電通信電路可用的可用主導聲音的波達方向。可選地,組合的步驟可通過在多個通道,對兩耳測量加權和連續求和來實現。可選地,該計算可分別地對時差和聲級差進行測量,並將結果加權和連續求和以便產生一個單輸出。所公開的方法可包括步驟採用波達方向估計將本地信號重新引入收聽者的步驟。可選地,波達方向估計可用於控制外部設備,諸如監視攝像機和機器人臂。
參照附圖,現僅通過舉例的方式說明本發明的實施例,其中圖1是根據本發明的波達方向估計器的實施例的框圖;圖2示出著重於任意空間區域的定位響應;圖3示出次級聲源存在時估計波達方向的任務;圖4是圖1的波達方向估計器的可選擴展的框圖,進一步地包括具有反饋的減噪濾波器;圖5是圖1的波達方向估計器的可選擴展的框圖,進一步地包括生成參考信號的無線電通信電路;圖6示出由兩耳間時差和聲級差測量的正交變換產生的圖;圖7示出為波達方向估計去除噪聲和冗餘的空間濾波技術的圖;圖8示出在頭部可佩戴設備中作為空間增強算法的本發明的應用。
具體實施例方式圖1中示出本發明的優選實施例100。該系統以數位訊號處理方案中的功能塊的示意圖形式顯示。每個功能塊表示運算或數據操作步驟。系統100包括探測裝置,該探測裝置以全方向或定向的麥克風或麥克風陣列101 和102的方式探測聲音。系統100還包括用於生成參考信號Y的生成裝置103。運算和估計裝置包含在計算機硬體中,由軟體指令控制。適當的用於實施此處描述的方法的硬體是現有的,且可由熟練DSP技術的合適的人員指定。用於實現此處描述的方法的軟體可由技術人員基於此處描述的教導和數學函數準備。參照圖1,來自左麥克風101和右麥克風102的輸出被轉換為多通道信號,例如採用傅立葉變換技術(FFT)。優選實施例隨後的分析將假定這些多通道信號左\,右Xk,以及參考信號Y是可獲得的。但是本領域技術人員應當明確,該過程可由複合濾波器組在時域內進行。可選地,運算可在寬帶信號上進行。在圖1中,100,左&信號和右\信號分別與參考信號Y組合,輸入到104和105, 從而以輔助左信號\和輔助右信號&的形式,計算&信號和右\與參考信號Y之間的關係。根據式1計算該組合過程。可選地,可通過在時域將左和右信號與參考信號相關聯來計算該組合過程,從而產生左和右輔助信號。本領域技術人員應當明確在FFT空間的乘法等同於時域中的卷積,因此該運算是可互換的。Zl (k) = Xl (k) · Y (k) / I Xl (k) · XL* (k)...(式 1)
Ze (k) = Xe (k) · Y (k) / I Xe (k) · X; (k)其中k表示帶寬為Δ Ω的頻率窗口,I I表示絕對值,以及*表示復共軛。兩耳間的時間延遲估計過程106,可採用廣義的相變函數實施。該計算提供與主導聲源位置相對應的兩耳間的時間延遲τ (秒)的估計。對於給定時間延遲步長,可得到兩耳間的時間延遲。在式2中定義該步長。
權利要求
1.一種估計聲音波達方向的方法,包括以下步驟生成參考信號;採用兩個或多個空間分離、定向或空間分離定向的麥克風探測聲音,以生成兩個或兩個以上的輸出信號;計算所述兩個或多個輸出信號中的每一個與參考信號之間的關係;以及基於關係的差異估計波達方向。
2.根據權利要求1所述的方法,其中參考信號通過採用專用的參考信號麥克風探測聲音而生成。
3.根據權利要求1所述的方法,其中參考信號通過波束形成器技術生成。
4.根據前述任一權利要求所述的方法,其中基於關係之間的差異估計波達方向的步驟包括計算兩耳間時差的步驟。
5.根據權利要求4所述的方法,其中計算兩耳間時差的步驟包括時間相關技術的使用。
6.根據前述任一權利要求所述的方法,其中基於關係之間的差異估計波達方向的步驟包括計算兩耳間聲級差的步驟。
7.根據權利要求6所述的方法,其中計算兩耳間聲級差的步驟包括功率差測量的使用。
8.根據前述任一權利要求所述的方法,其中計算關係的步驟在多頻率通道中進行。
9.根據前述任一權利要求所述的方法,還包括將基於高頻聲音的波達方向估計分布與來源於低頻聲音的波達方向估計分布相比較的步驟。
10.一種用於估計聲音波達方向的系統,所述系統包括生成裝置,用於生成參考信號;探測裝置,用於採用兩個或多個空間分離、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算裝置,用於計算兩個或多個輸出信號中的每一個與參考信號之間的關係;以及估計裝置,用於基於關係的差異估計波達方向。
11.一種估計聲音波達方向的方法,包括以下步驟採用兩個或多個空間分離、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算兩個或多個輸出信號之間的時差和聲級差;以及基於時差和聲級差的組合聲音的波達方向。
12.根據權利要求11所述的方法,其中計算時差和聲級差的步驟在多頻率通道中進行。
13.根據權利要求11或12所述的方法,其中將時差和聲級差組合的步驟包括時間延遲和聲級差測量的加權組合。
14.根據權利要求11至13中任意一項所述的方法,其中計算聲級差的步驟主要對高頻聲音執行。
15.根據權利要求11至14中任意一項所述的方法,其中計算時差的步驟主要對低頻聲音執行。
16.根據權利要求11至15中任意一項所述的方法,還包括將基於高頻聲音的波達方向估計分布與來源於低頻聲音的波達方向估計分布相比較的步驟。
17.一種用於估計聲音波達方向的系統,包括探測裝置,用於採用兩個或多個空間分離、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算裝置,用於計算兩個或多個輸出信號之間的時差和聲級差;以及估計裝置,用於估計基於時差和聲級差的組合的聲音的所述波達方向。
18. 一個電腦程式產品,包括根據任一前述的權利要求使計算設備執行方法或實現系統的軟體指令。
全文摘要
公開了用於估計聲音波達方向的系統和方法,一種方法包括以下步驟生成參考信號;採用兩個或多個空間分離、定向或空間分離定向的麥克風探測聲音,以生成兩個或多個輸出信號;計算兩個或多個輸出信號中的每一個與參考信號之間的關係;以及基於該關係的差異估計波達方向。
文檔編號H04R25/00GK102428717SQ201080021993
公開日2012年4月25日 申請日期2010年8月10日 優先權日2009年8月11日
發明者喬治·梅希亞 申請人:賀爾智慧財產權公司