一種基於改進phat加權時延估計的聲源定位方法及其實現系統的製作方法
2023-05-12 09:13:16 4
一種基於改進phat加權時延估計的聲源定位方法及其實現系統的製作方法
【專利摘要】本發明涉及一種基於改進PHAT加權時延估計的聲源定位方法,由麥克風陣列採集4路聲音信號,通過A/D採樣電路轉化為數位訊號,並通過改進的PHAT加權廣義互相關函數法進行時延估計算法處理,獲得時延估計值,再結合放置的麥克風陣列空間位置,利用迭代法解非線性方程組,從而得到聲源的相對位置。本發明的麥克風陣列安排類似於直角坐標系的原點和x、y、z軸上的定長點,該方法計算量小,設備要求不高,速度快,做到即時定位;該聲源定位系統應用於社會生活,軍事領域等方面,如視頻會議,路徑規劃,狙擊手定位等等。
【專利說明】—種基於改進PHAT加權時延估計的聲源定位方法及其實現系統
【技術領域】
[0001]本發明涉及一種基於改進PHAT加權時延估計的聲源定位方法及其實現系統,屬於聲源定位【技術領域】。
【背景技術】
[0002]聲音是獲取外界事物信息的一個重要途徑,聲音不單單可以承載語音信息,基於聲音傳播的特性和它的路徑本身,我們還能夠通過聲源定位技術,獲取聲音承載內容信息之外的位置信息,並可以運用到跟蹤搜尋,路線規劃等相關領域,以改善某些系統的工作效率。
[0003]早先的定位方法主要依靠無線電,雷射,聲納等設備,通過主動發送信號並監聽被測物體反射回來的波,對接收的反射波進行分析和計算得到被測物的位置信息。因為發送和接受都是使用預先制定的頻率波,不易受自然環境幹擾,因此有高精度和高抗幹擾的特性。然而這種主動式的定位方式首先要求具有強大的發射功率,這使得在一些功率不足的平臺或某些能源限制環境下無法得到應用。另外由於是主動發射,在戰爭中很容易暴露自身,這在先發現先打擊的現代戰場來說是非常不利的,於是無源定位研究被不斷提出。這其中的聲源定位技術由於採用被動式原理,便於隱藏,不幹擾現有電磁環境,使用廣泛存在的聲波,再加上設備成本低廉,功耗低,得到廣泛的關注和研究。
[0004]近年來聲源定位技術因為小型化智能設備的出現而快速發展,並在多媒體系統、視頻會議、機械傷痕探測、機器人移動路徑規劃、軍事探測等方面廣泛應用。它在許多小型場所和一些開闊地帶都能夠起到重要輔助作用。例如視頻會議中,根據說話人的位置,鏡頭和麥克風由聲源定位系統控制,始終面向說話人的方向,這樣可以更好的獲取圖像和聲音信息。又如在軍事戰場中,敵方的隱藏火力點或者狙擊手的偽裝十分高明,不易發現,面對突如其來的開火往往會導致部隊被動,在此種因敵方處於雷達和紅外監測盲區而不易察覺的情況下,就可以使用聲音定位來補充。美軍最近推出的步兵便攜聲音定位系統就是依據聲學建模和聲源定位技術實現快速捕獲火力源的。
[0005]現階段的聲源定位方法根據不同的應用要求,主要分為三大類:
[0006]1、仿人雙耳的聲源定位。其主要方法是對人聽力系統的生理和心理進行分析和建模,模仿人類聽覺工作原理,以實現定位、跟蹤、分辨多運動聲源,其建模和算法複雜多樣,多用於仿生機器人等領域。2、基於到達時延的聲源定位。假定一個以定速在空氣中傳播的聲波,它到達位於不同位置的一對接收端的相位不同,根據這對接收端對同一聲音記錄的相位差別,通過時延算法求得各個接收端的時間差。3、基於聲壓幅度比的定位。聲音在空氣中傳播時會使空氣產生一定的壓強變化,通過放置具有聲壓檢測的接收器檢測聲壓幅度,對來自同一個聲源的聲音信號的聲壓幅度會有強弱差異。這裡使用聲壓幅度比的概念,每一個接收到聲源信息的接收端根據聲壓幅度比得到聲源距離接收端的距離。
[0007]廣義互相關函數法屬於基於到達時延的聲源定位方法,其基本原理是:接收到的兩組數位訊號經過傅立葉變換到頻域,求出他們的互功率譜,然後通過某種加權運算,傅立葉反變換到時域,即得到兩組信號的廣義互相關函數。互相關函數的極值所對應的時間就是兩組信號間的時間差。廣義互相關函數方法建立在非混響模型基礎上。由於基本模型帶來的誤差,它不能夠精確辨識多個聲源,也不能分辨帶有方向性的噪聲,只適用於對強信號的時延估計,所以廣義互相關函數方法不適用於有較大混響和有相關噪聲的場合。但在一般情況下,由於它的低複雜度和小計算量,易於實現,廣義互相關函數方法還是得到了廣泛的應用。
【發明內容】
[0008]為了克服廣義互相關函數法的缺點和利用其低複雜度和小計算量的優點,本發明公開了一種基於改進PHAT加權時延估計的聲源定位方法,該方法算法簡單,易於實現,能夠快速定位聲源。
[0009]本發明還公開了一種上述方法的實現系統。
[0010]本發明的技術方案為:
[0011]—種基於改進PHAT加權時延估計的聲源定位方法,具體包括以下步驟:
[0012](I)在三維直角坐標系下選擇(O, O, O),(a, O, O),(O, a, O),(O, O, a)4個位置擺放麥克風,得到麥克風陣列,所述a為固定參數,所述a表示分別位於坐標(a,O, O)、(O, a, O)、(O, O, a)位置的三個麥克風到位於原點坐標(0,0,0)位置的麥克風的距離;
[0013](2)步驟(I)所述麥克風陣列採集4路聲音信號,並對所述聲音信號進行放大處理,並對放大處理後的聲音信號實現直流墊高處理,輸出模擬信號;
[0014]所述的直流墊高處理是利用現有MIC與電壓放大抬高電路實現的,所述MIC與電壓放大抬高電路包括4路麥克風和兩級運算放大器,實現固定增益,並採用運算放大器反相相加電路,實現對所述聲音信號的直流墊高處理;
[0015](3)將步驟⑵輸出的模擬信號分別傳輸到中斷觸發電路和Α/D採樣電路;
[0016](4)所述中斷觸發電路檢測到傳輸至所述中斷觸發電路的模擬信號時,向所述算法處理和系統控制模塊發送中斷信息;所述Α/D採樣電路檢測到傳輸至所述Α/D採樣電路的模擬信號,將4路所述模擬信號轉換為4路數位訊號,並傳送至所述算法處理和系統控制模塊;
[0017]當步驟(2)所述模擬信號發送到所述中斷觸發電路,所述中斷觸發電路判斷所述模擬信號的電壓大小,超過閾值後產生中斷信號並發送至所述算法處理和系統控制模塊,所述閾值為0.3V。
[0018](5)所述算法處理和系統控制模塊默認休眠等待,所述算法處理和系統控制模塊接收到所述中斷信息,並獲取到步驟(4)所述4路數位訊號,所述算法處理和系統控制模塊先對所述4路數位訊號進行信號預處理,然後採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理,獲得時延估計值;
[0019]步驟(5)所述的信號預處理的實現方法為:在算法處理和系統控制模塊中,通過預加窗的方法,由Α/D採樣電路轉換得到的4路數位訊號通過帶通濾波器濾波,選擇需要接收的聲源所在頻域,所述聲源所在頻域依據聲源性質通過現有技術查詢得到,同時除去超出Α/D採樣電路頻率1/2以上的頻率分量,防止混疊幹擾;
[0020]步驟(5)所述的採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理的實現方法為:採用改進的PHAT加權廣義互相關函數法得到到達不同麥克風的時間差。
[0021](6)通過時延估計值,採用迭代法求出聲源位置。
[0022]所述步驟(6)所述的採用迭代法求出聲源位置的實現方法為:由時間差和麥克風坐標位置,採用迭代法求解非線性方程組,從而得到聲源位置。
[0023]根據本發明優選的,所述步驟(5)所述的採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理,具體包括步驟如下:
[0024]a、步驟⑷所述的4路數位訊號分別設定為X1Oi)、X2 (n)、X3 (η)、X4 (η),對步驟(4)所述的4路數位訊號依次進行加窗濾波處理及傅立葉變換,依次得到頻域信號X1 (k),X2 (k),X3 (k),X4 (k),所述n、k均為整數,代表所述數位訊號中的點的序號;
[0025]b、通過式1、式I1、式III採用改進的PHAT加權廣義互相關函數法分別計算步驟a得到的4路頻域信號中X1GO與X2 Gihx1 (k)與X3 GOJ1GO與x4(k)的加權互功率譜G12 (k)、G13 (k)、G14 (k):
【權利要求】
1.一種基於改進PHAT加權時延估計的聲源定位方法,其特徵在於,具體包括以下步驟: (1)在三維直角坐標系下選擇(O,O,O),(a,O, O), (O, a, O), (O,O,a) 4個位置擺放麥克風,得到麥克風陣列,所述a為固定參數,所述a表示分別位於坐標(a,0,0)、(O,a,O)、(O, O, a)位置的三個麥克風到位於原點坐標(O,O,O)位置的麥克風的距離; (2)步驟(1)所述麥克風陣列採集4路聲音信號,並對所述聲音信號進行放大處理,並對放大處理後的聲音信號實現直流墊高處理,輸出模擬信號; (3)將步驟(2)輸出的模擬信號分別傳輸到中斷觸發電路和Α/D採樣電路; (4)所述中斷觸發電路檢測到傳輸至所述中斷觸發電路的模擬信號時,向所述算法處理和系統控制模塊發送中斷信息;所述Α/D採樣電路檢測到傳輸至所述Α/D採樣電路的模擬信號,將4路所述模擬信號轉換為4路數位訊號,並傳送至所述算法處理和系統控制模塊; (5)所述算法處理和系統控制模塊默認休眠等待,所述算法處理和系統控制模塊接收到所述中斷信息,並獲取到步驟(4)所述4路數位訊號,所述算法處理和系統控制模塊先對所述4路數位訊號進行信號預處理,然後採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理,獲得時延估計值; (6)通過時延估計值,採用迭代法求出聲源位置。
2.根據權利要求1所述的一種基於改進PHAT加權時延估計的聲源定位方法,其特徵在於,所述步驟(5)所述的採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理,具體包括步驟如下: a、步驟⑷所述的4路數位訊號分別設定為X1(n)、X2 (n)、X3 (n)、X4 (η),對步驟(4)所述的4路數位訊號依次進行加窗濾波處理及傅立葉變換,依次得到頻域信號X1 (k),X2 (k),X3 (k),X4(k),所述n、k均為整數,代表所述數位訊號中的點的序號; b、通過式1、式I1、式III採用改進的PHAT加權廣義互相關函數法分別計算步驟a得到的4路頻域信號中X1 (k)與X2 (k)、X1 (k)與X3 (k)、X1 (k)與X4 (k)的加權互功率譜G12 (k)、G13 (k)、G14 (k):
式1、式I1、式III中,X&I:)為X1GO的共軛;對於語音聲源,N為常數,N的取值範圍為0.7-.0.8 ; C、對步驟b所述G12GO、G13(k)、G14(k)分別進行傅立葉逆變換運算,得到廣義互相關函數 R12 (η)、R13 (η)、R14 (η); d、分別取得所述R12(η)、R13 (η)、R14 (η)的最大值時對應的η值即nl、n2、n3,當nl >M/2 時,取 nl = M+l-nl,當 n2 > M/2 時,取 n2 = M+l_n2,當 n3 > M/2,取 n3 = M+l_n3,所述M為傅立葉變換運算點數; e、步驟d最終得到的所述nl、n2、n3分別與採樣周期t相乘得到三路時延值tpt2、t3。
3.根據權利要求2所述的一種基於改進PHAT加權時延估計的聲源定位方法,其特徵在於,所述採用迭代法求出聲源位置,具體步驟包括: 設定聲源坐標為U,y, z),利用迭代公式,通過聲源與所述麥克風之間的距離利用現有技術預設x、y、z的初始值Xci, Y0, Zci,利用如下公式,進行迭代運算:
式IV中,其中t2, t3為三路時延值t2、t3,即h為聲音傳播到位於坐標原點(O, O, O)位置的麥克風與位於坐標(a,O, O)的位置的麥克風的時間差;t2為聲音傳播到位於坐標原點(0,0,0)位置的麥克風與位於坐標(0,a, O)的位置的麥克風的時間差;t3為聲音傳播到位於坐標原點(0,O, O)位置的麥克風與位於坐標(0,O, a)的位置的麥克風的時間差;sqrn = xn2+yn2+zn2, alfn = sqrn+a2, betan =小Cjrii,v 為聲音在空氣中的速度;
當 |xn+1_xn| ≤ 0.001 且 |yn+1_yn| ≤ 0.001 且 |zn+1-zn| ≤ 0.001 時,迭代停止,從而解出方程,得到的值xn+1、yn+1、zn+1即為聲源坐標(X,y, z)中的X、y、z,即x = xn+1, y = yn+1, z=Zn+1,得到聲源坐標(xn+1, yn+1, zn+1),求出聲源位置。
4.一種實現權利要求1-3任一所述的一種基於改進PHAT加權時延估計的聲源定位方法的系統,其特徵在於,包括四路MIC與電壓放大抬高電路、中斷觸發電路、Α/D模數轉換模塊、算法處理和系統控制模塊及顯示模塊,所述四路MIC與電壓放大抬高電路分別與所述中斷觸發電路、所述Α/D模數轉換模塊連接,所述中斷觸發電路、所述Α/D模數轉換模塊分別連接所述算法處理和系統控制模塊,所述算法處理和系統控制模塊連接所述顯示模塊。
5.根據權利要求4所述的系統,其特徵在於,所述MIC與電壓放大抬高電路由4路麥克風和兩級運算放大器組成,通過所述兩級運算放大器放大和直流墊高,輸出0-3.3V的模擬信號,並將所述模擬信號分別發送至中斷觸發電路和Α/D模數轉換模塊;所述中斷觸發電路判斷所述模擬信號的電壓大小,超過閾值後將發送中斷信號到所述算法處理和系統控制模塊;所述Α/D模數轉換模塊將所述模擬信號轉換為數位訊號,並傳送至所述算法處理和系統控制模塊;所述算法處理和系統控制模塊先對所述數位訊號進行信號預處理,然後採用改進的PHAT加權廣義互相關函數法進行時延估計算法處理,獲得時延估計值,通過時延估計值,採用迭代法求出聲源位置;所述顯示模塊用於顯示聲源位置。
6.根據權利要求4所述的系統,其特徵在於,所述算法處理和系統控制模塊為STM32開發平臺。
7.根據權利要求5所述的系統,其特徵在於,所述算法處理和系統控制模塊為STM32開發平臺。
【文檔編號】G01S5/22GK104181506SQ201410424948
【公開日】2014年12月3日 申請日期:2014年8月26日 優先權日:2014年8月26日
【發明者】王永, 倪暹, 王照君, 王雪峰 申請人:山東大學