一種七元麥克風陣列的聲源定位方法
2023-09-20 08:14:30 1
一種七元麥克風陣列的聲源定位方法
【專利摘要】本發明公開了一種七元麥克風陣列的聲源定位方法,該方法建立了七元麥克風陣列模型與室內聲場模型;利用該麥克風陣列接收室內聲源語音信號,對接收的語音信號進行採集、濾波、加窗、譜減、倒譜處理;再利用相位變換加權廣義互相關方法GCC-PHAT,得各麥克風之間的時間延遲;運用三維空間定位方法與坐標旋轉數字式計算機方法,確定聲源位置。本發明在混響、噪聲等幹擾信號存在的室內環境下,能準確確定聲源位置,實時性強、準確性高,在語音信號處理領域有廣泛的應用。
【專利說明】—種七元麥克風陣列的聲源定位方法
【技術領域】
[0001]本發明涉及聲源定位領域,特別是一種七元麥克風陣列的聲源定位方法。
【背景技術】
[0002]聲源定位技術是陣列信號處理的重要技術之一。目前在聲吶探測、視頻電話會議、人工智慧、語音追蹤與識別、監控系統等多個領域有著廣泛的應用。利用麥克風陣列對聲源方位進行計算是聲源定位的基本方法,它是將一組麥克風傳感器按一定方式布置在空間不同位置上,形成麥克風陣列;利用麥克風陣列接收空間聲源信號,再對陣列接收的信號進行處理,提取信號的有用特徵,再通過一定計算方法得到聲源的方位信息。
[0003]目前常用的聲源定位方法主要有三類:基於可控波束形成器的聲源定位法,主要是將各陣元採集到的信號加權求和,通過調控權值(權值取決於陣元信號的相位延遲,主要利用波達方向(DOA)(見文獻:Despoina Pavlidi, Anthony Griffin, MatthieuPuigtjAthanas1s Mouchtaris.Real-time multiple sound source localizat1nand counting using a circular microphone array [J].1EEE Transact1ns onAud1, Speech, and Language Processing, 2013,21 (10): 2193-2206.))等方法進行調控),使陣列輸出信號功率最大,從而進行聲源定位;基於高解析度譜估計的聲源定位法,主要利用最小方差估計法、子空間法(如MUSIC法(見文獻:Junli Liang, Ding Liu.Passivelocalizat1n of mixed near-field and far-field sources using two-stage MUSICalgorithm[J].1EEE Transact1ns on Signal Processing,2010,58(I):108-120.)、ESPRIT 法(見文獻:HaohaiSun, Heinz Teutsch, Edwin Mabande, Walter Ke Hermann.Roubst localizat1n of multiple sources in reverberant environments usingEB-ESPRIT with spherical microphone arrays[C].1EEE Internat1nal Conference onAcoustics Speech and Signal Processing (ICASSP), Prague, 2011:117-120.))等進行聲源定位;基於到達時間差(TDOA)的聲源定位法,主要結合自適應、廣義互相關(GCC)等進行聲源定位。利用多個麥克風構成一定形狀的陣列,可在二維平面、三維立體空間中獲得更為準確的聲源目標方位。
[0004]現有定位技術中,主要是利用一維線性陣列、二維十字四麥克風陣列進行聲源定位,與三維的陣列相比,這些陣列不能同時採集多個方向上的聲源信號,難以精確定位。另夕卜,現有定位技術中,僅考慮了環境噪聲對定位精度的影響,而沒有考慮混響的影響。因此,在噪聲與混響同時幹擾下,現有的聲源定位方法是不能準確地進行聲源定位的。
[0005]如何解決現有技術的不足已成為聲源定位領域亟待解決的一大難題。
【發明內容】
[0006]本發明所要解決的技術問題是為了克服現有技術的不足,而提供一種七元麥克風陣列的聲源定位方法。本發明方法在三維空間中實時、有效地解決了聲源定位問題,在一定程度上降低了噪聲、混響等信號對語音信號的幹擾,提高了定位的精度與穩定性。
[0007]本發明為解決上述技術問題採用以下技術方案:
[0008]根據本發明提出的一種七元麥克風陣列的聲源定位方法,包括如下步驟:
[0009]步驟一、在三維坐標系中,建立麥克風陣列模型,確定各麥克風在三維空間的位置;
[0010]步驟二、對各麥克風接收到聲源發出的語音信號s (t)進行採樣,得到離散信號s (k), t表示時間,k表示時間序列;
[0011]步驟三、對步驟二所述的離散信號s (k)進行濾波、加窗、譜減、倒譜處理,得到純語音時域信號X(k);具體如下:
[0012](301)、將離散信號s(k)通過帶通濾波器進行帶通濾波後,得到帶通信號;
[0013](302)、對(301)中所得帶通信號用窗函數進行加窗處理,得到加窗信號sw(k);
[0014](303)、對(302)所得加窗信號sw(k)用譜減法進行去噪處理,得到譜減信號Xw(f),對Xw(f)作傅立葉反變換得到去噪時域信號xw(k);
[0015](304)、對去噪時域信號Xw(k)由倒譜法進行消除混響處理,得到純語音時域信號x(k);
[0016]步驟四、對步驟三中的純語音時域信號x(k),利用相位變換加權廣義互相關方法GCC-PHAT計算第i個麥克風接收的經步驟三處理所得純語音時域信號Xi (k)與三維坐標原點處第O個麥克風接收的經步驟三處理所得純語音時域信號X(l(k)間的時延值Ti,I≤i≤6且i為自然數,則互相關函數為
[0017]
【權利要求】
1.一種七元麥克風陣列的聲源定位方法,其特徵在於,包括如下步驟: 步驟一、在三維坐標系中,建立麥克風陣列模型,確定各麥克風在三維空間的位置; 步驟二、對各麥克風接收到聲源發出的語音信號S (t)進行採樣,得到離散信號s (k),t表示時間,k表示時間序列; 步驟三、對步驟二所述的離散信號s (k)進行濾波、加窗、譜減、倒譜處理,得到純語音時域信號x(k);具體如下: (301)、將離散信號s(k)通過帶通濾波器進行帶通濾波後,得到帶通信號; (302)、對(301)中所得帶通信號用窗函數進行加窗處理,得到加窗信號Sw(k); (303)、對(302)所得加窗信號Sw(k)用譜減法進行去噪處理,得到譜減信號Xw(f),對Xw(f)作傅立葉反變換得到去噪時域信號Xw(k); (304)、對去噪時域信號Xw(k)由倒譜法進行消除混響處理,得到純語音時域信號x(k); 步驟四、對步驟三中的純語音時域信號x(k),利用相位變換加權廣義互相關方法GCC-PHAT計算第i個麥克風接收的經步驟三處理所得純語音時域信號XiGO與三維坐標原點處第O個麥克風接收的經步驟三處理所得純語音時域信號X(l(k)間的時延值Ti,I≤i≤6且i為自然數,則互相關函數為
式中,f表示頻率,e表示自然指數,X0 (f)表示純語音時域信號XtlOO的傅立葉變換,Xi* (f)表示純語音時域信號Xi (k)傅立葉變換的共軛,J = ^A, j為虛數單位,ΨP1iat (f)為加權函數,且
式中,U/)為相關函數的功率譜,且
式
表示 X。(k)與 Xi (k)的互相關函數,則 =argmaxOi),其中
表示使〃=(5)取得最大值時η =Ti,即為第O個麥克風與第i個麥克風所接收到信號的時延估計值; 步驟五、利用三維空間定位方法,結合步驟四中的《,得聲源到三維坐標原點的距離r:
式中,C表示聲速,L表示第i個麥克風位置Mi與三維坐標原點處第O個麥克風位置Mtl間的距離; 步驟六、利用坐標旋轉數字式計算機方法,結合步驟四得到的<,得聲源的俯仰角Θ、方位角1P為
步驟七、根據直角坐標與球面坐標間的關係,得聲源位置的直角坐標為.V = rsin cos ^
2.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(302)中窗函數釆用漢明窗函數w(k),即
式中,N表示時間序列的取值範圍,且N為大於零的正整數。
3.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(303)中譜減法的公式為
式中,Sw(f)為加窗信號Sw(k)的傅立葉變換,Nw(f)為加窗信號sw(k)中噪聲信號nw(k)的傅立葉變換。
4.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(304)中倒譜法處理過程為: (a)、對去噪時域信號Xw(k)進行分幀處理,得到分幀信號; (b)、對分幀信號用窗函數進行預加窗處理,得到預加窗信號Xww(k); (c)、對預加窗信號XwwGO計算每幀的復倒譜信號Xc;(k),所述復倒譜計算公式為 xc(k) = IFFT{ln[FFT[X胃(k)]]}; 式中,FFT表示傅立葉變換,IFFT表示傅立葉反變換,In表示自然對數; (d)、對復倒譜信號Xc;(k),利用復倒譜域低通濾波器進行濾波,得到濾波信號; (e)、對濾波信號,在時域條件下將每幀信號疊接相加,得到純語音時域信號x(k)。
5.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(301)中帶通濾波器的上截止頻率為fH = 3500Hz,下截止頻率為& = 250Hz。
6.根據權利要求4所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(a)中分幀信號的幀長為512點,幀移為128點。
7.根據權利要求4所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(d)中復倒譜域低通濾波器由通帶、過渡帶、阻帶三部分組成,其中通帶的最高截止點P = 4,過渡帶的帶寬h為64。
【文檔編號】G01S5/22GK104076331SQ201410273464
【公開日】2014年10月1日 申請日期:2014年6月18日 優先權日:2014年6月18日
【發明者】郭業才, 宋宮琨琨, 張寧, 胡昭華, 黃友銳 申請人:南京信息工程大學