新四季網

一種七元麥克風陣列的聲源定位方法

2023-09-20 08:14:30 1

一種七元麥克風陣列的聲源定位方法
【專利摘要】本發明公開了一種七元麥克風陣列的聲源定位方法,該方法建立了七元麥克風陣列模型與室內聲場模型;利用該麥克風陣列接收室內聲源語音信號,對接收的語音信號進行採集、濾波、加窗、譜減、倒譜處理;再利用相位變換加權廣義互相關方法GCC-PHAT,得各麥克風之間的時間延遲;運用三維空間定位方法與坐標旋轉數字式計算機方法,確定聲源位置。本發明在混響、噪聲等幹擾信號存在的室內環境下,能準確確定聲源位置,實時性強、準確性高,在語音信號處理領域有廣泛的應用。
【專利說明】—種七元麥克風陣列的聲源定位方法

【技術領域】
[0001]本發明涉及聲源定位領域,特別是一種七元麥克風陣列的聲源定位方法。

【背景技術】
[0002]聲源定位技術是陣列信號處理的重要技術之一。目前在聲吶探測、視頻電話會議、人工智慧、語音追蹤與識別、監控系統等多個領域有著廣泛的應用。利用麥克風陣列對聲源方位進行計算是聲源定位的基本方法,它是將一組麥克風傳感器按一定方式布置在空間不同位置上,形成麥克風陣列;利用麥克風陣列接收空間聲源信號,再對陣列接收的信號進行處理,提取信號的有用特徵,再通過一定計算方法得到聲源的方位信息。
[0003]目前常用的聲源定位方法主要有三類:基於可控波束形成器的聲源定位法,主要是將各陣元採集到的信號加權求和,通過調控權值(權值取決於陣元信號的相位延遲,主要利用波達方向(DOA)(見文獻:Despoina Pavlidi, Anthony Griffin, MatthieuPuigtjAthanas1s Mouchtaris.Real-time multiple sound source localizat1nand counting using a circular microphone array [J].1EEE Transact1ns onAud1, Speech, and Language Processing, 2013,21 (10): 2193-2206.))等方法進行調控),使陣列輸出信號功率最大,從而進行聲源定位;基於高解析度譜估計的聲源定位法,主要利用最小方差估計法、子空間法(如MUSIC法(見文獻:Junli Liang, Ding Liu.Passivelocalizat1n of mixed near-field and far-field sources using two-stage MUSICalgorithm[J].1EEE Transact1ns on Signal Processing,2010,58(I):108-120.)、ESPRIT 法(見文獻:HaohaiSun, Heinz Teutsch, Edwin Mabande, Walter Ke Hermann.Roubst localizat1n of multiple sources in reverberant environments usingEB-ESPRIT with spherical microphone arrays[C].1EEE Internat1nal Conference onAcoustics Speech and Signal Processing (ICASSP), Prague, 2011:117-120.))等進行聲源定位;基於到達時間差(TDOA)的聲源定位法,主要結合自適應、廣義互相關(GCC)等進行聲源定位。利用多個麥克風構成一定形狀的陣列,可在二維平面、三維立體空間中獲得更為準確的聲源目標方位。
[0004]現有定位技術中,主要是利用一維線性陣列、二維十字四麥克風陣列進行聲源定位,與三維的陣列相比,這些陣列不能同時採集多個方向上的聲源信號,難以精確定位。另夕卜,現有定位技術中,僅考慮了環境噪聲對定位精度的影響,而沒有考慮混響的影響。因此,在噪聲與混響同時幹擾下,現有的聲源定位方法是不能準確地進行聲源定位的。
[0005]如何解決現有技術的不足已成為聲源定位領域亟待解決的一大難題。


【發明內容】

[0006]本發明所要解決的技術問題是為了克服現有技術的不足,而提供一種七元麥克風陣列的聲源定位方法。本發明方法在三維空間中實時、有效地解決了聲源定位問題,在一定程度上降低了噪聲、混響等信號對語音信號的幹擾,提高了定位的精度與穩定性。
[0007]本發明為解決上述技術問題採用以下技術方案:
[0008]根據本發明提出的一種七元麥克風陣列的聲源定位方法,包括如下步驟:
[0009]步驟一、在三維坐標系中,建立麥克風陣列模型,確定各麥克風在三維空間的位置;
[0010]步驟二、對各麥克風接收到聲源發出的語音信號s (t)進行採樣,得到離散信號s (k), t表示時間,k表示時間序列;
[0011]步驟三、對步驟二所述的離散信號s (k)進行濾波、加窗、譜減、倒譜處理,得到純語音時域信號X(k);具體如下:
[0012](301)、將離散信號s(k)通過帶通濾波器進行帶通濾波後,得到帶通信號;
[0013](302)、對(301)中所得帶通信號用窗函數進行加窗處理,得到加窗信號sw(k);
[0014](303)、對(302)所得加窗信號sw(k)用譜減法進行去噪處理,得到譜減信號Xw(f),對Xw(f)作傅立葉反變換得到去噪時域信號xw(k);
[0015](304)、對去噪時域信號Xw(k)由倒譜法進行消除混響處理,得到純語音時域信號x(k);
[0016]步驟四、對步驟三中的純語音時域信號x(k),利用相位變換加權廣義互相關方法GCC-PHAT計算第i個麥克風接收的經步驟三處理所得純語音時域信號Xi (k)與三維坐標原點處第O個麥克風接收的經步驟三處理所得純語音時域信號X(l(k)間的時延值Ti,I≤i≤6且i為自然數,則互相關函數為
[0017]

【權利要求】
1.一種七元麥克風陣列的聲源定位方法,其特徵在於,包括如下步驟: 步驟一、在三維坐標系中,建立麥克風陣列模型,確定各麥克風在三維空間的位置; 步驟二、對各麥克風接收到聲源發出的語音信號S (t)進行採樣,得到離散信號s (k),t表示時間,k表示時間序列; 步驟三、對步驟二所述的離散信號s (k)進行濾波、加窗、譜減、倒譜處理,得到純語音時域信號x(k);具體如下: (301)、將離散信號s(k)通過帶通濾波器進行帶通濾波後,得到帶通信號; (302)、對(301)中所得帶通信號用窗函數進行加窗處理,得到加窗信號Sw(k); (303)、對(302)所得加窗信號Sw(k)用譜減法進行去噪處理,得到譜減信號Xw(f),對Xw(f)作傅立葉反變換得到去噪時域信號Xw(k); (304)、對去噪時域信號Xw(k)由倒譜法進行消除混響處理,得到純語音時域信號x(k); 步驟四、對步驟三中的純語音時域信號x(k),利用相位變換加權廣義互相關方法GCC-PHAT計算第i個麥克風接收的經步驟三處理所得純語音時域信號XiGO與三維坐標原點處第O個麥克風接收的經步驟三處理所得純語音時域信號X(l(k)間的時延值Ti,I≤i≤6且i為自然數,則互相關函數為
式中,f表示頻率,e表示自然指數,X0 (f)表示純語音時域信號XtlOO的傅立葉變換,Xi* (f)表示純語音時域信號Xi (k)傅立葉變換的共軛,J = ^A, j為虛數單位,ΨP1iat (f)為加權函數,且
式中,U/)為相關函數的功率譜,且

表示 X。(k)與 Xi (k)的互相關函數,則 =argmaxOi),其中
表示使〃=(5)取得最大值時η =Ti,即為第O個麥克風與第i個麥克風所接收到信號的時延估計值; 步驟五、利用三維空間定位方法,結合步驟四中的《,得聲源到三維坐標原點的距離r:
式中,C表示聲速,L表示第i個麥克風位置Mi與三維坐標原點處第O個麥克風位置Mtl間的距離; 步驟六、利用坐標旋轉數字式計算機方法,結合步驟四得到的<,得聲源的俯仰角Θ、方位角1P為
步驟七、根據直角坐標與球面坐標間的關係,得聲源位置的直角坐標為.V = rsin cos ^
2.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(302)中窗函數釆用漢明窗函數w(k),即
式中,N表示時間序列的取值範圍,且N為大於零的正整數。
3.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(303)中譜減法的公式為
式中,Sw(f)為加窗信號Sw(k)的傅立葉變換,Nw(f)為加窗信號sw(k)中噪聲信號nw(k)的傅立葉變換。
4.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(304)中倒譜法處理過程為: (a)、對去噪時域信號Xw(k)進行分幀處理,得到分幀信號; (b)、對分幀信號用窗函數進行預加窗處理,得到預加窗信號Xww(k); (c)、對預加窗信號XwwGO計算每幀的復倒譜信號Xc;(k),所述復倒譜計算公式為 xc(k) = IFFT{ln[FFT[X胃(k)]]}; 式中,FFT表示傅立葉變換,IFFT表示傅立葉反變換,In表示自然對數; (d)、對復倒譜信號Xc;(k),利用復倒譜域低通濾波器進行濾波,得到濾波信號; (e)、對濾波信號,在時域條件下將每幀信號疊接相加,得到純語音時域信號x(k)。
5.根據權利要求1所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(301)中帶通濾波器的上截止頻率為fH = 3500Hz,下截止頻率為& = 250Hz。
6.根據權利要求4所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(a)中分幀信號的幀長為512點,幀移為128點。
7.根據權利要求4所述的一種七元麥克風陣列的聲源定位方法,其特徵在於,所述(d)中復倒譜域低通濾波器由通帶、過渡帶、阻帶三部分組成,其中通帶的最高截止點P = 4,過渡帶的帶寬h為64。
【文檔編號】G01S5/22GK104076331SQ201410273464
【公開日】2014年10月1日 申請日期:2014年6月18日 優先權日:2014年6月18日
【發明者】郭業才, 宋宮琨琨, 張寧, 胡昭華, 黃友銳 申請人:南京信息工程大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀