新四季網

快速信道補償的聲紋認證系統及方法

2023-08-06 15:01:11 1

專利名稱:快速信道補償的聲紋認證系統及方法
技術領域:
本發明涉及一種聲紋認證系統,尤其涉及一種快速信道補償的聲紋認證系統;此 外,本發明還涉及一種快速信道補償的聲紋認證方法。
背景技術:
聲紋識別(Voic^print recognition), 又稱為說話人識別 (SpeakerRecognition),是一項根據語音波形中反映說話人生理、心理和行為特徵的語音 參數,自動識別說話人身份的技術。由於先天聲道結構的差異以及後天養成的發音習慣的 不同,導致每個人的聲音都具有獨特性,根據這一獨特性,可以準確的對人的身份加以區 分。在聲紋認證(或聲紋識別)系統中,訓練語音和測試語音的失配是制約當前系統 性能提高的主要因素。語音的失配來源於多種情況不同的傳輸通道,錄音設備和環境噪聲 的影響以及說話人生理情緒的變化的影響。在基於統計的GMM-UBM模型結構的系統中,由 於失配的影響,訓練語音得到的統計模型不能很好的描述測試情況下語音的參數分布,造 成了系統性能的急劇下降。目前為解決聲紋認證系統中上述失配問題,有特徵映射(FeatureMapping)等參 數級補償方法。特徵映射需要已知通道標記的語音訓練通道分類器及通道映射規則,利用 分類器的判決結果進行通道補償。在通道種類比較少和簡單情況下,此方法能夠取得一定 的效果。在複雜環境中,基於因子分析(factor analysis)的失配補償方法取得了很好的 效果,該方法分別估計訓練語音和測試語音的失配信息因子,根據失配信息因子消除訓練 語音和測試語音間的失配。不需要通道分類器判斷語音的通道類別,實現對語音失配的連 續綜合的補償。因子分析方法在NIST 『06資料庫上的結果,錯誤率降低約57%,由此可見 因子分析方法對提高聲紋認證系統在信道失配方面有著很好的效果。但基於因子分析方法的失配補償需要估計每幀語音參數對UBM的所有混合度的 EM統計量,和特徵映射方法相比,計算量太大,訓練和測試時間很長,限制了其在實際中的 應用。表1為基線系統和採用因子分析的聲紋認證系統的結果對比,採用因子分析的系統 很好的解決了訓練與測試環境及信道的失配,其等誤識率由8. 94%降為3. 76%,但是平均 所需的時間由1. 26秒增加為9. 53秒,這樣就限制了因子分析在實際應用領域的應用。表 1
所需時間(秒)EER (% )基線系統1. 268. 94因子分析9. 533. 7
發明內容
本發明要解決的技術問題在於提供了一種快速信道補償的聲紋認證系統,該系統 在實現失配補償的同時,計算量有明顯降低,從而能顯著提高訓練速度。為此,本發明還提 供快速信道補償的聲紋認證方法。本發明為解決上述技術問題提供的技術方案是一種快速信道補償的聲紋認證系 統,該聲紋認證系統包括高斯選擇器、選擇UBM混合度模塊、話者因子或通道因子模塊、UBM 模型和話者模型;所述高斯選擇器用於對UBM模型的各個高斯分量進行分類;所述選擇UBM 混合度模塊用於利用高斯選擇器為訓練數據的每幀觀察矢量選擇距離較近的混合度計算 零階或一階統計量;所述話者因子或通道因子模塊用於根據上述零階或一階統計量來估計 話者因子或通道因子,根據該話者因子或通道因子來建立話者模型。此外,本發明還提供一種快速信道補償的聲紋認證方法,包括如下步驟1)構建高斯選擇器,該高斯選擇器對UBM模型的各個高斯分量進行分類;2)經高斯選擇器分類的高斯分量和訓練數據的每幀觀察矢量計算後驗概率,選擇 其中後驗概率最大的若干組高斯分量;3)計算當前的觀察矢量和UBM模型中屬於選擇出的這若干組高斯分量的後驗概 率,其餘的高斯分量的後驗概率直接為零;4)根據步驟幻計算出零階或一階統計量來估計話者因子或通道因子;5)根據該話者因子或通道因子來建立話者模型。與現有技術相比,本發明的有益效果如下1.本發明採取基於因子分析的連續失配補償方法,更符合實際的失配情況,失配 補償後的系統性能提高也更加明顯。2.本發明提出了基於高斯選擇器的快速失配補償算法,為每幀觀察矢量選擇對應 的高斯分量計算EM統計量,降低因子分析算法的複雜度,訓練和測試速度有數倍提高。3.為了在保證快速失配補償算法提高訓練和測試速度的同時,更有效的提高失配 補償後的系統性能,本發明提出了基於Top-N策略的混合度選擇方案,提高了高斯選擇器 篩選UBM高斯分量和快速失配補償算法的補償精度,進一步提高失配補償後的系統性能。


下面結合附圖與具體實施方式
對本發明作進一步詳細的說明圖1是本發明中一幀語音矢量對UBM所有混合度的後驗概率示意圖;圖2是本發明的快速信道補償的聲紋認證系統的結構框圖。
具體實施例方式本發明提出將因子分析與高斯選擇(Gaussian selection)方法相結合的失配補 償方法,對於每幀矢量利用高斯選擇器對UBM的混合度進行選擇,只計算對EM(零階或一 階)統計量貢獻較大的混合度,降低計算EM統計量的計算量。在實現失配補償的同時,計 算量有明顯降低,訓練速度提高到原來的10倍,而性能幾乎沒有明顯下降。圖1所示的是一幀語音觀察矢量Ot對UBM所有混合度的後驗概率輸出γ (Ot)0 由圖1可以看出,語音矢量只對和其在空間中分布比較近的高斯分量的後驗概率輸出比較大,相距比較遠的混合度的後驗概率都是接近於零的很小值。而且只有那些後驗概率較大 的混合度才對EM統計量有貢獻,而且這些混合度的個數遠小於UBM混合度的總個數。因 此,如果只計算這些後驗概率較大的混合度,可以顯著降低因子分析方法中EM統計量的計 算量。但是,每幀語音矢量對應的後驗概率較大的混合度是不同的。圖2是基於高斯選擇 和因子分析方法的目標話者模型訓練框圖,虛線框所示的是利用高斯選擇器為每幀語音矢 量快速選擇距離較近的混合度計算EM統計量。如圖2所示,本發明的快速信道補償的聲紋 認證系統,包括高斯選擇器、選擇UBM混合度模塊、話者因子或通道因子模塊、UBM模型和話 者模型;所述高斯選擇器用於對UBM模型的各個高斯分量進行分類;所述選擇UBM混合度 模塊用於利用高斯選擇器為訓練數據的每幀觀察矢量選擇距離較近的混合度計算零階或 一階統計量;所述話者因子或通道因子模塊用於根據上述零階或一階統計量來估計話者因 子或通道因子,根據該話者因子或通道因子來建立話者模型,以實現話者的聲紋認證。通道因子是利用很多人在不同信道下的語音數據訓練得到的一個因子矩陣,該矩 陣對不同信道的特點進行了細緻的描述,在訓練及測試時,利用該矩陣可以對經不同信道 傳輸的語音信號進行有效補償,以減少由於不同信道之間的差異而導致系統識別性能的下 降。而話者因子則是利用很多人的不同次發音訓練得到的一個因子矩陣,該矩陣對說 話人(話者)發音的時變性進行了細緻的描述,在訓練及測試時,利用該矩陣可以對由於說 話人不同次發音特點的變化而導致識別系統性能的下降。本發明快速失配補償的算法流程如下1)對UBM模型的各個高斯分量按照相似度進行聚類,構造高斯選擇器。本發明通 過對UBM高斯分量的聚類,將相似的一組高斯分量合併成高斯選擇器的一個高斯分量。2)對於訓練和測試語音的每幀觀察矢量,首先和經高斯選擇器分類的高斯分量計 算後驗概率,選擇其中後驗概率最大的若干組高斯分量,即採用Top-N策略從所有高斯分 量中選擇出N個貢獻最大的高斯分量。3)計算當前的觀察矢量和UBM模型中屬於選擇出的這若干組高斯分量的後驗概 率,其餘的高斯分量的後驗概率直接為零。通過高斯選擇器的選擇,每一幀語音矢量只需要計算K+隊次後驗概率,計算量遠 小於因子分析方法中和所有高斯分量都計算後驗概率的計算量。以UBM的混合度為512,分 成16類為例,假設UBM各個混合度平均的分布到各個類中,則CUBM的計算量為16+512/16 =48次,降低為原來方法的1/10左右。表2為基線系統、因子分析和快速信道補償的聲紋 認證系統的結果對比。表權利要求
1.一種快速信道補償的聲紋認證系統,其特徵在於,該聲紋認證系統包括高斯選擇器、 選擇UBM混合度模塊、話者因子或通道因子模塊、UBM模型和話者模型;所述高斯選擇器用 於對UBM模型的各個高斯分量進行分類;所述選擇UBM混合度模塊用於利用高斯選擇器為 訓練數據的每幀觀察矢量選擇距離較近的混合度計算零階或一階統計量;所述話者因子或 通道因子模塊用於根據上述零階或一階統計量來估計話者因子或通道因子,根據該話者因 子或通道因子來建立話者模型。
2.如權利要求1所述的快速信道補償的聲紋認證系統,其特徵在於,所述話者因子是 利用很多人的不同次發音訓練得到的一個因子矩陣;所述通道因子是利用很多人在不同信 道下的語音數據訓練得到的一個因子矩陣。
3.如權利要求1所述的快速信道補償的聲紋認證系統,其特徵在於,所述高斯選擇器 對UBM模型的各個高斯分量按照相似度進行分類,通過對UBM模型的各個高斯分量的分類, 將相似的一組高斯分量合併成高斯選擇器的一個高斯分量。
4.如權利要求1所述的快速信道補償的聲紋認證系統,其特徵在於,所述選擇UBM混合 度模塊的具體處理方法如下首先,計算訓練數據的每幀觀察矢量和經高斯選擇器分類的 高斯分量的後驗概率,選擇其中後驗概率最大的若干組高斯分量;然後,計算當前的觀察矢 量和選擇出的這若干組高斯分量的後驗概率,其餘的高斯分量的後驗概率直接為零。
5.一種快速信道補償的聲紋認證方法,其特徵在於,包括如下步驟1)構建高斯選擇器,該高斯選擇器對UBM模型的各個高斯分量進行分類;2)經高斯選擇器分類的高斯分量和訓練數據的每幀觀察矢量計算後驗概率,選擇其中 後驗概率最大的若干組高斯分量;3)計算當前的觀察矢量和UBM模型中屬於選擇出的這若干組高斯分量的後驗概率,其 餘的高斯分量的後驗概率直接為零;4)根據步驟幻計算出零階或一階統計量來估計話者因子或通道因子;5)根據該話者因子或通道因子來建立話者模型。
6.如權利要求5所述的快速信道補償的聲紋認證方法,其特徵在於,步驟1)中,所述高 斯選擇器對UBM模型的各個高斯分量進行分類,通過對UBM模型的各個高斯分量的分類,將 相似的一組高斯分量合併成高斯選擇器的一個高斯分量。
全文摘要
本發明公開了一種快速信道補償的聲紋認證系統,包括高斯選擇器、選擇UBM混合度模塊、話者因子或通道因子模塊、UBM模型和話者模型;所述高斯選擇器用於對UBM模型的各個高斯分量進行分類;所述選擇UBM混合度模塊用於利用高斯選擇器為訓練數據的每幀觀察矢量選擇距離較近的混合度計算零階或一階統計量;所述話者因子或通道因子模塊用於根據上述零階或一階統計量來估計話者因子或通道因子,根據該話者因子或通道因子來建立話者模型。此外,本發明還公開了一種快速信道補償的聲紋認證方法。本發明在實現失配補償的同時,計算量有明顯降低,從而能顯著提高訓練速度。
文檔編號G10L15/10GK102129859SQ201010027299
公開日2011年7月20日 申請日期2010年1月18日 優先權日2010年1月18日
發明者黃偉 申請人:盛樂信息技術(上海)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀