新四季網

一種語音識別測試系統和方法與流程

2023-12-08 22:58:01 4


本發明屬於語音識別領域,具體地涉及一種語音識別測試系統和方法。



背景技術:

語音交互是目前ai近年來發展速度較快的一種,它脫離常規的人與機器界面交互的方式,語音智能的產品在國內外不斷的升溫,佔據了市場上不小的份額,而語音識別測試繁冗而複雜,涉及各方面的因素較多,特別是針對前期麥克風拾音方位、喚醒,回音消噪、背景消噪聲紋識別等評估。然而現有的語音識別測試系統功能都較單一,要完成整個語音識別測試則需要用到許多測試系統,使得整個測試流程複雜繁瑣,操作麻煩,測試效率低,且測試不夠系統全面,測試準確率較低。



技術實現要素:

本發明目的在於為解決上述問題而提供一種系統集成度高,使整個測試流程操作簡便,測試效率高,測試系統全面,提高測試準確率的語音識別測試系統和方法。

為此,本發明公開了一種語音識別測試系統,包括主控制模塊、實時信號測試模塊、錄音質量測試模塊、標準環境下語音測試模塊和常規情景下語音測試模塊,所述實時信號測試模塊、錄音質量測試模塊、標準環境下語音測試模塊和常規情景下語音測試模塊分別與主控制模塊連接,所述實時信號測試模塊用於測試拾取信號的質量完整性及電性能參數,所述錄音質量測試模塊用於測試錄音信號質量的電性能參,所述標準環境下語音測試模塊用於測試標準環境下語音識別率,所述常規情景下語音測試模塊用於測試常規使用環境下語音識別率。

進一步的,所述實時信號測試模塊包括標準信號源播放模塊、麥克風、信號採集處理模塊、主控制模塊和信號分析儀,所述標準信號源播放模塊設置在消音室內,用於播放標準信號聲源,所述麥克風採集標準信號源,並將採集到的信號傳輸給信號採集處理模塊,信號採集處理模塊對信號進行處理後傳輸給主控制模塊,主控制模塊對信號進行處理後傳輸給信號分析儀,信號分析儀對信號的電性能進行數據分析。

更進一步的,所述信號採集處理模塊通過有線或無線與主控制模塊通信連接。

進一步的,所述錄音質量測試模塊包括標準信號源/聲源播放模塊、麥克風、信號採集處理模塊、主控制模塊、功放模塊和信號分析儀,所述標準信號源/聲源播放模塊設置在消音室內,用於播放智能合成的語音語料庫音頻文件,所述麥克風採集標準信號源/聲源播放模塊播放的標準信號源/聲源,並將採集到的信號傳輸給信號採集處理模塊,信號採集處理模塊對信號進行處理後傳輸給主控制模塊,主控制模塊對信號進行錄製後將錄音信號傳輸給功放模塊,功放模塊對錄音信號進行功放後傳輸給信號分析儀,信號分析儀對錄音信號的電性能進行數據分析。

進一步的,所述標準環境下語音測試模塊包括標準聲源播放模塊、麥克風、信號採集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊,所述標準聲源播放模塊設置在消音室內,用於播放語音語料庫音頻文件,所述麥克風採集標準聲源播放模塊播放的標準聲源,並將採集到的信號傳輸給信號採集處理模塊,信號採集處理模塊對信號進行處理後傳輸給主控制模塊,主控制模塊對信號進行語音合成,並與離線語音合成模塊的內置文件進行對比,顯示測試數據的分析結果並計算語音識別準確率。

進一步的,所述常規情景下語音測試模塊包括標準聲源播放模塊、麥克風、信號採集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊,所述標準聲源播放模塊設置在常規使用環境中,用於播放語音語料庫音頻文件,所述麥克風採集標準聲源播放模塊播放的標準聲源,並將採集到的信號傳輸給信號採集處理模塊,信號採集處理模塊對信號進行處理後傳輸給主控制模塊,主控制模塊對信號進行語音合成,並與離線語音合成模塊的內置文件進行對比,顯示測試數據的分析結果並計算語音識別準確率。

進一步的,所述麥克風包括麥克風單體或麥克風陣列。

更進一步的,所述麥克風為駐極體麥克風、模擬mems麥克風或數字mems麥克風。

本發明還公開一種基於上述的語音識別測試系統的語音識別測試方法,包括如下步驟:

s1,採用實時信號測試模塊測試拾取信號的質量完整性及電性能參數是否達到設計要求,如果是,則進入步驟s2;如果否,則改善實時信號後重複步驟s1;

s2,採用錄音質量測試模塊測試錄音信號質量,確保其與實時測試信號電性能參數保持一致,進入步驟s3;

s3,採用標準環境下語音測試模塊測試標準環境下語音識別率,進入步驟s4;

s4,採用常規情景下語音測試模塊測試常規使用環境下語音識別率。

進一步的,所述步驟s3中還包括整體在標準測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化;所述步驟s4中還包括整體在情景交互測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。

本發明的有益技術效果:

1、方便評估前期單體麥克風或陣列麥克風模型聲學模型。

2、系統集成度高,提高測試效率:系統集成度高,包含實時信號測試、標準環境下語音測試、常規情景下語音測試和錄音質量測試(兼容信號和語音質量),方便各階段的測試數據分析,提高了測試效率。

3、提高測試準確率:從拾取信號質量分析到主客觀判定語音測試結果,整體綜合性強,減少誤差,提高了測試準確率。

附圖說明

圖1為本發明具體實施例的系統結構示意圖;

圖2為本發明具體實施例的實時信號測試模塊的結構示意圖;

圖3為本發明的實時信號測試模塊的另一種結構示意圖;

圖4為本發明具體實施例的錄音質量測試模塊的結構示意圖;

圖5為本發明具體實施例的標準環境下語音測試模塊的結構示意圖;

圖6為本發明具體實施例的常規情景下語音測試模塊的結構示意圖;

圖7為本發明具體實施例的方法流程圖;

圖8為本發明具體實施例的測試流程圖。

具體實施方式

現結合附圖和具體實施方式對本發明進一步說明。

如圖1-6所示,一種語音識別測試系統,包括主控制模塊1、實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5,所述實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5分別與主控制模塊1連接,主控制模塊1控制實時信號測試模塊2、錄音質量測試模塊3、標準環境下語音測試模塊4和常規情景下語音測試模塊5按照一定邏輯順序進行測試。

本具體實施例中,主控制模塊1為mcu處理器,其作業系統可以是android或ios作業系統,當然,在其它實施例中,主控制模塊1也可以是單片機、plc控制器等。

所述實時信號測試模塊2用於測試拾取信號的質量完整性及電性能參數,得出信號的幅度、失真、信噪比、頻響範圍等參數,本具體實施例中,如圖2所示,實時信號測試模塊2為有線實時信號測試模塊,包括標準信號源播放模塊21、麥克風3、信號採集處理模塊7、主控制模塊1和信號分析儀8,所述標準信號源播放模塊21設置在消音室內,以排除環境的噪聲,混響,回音,簡正振動等對標準信號的幹擾,標準信號源播放模塊21用於播放由主控制模塊1提供的標準信號源,所述麥克風6採集標準信號源,並將採集到的信號傳輸給信號採集處理模塊7,信號採集處理模塊7對信號進行處理後傳輸給主控制模塊1,主控制模塊1對信號進行處理後即轉換成audio信號後傳輸給信號分析儀8,信號分析儀8對信號的電性能進行數據分析,得出信號的幅度,失真,信噪比,頻響範圍等參數。

當然,在其它實施例中,實時信號測試模塊2可以為無線實時信號測試模塊,如圖3所示,包括標準信號源播放模塊21、麥克風3、信號採集處理模塊7、rf信號發射模塊22、rf信號接收模塊23、主控制模塊1和信號分析儀8,所述標準信號源播放模塊21設置在消音室內,以排除環境的噪聲,混響,回音,簡正振動等對標準信號的幹擾,標準信號源播放模塊21用於播放由主控制模塊1提供的標準信號源,所述麥克風6採集標準信號源,並將採集到的信號傳輸給信號採集處理模塊7,信號採集處理模塊7對信號進行處理後傳輸給rf信號發射模塊22,rf信號發射模塊22將信號無線發射給rf信號接收模塊23,rf信號接收模塊23接收後將信號傳輸給主控制模塊1,主控制模塊1對信號進行處理後即轉換成audio信號後傳輸給信號分析儀8,信號分析儀8對信號的電性能進行數據分析,得出信號的幅度,失真,信噪比,頻響範圍等參數。

所述錄音質量測試模塊3用於測試錄音信號質量的電性能參,本具體實施例中,如圖4所示,所述錄音質量測試模塊3包括標準信號源/聲源播放模塊31、麥克風6、信號採集處理模塊7、主控制模塊1、功放模塊32和信號分析儀8,所述標準信號源/聲源播放模塊31設置在消音室內,用於播放主控制模塊1中存儲的智能合成的語音語料庫音頻文件,所述麥克風6採集標準信號源/聲源播放模塊31播放的標準信號源/聲源,並將採集到的信號傳輸給信號採集處理模塊7,信號採集處理模塊7對信號進行處理後傳輸給主控制模塊1,主控制模塊1對信號進行錄製後將錄音信號傳輸給功放模塊32,功放模塊32對錄音信號進行功放後傳輸給信號分析儀8,信號分析儀8對錄音信號的電性能進行數據分析。

所述標準環境下語音測試模塊4用於測試標準環境下語音識別率,本具體實施例中,如圖5所示,標準環境下語音測試模塊4包括標準聲源播放模塊41、麥克風6、信號採集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊1,所述標準聲源播放模塊41設置在消音室內,用於播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風6採集標準聲源播放模塊41播放的標準聲源,並將採集到的信號傳輸給信號採集處理模塊7,信號採集處理模塊7對信號進行處理後傳輸給主控制模塊1,主控制模塊1對信號進行語音合成後與離線語音合成模塊9的內置文件進行對比,顯示測試數據的分析結果並計算語音識別準確率。

本具體實施例中,標準環境下語音測試模塊4還包括錄音文件播放模塊10,主控制模塊1還對信號進行錄音,並將錄音信號傳輸給錄音文件播放模塊10進行播放,以進行主觀音質評價量化。

所述常規情景下語音測試模塊5用於測試常規使用環境下語音識別率,本具體實施例中,如圖6所示,常規情景下語音測試模塊5包括標準聲源播放模塊51、麥克風6、信號採集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內容轉換成內置文件傳輸至主控制模塊1,所述標準聲源播放模塊51設置在常規使用環境中,用於播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風6採集標準聲源播放模塊51播放的標準聲源,並將採集到的信號傳輸給信號採集處理模塊7,信號採集處理模塊7對信號進行處理後傳輸給主控制模塊1,主控制模塊1對信號進行語音合成,並與離線語音合成模塊9的內置文件進行對比,顯示測試數據的分析結果並計算語音識別準確率。

本具體實施例中,常規情景下語音測試模塊5還包括錄音文件播放模塊10,主控制模塊1還對信號進行錄音,並將錄音信號傳輸給錄音文件播放模塊10進行播放,以進行主觀音質評價量化。

本具體實施例中,所述麥克風6可以是麥克風單體或麥克風陣列,麥克風的類型可以是駐極體麥克風、模擬mems麥克風或數字mems麥克風。

本具體實施例中,標準聲源可以可以是人工合成聲源,也可是人聲錄音標準普通話版聲源。

本具體實施例中,信號分析儀8可以是audioprecision音頻測試分析儀或b&k音頻測試儀等相關設備。

本具體實施例中,信號採集處理模塊7採用現有的信號採集處理晶片,功放模塊32採用現有的功率放大晶片,此是本領域技術人員可以輕易實現的,不再詳細說明。

本具體實施例中,常規使用環境可以是真實的常規使用環境,也可以是在室內模擬常規使用環境。

本具體實施例中,標準信號源播放模塊21、標準信號源/聲源播放模塊31、標準聲源播放模塊41和標準聲源播放模塊51採用同一個高保真音響來實現,高保真音響校準並根據所需音量進行播放。當然,在其它實施例中,也可以採用人工嘴來實現。錄音文件播放模塊10為高保真音響。

本具體實施例中,測試中可自由對被測麥克風6的位置進行變動。

如圖7所示,本發明還公開一種基於上述的語音識別測試系統的語音識別測試方法,包括如下步驟:

s1,採用實時信號測試模塊測試拾取信號的質量完整性及電性能參數,包括幅度,失真,信噪比,頻響範圍等參數是否達到設計要求,如果是,則進入步驟s2;如果否,則改善實時信號後重複步驟s1。

本步驟主要是確定測試系統的拾取信號線路是否完整,還原的波形是否異常,信號的完整的電性能測試否達到設計標準等環節定義拾音信號的質量,為後續標準化測試做優先平臺,從而提高測試準確度。

s2,採用錄音質量測試模塊測試錄音信號質量,確保其與實時測試信號電性能參數保持一致,進入步驟s3。

錄音質量測試綜合反饋測試系統的錄製信號完整性,信號處理,信號質量並對比實時信號參考要求,確認錄音信號質量與實時測試信號電性能參數保持一致

通過錄音信號質量與實時信號質量進行對比,確認錄音信號的電性能達到與實時信號電性能同樣的設計要求,另外通過對錄音的標準聲源進行主觀音質評價維度,綜合了主觀和客觀的數據分析。

s3,採用標準環境下語音測試模塊測試標準環境下語音識別率,進入步驟s4。

具體的,本步驟的測試環境仍定義在消音室內,主要目的是確認標準環境下語音識別率,其結果可參照常規情境下測試的語音識別率作對比,為後續優化語音識別或提高準確提供參考依據,同時整體在標準測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。

s4,採用常規情景下語音測試模塊測試常規使用環境下語音識別率。

具體的,模擬常規使用環境測試,考慮室內噪聲,混響,回音,簡正振動等因素,確認其語音識別率,及結果更加偏向用戶使用模式,同時整體在情景交互測試環境中對測試標準聲源的錄音質量的維度進行主觀音質評價量化。

具體測試流程圖可以參見圖8,此不再細說。

通過以上四個步驟測試對信號數據分析,並結合主觀音質考評進一步提高語音識別測試準確率。

本發明同樣適用於在線語音識別測試,即聯網推送雲端

儘管結合優選實施方案具體展示和介紹了本發明,但所屬領域的技術人員應該明白,在不脫離所附權利要求書所限定的本發明的精神和範圍內,在形式上和細節上可以對本發明做出各種變化,均為本發明的保護範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀