一種小型說話人情感識別系統的製作方法
2023-12-05 04:28:36 1
一種小型說話人情感識別系統的製作方法
【專利摘要】一種小型說話人情感識別系統,首先建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用於構建參考模板;另一部分做測試樣本,用於後續的情感識別實驗,然後對已獲得語音庫中的語音進行預處理,對預處理之後的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜係數及其相關統計參數。之後是進行語音情感識別實驗,將訓練語音的情感參數用基於支持向量機的情感分類器進行分類,之後再用其對測試語音進行預測,判斷其屬於何種情感。
【專利說明】一種小型說話人情感識別系統
【技術領域】
[0001]本發明涉及的是一種語音情感識別系統,特別涉及一種小型說話人情感識別系統。
[0002]
【背景技術】
語音是人與人之間交流的重要手段,聲音是信息的載體,人們可以通過聲音來獲得其中的信息,其中自然包括情感信息。語音是人類相互交流的一種重要工具,也是傳遞情感的一種重要媒介。語音信號所包含的不止是文字信息,同時還夾雜著人的情感。同樣是一句話,其中可以包含不同的情感,而情感不同,那麼這句話的意思就有可能發生變化,如果計算機無法從操作者的語音中獲得其情感,那麼就不可能達到最佳的交流效果,甚至有可能會對操作者的意思產生誤解,從而產生誤動作,給操作者帶來不便。
[0003]語音信號處理是一個重要的研究領域,至今已有很長的研究歷史,而語音信號的情感研究則是一個新興領域,但它是一個綜合了多類學科的研究課題。其中主要包含了生理學、心理學、以及信號處理等重要學科。同時該課題的研究成果一語音情感識別系統具有相當寬廣的應用前景,具體可以應用在:
1、遠程網絡教學,在遠程網絡教學系統中可以加入情感識別系統,通過判斷學習者的情感表達是否得體,可以讓學習者更好的提高帶有豐富情感的朗讀能力。
[0004]2、用於刑偵領域,情感識別系統可以製作成一個測謊儀,利用其推斷測試者的語言真實程度。隨著技術的不斷提高,可以不斷完善測謊儀的功能並將其用於現實中,因此情感識別系統對於刑偵領域來說也具有相當重要的實際意義。
[0005]3、娛樂遊戲,目前大多數遊戲都是通過文字來傳達信息,而如果在遊戲中加語音的情感識別及表達則可以豐富信息的傳遞方式,同時也更能吸引玩家。通過這種新穎的方式可以在一定程度上緩解玩家在遊戲過程中的疲勞度,玩家也能同時獲得聽覺與視覺上的享受,增加了遊戲的可玩程度。
[0006]
【發明內容】
本發明的目的是提供一種利用一個小型的情感語音庫利用其作為語音做訓練樣本,用於構建參考模板,對每種情感的識別率進行統計的人情感識別系統。
[0007]本發明的目的是這樣實現的:本發明的第一步工作是在閱讀了國內外大量資料的基礎上建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用於構建參考模板;另一部分做測試樣本,用於後續的情感識別實驗。第二步是對已獲得語音庫中的語音進行預處理,其步驟主要包括預加重、加窗分幀以及語音端點檢測。第三步是對預處理之後的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜係數及其相關統計參數。用軟體對參數的提取進行仿真實驗,得到不同情感類型的各個參數的分布範圍,並對結果進行簡要的分析。第四步是進行語音情感識別實驗,將訓練語音的情感參數用基於支持向量機的情感分類器進行分類,之後再用其對測試語音進行預測,判斷其屬於何種情感。實驗之後對每種情感的識別率進行統計,對最終的統計結果進行分析。最後,為整個系統設計了一個簡單的人機界面,該界面可以完成輸入測試語音、顯示系統對該語音的識別結果以及對結果進行清空的功能。
[0008]自己錄製一個小規模的漢語情感語音庫,庫中語音的情感分為四類:喜悅、憤怒、悲傷、驚奇。錄製者為6人均為男生,每人對4個語音文本分別用4種情感進行朗讀,每種情感朗讀4遍,總共獲得384個樣本作為實驗用情感語音庫。採用SVM的方法對情感進行分類,其中SVM採用「一對一」方法來解決多分類的問題。最後分別用語音的韻律特徵包括基音及共振峰的相關參數、語音特徵MFCC相關參數及兩者結合作為情感特徵做了識別,並對識別結果進行了分析對比。實驗中,在用全部11個參數進行識別時,最終所得到的4種情感的平均識別率為79.15%,悲傷的識別率最高為83.3%。同時發現,喜悅與憤怒這兩種情感之間最容易發生誤識別現象。
【專利附圖】
【附圖說明】
[0009]圖1為語首情感識別流程圖。
【具體實施方式】
[0010]下面結合附圖舉例對本發明做更詳細地描述:
實施例1
結合圖1,圖1為語音情感識別流程圖。1、情感語音庫的獲取。由於目前語音情感識別都是針對他國語言而言的,漢語在這方面的研究則開展的相對較少,找不到一個專門用於情感識別的漢語情感語音庫。因此進行識別研究之前的準備工就是自己錄製一個小規模的漢語的情感語音庫,然後基於該語音庫進行後續研究。2、語音信號的預處理。由於語音信號的特點,對於語音庫中的語音信號並不能直接提取其中的情感特徵參數,必須先進行一步前端處理,包括預加重、加窗分幀及端點檢測。3、情感特徵參數的提取。預處理之後則是提取信號中的情感特徵參數,其中主要包括兩種類別,一類是聲學特徵參數,包括12階MFCC參數和共振峰參數。另一類是韻律特徵參數,包括語音的基音頻率,短時能量,平均過零率等參數。並在此基礎上進行了細化,最終選取了基音頻率平均值、最大值、最小值,第一共振峰平均值、最大值,以及MFCC的第10個、11個、12個參數作為情感特徵參數。4、情感分類器的設計。本發明採用了基於支持向量機(Support Vector Machine)的語音情感分類器的設計,由於目前的svm都只適用於二分類,而如果要實現多分類,則需要在每兩個樣本間設計一個svm,在需要對未知樣本進行分類時,則要通過投票來最終確定其類別。這就是所謂的「一對一」法。
【權利要求】
1.一種小型說話人情感識別系統,其特徵在於:本發明的第一步工作是在閱讀了國內外大量資料的基礎上建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用於構建參考模板;另一部分做測試樣本,用於後續的情感識別實驗;第二步是對已獲得語音庫中的語音進行預處理,其步驟主要包括:預加重、加窗分幀以及語音端點檢測;第三步是對預處理之後的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜係數及其相關統計參數;用軟體對參數的提取進行仿真實驗,得到不同情感類型的各個參數的分布範圍,並對結果進行簡要的分析;第四步是進行語音情感識別實驗,將訓練語音的情感參數用基於支持向量機的情感分類器進行分類,之後再用其對測試語音進行預測,判斷其屬於何種情感;實驗之後對每種情感的識別率進行統計,對最終的統計結果進行分析;最後,為整個系統設計了一個簡單的人機界面,該界面可以完成輸入測試語音、顯示系統對該語音的識別結果以及對結果進行清空的功能。
2.根據權利要求1所述的一種小型說話人情感識別系統,其特徵在於:錄製一個小規模的漢語情感語音庫,庫中語音的情感分為四類:喜悅、憤怒、悲傷、驚奇;採用3穩的方法對情感進行分類,其中3穩採用「一對一」方法來解決多分類的問題;最後分別用語音的韻律特徵包括基音及共振峰的相關參數、語音特徵即⑶相關參數及兩者結合作為情感特徵做識別。
【文檔編號】G10L25/63GK104464756SQ201410750977
【公開日】2015年3月25日 申請日期:2014年12月10日 優先權日:2014年12月10日
【發明者】馮秀霞 申請人:黑龍江真美廣播通訊器材有限公司