一種基於模糊支持向量機的語音情感識別方法
2023-12-05 04:33:46 2
一種基於模糊支持向量機的語音情感識別方法
【專利摘要】本發明涉及語音情感識別技術,具體的說是涉及一種基於模糊支持向量機的語音情感識別方法。本發明的方法包括:對輸入的帶有情感的語音信號進行預處理;所述預處理包括預加重濾波和加窗分幀;提取處理後的語音信號的特徵信息梅爾倒普係數(MFCC);對所提取的梅爾倒普係數用核主成份分析(KPCA)進行降維處理;根據降維後的梅爾倒普係數特徵信息進行分類識別,並輸出識別結果;具體的分類識別方法為採用FSVM算法進行;本發明的有益效果為,通過MFCC情感特徵,然後用KPCA對特徵降維減少了冗餘的信息,比直接使用MFCC特徵的識別效果要好很多,其識別率更高,效果更好,且識別速度更快。本發明尤其適用於語音智能情感識別。
【專利說明】一種基於模糊支持向量機的語音情感識別方法
【技術領域】
[0001] 本發明涉及語音情感識別技術,具體的說是涉及一種基於模糊支持向量機的語音 情感識別方法。
【背景技術】
[0002] 專家已經從生理和心理兩個領域對情感研究了很長一段時間,隨著人工智慧的快 速發展,人機互動中的情感研究引起了廣大專家的極大興趣。在人機互動中,希望人類跟機 器能更自然的進行交流,這就需要機器能夠理解人類的情感,所以機器對情感的分類識別 顯得尤其重要了。在人類交流中,語音包含了豐富的信息,所以機器可以通過語音對情感進 行分類識別。專家們對語音情感分類識別已經進行了大量的研究和分析,一般包括語音情 感庫的建立、情感特徵提取、分類識別方法的研究。前人為了提高語音情感的識別率,對每 一個環節都進行了改進研究,但沒有形成一個統一的系統,識別率也不是很高。前人用梅爾 倒譜係數(MFCC)作為識別特徵,但在識別之前沒有對此特徵做進一步處理,這就會出現很 多冗餘的信息影響識別效果。前人在使用分類器的時候發現噪聲或孤立點對識別率影響特 別大,為了消除這種影響提高識別率,選擇一個合適的分類器成了研究的重點。為了提高語 音情感識別率,對情感特徵作適當處理和選擇合適的分類方法尤其重要。
【發明內容】
[0003] 本發明所要解決的,就是針對傳統技術存在的問題,提出一種基於模糊支持向量 機的語音情感識別方法。
[0004] 本發明解決上述技術問題所採用的技術方案是:一種基於模糊支持向量機的語音 情感識別方法,其特徵在於,包括以下步驟:
[0005] a.對輸入的語音信號預處理;所述預處理包括預加重濾波和加窗分幀,其中預加 重濾波的預加重係數α為0. 97,加窗分幀的幀長為30ms ;
[0006] b.提取處理後的語音信號的特徵信息;所述特徵信息為梅爾倒普係數(MFCC);其 中,特徵信息為26維,包括13維梅爾倒普係數以及13維由梅爾倒普係數推導出的一階差 分倒普係數;
[0007] c.對提取的梅爾倒普係數進行降維處理;所述降維處理具體為採用核主成份分 析(KPCA)進行降維;KPCA的處理過程如下:
[0008] cl.將所獲得的η個指標(每一指標有m個樣品)的一批數據寫成一個(mXn)維 數據矩陣
【權利要求】
1. 一種基於模糊支持向量機的語音情感識別方法,其特徵在於,包括以下步驟: a. 對輸入的語音信號預處理;所述預處理包括預加重濾波和加窗分幀; b. 提取處理後的語音信號的特徵信息;所述特徵信息為梅爾倒普係數; c. 對提取的梅爾倒普係數進行降維處理;所述降維處理具體為採用核主成份分析進 行降維; d. 將降維處理後的梅爾倒普係數特徵信息輸入模糊支持向量機分類器,模糊支持向量 機分類器輸出分類識別結果;所述模糊支持向量機分類器採用模糊支持向量算法對語音訓 練樣本進行訓練,具備語音情感分類識別能力;所述語音訓練樣本經過上述步驟a?c處理 後,再用於訓練模糊支持向量機分類器;所述模糊支持向量算法的具體步驟為:
【文檔編號】G10L17/04GK104091602SQ201410331505
【公開日】2014年10月8日 申請日期:2014年7月11日 優先權日:2014年7月11日
【發明者】周代英, 譚發曾, 賈繼超, 田兵兵, 寥闊 申請人:電子科技大學