新四季網

基於自然言語理解的語音情感識別方法

2023-12-05 04:29:31 1

專利名稱:基於自然言語理解的語音情感識別方法
技術領域:
本發明屬於語音情感識別技術領域。具體涉及一種基於自然言語理解的語音情感識別方法。
背景技術:
隨著計算機網絡通信技術和多媒體技術的飛速發展,人機互動技術已逐步成為人工智慧領域一個非常重要的方面,尤其是數字娛樂的興起、智能家電的逐步普及以及計算 機的日趨泛化,使得人機互動的自然性與智能性顯得很重要。而情感信息的處理是提高人機互動能力的一個重要課題,因此如何提高人機互動中語音情感識別技術對用戶的情緒狀態變化的適應能力日益迫切,使用戶帶有情感的語音信息能夠被計算機正確地識別,進而提高人機互動的自然性與智能性。語音情感識別是一項通過對語音信號的感知和分析,剝離出情感表達的聲學特徵,進而識別出說話者所處的情感狀態的技術。近十幾年來,語音情感識別技術已取得一定的發展,但仍面臨一個巨大的挑戰怎樣讓計算機更好的理解語音中的情感信息。語音情感信號的多樣性導致情感類型的劃分不一致,由於人類的情感是相當複雜的,不同文化背景中的不同情感所代表的意思也很多樣化。目前情感語音庫的建立(林奕琳,韋崗,楊康才.語音情感識別的研究進展.電路與系統學報,2007年第12卷第I期)主要是通過專業錄音演員模擬的情感語音,但是這種模擬的情感語音不能真實、準確地反映普通人在某種情感時的真實信息。因此,語音情感識別的自然性有待進一步提高。結合音質特徵和韻律特徵的語音情感識別(張石清,趙知勁,雷必成,楊廣映.結合音質特徵和韻律特徵的語音情感識別.電路與系統學報,2009年第14卷第4期)把語音音質特徵和韻律特徵參數相結合,取得的情感平均正確識別率比單獨使用韻律特徵參數要高,但卻沒有考慮到說話者的講話內容,情感語音中語音與情感特徵的關聯度不高,導致不能對語音情感信號進行整體的理解。綜上所述,現有語音情感識別中存在以下問題語音情感識別的自然性不強;情感語音中語音與情感特徵的關聯度不高,導致不能對語音情感信號進行整體的理解。因此,如何在自然言語理解的基礎上對帶情感的語音信號進行識別,進一步提高計算機識別的自然性和智能性是一個非常值得研究的課題。

發明內容
本發明旨在克服現有技術的缺陷,目的是提供一種基於自然言語理解的語音情感識別方法。該方法不僅對語音情感識別的自然性強,且情感語音中語音與情感特徵的關聯度高,能對語音情感信號進行整體的理解,提高語音情感信號的識別率。為了實現上述目的,本發明採用的技術方案是首先通過麥克風進行語音情感信號採集,對所採集的語音情感信號進行預處理和特徵提取,再通過句法情感分析計算所採集的語音情感信號的失真程度,求出情感特徵向量;然後分別進入訓練階段和識別階段,最後將自然言語理解後的情感特徵向量與情感語音庫中的情感特徵向量進行模式匹配,得出識別結果。所述訓練階段是先採用情感歸類對情感特徵向量進行分類,再進行模型訓練,然後建立情感語音庫;所述識別階段是採用語義分析和語用學分析對情感特徵向量進行自
然言語理解。在上述技術方案中
所述的句法情感分析是通過概率統計分析或分類器融合的方法對特徵提取後的語音情感信號中的情感詞語進行分析。其中概率統計分析是先用聚類分析的統計分析方法或主成分分析的統計分析方 法分析各類特徵提取後的語音情感信號的語音特徵變化情況,再根據語音特徵變化情況計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量;分類器融合是先用貝葉斯分類器組合或最大概率類別判別法對各類特徵提取後的語音情感信號的特徵進行數據融合,再根據數據融合的結果計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量。所述的情感歸類是基於語法規則的方法或基於情感關鍵詞定位的方法對不同情感關鍵詞的情感特徵向量進行分類。其中基於語法規則的方法是結合輸入的主語、動詞、人稱和時態信息對情感特徵向量進行分類,對分類後的情感特徵向量建立情感語音庫;基於情感關鍵詞定位的方法是根據用戶需要逐個提取與情感關鍵詞相關的特徵詞集,然後根據所提取的特徵詞集計算兩兩的句內共現率,最後選擇權重最大的特徵詞作為所需要的關鍵詞。所述的自然言語理解是通過語義分析和語用學分析對各類情感特徵向量進行自然目語理解。其中語義分析是先從語義層次對根據句法情感分析所獲得的各類情感特徵向量進行分析,將用戶的需求用計算機可理解的形式描述出來,再設定含語義信息的詞語的權重值,然後將用戶興趣主題與設定的權重值進行匹配計算;語用學分析是根據句法情感分析所獲得的各類情感特徵向量從語境層對特徵提取後的語音情感信號進行自然言語理解,依據語用學規則,根據上下文語境判斷語音情感的變化。由於採用上述技術方案,本發明全面考慮了語音情感識別中語義和情感之間的聯繫,從模型和言語兩個層面應對情感變化引起的語音變化,增強對帶有情感詞彙的語音信號的識別能力。模型層面對情感變化規律採用情感歸類對情感特徵向量進行分類,通過情感的分類降低了情感語音庫建立的複雜度;言語層面通過語義分析和語用學分析的手段,將語音情感特徵向量進行自然言語理解,提高了情感語音中語音與情感特徵的關聯度,實現了對語音情感信號的整體理解,從而提高了對語音情感信號的識別率。因此,本發明不僅對語音情感識別的自然性強,且情感語音中語音與情感特徵的關聯度高,能對語音情感信號進行整體的理解,提高了對語音情感信號的識別率。本發明可廣泛用於人機互動系統、自動遠程電話服務中心、遠程教育和刑事偵查中的測謊儀領域。


圖I是本發明的一種基於自然言語理解的語音情感識別方法框圖。
具體實施例方式下面結合附圖和具體實施例對本發明作進一步的描述
一種基於自然言語理解的語音情感識別方法。該方法如圖I所示首先通過麥克風進行語音情感信號採集,對所採集的語音情感信號進行預處理和特徵提取,預處理包括採樣與量化、預加重、分幀與加窗;特徵提取,包括提取語音持續時間、基音頻率、能量(振幅)的韻律特徵和共振峰參數、MEL頻率倒譜係數的音質特徵。再通過句法情感分析計算所採集的語音情感信號的失真程度,求出情感特徵向量;然後分別進入訓練階段和識別階段,最後將自然言語理解後的情感特徵向量與情感語音庫中的情感特徵向量進行模式匹配,得出識別結果。所述訓練階段是先採用情感歸類對情感特徵向量進行分類,再進行模型訓練,然 後建立情感語音庫;所述識別階段是採用語義分析和語用學分析對情感特徵向量進行自
然言語理解。在本具體實施方式

所述的句法情感分析是通過概率統計分析或分類器融合的方法對特徵提取後的語音情感信號中的情感詞語進行分析。其中概率統計分析是先用聚類分析的統計分析方法或主成分分析的統計分析方法分析各類特徵提取後的語音情感信號的語音特徵變化情況,再根據語音特徵變化情況計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量;分類器融合是先用貝葉斯分類器組合或最大概率類別判別法對各類特徵提取後的語音情感信號的特徵進行數據融合,再根據數據融合的結果計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量。所述的情感歸類是基於語法規則的方法或基於情感關鍵詞定位的方法對不同情感關鍵詞的情感特徵向量進行分類。其中基於語法規則的方法是結合輸入的主語、動詞、人稱和時態信息對情感特徵向量進行分類,對分類後的情感特徵向量建立情感語音庫;基於情感關鍵詞定位的方法是根據用戶需要逐個提取與情感關鍵詞相關的特徵詞集,然後根據所提取的特徵詞集計算兩兩的句內共現率,最後選擇權重最大的特徵詞作為所需要的關鍵詞。所述的自然言語理解是通過語義分析和語用學分析對各類情感特徵向量進行自然目語理解。其中語義分析是先從語義層次對根據句法情感分析所獲得的各類情感特徵向量進行分析,將用戶的需求用計算機可理解的形式描述出來,再設定含語義信息的詞語的權重值,然後將用戶興趣主題與設定的權重值進行匹配計算;語用學分析是根據句法情感分析所獲得的各類情感特徵向量從語境層對特徵提取後的語音情感信號進行自然言語理解,依據語用學規則,根據上下文語境判斷語音情感的變化。本發明全面考慮了語音情感識別中語義和情感之間的聯繫,從模型和言語兩個層面應對情感變化引起的語音變化,增強對帶有情感詞彙的語音信號的識別能力。模型層面對情感變化規律採用情感歸類對情感特徵向量進行分類,通過情感的分類降低了情感語音庫建立的複雜度;言語層面通過語義分析和語用學分析的手段,將語音情感特徵向量進行自然言語理解,提高了情感語音中語音與情感特徵的關聯度,實現了對語音情感信號的整體理解,從而提高了對語音情感信號的識別率。因此,本具體實施方式
不僅對語音情感識別的自然性強,且情感語音中語音與情感特徵的關聯度高,能對語音情感信號進行整體的理解,提高了對語音情感信號的識別率。本具體實施方式
可廣泛用於人機互動系統、自動遠程電話服務中心、遠程教育和刑事偵查中的測謊儀領域。
上述實施例用來解釋本發明,而不是對本發明進行限制,在本發明的精神和權利要求的保護範圍內,對本發明做出的任何修改和改變,都落入本發明的保護範圍內。
權利要求
1.一種基於自然言語理解的語音情感識別方法,其特徵在於首先通過麥克風進行語音情感信號採集,對所採集的語音情感信號進行預處理和特徵提取,再通過句法情感分析計算所採集的語音情感信號的失真程度,求出情感特徵向量;然後分別進入訓練階段和識別階段,最後將自然言語理解後的情感特徵向量與情感語音庫中的情感特徵向量進行模式匹配,得出識別結果; 所述訓練階段是先採用情感歸類對情感特徵向量進行分類,再進行模型訓練,然後建立情感語音庫;所述識別階段是採用語義分析和語用學分析對情感特徵向量進行自然言語理解。
2.根據權利要求I所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的句法情感分析是通過概率統計分析或分類器融合的方法對特徵提取後的語音情感信號中的情感詞語進行分析。
3.根據權利要求I所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的情感歸類是基於語法規則的方法或基於情感關鍵詞定位的方法對不同情感關鍵詞的情感特徵向量進行分類。
4.根據權利要求I所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的自然言語理解是通過語義分析和語用學分析對各類情感特徵向量進行自然言語理解。
5.根據權利要求2所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的概率統計分析是先用聚類分析的統計分析方法或主成分分析的統計分析方法分析各類特徵提取後的語音情感信號的語音特徵變化情況,再根據語音特徵變化情況計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量。
6.根據權利要求2所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的分類器融合是先用貝葉斯分類器組合或最大概率類別判別法對各類特徵提取後的語音情感信號的特徵進行數據融合,再根據數據融合的結果計算特徵提取後的語音情感信號的失真程度,求出各類情感特徵向量。
7.根據權利要求3所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的基於語法規則的方法是結合輸入的主語、動詞、人稱和時態信息對情感特徵向量進行分類,對分類後的情感特徵向量建立情感語音庫。
8.根據權利要求3所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的基於情感關鍵詞定位的方法是根據用戶需要逐個提取與情感關鍵詞相關的特徵詞集,然後根據所提取的特徵詞集計算兩兩的句內共現率,最後選擇權重最大的特徵詞作為所需要的關鍵詞。
9.根據權利要求4所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的語義分析是先從語義層次對根據句法情感分析所獲得的各類情感特徵向量進行分析,將用戶的需求用計算機可理解的形式描述出來,再設定含語義信息的詞語的權重值,然後將用戶興趣主題與設定的權重值進行匹配計算。
10.根據權利要求4所述的基於自然言語理解的語音情感識別方法,其特徵在於所述的語用學分析是根據句法情感分析所獲得的各類情感特徵向量從語境層對特徵提取後的語音情感信號進行自然言語理解,依據語用學規則,根據上下文語境判斷語音情感的變化。
全文摘要
本發明涉及一種基於自然言語理解的語音情感識別方法。其技術方案是首先通過麥克風進行語音情感信號採集,對所採集的語音情感信號進行預處理和特徵提取,再通過句法情感分析計算所採集的語音情感信號的失真程度,求出情感特徵向量;然後分別進入訓練階段和識別階段,最後將自然言語理解後的情感特徵向量與情感語音庫中的情感特徵向量進行模式匹配,得出識別結果。其中訓練階段是先採用情感歸類對情感特徵向量進行分類,再進行模型訓練,然後建立情感語音庫;識別階段是採用語義分析和語用學分析對情感特徵向量進行自然言語理解。本發明不僅對語音情感識別的自然性強,且能對語音情感信號進行整體的理解,提高了對語音情感信號的識別率。
文檔編號G10L15/02GK102723078SQ201210226989
公開日2012年10月10日 申請日期2012年7月3日 優先權日2012年7月3日
發明者吳懷宇, 杜釗君, 羅鳴 申請人:武漢科技大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀