一種基於發音節奏的語音評測方法及裝置的製作方法
2023-04-24 13:28:11
專利名稱:一種基於發音節奏的語音評測方法及裝置的製作方法
技術領域:
本發明涉及語音識別領域,特別涉及一種基於發音節奏的語音評測方法及裝置。
背景技術:
日常生活中,我們不難發現這樣的現象 日本學生的漢語發音節奏往往會受到母語的影響,與漢語母語發音者存在著很大的不同。而研究表明,對日本學習者而言,最難的部分即為漢語口語的學習。如果能及時發現日本學生漢語發音節奏中的偏誤並給予他們有效地反饋,將會對他們的大大提高他們的漢語口語學習效率。然而隨著漢語熱的進一步升溫,學習漢語的人數在急劇增加,傳統的教學資源有限,並且不能及時發現學生漢語發音節奏中的偏誤,無法滿足學生的需要。
發明內容
本發明的目的是針對上述問題,考慮到第二語言學習者口語發音節奏往往會受到母語發音節奏的影響,提出一種基於發音節奏的語音評測方法及裝置。為實現上述目的,本發明提供了一種基於發音節奏的語音評測裝置,該裝置包括GMM模型獲取單元,用於從被評測語音中選出訓練數據,提取出所述訓練數據的節奏特徵參數進行訓練得到GMM模型;似然度獲取單元,提取被評測語音的節奏特徵參數作為所述GMM模型的輸入,經GMM模型匹配獲取相應的似然度值;評測模型獲取單元,包括評測模型模塊,用於所述似然度經過訓練評測模型,根據所述評測模型對被評測語音的發音節奏進行評測。可選的,在本發明一實施例中,所述評測模型獲取單元還包括標準化處理模塊;所述標準化處理模塊用於似然度經過訓練獲取評測模型之前經過標準化處理;所述標準化處理包括求解信差和Z-Score值。可選的,在本發明一實施例中,所述評測模型模塊中的評測模型為LDA模型。可選的,在本發明一實施例中,所述GMM模型獲取單元獲取的GMM模型包括中國人說漢語GMM模型、日本人說漢語GMM模型和日本人說日語GMM模型。可選的,在本發明一實施例中,所述GMM模型獲取單元獲取的GMM模型還用於對被評測語音進行類型識別,即被評測語音作為輸入經過GMM模型獲取似然度值,將獲取最大似然度值的GMM模型對應的語料類型作為被評測語音的類型。可選的,在本發明一實施例中,所述語料類型包括中國人說漢語類型、日本人說漢語類型和日本人說日語類型。可選的,在本發明一實施例中,所述GMM模型獲取單元中的節奏特徵參數包括:%V、AV、rPV1、nPVI 和 ΛΕ ;其中,所述%V為在一句話中所有兀音的時長佔總時長的比例;
所述AV為在一句話中元音時長的標準差;所述Δ E為一句話中輔音/元音能量值的標準差;所述Δ E表達式為
權利要求
1.一種基於發音節奏的語音評測裝置,其特徵在於,該裝置包括 GMM模型獲取單元,用於從被評測語音中選出訓練數據,提取出所述訓練數據的節奏特徵參數進行訓練得到GMM模型; 似然度獲取單元,提取被評測語音的節奏特徵參數作為所述GMM模型的輸入,經GMM模型匹配獲取相應的似然度值; 評測模型獲取單元,包括評測模型模塊,用於所述似然度經過訓練評測模型,根據所述評測模型對被評測語音的發音節奏進行評測。
2.根據權利要求1所述的裝置,其特徵在於,所述評測模型獲取單元還包括標準化處理模塊; 所述標準化處理模塊用於似然度經過訓練獲取評測模型之前經過標準化處理;所述標準化處理包括求解信差和Z-Score值。
3.根據權利要求1或2所述的裝置,其特徵在於,所述評測模型模塊中的評測模型為LDA模型。
4.根據權利要求1或2所述的裝置,其特徵在於,所述GMM模型獲取單元獲取的GMM模型包括中國人說漢語GMM模型、日本人說漢語GMM模型和日本人說日語GMM模型。
5.根據權利要求4所述的裝置,其特徵在於,所述GMM模型獲取單元獲取的GMM模型還用於對被評測語音進行類型識別,即被評測語音的節奏特徵參數作為輸入經過GMM模型獲取似然度值,將獲取最大似然度值的GMM模型對應的語料類型作為被評測語音的類型。
6.根據權利要求4所述的裝置,其特徵在於,所述語料類型包括中國人說漢語類型、日本人說漢語類型和日本人說日語類型。
7.根據權利要求1或2所述的裝置,其特徵在於,所述GMM模型獲取單元中的節奏特徵參數包括-M、AV、rPV1、nPVI和Λ E ;其中, 所述%V為在一句話中所有元音的時長佔總時長的比例; 所述Δν為在一句話中元音時長的標準差; 所述ΔΕ為一句話中輔音/元音能量值的標準差;所述ΔE表達式為
8.根據權利要求1或2所述的裝置,其特徵在於,所述評測模型獲取單元還包括感知評測模塊;所述感知評測模塊,用於對所述訓練數據進行感知評測獲取感知評測信息,將感知評測信息與所述似然度值經過訓練獲取評測模型。
9.一種基於發音節奏的語音評測方法,其特徵在於,該方法包括從被評測語音中選出訓練數據,提取出所述訓練數據的節奏特徵參數進行訓練得到 GMM模型;提取被評測語音的節奏特徵參數作為所述GMM模型的輸入,經GMM模型匹配獲取相應的似然度值;所述似然度經過訓練評測模型,根據所述評測模型對被評測語音的發音節奏進行評測。
10.根據權利要求9所述的方法,其特徵在於,所述節奏特徵參數包括%V、AV、rPV1、 nPVI和ΛΕ ;其中,所述%V為在一句話中所有元音的時長佔總時長的比例;所述Δν為在一句話中元音時長的標準差;所述ΔΕ為一句話中輔音/元音能量值的標準差;所述ΔE表達式為
全文摘要
本發明涉及一種基於發音節奏的語音評測方法及裝置,該裝置包括GMM模型獲取單元用於從被評測語音中選出訓練數據,提取出所述訓練數據的節奏特徵參數進行訓練得到GMM模型;似然度獲取單元提取被評測語音的節奏特徵參數作為所述GMM模型的輸入,經GMM模型匹配獲取相應的似然度值;評測模型獲取單元用於所述似然度經過訓練評測模型,根據所述評測模型對被評測語音的發音節奏進行評測。本申請所提出的技術方案用於輔助語言教學,尤其是對外漢語的教學,滿足了學生學習語言的需要。另外,能及時發現學生的語音節奏中的偏誤並給予他們有效的反饋,將會提高他們的語言學習效率。尤其在於日本學生學習漢語方面。
文檔編號G09B19/06GK103021226SQ201210473420
公開日2013年4月3日 申請日期2012年11月20日 優先權日2012年11月20日
發明者張勁松, 時書菊, 解焱陸 申請人:北京語言大學