新四季網

韻律短語預測方法

2023-06-01 15:42:31

專利名稱:韻律短語預測方法
技術領域:
本發明涉及一種語音合成技術領域,特別是涉及一種韻律短語預測方法。
背景技術:
隨著技術的發展,語音合成技術已經越來越多的受到人們的關注。現階段合成語 音的可懂度已經達到相當高的水平,但自然度還不夠高,韻律層次預測的不準確。由於現有的語音合成系統大多只能生成固定語調模式的語句,對語句中的停頓、 輕重、長短、速度及升降調等出現不當處理,使合成語音聽起來枯燥、呆板。韻律生成的主要 障礙在於確定韻律的層次,常見的韻律層次是把韻律結構自下而上劃分為韻律詞、次韻律 短語、主韻律短語和呼吸群。近年來,越來越多的研究都集中於預測韻律結構。多通過首先 設計或收集一個標註好的語料資料庫,然後用某種學習算法建立一個訓練模型,並用從數 據庫中提取出的語法和韻律特徵參數對模型進行訓練,從而得到最終的韻律預測模型。然而,因為漢語語言結構非常複雜,採用目前常見韻律預測模型對於韻律短語邊 界預測的正確率並不高,阻礙了自然度的進一步提高。

發明內容
本發明所要解決的技術問題是提供一種韻律短語預測方法,能夠提高韻律短語邊 界預測的準確性。為了解決上述問題,本發明公開了一種韻律短語預測方法,包括最大熵模型預 測,分析句子的特徵,並對韻律短語進行預測;語法邊界預測,分析句子的特徵,根據語法規 則對語法邊界進行預測;對最大熵模型預測結果進行調整,通過預測出的語法邊界,對最大 熵模型預測結果進行調整,並根據調整後的概率結果確定韻律短語邊界。進一步地,該方法中,對最大熵模型預測結果的調整包括將最大熵模型預測結果 中語法邊界處是韻律短語邊界的概率增大,非語法邊界處是韻律短語邊界的概率降低。進一步地,該最大熵模型預測之前還包括建立最大熵模型,建立最大熵模型包括 選擇最大熵模型特徵、準備訓練數據及最大熵模型訓練。進一步地,該最大熵模型預測包括解析出句子中分詞邊界等特徵,並根據確定的 特徵進行標註,然後將標註後的數據送入最大熵模型進行預測,得出詞與詞之間是否為韻 律短語邊界的概率。進一步地,該最大熵模型解析出的特徵包括前一詞的詞性、詞長,後一詞的詞性、 詞長或者詞性與詞長的組合。進一步地,該語法邊界預測之前還包括總結語法規則,並根據語法規則確定句子 中的短語在句中的成分及句子的結構。進一步地,該語法規則的總結根據漢語結構特點進行。進一步地,該語法邊界預測還包括根據總結的語法規則將句子進行短語劃分,並 解析為多個短語組合的形式,然後根據句子的語法結構規則,分析出語法邊界。
與現有技術相比,本發明具有以下優點本發明的韻律短語預測方法中首先採用最大熵模型對韻律短語進行預測,然後對 句子進行成分分析,得出語法短語邊界,如主謂邊界、謂賓邊界等。然後通過這些語法短語 邊界對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界的概率增大, 將非語法短語邊界處是韻律短語邊界的概率減小。因為韻律短語邊界一定是語法短語邊 界,而語法短語邊界不一定是韻律短語邊界,因此提高了韻律短語預測的準確性。


圖1是本發明實施例的韻律短語預測方法的流程圖。圖2是圖1所示韻律短語預測方法中的語法規則分析的流程圖。
具體實施例方式為使本發明的上述目的、特徵和優點能夠更加明顯易懂,下面結合附圖和具體實 施方式對本發明作進一步詳細的說明。請參閱圖1,本發明的韻律短語預測方法首先採用最大熵模型對韻律短語邊界進 行預測;然後對句子進行成分分析,得出語法短語邊界,如主謂邊界、謂賓邊界等。然後通過 這些語法短語邊界對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界 的概率增大,將非語法短語邊界處是韻律短語邊界的概率減小。因為韻律短語邊界一定是 語法短語邊界,而語法短語邊界不一定是韻律短語邊界,故若最大熵模型預測出的韻律短 語邊界不在語法短語邊界上,則預測錯誤的可能性就比較大。下面對本發明的韻律短語預 測方法進行詳細說明。在預測之前還包括建立最大熵模型及總結語法規則。其中,建立最大熵模型包 括(1)選擇最大熵模型特徵選擇與韻律短語位置有關的特徵作為最大熵模型的特徵,例如,前一詞的詞性、詞 長,後一詞的詞性、詞長,或者前一詞的詞性與詞長的組合。(2)準備訓練數據在選擇最大熵模型的特徵之後,進行訓練數據的準備,需要確定模型中分詞邊界 的特徵。如前一詞的詞性、詞長,後一詞的詞性、詞長等等,即上述模型中的X。然後進行數 據準備,準備一些語料,並根據確定的特徵進行標註。考慮一個隨機過程ρ (y I χ),它根據能觀測到的向量X,以一定的概率輸出某個1,y 屬於一個有限集合Y。在韻律短語邊界預測中,Y= {1,0},分別表示韻律短語邊界和非韻 律短語邊界。X代表與韻律短語位置有關的特徵,即待判決的邊界的上下文環境,包括前一 詞的詞性、詞長,後一詞的詞性、詞長等等。為了重建隨機過程P(y |χ),我們對其輸出進行採
樣,得到N個訓練樣例(Xl,yi),(x2,y2),......,(xN,yN)0由於這些訓練樣例由此隨機過程
產生,所以我們假設某個事件在訓練樣例中的經驗概率,等於該事件在已知P (y I χ)時的期 望概率。(3)訓練最大熵模型在準備好訓練數據後,利用準備好的訓練數據來訓練最大熵模型。將上一步標註了詞性、詞長、正確的韻律短語位置後的數據送入最大熵模型訓練,數據格式為是否是韻 律短語邊界,特徵1,特徵2,特徵3,.......某個事件可以用一個表徵函數&&,y)來表示。如果樣例(Xj,Yj)中發生了此事 件,貝IJfi (Xyyi) = 1 ;否則為0。例如如果χ滿足右邊第一個詞是連詞,且y為韻律短語邊 界,則fi(x,y) = 1 ;其他情況,則fi(x,y) = 0。該事件在訓練樣例中的經驗概率表示為p(fi) = ΣΧ, yp(x' y)fi (χ' y)(i)其中,ρ(χ, y)是樣例(X,y)在訓練樣例中出現的概率,p(x, y))=^
χ (X, y)在訓練語料中的出現次數。如果已知p(y|x),則事件fi(x,y)的期望概率表示為p(fi) = Σχ, yp(x)p(y|x)fi(x' y)(2)其中,P(X)是訓練例中χ的概率。根據我們的假設有ρ (fi) = ρ (fi),即Σχ, yp(x)p(yU)fi(x' y) = ΣΧ, yp(x' y)fi(x,y) ⑶我們稱表徵函數fi(x,y)為特徵函數,或簡稱特徵。所以上式被稱為關於特徵 fi(x, y)的一個約束方程,簡稱為約束。約束是隨機過程ρ(y |χ)和訓練樣例關於某一特徵 的一個等式,它對P(yIχ)的分布做了某些限制,使之產生的樣例在特徵指示的方面,從統 計意義上接近訓練樣例。假設已經定義了 η個特徵,滿足這η個特徵的所有隨機過程構成一個集合
C ^ {p( y| X) I P (fi) = P (fi)forii {1,2, ··., η}} (4)一般地,C| > 1。我們選取其中熵最大的那個隨機過程作為重建出來的模型。這 裡的熵是條件熵,表示為H(p)三 一yP(x)p(ylx)logp(ylx)(5)則我們最終重建出來的模型為p* = arg max pecH(p) (6)該模型稱之為最大熵模型。熵最大的原則保證了最大熵模型具有很好的泛化效 果。最大熵模型的表達形式和參數計算求解(6)式得到最大熵模型具有如下的形式P ( y I Χ)y))(7)上式中,Xi是特徵fi(x,y)的權重,可以使用IIS或L-BreS迭代算法,從訓練語 料中訓練得到。Z(X)是歸一化係數。總結語法規則包括請參閱圖2,對輸入的句子進行短語劃分,並確定各短語的詞性,再根據漢語結構 特點對語法規則進行總結。比如,名詞可以為主語,形容詞可以為定語,以及一些其他的復 合規則,如狀語+謂語+補語,可以為動詞短語等。具體的總結主要是根據現實中的一些 句子來總結,比如在多個名詞可以組合成名詞短語,假設四個名詞組合成名詞短語,則可以總結規則為「名詞加名詞加名詞加名詞可以組成名詞短語」。當然,名詞的數量並未限制, 為了減少規則,則可以將上述規則總結為兩條規則「名詞加名詞是名詞短語」、「名詞加名 詞短語是名詞短語」。然後根據句子語法結構規則確定各種短語在句子中的成分及句子的 結構,並解析為多個短語組合的形式。比如,名詞短語可以做主語、賓語,形容詞可以做狀語 等。句子結構可以為「主語+謂語+賓語」等等。在對最大熵模型訓練及總結語法規則之後,便可以採用對韻律短語進行預測,預 測過程如下SlOl,最大熵模型預測。首先最大熵模型對輸入句子進行解析,解析出最大熵的輸入特徵,如詞性、詞長等 特徵。然後將這些特徵輸入最大熵模型進行預測,最大熵模型會給出詞與詞之間是否為韻 律短語邊界的概率。如果該概率很大,則該邊界被認為是一個韻律短語邊界。S102,語法邊界預測。根據總結的語法規則對輸入的句子進行分析,將輸入句子進行短語劃分最終將句
子解析為多個短語組合的形式。如,短語1+短語2+短語3+......,然後根據句子的語法結
構規則,分析出語法邊界,如主謂邊界、謂賓邊界等,得到句子的語法結構。比如,短語1可 以做主語、賓語,短語2可以做謂語,短語3可以作賓語,由於句子結構可以為「主語+謂語 +賓語」。則可以確定短語1為主語、短語2為謂語,短語3為賓語。S103,調整最大熵模型預測出語法邊界之後,對最大熵模型預測結果進行調整,因為韻律短語邊界一定 是語法短語邊界,而語法短語邊界不一定是韻律短語邊界。因此,將語法邊界處是韻律短語 邊界的概率調大,將非語法邊界處是韻律短語邊界的概率調小,最後根據調整後的概率結 果確定韻律短語邊界。下面結合實例對上述方法進行說明首先,對輸入文本進行解析,得到最大熵的輸入特徵,例如,輸入句子為「最大熵模 型預測韻律短語邊界」,則需要進行分詞,詞性標註等處理,如「最大熵/名詞、模型/名詞、 預測/動詞、韻律/名詞、短語/名詞、邊界/名詞」等,即解析出最大熵的輸入特徵,然後 根據最大熵訓練出來的每個特徵的概率,得到此處是韻律短語邊界的概率。「最大熵」、「模 型」、「韻律」、「短語」、「邊界」等都是名詞,根據最大熵模型,相鄰的「最大熵,,及「模型」是 韻律短語邊界的概率較大,同時相鄰的「韻律」、「短語」、「邊界」是韻律短語邊界的概率也較 大。然後,根據總結的語法規則,將輸入的句子進行短語劃分。例如,「最大熵」、「模型」 是名詞,此處,兩個名詞組合成名詞短語,「預測」是動詞,「韻律」、「短語」、「邊界」也是名詞, 此處,三個名詞組合成名詞短語。根據語法規則,名詞短語可以為主語也可以為賓語,而動 詞前的名詞短語為主語,動詞後的名詞短語為賓語。則可以分析出,此處,「最大熵模型」可 以做主語,「預測」可以做謂語,「韻律短語邊界」可以做賓語,則「最大熵模型」和「預測」之 間是主謂邊界,「預測」和「韻律短語邊界」之間是謂賓邊界。最後,對最大熵模型預測的概率進行調整,在語法邊界處是韻律短語的概率調大, 非語法邊界處是韻律短語的概率調小,然後根據調整後的概率確定韻律短語邊界。即,將 「最大熵模型」整體及「韻律短語邊界」整體做為韻律短語的概率調大,而將單一的名詞做為韻律短語的概率調小。另外,由於不同的語法邊界處是韻律短語邊界的可能性不一樣,故在 對最大熵預測的概率進行調整時,需要根據不同的語法邊界調整不同的幅度。本發明的韻律短語預測方法中,通過採用語法短語邊界來調整最大熵模型,將語 法短語邊界是韻律短語邊界的概率增大,將非語法短語邊界處是韻律短語邊界的概率減 小,可以避免一些統計模型預測的錯誤,提高了韻律短語邊界預測的準確性。以上對本發明所提供的一種韻律短語預測方法,進行了詳細介紹,本文中應用了 具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本 發明的方法及其核心思想;同時,對於本領域的一般技術人員,依據本發明的思想,在具體 實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的 限制。
權利要求
1.一種韻律短語預測方法,其特徵在於,包括最大熵模型預測,分析句子的特徵,並對韻律短語進行預測;語法邊界預測,分析句子的特徵,根據語法規則對語法邊界進行預測;對最大熵模型預測結果進行調整,通過預測出的語法邊界,對最大熵模型預測結果進 行調整,並根據調整後的概率結果確定韻律短語邊界。
2.如權利要求1所述的韻律短語預測方法,其特徵在於,所述對最大熵模型預測結果 的調整包括將最大熵模型預測結果中語法邊界處是韻律短語邊界的概率增大,非語法邊界 處是韻律短語邊界的概率降低。
3.如權利要求1所述的韻律短語預測方法,其特徵在於,所述最大熵模型預測之前還 包括建立最大熵模型,建立最大熵模型包括選擇最大熵模型特徵、準備訓練數據及最大熵 模型訓練。
4.如權利要求3所述的韻律短語預測方法,其特徵在於,所述最大熵模型預測包括解 析出句子中分詞邊界等特徵,並根據確定的特徵進行標註,然後將標註後的數據送入最大 熵模型進行預測,得出詞與詞之間是否為韻律短語邊界的概率。
5.如權利要求3所述的韻律短語預測方法,其特徵在於,所述最大熵模型解析出的特 徵包括前一詞的詞性、詞長,後一詞的詞性、詞長或者詞性與詞長的組合。
6.如權利要求1所述的韻律短語預測方法,其特徵在於,所述語法邊界預測之前還包 括總結語法規則,並根據語法規則確定句子中的短語在句中的成分及句子的結構。
7.如權利要求6所述的韻律短語預測方法,其特徵在於,所述語法規則的總結根據漢 語結構特點進行。
8.如權利要求6所述的韻律短語預測方法,其特徵在於,所述語法邊界預測還包括根 據總結的語法規則將句子進行短語劃分,並解析為多個短語組合的形式,然後根據句子的 語法結構規則,分析出語法邊界。
全文摘要
本發明提供了一種韻律短語預測方法,包括最大熵模型預測,分析句子的特徵,並對韻律短語進行預測;語法邊界預測,分析句子的特徵,根據語法規則對語法邊界進行預測;對最大熵模型預測結果進行調整,通過預測出的語法邊界,對最大熵模型預測結果進行調整,並根據調整後的概率結果確定韻律短語邊界。本發明的韻律短語預測方法中通過對句子進行成分分析,得出語法短語邊界,然後對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界的概率增大,將非語法短語邊界處是韻律短語邊界的概率減小,提高了韻律短語預測的準確性。
文檔編號G10L15/04GK102063898SQ20101029455
公開日2011年5月18日 申請日期2010年9月27日 優先權日2010年9月27日
發明者張連毅, 李健, 武衛東 申請人:北京捷通華聲語音技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀