韻律短語預測方法

2023-06-01 15:42:31 4

專利名稱：韻律短語預測方法
技術領域：
本發明涉及一種語音合成技術領域，特別是涉及一種韻律短語預測方法。
背景技術：
隨著技術的發展，語音合成技術已經越來越多的受到人們的關注。現階段合成語音的可懂度已經達到相當高的水平，但自然度還不夠高，韻律層次預測的不準確。由於現有的語音合成系統大多只能生成固定語調模式的語句，對語句中的停頓、輕重、長短、速度及升降調等出現不當處理，使合成語音聽起來枯燥、呆板。韻律生成的主要障礙在於確定韻律的層次，常見的韻律層次是把韻律結構自下而上劃分為韻律詞、次韻律短語、主韻律短語和呼吸群。近年來，越來越多的研究都集中於預測韻律結構。多通過首先設計或收集一個標註好的語料資料庫，然後用某種學習算法建立一個訓練模型，並用從數據庫中提取出的語法和韻律特徵參數對模型進行訓練，從而得到最終的韻律預測模型。然而，因為漢語語言結構非常複雜，採用目前常見韻律預測模型對於韻律短語邊界預測的正確率並不高，阻礙了自然度的進一步提高。

發明內容
本發明所要解決的技術問題是提供一種韻律短語預測方法，能夠提高韻律短語邊界預測的準確性。為了解決上述問題，本發明公開了一種韻律短語預測方法，包括最大熵模型預測，分析句子的特徵，並對韻律短語進行預測；語法邊界預測，分析句子的特徵，根據語法規則對語法邊界進行預測；對最大熵模型預測結果進行調整，通過預測出的語法邊界，對最大熵模型預測結果進行調整，並根據調整後的概率結果確定韻律短語邊界。進一步地，該方法中，對最大熵模型預測結果的調整包括將最大熵模型預測結果中語法邊界處是韻律短語邊界的概率增大，非語法邊界處是韻律短語邊界的概率降低。進一步地，該最大熵模型預測之前還包括建立最大熵模型，建立最大熵模型包括選擇最大熵模型特徵、準備訓練數據及最大熵模型訓練。進一步地，該最大熵模型預測包括解析出句子中分詞邊界等特徵，並根據確定的特徵進行標註，然後將標註後的數據送入最大熵模型進行預測，得出詞與詞之間是否為韻律短語邊界的概率。進一步地，該最大熵模型解析出的特徵包括前一詞的詞性、詞長，後一詞的詞性、詞長或者詞性與詞長的組合。進一步地，該語法邊界預測之前還包括總結語法規則，並根據語法規則確定句子中的短語在句中的成分及句子的結構。進一步地，該語法規則的總結根據漢語結構特點進行。進一步地，該語法邊界預測還包括根據總結的語法規則將句子進行短語劃分，並解析為多個短語組合的形式，然後根據句子的語法結構規則，分析出語法邊界。
與現有技術相比，本發明具有以下優點本發明的韻律短語預測方法中首先採用最大熵模型對韻律短語進行預測，然後對句子進行成分分析，得出語法短語邊界，如主謂邊界、謂賓邊界等。然後通過這些語法短語邊界對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界的概率增大，將非語法短語邊界處是韻律短語邊界的概率減小。因為韻律短語邊界一定是語法短語邊界，而語法短語邊界不一定是韻律短語邊界，因此提高了韻律短語預測的準確性。

圖1是本發明實施例的韻律短語預測方法的流程圖。圖2是圖1所示韻律短語預測方法中的語法規則分析的流程圖。
具體實施例方式為使本發明的上述目的、特徵和優點能夠更加明顯易懂，下面結合附圖和具體實施方式對本發明作進一步詳細的說明。請參閱圖1，本發明的韻律短語預測方法首先採用最大熵模型對韻律短語邊界進行預測；然後對句子進行成分分析，得出語法短語邊界，如主謂邊界、謂賓邊界等。然後通過這些語法短語邊界對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界的概率增大，將非語法短語邊界處是韻律短語邊界的概率減小。因為韻律短語邊界一定是語法短語邊界，而語法短語邊界不一定是韻律短語邊界，故若最大熵模型預測出的韻律短語邊界不在語法短語邊界上，則預測錯誤的可能性就比較大。下面對本發明的韻律短語預測方法進行詳細說明。在預測之前還包括建立最大熵模型及總結語法規則。其中，建立最大熵模型包括(1)選擇最大熵模型特徵選擇與韻律短語位置有關的特徵作為最大熵模型的特徵，例如，前一詞的詞性、詞長，後一詞的詞性、詞長，或者前一詞的詞性與詞長的組合。(2)準備訓練數據在選擇最大熵模型的特徵之後，進行訓練數據的準備，需要確定模型中分詞邊界的特徵。如前一詞的詞性、詞長，後一詞的詞性、詞長等等，即上述模型中的X。然後進行數據準備，準備一些語料，並根據確定的特徵進行標註。考慮一個隨機過程ρ (y I χ)，它根據能觀測到的向量X，以一定的概率輸出某個1，y 屬於一個有限集合Y。在韻律短語邊界預測中，Y= {1，0}，分別表示韻律短語邊界和非韻律短語邊界。X代表與韻律短語位置有關的特徵，即待判決的邊界的上下文環境，包括前一詞的詞性、詞長，後一詞的詞性、詞長等等。為了重建隨機過程P(y |χ)，我們對其輸出進行採
樣，得到N個訓練樣例(Xl，yi)，(x2，y2)，......，(xN,yN)0由於這些訓練樣例由此隨機過程
產生，所以我們假設某個事件在訓練樣例中的經驗概率，等於該事件在已知P (y I χ)時的期望概率。(3)訓練最大熵模型在準備好訓練數據後，利用準備好的訓練數據來訓練最大熵模型。將上一步標註了詞性、詞長、正確的韻律短語位置後的數據送入最大熵模型訓練，數據格式為是否是韻律短語邊界，特徵1，特徵2，特徵3，.......某個事件可以用一個表徵函數&&，y)來表示。如果樣例(Xj，Yj)中發生了此事件，貝IJfi (Xyyi) = 1 ；否則為0。例如如果χ滿足右邊第一個詞是連詞，且y為韻律短語邊界，則fi(x，y) = 1 ；其他情況，則fi(x，y) = 0。該事件在訓練樣例中的經驗概率表示為p(fi) = ΣΧ, yp(x' y)fi (χ' y)(i)其中，ρ(χ, y)是樣例(X，y)在訓練樣例中出現的概率，p(x, y))=^
χ (X, y)在訓練語料中的出現次數。如果已知p(y|x)，則事件fi(x，y)的期望概率表示為p(fi) = Σχ, yp(x)p(y|x)fi(x' y)(2)其中，P(X)是訓練例中χ的概率。根據我們的假設有ρ (fi) = ρ (fi),即Σχ, yp(x)p(yU)fi(x' y) = ΣΧ, yp(x' y)fi(x，y) ⑶我們稱表徵函數fi(x，y)為特徵函數，或簡稱特徵。所以上式被稱為關於特徵 fi(x, y)的一個約束方程，簡稱為約束。約束是隨機過程ρ(y |χ)和訓練樣例關於某一特徵的一個等式，它對P(yIχ)的分布做了某些限制，使之產生的樣例在特徵指示的方面，從統計意義上接近訓練樣例。假設已經定義了 η個特徵，滿足這η個特徵的所有隨機過程構成一個集合
C ^ {p( y| X) I P (fi) = P (fi)forii {1，2, ··., η}} (4)一般地，C| > 1。我們選取其中熵最大的那個隨機過程作為重建出來的模型。這裡的熵是條件熵，表示為H(p)三一yP(x)p(ylx)logp(ylx)(5)則我們最終重建出來的模型為p* = arg max pecH(p) (6)該模型稱之為最大熵模型。熵最大的原則保證了最大熵模型具有很好的泛化效果。最大熵模型的表達形式和參數計算求解(6)式得到最大熵模型具有如下的形式P ( y I Χ)y))(7)上式中，Xi是特徵fi(x，y)的權重，可以使用IIS或L-BreS迭代算法，從訓練語料中訓練得到。Z(X)是歸一化係數。總結語法規則包括請參閱圖2，對輸入的句子進行短語劃分，並確定各短語的詞性，再根據漢語結構特點對語法規則進行總結。比如，名詞可以為主語，形容詞可以為定語，以及一些其他的復合規則，如狀語+謂語+補語，可以為動詞短語等。具體的總結主要是根據現實中的一些句子來總結，比如在多個名詞可以組合成名詞短語，假設四個名詞組合成名詞短語，則可以總結規則為「名詞加名詞加名詞加名詞可以組成名詞短語」。當然，名詞的數量並未限制，為了減少規則，則可以將上述規則總結為兩條規則「名詞加名詞是名詞短語」、「名詞加名詞短語是名詞短語」。然後根據句子語法結構規則確定各種短語在句子中的成分及句子的結構，並解析為多個短語組合的形式。比如，名詞短語可以做主語、賓語，形容詞可以做狀語等。句子結構可以為「主語+謂語+賓語」等等。在對最大熵模型訓練及總結語法規則之後，便可以採用對韻律短語進行預測，預測過程如下SlOl，最大熵模型預測。首先最大熵模型對輸入句子進行解析，解析出最大熵的輸入特徵，如詞性、詞長等特徵。然後將這些特徵輸入最大熵模型進行預測，最大熵模型會給出詞與詞之間是否為韻律短語邊界的概率。如果該概率很大，則該邊界被認為是一個韻律短語邊界。S102，語法邊界預測。根據總結的語法規則對輸入的句子進行分析，將輸入句子進行短語劃分最終將句
子解析為多個短語組合的形式。如，短語1+短語2+短語3+......，然後根據句子的語法結
構規則，分析出語法邊界，如主謂邊界、謂賓邊界等，得到句子的語法結構。比如，短語1可以做主語、賓語，短語2可以做謂語，短語3可以作賓語，由於句子結構可以為「主語+謂語 +賓語」。則可以確定短語1為主語、短語2為謂語，短語3為賓語。S103，調整最大熵模型預測出語法邊界之後，對最大熵模型預測結果進行調整，因為韻律短語邊界一定是語法短語邊界，而語法短語邊界不一定是韻律短語邊界。因此，將語法邊界處是韻律短語邊界的概率調大，將非語法邊界處是韻律短語邊界的概率調小，最後根據調整後的概率結果確定韻律短語邊界。下面結合實例對上述方法進行說明首先，對輸入文本進行解析，得到最大熵的輸入特徵，例如，輸入句子為「最大熵模型預測韻律短語邊界」，則需要進行分詞，詞性標註等處理，如「最大熵/名詞、模型/名詞、預測/動詞、韻律/名詞、短語/名詞、邊界/名詞」等，即解析出最大熵的輸入特徵，然後根據最大熵訓練出來的每個特徵的概率，得到此處是韻律短語邊界的概率。「最大熵」、「模型」、「韻律」、「短語」、「邊界」等都是名詞，根據最大熵模型，相鄰的「最大熵，，及「模型」是韻律短語邊界的概率較大，同時相鄰的「韻律」、「短語」、「邊界」是韻律短語邊界的概率也較大。然後，根據總結的語法規則，將輸入的句子進行短語劃分。例如，「最大熵」、「模型」是名詞，此處，兩個名詞組合成名詞短語，「預測」是動詞，「韻律」、「短語」、「邊界」也是名詞，此處，三個名詞組合成名詞短語。根據語法規則，名詞短語可以為主語也可以為賓語，而動詞前的名詞短語為主語，動詞後的名詞短語為賓語。則可以分析出，此處，「最大熵模型」可以做主語，「預測」可以做謂語，「韻律短語邊界」可以做賓語，則「最大熵模型」和「預測」之間是主謂邊界，「預測」和「韻律短語邊界」之間是謂賓邊界。最後，對最大熵模型預測的概率進行調整，在語法邊界處是韻律短語的概率調大，非語法邊界處是韻律短語的概率調小，然後根據調整後的概率確定韻律短語邊界。即，將「最大熵模型」整體及「韻律短語邊界」整體做為韻律短語的概率調大，而將單一的名詞做為韻律短語的概率調小。另外，由於不同的語法邊界處是韻律短語邊界的可能性不一樣，故在對最大熵預測的概率進行調整時，需要根據不同的語法邊界調整不同的幅度。本發明的韻律短語預測方法中，通過採用語法短語邊界來調整最大熵模型，將語法短語邊界是韻律短語邊界的概率增大，將非語法短語邊界處是韻律短語邊界的概率減小，可以避免一些統計模型預測的錯誤，提高了韻律短語邊界預測的準確性。以上對本發明所提供的一種韻律短語預測方法，進行了詳細介紹，本文中應用了具體個例對本發明的原理及實施方式進行了闡述，以上實施例的說明只是用於幫助理解本發明的方法及其核心思想；同時，對於本領域的一般技術人員，依據本發明的思想，在具體實施方式及應用範圍上均會有改變之處，綜上所述，本說明書內容不應理解為對本發明的限制。
權利要求
1.一種韻律短語預測方法，其特徵在於，包括最大熵模型預測，分析句子的特徵，並對韻律短語進行預測；語法邊界預測，分析句子的特徵，根據語法規則對語法邊界進行預測；對最大熵模型預測結果進行調整，通過預測出的語法邊界，對最大熵模型預測結果進行調整，並根據調整後的概率結果確定韻律短語邊界。
2.如權利要求1所述的韻律短語預測方法，其特徵在於，所述對最大熵模型預測結果的調整包括將最大熵模型預測結果中語法邊界處是韻律短語邊界的概率增大，非語法邊界處是韻律短語邊界的概率降低。
3.如權利要求1所述的韻律短語預測方法，其特徵在於，所述最大熵模型預測之前還包括建立最大熵模型，建立最大熵模型包括選擇最大熵模型特徵、準備訓練數據及最大熵模型訓練。
4.如權利要求3所述的韻律短語預測方法，其特徵在於，所述最大熵模型預測包括解析出句子中分詞邊界等特徵，並根據確定的特徵進行標註，然後將標註後的數據送入最大熵模型進行預測，得出詞與詞之間是否為韻律短語邊界的概率。
5.如權利要求3所述的韻律短語預測方法，其特徵在於，所述最大熵模型解析出的特徵包括前一詞的詞性、詞長，後一詞的詞性、詞長或者詞性與詞長的組合。
6.如權利要求1所述的韻律短語預測方法，其特徵在於，所述語法邊界預測之前還包括總結語法規則，並根據語法規則確定句子中的短語在句中的成分及句子的結構。
7.如權利要求6所述的韻律短語預測方法，其特徵在於，所述語法規則的總結根據漢語結構特點進行。
8.如權利要求6所述的韻律短語預測方法，其特徵在於，所述語法邊界預測還包括根據總結的語法規則將句子進行短語劃分，並解析為多個短語組合的形式，然後根據句子的語法結構規則，分析出語法邊界。
全文摘要
本發明提供了一種韻律短語預測方法，包括最大熵模型預測，分析句子的特徵，並對韻律短語進行預測；語法邊界預測，分析句子的特徵，根據語法規則對語法邊界進行預測；對最大熵模型預測結果進行調整，通過預測出的語法邊界，對最大熵模型預測結果進行調整，並根據調整後的概率結果確定韻律短語邊界。本發明的韻律短語預測方法中通過對句子進行成分分析，得出語法短語邊界，然後對最大熵模型的預測結果進行調整。將語法短語邊界處是韻律短語邊界的概率增大，將非語法短語邊界處是韻律短語邊界的概率減小，提高了韻律短語預測的準確性。
文檔編號G10L15/04GK102063898SQ20101029455
公開日2011年5月18日申請日期2010年9月27日優先權日2010年9月27日
發明者張連毅, 李健, 武衛東申請人:北京捷通華聲語音技術有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

韻律短語預測方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法