一種語音線性預測編碼模型的缺失值非線性估算方法
2023-05-15 02:01:56
一種語音線性預測編碼模型的缺失值非線性估算方法
【專利摘要】本發明實施例公開了一種語音線性預測編碼模型的缺失值非線性估算方法。該方法包括如下步驟:線譜頻率參數變換步驟:將語音線性編碼預測模型的線譜頻率參數通過線性變換轉化為線譜頻率參數差值;訓練模型步驟;傳輸過程中丟失部分和收到部分概率分布計算步驟;最小均方誤差最優化估計步驟。利用本發明實施例,能夠在分組傳輸丟包的情況下,可靠的實現線性預測模型的最優估計,降低傳輸損失,提高語音質量,具有很大的實用價值。
【專利說明】一種語音線性預測編碼模型的缺失值非線性估算方法
【技術領域】
[0001]本發明涉及在分組網絡中,語音傳輸過程中包丟失的處理問題,著重描述了一種基於變換的線譜頻率參數和狄利克雷混合模型的非線性最優化估計方法。
【背景技術】
[0002]隨著網際網路技術的深入發展,語音通信技術得到了長足的進步,傳輸的語音信號已經由窄帶信號傳播演進到了寬帶信號傳播。伴隨著多媒體應用的不斷開發與推廣,人們對於在語音通信技術中語音傳輸質量和實時性的要求越來越高,因此,研究高效可靠的語音通信算法,具有迫切的社會需求。
[0003]語音通信中要解決的首要問題是語音的編碼。經過數十年的發展,語音編碼技術大致可以分為三種方式:波形編碼技術、基於參數模型的編碼技術和混合編碼技術。波形編碼技術針對語音波形直接進行量化和傳輸,不基於聲學模型。基於參數模型的編碼技術將語音通過線性預測模型分析後,分別傳輸線性預測模型,邊信息和語音能量信息。混合編碼技術是上述兩者的結合。
[0004]在語音編碼中,基於參數模型的編碼被廣泛應用,其核心在於如何有效可靠的實現線性預測模型的量化和編碼。在語音線性預測編碼模型的研究中,一般把線性預測編碼參數轉化為線譜頻率參數,這種表示方法較其他參數表示方法更為穩定高效,原因在於其頻譜敏感區域的分布較為平均。
[0005]在分組網絡中傳輸語音時,語音恢復的質量很大程度上取決於網絡的狀況。在分組網絡傳輸的模式下,如果能夠從已知信息估計出延遲或丟失的分組,可以有效地回復出語音信號,並且避免額外的延遲,從而提高語音質量,改善用戶的體驗。傳統的缺失的和接收到的線譜頻率元素間的聯合分布主要由高斯混合模型進行建模,通過高斯混合模型來模擬接收到部分和丟失部分的聯合分布,從而最優估計出丟失的包的信息。最新的研究表明,對於線性預測模型的編碼可以通過量化線譜頻率參數差值來實現,此方法比傳統的基於高斯混合模型的線譜頻率參數量化更為有效。在傳輸線譜頻率差值的時候,傳統的高斯混合模型無法很好地模擬數據的分布,也就不能實現最優的預測。因此,針對線譜頻率差值設計相應的統計模型並由此模型來最優估計分組傳輸中丟失的包就顯得尤為重要。
【發明內容】
[0006]針對現有語音傳輸過程中的丟包問題,本發明的目的是提供一種非線性最優化算法來估計所丟失的內容,最大限度恢復傳輸的語音質量。
[0007]為達到上述目的,本發明提出的非線性最優化缺失值估計方法包括下列步驟:
[0008]線譜頻率參數變換步驟:將語音線性編碼預測模型的線譜頻率參數通過線性變換轉化為線譜頻率參數差值;
[0009]訓練模型步驟:在發送端,使用狄利克雷混合模型(DMM-Dirichlet mixturemodel)模擬線譜頻率參數差值的分布,採用期望最大化算法訓練DMM中的各個參數;[0010]傳輸過程中丟失部分和收到部分概率分布計算步驟:根據線譜頻率參數差值滿足狄利克雷分布(Dirichlet distribution)的假設,把線譜頻率參數差值分成丟失部分和收到部分,分別歸一化後得到相應的狄利克雷分布;
[0011]最小均方誤差最優化估計步驟:按照最小均方誤差標準,得到缺失值的最優估計。
[0012]線譜頻率參數變換步驟中,利用線譜頻率參數的①非負特性,②有序特性和③有界特性將其變換為線性譜參數差值ALSF,此差值的特徵為:①分布在(0,1)開區間內,②加和為I ;此步驟具體過程如下:
[0013]1)K維線譜頻率參數表示為s = [S1, S2,…,sK]T,滿足O < S1 < S2 <,…,sK< π ;
[0014]2)變換後的K+1維線譜頻率參數差值ALSF為
【權利要求】
1.一種語音線性預測模型的非線性最優化丟包估計方法,其特徵在於,包括以下步驟: 線譜頻率參數變換步驟:將語音線性編碼預測模型的線譜頻率參數通過線性變換轉化為線譜頻率參數差值; 訓練模型步驟:在發送端,使用狄利克雷混合模型(DMM-Dirichlet mixture model)模擬線譜頻率參數差值的分布,採用期望最大化算法訓練的DMM中的各個參數; 傳輸過程中丟失部分和收到部分概率分布計算步驟:根據線譜頻率參數差值滿足狄利克雷分布(Dirichlet distribution)的假設,把線譜頻率參數差值分成丟失部分和收到部分,分別歸一化後得到相應的狄裡特雷分布; 最小均方誤差最優化估計步驟:按照最小均方誤差標準,得到缺失值的最優估計。
2.如權利要求1所述的方法,其特徵在於,線譜頻率參數變換步驟中,利用線譜頻率參數的①非負特性,②有序特性和③有界特性將其變換為線性譜參數差值ALSF,此差值的特徵為:①分布在(0,I)開區間內,②加和為I ;此步驟具體過程如下: 1)K 維線譜頻率參數表示為 s = [S1, S2, , sK]T,滿足 O < S1 < S2 <,..., sK < π ; 2)變換後的Κ+1維線譜頻率參數差值ALSF為5= 1;,?,...,?;,其中.V, in1=1
3.如權利要求2所述的方法,其特徵在於,訓練模型步驟中,傳輸之前,假設權利要求2中算得的?滿足狄利克雷分布,在發送端訓練模型,得到條件概率分布中的混合分量參數 可表示為:
4.如權利要求3所述的方法,其特徵在於,計算傳輸過程中丟失部分和收到部分概率分布步驟,假設、滿足狄利克雷分布,它在傳輸後可以分為兩部分:丟失部分Sw和收到部分可以通過兩者的相關特性估計其中的丟失部分;由於狄利克雷向量^是中性向量(neutral vector),將f和f分別歸一化後可計算得到它們的邊緣概率分布,其過程如下: 1)輸入:將上一步驟中得到的ALSF參數分成丟失部分和收到部分,即
5.如權利要求4所述的方法,其特徵在於,最小均方誤差最優化估計步驟:根據最小均方誤差準則,丟失部分的最佳估計,是歸一化丟失部分的均值與(1-Sk)相乘得到的結果,即丟失部分在已知收到部分基礎上的條件均值。計算結果如下式:
【文檔編號】G10L25/69GK103824561SQ201410054042
【公開日】2014年5月28日 申請日期:2014年2月18日 優先權日:2014年2月18日
【發明者】馬佔宇, 齊峰, 司中威, 郭軍, 張洪剛 申請人:北京郵電大學