用於基於語音相關結構的盲信道估計的方法和裝置的製作方法

2023-11-05 13:39:22 1

專利名稱：用於基於語音相關結構的盲信道估計的方法和裝置的製作方法
技術領域：
本發明涉及一種用於語音信號處理的方法和裝置，並特別涉及一種在語音系統中，例如在語音和說話者識別系統中去除信道畸變的方法和裝置。
背景技術：
倒譜均值歸一化(CMN)是一種在自動語音識別系統中去除通信信道畸變的有效的技術。為了有效的工作，CMN系統中的語音處理窗口必須非常長，以保存語音信息。不幸的是，當處理非平穩信道時，最好使用更小的窗口，而更小的窗口卻不能在CMN系統中一樣有效的工作。而且，CMN技術是基於這樣一個假定語音均值不攜帶語音信息，或者其在處理窗口期間是常數。然而，當使用短時窗口時，語音均值會攜帶重要的語音信息。
對影響語音信號的通信信道的估計問題屬於所熟知的盲系統辨識範疇。當只獲得一種語音信號時(即「單麥克風」的情況)，估計問題沒有一般的解決方法。可以使用超採樣來獲得估計信道所必需的信息，但是如果只獲得一種語音信號並且沒有可能進行超採樣，那麼如果不對信號源做出假設，就不可能解決估計問題的每個特例。例如，當識別器不能使用數字轉換器時，如果不對信號源做出假設，則不可能為電話語音識別進行信道估計。

發明內容
因此，本發明的一個構造提供一種用於被通信信道損壞的語音信號的盲信道估計方法。該方法包括將含噪語音信號轉換為倒譜表示或者對數譜表示；估計該含噪語音信號表示的時間相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和含噪語音信號表示的相關以及該含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統解算式的符號，以估計在處理窗口上的平均乾淨語音信號。
本發明的另一構造提供一種用於被通信信道損壞的語音信號的盲信道估計裝置。該裝置被構造使得將含噪語音信號轉換為倒譜表示或者對數譜表示；估計該含噪語音信號的表示的時間相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和含噪語音信號表示的相關以及該含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統解算式的符號，以估計在處理窗口上的平均乾淨語音信號。
本發明還有一個構造提供一種其上記錄有指令的機器可讀介質或媒體，所配置的指令使得包括可編程處理器和數位訊號處理器中至少一個的裝置進行如下操作將含噪語音信號轉換為倒譜表示或者對數譜表示；估計該含噪語音信號的表示的時間相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和該含噪語音信號表示的相關以及該含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統解算式的符號，以估計在處理窗口上的平均乾淨語音信號。
本發明的這些構造提供有效並且高效的語音通信信道的估計，而不會刪除語音信息。
下文所提供的詳細描述，可以明顯看出本發明進一步的應用領域。應該理解的是，雖然示出了本發明的優選實施例，但是詳細描述和具體範例只是用於說明性的目的，而不意欲限制本發明的範圍。

通過下面的詳細描述和附圖可以對本發明更加全面的理解，其中圖1是本發明盲信道估計器的一種構造的功能框圖；圖2是適合圖1的構造使用的最大似然模塊的雙通實施方式的框圖；圖3是適合圖1的構造使用的最大似然模塊的雙通GMM實施方式的框圖；
圖4是本發明的盲信道估計器的另一種構造的功能框圖；圖5是本發明盲信道估計方法的的一種構造的流程圖。
具體實施例方式
下面優選實施例的描述實際上只是示範性的，並不意欲對本發明、其應用或使用進行限定。
這裡所使用的「含噪語音信號」指的是被通信信道損壞和/或濾波的信號。還有這裡所使用的「乾淨語音信號」指的是沒有被通信信道濾波的語音信號，即通過具有平坦頻率響應的系統傳送的語音信號，或者用來訓練用於語音識別系統的聲學模型的語音信號。「平均乾淨含噪語音信號」指的是從語音信號中去除了通信信道的損壞和/或濾波的估計的含噪語音信號的估計。
參照圖1，在本發明的盲信道估計器10的一種構造中，利用存儲的語音相關結構 14對語音通信信道12進行估計和補償。如圖1所示，盲信道估計器10表示語音識別系統的一部分，其中信道12的輸出是含噪語音信號g(t)＝s(t)*h(t)，其中s(t)表示利用麥克風或音頻處理器16的輸出、或通過具有平坦頻率響應的濾波器得到的「乾淨」語音信號，h(t)表示信道12的濾波器。g(t)所表示的信號通過倒譜分析模塊18(或通過對數譜分析模塊，未示出)轉換為倒譜(或對數譜)域中的信號Y(t)＝S(t)+H(t)。
設S(t)為表示倒譜(或對數譜)域中的「乾淨」語音信號。假設乾淨語音信號的幀間時間相關是τ的遞減函數E[S(t)ST(t+τ)]＝fτ(E[S(t)S(t)ST(t)])， (1)fτ通過時不變線性濾波器近似為fτ(E[S(t)S(t)ST(t)])＝A(τ)E[S(t)ST(t)]。(2)通過執行倒譜分析(即獲得倒譜域中的S(t))，然後執行如下的相關，可以從乾淨語音訓練信號中得到矩陣A(τ)的估計
E[S(t)ST(t+)]1N0NS(t+)ST(t++)d,---(3)]]>將E[S(t)ST(t+τ)]與E[S(t)ST(t)](即τ延遲與零延遲的相關)的比值進行平均A(t,)=E[S(t)ST(t+)]E[S(t)ST(t)],---(4)]]>並在訓練集上進行積分A^=E[A]1N0TA(t,)dt,---(5)]]>其中等式3中的積分在處理窗口的N個採樣值上進行，並且等式5中的積分在整個訓練集上進行。等式3至5所描述的計算步驟是對在基本上沒有噪聲的環境中得到的乾淨語音訓練信號進行的，從而可以得到基本上等於s(t)的信號。在使用含噪信道12對盲信道估計器10開始操作之前，將從該信號中得到的估計存儲在相關結構模塊14中。
對於信道估計而言，因為等式1中的假設校驗完好，即相對誤差較小，最好使用短時延，但是時延不要太小使得該語音信號相關不能控制該通信信道相關。
在倒譜域(或對應的對數譜域)中觀測倒譜分析模塊18(或對應的對數譜分析模塊)所產生的含噪語音信號Y(t)。含噪語音信號Y(t)記作Y(t)＝S(t)+H(t)， (6)其中S(t)是原始的乾淨語音信號s(t)的倒譜域表示，而H(t)是通信信道12的時變響應h(t)的倒譜域表示。然後所觀測的信號Y(t)的相關通過相關估計器20確定。我們用信號Y(t)與具有時延τ的信號Y(t+τ)(或等價的Y(t-τ))表示為CY(τ)，其中CY(τ)＝E[Y(t)YT(t+τ)]。
線性系統解算器模塊22從相關估計器20產生的相關CY和存儲在相關結構模塊14中的相關結構得出式子AA=(I-A^)-1(CY-A^CY(0)).---(7)]]>同時，平均器模塊24根據倒譜分析模塊18的輸出Y(t)確定值b
b＝E[Y(t)]， (8)以及線性等式解算器22解算下面用於得到μs的等式系統ssT=bbT-A=B,]]>和 (9)μs+H＝b。
(10)等式9和10的系統是超定的，意味著單個等式的數目超過了未知量的數目。因此，在盲信道估計器10中，這種等式系統作為最小化問題解算，比如作為最小均方誤差問題解算。等式10用於解算s=S^,]]>其中μs是沒有信道損壞或在處理窗口上過濾的平均語音信號的平均值的估計，並利用線性系統解算器22最小化如下等式mins||ssT-B||2.---(11)]]>(一種構造中的估計並不用於語音識別，是因為用於信道估計的處理窗口，比如為40-200ms，比用於語音識別的窗口，比如為10-20ms要更長。然而，在這種構造中，用來估計其中H^=1TY(t)-^s,]]>其中求和運算在該處理窗口(例如200ms)上進行，然後S(t)用於在較短的處理窗口中識別，其中S^(t)=Y(t)-H^.)]]>在這種構造中，S(t)表示在較短的處理窗口上的乾淨語音，並且在此處稱之為「短窗乾淨語音」。
在本發明的一種構造中，線性系統解算器22通過設置下式來執行有效的最小化μs＝±λ1p1， (12)其中λ1是B的最大的特徵值，p1是對應的特徵向量。在該構造中，通過查找對應於最大特徵值(絕對值形式)的特徵向量來得到等式12的解。這是用於解決非對稱實矩陣的對角化問題的子情況。雖然已知多種方法用於解決這種類型的問題，但這些方法的精度是由最大與最小特徵值之間的比值決定的，也就是說，數值法更適合於較大特徵值差的情況。通過實驗，發現在本發明的構造中，最大和第二大的特徵值的差別大約有一到兩個數量級。因此具有足夠的穩定性，並且可以比較有把握地假定存在一個特徵向量，該特徵向量比其它任何特徵向量能更好地最小化該代價函數。該特徵向量提供一個在處理窗口上的平均乾淨語音μs的估計。
因為所得到的語音估計都是模量，可以使用試探方式來得到正確的符號。在盲信道估計器10中，最大似然估計器26使用聲學模型來確定等式12的解的符號。例如，在兩個解碼通道中，或者使用語音和靜音高斯混合模型(GMM)來執行最大似然估計。
參照圖2，在雙通最大似然估計器模塊26的一種構造中，將Y(t)輸入兩個估計器模塊52、54。估計器模塊52也接收作為輸入，並且估計器54模塊也接收作為輸入。估計器模塊52的結果是而估計器模塊54的結果是這些結果分別輸入執行語音識別的全解碼器56和58。全解碼器56和58的輸出被輸入到最大似然選擇器模塊60，其使用兼有解碼器56和58的語音識別輸出的似然信息來選擇從全解碼器56和58輸出的字作為結果。在圖2沒有示出的一種構造中，最大似然選擇器模塊60的輸出為或的輸出補充或者替代解碼器模塊56和58的解碼語音輸出，但的輸出仍然取決於由模塊56和58所提供的似然信息。
在圖3中提供了一種雙通GMM最大似然解碼模塊26A的構造，其可以替代圖2的雙通最大似然估計器模塊26。在這種構造中，估計和分別輸入到語音和靜音GMM解碼器72和74，最大似然選擇器模塊76從GMM解碼器72和74的輸出中選擇，以確定該構造的輸出在如圖3所示的構造中，最大似然選擇器模塊76的輸出輸入到全語音識別解碼模塊78，以產生解碼語音的最終輸出。
參照圖4，在本發明的盲信道估計器30的另一種構造中，在線性系統解算器模塊22中使用相同的最小化，但是使用最小信道範數模塊32來確定該解的符號。在盲信道估計器30中，選擇使信道倒譜的範數‖H(t)‖2＝‖Y-μs‖2最小化的s=S^(t)]]>的符號作為解±μs的正確符號。該符號的解是基於這樣一種假設平均起來，信道倒譜的範數比語音倒譜的範數小，因此選擇使得‖H(t)‖2＝‖Y-μs‖2最小化的±μs的符號作為語音信號的符號。
倒譜域(或對數譜域)中的估計語音信號適合在語音處理應用，比如語音或說話者識別中用於進一步分析。所估計的語音信號可以直接在倒譜域(或對數譜域)中使用，或者轉換成該應用所要求的另一種(例如時域或頻域)表示。
參照圖5，在本發明的盲信道估計方法100的一種構造中，提供了一種基於語音相關結構的盲信道估計的方法。步驟102中，從乾淨語音訓練信號s(t)中獲得相關結構基於在基本上沒有噪聲的環境中得到的乾淨語音訓練信號，用處理器執行等式3至5所描述的計算步驟，使得乾淨語音信號基本上等於s(t)。
然後在步驟104，得到要處理的含噪語音信號g(t)並將其轉換成倒譜域(或對數譜域)表示的Y(t)。然後在步驟106，使用Y(t)估計相關CY(τ)，並且在步驟108用Y(t)確定觀測信號Y(t)的平均值b。在步驟110，根據等式11的最小化限制構建和解算線性等式9和10的系統。在步驟112利用最大似然方法或範數最小化方法來選擇或確定該解的符號，因此，在處理窗口上產生平均乾淨語音信號的估計。
當語音源和通信信道更加接近的滿足下面四個條件時，使用本發明的構造可以得到更好的結果1、S(t)和H(t)是兩個獨立的隨機過程。
2、E[S(t+τ)]＝E[S(t)]，即S(t)是短時平穩過程。
3、在處理窗口內信道H(t)是常數，從而H(t)＝H，即為短時恆定應用。
4、語音源的相關結構滿足時不變線性濾波器模型，即E[S(t)ST(t+τ)]＝A(τ)E[S(t)ST(t)]。
可以認為這些條件足以滿足小的時延(短時結構)。然而當使用下面的普通的期望值估計器，第二個條件並不嚴格的滿足E[S(t)ST(t+)]=1N-i=1N-S(i)ST(i+).---(13)]]>因此，本發明的一種構造使用環形處理窗口E[S(t)ST(t+)]=1N-i=1N-S(i)ST(i+)+1i=1S(N-i)ST(i).---(14)]]>而且，在本方面的一種構造中，為了更接近的滿足相關結構條件，利用語音存在檢測器來確保在確定相關中忽略靜音幀，而只考慮語音幀。另外，利用短處理窗口更加接近的滿足短時恆定條件。因此，本發明的一種構造提供了語音檢測器模塊19來區分語音信號的有無，並且相關估計器模塊20和平均器模塊24利用該信息來確保只考慮語音幀。
在本發明的一種構造中，在倒譜域中應用上述方法。在另一種構造中，在對數譜域中應用該方法。在一種構造中，為了確保用來解算均方差問題所利用的對角化方法的精確性，使倒譜域或對數譜域中的係數的動態範圍是相等的。(通常有多個係數，因為倒譜或對數譜特徵是矢量。)例如在一種構造中，通過提取長時平均來歸一化倒譜係數，並白噪聲化協方差矩陣。在另一種構造中，使用對數譜係數而不是倒譜係數。
在本發明的一種構造中，倒譜係數用於信道去除。在另一種構造中，執行對數譜信道去除。在某些應用中可以進行對數譜信道去除，因為它在頻率上是局部的。
在本發明的一種構造中，利用四幀(40ms)的時延來確定輸入信號的相關。已經發現這種構造是低語音相關與低固有假設誤差之間的一種有效折衷方案。更具體地，如果處理窗口過長，H(t)可以不是常數，相反如果處理窗口過短，則不大可能得到好的相關估計。
利用一個或多個特殊用途的信號處理組件(即特別設計用於執行上述處理的組件)、適當的程序控制下的普通用途的數位訊號處理器、適當的程序控制下的普通用途的處理器或CPU、或它們的組合，以及在某些構造中附加的支持硬體(例如存儲器)，就可以物理上實現本發明的各種構造。對於實時語音識別(例如車輛的語音控制或即說即打計算機系統)，可以用麥克風或相似的傳感器和音頻模數轉換器(ADC)輸入用戶的語音。用於控制普通用途的可編程處理器或CPU、和/或普通用途的數位訊號處理器的指令可以以ROM固件的形式、以適當存儲媒體或介質上的機器可讀指令的形式，該介質不必是可刪除的或可改變的(例如軟盤、CD-ROM、DVD、快閃記憶體或硬碟)，或以從其他計算機接收到的信號(例如調製的電子載波信號)的形式提供。後一種情況的範例可以是通過網絡從遠程計算機接收到的指令，該遠程計算機自己可以存儲機器可讀形式的指令。
這裡，進一步描述這種構造的數學分析。
在倒譜域(或對數譜域)中觀測的被通信信道損壞的語音信號如上面的等式6所描述的。在時間t具有時延τ的信號X的相關為CX(τ)＝E[X(t)XT(t+τ)]。
(15)假定按照上文定義的無相關性、短時平穩、短時恆定條件，觀測信號的相關可以記作CY=CS+sHT+HST+HHT,---(16)]]>其中μs＝E[S(t)]。通過假定上文中的短時線性相關結構條件，可以得出上面的等式7和8。
通過考慮下面N2範數中的最小化問題，可以得出有效的最小化minX||XXT-B||2,---(17)]]>其中X＝[x1x2…xn]和B＝(bi，j)i，j∈1，…，n。假設B可對角化，則我們可以記作B＝PΛP*，其中Λ＝diag{λ1…λn}是對角矩陣，P＝{p1，…，pn}是單位矩陣。假定特徵值λ1…λn按照遞增順序λ1≥…≥λn排序。可以寫作minX||XXY-B||2~minY||YYT-||2,---(18)]]>
其中，Y＝PTX。也可以記作||YYT-||2=in(yi2-i)2+iji(yiyj)2.---(19)]]>通過進行偏微分，我們得到||YYT-||2yk=4yk(iyi2-k).---(20)]]>通過將微分設定為零，我們得到4yk(iyi2-k)=0,k=1...n.---(21)]]>由於已經假定λ1≥…≥λn，根據前面的等式，它滿足係數y1…yn中至多一個係數不為零。通過矛盾法，假定i1i2:yi10,yi20,]]>然後我們得到iyi2=i1,---(22)]]>iyi2=i2,---(23)]]>並且λi1≠λi2，這是不可能的。而且，給定Y是非零向量，我們得到yi0=i0yi=0iii0---(24)]]>因此，我們得到||YYT-||2=ii0i2,]]>並且使得‖YYT-Λ‖最小的解是i0＝1。這也就意味著最小化問題有兩個解X＝±λ1p1，其中λ1是B的最大特徵值，並且p1是對應的特徵向量。
本發明的構造提供了損壞語音信號的通信信道的有效估計。已經發現使用此處所描述的方法和裝置的試驗比標準倒譜均值歸一化技術更加有效，因為底層假定更容易驗證。這些試驗也表明，使用最小範數符號估計進行信道補償，靜態倒譜特徵相對於CMN具有顯著的改進。對於最大似然符號估計，建議在聯合估計聲學模型的時候，將信道符號作為隱藏變量考慮，並且在進行期望值最大(EM)算法時對其進行優化。
總之，對於完全使用倒譜域的本發明的構造，也存在對應的完全使用倒譜域的本發明的構造。一旦做出設計選擇其中一個或另一個域，在整個構造中應該一致的使用這個域，以避免另外需要從一個域轉換到另一個域。
本發明的描述實際上只是示範性的，因此，不脫離本發明要點的變化都被認為是處於本發明的範圍之中。這種改變並不被認為是脫離本發明的精神和範圍。
權利要求
1.一種用於被通信信道損壞的語音信號的盲信道估計方法，所述方法包括將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號表示；估計該含噪語音信號表示的相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和含噪語音信號表示的相關以及含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統的解的符號，以估計在處理窗口上的平均乾淨語音信號。
2.根據權利要求1所述的方法，進一步包括使用該平均乾淨語音估計來確定在該處理窗口上的平均信道估計；和使用該平均信道估計來確定在更短的處理窗口上的乾淨語音信號。
3.根據權利要求1所述的方法，其中所述選擇線性等式系統的解的符號包括利用最大似然準則選擇符號。
4.根據權利要求1所述的方法，其中所述選擇線性等式系統的解的符號包括選擇使得所估計的信道噪聲的範數最小的符號。
5.根據權利要求1所述的方法，其中所述將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號表示包括將該含噪語音信號轉換為倒譜表示。
6.根據權利要求1所述的方法，其中所述將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號表示包括將該含噪語音信號轉換為對數譜表示。
7.根據權利要求1所述的方法，進一步包括在基本上沒有噪聲的環境中得到乾淨語音訓練信號，和利用所述乾淨語音訓練信號確定所述相關結構。
8.根據權利要求1所述的方法，其中所述相關結構記作所述該含噪語音信號表示記作Y(t)＝S(t)+H(t)，其中Y(t)是該含噪語音信號表示，S(t)是該含噪語音信號的乾淨語音表示，並且H(t)是通信信道的時變響應表示；所述估計含噪語音信號表示的相關包括確定CY(τ)，其中CY(τ)＝E[YtYT(t+τ)]；所述確定含噪語音信號的平均值包括確定b＝E[Y(t)]；所述構建和解算線性等式系統包括解算記作如下的線性等式系統ssT=bbT-A=B,]]>和μs+H＝b中的平均乾淨語音信號的表示μs，其中A=(I-A^)-1(CY-A^CY(0)),]]>和b＝E[Y(t)]。
9.根據權利要求8所述的方法，其中所述構建和解算線性等式系統包括根據如下的最小化限制來解算所述線性等式系統mins||ssT-B||2.]]>
10.根據權利要求8所述的方法，其中所述構建和解算線性等式系統包括確定μs為±λ1p1，其中λ1是B的最大特徵值，並且p1是對應的特徵向量。
11.根據權利要求10所述的方法，進一步包括利用最大似然準則選擇μs的符號。
12.根據權利要求11所述的方法，進一步包括選擇使信道倒譜的範數‖H(t)‖2＝‖Y-μs‖2最小的μs的符號。
13.根據權利要求8所述的方法，進一步包括估計記作s(t)的乾淨語音訓練信號的為A^=E[A]1N0TA(t,)dt,]]>其中A(t,)=E[S(t)ST(t+)]E[S(t)ST(t)],]]>E[S(t)ST(t+)]1N0NS(t+)ST(t++)d,]]>並且S(t)是s(t)的倒譜或對數譜表示。
14.一種用於被通信信道損壞的語音信號的盲信道估計裝置，所述裝置被構造成將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號表示；估計該含噪語音信號表示的相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和含噪語音信號表示的相關以及含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統的解的符號，以估計在處理窗口上的平均乾淨語音信號。
15.根據權利要求14所述的裝置，進一步被構造成使用該平均乾淨語音估計來確定在該處理窗口上的平均信道估計；和使用該平均信道估計來確定在更短的處理窗口上的乾淨語音信號。
16.根據權利要求14所述的裝置，其中為選擇線性等式系統的解的符號，所述裝置被構造成利用最大似然準則選擇符號。
17.根據權利要求14所述的裝置，其中為選擇線性等式系統的解的符號，所述裝置被構造成選擇使得所估計的信道噪聲的範數最小的符號。
18.根據權利要求14所述的裝置，其中為將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號表示，所述裝置被構造成將該含噪語音信號轉換為倒譜表示。
19.根據權利要求14所述的裝置，其中為了將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號的表示，所述裝置被構造成將該含噪語音信號轉換為對數譜表示。
20.根據權利要求14所述的裝置，進一步被構造成在基本上沒有噪聲的環境中得到乾淨語音訓練信號，和利用所述乾淨語音訓練信號確定所述相關結構。
21.根據權利要求14所述的裝置，其中所述相關結構記作所述該含噪語音信號的表示記作Y(t)＝S(t)+H(t)，其中Y(t)是該含噪語音信號的表示，S(t)是該含噪語音信號的乾淨語音表示，並且H(t)是通信信道的時變響應表示；為估計該含噪語音信號表示的相關，所述裝置被構造成確定CY(τ)，其中CY(τ)＝E[YtYT(t+τ)]；為確定該含噪語音信號的平均值，所述裝置被構造成確定b＝E[Y(t)]；為構建和解算線性等式，所述裝置被構造成解算記作如下的線性等式系統ssT=bbT-A=B,]]>和μs+H＝b中的平均乾淨語音信號的表示μs，其中A=(I-A^)-1(CY-A^CY(0)),]]>和b＝E[Y(t)]。
22.根據權利要求21所述的裝置，其中為構建和解算線性等式系統，所述裝置被構造成根據如下的最小化限制來解算所述線性等式系統mins||ssT-B||2.]]>
23.根據權利要求21所述的裝置，其中為構建和解算線性等式系統，所述裝置被構造成確定μs為±λ1p1，其中λ1是B的最大特徵值，並且p1是對應的特徵向量。
24.根據權利要求23所述的裝置，進一步被構造成利用最大似然準則選擇μs的符號。
25.根據權利要求24所述的裝置，進一步被構造成選擇使信道倒譜的範數‖H(t)‖2＝‖Y-μs‖2最小的μs的符號。
26.根據權利要求21所述的裝置，進一步被構造成估計記作s(t)乾淨語音訓練信號的為A^=E[A]1N0TA(t,)dt,]]>其中A(t,)=E[S(t)ST(t+)]E[S(t)ST(t)],]]>E[S(t)ST(t+)]1N0NS(t+)ST(t++)d,]]>並且S(t)是s(t)的倒譜或對數譜表示。
27.一種其上記錄有指令的機器可讀介質或媒體，所配置的指令使得包括由可編程處理器和數位訊號處理器組成的組中至少一個部件的裝置進行如下操作將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號的表示；估計該含噪語音信號表示的相關；確定該含噪語音信號的平均值；根據最小化限制，利用乾淨語音訓練信號的相關結構和含噪語音信號表示的相關以及含噪語音信號的平均值來構建和解算線性等式系統；和選擇該線性等式系統的解的符號，以估計在處理窗口上的平均乾淨語音信號。
28.根據權利要求27所述的介質或媒體，其中所述指令包括進行如下操作的指令使用該平均乾淨語音估計來確定在該處理窗口上的平均信道估計；和使用該平均信道估計來確定在更短的處理窗口上的乾淨語音信號。
29.根據權利要求27所述的介質或媒體，其中為選擇線性等式系統的解的符號，所述記錄的指令包括利用最大似然準則選擇符號的指令。
30.根據權利要求27所述的介質或媒體，其中為選擇線性等式系統的解的符號，所述記錄的指令包括選擇使得所估計的信道噪聲的範數最小的符號的指令。
31.根據權利要求27所述的介質或媒體，其中為將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號的表示，所述記錄的指令包括將該含噪語音信號轉換為倒譜表示的指令。
32.根據權利要求27所述的介質或媒體，其中為了將含噪語音信號轉換為倒譜表示或對數譜表示的含噪語音信號的表示，所述記錄的指令包括將該含噪語音信號轉換為對數譜表示的指令。
33.根據權利要求27所述的介質或媒體，所述記錄的指令進一步包括在基本上沒有噪聲的環境中得到乾淨語音訓練信號，和利用所述乾淨語音訓練信號確定所述相關結構的指令。
34.根據權利要求27所述的介質或媒體，其中所述相關結構記作所述該含噪語音信號的表示記作Y(t)＝S(t)+H(t)，其中Y(t)是該含噪語音信號的表示，S(t)是該含噪語音信號的乾淨語音表示，並且H(t)是通信信道的時變響應表示；為估計該含噪語音信號表示的相關，所述記錄的指令包括確定CY(τ)，其中CY(τ)＝E[YtYT(t+τ)]的指令；為確定該含噪語音信號的平均值，所述記錄的指令包括確定b＝E[Y(t)]的指令；和為構建和解算線性等式，所述記錄的指令包括解算記作如下的線性等式的指令ssT=bbT-A=B,]]>和μs+H＝b中的平均乾淨語音信號的表示μs，其中A=(I-A^)-1(CY-A^CY(0)),]]>和b＝E[Y(t)]。
35.根據權利要求34所述的介質或媒體，其中為構建和解算線性等式系統，所述記錄的指令包括根據如下的最小化限制來解算所述線性等式系統的指令mins||ssT-B||2.]]>
36.根據權利要求34所述的介質或媒體，其中為構建和解算線性等式系統，所述記錄的指令包括確定μs為±λ1p1的指令，其中λ1是B的最大特徵值，並且p1是對應的特徵向量。
37.根據權利要求36所述的介質或媒體，所述記錄的指令進一步包括利用最大似然準則選擇μs的符號的指令。
38.根據權利要求37所述的介質或媒體，其中所述記錄的指令進一步包括選擇使信道倒譜的範數‖H(t)‖2＝‖Y-μs‖2最小的μs的符號的指令。
39.根據權利要求34所述的裝置，所述記錄的指令進一步包括估計記作s(t)乾淨語音訓練信號的為下式的指令A^=E[A]1N0TA(t,)dt,]]>其中A(t,)=E[S(t)ST(t+)]E[S(t)ST(t)],]]>E[S(t)ST(t+)]1N0NS(t+)ST(t++)d,]]>並且S(t)是s(t)的倒譜或對數譜表示。
全文摘要
提供用於被通信信道損壞的語音信號的盲信道估計方法和裝置。一種方法包括將含噪語音信號轉換為倒譜表示(18)或者對數譜表示；估計該含噪語音信號表示的相關(20)；確定該含噪語音信號的平均值(24)；根據最小化限制，利用乾淨語音訓練信號的相關結構(140)和含噪語音信號表示的相關(24)以及含噪語音信號的平均值來構建和解算線性等式系統；和選擇線性等式系統(22)的解的符號，以估計在處理窗口上的平均乾淨語音信號。
文檔編號G10L15/02GK1698096SQ03805911
公開日2005年11月16日申請日期2003年3月14日優先權日2002年3月15日
發明者尤奈斯·蘇爾密, 派屈克·恩伽元, 盧克·雷茄傑洛, 讓-克勞德·容科申請人:松下電器產業株式會社

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

用於基於語音相關結構的盲信道估計的方法和裝置的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法