用於增強混合信號中的語音的方法
2023-08-05 01:20:36 2
用於增強混合信號中的語音的方法
【專利摘要】從包括噪聲和語音的混合信號中產生增強的語音。利用矢量泰勒級數來估計混合信號中的噪聲。估計的噪聲依據最小均方差。然後,從混合信號中減去噪聲以獲得增強的語音。
【專利說明】用於增強混合信號中的語音的方法
【技術領域】
[0001] 本發明總體上涉及一種用於增強包括語音和噪聲的信號的方法,更具體地,涉及 利用模型來增強語音信號的方法。
【背景技術】
[0002] 諸如基於矢量泰勒級數(VTS)的方法的基於模型的語音增強方法使用語音和噪 聲二者的統計學模型,以從有噪信號中產生增強的語音的估計。在基於模型的方法中,在給 定噪聲的情況下,通常根據模型通過確定語音的期望值直接估計增強的語音。
[0003] 基於直接矢量泰勒級數的方法
[0004] 在高解析度噪聲補償技術中,通過在短時對數譜域而非具有降低的譜解析度的特 徵域(諸如通常用於語音識別的梅爾頻譜)中的高斯分布或高斯混合模型將混合的語音和 噪聲信號模型化。為了從頻譜中完美地重構信號,通過利用合適的互補分析和綜合窗來實 現這一點,這在減小的特徵集中是不可能的。
[0005] 這裡,將幀t的短時語音對數頻譜xt置於離散狀態st。噪聲為似穩定,因此僅單 個高斯分布用於噪聲對數頻譜Μ :
[0006]
【權利要求】
1. 一種用於增強混合信號中的語音的方法,其中,所述混合信號包括噪聲信號和語音 信號,該方法包括以下步驟: 確定混合信號中的噪聲的估計,其中,所述確定使用所述語音信號、所述噪聲信號和所 述混合信號的概率模型,其中,在基於對數頻譜的域中定義所述概率模型;以及 從所述混合信號中減去所述噪聲的所述估計以獲得增強的語音, 其中,上述步驟在處理器中執行。
2. 根據權利要求1所述的方法,其中,所述噪聲的所述估計基於後驗最小均方誤差標 準。
3. 根據權利要求1所述的方法,其中,所述噪聲的所述估計基於最大後驗(MAP)概率標 準。
4. 根據權利要求1所述的方法,其中,所述確定利用基於矢量泰勒級數(VTS)的方法。
5. 根據權利要求4所述的方法,其中,所述噪聲的所述估計是
其中,s是所述語音的狀態,y是有噪語音對數頻譜,是所述基於VTS的方法的展開 點,μ是均值,並且
是考慮了所述有噪語音對數頻譜和所述展 開點的語音狀態的條件概率。
6. 根據權利要求1所述的方法,其中,所述減去產生復譜
其中,t是時間幀,yt是有噪語音對數頻譜,&是所述噪聲的所述估計,並且Θ t是所述 有噪語音對數頻譜的相位。
7. 根據權利要求1所述的方法,該方法還包括: 針對所述噪聲中的各個頻率f賦予聲學模型權重a f,以有區別地強調聲學似然分數。
8. 根據權利要求1所述的方法,其中,從所述混合信號中的非語音段估計所述噪聲模 型的充分統計數據。
9. 根據權利要求8所述的方法,其中,根據下式在對數頻譜域中估計所述噪聲模型的 均值
其中,I是用於假定的非語音幀的時間索引的集合,yt是有噪語音對數頻譜,並且η是 所述集合I中的索引的數量。
10. 根據權利要求8所述的方法,其中,根據下式在功率域中估計所述噪聲模型的均值
其中,I是用於假定的非語音幀的時間索引的集合,yt是有噪語音對數頻譜,並且η是 所述集合I中的索引的數量。
【文檔編號】G10L21/0216GK104067340SQ201280067875
【公開日】2014年9月24日 申請日期:2012年12月11日 優先權日:2012年1月27日
【發明者】J·R·赫爾歇, J·勒魯克斯 申請人:三菱電機株式會社