用於高頻帶突發抑制的系統、方法和設備的製作方法
2023-11-04 19:20:57 3
專利名稱:用於高頻帶突發抑制的系統、方法和設備的製作方法
技術領域:
本發明涉及信號處理。
背景技術:
在公眾交換電話網絡(PSTN)上的語音通信傳統上在帶寬上限於300-3400 kHz的頻 率範圍。用於例如蜂窩式電話和IP語音(VoIP)的語音通信的新的網絡可能不具有相同 帶寬限制,且可能需要在此類網絡上發射和接收包括寬帶頻率範圍的語音通信。舉例來 說,可能需要支持向下延伸至50Hz且/或向上延伸至7或8kHz的音頻範圍。還可能需 要支持可能具有在傳統PSTN限制以外的範圍中的音頻語音內容的其它應用,例如高質 量音頻或音頻/視頻會議。
語音編碼器所支持的範圍向較高頻率的延伸可改進可識度。舉例來說,區分例如"s" 和"f"的摩擦音的信息主要在高頻率中。高頻帶延伸還可改進語音的其它質量,例如真 實感。舉例來說,甚至發聲的 元音也可能具有遠在PSTN限制以上的頻譜能量。
在對寬帶語音信號進行研究的過程中,發明者偶然在頻譜的上部部分中觀察到高能 量的脈沖或"突發"。這些高頻帶突發通常僅持續幾毫秒(通常2毫秒,最大長度為約3 毫秒),可在頻率中跨越高達幾千赫茲(kHz),且在不同類型的語音聲音(發聲和不發聲 兩者)期間顯現為隨機發生。對於一些講話者來說,高頻帶突發可在每一句子中發生, 而對於其它講話者來說,此類突發可能完全不發生。雖然這些事件通常並不頻繁發生, 但是它們確實看起來普遍存在,因為發明者已在來自若干不同資料庫和來自若干其它來 源的寬帶語音樣本中發現它們的實例。
高頻帶突發具有廣泛的頻率範圍,但是通常僅在頻譜的較高頻帶中(例如,3.5到7 kHz的區域)發生,而不在較低頻帶中發生。舉例來說,圖l展示詞語"能"的頻譜圖。 在這個寬帶語音信號中,可在0.1秒處觀察到高頻帶突發,其在6kHz左右的廣泛頻率區 域上延伸(該圖中,較暗的區域指示較高強度)。有可能至少一些高頻帶突發由講話者的
嘴與麥克風之間的相互作用而產生,且/或歸因於講話者的嘴在講話期間發出的喀噠聲。
發明內容
根據一個實施例, 一種信號處理方法包括處理寬帶語音信號以獲得低頻帶語音信 號和高頻帶語音信號;確定突發存在於高頻帶語音信號的一區域中;和確定低頻帶語音 信號的相應區域中不存在突發。所述方法還包括基於確定存在突發和基於確定突發不存 在,使所述區域上的高頻帶語音信號衰減。
根據一實施例, 一種設備包括第一突發檢測器,其經配置以檢測低頻帶語音信號 中的突發;第二突發檢測器,其經配置以檢測相應高頻帶語音信號中的突發;衰減控制 信號計算器,其經配置以根據第一突發檢測器的輸出與第二突發檢測器的輸出之間的差 來計算衰減控制信號;和增益控制元件,其經配置以將衰減控制信號施加給高頻帶語音 信號。
圖1展示包括高頻帶突發的信號的頻譜圖。 圖2展示高頻帶突發已得以抑制的信號的頻譜圖。
圖3展示根據一實施例包括濾波器組A110和高頻帶突發抑制器C200的布置的框圖。 圖4展示包括濾波器組A110、高頻帶突發抑制器C200和濾波器組B120的布置的框圖。
圖5a展示濾波器組A110的實施方案A112的框圖。
圖5b展示濾波器組B120的實施方案B122的框圖。
圖6a展示濾波器組A110的一個實例的低頻帶和高頻帶的帶寬覆蓋。
圖6b展示濾波器組A110的另一實例的低頻帶和高頻帶的帶寬覆蓋。
圖6c展示濾波器組A112的實施方案A114的框圖。
圖6d展示濾波器組B122的實施方案B124的框圖。
圖7展示包括濾波器組AU0、高頻帶突發抑制器C200和高頻帶語音編碼器A200 的布置的框圖。
圖8展示包括濾波器組AllO、高頻帶突發抑制器C200、濾波器組B120和寬帶語音 編碼器A100的布置的框圖。
圖9展示包括高頻帶突發抑制器C200的寬帶語音編碼器A102的框圖。
圖10展示寬帶語音編碼器A102的實施方案A104的框圖。
圖11展示包括寬帶語音編碼器A104和多路復用器A130的布置的框圖。
圖12展示高頻帶突發抑制器C200的實施方案C202的框圖。 圖13展示突發檢測器C10的實施方案C12的框圖。
圖14a和14b分別展示初始區域指示器C50-l和終止區域指示器C50-2的實施方案 C52-l、 C52-2的框圖。
圖15展示重合檢測器C60的實施方案C62的框圖。
圖16展示衰減控制信號發生器C20的實施方案C22的框圖。
圖17展示突發檢測器C12的實施方案C14的框圖。
圖18展示突發檢測器C14的實施方案C16的框圖。
圖19展示突發檢測器C16的實施方案C18的框圖。
圖20展示衰減控制信號發生器C22的實施方案C24的框圖。
具體實施例方式
除非上下文明確限制,否則本文使用術語"計算"來指示其任何普通含義,例如計 算、產生和從一列值中選擇。在術語"包含"用於本描述內容和權利要求書中時,並不 排除其它元件或操作。
高頻帶突發在原始語音信號中完全聽得到,但是它們不對可識度作貢獻,且通過抑 制它們可改進信號質量。高頻帶突發還可能對高頻帶語音信號的編碼有害,使得通過抑 制來自高頻帶語音信號的突發可改進編碼信號的效率,且尤其可改進編碼時間包絡的效 率。
高頻帶突發可以若干方式負面影響高頻帶編碼系統。第一,這些突發可通過在突發 時引入尖峰而使語音信號能量包絡隨著時間的過去變得不平滑得多。除非編碼器以高分 辨率模擬信號的時間包絡(其增加待發送到解碼器的信息量),否則突發能量可能隨著時 間的過去在經解碼信號中拖尾且導致假信號。第二,高頻帶突發往往在如由(例如)一 組參數(例如線性預測濾波器係數)模擬的頻譜包絡中佔優勢。通常為語音信號的每一 幀(約20毫秒)執行此模擬。因此,可根據頻譜包絡來合成不同於先前幀和後繼幀的含 有喀噠聲的幀,這可導致感覺上令人不愉快的不連續性。
高頻帶突發可導致高頻帶合成濾波器的激勵信號是從窄帶殘差(residual)導出或另 外表示窄帶殘差的語音編碼系統的另一問題。在所述情況下,高頻帶突發的存在可使高 頻帶語音信號的編碼複雜化,因為高頻帶語音信號包括窄帶語音信號中不具有的結構。
實施例包括經配置以檢測存在於高頻帶語音信號中而不存在於相應低頻帶語音信號 中的突發且減小每一突發期間高頻帶語音信號的電平的系統、方法和設備。此類實施例
的潛在優勢包括在不顯著降級原始信號的質量的情況下避免經解碼信號中的假信號和/ 或避免編碼效率的損失。圖2展示在根據此方法抑制高頻帶突發之後圖1所示的寬帶信 號的頻譜圖。
圖3展示根據一實施例包括濾波器組A110和高頻帶突發抑制器C200的布置的框圖。 濾波器組A110經配置以對寬帶語音信號S10進行濾波以產生低頻帶語音信號S20和高 頻帶語音信號S30。高頻帶突發抑制器C200經配置以基於高頻帶語音信號S30輸出經處 理高頻帶語音信號S30a,其中在高頻帶語音信號S30中發生而在低頻帶語音信號S20中 不存在的突發己得以抑制。
圖4展示還包括濾波器組B120的圖3所示的布置的框圖。濾波器組B120經配置以 將低頻帶語音信號S20與經處理高頻帶語音信號S30a組合,以產生經處理寬帶語音信號 S10a。由於對高頻帶突發的抑制,經處理寬帶語音信號S10a的質量可比寬帶語音信號 S10的質量有所改進。
濾波器組A110經配置以根據分離頻帶方案對輸入信號進行濾波以產生低頻子頻帶 和高頻子頻帶。視特定應用的設計準則而定,輸出子頻帶可具有相等的或不相等的帶寬, 且可重疊或不重疊。產生兩個以上子頻帶的濾波器組A110的配置也是可能的。舉例來說, 所述濾波器組可經配置以產生極低頻帶信號,其包括低於窄帶信號S20的頻率範圍的頻 率範圍中的分量(例如50-300 Hz的範圍)。在此情況下,寬帶語音編碼器A100經實施 以單獨編碼此極低頻帶信號,且多路復用器A130可經配置以在多路復用信號S70中包 括經編碼極低頻帶信號(例如,作為可分離部分)。
圖5a展示濾波器組A110的實施方案A112的框圖,所述實施方案經配置以產生具 有減小的取樣率的兩個子頻帶信號。濾波器組A110經布置以接收具有高頻(或高頻帶) 部分和低頻(或低頻帶)部分的寬帶語音信號SIO。濾波器組A112包括經配置以接收寬 帶語音信號S10並產生窄帶語音信號S20的低頻帶處理路徑,和經配置以接收寬帶語音 信號S10並產生高頻帶語音信號S30的高頻帶處理路徑。低通濾波器110對寬帶語音信 號S10進行濾波以使選定低頻子頻帶通過,且高通濾波器130對寬帶語音信號S10進行 濾波以使選定高頻子頻帶通過。因為兩個子頻帶信號比寬帶語音信號S10具有更窄的帶 寬,所以其取樣率可在不損失信息的情況下減小到一定程度。降取樣器120根據所需抽 取因數來減小低通信號的取樣率(例如,通過移除信號樣本和/或以平均值替換樣本), 且降取樣器140同樣根據另一所需抽取因數來減小高通信號的取樣率。
圖5b展示濾波器組B120的相應實施方案B122的框圖。升取樣器150增加窄帶信
號S90的取樣率(例如,通過零填充和/或通過複製樣本),且低通濾波器160對經升取 樣的信號進行濾波以使得僅低頻帶部分通過(例如,以防止混疊)。同樣,升取樣器170 增加高頻帶信號S100的取樣率,且高通濾波器180對經升取樣的信號進行濾波以使得僅 高頻帶部分通過。接著求兩個通帶信號之和以形成寬帶語音信號SllO。在解碼器B100 的一些實施方案中,濾波器組B120經配置以根據由高頻帶解碼器B200接收和/或計算出 的一個或一個以上權值來產生兩個通帶信號的加權和。還預期將兩個以上通帶信號組合 的濾波器組B120的配置。
濾波器110、 130、 160、 180中的每一者可實施為有限脈衝響應(FIR)濾波器或實 施為無限脈衝響應(IIR)濾波器。濾波器IIO和130的頻率響應可具有在阻帶與通帶之 間的對稱或不同形狀的過渡區域。同樣,濾波器160和180的頻率響應可具有在阻帶與 通帶之間的對稱或不同形狀的過渡區域。可能需要(但不是嚴格必要)低通濾波器110 與低通濾波器160具有相同的響應,且高通濾波器130與高通濾波器180具有相同的響 應。在一個實例中,兩個濾波器對110、 130和160、 180為正交鏡像濾波器(QMF)組, 其中濾波器對IIO、 130與濾波器對160、 180具有相同係數。
在典型實例中,低通濾波器110具有包括300-3400 Hz的有限PSTN範圍的通帶(例 如,0到4kHz的頻帶)。圖6a和6b以兩個不同實施實例展示寬帶語音信號SIO、低頻 帶語音信號S20和高頻帶語音信號S30的相對帶寬。在這兩個特定實例中,寬帶語音信 號S10具有16 kHz的取樣率(表示在0到8 kHz的範圍內的頻率分量),且低頻帶信號 S20具有8 kHz的取樣率(表示在0到4 kHz的範圍內的頻率分量)。
在圖6a的實例中,在兩個子頻帶之間不存在顯著重疊。在此實例中展示的高頻帶信 號S30可使用具有4-8 kHz的通帶的高通濾波器130來獲得。在此情況下,可能需要通 過以二為因數對經濾波信號進行降取樣來使取樣率減小到8kHz。可預期此操作顯著減小 對信號的進一步處理操作的計算複雜性,所述操作將在不損失信息的情況下將通帶能量 向下移動到0到4kHz的範圍。
在圖6b的替代實例中,較高子頻帶與較低子頻帶具有明顯重疊,使得兩個子頻帶信 號描述3.5到4 kHz的區域。在此實例中的高頻帶信號S30可使用具有3.5-7 kHz的通帶 的高通濾波器130來獲得。在此情況下,可能需要通過以16/7為因數對經濾波信號進行 降取樣來使取樣率減小到7kHz。可預期此操作顯著減小對信號的進一步處理操作的計算 複雜性,所述操作將在不損失信息的情況下將通帶能量向下移動到0到3.5 kHz的範圍。
在用於電話通信的典型手機中, 一個或一個以上變換器(即,麥克風和耳機或揚聲
器)在7-8kHz的頻率範圍內不存在明顯響應。在圖6b的實例中,寬帶語音信號S10的 在7與8 kHz之間的部分不包括在經編碼信號中。高通濾波器130的其它特定實例具有 3.5-7.5 kHz和3.5-8 kHz的通帶。
在一些實施方案中,如圖6b的實例中提供子頻帶之間的重疊允許使用在重疊區域上 具有平滑下降的低通和/或高通濾波器。此類濾波器通常比具有較陡峭或"磚牆 (brick-wall)"響應的濾波器在計算上較不複雜且/或引入較少延遲。具有陡峭過渡區域的 濾波器往往比具有平滑下降的類似階的濾波器具有更高的旁瓣(其可導致混疊)。具有陡 峭過渡區域的濾波器也可能具有可導致振鈴假信號的長脈衝響應。對於具有一個或一個 以上IIR濾波器的濾波器組實施方案來說,允許在重疊區域上的平滑下降可使得能夠使 用極點遠離單位圓的濾波器(一或多個),這對於確保穩定的定點實施方案可能很重要。
子頻帶的重疊允許低頻帶和高頻帶的平滑混合,其可產生較少的可聽假信號,使混 疊減少和/或從一個頻帶到另一頻帶的過渡不太顯著。此外,在隨後由不同語音編碼器對 低頻帶和高頻帶語音信號S20、 S30編碼的應用中,低頻帶語音編碼器(例如,波形編碼 器)的編碼效率可因頻率不斷增加而降低。舉例來說,低頻帶語音編碼器的編碼質量可 在低位速率下減小,尤其在存在背景噪聲時減小。在此類情況下,提供子頻帶的重疊可 增加在重疊區域中的再生頻率分量的質量。
此外,子頻帶的重疊允許低頻帶和高頻帶的平滑混合,其可產生較少的可聽假信號, 使混疊減少和/或從一個頻帶到另一頻帶的過渡不太顯著。對於如下所討論的低頻帶編碼 器A120和高頻帶編碼器A200根據不同編碼方法操作的實施方案來說,可能尤其需要所 述特徵。舉例來說,不同編碼技術可產生聽起來完全不同的信號。編碼密碼本索引形式 的頻譜包絡的編碼器可產生具有與改為編碼幅值頻譜的編碼器不同聲音的信號。時域編 碼器(例如,脈衝編碼調製或PCM編碼器)可產生具有與頻域編碼器不同聲音的信號。 編碼具有頻譜包絡表示形式和相應殘差信號的信號的編碼器可產生具有與編碼僅具有頻
譜包絡表示形式的信號的編碼器不同聲音的信號。將信號編碼為其波形的表示形式的編 碼器可產生具有與來自正弦編碼器的聲音不同的聲音的輸出。在此類情況下,使用具有 陡峭過渡區域的濾波器來界定非重疊子頻帶可在合成的寬帶信號中的子頻帶之間產生突 然的感覺上顯著的過渡。
雖然常常在子頻帶技術中使用具有互補重疊頻率響應的QMF濾波器組,但是此類濾 波器不適於本文所描述的至少一些帶寬編碼實施方案。編碼器處的QMF濾波器組經配置 以建立顯著程度的混疊,其在解碼器處的相應QMF濾波器組中被取消。此類布置可能不
適於信號在濾波器組之間引起大量失真的應用,因為失真可能減小混疊取消性質的有效 性。舉例來說,本文所描述的應用包括經配置而以極低位速率操作的編碼實施方案。由 於位速率極低,所以經解碼信號與原始信號相比,很可能呈現為顯著失真,使得QMF濾 波器組的使用可導致未取消的混疊。使用QMF濾波器組的應用通常具有較高位速率(例 如,對於AMR來說超過12kbps,且對於G.722來說超過64 kbps)。
另外,編碼器可經配置以產生在感覺上類似於原始信號但實際上顯著不同於原始信 號的合成信號。舉例來說,從本文所描述的窄帶殘差導出高頻帶激勵的編碼器可產生此 類信號,因為經解碼信號中可能完全不存在實際高頻帶殘差。QMF濾波器組在此類應用 中的使用可導致由未取消的混疊引起的顯著程度的失真。
如果受影響的子頻帶較窄,那麼由QMF混疊引起的失真量可減小,因為混疊的效果 限於等於子頻帶的寬度的帶寬。舉例來說,如本文所述,每一子頻帶約包括寬帶帶寬的 一半,然而,由未取消混疊引起的失真可影響信號的大部分。信號的質量也可能受上面 發生未取消混疊的頻帶的位置影響。舉例來說,在寬帶語音信號的中心附近(例如,3 kHz 與4kHz之間)產生的失真可比在信號邊緣附近(例如,約6kHz)發生的失真更有害。
雖然QMF濾波器組的濾波器的響應彼此嚴格相關,但是濾波器組A110和B120的 低頻帶和高頻帶路徑可經配置以具有除兩個子頻帶的重疊外完全不相關的頻譜。我們將 兩個子頻帶的重疊定義為從高頻帶濾波器的頻率響應下降到-20 dB的點到低頻帶濾波器 的頻率響應下降到-20dB的點的距離。在濾波器組A110和/或B120的各種實例中,此重 疊在200 Hz左右到1 kHz左右的範圍內。約400到約600 Hz的範圍可表示編碼效率與 感覺上的平滑度之間的理想折衷。在如上所述的一個特定實例中,所述重疊在500Hz左 右。
可能需要實施濾波器組A112和/或B122以在若干階段中執行如圖6a和6b中所說明 的操作。舉例來說,圖6c展示濾波器組A112的實施方案A114的框圖,所述實施方案 使用一系列內插、重取樣、抽取和其它操作來執行高通濾波和降取樣操作的功能均等操 作。此類實施方案可能較易於設計且/或可能允許邏輯和/或編碼的功能塊的再使用。舉例 來說,如圖6c所示,相同的功能塊可用於執行到14 kHz的抽取和到7 kHz的抽取的操 作。可通過將信號與函數e^或序列(-l)n (其值在+l與-1之間更替)相乘來實施頻譜反 向操作。頻譜整形操作可實施為低通濾波器,所述低通濾波器經配置以使信號整形以獲 得所需的總濾波器響應。
注意到,由於頻譜反向操作的緣故,高頻帶信號S30的頻譜被反向。可相應地配置
編碼器和相應解碼器中的隨後操作。舉例來說,可能需要產生也具有頻譜反向形式的相 應激勵信號。
圖6d展示濾波器組B122的實施方案B124的框圖,所述實施方案使用一系列內插、 重取樣、抽取和其它操作來執行升取樣和高通濾波操作的功能均等操作。濾波器組B124 包括在高頻帶中的頻譜反向操作,其使(例如)編碼器的濾波器組(例如濾波器組A114) 中所執行的類似操作反向。在此特定實例中,濾波器組B124還包括低頻帶和高頻帶中的 陷波濾波器,其衰減7100 Hz處的信號的分量,但是此類濾波器為可選的且並非必須包 括。與此一同申請的專利申請案"SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING"(代理人案號050551)包括關於濾波器組A110和B120 的特定實施方案的元件的響應的額外描述和圖式,且此材料在此以引用的方式併入。
如上所述,高頻帶突發抑制可改進編碼高頻帶語音信號S30的效率。圖7展示由高 頻帶語音編碼器A200編碼經處理高頻帶語音信號S30a(如由高頻帶突發抑制器C200所 產生)以產生經編碼高頻帶語音信號S30b的布置的框圖。
一種寬帶語音編碼方法涉及縮放窄帶語音編碼技術(例如,經配置以編碼0-4 kHz 的範圍的技術)以覆蓋寬帶頻譜。舉例來說,可在較高速率下對語音信號進行取樣以包 括高頻率處的分量,且窄帶編碼技術可經重新配置以使用較多濾波器係數來表示此寬帶 信號。圖8展示寬帶語音編碼器A100經布置以編碼經處理寬帶語音信號S10a以產生經 編碼寬帶語音信號S10b的實例的框圖。
然而,例如CELP(密碼本激勵線性預測)的窄帶編碼技術計算量較大,且寬帶CELP 編碼器可能消耗過多的處理循環才可應用於許多移動和其它嵌入式應用。使用這種技術 編碼寬帶信號的整個頻譜達到所需質量還可能導致不可接受的較大的帶寬增加。此外, 甚至在此類經編碼信號的窄帶部分可傳輸到僅支持窄帶編碼的系統和/或由所述系統解 碼之前,也將需要對所述經編碼信號進行代碼轉換。圖9展示分別包括單獨的低頻帶和 高頻帶語音編碼器A120和A220的寬帶語音編碼器A102的框圖。
可能需要實施寬帶語音編碼,使得在不進行代碼轉換或其它顯著修改的情況下,至 少經編碼信號的窄帶部分可經由窄帶信道(例如PSTN信道)發送。還可能需要寬帶編 碼延伸的有效性(例如)以避免在應用(例如無線蜂窩式電話以及有線和無線信道上的 廣播)中可得到服務的用戶的數量顯著減少。
一種寬帶語音編碼方法涉及從經編碼窄帶頻譜包絡外推高頻帶頻譜包絡。雖然這種 方法可在帶寬無任何增加且不需要代碼轉換的情況下實施,然而, 一般不能從窄帶部分 的頻譜包絡中精確預測到語音信號的高頻帶部分的粗頻譜包絡或共振峰結構。
圖10展示根據來自低頻帶語音信號的信息使用另一方法來編碼高頻帶語音信號的 寬帶語音編碼器A104的框圖。在此實例中,從經編碼低頻帶激勵信號S50導出高頻帶 激勵信號。編碼器A104可經配置以(例如)根據如與此一同申請的專利申請案"SYSTEMS, METHODS, AND APPARATUS FOR GAIN CODING"(代理人案號050547)中所描述的 一個或一個以上此類實施例基於一基於高頻帶激勵信號的信號來編碼增益包絡,所述申 請案的描述內容在此以引用的方式併入。寬帶語音編碼器A104的一個特定實例經配置而 在約8.55kbps (千位/秒)的速率下編碼寬帶語音信號S10,其中約7.55kbps用於低頻帶 濾波器參數S40和經編碼低頻帶激勵信號S50,且約lkbps用於經編碼高頻帶語音S60。
可能需要將經編碼低頻帶信號與高頻帶信號組合成單一位流。舉例來說,可能需要 將經編碼信號多路復用在一起,以作為經編碼寬帶語音信號來用於傳輸(例如,經由有 線、光學或無線傳輸信道)或存儲。圖11展示包括寬帶語音編碼器A104和多路復用器 A130的布置的框圖,所述多路復用器A130經配置以將低頻帶濾波器參數S40、經編碼 低頻帶激勵信號S50和高頻帶濾波器參數S60組合成多路復用信號S70。
多路復用器A130可能需要經配置以將經編碼低頻帶信號(包括低頻帶濾波器參數 S40和經編碼低頻帶激勵信號S50)作為多路復用信號S70的可分離的子流而嵌入,使得 可獨立於多路復用信號S70的另一部分(例如高頻帶和/或極低頻帶信號)來恢復和解碼 經編碼低頻帶信號。舉例來說,多路復用信號S70可經布置以使得可通過剝離高頻帶濾 波器參數S60來恢復經編碼低頻帶信號。此特徵的一個潛在優勢是避免在將經編碼寬帶 信號傳遞到支持低頻帶信號的解碼但不支持高頻帶部分的解碼的系統之前,需要對所述 經編碼寬帶信號進行代碼轉換。
如本文所描述包括低頻帶、高頻帶和/或寬帶語音編碼器的設備還可包括經配置以將 經編碼信號傳輸到傳輸信道(例如有線、光學或無線信道)中的電路。此類設備還可經 配置以對信號執行一個或一個以上信道編碼操作,例如誤差校正編碼(例如,速率兼容 巻積編碼)和/或誤差檢測編碼(例如,循環冗餘編碼),和/或一層或一層以上的網絡協 議編碼(例如,乙太網、TCP/IP、 cdma2000)。
可根據源濾波器模型來實施本文所描述的低頻帶、高頻帶和寬帶語音編碼器中的任 一者或全部,所述源濾波器模型將輸入語音信號編碼為(A)描述濾波器的一組參數和(B) 使所描述的濾波器產生輸入語音信號的合成再生物的激勵信號。舉例來說,語音信號的 頻譜包絡由表示聲域的共振的且稱為共振峰的許多峰值表徵。大多數語音編碼器至少將
這種粗頻譜結構編碼為例如濾波器係數的一組參數。
在基本源濾波器布置的一個實例中,分析模塊計算表徵濾波器的對應於一段時間(通 常20毫秒)語音聲音的一組參數。根據那些濾波器參數而配置的白化濾波器(也稱為分 析或預測誤差濾波器)移除頻譜包絡以使信號在頻譜上平坦化。所得的白化信號(也稱 為殘差)與原始語音信號相比具有較少的能量,且因此具有較少的方差,且更易於編碼。 對殘差信號的編碼產生的誤差也可在頻譜上更均勻地散布。濾波器參數和殘差通常經量 化以用於經由信道有效傳輸。在解碼器處,根據濾波器參數配置的合成濾波器由殘差激 勵以產生原始語音聲音的合成型式。合成濾波器通常經配置以具有轉移函數,所述轉移 函數是白化濾波器的轉移函數的反函數。
分析模塊可實施為線性預測編碼(LPC)分析模塊,其將語音信號的頻譜包絡編碼 為一組線性預測(LP)係數(例如,全極點濾波器1/A(z)的係數)。分析模塊通常將輸入 信號處理為一系列非重疊的幀,為每一幀計算一組新的係數。幀周期一般為可預期信號 為局部靜止的周期; 一個常見實例為20毫秒(等於8 kHz的取樣率下160個樣本)。低 頻帶LPC分析模塊的一個實例經配置以計算一組十個LP濾波器係數,以表徵低頻帶語 音信號S20的每一 20毫秒幀的共振峰結構,且高頻帶LPC分析模塊的一個實例經配置 以計算一組六個(或者,八個)LP濾波器係數,以表徵高頻帶語音信號S30的每一 20 毫秒幀的共振峰結構。還可能實施分析模塊以將輸入信號處理為一系列重疊幀。
分析模塊可經配置以直接分析每一幀的樣本,或可首先根據窗口函數(例如,漢明 窗口)來對樣本加權。也可在大於所述幀的窗口 (例如30毫秒窗口)上執行分析。此窗 口可為對稱的(例如5-20-5,使得其緊接在20毫秒幀之前和之後包括5毫秒)或非對稱 的(10-20,使得其包括前一幀的最後10毫秒)。LPC分析模塊通常經配置以使用 Levinson-Durbin遞歸式或Leroux-Gueguen算法來計算LP濾波器係數。在另一實施方案 中,分析模塊可經配置以為每一幀計算一組倒譜係數,而不是一組LP濾波器係數。
通過量化濾波器參數可顯著減小語音編碼器的輸出率,而對再生質量產生相對較小 的影響。線性預測濾波器係數難以有效量化且常常由語音編碼器映射為另一表示形式(例 如線頻譜對(LSP)或線頻譜頻率(LSF))以用於量化和/或熵編碼。LP濾波器係數的其 它一對一表示形式包括部分自相關係數、對數面積比值、導抗頻譜對(ISP)和導抗頻譜 頻率(ISF),其用於GSM (全球移動通信系統)AMR-WB (自適應多速率寬帶)編解碼 器中。通常, 一組LP濾波器係數與相應的一組LSF之間的變換為可逆的,但是實施例 也包括變換無法在無誤差情況下可逆的語音編碼器的實施方案。
語音編碼器通常經配置以量化所述組窄帶LSF (或其它係數表示形式)且輸出此量 化的結果作為濾波器參數。通常使用向量量化器來執行量化,所述向量量化器將輸入向 量編碼為表或密碼本中的相應向量條目的索引。此類量化器還可經配置以執行分類向量 量化。舉例來說,此類量化器可經配置以基於已在相同幀內(例如,在低頻帶信道中和/ 或在高頻帶信道中)編碼的信息來選擇一組密碼本中的一者。這種技術通常以額外密碼 本存儲為代價提供增加的編碼效率。
語音編碼器還可經配置以通過傳遞語音信號通過根據所述組濾波器係數配置的白化 濾波器(也稱為分析或預測誤差濾波器)來產生殘差信號。白化濾波器通常實施為FIR 濾波器,但是也可使用IIR實施方案。此殘差信號通常將含有語音幀的感覺上重要的信 息,例如關於音調的長期結構,其在濾波器參數中未表示。此外,此殘差信號通常經量 化而用於輸出。舉例來說,低頻帶語音編碼器A122可經配置以計算殘差信號的量化表示 形式以作為經編碼低頻帶激勵信號S50而輸出。通常使用向量量化器來執行此量化,所 述向量量化器將輸入向量編碼為表或密碼本中的相應向量條目的索引,且可經配置以執 行如上所描述的分類向量量化。
或者,此類量化器可經配置以發送一個或一個以上參數,如在稀疏密碼本方法中, 可在解碼器處根據所述參數動態產生向量,而不是從存儲裝置中檢索向量。這種方法用 於例如代數CELP (密碼本激勵線性預測)的編碼方案和例如3GPP2 (第三代合作夥伴2) EVRC (增強可變速率編解碼器)的編解碼器中。
窄帶編碼器A120的一些實施方案經配置以通過識別一組密碼本向量中與殘差信號 最佳匹配的一個密碼本向量來計算經編碼窄帶激勵信號S50。然而,注意到,也可實施 窄帶編碼器A120以在不實際產生殘差信號的情況下計算殘差信號的量化表示形式。舉例 來說,窄帶編碼器A120可經配置以使用許多密碼本向量來產生相應的合成信號(例如, 根據一組當前的濾波器參數),且選擇與所產生信號相關聯的在感覺加權域中與原始窄帶 信號S20最佳匹配的密碼本向量。
可能需要將低頻帶語音編碼器A120或A122實施為分析合成語音編碼器。密碼本激 勵線性預測(CELP)編碼是分析合成編碼的一個通用系列,且此類編碼器的實施方案可 執行殘差的波形編碼,包括例如從固定和自適應密碼本中選擇條目、誤差最小化操作和/ 或感覺加權操作的操作。分析合成編碼的其它實施方案包括混合激勵線性預測(MELP)、 代數CELP (ACEUO、鬆弛CELP (RCELP)、規貝U脈衝激勵(RPE)、多脈衝CEU5 (MPE) 以及向量和激勵線性預測(VSELP)編碼。相關編碼方法包括多頻帶激勵(MBE)和原 型波形內插(PWI)編碼。標準的分析合成語音編解碼器的實例包括ETSI (歐洲電信 標準協會)-GSM全速率編解碼器(GSM 06.10),其使用殘差激勵線性預測(RELP); GSM增強全速率編解碼器(ETSI-GSM 06.60); ITU (國際電信聯盟)標準11.8 kb/s G.729 Annex E編碼器;IS (臨時標準)-136 (時分多路存取方案)的IS-641編解碼器;GSM 自適應多速率(GSM-AMR)編解碼器;和4GV (Fourth-Generation Vocoder )編解 碼器(加州聖地牙哥市的高通公司(QUALCOMM Incorporated, San Diego, CA))。 RCELP 編碼器的現有實施方案包括如在電信工業協會(TIA) IS-127中所描述的增強可變速率編 解碼器(EVRC),和第三代合作夥伴計劃2 (3GPP2)可選模式聲碼器(SMV)。可根據 這些技術中的任一者或任何其它語音編碼技術(無論是已知的還是待開發的)來實施本 文所描述的各種低頻帶、高頻帶和寬帶編碼器,其中所述任何其它語音編碼技術將語音 信號表示為(A)描述濾波器的一組參數和(B)提供用於使所描述的濾波器再生語音信 號的激勵的至少一部分的殘差信號。
圖12展示高頻帶突發抑制器C200的實施方案C202的框圖,所述實施方案包括突 發檢測器C10的兩個實施方案C10-1、 C10-2。突發檢測器C10-1經配置以產生指示在低 頻帶語音信號S20中存在突發的低頻帶突發指示信號SB10。突發檢測器C10-2經配置以 產生指示在高頻帶語音信號S30中存在突發的高頻帶突發指示信號SB20。突發檢測器 ClO-1和C10-2可相同或可為突發檢測器C10的不同實施方案的實例。高頻帶突發抑制 器C202還包括衰減控制信號發生器C20,其經配置以根據低頻帶突發指示信號SB10 與高頻帶突發指示信號SB20之間的關係產生衰減控制信號SB70;和增益控制元件C150 (例如,乘法器或放大器),其經配置以將衰減控制信號SB70施加給高頻帶語音信號S30 以產生經處理髙頻帶語音信號S30a。
在本文所描述的特定實例中,可假設高頻帶突發抑制器C202在20毫秒幀中處理高 頻帶語音信號S30,且低頻帶語音信號S20和高頻帶語音信號S30兩者均在8 kHz下被 取樣。然而,這些特定值僅為實例,且並非限制,且也可根據特定設計選擇和/或如本文 所述使用其它值。
突發檢測器C10經配置以計算語音信號的前向和後向平滑包絡,且根據前向平滑包 絡中的邊緣與後向平滑包絡中的邊緣之間的時間關係來指示突發的存在。突發抑制器 C202包括突發檢測器C10的兩個實例,每一者經布置以接收語音信號S20、 S30中的各 別一者且輸出相應的突發指示信號SBIO、 SB20。
圖13展示突發檢測器C10的實施方案C12的框圖,所述實施方案經布置以接收語
音信號S20、 S30中的一者且輸出相應的突發指示信號SBIO、 SB20。突發檢測器C12經 配置以在兩個階段計算前向和後向平滑包絡中的每一者。在第一階段,計算器C30經配 置以使語音信號轉變成恆定極性信號。在一個實例中,計算器C30經配置以將恆定極性 信號計算為相應語音信號的當前幀的每一樣本的平方。此信號可經平滑化以獲得能量包 絡。在另一實例中,計算器C30經配置以計算每一傳入樣本的絕對值。此信號可經平滑 化以獲得幅值包絡。計算器C30的其它實施方案可經配置以根據例如削波的另一函數來 計算恆定極性信號。
在第二階段,前向平滑器C40-l經配置以使恆定極性信號在前向時間方向上平滑化 以產生前向平滑包絡,且後向平滑器C40-2經配置以使恆定極性信號在後向時間方向上 平滑化以產生後向平滑包絡。前向平滑包絡指示在前向方向上相應語音信號隨時間的電 平差,且後向平滑包絡指示在後向方向上相應語音信號隨時間的電平差。
在一個實例中,前向平滑器C40-1實施為一階無限脈衝響應(IIR)濾波器,其經配 置以根據例如以下表達式使恆定極性信號平滑化
Sf(n)= aSf(n-l)+(l-a)P(n),
且後向平滑器C40-2實施為一階IIR濾波器,其經配置以根據例如以下表達式使恆 定極性信號平滑化
Sb(n)= aSb(n+l)+(l-a)P(n),
其中n為時間指數,P(n)為恆定極性信號,Sf(n)為前向平滑包絡,Sb(n)為後向平滑 包絡,且a為具有0(無平滑)與l之間的值的衰變因數。可注意到,部分由於例如後 向平滑包絡的計算的操作的緣故,經處理高頻帶語音信號S30a中可能引起至少一幀的延 遲。然而,這一延遲感覺上相對不重要,且即使在實時語音處理操作中也並非罕見。
可能需要選擇a的值使得平滑器的衰變時間類似於高頻帶突發的預期持續時間(例 如,約5毫秒)。通常,前向平滑器C40-l和後向平滑器C40-2經配置以執行相同平滑操 作的互補型式,且使用相同的a值,但在一些實施方案中,兩個平滑器可經配置以執行 不同操作和/或使用不同值。也可使用其它遞歸或非遞歸平滑函數,包括高階有限脈衝響 應(FIR)或IIR濾波器。
在突發檢測器C12的其它實施方案中,前向平滑器C40-l和後向平滑器C40-2中的
一者或兩者經配置以執行自適應平滑操作。舉例來說,前向平滑器C40-l可經配置以根 據例如以下表達式來執行自適應平滑操作-
其中平滑減少,或在此情況下,在恆定極性信號的強前沿處禁用平滑。在突發檢測 器C12的此實施方案或另一實施方案中,後向平滑器C40-2可經配置以根據例如以下表 達式來執行自適應平滑操作
其中平滑減少,或在此情況下,在恆定極性信號的強後沿處禁用平滑。這種自適應 平滑可有助於界定前向平滑包絡中的突發事件的開始和後向平滑包絡中的突發事件的結 束。
突發檢測器C12包括區域指示器C50的實例(初始區域指示器C50-1),其經配置以 指示在前向平滑包絡中高電平事件(例如突發)的開始。突發檢測器C12還包括區域指 示器C50的實例(終止區域指示器C50-2),其經配置以指示在後向平滑包絡中高電平事 件(例如突發)的結束。
圖14a展示初始區域指示器C50-l的實施方案C52-l的框圖,所述實施方案包括延 遲元件C70-l和加法器。延遲元件C70-l經配置以應用具有正量值的延遲,使得前向平 滑包絡減小其自身的延遲型式。在另一實例中,可根據所需加權因數對當前樣本或延遲 樣本進行加權。
圖14b展示終止區域指示器C50-2的實施方案C52-2的框圖,所述實施方案包括延 遲元件C70-2和加法器。延遲元件C70-2經配置以應用具有負量值的延遲,使得後向平 滑包絡減小其自身的提前型式。在另一實例中,可根據所需加權因數對當前樣本或提前 樣本進行加權。
在區域指示器C52的不同實施方案中可使用各種延遲值,且在初始區域指示器C52-1 和終止區域指示器C52-2中可使用具有不同量值的延遲值。可根據所檢測區域的所需寬 度來選擇延遲的量值。舉例來說,小的延遲值可用於執行窄邊緣區域的檢測。為了獲得
戶(w), 其中屍(")2S,(w —1)
必f (" — 1) + (1 - ff)屍("),其中屍(")< ^ (" -1)
屍("), 其中屍(")2&(" + l)
(" +1) + (1 — ")P("),其中f (rt) < & (" +1)
強邊緣檢測,可能需要使用具有類似於預期邊緣寬度的量值(例如,約3個或5個樣本) 的延遲。
或者,區域指示器C50可經配置以指示延伸超過相應邊緣的較寬區域。舉例來說, 初始區域指示器C50-l可能需要指示在前沿之後的一段時間內在前向方向上延伸的事件 的初始區域。同樣,終止區域指示器C50-2可能需要指示在後沿之前的一段時間內在後 向方向上延伸的事件的終止區域。在此情況下,可能需要使用具有較大量值的延遲值, 例如類似於突發的預期長度的量值的量值。在一個此類實例中,使用約4毫秒的延遲。
區域指示器C50進行的處理可根據延遲的量值和方向而延伸超過語音信號的當前幀 的邊界。舉例來說,初始區域指示器C50-1進行的處理可向前一幀中延伸,且終止區域 指示器C50-2進行的處理可向後一幀中延伸。
與語音信號中可能出現的其它高電平事件相比,突發由在時間上與終止區域(如在 終止區域指示信號SB60中所指示)重合的初始區域(如在初始區域指示信號SB50中所 指示)來辨別。舉例來說,當初始區域與終止區域之間的時間距離不大於(或者小於) 預定重合間隔(例如突發的預期持續時間)時,可指示突發。重合檢測器C60經配置以 根據區域指示信號SB50和SB60中的初始區域與終止區域在時間上的重合來指示檢測到 突發。例如,對於初始區域指示信號SB50和終止區域指示信號SB60指示從各自前沿和 後沿延伸的區域的實施方案來說,重合檢測器C60可經配置以指示延伸區域在時間上的 重疊。
圖15展示重合檢測器C60的實施方案C62的框圖,所述實施方案包括削波器C80 的第一實例C80-1,其經配置以對初始區域指示信號SB50進行削波;削波器C80的第二 實例C80-2,其經配置以對終止區域指示信號SB60進行削波;和均值計算器C90,其經 配置以根據經削波信號的均值來輸出相應的突發指示信號。削波器C80經配置以根據例 如以下表達式來對輸入信號的值進行削波
輸出:max(輸入,O)。
或者,削波器C80也可經配置以根據例如以下表達式來對輸入信號的值按閾值取值
其中,閾值TL具有大於零的值。通常,削波器C80的實例C80-l和C80-2將使用相 同的閾值,但是也可能兩個實例C80-l和C80-2使用不同的閾值。
均值計算器C90經配置以根據經削波信號的均值來輸出相應的突發指示信號SBIO、 SB20,所述突發指示信號指示輸入信號中的突發的時間位置和強度且具有等於或大於零 的值。尤其對於將具有界定的初始區域和終止區域的突發與僅具有強初始區域或終止區 域的其它事件區分來說,幾何均值可比算術均值提供更好的結果。舉例來說,僅具有一 個強邊緣的事件的算術均值可能仍然較高,而不存在所述邊緣之一的事件的幾何均值將 較低或為零。然而,幾何均值通常計算量比算術均值大。在一個實例中,經布置以處理
低頻帶結果的均值計算器C90的實例使用算術均值(^i + W),且經布置以處理高頻帶 結果的均值計算器C90的實例使用較保守的幾何均值(V^)。
均值計算器C90的其它實施方案可經配置以使用不同種類的均值,例如調和均值。 在重合檢測器C62的另一實施方案中,初始區域指示信號SB50和終止區域指示信號SB60 中的一者或兩者在削波之前或之後相對於另一者被加權。
重合檢測器C60的其它實施方案經配置以通過測量前沿與後沿之間的時間距離來檢 測突發。舉例來說, 一個此類實施方案經配置以將突發識別為在初始區域指示信號SB50 中的前沿與在終止區域指示信號SB60中的後沿之間的分開不大於預定寬度的區域。所述 預定寬度基於高頻帶突發的預期持續時間,且在一個實例中,使用約4毫秒的寬度。
重合檢測器C60的另一實施方案經配置以將初始區域指示信號SB50中的每一前沿 在前向方向上擴展所需時間周期(例如,基於高頻帶突發的預期持續時間),將終止區域 指示信號SB60中的每一後沿在後向方向上擴展所需時間周期(例如,基於高頻帶突發的 預期持續時間)。此類實施方案可經配置以產生相應的突發指示信號SBIO、 SB20作為這 兩個經擴展信號的邏輯與(AND),或者產生相應的突發指示信號SBIO、 SB20以指示跨 越區域重疊的區的突發的相對強度(例如,通過計算信號SBIO、 SB20的均值)。此類實 施方案可經配置以僅擴展超過閾值的邊緣。在一個實例中,將邊緣擴展約4毫秒的時間 周期。
衰減控制信號發生器C20經配置以根據低頻帶突發指示信號SB10與高頻帶突發指 示信號SB20之間的關係來產生衰減控制信號SB70。舉例來說,衰減控制信號發生器C20 可經配置以根據突發指示信號SB10與SB20之間的算術關係(例如,差)來產生衰減控 制信號SB70。
圖16展示衰減控制信號發生器C20的實施方案C22的框圖,所述實施方案經配置 以通過從高頻帶突發指示信號SB20中減去低頻帶突發指示信號SB10而將低頻帶突發指 示信號SB10與高頻帶突發指示信號SB20組合。所得的差信號指示突發存在於高頻帶中 的何處,所述突發在低頻帶中不發生(或較弱)。在另一實施方案中,低頻帶突發指示信 號SB10和高頻帶突發指示信號SB20中的一者或兩者相對於另一者被加權。
衰減控制信號計算器C100根據差信號的值來輸出衰減控制信號SB70。舉例來說, 衰減控制信號計算器C100可經配置以指示根據差信號超過閾值的程度而變化的衰減。
衰減控制信號發生器C20可能需要經配置以對經對數定標的值執行運算。舉例來說, 可能需要根據突發指示信號的電平之間的比率(例如,根據以分貝或dB為單位的值)來 使高頻帶語音信號S30衰減,且這一比率可根據經對數定標的值的差來容易地計算出。 對數定標使信號沿量值軸變形,而不另外改變其形狀。圖17展示突發檢測器C12的實施 方案C14,其包括對數計算器C130的實例C130-l、 C130-2,所述對數計算器經配置以 對前向和後向處理路徑的每一者中的平滑包絡進行對數定標(例如,以10為底數)。
在一個實例中,衰減控制信號計算器C100經配置以根據以下公式計算衰減控制信號 SB70的值
formula see original document page 22)
其中DdB表示高頻帶突發指示信號SB20與低頻帶突發指示信號SB10之間的差,T犯 表示閾值,且AdB為衰減控制信號SB70的相應值。在一個特定實例中,閾值TdB具有8 dB 的值。
在另一實施方案中,衰減因數計算器C100經配置以根據差信號超過閾值(例如,3dB 或4 dB)的程度來指示線性衰減。在此實例中,直到差信號超過閾值,衰減控制信號SB70 才指示衰減。當差信號超過閾值時,衰減控制信號SB70指示與當前超過閾值的量成線性 比例的衰減值。
高頻帶突發抑制器C202包括增益控制元件(例如乘法器或放大器),所述增益控制 元件經配置以根據衰減控制信號SB70的當前值使高頻帶語音信號S30衰減以產生經處 理高頻帶語音信號S30a。通常,除非在高頻帶語音信號S30的當前位置處已檢測到高頻 帶突發,否則衰減控制信號SB70指示無衰減的值(例如,l.O或OdB的增益),在所述 已檢測到高頻帶突發的情況下,典型的衰減值為0.3或約10 dB的增益減小量。
衰減控制信號發生器C22的替代實施方案可經配置以根據邏輯關係將低頻帶突發指 示信號SB10與高頻帶突發指示信號SB20組合。在一個此類實例中,通過計算高頻帶突
發指示信號SB20與低頻帶突發指示信號SB 10的邏輯反向形式(logical inverse)的邏輯 與來組合突發指示信號。在此情況下,突發指示信號的每一者可首先按閾值取值以獲得 二進位值信號,且衰減控制信號計算器C100可經配置以根據所組合信號的狀態來指示兩 個衰減狀態中的一個相應狀態(例如,指示無衰減的一個狀態)。
在執行包絡計算之前,可能需要使語音信號S20和S30中的一者或兩者的頻譜整形 以使頻譜平坦化且/或使一個或一個以上特定頻率區域加重或衰減。低頻帶語音信號S20 (例如)可能往往在低頻率下具有較多能量,且可能需要減少此能量。還可能需要減少低 頻帶語音信號S20的高頻率分量使得突發檢測主要基於中間頻率。頻譜整形是可改進突 發抑制器C200的性能的可選操作。
圖18展示突發檢測器C14的實施方案C16的框圖,所述實施方案包括整形濾波器 CllO。在一個實例中,濾波器C110經配置以根據例如以下通帶轉移函數來對低頻帶語 音信號S20進行濾波
formula see original document page 23
其使極低和極高的頻率衰減。
可能需要使高頻帶語音信號S30的低頻率衰減且/或增強使較高頻率。在一個實例中: 濾波器C110經配置以根據例如以下高通轉移函數來對高頻帶語音信號S30進行濾波
formula see original document page 23
其使4 kHz左右的頻率衰減。
在實際意義上可能不必以相應語音信號S20、S30的全取樣速率執行突發檢測操作中 的至少一些操作。圖19展示突發檢測器C16的實施方案C18的框圖,所述實施方案包 括經配置以對前向和後向處理路徑中的每一者中的相應平滑包絡進行降取樣的降取樣器 C120。在一個實例中,每一降取樣器C120經配置而以八為因數對包絡進行降取樣。對 於在8kHz下取樣的20毫秒幀(160個樣本)的特定實例來說,此類降取樣器將包絡減 小到lkHz取樣率,或每幀20個樣本。降取樣可顯著減小高頻帶突發抑制操作的計算復 雜性,而不會顯著影響性能。
由增益控制元件C150施加的衰減控制信號可能需要與高頻帶語音信號S30具有相同 的取樣率。圖20展示衰減控制信號發生器C22的實施方案C24的框圖,所述實施方案 可結合突發檢測器C10的降取樣型式來使用。衰減控制信號發生器C24包括升取樣器 C140,所述升取樣器C140經配置以對衰減控制信號SB70進行升取樣而獲得取樣率等於 高頻帶語音信號S30的取樣率的信號SB70a。
在一個實例中,升取樣器C140經配置以通過衰減控制信號SB70的零階內插來執行 升取樣。在另一實例中,升取樣器C140經配置以另外通過在衰減控制信號SB70的值之 間進行內插(例如,通過傳遞衰減控制信號SB70通過FIR濾波器)以獲得較不陡峭的 過渡,來執行升取樣。在另一實例中,升取樣器C140經配置以使用窗口正弦函數來執行 升取樣。
在一些情況下(例如在電池供電裝置(例如,蜂窩式電話)中),高頻帶突發抑制器 C200可經配置以選擇性地被禁用。舉例來說,可能需要在裝置的省電模式下禁用例如高 頻帶突發抑制的操作。
如上所提及,本文所描述的實施例包括可用於執行嵌入式編碼的實施方案,支持與 窄帶系統的兼容性以及避免需要代碼轉換。對高頻帶編碼的支持還可用於基於成本來區 分具有寬帶支持以及向後兼容性的晶片、晶片集、裝置和/或網絡與僅具有窄帶支持的芯 片、晶片集、裝置和/或網絡。本文所描述的對高頻帶編碼的支持還可結合用於支持低頻 帶編碼的技術來使用,且根據此實施例的系統、方法或設備可支持(例如)約50或100 Hz直到約7或8 kHz的頻率分量的編碼。
如上所提及,向語音編碼器添加高頻帶支持可改進可識度,尤其可改進關於摩擦音 的區分的可識度。雖然通常可由聽者從特定上下文中導出這種區分,但是高頻帶支持可 用作語音識別和其它機器解譯應用(例如用於自動化語音菜單導航和/或自動呼叫處理的 系統)中的啟動特徵。高頻帶突發抑制可增加機器解譯應用中的精確性,且預期高頻帶 突發抑制器C200的實施方案可用於一個或一個以上進行或不進行語音編碼的此類應用 中。
根據一實施例的設備可嵌入用於無線通信的可攜式裝置中,所述可攜式裝置例如蜂 窩式電話或個人數字助理(PDA)。或者,此類設備可包括在另一通信裝置中,所述另一 通信裝置例如VoIP手機、經配置以支持VoIP通信的個人計算機,或經配置以路由電話 或VoIP通信的網絡裝置。舉例來說,根據一實施例的設備可在用於通信裝置的晶片或芯 片集中實施。視特定應用而定,此類裝置還可包括例如以下特徵語音信號的模擬-數字
轉換和/或數字-模擬轉換、用於對語音信號執行放大和/或其它信號處理操作的電路,和/ 或用於發射和/或接收經編碼語音信號的射頻電路。
明確地預期且揭示實施例可包括第60/667,901號和第60/673,965號美國臨時專利 申請案中以及上文列出的相關專利申請案中揭示的其它特徵中的任一者或一者以上且/ 或與所述其它特徵中的任一者或一者以上一起使用,本申請案主張所述美國臨時專利申 請案的權益。此類特徵包括從低頻帶激勵信號中產生高頻帶激勵信號,其可包括其它特 徵,例如反稀疏濾波、使用非線性函數進行諧波延伸、經調製噪聲信號與經頻譜延伸 的信號的混合,和/或自適應白化。此類特徵包括根據在低頻帶編碼器中執行的規則化來 對高頻帶語音信號進行時間扭曲。此類特徵包括根據原始語音信號與合成語音信號之間 的關係來編碼增益包絡。此類特徵包括使用重疊的濾波器組來從寬帶語音信號中獲得低 頻帶和高頻帶語音信號。此類特徵包括根據窄帶激勵信號S80或窄帶殘差信號S50的規 則化和其它移位來使高頻帶信號S30和/或高頻帶激勵信號S120移位。此類特徵包括系 數表示形式(例如高頻帶LSF)的固定或自適應平滑。此類特徵包括與係數表示形式(例 如LSF)的量化相關聯的噪聲的固定或自適應整形。此類特徵還包括增益包絡的固定或 自適應平滑,和增益包絡的自適應衰減。
提供對所描述的實施例的以上介紹以使所屬領域的技術人員能夠製造或使用本發 明。對這些實施例的各種修改是可能的,且本文所提出的一般原理也可應用於其它實施 例。舉例來說,實施例可部分或整體實施為硬連線電路、實施為製作成專用集成電路的 電路配置,或實施為加載到非易失性存儲裝置中的固件程序或作為機器可讀代碼從數據 存儲媒體加載或加載到數據存儲媒體中的軟體程序,所述代碼為可由邏輯元件陣列(例 如微處理器或其它數位訊號處理單元)執行的指令。數據存儲媒體可為存儲元件的陣 列,例如半導體存儲器(其可包括(不限於)動態或靜態RAM (隨機存取存儲器)、
ROM (只讀存儲器)和/或快閃RAM),或鐵電、磁阻、雙向、聚合或相變存儲器;或盤 式媒體,例如磁碟或光碟。應將術語"軟體"理解為包括原始碼、彙編語言代碼、機器 代碼、二進位代碼、固件、宏代碼、微碼、可由邏輯元件陣列執行的任何一個或一個以 上指令集或指令序列,以及此類實例的任何組合。
高頻帶語音編碼器A200,寬帶語音編碼器AIOO、 A102和A104以及高頻帶突發抑 制器C200的實施方案的各種元件及包括一個或一個以上此類設備的布置可實施為駐留 在(例如)同一晶片上或一晶片集中的兩個或兩個以上晶片之間的電子和/或光學裝置, 但是也涵蓋不存在這種限制的其它布置。此類設備的一個或一個以上元件可整體或部分
地實施為經布置以執行一個或一個以上固定或可編程邏輯元件(例如,電晶體、門)陣 列的一個或一個以上指令集,所述陣列例如微處理器、嵌入式處理器、IP核心、數字信 號處理器、FPGA (現場可編程門陣列)、ASSP (專用標準產品)和ASIC (專用集成電 路)。 一個或一個以上此類元件也可能具有共同結構(例如,用於在不同時間執行對應於 不同元件的代碼部分的處理器、用於在不同時間執行對應於不同元件的任務的指令集, 或在不同時間為不同元件執行操作的電子和/或光學裝置的布置)。此外, 一個或一個以 上此類元件有可能用於執行與所述設備的操作不直接相關的任務或其它指令集,例如與 內嵌有所述設備的裝置或系統的另一操作相關的任務。
實施例還包括額外的語音處理、語音編碼和高頻帶突發抑制方法,所述方法如本文 (例如)通過描述經配置以執行此類方法的結構實施例而明確揭示。這些方法的每一者也 可確實地實施(例如,在上文所列舉的一個或一個以上數據存儲媒體中)為一個或一個 以上可由包括邏輯元件陣列(例如,處理器、微處理器、微控制器或其它有限狀態機) 的機器讀取和/或執行的指令集。因此,本發明不希望限於上文所展示的實施例,而是應 符合與本文中以任何方式揭示的原理和新穎特徵一致的最廣泛範圍。
權利要求
1.一種信號處理方法,所述方法包含計算第一突發指示信號,所述第一突發指示信號指示在語音信號的低頻部分中是否檢測到突發;計算第二突發指示信號,所述第二突發指示信號指示在所述語音信號的高頻部分中是否檢測到突發;根據所述第一突發指示信號與所述第二突發指示信號之間的關係產生衰減控制信號;以及將所述衰減控制信號施加給所述語音信號的所述高頻部分。
2. 根據權利要求1所述的信號處理方法,其中所述計算第一突發指示信號和所述計算 第二突發指示信號中的至少一者包含-產生所述語音信號的在正時間方向上平滑的相應部分的包絡; 指示在所述前向平滑包絡中的突發的初始區域; 產生所述語音信號的在負時間方向上平滑的相應部分的包絡;以及 指示在所述後向平滑包絡中的突發的終止區域。
3. 根據權利要求2所述的信號處理方法,其中所述計算第一突發指示信號和所述計算 第二突發指示信號中的至少一者包含檢測所述初始區域與所述終止區域在時間上 的重合。
4. 根據權利要求2所述的信號處理方法,其中所述計算第一突發指示信號和所述計算 第二突發指示信號中的至少一者包含根據所述初始區域與所述終止區域在時間上 的重疊來指示突發。
5. 根據權利要求2所述的方法,其中所述計算第一突發指示信號和所述計算第二突發 指示信號中的至少一者包含根據兩個信號的均值計算所述相應的突發指示信號,所 述兩個信號為(A)基於所述初始區域的指示的信號和(B)基於所述終止區域的指 示的信號。
6. 根據權利要求l所述的方法,其中所述第一突發指示信號和所述第二突發指示信號 中的至少一者指示所檢測的突發在對數標度上的電平。
7. 根據權利要求l所述的方法,其中所述產生衰減控制信號包括根據所述第一突發指 示信號與所述第二突發指示信號之間的差來產生所述衰減控制信號。
8. 根據權利要求l所述的方法,其中所述產生衰減控制信號包括根據所述第二突發指 示信號的電平超過所述第一突發指示信號的電平的程度來產生所述衰減控制信號。
9. 根據權利要求1所述的方法,其中所述將所述衰減控制信號施加給所述語音信號的 所述高頻部分包含以下兩者中的至少一者(A)將所述語音信號的所述高頻部分與 所述衰減控制信號相乘,和(B)根據所述衰減控制信號放大所述語音信號的所述 高頻部分。
10. 根據權利要求l所述的方法,所述方法包含處理所述語音信號以獲得所述低頻部分 和所述高頻部分。
11. 根據權利要求l所述的方法,所述方法包含將基於所述增益控制元件的輸出的信號 編碼成至少多個線性預測濾波器係數。
12. 根據權利要求11所述的方法,所述方法包含將所述低頻部分編碼成至少第二多個線 性預測濾波器係數和經編碼激勵信號,其中所述編碼基於所述增益控制元件的輸出的信號包括根據基於所述經編碼激 勵信號的信號來編碼基於所述增益控制元件的輸出的信號的增益包絡。
13. 根據權利要求12所述的方法,所述方法包含基於所述經編碼激勵信號產生高頻帶 激勵信號,其中所述編碼基於所述增益控制元件的輸出的信號包括根據基於所述高頻帶激 勵信號的信號來編碼基於所述增益控制元件的輸出的信號的增益包絡。
14. 一種數據存儲媒體,其具有描述根據權利要求1所述的信號處理方法的機器可執行 指令。
15. —種包含高頻帶突發抑制器的設備,所述高頻帶突發抑制器包含第一突發檢測器,其經配置以輸出第一突發指示信號,所述第一突發指示信號指 示在語音信號的低頻部分中是否檢測到突發;第二突發檢測器,其經配置以輸出第二突發指示信號,所述第二突發指示信號指 示在所述語音信號的高頻部分中是否檢測到突發;衰減控制信號發生器,其經配置以根據所述第一突發指示信號與所述第二突發指 示信號之間的關係來產生衰減控制信號;以及增益控制元件,其經配置以將所述衰減控制信號施加給所述語音信號的所述高頻 部分。
16. 根據權利要求15所述的設備,其中所述第一突發檢測器和所述第二突發檢測器中的至少一者包含-前向平滑器,其經配置以產生所述語音信號的在正時間方向上平滑的相應部分的 包絡;第一區域指示器,其經配置以指示在所述前向平滑包絡中的突發的初始區域; 後向平滑器,其經配置以產生所述語音信號的在負時間方向上平滑的相應部分的 包絡;以及第二區域指示器,其經配置以指示在所述後向平滑包絡中的突發的終止區域。
17. 根據權利要求16所述的設備,其中所述至少一個突發檢測器包含重合檢測器,所 述重合檢測器經配置以檢測所述初始區域與所述終止區域在時間上的重合。
18. 根據權利要求16所述的設備,其中所述至少一個突發檢測器包含重合檢測器,所 述重合檢測器經配置以根據所述初始區域與所述終止區域在時間上的重疊來指示 突發。
19. 根據權利要求16所述的設備,其中所述至少一個突發檢測器包含重合檢測器,所 述重合檢測器其經配置以根據兩個信號的均值來輸出所述相應的突發指示信號,所 述兩個信號為(A)基於所述初始區域的指示的信號和(B)基於所述終止區域的指 示的信號。
20. 根據權利要求15所述的設備,其中所述第一突發指示信號和所述第二突發指示信 號中的至少一者指示所檢測的突發在對數標度上的電平。
21. 根據權利要求15所述的設備,其中所述衰減控制信號發生器經配置以根據所述第 一突發指示信號與所述第二突發指示信號之間的差來產生所述衰減控制信號。
22. 根據權利要求15所述的設備,其中所述衰減控制信號發生器經配置以根據所述第 二突發指示信號的電平超過所述第一突發指示信號的電平的程度來產生所述衰減 控制信號。
23. 根據權利要求15所述的設備,其中所述增益控制元件包含乘法器和放大器中的至 少一者。
24. 根據權利要求15所述的設備,所述設備包含濾波器組,所述濾波器組經配置以處 理所述語音信號以獲得所述低頻部分和所述高頻部分。
25. 根據權利要求15所述的設備,所述設備包含高頻帶語音編碼器,所述高頻帶語音 編碼器經配置以將基於所述增益控制元件的輸出的信號編碼成至少多個線性預測 濾波器係數。
26. 根據權利要求25所述的設備,所述設備包含低頻帶語音編碼器,所述低頻帶語音 編碼器經配置以將所述低頻部分編碼成至少第二多個線性預測濾波器係數和經編 碼激勵信號,其中所述高頻帶語音編碼器經配置以根據基於所述經編碼激勵信號的信號來編 碼基於所述增益控制元件的輸出的信號的增益包絡。
27. 根據權利要求26所述的設備,其中所述高頻帶編碼器經配置以基於所述經編碼激 勵信號來產生高頻帶激勵信號,且其中所述高頻帶語音編碼器經配置以根據基於所述高頻帶激勵信號的信號來編 碼基於所述增益控制元件的輸出的信號的增益包絡。
28. 根據權利要求15所述的設備,所述設備包含蜂窩式電話。
29. —種設備,其包含用於計算第一突發指示信號的裝置,所述第一突發指示信號指示在語音信號的低 頻部分中是否檢測到突發;用於計算第二突發指示信號的裝置,所述第二突發指示信號指示在所述語音信號 的高頻部分中是否檢測到突發;用於根據所述第一突發指示信號與所述第二突發指示信號之間的關係產生衰減 控制信號的裝置;以及用於將所述衰減控制信號施加給所述語音信號的所述高頻部分的裝置。
全文摘要
在一個實施例中,一種高頻帶突發抑制器包括第一突發檢測器,其經配置以檢測低頻帶語音信號中的突發;以及第二突發檢測器,其經配置以檢測相應高頻帶語音信號中的突發。所述低頻帶語音信號和高頻帶語音信號可為寬帶語音信號的不同(可能重疊)頻率區域。所述高頻帶突發抑制器還包括衰減控制信號計算器,所述衰減控制信號計算器經配置以根據所述第一突發檢測器的輸出與所述第二突發檢測器的輸出之間的差來計算衰減控制信號。增益控制元件經配置以將所述衰減控制信號施加給所述高頻帶語音信號。在一個實例中,當在所述高頻帶語音信號中發現突發而在所述低頻帶語音信號的在時間上的相應區域中不存在突發時,所述衰減控制信號指示衰減。
文檔編號G10L19/00GK101185120SQ200680018269
公開日2008年5月21日 申請日期2006年4月3日 優先權日2005年4月1日
發明者科恩·貝爾納德·福斯, 阿南塔帕德馬納卜漢·A·坎達達伊 申請人:高通股份有限公司