新四季網

用於寬頻帶語音編碼的系統、方法和設備的製作方法

2023-11-04 18:42:22 4

專利名稱:用於寬頻帶語音編碼的系統、方法和設備的製作方法
技術領域:
本發明涉及信號處理。 背景技水
公共交換電話網絡(PSTN)上的語音通信的帶寬傳統上限於300-3400 kHz的頻率範 圍。用於語音通信(例如蜂窩式電話和IP語音(網際網路協議,VoIP))的新的網絡可能 不具有相同的帶寬限制,且可能需要在此類網絡上發射和接收包含寬頻帶頻率範圍的語 音通信。舉例來說,可能需要支持向下延伸到50 Hz和/或一直到7或8 kHz的音頻頻率 範圍。還可能需要支持可能具有在傳統PSTN限制以外的範圍內的音頻語音內容的其它 應用,例如高質量音頻或音頻/視頻會議。
語音編碼器所支持的範圍向較高頻率的延伸可改進清晰度。舉例來說,區分例如"s" 與"f"的摩擦音的信息主要處於高頻率。高頻帶延伸還可改進語音的其它質量,例如存 在率。舉例來說,甚至濁元音也可具有遠遠高於PSTN限制的頻譜能量。
寬頻帶語音編碼的一種方法涉及縮放窄頻帶語音編碼技術(例如,經配置以編碼0-4 kHz的範圍的技術)以覆蓋寬頻帶頻譜。舉例來說,語音信號可以較高速率取樣以包含 處於高頻率的分量,且窄頻帶編碼技術可重新配置以使用更多濾波係數來表示此寬頻帶 信號。然而,例如CELP (密碼本激勵線性預測)的窄頻帶編碼技術計算量較大,而寬頻 帶CELP編碼器可能消耗過多處理循環,以至於對於許多移動和其它嵌入式應用而言不 現實。使用這種技術將寬頻帶信號的整個頻譜編碼為所需質量還可能導致帶寬大大增加 而令人無法接受。此外,甚至在此經編碼信號的窄頻帶部分可傳輸到僅支持窄頻帶編碼 的系統中和/或由所述系統解碼之前,將需要對所述經編碼信號進行代碼轉換。
寬頻帶語音編碼的另一種方法涉及從經編碼窄頻帶頻譜包絡外推高頻帶頻譜包絡。 雖然這種方法可在不增加帶寬且不需要代碼轉換的情況下實施,但通常無法從窄頻帶部 分的頻譜包絡中精確地預測出語音信號的高頻帶部分的粗略頻譜包絡或共振峰結構。
可能需要實施寬頻帶語音編碼,使得至少經編碼信號的窄頻帶部分可通過窄頻帶信 道(例如,PSTN信道)發送,而不進行代碼轉換或其它顯著修改。還可能需要寬頻帶編 碼延伸有效率,以便(例如)避免在例如無線蜂窩式電話以及有線和無線信道上的廣播 的應用中可能接受服務的用戶的數目顯著減少。

發明內容
在一個實施例中, 一種信號處理方法包含根據至少一窄頻帶激勵信號和多個窄頻 帶濾波器參數來合成窄頻帶語音信號;以及基於所述窄頻帶激勵信號產生高頻帶激勵信 號。所述方法還包含根據至少所述高頻帶激勵信號和多個高頻帶濾波器參數來合成高 頻帶語音信號;以及將窄頻帶語音信號與高頻帶語音信號組合以獲得寬頻帶語音信號。 在此方法中,產生高頻帶激勵信號包含將非線性函數應用於基於所述窄頻帶激勵信號的 信號以產生頻譜延伸信號,且高頻帶激勵信號是基於所述頻譜延伸信號。
在另一實施例中, 一種設備包含窄頻帶解碼器,其經配置以根據至少一窄頻帶激勵 信號和多個窄頻帶濾波器參數來合成窄頻帶語音信號。所述設備還包含高頻帶解碼器, 其經配置以基於所述窄頻帶激勵信號產生高頻帶激勵信號,並根據至少所述高頻帶激勵 信號和多個高頻帶濾波器參數來合成高頻帶語音信號。所述設備還包含濾波器組,其經 配置以將窄頻帶語音信號與高頻帶語音信號組合以獲得寬頻帶語音信號。所述高頻帶解 碼器經配置以將非線性函數應用於基於所述窄頻帶激勵信號的信號以產生頻譜延伸信 號,並基於所述頻譜延伸信號產生高頻帶激勵信號。
在另一實施例中, 一種信號處理方法包含處理寬頻帶語音信號以獲得窄頻帶語音
信號和高頻帶語音信號;以及將窄頻帶語音信號編碼為經編碼窄頻帶激勵信號和多個窄 頻帶濾波器參數。所述方法還包含基於所述窄頻帶激勵信號產生高頻帶激勵信號,其中 窄頻帶激勵信號基於所述經編碼窄頻帶激勵信號。所述方法包含根據高頻帶激勵信號將 高頻帶語音信號編碼為至少多個高頻帶濾波器參數。在此方法中,產生高頻帶激勵信號 包含將非線性函數應用於基於所述窄頻帶激勵信號的信號以產生頻譜延伸信號,且高頻 帶激勵信號基於所述頻譜延伸信號。
在另一實施例中, 一種設備包含濾波器組,其經配置以對寬頻帶語音信號進行濾 波以獲得窄頻帶語音信號和高頻帶語音信號;以及窄頻帶編碼器,其經配置以將窄頻帶 語音信號編碼為至少經編碼窄頻帶激勵信號和多個窄頻帶濾波器參數。所述設備包含高 頻帶編碼器,其經配置以基於經編碼窄頻帶激勵信號產生高頻帶激勵信號,並根據高頻
帶激勵信號將高頻帶語音信號編碼為至少多個高頻帶濾波器參數。所述高頻帶編碼器經
配置以將非線性函數應用於基於所述經編碼窄頻帶激勵信號的信號以產生頻譜延伸信
號,並基於所述頻譜延伸信號產生高頻帶激勵信號。


圖la展示根據一實施例的寬頻帶語音編碼器A100的方塊圖。
圖lb展示寬頻帶語音編碼器A100的實施方案A102的方塊圖。
圖2a展示根據一實施例的寬頻帶語音解碼器B100的方塊圖。
圖2b展示寬頻帶語音編碼器B100的實施方案B102的方塊圖。
圖3a展示濾波器組A110的實施方案A112的方塊圖。
圖3b展示濾波器組B120的實施方案B122的方塊圖。
圖4a展示濾波器組A110的一個實例的低和高頻帶的帶寬覆蓋。
圖4b展示濾波器組A110的另一實例的低和高頻帶的帶寬覆蓋。
圖4c展示濾波器組A112的實施方案A114的方塊圖。
圖4d展示濾波器組B122的實施方案B124的方塊圖。
圖5a展示語音信號的頻率與對數幅值的曲線的實例。
圖5b展示基礎線性預測編碼系統的方塊圖。
圖6展示窄頻帶編碼器A120的實施方案A122的方塊圖。
圖7展示窄頻帶解碼器B110的實施方案B112的方塊圖。
圖8a展示濁語音的殘留信號的頻率與對數幅值的曲線的實例。
圖8b展示濁語音的殘留信號的時間與對數幅值的曲線的實例。
圖9展示也執行長期預測的基礎線性預測編碼系統的方塊圖。
圖10展示高頻帶編碼器A200的實施方案A202的方塊圖。
圖11展示高頻帶激勵發生器A300的實施方案A302的方塊圖。
圖12展示頻譜延伸器A400的實施方案A402的方塊圖。
圖12a展示頻譜延伸操作的一個實例中各點處的信號頻譜的曲線。
圖12b展示頻譜延伸操作的另一實例中各點處的信號頻譜的曲線。
圖13展示高頻帶激勵發生器A302的實施方案A304的方塊圖。
圖14展示高頻帶激勵發生器A302的實施方案A306的方塊圖。
圖15展示包絡計算任務T100的流程圖。
圖16展示組合器490的實施方案492的方塊圖。
圖17說明計算高頻帶信號S30的周期性的指標的方法。
圖18展示高頻帶激勵發生器A302的實施方案A312的方塊圖。 圖19展示高頻帶激勵發生器A302的實施方案A314的方塊圖。 圖20展示高頻帶激勵發生器A302的實施方案A316的方塊圖。 圖21展示增益計算任務T200的流程圖。 圖22展示增益計算任務T200的實施方案T210的流程圖。 圖23a展示窗口函數的圖。
圖23b展示將如圖23a所示的窗口函數應用於語音信號的子幀。
圖24展示高頻帶解碼器B200的實施方案B202的方塊圖。
圖25展示寬頻帶語音編碼器A100的實施方案AD10的方塊圖。
圖26a展示延遲線D120的實施方案D122的示意圖。
圖26b展示延遲線D120的實施方案D124的示意圖。
圖27展示延遲線D120的實施方案D130的示意圖。
圖28展示寬頻帶語音編碼器AD10的實施方案AD12的方塊圖。
圖29展示根據一實施例的信號處理方法MD100的流程圖。
圖30展示根據一實施例的方法M100的流程圖。
圖31a展示根據一實施例的方法M200的流程圖。
圖31b展示方法M200的實施方案M210的流程圖。
圖32展示根據一實施例的方法M300的流程圖。
在各圖以及隨附的描述中,相同參考標號表示相同或類似的元件或信號。
具體實施例方式
本文描述的實施例包含可經配置以向窄頻帶語音編碼器提供延伸以支持傳輸和/或 存儲寬頻帶語音信號而帶寬僅增加約800到1000 bps (位/秒)的系統、方法和設備。此
類實施方案的潛在優點包含支持與窄頻帶系統的兼容性的嵌入式編碼、在窄頻帶與高頻 帶編碼信道之間相對容易地分配和再分配位、避免計算量較大的寬頻帶合成操作,以及 維持待通過計算量較大的波形編碼例行程序處理的信號的低取樣速率。
除非特別受到上下文限制,否則本文使用術語"計算"來表示其普通含義的任一者, 例如計算、產生和從值的列表中選擇。本描述內容和權利要求書中使用術語"包括"時, 不排除其它元件或操作。使用術語"A基於B"來表示其普通含義的任一者,包含以下 情況(i) "A等於B"和(ii) "A至少基於B"。術語"網際網路協議"包含如IETF (因 特網工程工作小組)RFC (請求註解)791中描述的版本4和隨後版本(例如,版本6)。
圖la展示根據一實施例的寬頻帶語音編碼器A100的方塊圖。濾波器組A110經配 置以對寬頻帶語音信號S10進行濾波以產生窄頻帶信號S20和高頻帶信號S30。窄頻帶 編碼器A120經配置以編碼窄頻帶信號S20以產生窄頻帶(NB)濾波器參數S40和窄頻 帶殘留信號S50。如本文進一步詳細描述,窄頻帶編碼器A120通常經配置以作為密碼本 索引或採取另一量化形式而產生窄頻帶濾波器參數S40和經編碼窄頻帶激勵信號S50。 高頻帶編碼器A200經配置以根據經編碼窄頻帶激勵信號S50中的信息編碼高頻帶信號 S30以產生高頻帶編碼參數S60。如本文進一步詳細描述,高頻帶編碼器A200通常經配 置以作為密碼本索引或採取另一量化形式而產生高頻帶編碼參數S60。寬頻帶語音編碼 器A10O的一個特定實例經配置以在約8.55 kbps (千位/秒)的速率下編碼寬頻帶語音信 號SIO,其中約7.55 kbps用於窄頻帶濾波器參數S40和經編碼窄頻帶激勵信號S50,且 約1 kbps用於高頻帶編碼參數S60。
可能需要將經編碼窄頻帶和高頻帶信號組合為單一位流。舉例來說,可能需要將經 編碼信號多路復用在一起以作為經編碼寬頻帶語音信號用於傳輸(例如,在有線、光學 或無線傳輸信道上)或用於存儲。圖lb展示寬頻帶語音編碼器A100的實施方案A102 的方塊圖,寬頻帶語音編碼器A100包含多路復用器A130,其經配置以將窄頻帶濾波器 參數S40、經編碼窄頻帶激勵信號S50和高頻帶濾波器參數S60組合為多路復用信號S70。
一種包含編碼器A102的設備還可包含經配置以將多路復用信號S70傳輸到例如有 線、光學或無線信道的傳輸信道中的電路。此設備還可經配置以對信號執行一個或一個 以上信道編碼操作,例如誤差校正編碼(例如,速率兼容巻積編碼)和/或誤差檢測編碼 (例如,循環冗餘編碼),和/或一層或一層以上網絡協議編碼(例如,乙太網、TCP/IP、 cdma2000)。
可能需要多路復用器A130經配置以嵌入經編碼窄頻帶信號(包含窄頻帶濾波器參數 S40和經編碼窄頻帶激勵信號S50)作為可分離的多路復用信號S70支流,使得經編碼窄 頻帶信號可獨立於多路復用信號S70的另一部分(例如,高頻帶和/或低頻帶信號)被恢 復並解碼。舉例來說,多路復用信號S70可經配置使得經編碼窄頻帶信號可通過剝除高 頻帶濾波器參數S60而恢復。這一特徵的一個潛在優點是避免在將經編碼寬頻帶信號傳 遞到支持窄頻帶信號的解碼但不支持高頻帶部分的解碼的系統之前需要對所述經編碼寬 頻帶信號進行代碼轉換。
圖2a展示根據一實施例的寬頻帶語音解碼器B100的方塊圖。窄頻帶解碼器B110 經配置以解碼窄頻帶濾波器參數S40和經編碼窄頻帶激勵信號S50以產生窄頻帶信號
S90。高頻帶解碼器B200經配置以根據基於經編碼窄頻帶激勵信號S50的窄頻帶激勵信 號S80而解碼高頻帶編碼參數S60,以產生高頻帶信號SIOO。在此實例中,窄頻帶解碼 器B110經配置以將窄頻帶激勵信號S80提供到高頻帶解碼器B200。濾波器組B120經配 置以將窄頻帶信號S90與高頻帶信號S100組合以產生寬頻帶語音信號SllO。
圖2b是寬頻帶語音解碼器BIOO的實施方案B102的方塊圖,寬頻帶語音解碼器B100 包含多路分解器B130,其經配置以從多路復用信號S70中產生經編碼信號S40、 S50和 S60。 一種包含解碼器B102的設備可包含經配置以從例如有線、光學或無線信道的傳輸 信道接收多路復用信號S70的電路。此設備還可經配置以對信號執行一個或一個以上信 道解碼操作,例如誤差校正解碼(例如,速率兼容巻積解碼)和/或誤差檢測解碼(例如, 循環冗餘解碼),和/或一層或一層以上網絡協議解碼(例如,乙太網、TCP/IP、 cdma2000)。
濾波器組A110經配置以根據分裂頻帶方案對輸入信號進行濾波以產生低頻率子頻 帶和高頻率子頻帶。視特定應用的設計標準而定,輸出子頻帶可具有相等或不等的帶寬 且可能重疊或不重疊。產生兩個以上子頻帶的濾波器組A110配置也是可能的。舉例來說, 此濾波器組可經配置以產生一個或一個以上低頻帶信號,所述低頻帶信號包含處於窄頻 帶信號S20的頻率範圍以下的頻率範圍(例如50-300 Hz的範圍)內的分量。此濾波器 組也可能經配置以產生一個或一個以上額外高頻帶信號,所述額外高頻帶信號包含處於 高頻帶信號S30的頻率範圍以上的頻率範圍(例如14-20、 16-20或16-32 kHz的範圍) 內的分量。在此情況下,可實施寬頻帶語音編碼器A100以單獨編碼此信號(一個或多個), 且多路復用器A130可經配置以將額外經編碼信號(一個或多個)包含在多路復用信號 S70中(例如,作為可分離部分)。
圖3a展示濾波器組A110的實施方案A112的方塊圖,濾波器組A110經配置以產生 具有減小的取樣速率的兩個子頻帶信號。濾波器組A110經配置以接收具有高頻率(或高 頻帶)部分和低頻率(或低頻帶)部分的寬頻帶語音信號SIO。濾波器組A112包含經配 置以接收寬頻帶語音信號S10並產生窄頻帶語音信號S20的低頻帶處理路徑,和經配置 以接收寬頻帶語音信號S10並產生高頻帶語音信號S30的高頻帶處理路徑。低通濾波器 110對寬頻帶語音信號S10進行濾波以通過選定的低頻率子頻帶,且高通濾波器130對 寬頻帶語音信號S10進行濾波以通過選定的高頻率子頻帶。因為兩個子頻帶信號的帶寬 比寬頻帶語音信號S10窄,所以其取樣速率可在一定程度上減小而無信息損失。向下取 樣器120根據所需的抽選因數(例如,通過去除信號的樣本和/或用平均值代替樣本)來 減小低通信號的取樣速率,且向下取樣器140同樣地根據另一所需的抽選因數來減小高
1 通信號的取樣速率。
圖3b展示濾波器組B120的相應實施方案B122的方塊圖。向上取樣器150 (例如, 通過零塞入和/或通過複製樣本)增加窄頻帶信號S90的取樣速率,且低通濾波器160對 向上取樣信號進行濾波以僅通過低頻帶部分(例如,以防止混疊)。同樣,向上取樣器 170增加高頻帶信號S100的取樣速率,且高通濾波器180對向上取樣信號進行濾波以僅 通過高頻帶部分。接著,將兩個通頻帶信號求和以形成寬頻帶語音信號SllO。在解碼器 B100的一些實施方案中,濾波器組B120經配置以根據由高頻帶解碼器B200接收和/或 計算的一個或一個以上權數來產生兩個通頻帶信號的加權總和。還預期將兩個以上通頻 帶信號組合的濾波器組B120配置。
濾波器110、 130、 160、 180的每一者可實施為有限脈衝響應(FIR)濾波器或實施 為無限脈衝響應(IIR)濾波器。編碼器濾波器IIO和130的頻率響應可具有抑止頻帶與 通頻帶之間的對稱或相異形狀的轉變區。同樣,解碼器濾波器160和180的頻率響應可 具有抑止頻帶與通頻帶之間的對稱或相異形狀的轉變區。可能需要(但不是嚴格有必要) 低通濾波器110與低通濾波器160具有相同響應,且高通濾波器130與高通濾波器180 具有相同響應。在一個實例中,兩個濾波器對110、 130和160、 180是正交鏡像濾波器 (QMF)組,其中濾波器對IIO、 130與濾波器對160、 180具有相同係數。
在典型實例中,低通濾波器110具有包含300-3400 Hz的有限PSTN範圍的通頻帶(例 如,0到4kHz的頻帶)。圖4a和4b展示兩個不同實施實例中寬頻帶語音信號SIO、窄 頻帶信號S20和高頻帶信號S30的相對帶寬。在這兩個特定實例中,寬頻帶語音信號S10 具有16 kHz的取樣速率(表示0到8 kHz範圍內的頻率分量),且窄頻帶信號S20具有8 kHz的取樣速率(表示0到4kHz範圍內的頻率分量)。
在圖4a的實例中,兩個子頻帶之間不存在明顯重疊。此實例中所示的高頻帶信號 S30可通過使用具有4-8kHz的通頻帶的高通濾波器130來獲得。在此情況下,可能需要 通過以2為因數向下取樣經濾波信號而將取樣速率減小為8 kHz。可預期此操作會顯著減 小對信號的進一步處理操作的計算複雜性,此操作將把通頻帶能量下移到0到4 kHz範 圍內而無信息損失。
在圖4b的替代實例中,上部和下部子頻帶具有明顯重疊,使得兩個子頻帶信號均描 述3.5到4 kHz的區域。此實例中的高頻帶信號S30可通過使用具有3.5-7 kHz的通頻帶 的高通濾波器130來獲得。在此情況下,可能需要通過以16/7為因數向下取樣經濾波信 號而將取樣速率減小為7 kHz。可預期此操作會顯著減小對信號的進一步處理操作的計算
複雜性,此操作將把通頻帶能量下移到0到3.5 kHz範圍內而無信息損失。
在典型電話通信手機中, 一個或一個以上變換器(即,麥克風和耳機或揚聲器)缺 乏7-8 kHz的頻率範圍上的明顯響應。在圖4b的實例中,寬頻帶語音信號S10的處於7 與8 kHz之間的部分不包含在經編碼信號中。高通濾波器130的其它特定實例具有3.5-7.5 kHz和3.5-8 kHz的通頻帶。
在一些實施方案中,如在圖4b的實例中在子頻帶之間提供重疊允許使用在重疊區上 具有平滑衰減的低通和/或高通濾波器。此類濾波器與具有較急劇或"磚牆式(brick-wall)" 響應的濾波器相比,通常較易設計,計算上不太複雜,且/或引起的延遲較少。具有急劇 轉變區的濾波器往往比具有平滑衰減的類似等級的濾波器具有更高的旁瓣(這可能引起 混疊)。具有急劇轉變區的濾波器還可能具有長脈衝響應,這可能引起振鈴假象。對於具 有一個或一個以上IIR濾波器的濾波器組實施方案,允許重疊區上的平滑衰減可使得能 夠使用極點較遠離單位圓的濾波器(一個或多個),這對於確保穩定的定點實施方案可能 較重要。
子頻帶重疊允許低頻帶與高頻帶的平滑混合,這可導致較少的可聽到的假象,減少 混疊,且/或使一個頻帶到另一頻帶的轉變不太明顯。此外,窄頻帶編碼器A120 (例如, 波形編碼器)的編碼效率可隨著頻率不斷增加而下降。舉例來說,可能在低位速率下, 尤其在存在背景噪聲的情況下減小窄頻帶編碼器的編碼質量。在此類情況下,提供子頻 帶重疊可提高重疊區中複製的頻率分量的質量。
此外,子頻帶重疊允許低頻帶與高頻帶的平滑混合,其可能導致較少的可聽到的假 象,減少混疊,且/或使一個頻帶到另一頻帶的轉變不太明顯。此特徵對於窄頻帶編碼器 A120和高頻帶編碼器A200根據不同編碼方法操作的實施方案可能尤其合乎需要。舉例 來說,不同編碼技術可產生聽起來非常不同的信號。以密碼本索引形式編碼頻譜包絡的 編碼器可產生具有與改為編碼幅值譜的編碼器不同的聲音的信號。時域編碼器(例如,
脈衝-代碼調製或PCM編碼器)可產生具有與頻域編碼器不同的聲音的信號。以頻譜包 絡和相應殘留信號的表示形式編碼信號的編碼器可產生具有與僅以頻譜包絡表示形式編 碼信號的編碼器不同的聲音的信號。將信號編碼為其波形的表示形式的編碼器可產生具
有與來自正弦編碼器的輸出不同的聲音的輸出。在此類情況下,使用具有急劇轉變區的 濾波器來界定非重疊子頻帶可能導致合成的寬頻帶信號中子頻帶之間的轉變較突然且感 覺上較明顯。
儘管子頻帶技術中通常使用具有互補重疊頻率響應的QMF濾波器組,但此類濾波器
不適於本文描述的寬頻帶編碼實施方案中的至少一些實施方案。編碼器處的QMF濾波器 組經配置以產生較大程度的混疊,所述混疊在解碼器處的相應QMF濾波器組中被消去。 此配置可能不適於信號招致濾波器組之間的大量失真的應用,因為失真可減小混疊消去 性質的效力。舉例來說,本文描述的應用包含經配置以在非常低的位速率下操作的編碼 實施方案。由於位速率非常低,所以經解碼信號很可能與原始信號相比呈現為明顯失真, 使得QMF濾波器組的使用可導致未消去的混疊。使用QMF濾波器組的應用通常具有較 高位速率(例如,對於AMR超過12kbps,且對於G.722超過64 kbps)。
另外,編碼器可經配置以產生感覺上類似於原始信號但實際上顯著不同於原始信號 的合成信號。舉例來說,如本文所描述從窄頻帶殘留中導出高頻帶激勵的編碼器可產生 此信號,因為經解碼信號中可能完全不存在實際高頻帶殘留。在此類應用中使用QMF濾 波器組可導致由未消去的混疊引起的較大程度的失真。
如果受影響子頻帶較窄,那麼可減小QMF混疊引起的失真量,因為混疊的影響限於 與子頻帶寬度相等的帶寬。然而,對於本文描述的其中每一子頻帶包含寬頻帶帶寬的約 一半的實例,由未消去的混疊引起的失真可能影響信號的大部分。信號的質量也可能受 上面發生未消去的混疊的頻帶的位置影響。舉例來說,寬頻帶語音信號中心附近(例如, 3與4kHz之間)產生的失真可能比信號邊緣附近(例如,6kHz以上)發生的失真有害 得多。
雖然QMF濾波器組的濾波器的響應彼此嚴格相關,但濾波器組A110和B120的低
頻帶和高頻帶路徑可經配置以具有除兩個子頻帶的重疊外完全不相關的頻譜。我們將兩 個子頻帶的重疊定義為高頻帶濾波器的頻率響應下降到-20 dB的點至低頻帶濾波器的頻 率響應下降到-20dB的點的距離。在濾波器組A110和/或B120的各種實例中,此重疊範 圍為約200 Hz到約1 kHz。約400到約600 Hz的範圍可表示編碼效率與感知平滑度之間 的理想折衷。在上文提及的一個特定實例中,重疊在500Hz附近。
可能需要實施濾波器組A112和/或B122來在若干階段執行圖4a和4b中說明的操作。 舉例來說,圖4c展示濾波器組A112的實施方案A114的方塊圖,實施方案A114使用一 系列內插、再取樣、抽選和其它操作來執行功能等效的高通濾波和向下取樣操作。此類 實施方案可較易設計且/或可允許再使用邏輯和/或代碼的功能塊。舉例來說,可使用相同 功能塊來執行如圖4c所示至14 kHz的抽選以及至7 kHz的抽選的操作。可通過將信號 與函數e—或序列(-l)n相乘來實施頻譜反轉操作,所述序列(-l)n的值在+l與-1之間交替。 頻譜成形操作可實施為經配置以使信號成形從而獲得所需的總體濾波器響應的低通濾波 器。
注意到,由於頻譜反轉操作的緣故,高頻帶信號S30的頻譜反轉。可相應地配置編 碼器和相應解碼器中的後續操作。舉例來說,本文描述的高頻帶激勵發生器A300可經配 置以產生同樣具有頻譜反轉形式的高頻帶激勵信號S120。
圖4d展示濾波器組B122的實施方案B124的方塊圖,濾波器組B122使用一系列內 插、再取樣和其它操作來執行功能等效的向上取樣和髙通濾波操作。濾波器組B124包含 高頻帶中的頻譜反轉操作,其使與例如編碼器的濾波器組(例如,濾波器組A114)中執 行的類似的操作反轉。在此特定實例中,濾波器組B124還包含低頻帶和高頻帶中的陷波 濾波器,其削弱7100 Hz處的信號分量,但此類濾波器是任選的且不需要包含此類濾波 器。與此一同申請的代理人案號為050551的專利申請案"SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING"包含關於濾波器組A110和B120的特 定實施方案的元件的響應的額外描述和圖式,且此材料在此以引用的方式併入。
窄頻帶編碼器A120根據源-濾波器模型而實施,其將輸入語音信號編碼為(A) — 組描述濾波器的參數和(B)驅動所描述的濾波器產生輸入語音信號的合成複製物的激勵 信號。圖5a展示語音信號的頻譜包絡的實例。表現此頻譜包絡的特徵的峰值表示聲域的 諧振且稱為共振峰。大多數語音編碼器至少將此粗略譜結構編碼為一組參數(例如,濾 波器係數)。
圖5b展示如應用於窄頻帶信號S20的頻譜包絡的編碼的基礎源-濾波器配置的實例。 分析模塊計算描述對應於一段時間(通常20毫秒)內的語音聲音的濾波器的一組參數。 根據那些濾波器參數配置的白化濾波器(也稱為分析或預測誤差濾波器)去除頻譜包絡 以對信號進行頻譜整平。所得的白化信號(也稱為殘留)與原始語音信號相比,具有較 少能量且因此變化較小並且較易於編碼。由於對殘留信號編碼引起的誤差還可能較均勻 地散布在頻譜上。濾波器參數和殘留通常經過量化以用於在信道上有效傳輸。在解碼器 處,根據濾波器參數配置的合成濾波器由基於殘留的信號激勵以產生原始語音聲音的合 成版本。合成濾波器通常經配置以具有轉移函數,所述轉移函數是白化濾波器的轉移函 數的反轉形式。
圖6展示窄頻帶編碼器A120的基礎實施方案A122的方塊圖。在此實例中,線性預 測編碼(LPC)分析模塊210將窄頻帶信號S20的頻譜包絡編碼為一組線性預測(LP) 係數(例如,全極濾波器的係數1/A(z))。分析模塊通常將輸入信號處理為一系列非重疊 幀,其中為每一幀計算一組新的係數。幀周期通常是可預期信號在本地靜止的周期;一
個常見實例為20毫秒(等效於8 kHz的取樣速率下160個樣本)。在一個實例中,LPC 分析模塊210經配置以計算一組10個LP濾波器係數以描述每一20毫秒幀的共振峰結構。 也可能實施分析模塊以將輸入信號處理為一系列重疊幀。
分析模塊可經配置以直接分析每一幀的樣本,或者可首先根據窗口函數(例如,漢 明窗口)對樣本進行加權。也可在大於幀的窗口 (例如,30毫秒窗口)上執行分析。此 窗口可對稱(例如5-20-5,使得其包含緊接著20毫秒幀之前和之後的5毫秒)或不對稱 (例如10-20,使得其包含先前幀的最後10毫秒)。LPC分析模塊通常經配置以使用 Levinson-Durbin遞歸式或Leroux-Gueguen算法計算LP濾波器係數。在另一實施方案中, 分析模塊可經配置以計算每一幀的一組倒譜係數而不是一組LP濾波器係數。
編碼器A120的輸出速率可通過量化濾波器係數而顯著減小,且對複製質量的影響相 對較小。線性預測濾波器係數難以有效量化,且通常映射為另一表示形式,例如線譜對 (LSP)或線譜頻率(LSF),以用於量化和/或熵編碼。在圖6的實例中,LP濾波器係數 -LSF變換220將所述組LP濾波器係數變換為一組相應的LSF。 LP濾波器係數的其它一 對一表示形式包含部分自相關係數、對數面積比值、導抗譜對(ISP)和導抗譜頻率(ISF), 其用於GSM (全球移動通信系統)AMR-WB (自適應多速寬頻帶)編解碼器中。通常, 一組LP濾波器係數與一組相應的LSF之間的變換是可逆的,但實施例還包含變換不可 在無誤差情況下可逆的編碼器A120實施方案。
量化器230經配置以量化所述組窄頻帶LSF (或其它係數表示形式),且窄頻帶編碼 器A122經配置以輸出此量化的結果作為窄頻帶濾波器參數S40。此量化器通常包含向量 量化器,其將輸入向量編碼為對於表或密碼本中的相應向量條目的索引。
如圖6所示,窄頻帶編碼器A122還通過使窄頻帶信號S20通過根據所述組濾波器 係數配置的白化濾波器260 (也稱為分析或預測誤差濾波器)來產生殘留信號。在此特 定實例中,白化濾波器260實施為FIR濾波器,但也可使用IIR實施方案。此殘留信號 通常將含有窄頻帶濾波器參數S40中未表示的感覺上較重要的語音幀信息,例如與音調 有關的長期結構。量化器270經配置以計算此殘留信號的量化表示形式以作為經編碼的 窄頻帶激勵信號S50輸出。此量化器通常包含向量量化器,其將輸入向量編碼為對於表 或密碼本中的相應向量條目的索引。或者,此量化器可經配置以發送一個或一個以上參 數,可在解碼器處從所述參數中動態地產生向量,而不是如稀疏密碼本方法中一樣從存 儲裝置中檢索向量。此方法用於例如代數CELP (密碼本激勵線性預測)的編碼方案和例 如3GPP2 (第三代合作夥伴關係2) EVRC (增強可變速率編解碼器)的編解碼器中。
需要窄頻帶編碼器A120根據將可用於相應窄頻帶解碼器的相同濾波器參數值來產 生經編碼窄頻帶激勵信號。以此方式,所得的經編碼窄頻帶激勵信號可能已在某種程度 上考慮那些參數值的不理想性,例如量化誤差。因此,需要使用將在解碼器處可用的相 同係數值來配置白化濾波器。在如圖6所示的編碼器A122的基礎實例中,反轉量化器 240對窄頻帶編碼參數S40解量化,LSF-LP濾波器係數變換250將所得值映射回一組相 應的LP濾波器係數,且此組係數用於配置白化濾波器260以產生由量化器270量化的殘 留信號。
窄頻帶編碼器A120的一些實施方案經配置以通過從一組密碼本向量中識別出與殘 留信號最佳匹配的一個向量來計算經編碼窄頻帶激勵信號S50。然而,注意到,窄頻帶 編碼器A120也可經實施以計算殘留信號的量化表示形式而不實際上產生殘留信號。舉例 來說,窄頻帶編碼器A120可經配置以使用許多密碼本向量來產生相應的合成信號(例如, 根據一組當前濾波器參數),並選擇與感知加權域中和原始窄頻帶信號S20最佳匹配的所 產生信號相關聯的密碼本向量。
圖7展示窄頻帶解碼器BUO的實施方案B112的方塊圖。反轉量化器310對窄頻帶 濾波器參數S40解量化(在此情況下,解量化為一組LSF),且LSF-LP濾波器係數變換 320將LSF變換為一組濾波器係數(例如,如上文參照窄頻帶編碼器A122的反轉量化器 240和變換250所描述)。反轉量化器340對窄頻帶殘留信號S40解量化以產生窄頻帶激 勵信號S80。基於濾波器係數和窄頻帶激勵信號S80,窄頻帶合成濾波器330合成窄頻帶 信號S卯。換句話說,窄頻帶合成濾波器330經配置以根據解量化濾波器係數對窄頻帶 激勵信號S80進行頻譜成形,以產生窄頻帶信號S90。窄頻帶解碼器B112還將窄頻帶激 勵信號S80提供到高頻帶編碼器A200,高頻帶編碼器A200使用窄頻帶激勵信號S80來 導出高頻帶激勵信號S120,如本文所描述。在下文描述的一些實施方案中,窄頻帶解碼 器B110可經配置以將與窄頻帶信號有關的額外信息(例如,頻譜傾斜、音調增益和滯後, 以及語音模式)提供到高頻帶解碼器B200。
窄頻帶編碼器A122和窄頻帶解碼器B112的系統是合成分析語音編解碼器的基礎實 例。密碼本激勵線性預測(CELP)編碼是合成分析編碼的一個普遍系列,且此類編碼器 的實施方案可執行殘留的波形編碼,其中包含例如從固定和自適應密碼本中選擇條目的
操作、誤差最小化操作和/或感知加權操作。合成分析編碼的其它實施方案包含混合激勵 線性預測(MELP)、代數CELP (ACELP)、鬆弛CELP (RCELP)、規貝U脈衝'激勵(RPE)、 多脈衝CELP (MPE)和向量和激勵線性預測(VSELP)編碼。相關編碼方法包含多頻帶
激勵(MBE)和原型波形內插(PWI)編碼。標準合成分析語音編解碼器的實例包含使 用殘留激勵線性預測(RELP)的ETSI (歐洲電信標準協會)GSM全速率編解碼器(GSM 06.10)、 GSM增強全速率編解碼器(ETSI-GSM 06.60)、 ITU (國際電信聯盟)標準11.8 kb/s G.729 Annex E編碼器、IS-136的IS (臨時標準)641編解碼器(時分多址方案)、 GSM自適應多速率(GSM-AMR)編解碼器,和4GV (第四代Vocoder )編解碼器 (加州聖地牙哥市的高通公司(QUALCOMM Incorporated, San Diego, CA))。窄頻帶編碼 器A120和相應的解碼器B110可根據這些技術中的任一者或任何其它語音編碼技術(己 知的或待開發的)實施,所述語音編碼技術將語音信號表示為(A) —組描述濾波器的參 數和(B)用於驅動所描述的濾波器複製語音信號的激勵信號。
即使在白化濾波器已從窄頻帶信號S20中去除粗略頻譜包絡之後,也可能保留相當 大量的精細諧波結構(尤其對於濁語音來說)。圖8a展示濁音信號(例如,元音)的殘 留信號(如可能由白化濾波器產生)的一個實例的頻譜曲線。此實例中可見的周期性結 構與音調有關,且同一說話者發出的不同濁音可能具有不同的共振峰結構但具有類似的 音調結構。圖8b展示此殘留信號的實例的時域曲線,其展示音調脈衝的時間序列。
可通過使用一個或一個以上參數值編碼音調結構的特性來增加編碼效率和/或語音 質量。音調結構的一個重要特性是第一諧波的頻率(也稱為基頻),其通常在60到400 Hz 範圍內。此特性通常編碼為基頻的反轉形式,也稱為音調滯後(pitch lag)。音調滯後指 示一個音調周期中樣本的數目,且可編碼為一個或一個以上密碼本索引。來自男性說話
者的語音信號往往比來自女性說話者的語音信號具有更大的音調滯後。
與音調結構有關的另一信號特性是周期性,其指示諧波結構的強度,或換句話說, 信號為諧波或非諧波的程度。周期性的兩個典型指示符是零交叉和標準化自相關函數 (NACF)。周期性也可由音調增益來指示,所述音調增益通常編碼為密碼本增益(例如, 量化自適應密碼本增益)。
窄頻帶編碼器A120可包含經配置以編碼窄頻帶信號S20的長期諧波結構的一個或 一個以上模塊。如圖9所示,可使用的一個典型CELP範例包含開放式迴路LPC分析模 塊,其編碼短期特性或粗略頻譜包絡,之後是閉合式迴路長期預測分析階段,所述階段 編碼精細音調或諧波結構。短期特性編碼為濾波器係數,且長期特性編碼為例如音調滯 後和音調增益的參數的值。舉例來說,窄頻帶編碼器A120可經配置以便以包含一個或一 個以上密碼本索引(例如,固定密碼本索引和自適應密碼本索引)和相應增益值的形式 輸出經編碼窄頻帶激勵信號S50。窄頻帶殘留信號的這種量化表示形式的計算(例如,
通過量化器270)可包含選擇這些索引和計算這些值。音調結構的編碼還可包含內插音 調原型波形,所述操作可包含計算連續音調脈衝之間的差。可針對對應於清語音(其通 常類似於噪聲且未系統化)的幀禁用長期結構的建模。
根據圖9所示的範例的窄頻帶解碼器B110的實施方案可經配置以在長期結構(音調 或諧波結構)已恢復之後將窄頻帶激勵信號S80輸出到高頻帶解碼器B200。舉例來說, 此解碼器可經配置以輸出窄頻帶激勵信號S80作為經編碼窄頻帶激勵信號S50的解量化 版本。當然,也可能實施窄頻帶解碼器BllO,使得高頻帶解碼器B200執行經編碼窄頻 帶激勵信號S50的解量化以獲得窄頻帶激勵信號S80。
在根據圖9所示的範例的寬頻帶語音編碼器A100的實施方案中,高頻帶編碼器A200 可經配置以接收由短期分析或白化濾波器產生的窄頻帶激勵信號。換句話說,窄頻帶編 碼器A120可經配置以在編碼長期結構之前將窄頻帶激勵信號輸出到高頻帶編碼器 A200。然而,高頻帶編碼器A200需要從窄頻帶信道接收將由高頻帶解碼器B200接收的 相同編碼信息,使得高頻帶編碼器A200產生的編碼參數可能已在某種程度上考慮所述信 息的不理想性。因此,可能優選的是,高頻帶編碼器A200從待由寬頻帶語音編碼器A100 輸出的相同參數化和/或量化經編碼窄頻帶激勵信號S50中重建窄頻帶激勵信號S80。此 方法的一個潛在優點是較準確地計算下文描述的高頻帶增益因數S60b。
除了描述窄頻帶信號S20的短期和/或長期結構的參數外,窄頻帶編碼器A120還可 產生與窄頻帶信號S20的其它特性有關的參數值。這些值(其可能經適宜量化以由寬頻 帶語音編碼器A100輸出)可包含在窄頻帶濾波器參數S40中或單獨輸出。高頻帶編碼 器A200也可經配置以根據這些額外參數中的一者或一者以上(例如,解量化之後)計算 高頻帶編碼參數S60。在寬頻帶語音解碼器B100處,高頻帶解碼器B200可經配置以經 由窄頻帶解碼器BllO (例如,解量化之後)接收參數值。或者,高頻帶解碼器B200可 經配置以直接接收(且可能用於解量化)參數值。
在額外窄頻帶編碼參數的一個實例中,窄頻帶編碼器A120產生每一幀的頻譜傾斜和 語音模式參數的值。頻譜傾斜與通頻帶上頻譜包絡的形狀有關,且通常由量化第一反射 係數表示。對於大多數濁音,頻譜能量隨著頻率的不斷增加而減小,使得第一反射係數 為負且可接近-1。大多數清音具有平整的頻譜,從而使得第一反射係數接近零,或者在 高頻率下具有較多能量,從而使得第一反射係數為正且可接近+1。
語音模式(也稱為發聲模式)指示當前幀表示濁語音還是清語音。此參數可具有二 進位值,其基於周期性的一個或一個以上指標(例如,零交叉、NACF、音調增益)和/
或幀的聲音活動(例如,此指標與閾值之間的關係)。在其它實施方案中,語音模式參數 具有一個或一個以上其它狀態以指示例如無聲或背景噪聲或無聲與濁語音之間的轉變的 模式。
高頻帶編碼器A200經配置以根據源-濾波器模型來編碼高頻帶信號S30,其中此濾 波器的激勵是基於經編碼窄頻帶激勵信號。圖10展示高頻帶編碼器A200的實施方案 A202的方塊圖,高頻帶編碼器A200經配置以產生包含高頻帶濾波器參數S60a和高頻帶 增益因數S60b的高頻帶編碼參數S60流。高頻帶激勵發生器A300從經編碼窄頻帶激勵 信號S50中導出高頻帶激勵信號S120。分析模塊A210產生描述高頻帶信號S30的頻譜 包絡的一組參數值。在此特定實例中,分析模塊A210經配置以執行LPC分析以便為高 頻帶信號S30的每一幀產生一組LP濾波器係數。線性預測濾波器係數-LSF變換410將 所述組LP濾波器係數變換為一組相應的LSF。如上文參照分析模塊210和變換220所述, 分析模塊A210和/或變換410可經配置以使用其它係數組(例如,倒譜係數)和/或係數 表示形式(例如,ISP)。
量化器420經配置以量化所述組高頻帶LSF (或其它係數表示形式,例如ISP),且 高頻帶編碼器A202經配置以輸出此量化的結果作為高頻帶濾波器參數S60a。此量化器 通常包含向量量化器,其將輸入向量編碼為對於表或密碼本中的相應向量條目的索引。
高頻帶編碼器A202還包含合成濾波器A220,其經配置以根據分析模塊A210產生 的高頻帶激勵信號S120和經編碼頻譜包絡(例如,所述組LP濾波器係數)來產生合成 高頻帶信號S130。合成濾波器A220通常實施為IIR濾波器,但也可使用FIR實施方案。 在特定實例中,合成濾波器A220實施為六次線性自回歸濾波器。
高頻帶增益因數計算器A230計算原始高頻帶信號S30與合成高頻帶信號S130的電 平之間的一個或一個以上差,以指定幀的增益包絡。量化器430可實施為將輸入向量編 碼為對於表或密碼本中的相應向量條目的索引的向量量化器,其量化指定增益包絡的值 (一或多個),且高頻帶編碼器A202經配置以輸出此量化的結果作為高頻帶增益因數 S60b。
在如圖IO所示的實施方案中,合成濾波器A220經配置以從分析模塊A210接收濾 波器係數。高頻帶編碼器A202的替代實施方案包含反轉量化器和反轉變換,其經配置以 從高頻帶濾波器參數S60a中解碼濾波器係數,且在此情況下合成濾波器A220經配置以 改為接收經解碼濾波器係數。此替代配置可支持由高頻帶增益計算器A230較準確地計算 增益包絡。
在一個特定實例中,分析模塊A210和高頻帶增益計算器A230分別每幀輸出一組六 個LSF和一組五個增益值,使得可僅用每幀十一個額外值來實現窄頻帶信號S20的寬頻 帶延伸。耳朵對於高頻率下的頻率誤差往往較不敏感,因而低LPC級的高頻帶編碼可產 生具有可與較高LPC級的窄頻帶編碼相比的感知質量的信號。高頻帶編碼器A200的典 型實施方案可經配置以每幀輸出8到12位用於頻譜包絡的高質量重建,以及每幀輸出另 外8到12位用於時間包絡的高質量重建。在另一特定實例中,分析模塊A210每幀輸出 一組八個LSF。
高頻帶編碼器A200的一些實施方案經配置以通過以下方式產生高頻帶激勵信號 S120:產生具有高頻帶頻率分量的隨機噪聲信號,並根據窄頻帶信號S20、窄頻帶激勵 信號S80或高頻帶信號S30的時域包絡對噪聲信號進行幅值調製。雖然這種基於噪聲的 方法對於清音可產生適當結果,然而,其對於濁音可能不理想,濁音的殘留通常為諧波 且因此具有某種周期性結構。
高頻帶激勵發生器A300經配置以通過將窄頻帶激勵信號S80的頻譜延伸到高頻帶 頻率範圍中來產生高頻帶激勵信號S120。圖11展示高頻帶激勵發生器A300的實施方案 A302的方塊圖。反轉量化器450經配置以解量化經編碼窄頻帶激勵信號S50以產生窄頻 帶激勵信號S80。頻譜延伸器A400經配置以基於窄頻帶激勵信號S80產生諧波延伸信號 S160。組合器470經配置以將噪聲發生器480產生的隨機噪聲信號與包絡計算器460計 算的時域包絡組合以產生經調製噪聲信號S170。組合器490經配置以將諧波延伸信號S60 與經調製噪聲信號S170混合以產生高頻帶激勵信號S120。
在一個實例中,頻譜延伸器A400經配置以對窄頻帶激勵信號S80執行頻譜摺疊操 作(也稱為鏡射)以產生諧波延伸信號S160。頻譜摺疊可由零塞入激勵信號S80執行且 接著應用高通濾波器來保留偽信號。在另一實例中'頻譜延伸器A400經配置以通過將窄 頻帶激勵信號S80頻譜轉譯到高頻帶中(例如,經由向上取樣,之後與恆定頻率餘弦信 號相乘)來產生諧波延伸信號S160。
頻譜摺疊和轉譯方法可產生諧波結構在相位和/或頻率上與窄頻帶激勵信號S80的原 始諧波結構不連續的頻譜延伸信號。舉例來說,此類方法可產生具有通常不位於基頻的 倍數處的峰值的信號,這可能在重建的語音信號中引起聲音微弱的假象。這些方法往往 還產生具有不自然較強音調特性的高頻率諧波。然而,因為PSTN信號可在8 kHz下取
樣但帶寬被限制為不大於3400 Hz,所以窄頻帶激勵信號S80的上部頻譜可能含有極少或 不含有能量,使得根據頻譜摺疊或頻譜轉譯操作產生的延伸信號可具有3400 Hz以上的頻譜缺陷。
產生諧波延伸信號S160的其它方法包含識別窄頻帶激勵信號S80的一個或一個以上 基頻,和根據所述信息產生諧音。舉例來說,激勵信號的諧波結構可由基頻與幅值和相 位信息一起描述。高頻帶激勵發生器A300的另一實施方案基於基頻和幅值(例如,如由 音調滯後和音調增益指示)來產生諧波延伸信號S160。然而,除非諧波延伸信號與窄頻 帶激勵信號S80在相位上相干,否則所得的經解碼語音的質量可能不可接受。
可使用非線性函數來產生與窄頻帶激勵相位上相干並保持諧波結構而沒有相位不連 續性的高頻帶激勵信號。非線性函數還可提供高頻率諧波之間的增加的噪聲電平,其往 往比通過例如頻譜摺疊和頻譜轉譯的方法產生的音調高頻率諧波聽起來更為自然。可由 頻譜延伸器A400的各種實施方案應用的典型無記憶非線性函數包含絕對值函數(也稱為 全波整流)、半波整流、平方、立方和削波。頻譜延伸器A400的其它實施方案可經配置 以應用具有記憶的非線性函數。
圖12是頻譜延伸器A400的實施方案A402的方塊圖,頻譜延伸器A400經配置以應 用非線性函數來延伸窄頻帶激勵信號S80的頻譜。向上取樣器510經配置以對窄頻帶激 勵信號S80進行向上取樣。可能需要對信號進行充分向上取樣以使應用非線性函數時的 混疊最小化。在一個特定實例中,向上取樣器510以8為因數對信號進行向上取樣。向 上取樣器510可經配置以通過對輸入信號進行零塞入並對結果進行低通濾波來執行向上 取樣操作。非線性函數計算器520經配置以將非線性函數應用於經向上取樣信號。對於 頻譜延伸(例如,平方)而言,絕對值函數相對於其它非線性函數的一個潛在優點是, 不需要能量標準化。在一些實施方案中,可通過剝離或清除每一樣本的符號位來有效地 應用絕對值函數。非線性函數計算器520還可經配置以執行經向上取樣或頻譜延伸信號 的幅值偏差。
向下取樣器530經配置以對應用非線性函數的頻譜延伸結果進行向下取樣。向下取 樣器530可能需要執行帶通濾波操作以在減小取樣速率(例如,以便減小或避免由於不 必要圖像引起的混疊或訛誤)之前選擇頻譜延伸信號的所需頻帶。向下取樣器530可能 還需要在一個以上階段減小取樣速率。
圖12a是展示頻譜延伸操作的一個實例中各點處的信號頻譜的圖,其中頻率標度在 各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實例的頻譜。曲線(b)展示信號S80 已被以8為因數向上取樣之後的頻譜。曲線(c)展示應用非線性函數之後的延伸頻譜的實 例。曲線(d)展示低通濾波之後的頻譜。在此實例中,通頻帶延伸到高頻帶信號S30的頻
率上限(例如,7kHz或8kHz)。
曲線(e)展示向下取樣的第一階段之後的頻譜,其中使取樣速率以4為因數減小以獲 得寬頻帶信號。曲線(f)展示進行高通濾波操作以選擇延伸信號的高頻帶部分之後的頻譜, 且曲線(g)展示向下取樣的第二階段之後的頻譜,其中使取樣速率以2為因數減小。在一 個特定實例中,向下取樣器530通過使寬頻帶信號通過濾波器組A112 (或具有相同響應 的其它結構或例行程序)的高通濾波器130和向下取樣器140來執行高通濾波和向下取 樣的第二階段,以產生具有高頻帶信號S30的頻率範圍和取樣速率的頻譜延伸信號。
如曲線(g)中可見,曲線(f)所示的高通信號的向下取樣促使其頻譜反轉。在此實例中, 向下取樣器530還經配置以對信號執行頻譜翻轉操作。曲線(h)展示應用頻譜翻轉操作的 結果,所述頻譜翻轉操作可通過將信號與函數e^或序列(-l)n相乘來執行,所述序列(-l)11 的值在+1與-1之間交替。此操作等效於在頻域中將信號的數字頻譜移位距離兀。注意到, 還可通過以不同次序應用向下取樣和頻譜翻轉操作來獲得相同結果。向上取樣和/或向下 取樣的操作還可經配置以包含再取樣來獲得具有高頻帶信號S30的取樣速率(例如,7 kHz)的頻譜延伸信號。
如上文注意到,濾波器組A110和B120可經實施使得窄頻帶和高頻帶信號S20、 S30 中的一者或兩者在濾波器組A110的輸出處具有頻譜反轉形式,以頻譜反轉形式被編碼和 解碼,並在寬頻帶語音信號S110中輸出之前在濾波器組B120處再次頻譜反轉。當然, 在此情況下,將不需要如圖12a所示的頻譜翻轉操作,因為高頻帶激勵信號S120將也需 要具有頻譜反轉形式。
頻譜延伸器A402執行的頻譜延伸操作的向上取樣和向下取樣的各個任務可以許多 不同方式配置和安排。舉例來說,圖12b是展示頻譜延伸操作的另一實例中各點處的信 號頻譜的圖,其中頻率標度在各曲線上相同。曲線(a)展示窄頻帶激勵信號S80的一個實 例的頻譜。曲線(b)展示信號S80已被以2為因數向上取樣之後的頻譜。曲線(c)展示應用 非線性函數之後的延伸頻譜的實例。在此情況下,接受較高頻率中可能發生的混疊。
曲線(d)展示頻譜反轉操作之後的頻譜。曲線(e)展示向下取樣的單一階段之後的頻 譜,其中使取樣速率以2為因數減小以獲得所需頻譜延伸信號。在此實例中,所述信號 採取頻譜反轉形式,且可用於處理採取此形式的高頻帶信號S30的高頻帶編碼器A200 的實施方案中。
非線性函數計算器520產生的頻譜延伸信號很可能隨著頻率增加而幅值明顯降低。 頻譜延伸器A402包含頻譜整平器540,其經配置以對經向下取樣信號執行白化操作。頻
譜整平器540可經配置以執行固定白化操作或執行自適應白化操作。在自適應白化的特 定實例中,頻譜整平器540包含LPC分析模塊,其經配置以依據經向下取樣信號計算 一組四個濾波器係數;以及四次分析濾波器,其經配置以根據那些係數對信號進行白化。 頻譜延伸器A400的其它實施方案包含頻譜整平器540在向下取樣器530之前對頻譜延伸 信號操作的配置。
可實施高頻帶激勵發生器A300以輸出諧波延伸信號S160作為高頻帶激勵信號 S120。然而,在一些情況下,僅使用諧波延伸信號作為高頻帶激勵可能導致可聽到的假 象。語音的諧波結構在高頻帶中通常不如低頻帶中明顯,且在高頻帶激勵信號中使用過 多諧波結構可能導致嗡嗡聲。此假象在來自女性說話者的語音信號中可能尤其明顯。
實施例包含經配置以將諧波延伸信號S160與噪聲信號混合的高頻帶激勵發生器 A300的實施方案。如圖11所示,高頻帶激勵發生器A302包含噪聲發生器480,其經配 置以產生隨機噪聲信號。在一個實例中,噪聲發生器480經配置以產生單位方差白色偽 隨機噪聲信號,但在其它實施方案中,噪聲信號不需要為白色的且可具有隨著頻率變化 的功率密度。噪聲發生器480可能需要經配置以輸出噪聲信號作為確定性函數以便可在 解碼器處複製其狀態。舉例來說,噪聲發生器480可經配置以輸出噪聲信號作為早先在 相同幀內編碼的信息(例如,窄頻帶濾波器參數S40和/或經編碼窄頻帶激勵信號S50) 的確定性函數。
在與諧波延伸信號S160混合之前,噪聲發生器480產生的隨機噪聲信號可經幅值調 制以具有近似窄頻帶信號S20、高頻帶信號S30、窄頻帶激勵信號S80或諧波延伸信號 S160的隨時間能量分布的時域包絡。如圖11所示,高頻帶激勵發生器A302包含組合器 470,其經配置以根據包絡計算器460計算的時域包絡對噪聲發生器480產生的噪聲信號 進行幅值調製。舉例來說,組合器470可實施為乘法器,其經配置以根據包絡計算器460 計算的時域包絡來縮放噪聲發生器480的輸出以產生經調製噪聲信號S170。
如圖13的方塊圖所示,在高頻帶激勵發生器A302的實施方案A304中,包絡計算 器460經配置以計算諧波延伸信號S160的包絡。如圖14的方塊圖所示,在高頻帶激勵 發生器A302的實施方案A306中,包絡計算器460經配置以計算窄頻帶激勵信號S80的 包絡。高頻帶激勵發生器A302的另外的實施方案可以其它方式配置以根據窄頻帶音調脈 衝的位置及時向諧波延伸信號S160添加噪聲。
包絡計算器460可經配置以作為一項包含一系列子任務的任務而執行包絡計算。圖 15展示此任務的實例T100的流程圖。子任務T110計算包絡待建模的信號(例如,窄頻
帶激勵信號S80或諧波延伸信號S160)的幀的每一樣本的平方以產生平方值序列。子任 務T120對平方值序列執行平滑操作。在一個實例中,子任務T120根據以下表達式向序 列應用一次IIR低通濾波器-
formula see original document page 26 (1)
其中x是濾波器輸入,y是濾波器輸出,n是時域索引,且a是具有0.5與l之間的 值的平滑係數。平滑係數a的值可為固定的,或者在替代實施方案中,可根據輸入信號 中噪聲的指示而自適應,使得在無噪聲的情況下a較接近l,且在存在噪聲的情況下較接 近0.5。子任務T130將平方根函數應用於經平滑序列的每一樣本以產生時域包絡。
包絡計算器460的此實施方案可經配置以按照串行和/或並行方式執行任務T100的 各個子任務。在任務T100的另外的實施方案中,子任務T110之前可以是帶通操作,其 經配置以選擇包絡待建模的信號的所需頻率部分,例如3-4kHz範圍。
組合器490經配置以將諧波延伸信號S160與經調製噪聲信號S170混合以產生高頻 帶激勵信號S120。組合器490的實施方案可經配置(例如)以將高頻帶激勵信號S120 計算為諧波延伸信號S160與經調製噪聲信號S170的和。組合器490的此實施方案可經 配置以通過在求和之前向諧波延伸信號S160和/或向經調製噪聲信號S170應用加權因 數,而將高頻帶激勵信號S120計算為加權總和。可根據一個或一個以上標準來計算每一 此類加權因數,且所述加權因數可為固定值,或者在逐幀或逐子幀基礎上計算出的自適 應值。
圖16展示組合器490的實施方案492的方塊圖,所述實施方案492經配置以將高頻 帶激勵信號S120計算為諧波延伸信號S160與經調製噪聲信號S170的加權總和。組合器 492經配置以根據諧波加權因數S180加權諧波延伸信號S160,根據噪聲加權因數S190 加權經調製噪聲信號S170,並輸出高頻帶激勵信號S120作為被加權信號的總和。在此 實例中,組合器492包含加權因數計算器550,其經配置以計算諧波加權因數S180和噪 聲加權因數S190。
加權因數計算器550可經配置以根據高頻帶激勵信號S120中諧波含量與噪聲含量的 所需比率來計算加權因數S180和S190。舉例來說,組合器492可能需要產生高頻帶激 勵信號S120以具有與高頻帶信號S30的諧波能量與噪聲能量比類似的諧波能量與噪聲能 量比。在加權因數計算器550的一些實施方案中,根據與窄頻帶信號S20或窄頻帶殘留 信號的周期性有關的一個或一個以上參數(例如,音調增益和/或語音模式)來計算加權 因數S180、 S190。加權因數計算器550的此實施方案可經配置以向諧波加權因數S180
指派(例如)與音調增益成比例的值,且/或對於清語音信號比對於濁語音信號向噪聲加 權因數S190指派更高的值。
在其它實施方案中,加權因數計算器550經配置以根據高頻帶信號S30的周期性的 指標來計算諧波加權因數S180和/或噪聲加權因數S190的值。在一個此類實例中,加權 因數計算器550將諧波加權因數S180計算為高頻帶信號S30的當前幀或子幀的自相關係 數的最大值,其中在包含一個音調滯後的延遲且不包含零樣本的延遲的搜索範圍上執行 自相關。圖17展示以一個音調滯後的延遲為中心並具有不大於一個音調滯後的寬度的長 度為n個樣本的此搜索範圍的實例。
圖17還展示加權因數計算器550在若干階段計算高頻帶信號S30的周期性的指標的 另一方法的實例。在第一階段,將當前幀劃分為許多子幀,且針對每一子幀單獨識別自 相關係數為最大時的延遲。如上文所提及,在包含一個音調滯後的延遲且不包含零樣本 的延遲的搜索範圍上執行自相關。
在第二階段,通過將相應識別的延遲應用於每一子幀,連接所得的子幀以建立最佳 延遲幀,並將諧波加權因數S180計算為原始幀與最佳延遲幀之間的相關係數,來建立延 遲幀。在另一替代實施方案中,加權因數計算器550將諧波加權因數S180計算為第一階 段中針對每一子幀獲得的最大自相關係數的平均值。加權因數計算器550的實施方案還 可經配置以縮放相關係數,和/或將其與另一值組合,以計算諧波加權因數S180的值。
加權因數計算器550可能需要僅在以其它方式指示幀存在周期性的情況下計算高頻 帶信號S30的周期性的指標。舉例來說,加權因數計算器550可經配置以根據當前幀的 周期性的另一指示符(例如,音調增益)與閾值之間的關係來計算高頻帶信號S30的周 期性的指標。在一個實例中,加權因數計算器550經配置以僅當幀的音調增益(例如, 窄頻帶殘留的自適應密碼本增益)的值大於0.5(或者,至少0.5)時才對高頻帶信號S30 執行自相關運算。在另一實例中,加權因數計算器550經配置以僅針對具有特定語音模 式狀態的幀(例如,僅針對濁音信號)對高頻帶信號S30執行自相關運算。在此類情況 下,加權因數計算器550可經配置以針對具有其它語音模式狀態和/或較小的音調增益值 的幀分派默認加權因數。
實施例包含經配置以根據不同於周期性或除周期性以外的特性來計算加權因數的加 權因數計算器550的另外的實施方案。舉例來說,此實施方案可經配置以針對具有大音 調滯後的語音信號比針對具有小音調滯後的語音信號向噪聲增益因數S190分派更大的 值。加權因數計算器550的另一此類實施方案經配置以根據處於基頻的倍數處的信號能
量相對於處於其它頻率分量處的信號能量的指標,來確定寬頻帶語音信號S10或高頻帶 信號S30的諧度的指標。
寬頻帶語音編碼器A100的一些實施方案經配置以基於本文描述的音調增益和/或周 期性或諧度的另一指標,來輸出周期性或諧度的指示(例如,指示幀為諧波還是非諧波 的l位旗標)。在一個實例中,相應的寬頻帶語音解碼器B100使用此指示來配置例如加 權因數計算的操作。在另一實例中,此指示用於編碼器和/或解碼器處來計算語音模式參 數的值。
可能需要高頻帶激勵發生器A302產生高頻帶激勵信號S120,使得激勵信號的能量 大致不受加權因數S180和S190的特定值的影響。在此情況下,加權因數計算器550可 經配置以計算諧波加權因數S180或噪聲加權因數S190的值(或從存儲裝置或高頻帶編 碼器A200的另一元件接收此值),並根據例如以下表達式導出另一加權因數的值
(W諧波)2+(W噪聲)^1, (2)
其中W諧波表示諧波加權因數S180,且W噪聲表示噪聲加權因數S190。或者,加權因 數計算器550可經配置以根據當前幀或子幀的周期性測量的值從多對加權因數S180、 S190中選出相應一者,其中所述對經預先計算以滿足例如表達式(2)的恆定能量比。 對於遵循表達式(2)的加權因數計算器550的實施方案,諧波加權因數S180的典型值 在約0.7到約l.O範圍內,且噪聲加權因數S190的典型值在約0.1到約0.7範圍內。加權 因數計算器550的其它實施方案可經配置以根據依據諧波延伸信號S160與經調製噪聲信 號S170之間的所需基線加權修改的表達式(2)型式來操作。
當已使用稀疏密碼本(條目大部分為零值的密碼本)來計算殘留的量化表示形式時, 合成語音信號中可能發生假象。尤其當以低位速率編碼窄頻帶信號時,會發生密碼本稀 疏。密碼本稀疏引起的假象通常在時間上是準周期性的,且主要在3 kHz以上發生。因 為人耳在較高頻率下具有較好的時間分辨能力,所以這些假象在高頻帶中可能較明顯。
實施例包含經配置以執行抗稀疏濾波的高頻帶激勵發生器A300的實施方案。圖18 展示高頻帶激勵發生器A302的實施方案A312的方塊圖,所述實施方案A312包含抗稀 疏濾波器600,其經配置以對反轉量化器450產生的經解量化窄頻帶激勵信號進行濾波。 圖19展示高頻帶激勵發生器A302的實施方案A314的方塊圖,所述實施方案A314包含 抗稀疏濾波器600,其經配置以對頻譜延伸器A400產生的頻譜延伸信號進行濾波。圖20 展示高頻帶激勵發生器A302的實施方案A316的方塊圖,所述實施方案A316包含抗稀 疏濾波器600,其經配置以對組合器490的輸出進行濾波以產生高頻帶激勵信號S120。
當然,預期並在此明確地揭示將實施方案A304和A306的任一者的特徵與實施方案 A312、 A314和A316的任一者的特徵組合的高頻帶激勵發生器A300的實施方案。抗稀 疏濾波器600也可配置在頻譜延伸器A400內例如在頻譜延伸器A402中的元件510、 520、530和540的任一者之後。特別注意到,抗稀疏濾波器600也可用於頻譜延伸器A400 的執行頻譜摺疊、頻譜轉譯或諧波延伸的實施方案。
抗稀疏濾波器600可經配置以改變其輸入信號的相位。舉例來說,抗稀疏濾波器600 可能需要經配置和安排,使得高頻帶激勵信號S120的相位隨著時間隨機化或其它方式更 為均勻地分布。可能還需要抗稀疏濾波器600的響應為頻譜整平的,使得經濾波信號的 幅值頻譜不會有相當大的改變。在一個實例中,抗稀疏濾波器600根據以下表達式實施 為具有轉移函數的全通濾波器
u, 、 一0.7 + ^ 0.6+
1-0.7z—4 l + 0.6f6 。 (3)
此濾波器的一個作用可以是將輸入信號的能量散布開使得其不再僅集中於幾個樣本中。
密碼本稀疏引起的假象通常對於其中殘留包含較少音調信息的類似噪聲的信號較明 顯,且對於背景噪聲中的語音也較明顯。稀疏在激勵具有長期結構的情況下通常引起較 少假象,且事實上相位修改可引起濁音信號中的噪聲。因此,可能需要配置抗稀疏濾波 器600以對清音信號進行濾波並在不作出改變的情況下使至少一些濁音信號通過。清音 信號的特徵在於低音調增益(例如,量化窄頻帶自適應密碼本增益)和接近零或為正的 頻譜傾斜(例如,量化第一反射係數),從而指示整平或隨著頻率的不斷增加而向上傾斜 的頻譜包絡。抗稀疏濾波器600的典型實施方案經配置以對清音(例如,如頻譜傾斜的 值所指示)進行濾波,當音調增益低於閾值(或者,不大於閾值)時對濁音進行濾波, 且否則在不作出改變的情況下使信號通過。
抗稀疏濾波器600的另外的實施方案包含兩個或兩個以上濾波器,其經配置以具有 不同的最大相位修改角(例如,高達180度)。在此情況下,抗稀疏濾波器600可經配置 以根據音調增益(例如,量化自適應密碼本或LTP增益)的值在這些組成濾波器中進行 選擇,以便將較大的最大相位修改角用於具有較低音調增益值的幀。抗稀疏濾波器600 的實施方案還可包含不同的組成濾波器,其經配置以在頻譜的或多或少的部分上修改相 位,以便將經配置以在輸入信號的較寬頻率範圍上修改相位的濾波器用於具有較低音調
增益值的幀。
為了準確地複製經編碼語音信號,可能需要使合成寬頻帶語音信號S100的高頻帶與 窄頻帶部分的電平之間的比率類似於原始寬頻帶語音信號S10中的所述比率。除了高頻 帶編碼參數S60a表示的頻譜包絡外,高頻帶編碼器A200還可經配置以通過指定時間或 增益包絡來表徵高頻帶信號S30。如圖10所示,高頻帶編碼器A202包含高頻帶增益因 數計算器A230,其經配置和安排以根據高頻帶信號S30與合成高頻帶信號S130之間的 關係(例如,所述兩個信號在幀或其某一部分上的能量之間的差或比率)來計算一個或 一個以上增益因數。在高頻帶編碼器A202的其它實施方案中,高頻帶增益計算器A230 可同樣地配置但改為經安排以根據高頻帶信號S30與窄頻帶激勵信號S80或高頻帶激勵 信號S120之間的這種時間變化關係來計算增益包絡。
窄頻帶激勵信號S80和高頻帶信號S30的時間包絡很可能類似。因此,編碼基於高 頻帶信號S30與窄頻帶激勵信號S80 (或從中導出的信號,例如高頻帶激勵信號S120或 合成高頻帶信號S130)之間的關係的增益包絡通常將比編碼僅基於高頻帶信號S30的增 益包絡有效。在典型實施方案中,高頻帶編碼器A202經配置以輸出為每一幀指定5個增 益因數的8到12位的量化索引。
高頻帶增益因數計算器A230可經配置以作為一項包含一個或一個以上系列的子任 務的任務而執行增益因數計算。圖21展示根據高頻帶信號S30與合成高頻帶信號S130 的相對能量計算相應子幀的增益值的任務的實例T200的流程圖。任務220a和220b計算 各個信號的相應子幀的能量。舉例來說,任務220a和220b可經配置以將能量計算為各 個子幀的樣本的平方的和。任務T230將子幀的增益因數計算為那些能量的比率的平方 根。在此實例中,任務T230將增益因數計算為子幀上高頻帶信號S30的能量與合成高頻 帶信號S130的能量的比率的平方根。
高頻帶增益因數計算器A230可能需要經配置以根據窗口函數來計算子幀能量。圖 22展示增益因數計算任務T200的此實施方案T210的流程圖。任務T215a將窗口函數應 用於高頻帶信號S30,且任務T215b將相同窗口函數應用於合成高頻帶信號S130。任務 220a和220b的實施方案222a和222b計算各自窗口的能量,且任務T230將子幀的增益 因數計算為能量的比率的平方根。
可能需要應用與鄰近子幀重疊的窗口函數。舉例來說,可以重疊-相加方式應用的產 生增益因數的窗口函數可幫助減小或避免子幀之間的不連續性。在一個實例中,高頻帶 增益因數計算器A230經配置以應用如圖23a所示的梯形窗口函數,其中窗口與兩個鄰近
子幀的每一者重疊一毫秒。圖23b展示將此窗口函數應用於20毫秒幀的五個子幀的每一 者。高頻帶增益因數計算器A230的其它實施方案可經配置以應用具有不同重疊周期和/ 或不同窗口形狀(例如,矩形、漢明)(其可對稱或不對稱)的窗口函數。高頻帶增益因 數計算器A230的實施方案還可能經配置以將不同窗口函數應用於幀內的不同子幀和/或 包含具有不同長度的子幀的幀。
提供以下值(沒有限制)作為特定實施方案的實例。針對這些情況假定一個20毫秒 的幀,但可使用任何其它持續時間。對於以7 kHz取樣的高頻帶信號,每一幀具有140 個樣本。如果將此幀劃分為具有相等長度的五個子幀,那麼每一子幀將具有28個樣本, 且如圖23a所示的窗口將為42個樣本寬。對於以8kHz取樣的高頻帶信號,每一幀具有 160個樣本。如果此幀劃分為具有相等長度的五個子幀,那麼每一子幀將具有32個樣本, 且如圖23a所示的窗口將為48個樣本寬。在其它實施方案中,可使用具有任何寬度的子 幀,且甚至可能使高頻帶增益計算器A230的實施方案經配置以針對幀的每一樣本產生不 同的增益因數。
圖24展示高頻帶解碼器B200的實施方案B202的方塊圖。高頻帶解碼器B202包含 高頻帶激勵發生器B300,其經配置以基於窄頻帶激勵信號S80產生高頻帶激勵信號 S120。視特定系統設計選擇而定,可根據本文描述的高頻帶激勵發生器A300的實施方 案的任一者來實施高頻帶激勵發生器B300。通常,需要將高頻帶激勵發生器B300實施 為具有與特定編碼系統的高頻帶編碼器的高頻帶激勵發生器相同的響應。然而,因為窄 頻帶解碼器B110通常將執行經編碼窄頻帶激勵信號S50的解量化,所以在大多數情況下, 高頻帶激勵發生器B300可經實施以從窄頻帶解碼器B110接收窄頻帶激勵信號S80,而 不需要包含經配置以對經編碼窄頻帶激勵信號S50解量化的反轉量化器。窄頻帶解碼器 B110也可能經實施以包含抗稀疏濾波器600的實例,其經配置以在將經解量化的窄頻帶 激勵信號輸入到例如濾波器330的窄頻帶合成濾波器之前對所述信號進行濾波。
反轉量化器560經配置以對高頻帶濾波器參數S60a (在此實例中為一組LSF)解量 化,且LSF-LP濾波器係數變換570經配置以將LSF變換為一組濾波器係數(例如,如 上文參照窄頻帶編碼器A122的反轉量化器240和變換250所描述)。在其它實施方案中, 如上文所提及,可使用不同係數組(例如,倒譜係數)和/或係數表示形式(例如,ISP)。 高頻帶合成濾波器B200經配置以根據高頻帶激勵信號S120和所述組濾波器係數產生合 成高頻帶信號。對於其中高頻帶編碼器包含合成濾波器的系統(例如,如上述編碼器A202 的實例中),可能需要將高頻帶合成濾波器B200實施為具有與所述合成濾波器相同的響
應(例如,相同轉移函數)。
高頻帶解碼器B202還包含經配置以對高頻帶增益因數S60b解量化的反轉量化器 580,和經配置和安排以將經解量化的增益因數應用於合成高頻帶信號以產生高頻帶信號 S100的增益控制元件590 (例如,乘法器或放大器)。對於其中幀的增益包絡由一個以上 增益因數指定的情況,增益控制元件590可包含經配置以可能根據窗口函數將增益因數 應用於各個子幀的邏輯,所述窗口函數可與由相應高頻帶編碼器的增益計算器(例如, 高頻帶增益計算器A230)應用的窗口函數相同或不同。在高頻帶解碼器B202的其它實 施方案中,增益控制元件590經類似地配置但經安排以改為將經解量化的增益因數應用 於窄頻帶激勵信號S80或應用於高頻帶激勵信號S120。
如上文所提及,可能需要在高頻帶編碼器與高頻帶解碼器中獲得相同狀態(例如, 通過在編碼期間使用經解量化值)。因此,可能需要在根據此實施方案的編碼系統中確保 高頻帶激勵發生器A300和B300中的相應噪聲發生器具有相同狀態。舉例來說,此實施 方案的高頻帶激勵發生器A300和B300可經配置而使得噪聲發生器的狀態是相同幀內已 編碼的信息(例如,窄頻帶濾波器參數S40或其一部分,和/或經編碼窄頻帶激勵信號S50 或其一部分)的確定性函數。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430)可 經配置以執行分類向量量化。舉例來說,此量化器可經配置以基於窄頻帶信道中和/或高 頻帶信道中的相同幀內已編碼的信息從一組密碼本中選出一個密碼本。此技術通常以存 儲額外的密碼本為代價提供增加的編碼效率。
如上文參看例如圖8和9所論述,在從窄頻帶語音信號S20中去除粗略頻譜包絡之 後,相當大量的周期性結構可能保留在殘留信號中。舉例來說,殘留信號可隨時間而含 有粗略周期性脈衝或尖峰信號序列。此結構(通常與音調有關)尤其有可能發生在濁音 語音信號中。窄頻帶殘留信號的量化表示形式的計算可包含根據由(例如) 一個或一個 以上密碼本表示的長期周期性的模型來編碼此音調結構。
實際殘留信號的音調結構可能不與周期性模型完全匹配。舉例來說,殘留信號可能 包含音調脈衝的位置規則性的較小抖動,使得幀中連續音調脈衝之間的距離不完全相等 且所述結構並非相當規則。這些不規則性往往會降低編碼效率。
窄頻帶編碼器A120的一些實施方案經配置以通過在量化之前或期間將自適應時間 偏差應用於殘留,或通過以其它方式在經編碼激勵信號中包含自適應時間偏差,來執行 音調結構的規則化。舉例來說,此編碼器可經配置以選擇或以其它方式計算時間偏差的 程度(例如,根據一個或一個以上感知加權和/或誤差最小化標準),使得所得的激勵信 號與長期周期性的模型最佳擬和。音調結構的規則化由稱為鬆弛代碼激勵線性預測 (RCELP)編碼器的CELP編碼器子組執行。
RCELP編碼器通常經配置以執行時間偏差作為自適應時移。此時移可為負幾毫秒到 正幾毫秒範圍的延遲,且其通常平滑地變化以避免可聽到的不連續性。在一些實施方案 中,此編碼器經配置以用分段方式應用規則化,其中每一幀或子幀偏差相應的固定時移。 在其它實施方案中,編碼器經配置以應用規則化作為連續偏差函數,使得幀或子幀根據 音調輪廓(也稱為音調軌跡)而偏差。在一些情況下(例如,如第2004/0098255號美國 專利申請公開案中所描述),編碼器經配置以通過將偏移應用於用於計算經編碼激勵信號 的感知加權輸入信號而在經編碼激勵信號中包含時間偏差。
編碼器計算規則化和量化的經編碼激勵信號,且解碼器對經編碼激勵信號解量化以
獲得用於合成經解碼語音信號的激勵信號。經解碼輸出信號因此展現出與通過規則化而 包含在經編碼激勵信號中的延遲相同的變化的延遲。通常,不將任何指定規則化量的信 息傳輸到解碼器。
規則化往往使殘留信號較易編碼,這改進了來自長期預測器的編碼增益且因此推進 了總體編碼效率,而通常不會產生假象。可能需要僅對濁音幀執行規則化。舉例來說, 窄頻帶編碼器A124可經配置以僅偏移那些具有長期結構(例如,濁音信號)的幀或子幀。 甚至可能需要僅對包含音調脈衝能量的子幀執行規則化。第5,704,003號美國專利(Kleijn 等人)和第6,879,955號美國專利(Rao)和第2004/0098255號美國專利申請公開案(Kovesi 等人)中描述了 RCELP編碼的各種實施方案。RCELP編碼器的現有實施方案包含如電 信工業協會(TIA) IS-127中所描述的增強可變速率編解碼器(EVRC),和第三代合作 夥伴關係計劃2 (3GPP2)可選模式聲碼器(SMV)。
遺憾的是,規則化對於其中從經編碼窄頻帶激勵信號導出高頻帶激勵的寬頻帶語音 編碼器(例如,包含寬頻帶語音編碼器A100和寬頻帶語音解碼器B100的系統)可能導
致若干問題。由於高頻帶激勵信號是從時間偏差信號導出的,所以高頻帶激勵信號通常 將具有與原始高頻帶語音信號的時間特性不同的時間特性。換句話說,高頻帶激勵信號
將不再與原始高頻帶語音信號同步。
偏差高頻帶激勵信號與原始高頻帶語音信號之間的時間上的不對準可能引起若干問 題。舉例來說,偏差高頻帶激勵信號可能不再為根據從原始高頻帶語音信號提取的濾波 器參數配置的合成濾波器提供適宜的源激勵。因此,合成高頻帶信號可含有減小經解碼
寬頻帶語音信號感知質量的可聽假象。
時間上的不對準還可能引起增益包絡編碼的低效率。如上文所提及,窄頻帶激勵信 號S80與高頻帶信號S30的時間包絡之間很可能存在相關。通過根據這兩個時間包絡之 間的關係編碼高頻帶信號的增益包絡,與直接編碼增益包絡相比可實現編碼效率的提高。 然而,當經編碼窄頻帶激勵信號規則化時,此相關可能削弱。窄頻帶激勵信號S80與高 頻帶信號S30之間的時間上的不對準可導致高頻帶增益因數S60b中出現波動,且編碼效 率可能降低。
實施例包含根據相應經編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執 行時間偏差的寬頻帶語音編碼方法。此類方法的潛在優點包含改進經解碼寬頻帶語音信 號的質量和/或提高編碼高頻帶增益包絡的效率。
圖25展示寬頻帶語音編碼器A100的實施方案AD10的方塊圖。編碼器AD10包含 窄頻帶編碼器A120的實施方案A124,所述實施方案A124經配置以在計算經編碼窄頻 帶激勵信號S50期間執行規則化。舉例來說,窄頻帶編碼器A124可根據上文論述的 RCELP實施方案中的一者或一者以上配置。
窄頻帶編碼器A124還經配置以輸出指定所應用的時間偏差的程度的規則化數據信 號SD10。對於窄頻帶編碼器A124經配置以將固定時移應用於每一幀或子幀的各種情況, 規則化數據信號SD10可包含一系列值,其以樣本、毫秒或某一其它時間增量為單位將 每一時移量指示為整數或非整數值。對於窄頻帶編碼器A124經配置以用其它方式修改幀 或其它樣本序列的時間標度(例如,通過壓縮一個部分並擴展另一部分)的情況,規則 化信息信號SD10可包含對修改的相應描述,例如一組函數參數。在一個特定實例中, 窄頻帶編碼器A124經配置以將幀劃分為三個子幀並計算每一子幀的固定時移,使得規則 化數據信號SD10指示經編碼窄頻帶信號的每一規則化幀的三個時移量。
寬頻帶語音編碼器AD10包含延遲線D120,其經配置以根據由輸入信號指示的延遲 量來推進或阻滯高頻帶語音信號S30的若干部分,從而產生時間偏差高頻帶語音信號 S30a。在圖25所示的實例中,延遲線D120經配置以根據由規則化數據信號SD10指示 的偏差來對高頻帶語音信號S30執行時間偏差。以此方式,經編碼窄頻帶激勵信號S50 中包含的相同時間偏差量也在分析之前應用於高頻帶語音信號S30的相應部分。儘管此 實例將延遲線D120展示為高頻帶編碼器A200的單獨元件,但在其它實施方案中,延遲 線D120配置為高頻帶編碼器的一部分。
高頻帶編碼器A200的另外的實施方案可經配置以執行未偏差高頻帶語音信號S30
的頻譜分析(例如,LPC分析),並在計算高頻帶增益參數S60b之前執行高頻帶語音信 號S30的時間偏差。此編碼器可包含(例如)經配置以執行時間偏差的延遲線D120的 實施方案。然而,在此類情況下,基於對未偏差信號S30的分析的高頻帶濾波器參數S60a 可描述與高頻帶激勵信號S120在時間上不對準的頻譜包絡。
延遲線D120可根據適於將所需時間偏差操作應用於高頻帶語音信號S30的邏輯元 件與存儲元件的任何組合來配置。舉例來說,延遲線D120可經配置以根據所需的時移從 緩衝器中讀取高頻帶語音信號S30。圖26a展示延遲線D120的此實施方案D122的示意 圖,所述延遲線D120包含移位寄存器SR1。移位寄存器SR1是經配置以接收和存儲高 頻帶語音信號S30的m個最新近樣本的具有大約長度m的緩衝器。值m至少等於將支 持的最大正(或"推進")與負(或"阻滯")時移的總和。值m等於高頻帶信號S30的 幀或子幀的長度可能會較方便。
延遲線D122經配置以從移位寄存器SR1的偏移位置OL輸出時間偏差高頻帶信號 S30a。偏移位置OL的定位根據由例如規則化數據信號SDIO指示的當前時移而在參考位 置(零時移)附近變化。延遲線D122可經配置以支持相等的推進和阻滯限制,或者一個 限制大於另一限制,使得可在一個方向上比在另一方向上執行更大偏移。圖26a展示支 持的正時移大於負時移的特定實例。延遲線D122可經配置以一次輸出一個或一個以上樣 本(例如視輸出總線寬度而定)。
具有大於幾毫秒的量值的規則化時移可引起經解碼信號中的可聽到的假象。通常, 由窄頻帶編碼器A124執行的規則化時移的量值將不超過幾毫秒,使得由規則化數據信號 SD10指示的時移將有限。然而,在此類情況下可能需要延遲線D122經配置以對正和/ 或負方向上的時移強加最大限制(例如,以遵循比窄頻帶編碼器強加的限制更為嚴格的 限制)。
圖26b展示延遲線D122的實施方案D124的示意圖,延遲線D122包含移位窗口 SW。 在此實例中,偏移位置OL的定位受移位窗口 SW限制。儘管圖26b展示緩衝器長度m 大於移位窗口 SW的寬度的情況,但延遲線D124也可經實施使得移位窗口 SW的寬度等 於m。
在其它實施方案中,延遲線D120經配置以根據所需時移將高頻帶語音信號S30寫 入到緩衝器。圖27展示延遲線D120的實施方案D130的示意圖,所述實施方案D130 包含經配置以接收和存儲高頻帶語音信號S30的兩個移位寄存器SR2和SR3。延遲線 D130經配置以根據例如由規則化數據信號SD10指示的時移而將來自移位寄存器SR2的 幀或子幀寫入到移位寄存器SR3。移位寄存器SR3配置為FIFO緩衝器,其經配置以輸 出時間偏差高頻帶信號S30。
在圖27所示的特定實例中,移位寄存器SR2包含幀緩衝器部分FBI和延遲緩衝器 部分DB,且移位寄存器SR3包含幀緩衝器部分FB2、推進緩衝器部分AB和阻滯緩衝器 部分RB。推進緩衝器AB和阻滯緩衝器RB的長度可相等,或者其中一者可大於另一者, 使得所支持的一個方向上的偏移大於所支持的另一方向上的偏移。延遲緩衝器DB和阻 滯緩衝器部分RB可經配置以具有相同長度。或者,延遲緩衝器DB可比阻滯緩衝器RB 短以考慮到將樣本從幀緩衝器FBI轉移到移位寄存器SR3所需的時間間隔,所述轉移可 包含例如在存儲到移位寄存器SR3之前先使樣本偏差的其它處理操作。
在圖27的實例中,幀緩衝器FBI經配置以具有與高頻帶信號S30的一個幀的長度 相等的長度。在另一實例中,幀緩衝器FB1經配置以具有與高頻帶信號S30的一個子幀 的長度相等的長度。在此情況下,延遲線D130可經配置以包含用於將相同(例如,平均) 延遲應用於待偏移的幀的所有子幀的邏輯。延遲線D130還可包含用於將來自幀緩衝器 FBI的值與阻滯緩衝器RB或推進緩衝器AB中待重寫的值進行平均的邏輯。在另一實例 中,移位寄存器SR3可經配置以僅經由幀緩衝器FB1接收高頻帶信號S30的值,且在此 情況下,延遲線D130可包含用於在寫入到移位寄存器SR3的連續幀或子幀之間的間隙 上進行內插的邏輯。在其它實施方案中,延遲線D130可經配置以在將來自幀緩衝器FB1 的樣本寫入到移位寄存器SR3之前對所述樣本執行偏差操作(例如,根據由規則化數據 信號SD10描述的函數)。
延遲線D120可能需要應用基於但不等同於由規則化數據信號SD10指定的偏差的時 間偏差。圖28展示寬頻帶語音編碼器AD10的實施方案AD12的方塊圖,寬頻帶語音編 碼器AD10包含延遲值映射器DllO。延遲值映射器D110經配置以將由規則化數據信號 SD10指示的偏差映射為經映射延遲值SD10a。延遲線D120經配置以根據由經映射延遲 值SD10a指示的偏差來產生時間偏差高頻帶語音信號S30a。
可預期窄頻帶編碼器應用的時移隨時間平滑地進展。因此,通常計算語音幀期間應 用於子幀的平均窄頻帶時移並根據此平均值來偏移高頻帶語音信號S30的相應幀已足 夠。在一個此類實例中,延遲值映射器D110經配置以計算每一幀的子幀延遲值的平均值, 且延遲線D120經配置以將計算出的平均值應用於高頻帶信號S30的相應幀。在其它實 例中,可計算和應用較短周期(例如,兩個子幀,或半個幀)或較長周期(例如,兩個 幀)內的平均值。在平均值是樣本的非整數值的情況下,延遲值映射器D110可經配置以
在將所述值輸出到延遲線D120之前將所述值四捨五入為樣本的整數數目。
窄頻帶編碼器A124可經配置以在經編碼窄頻帶激勵信號中包含非整數數目的樣本 的規則化時移。在此情況下,延遲值映射器D110可能需要經配置以將窄頻帶時移四舍五 入為樣本的整數數目,且延遲線D120可能需要將經四捨五入的時移應用於高頻帶語音信 號S30。
在寬頻帶語音編碼器AD10的一些實施方案中,窄頻帶語音信號S20與高頻帶語音 信號S30的取樣速率可能不同。在此類情況下,延遲值映射器D110可經配置以調節規則 化數據信號SD10中指示的時移量,以考慮窄頻帶語音信號S20(或窄頻帶激勵信號S80) 與高頻帶語音信號S30的取樣速率之間的差異。舉例來說,延遲值映射器D110可經配置 以根據取樣速率的比率縮放時移量。在上文提及的一個特定實例中,以8kHz對窄頻帶 語音信號S20進行取樣,且以7 kHz對高頻帶語音信號S30進行取樣。在此情況下,延 遲值映射器D110經配置以將每一偏移量乘以7/8。延遲值映射器D110的實施方案還可 經配置以執行此縮放運算以及本文描述的整數四捨五入和/或時移平均運算。
在另外的實施方案中,延遲線D120經配置以用其它方式修改幀或其它樣本序列的時 間標度(例如,通過壓縮一個部分並擴展另一部分)。舉例來說,窄頻帶編碼器A124可 經配置以根據例如音調輪廓或軌跡的函數來執行規則化。在此情況下,規則化數據信號 SD10可包含對所述函數的相應描述(例如一組參數),且延遲線D120可包含經配置以根 據所述函數對高頻帶語音信號S30的幀或子幀執行偏差的邏輯。在其它實施方案中,延 遲值映射器D110經配置以在將所述函數通過延遲線D120應用於高頻帶語音信號S30之 前對所述函數進行平均、縮放和/或四捨五入。舉例來說,延遲值映射器D110可經配置 以根據所述函數計算一個或一個以上延遲值,每一延遲值指示樣本數目,其接著由延遲 線D120應用以對高頻帶語音信號S30的一個或一個以上相應幀或子幀執行時間偏差。
圖29展示根據相應經編碼窄頻帶激勵信號中包含的時間偏差對高頻帶語音信號執 行時間偏差的方法MD100的流程圖。任務TD100處理寬頻帶語音信號以獲得窄頻帶語 音信號和高頻帶語音信號。舉例來說,任務TD100可經配置以使用具有低通濾波器和高 通濾波器的濾波器組(例如濾波器組A110的實施方案)對寬頻帶語音信號進行濾波。任 務TD200將窄頻帶語音信號至少編碼為經編碼的窄頻帶激勵信號和多個窄頻帶濾波器參 數。所述經編碼的窄頻帶激勵信號和/或濾波器參數可量化,且經編碼的窄頻帶激勵信號 還可包含例如語音模式參數的其它參數。任務TD200還包含經編碼的窄頻帶激勵信號中 的時間偏差。
任務TD300基於窄頻帶激勵信號產生高頻帶激勵信號。在此情況下,窄頻帶激勵信 號基於經編碼的窄頻帶激勵信號。任務TD400根據至少所述高頻帶激勵信號,將高頻帶 語音信號至少編碼為多個高頻帶濾波器參數。舉例來說,任務TD400可經配置以將高頻 帶語音信號編碼為多個量化LSF。任務TD500將時移應用於高頻帶語音信號,所述時移 基於與經編碼窄頻帶激勵信號中包含的時間偏差有關的信息。
任務TD400可經配置以對高頻帶語音信號執行頻譜分析(例如,LPC分析),且/或 計算高頻帶語音信號的增益包絡。在此類情況下,任務TD500可經配置以在所述分析和 /或增益包絡計算之前將時移應用於高頻帶語音信號。
寬頻帶語音編碼器A100的其它實施方案經配置以將由經編碼窄頻帶激勵信號中包 含的時間偏差引起的高頻帶激勵信號S120的時間偏差反轉。舉例來說,高頻帶激勵發生 器A300可經實施以包含延遲線D120的實施方案,延遲線D120的所述實施方案經配置 以接收規則化數據信號SD10或經映射延遲值SD10a,並將相應的反轉時移應用於窄頻帶 激勵信號S80,且/或應用於基於所述窄頻帶激勵信號S80的隨後信號(例如,諧波延伸 信號S160或高頻帶激勵信號S120)。
另外的寬頻帶語音編碼器實施方案可經配置以彼此獨立地對窄頻帶語音信號S20和 高頻帶語音信號S30進行編碼,使得高頻帶語音信號S30被編碼為高頻帶頻譜包絡和高 頻帶激勵信號的表示形式。此實施方案可經配置以根據與經編碼窄頻帶激勵信號中包含 的時間偏差有關的信息對高頻帶殘留信號執行時間偏差,或用其它方式將時間偏差包含 在經編碼高頻帶激勵信號中。舉例來說,高頻帶編碼器可包含本文描述的經配置以將時 間偏差應用於高頻帶殘留信號的延遲線D120和/或延遲值映射器D110的實施方案。此操 作的潛在優點包含對高頻帶殘留信號的較有效編碼,和合成窄頻帶與高頻帶語音信號之 間的較好匹配。
如上文所提及,本文描述的實施例包含可用於執行嵌入式編碼的實施方案、支持與 窄頻帶系統的兼容性並避免需要代碼轉換。對高頻帶編碼的支持還可用於按照成本來區 分具有寬頻帶支持與向後兼容性的晶片、晶片組、裝置和/或網絡與僅具有窄頻帶支持的 晶片、晶片組、裝置和/或網絡。如本文所描述的對高頻帶編碼的支持也可與用於支持低 頻帶編碼的技術結合使用,且根據此實施例的系統、方法或設備可支持對例如約50或 100 Hz—直到約7或8 kHz的頻率分量的編碼。
如上文所提及,向語音編碼器添加高頻帶支持可改進清晰度,尤其是關於摩擦音的 區分的清晰度。儘管這種區分通常可能由人類收聽者根據特定上下文推導出來,但高頻
帶支持可充當語音識別和其它機器解譯應用(例如用於自動化語音菜單導航和/或自動呼 叫處理的系統)中的啟用特徵。
根據一實施例的設備可嵌入到可攜式無線通信裝置(例如,蜂窩式電話或個人數字 助理(PDA))中。或者,此設備可包含在另一通信裝置中,例如VoIP手機、經配置以 支持VoIP通信的個人計算機或經配置以路由電話或VoIP通信的網絡裝置。舉例來說, .根據一實施例的設備可實施在通信裝置的晶片或晶片組中。視特定應用而定,此裝置還 可包含例如以下特徵對語音信號的模擬-數字和/或數字-模擬轉換、用於對語音信號執 行放大和/或其它信號處理操作的電路,和/或用於發射和/或接收經編碼語音信號的射頻 電路。
明確預期且揭示實施例可包含第60/667,901號和第60/673,965號美國臨時專利申請 案中揭示的其它特徵中的任一者或一者以上且/或與其一起使用,本申請案中主張所述臨 時專利申請案的權益。此類特徵包含去除發生於高頻帶中且在窄頻帶中大體上不存在的 具有短持續時間的高能量突發。此類特徵包含例如高頻帶LSF的係數表示形式的固定或 自適應平滑。此類特徵包含與例如LSF的係數表示形式的量化相關聯的噪聲的固定或自 適應成形。此類特徵還包含增益包絡的固定或自適應平滑,以及增益包絡的自適應衰減。
提供對所描述實施例的以上介紹以便使所屬領域的技術人員能夠製造或使用本發 明。可能對這些實施例作出各種修改,且本文提供的一般原理也可應用於其它實施例。 舉例來說,實施例可部分或整體地實施為硬連線電路,實施為製造到專用集成電路中的 電路配置,或者實施為作為機器可讀代碼加載到非易失性存儲裝置中的固件程序、或從 數據存儲媒體加載或加載到數據存儲媒體中的軟體程序,所述代碼為可由例如微處理器 或其它數位訊號處理單元的邏輯元件陣列執行的指令。數據存儲媒體可為存儲元件陣列, 例如半導體存儲器(其可包含(不限於)動態或靜態RAM (隨機存取存儲器)、ROM (只 讀存儲器)和/或快閃RAM),或鐵電、磁阻、雙向開關半導體、聚合物或相變存儲器; 或者例如磁碟或光碟的圓盤式媒體。術語"軟體"應理解為包含原始碼、彙編語言代碼、 機器代碼、二進位代碼、固件、宏代碼、微碼、可由邏輯元件陣列執行的任何一個或一 個以上指令組或序列,以及此類實例的任何組合。
高頻帶激勵發生器A300和B300、高頻帶編碼器A100、高頻帶解碼器B200、寬頻 帶語音編碼器A100和寬頻帶語音解碼器B100的實施方案的各種元件可實施為(例如) 駐存在晶片組中的同一晶片上或兩個或兩個以上晶片之間的電子和/或光學裝置,但也預 期存在沒有此限制的其它配置。此設備的一個或一個以上元件可整體或部分地實施為一
個或一個以上指令組,所述指令組經配置以在一個或一個以上固定或可編程邏輯元件(例 如,電晶體、門)陣列上執行,所述元件例如為微處理器、內嵌式處理器、IP核心、數 字信號處理器、FPGA (場可編程門陣列)、ASSP (專用標準產品)和ASIC (專用集成 電路)。 一個或一個以上此類元件也可能具有共同結構(例如,用於在不同時間執行對應 於不同元件的代碼部分的處理器、經執行以在不同時間執行對應於不同元件的任務的指 令組,或者在不同時間針對不同元件執行操作的電子和/或光學裝置的配置)。此外,一 個或一個以上此類元件可能用於執行與設備的操作並不直接相關的任務或其它指令組, 例如與內嵌有所述設備的裝置或系統的另一操作相關的任務。
圖30展示根據一實施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶 部分進行編碼的方法M100的流程圖。任務X100計算表徵高頻帶部分的頻譜包絡的一組 濾波器參數。任務X200通過將非線性函數應用於從窄頻帶部分導出的信號來計算頻譜延 伸信號。任務X300根據(A)所述組濾波器參數和(B)基於所述頻譜延伸信號的高頻 帶激勵信號來產生合成高頻帶信號。任務X400基於(C)高頻帶部分的能量與(D)從 窄頻帶部分導出的信號的能量之間的關係來計算增益包絡。
圖31a展示根據一實施例產生高頻帶激勵信號的方法M2O0的流程圖。任務Y1O0通 過將非線性函數應用於從語音信號的窄頻帶部分導出的窄頻帶激勵信號來計算經諧波延 伸信號。任務Y200將經諧波延伸信號與經調製噪聲信號混合以產生高頻帶激勵信號。圖 31b展示根據包含任務Y300和Y400的另一實施例產生高頻帶激勵信號的方法M210的 流程圖。任務Y300根據窄頻帶激勵信號和經諧波延伸信號中的一者的隨時間的能量來計 算時域包絡。任務Y400根據時域包絡調製噪聲信號以產生經調製噪聲信號。
圖32展示根據一實施例對具有窄頻帶部分和高頻帶部分的語音信號的所述高頻帶 部分進行解碼的方法M300的流程圖。任務Z100接收表徵所述高頻帶部分的頻譜包絡的 一組濾波器參數和表徵所述高頻帶部分的時間包絡的一組增益因數。任務Z200通過將非 線性函數應用於從窄頻帶部分導出的信號來計算頻譜延伸信號。任務Z300根據(A)所 述組濾波器參數和(B)基於所述頻譜延伸信號的高頻帶激勵信號來產生合成高頻帶信號。 任務Z400基於所述組增益因數來調製所述合成高頻帶信號的增益包絡。舉例來說,任務 Z400可經配置以通過將所述組增益因數應用於從窄頻帶部分導出的激勵信號、應用於頻 譜延伸信號、應用於高頻帶激勵信號,或應用於合成高頻帶信號,來調製所述合成高頻 帶信號的增益包絡。
實施例還包含如本文中(例如)通過對經配置以執行額外語音解碼、編碼和解碼方
法的結構實施例的描述而明確揭示的所述額外語音解碼、編碼和解碼方法。這些方法的 每一者也可確實地實施(例如,在如上文列舉的一個或一個以上數據存儲媒體中)為可 由包含邏輯元件(例如,處理器、微處理器、微控制器或其它有限狀態機)陣列的機器 讀取和/或執行的一個或一個以上指令組。因此,本發明不希望限於上文展示的實施例, 而是應符合與本文中(包含所提交的形成原始揭示案的一部分的所附權利要求書中)以 任何方式揭示的原理和新穎特徵一致的最廣泛範圍。
權利要求
1.一種信號處理方法,所述方法包括根據至少一低頻帶激勵信號和多個低頻帶濾波器參數來合成低頻帶語音信號;基於所述低頻帶激勵信號產生高頻帶激勵信號;根據至少所述高頻帶激勵信號和多個高頻帶濾波器參數來合成高頻帶語音信號;以及將所述低頻帶語音信號與所述高頻帶語音信號組合以獲得寬頻帶語音信號,其中所述產生高頻帶激勵信號包含將非線性函數應用於基於所述低頻帶激勵信號的信號以產生頻譜延伸信號,其中所述高頻帶激勵信號基於所述頻譜延伸信號。
2. 根據權利要求l所述的信號處理方法,其中所述合成低頻帶語音信號包含根據至少 所述低頻帶激勵信號和多個線性預測濾波器係數來合成所述低頻帶語音信號。
3. 根據權利要求1所述的信號處理方法,其中所述合成高頻帶語音信號包含根據至少 所述高頻帶激勵信號和多個線性預測濾波器係數來合成所述高頻帶語音信號。
4. 根據權利要求1所述的信號處理方法,其中所述非線性函數是無記憶非線性函數。
5. 根據權利要求l所述的信號處理方法,其中所述非線性函數是絕對值函數。
6. 根據權利要求1所述的信號處理方法,其中所述產生高頻帶激勵信號包含將基於所 述頻譜延伸信號的信號與經調製噪聲信號混合,其中所述高頻帶激勵信號基於所述 混合信號。
7. 根據權利要求6所述的信號處理方法,其中所述經調製噪聲信號基於根據一信號的 時域包絡來調製噪聲信號的結果,所述信號基於所述低頻帶語音信號、所述低頻帶 激勵信號和所述頻譜延伸信號中的至少一者。
8. 根據權利要求1所述的信號處理方法,所述方法包括在所述組合之前並根據多個增 益因數來修改所述高頻帶語音信號隨時間的幅值。
9. 根據權利要求8所述的信號處理方法,其中所述修改所述高頻帶語音信號的幅值包 括根據所述多個增益因數來修改所述低頻帶激勵信號、所述頻譜延伸信號、所述高 頻帶激勵信號和所述高頻帶語音信號中的至少一者隨時間的幅值。
10. —種具有機器可執行指令的數據存儲媒體,所述機器可執行指令描述根據權利要求l所述的信號處理方法。
11. 一種設備,其包括窄頻帶解碼器,其經配置以根據至少一低頻帶激勵信號和多個低頻帶濾波器參數 來合成低頻帶語音信號;高頻帶解碼器,其經配置以基於所述低頻帶激勵信號產生高頻帶激勵信號,並根 據至少所述高頻帶激勵信號和多個高頻帶濾波器參數來合成高頻帶語音信號;以及濾波器組,其經配置以將所述低頻帶語音信號與所述高頻帶語音信號組合以獲得 寬頻帶語音信號,其中所述高頻帶解碼器經配置以將非線性函數應用於基於所述低頻帶激勵信號 的信號以產生頻譜延伸信號,且其中所述高頻帶解碼器經配置以基於所述頻譜延伸信號產生所述高頻帶激勵信 號。
12. 根據權利要求ll所述的設備,其中所述窄頻帶解碼器經配置以根據至少所述低頻帶 激勵信號和多個線性預測濾波器係數來合成所述低頻帶語音信號。
13. 根據權利要求11所述的設備,其中所述高頻帶解碼器經配置以根據至少所述高頻帶 激勵信號和多個線性預測濾波器係數來合成所述高頻帶語音信號。
14. 根據權利要求11所述的設備,其中所述高頻帶解碼器經配置以將無記憶非線性函數 應用於基於所述窄頻帶激勵信號的信號以產生所述頻譜延伸信號。
15. 根據權利要求11所述的設備,其中所述高頻帶解碼器經配置以將絕對值函數應用於 基於所述低頻帶激勵信號的信號以產生所述頻譜延伸信號。
16. 根據權利要求11所述的設備,其中所述高頻帶解碼器經配置以將基於所述頻譜延伸 信號的信號與經調製噪聲信號混合,且其中所述高頻帶解碼器經配置以基於所述混合信號來產生所述高頻帶激勵信號。
17. 根據權利要求16所述的設備,其中所述高頻帶解碼器經配置以根據一信號的時域 包絡來執行對噪聲信號的調製,所述信號基於所述低頻帶語音信號、所述低頻帶激 勵信號和所述頻譜延伸信號中的至少一者,且其中所述經調製噪聲信號基於所述調製的結果。
18. 根據權利要求11所述的設備,其中所述高頻帶解碼器經配置以根據多個增益因數來 修改所述高頻帶語音信號隨時間的幅值。
19. 根據權利要求18所述的設備,其中所述高頻帶解碼器經配置以通過根據多個增益 因數來修改所述低頻帶激勵信號、所述頻譜延伸信號、所述髙頻帶激勵信號和所述 高頻帶語音信號中的至少一者隨時間的幅值,而根據所述多個增益因數修改所述高頻帶語音信號的幅值。
20. 根據權利要求11所述的設備,所述設備包括蜂窩式電話。
21. 根據權利要求11所述的設備,所述設備包括經配置以接收與網際網路協議的版本一致 的多個包的裝置,其中所述多個包描述所述低頻帶激勵信號、所述多個低頻帶濾波 器參數和所述多個高頻帶濾波器參數。
22. —種信號處理方法,所述方法包括處理寬頻帶語音信號以獲得低頻帶語音信號和高頻帶語音信號; 將所述低頻帶語音信號編碼為至少一經編碼低頻帶激勵信號和多個低頻帶濾波 器參數;基於所述經編碼低頻帶激勵信號產生高頻帶激勵信號;根據所述高頻帶激勵信號將所述高頻帶語音信號編碼為至少多個高頻帶濾波器 參數;且其中所述產生高頻帶激勵信號包含將非線性函數應用於基於所述經編碼低頻帶 激勵信號的信號以產生頻譜延伸信號,其中所述高頻帶激勵信號基於所述頻譜延伸 信號。
23. 根據權利要求22所述的信號處理方法,其中所述將所述低頻帶語音信號編碼為至 少一經編碼低頻帶激勵信號和多個低頻帶濾波器參數包含將所述低頻帶語音信號 編碼為至少一經編碼低頻帶激勵信號和多個線性預測濾波器係數。
24. 根據權利要求22所述的信號處理方法,其中所述將所述高頻帶語音信號編碼為至 少多個高頻帶濾波器參數包含將所述高頻帶語音信號編碼為至少多個線性預測濾 波器係數。
25. 根據權利要求22所述的信號處理方法,其中所述非線性函數是無記憶非線性函數。
26. 根據權利要求22所述的信號處理方法,其中所述非線性函數是絕對值函數。
27. 根據權利要求22所述的信號處理方法,其中所述基於所述頻譜延伸信號產生所述 高頻帶激勵信號包含將基於所述頻譜延伸信號的信號與經調製噪聲信號混合,其中 所述高頻帶激勵信號基於所述混合信號。
28. 根據權利要求27所述的信號處理方法,其中所述經調製噪聲信號基於根據一信號 的時域包絡來調製噪聲信號的結果,所述信號基於所述低頻帶語音信號、所述低頻 帶激勵信號和所述頻譜延伸信號中的至少一者。
29. 根據權利要求22所述的信號處理方法,所述方法包括根據所述高頻帶信號與基於所述低頻帶激勵信號的信號之間的時間變化關係來計算增益包絡。
30. 根據權利要求29所述的信號處理方法,其中所述計算增益包絡包括基於所述高頻帶激勵信號和所述多個高頻帶濾波器參數產生合成高頻帶信號;以及根據所述高頻帶信號與所述合成高頻帶信號之間的時間變化關係來計算增益包 絡。
31. —種具有機器可執行指令的數據存儲媒體,所述機器可執行指令描述根據權利要22 所述的信號處理方法。
32. —種設備,其包括-濾波器組,其經配置以對寬頻帶語音信號進行濾波以獲得低頻帶語音信號和高頻 帶語音信號;低頻帶編碼器,其經配置以將所述低頻帶語音信號編碼為至少一經編碼低頻帶激 勵信號和多個低頻帶濾波器參數;以及高頻帶編碼器,其經配置以基於所述經編碼低頻帶激勵信號產生高頻帶激勵信 號,並根據所述高頻帶激勵信號將所述高頻帶語音信號編碼為至少多個高頻帶濾波 器參數,其中所述高頻帶編碼器經配置以將非線性函數應用於基於所述經編碼低頻帶激 勵信號的信號以產生頻譜延伸信號,且其中所述高頻帶解碼器經配置以基於所述頻譜延伸信號產生所述高頻帶激勵信 號。
33. 根據權利要求32所述的設備,其中所述窄頻帶編碼器經配置以將所述低頻帶語音 信號編碼為至少一經編碼低頻帶激勵信號和多個線性預測濾波器係數。
34. 根據權利要求32所述的設備,其中所述高頻帶編碼器經配置以將所述高頻帶語音 信號編碼為至少多個線性預測濾波器係數。
35. 根據權利要求32所述的設備,其中所述高頻帶編碼器經配置以將無記憶非線性函 數應用於基於所述經編碼低頻帶激勵信號的信號以產生所述頻譜延伸信號。
36. 根據權利要求32所述的設備,其中所述高頻帶編碼器經配置以將絕對值函數應用 於基於所述經編碼低頻帶激勵信號的信號以產生所述頻譜延伸信號。
37. 根據權利要求32所述的設備,其中所述高頻帶編碼器經配置以將基於所述頻譜延 伸信號的信號與經調製噪聲信號混合,且其中所述高頻帶編碼器經配置以基於所述混合信號來產生所述高頻帶激勵信號。
38. 根據權利要求37所述的設備,其中所述高頻帶編碼器經配置以根據一信號的時域 包絡來調製噪聲信號,所述信號基於所述低頻帶語音信號、所述經編碼低頻帶激勵 信號和所述頻譜延伸信號中的至少一者。
39. 根據權利要求32所述的設備,其中所述高頻帶編碼器經配置以根據所述高頻帶信 號與基於所述經編碼低頻帶激勵信號的信號之間的時間變化關係來計算增益包絡。
40. 根據權利要求39所述的設備,其中所述高頻帶編碼器經配置以基於所述高頻帶激 勵信號和所述多個高頻帶濾波器參數產生合成高頻帶信號,並根據所述高頻帶信號 與所述合成高頻帶信號之間的時間變化關係來計算所述增益包絡。
41. 根據權利要求32所述的設備,所述設備包括蜂窩式電話。
42. 根據權利要求32所述的設備,所述設備包括經配置以發射與網際網路協議的版本一 致的多個包的裝置,其中所述多個包描述所述經編碼低頻帶激勵信號、所述多個低 頻帶濾波器參數和所述多個高頻帶濾波器參數。
全文摘要
根據一個實施例的一種寬頻帶語音編碼器包含窄頻帶編碼器和高頻帶編碼器。所述窄頻帶編碼器經配置以將寬頻帶語音信號的窄頻帶部分編碼為一組濾波器參數和相應的經編碼激勵信號。所述高頻帶編碼器經配置以根據高頻帶激勵信號將所述寬頻帶語音信號的高頻帶部分編碼為一組濾波器參數。所述高頻帶編碼器經配置以通過將非線性函數應用於基於所述經編碼窄頻帶激勵信號的信號以產生頻譜延伸信號來產生所述高頻帶激勵信號。
文檔編號G10L21/02GK101180677SQ200680018149
公開日2008年5月14日 申請日期2006年4月3日 優先權日2005年4月1日
發明者科恩·貝爾納德·福斯, 阿南塔帕德馬納卜漢·A·坎達達伊 申請人:高通股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀