用於在與語音信號相關聯的包中包含識別符的系統及方法
2023-06-11 04:18:16 2
用於在與語音信號相關聯的包中包含識別符的系統及方法
【專利摘要】本發明描述一種用於在與語音信號相關聯的包中包含識別符的系統及方法。接收信號。將所述信號分割為多個幀。將所述信號的一幀編碼到包中。確定將所述包編碼為寬帶包還是窄帶包。基於所述確定在所述包中封裝識別符。傳輸所述包。從N位參數提供至少兩個非法值,其中將來自所述N位參數的至少一個位用於載送信息。來自所述N位參數的用於載送信息的位的數目等於log2(X),其中X為從所述N位參數提供的非法值的數目。
【專利說明】用於在與語音信號相關聯的包中包含識別符的系統及方法
[0001] 分案申請
[0002] 本發明專利申請是申請日為2007年7月31日,申請號為200780027855. 1,以及發 明名稱為"用於在與語音信號相關聯的包中包含識別符的系統及方法"的發明專利申請案 的分案申請。
[0003] 根據35U. S. C. § 119豐張優先權
[0004] 本專利申請案主張2006年7月31日申請的標題為"特殊半速率識別符包產生和 解碼"的臨時申請案第60/834, 617號的優先權,且轉讓給本受讓人,且在此以引用的方式明 確併入本文中。
【技術領域】
[0005] 本系統及方法大體上涉及語音處理技術。更明確地說,本系統及方法涉及在與語 音信號相關聯的包中包含識別符。
【背景技術】
[0006] 通過數位技術的聲音傳輸變得普遍,尤其是在長距離及數字無線電電話應用中變 得普遍。此又產生了對確定在維持重構語音的被感知質量的同時可經由信道發送的信息的 最小量的興趣。用於壓縮語音的裝置可用於電信的許多領域中。電信的實例為無線通信。 無線通信的領域具有許多應用,其包括(例如)無繩電話、尋呼機、無線局域環路、例如蜂窩 式及可攜式通信系統(PCS)電話系統的無線電話、移動網際網路協議(IP)電話及衛星通信系 統。尤其重要的應用為用於移動訂戶的無線電話。
【發明內容】
[0007] 本發明描述一種用於在與語音信號相關聯的包中包含識別符的方法。接收信號。 將所述信號分割為多個幀。將所述信號的幀編碼到包中。確定將所述包編碼為寬帶包還是 窄帶包。基於所述確定,在包中封裝識別符。傳輸所述包。從N位參數提供至少兩個非法 值,其中來自所述N位參數的至少一個位用於載送信息。用於載送信息的來自所述N位參 數的位的數目等於l〇g 2 (X),其中X為從所述N位參數提供的非法值的數目。
[0008] 還描述一種用於在與語音信號相關聯的包中包含識別符的設備。所述設備包括處 理器及與所述處理器進行電子通信的存儲器。指令存儲於所述存儲器中。所述指令可執行 以:接收信號;將所述信號分割為多個幀;將所述信號的幀編碼到包中;確定將所述包編碼 為寬帶包還是窄帶包;基於所述確定,在所述包中封裝識別符;及傳輸所述包。
[0009] 還描述一種經配置以在與語音信號相關聯的包中包含識別符的系統。所述系統包 括用於處理的裝置及用於接收信號的裝置。描述用於將所述信號分割為多個幀的裝置,及 用於將所述信號的幀編碼到包中的裝置。描述用於確定將所述包編碼為寬帶包還是窄帶包 的裝置。描述用於基於所述確定而在所述包中封裝識別符的裝置,及用於傳輸所述包的裝 置。
[0010] 還描述一種計算機可讀媒體。所述媒體經配置以存儲一組指令,所述指令可執行 以:接收信號;將所述信號分割為多個幀;將所述信號的幀編碼到包中;確定將所述包編碼 為寬帶包還是窄帶包;基於所述確定,在所述包中封裝識別符;及傳輸所述包。
[0011] 還描述一種用於解碼包的方法。接收包。分析在所述包中所包括的識別符。確定 所述包是由寬帶編碼器還是由窄帶編碼器編碼。基於所述確定,選擇用於所述包的解碼模 式。
[0012] 還描述一種用於解碼包的設備。所述設備包括處理器及與所述處理器進行電子通 信的存儲器。指令存儲於所述存儲器中。所述指令可執行以:接收包;分析在所述包中所包 括的識別符;確定所述包是由寬帶編碼器還是由窄帶編碼器編碼;及基於所述確定,選擇 用於所述包的解碼模式。
[0013] 還描述一種經配置以解碼包的系統。所述系統包括用於處理的裝置及用於接收包 的裝置。描述用於分析包括於所述包中的識別符的裝置,及用於確定所述包是由寬帶編碼 器還是由窄帶編碼器編碼的裝置。描述用於基於所述確定而選擇用於所述包的解碼模式的 裝直。
[0014] 還描述一種計算機可讀媒體。所述媒體經配置以存儲一組指令,所述指令可執行 以:接收包;分析在所述包中所包括的識別符;確定所述包是由寬帶編碼器還是由窄帶編 碼器編碼;及基於所述確定,選擇用於所述包的解碼模式。
【專利附圖】
【附圖說明】
[0015] 圖la展示根據一配置的寬帶語音編碼器Α100的框圖;
[0016] 圖lb展示寬帶語音編碼器A100的一實施方案A102的框圖;
[0017] 圖2a展示根據一配置的寬帶語音解碼器B100的框圖;
[0018] 圖2b展示寬帶語音解碼器B100的一實施方案B102的框圖;
[0019] 圖3a展示濾波器組A110的一實施方案A112的框圖;
[0020] 圖3b展示濾波器組B120的一實施方案B122的框圖;
[0021] 圖4a展示濾波器組A110的一實例的低帶及高帶的帶寬覆蓋;
[0022] 圖4b展示濾波器組A110的另一實例的低帶及高帶的帶寬覆蓋;
[0023] 圖4c展示濾波器組A112的一實施方案A114的框圖;
[0024] 圖4d展示濾波器組B122的一實施方案B124的框圖;
[0025] 圖5a展示語音信號的頻率與對數振幅的曲線的一實例;
[0026] 圖5b展示基本線性預測編碼系統的框圖;
[0027] 圖6展示窄帶編碼器A120的一實施方案A122的框圖;
[0028] 圖7展示窄帶解碼器B110的一實施方案B112的框圖;
[0029] 圖8a展示有聲語音的殘餘信號的頻率與對數振幅的曲線的一實例;
[0030] 圖8b展示有聲語音的殘餘信號的時間與對數振幅的曲線的一實例;
[0031] 圖9展示還執行長期預測的基本線性預測編碼系統的框圖;
[0032] 圖10展示高帶編碼器A200的一實施方案A202的框圖;
[0033] 圖11展示高帶激勵產生器A300的一實施方案A302的框圖;
[0034] 圖12展示頻譜擴展器A400的一實施方案A402的框圖;
[0035] 圖12a展示在頻譜擴展操作的一實例中多個點處的信號頻譜的曲線;
[0036] 圖12b展示在頻譜擴展操作的另一實例中多個點處的信號頻譜的曲線;
[0037] 圖13展示高帶激勵產生器A302的一實施方案A304的框圖;
[0038] 圖14展示高帶激勵產生器A302的一實施方案A306的框圖;
[0039] 圖15展示用於包絡計算任務T100的流程圖;
[0040] 圖16展示組合器490的一實施方案492的框圖;
[0041] 圖17說明計算高帶信號S30的周期性的量度的方法;
[0042] 圖18展示高帶激勵產生器A302的一實施方案A312的框圖;
[0043] 圖19展示高帶激勵產生器A302的一實施方案A314的框圖;
[0044] 圖20展示高帶激勵產生器A302的一實施方案A316的框圖;
[0045] 圖21展示用於增益計算任務T200的流程圖;
[0046] 圖22展示用於增益計算任務T200的一實施方案T210的流程圖;
[0047] 圖23a展示開窗函數的圖;
[0048] 圖23b展示如圖23a中所示的開窗函數對語音信號的子幀的應用;
[0049] 圖24展示高帶解碼器B200的一實施方案B202的框圖;
[0050] 圖25展示寬帶語音編碼器A100的一實施方案AD10的框圖;
[0051] 圖26a展示延遲線D120的一實施方案D122的示意圖;
[0052] 圖26b展示延遲線D120的一實施方案D124的示意圖;
[0053] 圖27展示延遲線D120的一實施方案D130的示意圖;
[0054] 圖28展示寬帶語音編碼器AD10的一實施方案AD12的框圖;
[0055] 圖29展示根據一配置的信號處理方法MD100的流程圖;
[0056] 圖30展示用於根據一配置的方法M100的流程圖;
[0057] 圖31a展示用於根據一配置的方法M200的流程圖;
[0058] 圖31b展示用於方法M200的一實施方案M210的流程圖;
[0059] 圖32展示用於根據一配置的方法M300的流程圖;
[0060] 圖33說明無線通信系統的一配置;
[0061] 圖34為說明信號傳輸環境的一配置的框圖;
[0062] 圖35為說明用於在與語音信號相關聯的包中包括識別符的方法的一配置的流程 圖;
[0063] 圖36為說明解碼包的方法的一配置的流程圖;
[0064] 圖37為說明與多模式解碼器進行通信的多模式編碼器的一配置的框圖;
[0065] 圖38為說明可變速率語音編碼方法的一配置的流程圖;
[0066] 圖39為說明規則窄帶半速率包及寬帶半速率包的一配置的框圖;
[0067] 圖40為說明分配到各種類型的包的位的數目的表;及 [0068] 圖41為在通信裝置的一配置中的某些組件的框圖。
【具體實施方式】
[0069] 現參看附圖來描述所述系統及所述方法的各種配置,其中相同參考標號指示相同 或功能類似的元件。如大致在本文中的各圖中所描述及說明,可以廣泛的多種不同配置來 布置及設計本系統及方法的特徵。因此,下文的詳細描述並不希望限制如所主張的系統及 方法的範圍,而是僅表示所述系統及所述方法的配置。
[0070] 可將本文中所揭示的配置的許多特徵實施為計算機軟體、電子硬體或兩者的組 合。為清楚地說明硬體與軟體的此互換性,將大致就各種組件的功能性來描述所述組件。將 此功能性實施為硬體還是軟體視特定應用及強加於整個系統的設計約束而定。所屬領域的 技術人員可以針對每一特定應用的變化的方式來實施所描述的功能性,但不應將所述實施 方案決策解釋為導致脫離本系統及方法的範圍。
[0071] 在將所描述的功能性實施為計算機軟體的情況下,此軟體可包括任何類型的位於 存儲器裝置內及/或作為電子信號而經由系統總線或網絡傳輸的計算機指令或計算機可 執行碼。實施與本文中所描述的組件相關聯的功能性的軟體可包含單個指令或許多指令, 且可分布在若干不同碼段、分布於不同程序中及分布為跨越若干存儲器裝置。
[0072] 如本文中所使用,術語"一配置"、"配置"、"若干配置"、"所述配置"、"所述若干配 置"、"一個或一個以上配置"、" 一些配置"、"某些配置"、"一個配置"、"另一配置"及其類似 物意味著"所揭示的系統及方法的一個或一個以上(但未必全部)配置",除非另外明確規 定。
[0073] 術語"確定"(及其語法變體)是以極為廣泛的意義來使用。術語"確定"包含廣 泛的多種動作且因此"確定"可包括核算、計算、處理、導出、調查、查找(例如,在表格、數據 庫或另一數據結構中進行查找)、查明及其類似物。並且,"確定"可包括接收(例如,接收 信息)、存取(例如,存取存儲器中的數據)及其類似物。並且,"確定"可包括解析、選擇、 挑選、建立及其類似物。
[0074] 短語"基於"並不意味著"僅基於",除非另外明確規定。換句話說,短語"基於"描 述"僅基於"與"至少基於"兩者。
[0075] 蜂窩式網絡可包括由許多小區(每一小區由固定傳輸器服務)構成的無線電網 絡。可將所述多個傳輸器稱為小區站點或基站。通過經由通信信道將語音信號傳輸到基站, 小區可與網絡中的其它小區通信。小區可將語音信號劃分為多個幀(例如,20毫秒(ms)的 語音信號)。可將每一幀編碼到包中。包可包括某一數量的位,所述位接著在通信信道上被 傳輸到接收基站或接收小區。接收基站或接收小區可將包拆包且解碼各種幀以重構信號。
[0076] 可將包編碼為全速率包(171位)、半速率包(80位)、四分之一速率包(40位)或 八分之一速率包(16位)。此外,可利用窄帶編碼器或寬帶編碼器來編碼包。由寬帶編碼器 編碼的包可被編碼為全速率包、半速率包或八分之一速率包。由窄帶編碼器編碼的包可被 編碼為全速率包、半速率包、四分之一速率包或八分之一速率包。可針對各種類型的包實施 寬帶編碼器,包括編碼激勵線性預測(CELP)包及噪聲激勵線性預測(NELP)包。可對CELP 包、原型音高周期(PPP)包及NELP包實施窄帶編碼器。
[0077] 在編碼包之後,在包中可包括識別符以便對解碼器指示所述包是由寬帶編碼器還 是由窄帶編碼器所編碼。在識別符中所包括的信息可對解碼器指示所述包是應使用寬帶解 碼器還是窄帶解碼器予以解碼。舉例來說,第四代聲碼器(4GV)寬帶(WB)編碼器可編碼 半速率(80位)包。所述包可不具有用以識別更多類型的包的顯式位。因而,包括7位音 高滯後的無效位模式可用於識別包括73位(或73位以下)的一個或一個以上包。然而, 4GV-WB半速率包可需要74位,且因而,可能無法針對4GV-WB半速率包利用7位音高滯後 識別符(因為在此實例中,可用於半速率的位的總數目為80)。在一方面中,7位音高滯後 識別符的兩個無效樣式(彼此相差一個位)可用於識別4GV-WB半速率包。(七個位中的) 六個位可用作識別符,因此除了 73位之外,釋放了一個不同位以由4GV-WB半速率包使用, 其產生用於4GV-WB半速率包的74位。
[0078] 本文中所描述的配置包括可經配置以對窄帶語音編碼器提供擴展從而支持以約 800bps到1000bps (位每秒)的帶寬增量來傳輸及/或存儲寬帶語音信號的系統、方法及設 備。所述實施方案的潛在優勢包括:用以支持與窄帶系統的兼容性的嵌入式編碼、在窄帶編 碼信道與高帶編碼信道之間的相對容易的位分配及再分配、避免了計算密集型寬帶合成運 算及維持待由計算密集型波形編碼例行程序處理的信號的低取樣速率。
[0079] 除非上下文明確限制,否則術語"計算"在本文中用於指示其一般意義中的任一意 義,例如演算、產生一列值及從一列值進行選擇。在本描述及權利要求書中使用術語"包含" 時,其並不排除其它元件或操作。術語"A基於B"用於指示其一般意義中的任一意義,包 括⑴"A等同於B"及(ii) "A至少基於B"的情況。術語"網際網路協議"包括版本4(如 IETF(網際網路工程任務組)RFC(請求評論)791中所描述)及隨後版本(例如版本6)。
[0080] 圖la展示根據一配置的寬帶語音編碼器A100的框圖。濾波器組A110經配置以 對寬帶語音信號S10進行濾波,以產生窄帶信號S20及高帶信號S30。窄帶編碼器A120經 配置以編碼窄帶信號S20,以產生窄帶(NB)濾波器參數S40及窄帶殘餘信號S50。如本文 中進一步詳細描述,窄帶編碼器A120通常經配置以產生作為碼簿索引或以另一經量化形 式的窄帶濾波器參數S40及經編碼窄帶激勵信號S50。高帶編碼器A200經配置以根據在經 編碼窄帶激勵信號S50中的信息而編碼高帶信號S30,以產生高帶編碼參數S60。如本文中 進一步詳細描述,高帶編碼器A200通常經配置以產生作為碼簿索引或以另一量化形式的 高帶編碼參數S60。寬帶語音編碼器A100的一特定實例經配置而以約8. 55kbps (千位每 秒)的速率來編碼寬帶語音信號S10,其中約7. 55kbps用於窄帶濾波器參數S40及經編碼 窄帶激勵信號S50,且約lkbps用於高帶編碼參數S60。
[0081] 可能需要將經編碼窄帶與高帶信號組合為單一位流。舉例來說,可能需要將經編 碼信號多路復用在一起以作為經編碼寬帶語音信號而(例如,經由有線、光學或無線傳輸 信道)傳輸或存儲。圖lb展示寬帶語音編碼器A100的一實施方案A102的框圖,其包括多 路復用器A130,所述多路復用器A130經配置以將窄帶濾波器參數S40、經編碼窄帶激勵信 號S50及高帶濾波器參數S60組合為經多路復用信號S70。
[0082] 包括編碼器A102的設備還可包括電路,所述電路經配置以將經多路復用信號S70 傳輸到例如有線、光學或無線信道的傳輸信道中。所述設備還可經配置以執行對信號的一 個或一個以上信道編碼操作,例如誤差校正編碼(例如,速率兼容卷積編碼)及/或誤差檢 測編碼(例如,循環冗餘編碼)及/或一個或一個以上層的網絡協議編碼(例如,乙太網、 TCP/IP、cdma2000)。
[0083] 可能需要配置多路復用器A130以將經編碼窄帶信號(包括窄帶濾波器參數S40 及經編碼窄帶激勵信號S50)作為經多路復用信號S70的可分子流而嵌入,使得經編碼窄帶 信號可獨立於經多路復用信號S70的另一部分(例如高帶及/或低帶信號)而被恢復及解 碼。舉例來說,經多路復用信號S70可經布置以使得經編碼窄帶信號可通過去除高帶濾波 器參數S60而得以恢復。所述特徵的一潛在優勢為:避免了在將經編碼寬帶信號傳遞到支 持窄帶信號的解碼但不支持高帶部分的解碼的系統之前,將經編碼寬帶信號進行碼變換的 需要。
[0084] 圖2a為根據一配置的寬帶語音解碼器B100的框圖。窄帶解碼器B110經配置以解 碼窄帶濾波器參數S40及經編碼窄帶激勵信號S50,以產生窄帶信號S90。高帶解碼器B200 經配置以根據窄帶激勵信號S80基於經編碼窄帶激勵信號S50來解碼高帶編碼參數S60,以 產生高帶信號S100。在此實例中,窄帶解碼器B110經配置以將窄帶激勵信號S80提供到高 帶解碼器B200。濾波器組B120經配置以將窄帶信號S90與高帶信號S100組合,以產生寬 帶語音信號S110。
[0085] 圖2b為寬帶語音解碼器B100的一實施方案B102的框圖,其包括解多路復用器 B130,所述解多路復用器B130經配置以從經多路復用信號S70產生經編碼信號S40、S50及 S60。包括解碼器B102的設備可包括電路,所述電路經配置以從例如有線、光學或無線信道 的傳輸信道接收經多路復用信號S70。所述設備還可經配置以執行對信號的一個或一個以 上信道解碼操作,例如誤差校正解碼(例如,速率兼容卷積解碼)及/或誤差檢測解碼(例 如,循環冗餘解碼)及/或一個或一個以上層的網絡協議解碼(例如,乙太網絡、TCP/IP、 cdma2000)。
[0086] 濾波器組A110經配置以根據帶分割方案來對輸入信號進行濾波,以產生低頻率 子帶及高頻率子帶。視針對特定應用的設計標準而定,輸出子帶可具有相等或不等帶寬且 可重疊或不重疊。產生兩個以上子帶的濾波器組A110的配置也是可能的。舉例來說,所述 濾波器組可經配置以產生一個或一個以上低帶信號,所述信號包括在低於窄帶信號S20的 頻率範圍的頻率範圍(例如50Hz到300Hz的範圍)內的分量。所述濾波器組還可能經配 置以產生一個或一個以上額外高帶信號,所述信號包括在高於高帶信號S30的頻率範圍的 頻率範圍(例如14kHz到20kHz、16kHz到20kHz或16kHz到32kHz的範圍)內的分量。在 所述情況下,寬帶語音編碼器A100可經實施以單獨編碼所述信號,且多路復用器A130可經 配置以將額外經編碼信號包括於經多路復用信號S70中(例如,作為可分部分)。
[0087] 圖3a展示濾波器組A110的一實施方案A112的框圖,其經配置以產生具有降低取 樣速率的兩個子帶信號。濾波器組A110經布置以接收具有高頻率(或高帶)部分及低頻 率(或低帶)部分的寬帶語音信號S10。濾波器組A112包括:低帶處理路徑,其經配置以接 收寬帶語音信號S10且產生窄帶語音信號S20 ;及高帶處理路徑,其經配置以接收寬帶語音 信號S10且產生高帶語音信號S30。低通濾波器110對寬帶語音信號S10進行濾波以使選 定低頻率子帶通過,且高通濾波器130對寬帶語音信號S10進行濾波以使選定高頻率子帶 通過。因為兩個子帶信號均具有比寬帶語音信號S10更窄的帶寬,所以其取樣速率可降低 到某一程度而不會損失信息。降取樣器(d 〇Wnsampler)120根據所要抽取因子來降低低通 信號的取樣速率(例如,通過移除信號的樣本及/或以平均值替代樣本),且降取樣器140 同樣根據另一所要抽取因子來降低高通信號的取樣速率。
[0088] 圖3b展示濾波器組B120的一對應實施方案B122的框圖。升取樣器 (upsampler) 150增加窄帶信號S90的取樣速率(例如,通過零塞入及/或通過複製樣本), 且低通濾波器160對經升取樣信號進行濾波以使低帶部分通過(例如,以避免假信號)。同 樣,升取樣器170增加高帶信號S100的取樣速率,且高通濾波器180對經升取樣信號進行 濾波以使高帶部分通過。接著將所述兩個通帶信號求和以形成寬帶語音信號S110。在解碼 器B100的一些實施方案中,濾波器組B120經配置以根據由高帶解碼器B200接收及/或計 算的一個或一個以上權重來產生兩個通帶信號的加權和。還涵蓋組合兩個以上通帶信號的 濾波器組B120的配置。
[0089] 濾波器110、130、160、180中的每一者均可實施為有限脈衝響應(FIR)濾波器或無 限脈衝響應(IIR)濾波器。編碼器濾波器110及130的頻率響應可在阻帶與通帶之間具有 對稱或不同形狀的過渡區域。同樣,解碼器濾波器160及180的頻率響應可在阻帶與通帶 之間具有對稱或不同形狀的過渡區域。低通濾波器110可能需要具有與低通濾波器160相 同的響應,且高通濾波器130可能需要具有與高通濾波器180相同的響應。在一實例中,兩 個濾波器對110、130及160、180為正交鏡像濾波器(QMF)組,其中濾波器對110、130具有 與濾波器對160U80相同的係數。
[0090] 在一典型實例中,低通濾波器110具有包括300Hz到3400Hz的有限PSTN範圍的 通帶(例如,從0kHz到4kHz的帶)。圖4a及圖4b展示在兩個不同實施性實例中的寬帶語 音信號S10、窄帶信號S20及高帶信號S30的相對帶寬。在所述兩個特定實例中,寬帶語音 信號S10具有16kHz的取樣速率(表示頻率分量在0kHz到8kHz的範圍內),且窄帶信號 S20具有8kHz的取樣速率(表示頻率分量在0kHz到4kHz的範圍內)。
[0091] 在圖4a的實例中,在兩個子帶之間不存在顯著重疊。可使用具有4kHz到8kHz的 通帶的高通濾波器130獲得此實例中所示的高帶信號S30。在所述情況下,可需要通過以因 子2將經濾波信號降取樣來將取樣速率降低到8kHz。所述操作(可預期其將顯著降低對信 號的進一步處理操作的計算複雜度)將使通帶能量下降到0kHz到4kHz的範圍內而不會損 失?目息。
[0092] 在圖4b的替代實例中,上子帶與下子帶具有可觀的重疊,使得兩個子帶信號均描 述3. 5kHz到4kHz的區域。可使用具有3. 5kHz到7kHz的通帶的高通濾波器130獲得在此 實例中的高帶信號S30。在所述情況下,可需要通過以16/7的因子將濾波信號降取樣來將 取樣速率降低到7kHz。所述操作(可預期其將顯著降低對信號的進一步處理操作的計算復 雜度)將使通帶能量下降到〇kHz到3. 5kHz的範圍內而不會損失信息。
[0093] 在用於電話通信的典型手持機中,轉換器(即,麥克風及耳機或揚聲器)中的一者 或一者以上缺乏在7kHz到8kHz的頻率範圍內的明顯響應。在圖4b的實例中,在經編碼信 號中不包括寬帶語音信號S10在7kHz與8kHz之間的部分。高通濾波器130的其它特定實 例具有3. 5kHz到7. 5kHz及3. 5kHz到8kHz的通帶。
[0094] 在一些實施方案中,提供在子帶之間的重疊(如在圖4b的實例中)允許使用在重 疊區域上具有平滑滾落(rolloff)的低通及/或高通濾波器。所述濾波器通常較容易設計、 計算複雜度較低及/或比具有更急劇或"磚牆"響應的濾波器引入較少延遲。具有急劇過 渡區域的濾波器傾向於比具有平滑滾落的類似階數的濾波器具有更高旁瓣(旁瓣可導致 假信號)。具有急劇過渡區域的濾波器還可具有可導致振鈴偽影(ringing artifact)的長 脈衝響應。對於具有一個或一個以上IIR濾波器的濾波器組實施方案來說,允許在重疊區 域上的平滑滾落可能夠使用極點遠離單位圓的濾波器,此對於確保穩定的固定點實施方案 可為重要的。
[0095] 子帶的重疊允許低帶與高帶的平滑摻合,此可導致較少可聽偽影、減少的假信號 及/或從一個帶到另一帶的較不明顯的過渡。此外,窄帶編碼器A120 (例如,波形編碼器) 的編碼效率可隨著頻率增加而下降。舉例來說,窄帶編碼器的編碼質量可在低位速率處降 低(尤其在存在背景噪聲的情況下)。在所述情況下,提供子帶的重疊可增加在重疊區域中 的再生頻率分量的質量。
[0096] 此外,子帶的重疊允許低帶與高帶的平滑摻合,此可導致較少可聽偽影、減少的假 信號、及/或從一個帶到另一帶的較不明顯的過渡。所述特徵可尤其合乎其中窄帶編碼器 A120及高帶編碼器A200根據不同編碼方法操作的實施方案的需要。舉例來說,不同編碼 技術可產生聽起來非常不同的信號。編碼以碼簿索引形式的頻譜包絡的編碼器可產生一信 號,其具有與編碼振幅頻譜的編碼器產生的信號不同的聲音。時域編碼器(例如,脈衝碼調 制或PCM編碼器)可產生一信號,其具有與頻域編碼器所產生的信號不同的聲音。利用頻 譜包絡及對應殘餘信號的表示來編碼信號的編碼器可產生一信號,其具有與利用頻譜包絡 的表示來編碼信號的編碼器所產生的信號不同的聲音。將信號編碼為其波形的表示的編碼 器可產生一輸出,其具有不同於來自正弦編碼器的輸出的聲音。在所述情況下,使用具有急 劇過渡區域的濾波器來界定非重疊子帶可導致在經合成的寬帶信號中的子帶之間的突然 且明顯可感知的過渡。
[0097] 雖然具有互補重疊頻率響應的QMF濾波器組通常用於子帶技術中,但所述濾波器 不適於本文中所描述的寬帶編碼實施方案中的至少一些實施方案。在編碼器處的QMF濾波 器組經配置以產生顯著程度的假信號,所述假信號在解碼器處的對應QMF濾波器組中被消 去。所述布置可能不適用於其中信號在濾波器組之間發生顯著量的失真的應用中,因為失 真可降低假信號消去性質的有效性。舉例來說,本文中所描述的應用包括經配置而以極低 位速率操作的編碼實施方案。由於所述極低位速率,所以與原始信號相比,經解碼信號可能 表現出顯著失真,使得使用QMF濾波器組可導致未消去的假信號。使用QMF濾波器組的應 用通常具有較高位速率(例如,對AMR來說超過12kbps,對於G. 722來說超過64kbps)。 [0098] 另外,編碼器可經配置以產生感知上類似於原始信號但實際上顯著不同於原始信 號的經合成信號。舉例來說,如本文中所描述的從窄帶殘餘得出高帶激勵的編碼器可產生 所述信號,因為實際高帶殘餘可完全不存在於經解碼信號中。QMF濾波器組在所述應用中的 使用可導致由未消去的假信號引起的顯著程度的失真。
[0099] 由於假信號的影響限於等於子帶寬度的帶寬,因此如果受影響的子帶較窄,則可 降低由QMF假信號引起的失真量。然而,對於本文中所描述的每一子帶包括寬帶帶寬的約 一半的實例來說,由未消去的假信號引起的失真可影響信號的顯著部分。信號的質量還可 受其上出現未消去的假信號的頻帶的位置的影響。舉例來說,在寬帶語音信號的中心附近 (例如,在3kHz與4kHz之間)產生的失真可比出現於信號的邊緣附近(例如,超過6kHz) 的失真有害得多。
[0100] 雖然QMF濾波器組的濾波器的響應嚴格地彼此相關,但濾波器組A110及B120的 低帶路徑及高帶路徑可經配置以具有完全不相關的頻譜(除兩個子帶的重疊以外)。我們 將兩個子帶的重疊定義為從高帶濾波器的頻率響應下降到_2〇dB的點直到低帶濾波器的 頻率響應下降到-20dB的點的距離。在濾波器組A110及/或B120的各種實例中,此重疊 在從約200Hz到約1kHz的範圍內。約400Hz到約600Hz的範圍可表示在編碼效率與感知 平滑度之間的所要折衷。在上文所提及的一特定實例中,重疊為約500Hz。
[0101] 可能需要實施濾波器組A112及/或B122以在若干階段中執行圖4a及圖4b中所 說明的操作。舉例來說,圖4c展示濾波器組A112的一實施方案A114的框圖,其使用一系 列內插、重取樣、抽取及其它操作來執行高通濾波及降取樣操作的功能等同操作。所述實施 方案可較易於設計及/或可允許再使用邏輯及/或編碼的功能塊。舉例來說,相同功能塊 可用於執行對14kHz的抽取及對7kHz的抽取的操作(如圖4c中所示)。通過將信號與函 數或序列(_l) n(其值在+1與-1之間交替)相乘,可實施頻譜反轉操作。可將頻譜成 形操作實施為經配置以成形信號以獲得所要整體濾波器響應的低通濾波器。
[0102] 應注意到,由於頻譜反轉操作,高帶信號S30的頻譜被反轉。可相應地配置在編碼 器及對應解碼器中的隨後操作。舉例來說,如本文所描述的高帶激勵產生器A300可經配置 以產生也具有頻譜反轉形態的高帶激勵信號S120。
[0103] 圖4d展不濾波器組B122的一實施方案B124的框圖,其使用一系列內插、重取樣 及其它操作來執行升取樣及高通濾波操作的功能等同操作。濾波器組B124包括在高帶中 的頻譜反轉操作,其反轉與(例如)在編碼器的濾波器組(例如濾波器組A114)中執行的操 作類似的操作。在此特定實例中,濾波器組B124還包括在低帶及高帶中衰減信號在7100Hz 處的分量的陷波濾波器,但所述陷波濾波器是任選的且無需被包括。
[0104] 窄帶編碼器A120根據源-濾波器模型而實施,其將輸入語音信號編碼為:(A)描 述濾波器的一組參數;及(B)驅動所描述濾波器產生輸入語音信號的經合成再現信號的激 勵信號。圖5a展示語音信號的頻譜包絡的一實例。表現此頻譜包絡的特徵的峰值表示聲 道的共振且被稱為共振峰。大多數語音編碼器至少將此粗略頻譜結構編碼為例如濾波器系 數的一組參數。
[0105] 圖5b展示如應用於窄帶信號S20的頻譜包絡的編碼的基本源-濾波器布置的一 實例。分析模塊計算表現對應於一時間周期(通常20毫秒)內的語音的濾波器的特徵的 一組參數。根據所述濾波器參數而配置的白化濾波器(還稱為分析或預測誤差濾波器)移 除頻譜包絡,以在頻譜上平化所述信號。所得經白化信號(還稱為殘餘)具有較少能量,且 因此具有較小方差,且比原始語音信號更易於編碼。由編碼殘餘信號產生的誤差還可更均 勻地散布於頻譜上。濾波器參數及殘餘通常經量化以經由信道有效傳輸。在解碼器處,根 據濾波器參數所配置的合成濾波器由基於殘餘的信號而激勵,以產生原始語音的經合成版 本。合成濾波器通常經配置以具有傳遞函數,其為白化濾波器的傳遞函數的倒數。
[0106] 圖6展示窄帶編碼器A120的一基本實施方案A122的框圖。在此實例中,線性預測 編碼(LPC)分析模塊210將窄帶信號S20的頻譜包絡編碼為一組線性預測(LP)係數(例 如,全極濾波器1/A(z)的係數)。分析模塊通常將輸入信號處理為一系列非重疊幀,其中針 對每一幀計算一組新係數。幀周期通常為可預期信號在其內局部不變的周期;一實例為20 毫秒(等於8kHz的取樣速率時的160個樣本)。在一實例中,LPC分析模塊210經配置以 計算一組十個LP濾波器係數,以表現每20毫秒幀的共振峰結構的特徵。還可能實施分析 模塊以將輸入信號處理為一系列重疊中貞。
[0107] 分析模塊可經配置以直接分析每一幀的樣本,或樣本可根據開窗函數(例如漢明 窗口)而被首先加權。還可在大於幀的窗口(例如30毫秒的窗口)內執行分析。此窗口 可為對稱的(例如5-20-5,使得緊接在20毫秒幀之前及之後,其包括5毫秒)或非對稱的 (例如10-20,使得其包括前一幀的最後10毫秒)。LPC分析模塊通常經配置以使用理文森 杜賓(Levinson-Durbin)遞歸或萊羅克斯古伊古恩(Leroux-Gueguen)算法來計算LP濾波 器係數。在另一實施方案中,分析模塊可經配置以針對每一幀計算一組倒頻譜係數而並非 一組LP濾波器係數。
[0108] 通過量化濾波器參數,編碼器A120的輸出速率可顯著降低,同時對再現質量具有 相對較少影響。線性預測濾波器係數難以有效量化且通常映射為用於量化及/或熵編碼的 另一表示,例如線頻譜對(LSP)或線頻譜頻率(LSF)。在圖6的實例中,LP濾波器係數到 LSF變換220將所述組LP濾波器係數變換為一組對應的LSF。LP濾波器係數的其它一對一 表示包括:部分自相關係數;對數面積比(log-area-ratio)值;導抗頻譜對(ISP);及導抗 頻譜頻率(ISF),以上均用於GSM (全球移動通信系統)AMR-WB (自適應多速率寬帶)編解碼 器。通常,一組LP濾波器係數與一組對應的LSF之間的變換為可逆的,但是配置還包括編 碼器A120的實施方案,其中變換不能無誤差地可逆。
[0109] 量化器230經配置以量化所述組窄帶LSF (或其它係數表示),且窄帶編碼器A122 經配置以將此量化結果作為窄帶濾波器參數S40輸出。所述量化器通常包括向量量化器, 其將輸入向量編碼為表或碼簿中的對應向量條目的索引。
[0110] 如圖6中所見,窄帶編碼器A122還通過使窄帶信號S20通過白化濾波器260 (還 稱為分析或預測誤差濾波器)來產生殘餘信號,所述白化濾波器260根據所述組濾波器系 數而配置。在此特定實例中,雖然還可使用IIR實施方案,但白化濾波器260被實施為FIR 濾波器。此殘餘信號通常將含有語音幀的感知上重要的信息(例如關於音高的長期結構), 其未表示在窄帶濾波器參數S40中。量化器270經配置以計算此殘餘信號的經量化表示以 作為經編碼窄帶激勵信號S50而輸出。所述量化器通常包括向量量化器,其將輸入向量編 碼為表或碼簿中的對應向量條目的索引。或者,所述量化器可經配置以發送一個或一個以 上參數,可在解碼器處從所述參數動態產生向量,而並非如稀疏碼簿方法中那樣從存儲裝 置檢索。所述方法用於例如代數CELP (碼簿激勵線性預測)的編碼方案中及例如3GPP2 (第 三代合作夥伴2) EVRC (增強型可變速率編解碼器)的編解碼器中。
[0111] 需要窄帶編碼器A120根據將可用於對應窄帶解碼器的相同濾波器參數值來產生 經編碼窄帶激勵信號。以此方式,所得經編碼窄帶激勵信號可已在某種程度上計及在所述 參數值中的非理想性,例如量化誤差。因此,需要使用將可用於解碼器處的相同係數值來配 置白化濾波器。在如圖6中所示的編碼器A122的基本實例中,逆量化器240將窄帶編碼參 數S40去量化,LSF到LP濾波器係數變換250將所得值映射回一組對應的LP濾波器係數, 且將此組係數用於配置白化濾波器260以產生由量化器270量化的殘餘信號。
[0112] 窄帶編碼器A120的一些實施方案經配置以通過識別一組碼簿向量中的最匹配殘 餘信號的向量來計算經編碼窄帶激勵信號S50。然而,注意到,窄帶編碼器A120還可經實施 以計算殘餘信號的經量化表示,而實際上並不產生殘餘信號。舉例來說,窄帶編碼器A120 可經配置以使用許多碼簿向量來產生對應的經合成信號(例如,根據一組當前濾波器參 數),且在感知加權域中選擇最匹配原始窄帶信號S20的與所產生信號相關聯的碼簿向量。
[0113] 圖7展示窄帶解碼器B110的一實施方案B112的框圖。逆量化器310將窄帶濾波 器參數S40去量化(在此情況下,去量化為一組LSF),且LSF到LP濾波器係數變換320將 LSF變換為一組濾波器係數(例如,如上文參看窄帶編碼器A122的逆量化器240及變換250 所描述)。逆量化器340將窄帶殘餘信號S40去量化以產生窄帶激勵信號S80。基於濾波 器係數及窄帶激勵信號S80,窄帶合成濾波器330合成窄帶信號S90。換句話說,窄帶合成 濾波器330經配置以根據所述經去量化的濾波器係數來頻譜成形窄帶激勵信號S80,以產 生窄帶信號S90。窄帶解碼器B112還將窄帶激勵信號S80提供到高帶編碼器A200,所述高 帶編碼器A200使用激勵信號S80而得出如本文中所述的高帶激勵信號S120。在如下文所 描述的一些實施方案中,窄帶解碼器B110可經配置以將與窄帶信號相關的額外信息(例如 頻譜傾斜、音高增益及滯後及語音模式)提供到高帶解碼器B200。
[0114] 窄帶編碼器A122及窄帶解碼器B112的系統為分析合成語音編解碼器 (analysis-by-synthesis speech codec)的一基本實例。碼簿激勵線性預測(CELP)編 碼為一系列普遍的分析合成編碼,且所述編碼器的實施方案可執行殘餘的波形編碼,包括 例如從固定及自適應碼簿選擇條目,誤差最小化操作及/或感知加權操作的所述操作。 分析合成編碼的其它實施方案包括混合激勵線性預測(MELP)、代數CELP(ACELP)、鬆弛 CELP(RCELP)、規則脈衝激勵(RPE)、多脈衝CELP(MPE)及向量和激勵線性預測(VSELP)編 碼。相關編碼方法包括多帶激勵(MBE)及原型波形內插(PWI)編碼。標準化分析合成語音 編解碼器的實例包括:ETSI (歐洲電信標準協會)-GSM全速率編解碼器(GSM06. 10),其使用 殘餘激勵線性預測(RELP) ;GSM增強型全速率編解碼器(ETSI-GSM06.60) ;ITU(國際電信 聯合會)標準11. 8kb/sG. 729附件E編碼器;用於IS-136(時分多址方案)的IS(臨時標 準)-641編解碼器;GSM自適應多速率(GSM-AMR)編解碼器及4GVTM(第四代聲碼器?)編解 碼器(高通公司(QUALCOMM Incorporated),加利福尼亞,聖地牙哥(San Diego, CA))。可 根據所述技術中的任一技術,或將語音信號表不為(A)描述濾波器的一組參數及(B)用於 驅動所描述濾波器再現語音信號的激勵信號的任何其它語音編碼技術(無論已知的還是 待研發的)來實施窄帶編碼器A120及對應解碼器B110。
[0115] 即使在白化濾波器已從窄帶信號S20移除粗略頻譜包絡之後,仍可保留相當量的 精細諧波結構(尤其對有聲語音來說)。圖8a展示例如元音的有聲信號的殘餘信號(如可 由白化濾波器產生)的一實例的頻譜曲線。在此實例中可見的周期性結構與音高相關,且 由相同說話者所說的不同有聲聲音可具有不同共振峰結構但具有類似音高結構。圖8b展 示所述殘餘信號的一實例的時域曲線,其按時間展示音高脈衝的序列。
[0116] 可通過使用一個或一個以上參數值來編碼音高結構的特徵而增加編碼效率及/ 或語音質量。音高結構的一重要特徵為第一諧波的頻率(還稱為基礎頻率),其通常在60Hz 到400Hz的範圍內。通常將此特徵編碼為基礎頻率的倒數(還稱為音高滯後)。音高滯後 指示在一音高周期中的樣本數目且可被編碼為一個或一個以上碼簿索引。來自男性說話者 的語音信號傾向於比來自女性說話者的語音信號具有更大音高滯後。
[0117] 關於音高結構的另一信號特徵為周期性,其指示諧波結構的強度,或換句話說,信 號為諧波或非諧波的程度。周期性的兩個典型標誌為零交叉及規範化自相關函數(NACF)。 周期性還可由音高增益來指示,音高增益被編碼為碼簿增益(例如,經量化的自適應碼簿 增益)。
[0118] 窄帶編碼器A120可包括經配置以編碼窄帶信號S20的長期諧波結構的一個或一 個以上模塊。如圖9中所示,可使用的一典型CELP範例包括開環LPC分析模塊,其編碼短 期特徵或粗略頻譜包絡,接著為閉環長期預測分析階段,其編碼精細音高或諧波結構。短期 特徵被編碼為濾波器係數,且長期特徵被編碼為例如音高滯後及音高增益的參數值。舉例 來說,窄帶編碼器A120可經配置而以包括一個或一個以上碼簿索引(例如,固定碼簿索引 及自適應碼簿索引)及對應增益值的形式輸出經編碼窄帶激勵信號S50。對窄帶殘餘信號 的此經量化表示的計算(例如,由量化器270進行)可包括選擇所述索引及計算所述值。 對音高結構的編碼還可包括內插音高原型波形,此操作可包括計算在連續音高脈衝之間的 差。針對對應於無聲語音(其通常像噪聲且未結構化)的幀,可停用對長期結構的模型化。
[0119] 根據如圖9中所示的範例的窄帶解碼器B110的實施方案可經配置以在已恢復長 期結構(音高或諧波結構)之後,將窄帶激勵信號S80輸出到高帶解碼器B200。舉例來說, 所述解碼器可經配置以將窄帶激勵信號S80輸出為經編碼窄帶激勵信號S50的經去量化版 本。當然,還可能實施窄帶解碼器B110,使得高帶解碼器B200執行經編碼窄帶激勵信號S50 的去量化,以獲得窄帶激勵信號S80。
[0120] 在根據如圖9中所示的一範例的寬帶語音編碼器A100的實施方案中,高帶編碼器 A200可經配置以接收由短期分析或白化濾波器所產生的窄帶激勵信號。換句話說,窄帶編 碼器A120可經配置以在編碼長期結構之前,將窄帶激勵信號輸出到高帶編碼器A200。然 而,需要高帶編碼器A200從窄帶信道接收將由高帶解碼器B200接收的相同的編碼信息,使 得由高帶編碼器A200所產生的編碼參數可以在某種程度上計及所述信息中的非理想性。 因此,使高帶編碼器A200從待由寬帶語音編碼器A100輸出的同樣經參數化及/或經量化 的所編碼窄帶激勵信號S50重構窄帶激勵信號S80可能為優選的。此方法的一潛在優勢在 於可更準確地計算下文描述的高帶增益因子S60b。
[0121] 除表現窄帶信號S20的短期及/或長期結構的特徵的參數之外,窄帶編碼器A120 可產生關於窄帶信號S20的其它特徵的參數值。這些值(可經適當量化以由寬帶語音編碼 器A100輸出)可包括於窄帶濾波器參數S40中或被單獨輸出。高帶編碼器A200還可經配 置以根據這些額外參數中的一者或一者以上來計算高帶編碼參數S60(例如,在去量化之 後)。在寬帶語音解碼器B100處,高帶解碼器B200可經配置以經由窄帶解碼器B110接收 參數值(例如,在去量化之後)。或者,高帶解碼器B200可經配置以直接接收(或可能去量 化)參數值。
[0122] 在額外窄帶編碼參數的一實例中,窄帶編碼器A120產生頻譜傾斜值及每一幀的 語音模式參數。頻譜傾斜與通帶上的頻譜包絡的形狀相關,且通常由經量化的第一反射系 數表示。對大多數有聲聲音來說,頻譜能量隨頻率增加而降低,使得第一反射係數為負且可 接近-1。大多數無聲聲音具有為平坦(使得第一反射係數接近零)或在高頻率處具有更多 能量(使得第一反射係數為正且可接近+1)的頻譜。
[0123] 語音模式(還稱為發聲模式)指示當前幀表示有聲語音還是無聲語音。此參數可 具有二進位值,所述值基於幀的周期性(例如零交叉、NACF、音高增益)及/或語音有效性 的一個或一個以上量度,例如所述量度與閾值之間的關係。在其它實施方案中,語音模式參 數具有一個或一個以上其它狀態,以指示例如靜默或背景噪聲,或靜默與有聲語音之間的 過渡的模式。
[0124] 高帶編碼器A200經配置以根據源-濾波器模型來編碼高帶信號S30,其中用於此 濾波器的激勵是基於經編碼窄帶激勵信號。圖10展示高帶編碼器A200的一實施方案A202 的框圖,其經配置以產生高帶編碼參數S60的流,所述參數包括高帶濾波器參數S60a及高 帶增益因子S60b。高帶激勵產生器A300從經編碼窄帶激勵信號S50得出高帶激勵信號 S120。分析模塊A210產生表現高帶信號S30的頻譜包絡的特徵的一組參數值。在此特定 實例中,分析模塊A210經配置以執行LPC分析,以針對高帶信號S30的每一幀產生一組LP 濾波器係數。線性預測濾波器係數到LSF變換410將所述組LP濾波器係數變換為一組對 應的LSF。如上文參看分析模塊210及變換220所所述,分析模塊A210及/或變換410可 經配置以使用其它係數組(例如,倒頻譜係數)及/或係數表示(例如,ISP)。
[0125] 量化器420經配置以量化所述組高帶LSF (或其它係數表示,例如ISP),且高帶編 碼器A202經配置以將此量化結果輸出為高帶濾波器參數S60a。所述量化器通常包括將輸 入向量編碼為表或碼簿中的對應向量條目的索引的向量量化器。
[0126] 高帶編碼器A202還包括合成濾波器A220,其經配置以根據高帶激勵信號S120及 由分析模塊A210產生的編碼頻譜包絡(例如,所述組LP濾波器係數)來產生經合成高帶 信號S130。雖然還可使用FIR實施,但合成濾波器A220通常被實施為IIR濾波器。在一特 定實例中,合成濾波器A220被實施為六階線性自回歸濾波器。
[0127] 高帶增益因子計算器A230計算在原始高帶信號S30的電平與經合成高帶信號 S130的電平之間的一個或一個以上差,以指定用於幀的增益包絡。量化器430(其可實施為 將輸入向量編碼為表或碼簿中的對應向量條目的索引的向量量化器)量化指定增益包絡 的值,且高帶編碼器A202經配置以將此量化結果輸出為高帶增益因子S60b。
[0128] 在圖10中所示的一實施方案中,合成濾波器A220經布置以接收來自分析模塊 A210的濾波器係數。高帶編碼器A202的替代實施方案包括經配置以從高帶濾波器參數 S60a解碼濾波器係數的逆量化器及逆變換,且在此情況下,替代地,合成濾波器A220經布 置以接收經解碼的濾波器係數。所述替代布置可支持高帶增益計算器A230對增益包絡進 行更準確的計算。
[0129] 在一特定實例中,分析模塊A210及高帶增益計算器A230分別輸出每幀一組六個 LSF與一組五個增益值,使得利用每幀11個額外值可實現窄帶信號S20的寬帶擴展。人耳 傾向於對在高頻率處的頻率誤差較不敏感,使得在較低LPC階處的高帶編碼可產生具有可 與在較高LPC階處的窄帶編碼相當的感知質量的信號。高帶編碼器A200的一典型實施方案 可經配置以輸出每幀8到12位以用於頻譜包絡的高質量重構,且輸出每幀另外8到12位 以用於時間包絡的高質量重構。在另一特定實例中,分析模塊A210輸出每幀一組8個LSF。
[0130] 高帶編碼器A200的一些實施方案經配置以通過產生具有高帶頻率分量的隨機噪 聲信號且根據窄帶信號S20、窄帶激勵信號S80或高帶信號S30的時域包絡來振幅調製噪 聲信號而產生高帶激勵信號S120。雖然所述基於噪聲的方法可對於無聲聲音產生適當結 果,然而,其對於有聲聲音可並不合乎需要,所述有聲聲音的殘餘通常為諧波的且因此具有 一些周期結構。
[0131] 高帶激勵產生器A300經配置以通過將窄帶激勵信號S80的頻譜擴展到高帶頻率 範圍內來產生高帶激勵信號S120。圖11展示高帶激勵產生器A300的一實施方案A302的 框圖。逆量化器450經配置以將經編碼窄帶激勵信號S50去量化以產生窄帶激勵信號S80。 頻譜擴展器A400經配置以基於窄帶激勵信號S80而產生諧波擴展信號S160。組合器470 經配置以組合由噪聲產生器480所產生的隨機噪聲信號及由包絡計算器460所計算的時域 包絡,以產生經調製噪聲信號S170。組合器490經配置以混合諧波擴展信號S60與經調製 噪聲信號S170以產生高帶激勵信號S120。
[0132] 在一實例中,頻譜擴展器A400經配置以對窄帶激勵信號S80執行頻譜摺疊操作 (還稱為鏡射),以產生諧波擴展信號S160。頻譜摺疊可通過零塞入激勵信號S80且接著應 用高通濾波器以保留假信號來執行。在另一實例中,頻譜擴展器A400經配置以通過將窄帶 激勵信號S80頻譜轉化為高帶(例如,經由升取樣,接著與恆定頻率餘弦信號相乘)來產生 諧波擴展信號S160。
[0133] 頻譜摺疊及轉化方法可產生頻譜擴展信號,其諧波結構與窄帶激勵信號S80的原 始諧波結構在相位及/或頻率方面不連續。舉例來說,所述方法可產生峰值通常不位於基 礎頻率倍數處的信號,此可在經重構的語音信號中導致金屬音(tinny-sounding)偽影。所 述方法還傾向於產生具有非自然強音調特徵的高頻率諧波。此外,因為PSTN信號可以8kHz 取樣但頻帶限制於不超過3400Hz,所以窄帶激勵信號S80的上部頻譜可含有少量能量或無 能量,使得根據頻譜摺疊或頻譜轉化操作而產生的經擴展信號可具有在3400Hz之上的頻 譜空洞。
[0134] 產生諧波擴展信號S160的其它方法包括識別窄帶激勵信號S80的一個或一個以 上基礎頻率及根據所述信息產生諧波音調。舉例來說,激勵信號的諧波結構的特徵可為基 礎頻率連同振幅及相位信息。高帶激勵產生器A300的另一實施方案基於基礎頻率及振幅 (如例如由音高滯後及音高增益來指示)來產生諧波擴展信號S160。然而,除非諧波擴展 信號與窄帶激勵信號S80相位相干,否則所得經解碼語音的質量可能為不可接受的。
[0135] 非線性函數可用於產生與窄帶激勵相位相干且保留諧波結構而無相位不連續性 的高帶激勵信號。非線性函數還可在高頻率諧波之間提供增加的噪聲電平,其傾向於比由 例如頻譜摺疊及頻譜轉化的方法產生的高頻率音調諧波聽起來更自然。可由頻譜擴展器 A400的各種實施方案應用的典型無記憶非線性函數包括絕對值函數(還稱為全波整流)、 半波整流、平方、立方及截割。頻譜擴展器A400的其它實施方案可經配置以應用具有記憶 的非線性函數。
[0136] 圖12為頻譜擴展器A400的一實施方案A402的框圖,其經配置以應用非線性函數 以擴展窄帶激勵信號S80的頻譜。升取樣器510經配置以升取樣窄帶激勵信號S80。可能 需要充分升取樣所述信號以最小化在應用非線性函數時的假信號。在一特定實例中,升取 樣器510以因子8來升取樣信號。升取樣器510可經配置以通過對輸入信號零塞入及低通 濾波所述結果來執行升取樣操作。非線性函數計算器520經配置以將非線性函數應用於經 升取樣的信號。絕對值函數相比於用於頻譜擴展的其它非線性函數(例如平方)的潛在優 勢為其不需要能量規範化。在一些實施方案中,通過除去或清除每一樣本的符號位,可有效 應用絕對值函數。非線性函數計算器520還可經配置以對經升取樣或頻譜擴展的信號執行 振幅彎曲(amplitude warping)。
[0137] 降取樣器530經配置以降取樣應用非線性函數的頻譜擴展結果。可能需要降取樣 器530在降低取樣速率之前執行帶通濾波操作以選擇頻譜擴展信號的所要頻帶(例如,以 減小或避免由不當圖像造成的假信號或惡化)。還可能需要降取樣器530在一個以上階段 中降低取樣速率。
[0138] 圖12a為展示在頻譜擴展操作的一實例中各點處的信號頻譜的圖,其中頻率比例 在各個曲線上相同。曲線(a)展示窄帶激勵信號S80的一實例的頻譜。曲線(b)展示信號 S80在以因子8升取樣之後的頻譜。曲線(c)展示在應用非線性函數之後的擴展頻譜的一 實例。曲線(d)展示在低通濾波之後的頻譜。在此實例中,通帶擴展到高帶信號S30的頻 率上限(例如,7kHz或8kHz)。
[0139] 曲線(e)展示在降取樣的第一階段之後的頻譜,其中以因子4降低取樣速率以獲 得寬帶信號。曲線(f)展示在進行高通濾波操作以選擇經擴展信號的高帶部分之後的頻 譜,且曲線(g)展示在降取樣的第二階段之後的頻譜,其中以因子2降低取樣速率。在一特 定實例中,降取樣器530通過使寬帶信號通濾波波器組A112的高通濾波器130及降取樣器 140 (或具有相同響應的其它結構或例行程序)來執行高通濾波及降取樣的第二階段,以產 生具有高帶信號S30的頻率範圍及取樣速率的頻譜擴展信號。
[0140] 如在曲線(g)中所見,在曲線(f)中展示的高通信號的降取樣引起其頻譜反轉。在 此實例中,降取樣器530還經配置以對信號執行頻譜翻轉(spectral flipping)操作。曲 線(h)展示應用頻譜翻轉操作的結果,所述頻譜翻轉操作可通過使信號與函數或序列 (_l) n(其值在+1與-1之間交替)相乘而執行。所述操作等同於在頻域中將信號的數字頻 譜移位η的距離。注意到,相同結果還可通過以不同順序應用降取樣操作及頻譜翻轉操作 而獲得。升取樣及/或降取樣的操作還可經配置以包括重取樣,以獲得具有高帶信號S30 的取樣速率(例如,7kHz)的頻譜擴展信號。
[0141] 如上文所述,濾波器組A110及B120可經實施以使得窄帶信號S20及高帶信號S30 中的一或兩者在濾波器組A110的輸出處具有頻譜反轉形式,以頻譜反轉形式被編碼及解 碼,且在寬帶語音信號S110中輸出之前再次在濾波器組B120處被頻譜反轉。當然,在所述 情況下,因為將需要高帶激勵信號S120同樣具有頻譜反轉形式,所以可不實施如圖12a中 所示的頻譜翻轉操作。
[0142] 由頻譜擴展器A402執行的頻譜擴展操作的升取樣及降取樣的各種任務可以許多 不同方式加以配置及布置。舉例來說,圖12b為展示頻譜擴展操作的另一實例中各個點處 的信號頻譜的圖,其中頻率比例在各個曲線上相同。曲線(a)展示窄帶激勵信號S80的一 實例的頻譜。曲線(b)展示信號S80在以因子2升取樣之後的頻譜。曲線(c)展示在應用 非線性函數之後的經擴展頻譜的一實例。在此情況下,接受可能出現在較高頻率中的假信 號。
[0143] 曲線(d)展示在頻譜反轉操作之後的頻譜。曲線(e)展示在單階段降取樣之後的 頻譜,其中以因子2降低取樣速率以獲得所要頻譜擴展信號。在此實例中,信號為頻譜反轉 形式且可用於以所述形式處理高帶信號S30的高帶編碼器A200的一實施方案中。
[0144] 由非線性函數計算器520產生的頻譜擴展信號的振幅可能會隨著頻率增加而明 顯下降。頻譜擴展器A402包括頻譜平化器540,其經配置以對經降取樣信號執行白化操作。 頻譜平化器540可經配置以執行固定白化操作或執行自適應白化操作。在自適應白化的一 特定實例中,頻譜平化器540包括:LPC分析模塊,其經配置以從經降取樣信號計算一組四 個濾波器係數;及四階分析濾波器,其經配置以根據所述係數來白化所述信號。頻譜擴展器 A400的其它實施方案包括其中頻譜平化器540在降取樣器530之前對頻譜擴展信號進行操 作的配置。
[0145] 高帶激勵產生器A300可經實施以將諧波擴展信號S160輸出為高帶激勵信號 S120。然而,在一些情況下,將諧波擴展信號用作高帶激勵可導致可聽偽影。語音的諧波 結構在高帶中通常沒有在低帶中明顯,且在高帶激勵信號中使用過多諧波結構可導致嗡嗡 聲。此偽影可在來自女性說話者的語音信號中尤為明顯。
[0146] 配置包括經配置以將諧波擴展信號S160與噪聲信號混合的高帶激勵產生器A300 的實施方案。如圖11中所示,高帶激勵產生器A302包括噪聲產生器480,其經配置以產生 隨機噪聲信號。在一實例中,噪聲產生器480經配置以產生單位方差白偽隨機噪聲信號,但 在其它實施中噪聲信號無需白化且可具有隨頻率變化的功率密度。可能需要噪聲產生器 480經配置以將噪聲信號輸出為確定性函數,使得其狀態可在解碼器處被複製。舉例來說, 噪聲產生器480可經配置以將噪聲信號輸出為相同幀內較早編碼的信息(例如窄帶濾波器 參數S40及/或經編碼窄帶激勵信號S50)的確定性函數。
[0147] 在與諧波擴展信號S160混合之前,由噪聲產生器480產生的隨機噪聲信號可經振 幅調製以具有時域包絡,所述時域包絡近似於窄帶信號S20、高帶信號S30、窄帶激勵信號 S80或諧波擴展信號S160的時間上的能量分布。如圖11中所示,高帶激勵產生器A302包 括組合器470,其經配置以根據由包絡計算器460計算出的時域包絡來振幅調製由噪聲產 生器480產生的噪聲信號。舉例來說,組合器470可被實施為乘法器,其經布置以根據由包 絡計算器460計算出的時域包絡來按比例調整噪聲產生器480的輸出,以產生經調製噪聲 信號S170。
[0148] 在高帶激勵產生器A302的一實施方案A304中(如圖13的框圖中所示),包絡計算 器460經布置以計算諧波擴展信號S160的包絡。在高帶激勵產生器A302的實施方案A306 中(如圖14的框圖中所示),包絡計算器460經布置以計算窄帶激勵信號S80的包絡。高 帶激勵產生器A302的另一實施方案可另外經配置以根據窄帶音高脈衝在時間上的位置將 噪聲添加到諧波擴展信號S160。
[0149] 包絡計算器460可經配置以將包絡計算執行為包括一系列子任務的任務。圖15展 示所述任務的一實例T100的流程圖。子任務T110計算其包絡待模型化的信號(例如,窄 帶激勵信號S80或諧波擴展信號S160)的幀的每一樣本的平方,以產生平方值的序列。子 任務T120對所述平方值序列執行平滑操作。在一實例中,子任務T120根據以下表達式將 一階IIR低通濾波器應用於所述序列 :
[0150] y (n) = ax (n) + (l_a) y (n_l), (1)
[0151] 其中X為濾波器輸入,y為濾波器輸出,n為時域索引,且a為具有在0. 5與1之間 的值的平滑係數。平滑係數的值可為固定的,或在一替代實施方案中,所述值根據輸入信號 中噪聲的指示可為自適應的,使得a在不存在噪聲時較接近1且在存在噪聲時較接近0. 5。 子任務T130將平方根函數應用於平滑化序列的每一樣本以產生時域包絡。
[0152] 包絡計算器460的此實施方案可經配置而以串行及/或並行方式來執行任務T100 的各個子任務。在任務T100的另外實施方案中,子任務T110可在經配置以選擇其包絡待 模型化的信號的所要頻率部分(例如3kHz到4kHz的範圍)的帶通操作之後進行。
[0153] 組合器490經配置以混合諧波擴展信號S160與經調製噪聲信號S170以產生高帶 激勵信號S120。組合器490的實施方案可經配置以(例如)將高帶激勵信號S120計算為 諧波擴展信號S160與經調製噪聲信號S170的和。組合器490的所述實施方案可經配置以 在求和之前通過將加權因子施加於諧波擴展信號S160及/或經調製噪聲信號S170來將高 帶激勵信號S120計算為經加權和。每一所述加權因子可根據一個或一個以上準則加以計 算且可為固定值或者替代地為以逐幀或逐子幀而計算出的自適應值。
[0154] 圖16展示組合器490的一實施方案492的框圖,其經配置以將高帶激勵信號S120 計算為諧波擴展信號S160與調製噪聲信號S170的經加權和。組合器492經配置以根據諧 波加權因子S180來對諧波擴展信號S160加權,根據噪聲加權因子S190來對調製噪聲信號 S170加權,及將高帶激勵信號S120輸出為經加權信號的和。在此實例中,組合器492包括 加權因子計算器550,其經配置以計算諧波加權因子S180及噪聲加權因子S190。
[0155] 加權因子計算器550可經配置以根據高帶激勵信號S120中諧波含量與噪聲含量 的所要比率來計算加權因子S180及S190。舉例來說,可能需要組合器492產生具有類似 於高帶信號S30的諧波能量與噪聲能量的比率的諧波能量與噪聲能量的比率的高帶激勵 信號S120。在加權因子計算器550的一些實施方案中,加權因子S180、S190根據關於窄帶 信號S20或窄帶殘餘信號的周期性的一個或一個以上參數(例如音高增益及/或語音模 式)而進行計算。加權因子計算器550的所述實施方案可經配置以對(例如)諧波加權因 子S180指派與音高增益成比例的值,及/或對用於無聲語音信號的噪聲加權因子S190指 派一值,所述值高於用於有聲語音信號的噪聲加權因子的值。
[0156] 在其它實施方案中,加權因子計算器550經配置以根據高帶信號S30的周期性量 度來計算諧波加權因子S180及/或噪聲加權因子S190的值。在一個所述實例中,加權因 子計算器550將諧波加權因子S180計算為用於當前幀或子幀的高帶信號S30的自相關係 數的最大值,其中自相關在包括一個音高滯後的延遲但不包括零樣本的延遲的搜索範圍內 執行。圖17展示具有η個樣本的長度的此搜索範圍的一實例,所述搜索範圍以一個音高滯 後的延遲為中心且具有不大於一個音高滯後的寬度。
[0157] 圖17還展示另一方法的實例,其中加權因子計算器550在若干階段中計算高帶信 號S30的周期性量度。在第一階段中,當前幀被分成許多子幀,且針對每一子幀單獨識別自 相關係數為最大值的延遲。如上所提及,自相關在包括一個音高滯後的延遲但不包括零樣 本的延遲的搜索範圍內執行。
[0158] 在第二階段中,延遲幀通過將對應的所識別的延遲應用於每一子幀,級聯所得子 幀以構造最佳延遲幀,且將諧波加權因子S180計算為在原始幀與最佳延遲幀之間的相關 係數而構造。在另一替代例中,加權因子計算器550將諧波加權因子S180計算為在第一階 段中針對每一子幀獲得的最大自相關係數的平均值。加權因子計算器550的實施方案還可 經配置以按比例調整相關係數及/或將其與另一值組合以計算諧波加權因子S180的值。
[0159] 在以其它方式指示在幀中存在周期性的情況下,可能需要加權因子計算器550來 計算高帶信號S30的周期性量度。舉例來說,加權因子計算器550可經配置以根據在當前幀 的周期性的另一指示(例如音高增益)與閾值之間的關係來計算高帶信號S30的周期性量 度。在一實例中,加權因子計算器550經配置以在幀的音高增益(例如,窄帶殘餘的自適應 碼簿增益)具有大於〇. 5 (或至少為0. 5)的值的情況下對高帶信號S30執行自相關操作。 在另一實例中,加權因子計算器550經配置以針對具有語音模式的特定狀態的幀(例如,有 聲信號)而對高帶信號S30執行自相關操作。在所述情形下,加權因子計算器550可經配 置以對具有語音模式的其它狀態及/或較低的音高增益值的幀指派默認加權因子。
[0160] 配置包括經配置以根據不同於周期性的特徵或除周期性之外的特徵來計算加權 因子的加權因子計算器550的其它實施方案。舉例來說,所述實施方案可經配置以對具有 較大音高滯後的語音信號的噪聲增益因子S190指派一值,所述值高於對具有較小音高滯 後的語音信號的噪聲增益因子指派的值。加權因子計算器550的另一此實施方案經配置以 根據在基礎頻率的倍數處的信號能量相對於在其它頻率分量處的信號能量的量度來確定 寬帶語音信號S10或高帶信號S30的諧波性量度。
[0161] 寬帶語音編碼器A100的一些實施方案經配置以基於本文中所描述的音高增益及 /或另一周期性或諧波性量度來輸出周期性或諧波性的指示(例如,指示幀為諧波還是非 諧波的一位旗標)。在一實例中,對應寬帶語音解碼器B100使用此指示以配置例如加權因 子計算的操作。在另一實例中,所述指示在編碼器及/或解碼器處用於計算語音模式參數 值。
[0162] 可能需要高帶激勵產生器A302產生高帶激勵信號S120,使得激勵信號的能量大 體上不受加權因子S180及S190的特定值的影響。在所述情形下,加權因子計算器550可 經配置以計算諧波加權因子S180或噪聲加權因子S190的值(或接收來自高帶編碼器A200 的存儲裝置或另一元件的所述值),且根據如下表達式得出另一加權因子值:
[0163] (W 諧波)+ (W 嘆聲)=1, (2)
[0164] 其中表示諧波加權因子5180,且1^^表示噪聲加權因子S190。或者,加權因子 計算器550可經配置以根據當前幀或子幀的周期性量度的值來選擇在多對加權因子S180、 S190中的一對應對,其中所述對經預先計算以滿足例如表達式(2)的恆定能量比。對於其 中觀察到表達式(2)的加權因子計算器550的一實施方案來說,諧波加權因子S180的典型 值在約0. 7到約1. 0的範圍內,且噪聲加權因子S190的典型值在約0. 1到約0. 7的範圍內。 加權因子計算器550的其它實施方案可經配置以根據表達式(2)的一版本而操作,所述版 本是根據在諧波擴展信號S160與調製噪聲信號S170之間的所要基線加權而修改得出。
[0165] 當將稀疏碼簿(其條目大多為零值)用於計算殘餘的經量化表示時,在經合成語 音信號中可能出現偽影。碼簿稀疏尤其會在以低位速率編碼窄帶信號時發生。由碼簿稀疏 引起的偽影通常在時間上為類周期性的,且大多發生在3kHz以上。因為人耳在較高頻率時 具有較佳時間解析度,所以這些偽影在高帶中可能更顯著。
[0166] 配置包括經配置以執行反稀疏濾波的高帶激勵產生器A300的實施方案。圖18展 示高帶激勵產生器A302的一實施方案A312的框圖,其包括反稀疏濾波器600,所述反稀疏 濾波器600經布置以濾波由逆量化器450產生的經去量化窄帶激勵信號。圖19展示高帶 激勵產生器A302的一實施方案A314的框圖,其包括反稀疏濾波器600,所述反稀疏濾波器 600經布置以濾波由頻譜擴展器A400產生的頻譜擴展信號。圖20展示高帶激勵產生器 A302的一實施方案A316的框圖,其包括反稀疏濾波器600,所述反稀疏濾波器600經布置 以濾波組合器490的輸出以產生高帶激勵信號S120。當然,還涵蓋且在本文中明確揭示將 實施方案A304及A306中的任一者的特徵與實施方案A312、A314及A316中的任一者的特 徵組合在一起的高帶激勵產生器A300的實施方案。反稀疏濾波器600還可布置於頻譜擴 展器A400內:舉例來說,在頻譜擴展器A402中的元件510、520、530及540的任一者之後。 明確注意到,反稀疏濾波器600還可與執行頻譜摺疊、頻譜轉化或諧波擴展的頻譜擴展器 A400的實施方案一起使用。
[0167] 反稀疏濾波器600可經配置以改變其輸入信號的相位。舉例來說,可能需要反稀 疏濾波器600經配置及布置以使得高帶激勵信號S120的相位在時間上被隨機化,或者被更 平均地分布。還可能需要反稀疏濾波器600的響應是頻譜上平坦的,使得經濾波的信號的 量值頻譜並未明顯改變。在一實例中,反稀疏濾波器600被實施為具有根據以下表達式的 傳遞函數的全通濾波器:
[0168] , -0.7 + z-4 0.6+ z-6 H(z)=-r·-τ- 1-0.7,--4 1 + 0.6.--° D (3)
[0169] 此濾波器的一作用在於可展開輸入信號的能量,使得其不再集中於較少樣本中。
[0170] 由碼簿稀疏性引起的偽影通常對於類噪聲信號更顯著,其中殘餘包括較少音高信 息,且對於背景噪聲中的語音也如此。在激勵具有長期結構的情況下,稀疏通常引起較少偽 影,且實際上相位修改可引起在有聲信號中的噪聲。因此,可能需要配置反稀疏濾波器600 以濾波無聲信號且使至少一些有聲信號在不發生改變的情況下通過。無聲信號的特徵在於 低音高增益(例如,經量化的窄帶自適應碼簿增益)及接近零或為正的頻譜傾斜(例如,經 量化的第一反射係數),所述頻譜傾斜指示頻譜包絡隨頻率增加為平坦或向上傾斜的。反稀 疏濾波器600的典型實施方案經配置以濾波無聲聲音(例如,如由頻譜傾斜的值所指示), 在音高增益低於閾值(或不大於閾值)時濾波有聲聲音,且否則使信號在不發生改變的情 況下通過。
[0171] 反稀疏濾波器600的其它實施方案包括兩個或兩個以上濾波器,所述濾波器經配 置以具有不同的最大相位修改角(例如,高達180度)。在所述情況下,反稀疏濾波器600 可經配置以根據音高增益(例如,經量化自適應碼簿或LTP增益)的值而在所述組成濾波 器中進行選擇,使得將較大的最大相位修改角用於具有較低音高增益值的幀。反稀疏濾波 器600的一實施方案還包括不同的組成濾波器,其經配置以在頻譜的或多或少的範圍內修 改相位,使得將經配置以在輸入信號的較寬頻率範圍內修改相位的濾波器用於具有較低音 高增益值的幀。
[0172] 對於經編碼語音信號的準確再現來說,可能需要在經合成寬帶語音信號S100的 高帶部分的電平與窄帶部分的電平之間的比率類似於在原始寬帶語音信號S10中的比率。 除了由高帶編碼參數S60a表示的頻譜包絡以外,高帶編碼器A200可經配置以通過指定時 間或增益包絡來表現高帶信號S30的特徵。如圖10中所示,高帶編碼器A202包括高帶增 益因子計算器A230,其經配置及布置以根據在高帶信號S30與經合成高帶信號S130之間的 關係(例如兩個信號在一幀或其某部分內的能量之間的差或比率)來計算一個或一個以上 增益因子。在高帶編碼器A202的其它實施方案中,高帶增益計算器A230可經同樣配置但 經替代布置以根據在高帶信號S30與窄帶激勵信號S80或高帶激勵信號S120之間的所述 時變關係來計算增益包絡。
[0173] 窄帶激勵信號S80的時間包絡與高帶信號S30的時間包絡可能為類似的。因此, 編碼基於高帶信號S30與窄帶激勵信號S80(或自其得出的信號,例如高帶激勵信號S120 或經合成高帶信號S130)之間的關係的增益包絡通常比編碼基於高帶信號S30的增益包絡 更有效。在一典型實施方案中,高帶編碼器A202經配置以輸出對於每一幀指定五個增益因 子的具有8到12位的經量化索引。
[0174] 高帶增益因子計算器A230可經配置以將增益因子計算執行為包括一個或一個以 上系列的子任務的任務。圖21展示所述任務的一實例T200的流程圖,所述任務根據高帶 信號S30與經合成高帶信號S130的相對能量來計算對應子幀的增益值。任務220a及220b 計算相應信號的對應子幀的能量。舉例來說,任務220a及220b可經配置以將所述能量計 算為相應子幀的樣本的平方的和。任務T230將子幀的增益因子計算為所述能量的比率的 平方根。在此實例中,任務T230將增益因子計算為在子幀內高帶信號S30的能量與經合成 高帶信號S130的能量的比率的平方根。
[0175] 可能需要高帶增益因子計算器A230經配置以根據開窗函數來計算子幀能量。圖 22展示增益因子計算任務T200的所述實施方案T210的流程圖。任務T215a將開窗函數應 用於高帶信號S30,且任務T215b將相同開窗函數應用於經合成高帶信號S130。任務220a 及220b的實施方案222a及222b計算相應窗口的能量,且任務T230將子幀的增益因子計 算為能量比率的平方根。
[0176] 可能需要應用覆蓋相鄰子幀的開窗函數。舉例來說,產生可以覆蓋相加方式應用 的增益因子的開窗函數可有助於減少或避免子幀之間的不連續性。在一實例中,高帶增益 因子計算器A230經配置以應用如圖23a中所示的梯形開窗函數,其中所述窗口重疊兩個相 鄰子幀的中每一者達1毫秒。圖23b展示將此開窗函數應用到20毫秒幀的五個子幀中的 每一者。高帶增益因子計算器A230的其它實施方案可經配置以應用具有不同重疊周期及/ 或可為對稱或不對稱的不同窗口形狀(例如矩形、漢明)的開窗函數。高帶增益因子計算 器A230的一實施方案還可能經配置以將不同開窗函數應用於一幀內的不同子幀,及/或一 幀也可能包括具有不同長度的子幀。
[0177] 在無限制的情況下,將以下值表示為特定實施方案的實例。雖然可使用任何其它 持續時間,但對於這些情況採用20毫秒的幀。對以7kHz取樣的高帶信號來說,每一幀均具 有140個樣本。如果將所述幀劃分為長度相等的五個子幀,則每一子幀將具有28個樣本,且 如圖23a中所示的窗口將為42個樣本寬。對於以8kHz取樣的高帶信號來說,每一幀均具 有160個樣本。如果將所述巾貞劃分為長度相等的五個子巾貞,則每一子巾貞將具有32個樣本, 且如圖23a中所示的窗口將為48個樣本寬。在其它實施方案中,可使用任何寬度的子幀, 且高帶增益計算器A230的一實施方案甚至可能經配置以針對一幀的每一樣本產生不同的 增益因子。
[0178] 圖24展示高帶解碼器B200的一實施方案B202的框圖。高帶解碼器B202包括高 帶激勵產生器B300,其經配置以基於窄帶激勵信號S80產生高帶激勵信號S120。視特定系 統設計選擇而定,高帶激勵產生器B300可根據如本文中所描述的高帶激勵產生器A300的 任一實施方案而加以實施。通常需要將高帶激勵產生器B300實施為與特定編碼系統的高 帶編碼器的高帶激勵產生器具有相同的響應。然而,因窄帶解碼器B110通常將執行經編碼 窄帶激勵信號S50的去量化,所以在大多數情況下,高帶激勵產生器B300可經實施以接收 來自窄帶解碼器B110的窄帶激勵信號S80,且無需包括經配置以去量化經編碼窄帶激勵信 號S50的逆量化器。窄帶解碼器B110還可能經實施以包括反稀疏濾波器600的一實例,所 述反稀疏濾波器600經布置以在經去量化窄帶激勵信號被輸入到窄帶合成濾波器(例如濾 波器330)之前對其進行濾波。
[0179] 逆量化器560經配置以對高帶濾波器參數S60a進行去量化(在此實例中,去量化 為一組LSF),且LSF到LP濾波器係數變換570經配置以將LSF變換為一組濾波器係數(例 如,如上文參看窄帶編碼器A122的逆量化器240及變換250所描述)。如上文所提及,在其 它實施方案中,可使用不同係數組(例如,倒頻譜係數)及/或係數表示(例如,ISP)。高 帶合成濾波器B200經配置以根據高帶激勵信號S120及所述組濾波器係數來產生經合成高 帶信號。對於其中高帶編碼器包括合成濾波器的系統來說(例如,如在上文所描述的編碼 器A202的實例中),可能需要將高帶合成濾波器B200實施為與所述合成濾波器具有相同響 應(例如,相同傳遞函數)。
[0180] 高帶解碼器B202還包括:逆量化器580,其經配置以去量化高帶增益因子S60b ; 及增益控制元件590 (例如,乘法器或放大器),其經配置及布置以將經去量化增益因子應 用於經合成高帶信號,以產生高帶信號S100。對其中幀的增益包絡由一個以上增益因子指 定的情況來說,增益控制元件590可包括邏輯,所述邏輯經配置以可能根據與由對應高帶 編碼器的增益計算器(例如,高帶增益計算器A230)所應用的開窗函數相同或不同的開窗 函數將增益因子應用於相應子幀。在高帶解碼器B202的其它實施方案中,增益控制元件 590經類似配置但經替代布置以將經經去量化增益因子應用於窄帶激勵信號S80或高帶激 勵信號S120。
[0181] 如上文所提及,可能需要在高帶編碼器及高帶解碼器中獲得相同狀態(例如,通 過在編碼期間使用經去量化值)。因此,在根據所述實施方案的編碼系統中,可能需要確保 在高帶激勵產生器A300及B300中的對應噪聲產生器的狀態相同。舉例來說,所述實施方 案的高帶激勵產生器A300及B300可經配置以使得噪聲產生器的狀態為已在相同幀內編碼 的信息(例如,窄帶濾波器參數S40或其一部分及/或經編碼窄帶激勵信號S50或其一部 分)的確定性函數。
[0182] 本文中所描述的元件的量化器中的一者或一者以上(例如,量化器230、420或 430)可經配置以執行經分類向量量化。舉例來說,所述量化器可經配置以基於已在窄帶信 道及/或高帶信道中的相同幀內編碼的信息來選擇一組碼簿中的一者。所述技術通常以犧 牲額外碼簿存儲為代價來提供增加的編碼效率。
[0183] 如上文參看(例如)圖8及圖9所論述,在將粗略頻譜包絡從窄帶語音信號S20 移除之後,相當數量的周期結構可仍保留於殘餘信號中。舉例來說,殘餘信號可含有時間上 的約略周期脈衝或峰值的序列。所述結構(其通常與音高相關)尤其可能出現於有聲語音 信號中。對窄帶殘餘信號的經量化表示的計算可包括根據由(例如)一個或一個以上碼簿 表示的長期周期性模型來編碼此音高結構。
[0184] 實際殘餘信號的音高結構可並非與周期性模型完全匹配。舉例來說,殘餘信號可 在音高脈衝的位置的規則性中包括小抖動,使得在幀中的連續音高脈衝之間的距離不完全 相等且所述結構並不非常規則。所述不規則性傾向於降低編碼效率。
[0185] 窄帶編碼器A120的一些實施方案可經配置以通過在量化之前或量化期間將自適 應時間彎曲應用於殘餘,或通過另外在經編碼激勵信號中包括自適應時間彎曲來執行音高 結構的規則化。舉例來說,所述編碼器可經配置以選擇或另外計算時間中彎曲的程度(例 如,根據一個或一個以上感知加權及/或誤差最小化準則),使得所得激勵信號最佳符合長 期周期性模型。音高結構的規則化由稱為鬆弛碼激勵線性預測(RCELP)編碼器的一子組 CELP編碼器而執行。
[0186] RCELP編碼器通常經配置以將時間彎曲執行為自適應時間移位。此時間移位可 為從負的若干毫秒到正的若干毫秒範圍內的延遲,且其通常平滑地變化以避免可聽不連續 性。在一些實施方案中,所述編碼器經配置以用分段形式來應用所述規則化,其中每一幀或 子幀由對應固定時間移位而彎曲。在其它實施方案中,編碼器經配置以將規則化應用為連 續彎曲函數,使得幀或子幀根據音高周線(還稱為音高軌線)而被彎曲。在一些情況下,編 碼器經配置以通過將移位應用於用於計算經編碼激勵信號的感知加權輸入信號而在經編 碼激勵信號中包括時間彎曲。
[0187] 編碼器計算經規則化及量化的經編碼激勵信號,且解碼器對經編碼激勵信號去量 化以獲得用於合成經解碼語音信號的激勵信號。因此,經解碼輸出信號展現與通過規則化 而包括於經編碼激勵信號中的變化的延遲相同的變化的延遲。通常,並無指定規則化量的 信息被傳輸到解碼器。
[0188] 規則化傾向於使殘餘信號更易於編碼,此改進來自長期預測器的編碼增益,且因 此提高整體編碼效率,而通常不產生偽影。可能需要對有聲幀執行規則化。舉例來說,窄帶 編碼器A124可經配置以移位具有長期結構的那些幀或子幀(例如有聲信號)。甚至可能 需要對包括音高脈衝能量的子幀執行規則化。RCELP編碼器的現有實施方案包括如電信行 業協會(TIA)IS-127中所描述的增強型可變速率編解碼器(EVRC),及第三代合作夥伴項目 2(3GPP2)可選模式聲碼器(SMV)。
[0189] 不幸的是,規則化可對其中高帶激勵是從經編碼窄帶激勵信號得到的寬帶語音編 碼器造成問題(例如包括寬帶語音編碼器A100及寬帶語音解碼器B100的系統)。由於其 從經時間彎曲的信號得到,所以高帶激勵信號通常將具有不同於原始高帶語音信號的時間 輪廓的時間輪廓。換句話說,高帶激勵信號將不再與原始高帶語音信號同步。
[0190] 在經彎曲高帶激勵信號與原始高帶語音信號之間的時間未對準可引起若干問題。 舉例來說,經彎曲的高帶激勵信號可不再為根據從原始高帶語音信號提取的濾波器參數而 配置的合成濾波器提供合適源激勵。結果,經合成高帶信號可含有降低經解碼寬帶語音信 號的感知質量的可聽偽影。
[0191] 時間未對準還可引起增益包絡編碼的無效率。如上文所提及,在窄帶激勵信號S80 的時間包絡與高帶信號S30的時間包絡之間可能存在相關性。通過根據在所述兩個時間包 絡之間的關係來編碼高帶信號的增益包絡,與直接編碼增益包絡相比,可實現編碼效率的 增加。然而,當經編碼窄帶激勵信號經規則化時,可減弱此相關性。在窄帶激勵信號S80與 高帶信號S30之間的時間未對準可導致在高帶增益因子S60b中出現波動,且編碼效率可下 降。
[0192] 配置包括寬帶語音編碼方法,其根據包括於對應經編碼窄帶激勵信號中的時間彎 曲來執行高帶語音信號的時間彎曲。所述方法的潛在優勢包括改進經解碼寬帶語音信號的 質量及/或改進編碼高帶增益包絡的效率。
[0193] 圖25展示寬帶語音編碼器A100的一實施方案AD10的框圖。編碼器AD10包括窄 帶編碼器A120的一實施方案A124,其經配置以在計算經編碼窄帶激勵信號S50期間執行規 則化。舉例來說,窄帶編碼器A124可根據上文論述的RCELP實施方案中的一者或一者以上 而被配置。
[0194] 窄帶編碼器A124還經配置以輸出指定所應用的時間彎曲程度的規則化數據信號 SD10。對其中窄帶編碼器A124經配置以將固定時間移位應用於每一幀或子幀的各種情況 來說,規則化數據信號SD10可包括一系列值,所述值將每一時間移位量指示為整數或非整 數值(在樣本、毫秒或一些其它時間增量方面)。對其中窄帶編碼器A124經配置以用其它 方式修改幀或樣本的其它序列的時間比例(例如,通過壓縮一部分且擴展另一部分)的情 況來說,規則化信息信號SD10可包括所述修改的對應描述,例如一組函數參數。在一特定 實例中,窄帶編碼器A124經配置以將一幀劃分為三個子幀且計算每一子幀的固定時間移 位,使得規則化數據信號SD10指示經編碼窄帶信號的每一規則化幀的三個時間移位量。
[0195] 寬帶語音編碼器AD10包括延遲線D120,其經配置以根據由輸入信號指示的延遲 量來推進或阻滯高帶語音信號S30的部分,以產生經時間彎曲的高帶語音信號S30a。在圖 25中所示的實例中,延遲線D120經配置以根據由規則化數據信號SD10指示的彎曲來對高 帶語音信號S30進行時間彎曲。以此方式,包括於經編碼窄帶激勵信號S50中的相同量的 時間彎曲也在分析之前被應用於高帶語音信號S30的對應部分。雖然此實例將延遲線D120 展示為與高帶編碼器A200分離的元件,但在其它實施方案中,延遲線D120經布置為高帶編 碼器的部分。
[0196] 高帶編碼器A200的另外實施方案可經配置以執行未彎曲高帶語音信號S30的頻 譜分析(例如,LPC分析),且在計算高帶增益參數S60b之前執行高帶語音信號S30的時間 彎曲。所述編碼器可包括(例如)經布置以執行時間彎曲的延遲線D120的實施方案。然 而,在所述情況下,基於未彎曲信號S30的分析的高帶濾波器參數S60a可描述與高帶激勵 信號S120在時間上未對準的頻譜包絡。
[0197] 可根據適於將所要時間彎曲操作應用於高帶語音信號S30的邏輯元件與存儲元 件的任何組合來配置延遲線D120。舉例來說,延遲線D120可經配置以根據所要時間移位從 緩衝器讀取高帶語音信號S30。圖26a展示包括移位寄存器SR1的延遲線D120的所述實 施方案D122的示意圖。移位寄存器SR1為具有某長度m的緩衝器,其經配置以接收且存儲 高帶語音信號S30的m個最近樣本。值m至少等於所支持的最大正(或"推進")與負(或 "阻滯")時間移位的和。使值m等於高帶信號S30的幀或子幀的長度可為方便的。
[0198] 延遲線D122經配置以從移位寄存器SR1的偏移位置0L輸出經時間彎曲的高帶信 號S30a。偏移位置0L的定位根據由(例如)規則化數據信號SD10所指示的當前時間移 位而圍繞參考定位(零時間移位)變化。延遲線D122可經配置以支持相等推進及阻滯限 制,或者另一選擇為一限制大於另一限制以使得可在一方向上執行的移位大於在另一方向 上執行的移位。圖26a展示所支持的正時間移位大於負時間移位的特定實例。延遲線D122 可經配置以一次輸出一個或一個以上樣本(例如,視輸出總線寬度而定)。
[0199] 具有多於若干毫秒的量值的規則化時間移位可在經解碼信號中導致可聽偽影。通 常,由窄帶編碼器A124執行的規則化時間移位的量值將不超過若干毫秒,使得由規則化數 據信號SD10指示的時間移位將受限制。然而,在所述情況下,可能需要配置延遲線D122以 對正及/或負方向上的時間移位施加最大限制(例如,以遵守比由窄帶編碼器所施加的限 制更苛刻的限制)。
[0200] 圖26b展示包括移位窗口 SW的延遲線D122的一實施方案D124的示意圖。在此 實例中,偏移位置0L的定位由移位窗口 SW所限制。雖然圖26b展示其中緩衝器長度m大 於移位窗口 SW的寬度的情況,但還可實施延遲線D124以使得移位窗口 SW的寬度等於m。
[0201] 在其它實施方案中,延遲線D120可經配置以根據所要時間移位將高帶語音信號 S30寫入到緩衝器。圖27展示延遲線D120的所述實施方案D130的示意圖,其包括經配置 以接收及存儲高帶語音信號S30的兩個移位寄存器SR2及SR3。延遲線D130經配置以根據 如由(例如)規則化數據信號SD10指示的時間移位,將幀或子幀從移位寄存器SR2寫入到 移位寄存器SR3。移位寄存器SR3經配置為經布置以輸出經時間彎曲高帶信號S30的FIFO 緩衝器。
[0202] 在圖27中展示的特定實例中,移位寄存器SR2包括幀緩衝器部分FBI及延遲緩衝 器部分DB,且移位寄存器SR3包括幀緩衝器部分FB2、推進緩衝器部分AB及阻滯緩衝器部 分RB。推進緩衝器AB與阻滯緩衝器RB的長度可相等,或一者可大於另一者,使得在一方向 上所支持的位移大於另一方向上所支持的移位。延遲緩衝器DB及阻滯緩衝器部分RB可經 配置以具有相同長度。或者,延遲緩衝器DB可比阻滯緩衝器RB更短,以計及用於將樣本從 幀緩衝器FBI傳送到移位寄存器SR3的時間間隔,其可包括其它處理操作(例如在將樣本 存儲到移位寄存器SR3之前,彎曲所述樣本)。
[0203] 在圖27的實例中,幀緩衝器FBI經配置以具有與高帶信號S30的一幀的長度相等 的長度。在另一實例中,幀緩衝器FBI經配置以具有與高帶信號S30的一子幀的長度相等的 長度。在所述情況下,延遲線D130可經配置以包括將相同(例如,平均)延遲應用於待移 位的幀的子幀的邏輯。延遲線D130還可包括對來自幀緩衝器FBI的值與待覆寫於阻滯緩 衝器RB或推進緩衝器AB中的值求平均的邏輯。在另一實例中,移位寄存器SR3可經配置 以僅經由幀緩衝器FBI接收高帶信號S30的值,且在所述情況下,延遲線D130可包括在寫 入到移位寄存器SR3的連續幀或子幀之間的間隙上進行內插的邏輯。在其它實施方案中, 延遲線D130可經配置以在將來自幀緩衝器FBI的樣本寫入到移位寄存器SR3之前對其執 行彎曲操作(例如,根據由規則化數據信號SD10描述的函數)。
[0204] 可能需要延遲線D120應用基於(但並非相同於)由規則化數據信號SD10所指定 的彎曲的時間彎曲。圖28展示寬帶語音編碼器AD10的一實施方案AD12的框圖,其包括延 遲值映射器D110。延遲值映射器D110經配置以將由規則化數據信號SD10所指示的彎曲映 射到經映射延遲值SDlOa中。延遲線D120經布置以根據由經映射延遲值SDlOa所指示的 彎曲來產生經時間彎曲的高帶語音信號S30a。
[0205] 可預期由窄帶編碼器應用的時間移位隨時間而平滑變化。因此,通常計算在語音 幀期間應用於子幀的平均窄帶時間移位,且根據此平均值來移位高帶語音信號S30的對應 幀就已足夠。在一所述實例中,延遲值映射器D110經配置以計算每一幀的子幀延遲值的平 均值,且延遲線D120經配置以將計算出的平均值應用於高帶信號S30的對應幀。在其它實 例中,可計算及應用在較短周期(例如兩個子幀或一幀的一半)或較長周期(例如兩個幀) 內的平均值。在其中平均值為樣本的非整數值的情況下,延遲值映射器D110可經配置以在 將所述值輸出到延遲線D120之前將其四捨五入為整數數目個樣本。
[0206] 窄帶編碼器A124可經配置以在經編碼窄帶激勵信號中包括非整數數目個樣本的 規則化時間移位。在此情況下,可能需要延遲值映射器D110經配置以將窄帶時間移位四舍 五入為整數數目個樣本,且可能需要延遲線D120將所述四捨五入的時間移位應用於高帶 語音信號S30。
[0207] 在寬帶語音編碼器AD10的一些實施方案中,窄帶語音信號S20的取樣速率與高帶 語音信號S30的取樣速率可不同。在所述情況下,延遲值映射器D110可經配置以調節在 規則化數據信號SD10中所指示的時間移位量,以計及在窄帶語音信號S20 (或窄帶激勵信 號S80)的取樣速率與高帶語音信號S30的取樣速率之間的差值。舉例來說,延遲值映射器 D110可經配置以根據取樣速率的比率來按比例調整時間移位量。在上文提及的一特定實例 中,窄帶語音信號S20以8kHz進行取樣,且高帶語音信號S30以7kHz進行取樣。在此情況 下,延遲值映射器D110經配置以將每一移位量乘以7/8。延遲值映射器D110的實施方案還 可經配置以執行所述按比例調整操作連同如本文中所描述的整數四捨五入及/或時間移 位平均運算。
[0208] 在另外的實施方案中,延遲線D120經配置以用其它方式修改幀或樣本的其它序 列的時間比例(例如,通過壓縮一部分且擴展另一部分)。舉例來說,窄帶編碼器A124可 經配置以根據例如音高周線或軌線的函數來執行規則化。在所述情況下,規則化數據信號 SD10可包括所述函數的對應描述(例如一組參數),且延遲線D120可包括經配置以根據 所述函數來彎曲高帶語音信號S30的幀或子幀的邏輯。在其它實施方案中,延遲值映射器 D110經配置以在函數由延遲線D120應用於高帶語音信號S30之前對所述函數求平均值、按 比例調整及/或四捨五入。舉例來說,延遲值映射器D110可經配置以根據所述函數計算一 個或一個以上延遲值,每一延遲值指示許多樣本,所述樣本接著由延遲線D120應用以對高 帶語音信號S30的一個或一個以上對應幀或子幀進行時間彎曲。
[0209] 圖29展示根據包括於對應編碼窄帶激勵信號中的時間彎曲來對高帶語音信號進 行時間彎曲的方法MD100的流程圖。任務TD100處理寬帶語音信號以獲得窄帶語音信號及 高帶語音信號。舉例來說,任務TD100可經配置以使用具有低通濾波器及高通濾波器的濾 波器組(例如濾波器組A110的一實施方案)來濾波寬帶語音信號。任務TD200將窄帶語音 信號編碼為至少一經編碼窄帶激勵信號及多個窄帶濾波器參數。經編碼窄帶激勵信號及/ 或濾波器參數可被量化,且經編碼窄帶語音信號還可包括其它參數(例如語音模式參數)。 任務TD200還包括經編碼窄帶激勵信號中的時間彎曲。
[0210] 任務TD300基於窄帶激勵信號產生高帶激勵信號。在此情況下,窄帶激勵信號基 於經編碼窄帶激勵信號。至少根據高帶激勵信號,任務TD400將高帶語音信號編碼為至少 多個高帶濾波器參數。舉例來說,任務TD400可經配置以將高帶語音信號編碼為多個經量 化LSF。任務TD500將時間移位應用於高帶語音信號,所述時間移位基於關於包括於編碼窄 帶激勵信號中的時間彎曲的信息。
[0211] 任務TD400可經配置以對高帶語音信號執行頻譜分析(例如LPC分析),及/或計 算高帶語音信號的增益包絡。在所述情況下,任務TD500可經配置以在分析及/或增益包 絡計算之前將時間移位應用於高帶語音信號。
[0212] 寬帶語音編碼器A100的其它實施方案經配置以反轉由包括於經編碼窄帶激勵信 號中的時間彎曲引起的高帶激勵信號S120的時間彎曲。舉例來說,高帶激勵產生器A300 可經實施以包括延遲線D120的一實施方案,其經配置以接收規則化數據信號SD10或經映 射延遲值SDlOa,且將對應的反轉時間移位應用於窄帶激勵信號S80及/或基於其的後續信 號(例如諧波擴展信號S160或高帶激勵信號S120)。
[0213] 另外的寬帶語音編碼器實施方案可經配置以將窄帶語音信號S20與高帶語音信 號S30彼此獨立地編碼,使得高帶語音信號S30被編碼為高帶頻譜包絡及高帶激勵信號的 表示。此實施方案可經配置以執行對高帶殘餘信號的時間彎曲,或另外根據關於包括於編 碼窄帶激勵信號中的時間彎曲的信息將時間彎曲包括於經編碼高帶激勵信號中。舉例來 說,高帶編碼器可包括如本文中所描述的延遲線D120及/或延遲值映射器D110的一實施 方案,所述延遲線D120及/或所述延遲值映射器D110經配置以將時間彎曲應用於高帶殘 餘信號。所述操作的潛在優勢包括更有效編碼高帶殘餘信號及使在經合成的窄帶語音信號 與高帶語音信號之間的匹配更佳。
[0214] 如上文所提及,如本文中所描述的配置包括可用於執行嵌入式編碼、支持與窄帶 系統的兼容性且避免需要碼變換的實施方案。對高帶編碼的支持還可用於基於成本而區分 具有帶有反向兼容性的寬帶支持的晶片、晶片組、裝置及/或網絡以及區分那些具有窄帶 支持的晶片、晶片組、裝置及/或網絡。如本文中所描述的對高帶編碼的支持還可結合用於 支持低帶編碼的技術而使用,且根據所述配置的系統、方法或設備可支持從(例如)約50Hz 或100Hz直到約7kHz或8kHz的頻率分量的編碼。
[0215] 如上文所提及,將高帶支持添加到語音編碼器可改進清晰度,尤其是關於摩擦音 的區別。雖然此區別通常可由人類收聽者從特定上下文得出,但高帶支持可充當語音辨識 及其它機器解譯應用(例如用於自動聲音菜單導航及/或自動呼叫處理的系統)的啟用特 徵。
[0216] 可將根據一配置的設備嵌入到用於無線通信的可攜式裝置(例如蜂窩式電話或 個人數字助理(PDA))中。或者,所述設備可包括於另一通信裝置(例如VoIP手持機、經配 置以支持VoIP通信的個人計算機或經配置以路由電話或VoIP通信的網絡裝置)中。舉例 來說,可將根據一配置的設備實施於用於通信裝置的晶片或晶片組中。視特定應用而定,所 述裝置還可包括以下特徵:例如語音信號的模擬-數字及/或數字-模擬轉換、對語音信號 執行放大及/或其它信號處理操作的電路及/或用於傳輸及/或接收經編碼語音信號的射 頻電路。
[0217] 明確涵蓋及揭示的是,配置可包括在美國臨時專利申請案第60/667, 901號及 60/673, 965號中所揭示的其它特徵中的任何一個或一個以上特徵及/或與其一起使用。所 述特徵包括移除發生於高帶中且大體上不存在於窄帶中的短持續時間的高能量突發。所述 特徵包括例如高帶LSF的係數表示的固定或自適應平滑化。所述特徵包括與例如LSF的系 數表示的量化相關聯的噪聲的固定或自適應成形。所述特徵還包括增益包絡的固定或自適 應平滑化,及增益包絡的自適應衰減。
[0218] 可將高帶激勵產生器A300及B300、高帶編碼器A100、高帶解碼器B200、寬帶語音 編碼器A100及寬帶語音解碼器B100的實施方案的各種元件實施為駐留於(例如)相同芯 片上或一晶片組中的兩個或兩個以上晶片中的電子及/或光學裝置,但還涵蓋不具有所述 限制的其它布置。可將所述設備的一個或一個以上元件整體或部分地實施為一個或一個以 上組的指令,所述指令經布置以在邏輯元件(例如,電晶體、柵極)的一個或一個以上固定 或可編程陣列上執行,例如,微處理器、嵌入式處理器、IP核心、數位訊號處理器、FPGA(現 場可編程門陣列)、ASSP(專用標準產品)及ASIC(專用集成電路)。一個或一個以上所 述元件還可能具有共同結構(例如,用於在不同時間執行對應於不同元件的碼部分的處理 器、經執行以在不同時間執行對應於不同元件的任務的一組指令或在不同時間執行用於不 同元件的操作的電子及/或光學裝置的布置)。而且,一個或一個以上所述元件可能用於執 行任務或執行不直接與設備有關的操作的其它組指令,例如與設備所嵌入於的裝置或系統 的另一操作有關的任務。
[0219] 圖30展示根據一配置的編碼具有窄帶部分及高帶部分的語音信號的高帶部分的 方法M100的流程圖。任務X100計算表現高帶部分的頻譜包絡的特徵的一組濾波器參數。任 務X200通過將非線性函數應用於從窄帶部分得到的信號來計算頻譜擴展信號。任務X300 根據(A)所述組濾波器參數及(B)基於頻譜擴展信號的高帶激勵信號來產生經合成高帶信 號。任務X400基於(C)在高帶部分的能量與(D)從窄帶部分得到的信號的能量之間的關 系來計算增益包絡。
[0220] 圖31a展示根據一配置產生高帶激勵信號的方法M200的流程圖。任務Y100通過 將非線性函數應用於從語音信號的窄帶部分得到的窄帶激勵信號來計算諧波擴展信號。任 務Y200將所述諧波擴展信號與經調製噪聲信號混合以產生高帶激勵信號。圖31b展示根據 包括任務Y300及Y400的另一配置來產生高帶激勵信號的方法M210的流程圖。任務Y300 根據窄帶激勵信號與諧波擴展信號中的一者隨時間變化的能量來計算時域包絡。任務Y400 根據所述時域包絡來調製噪聲信號以產生經調製噪聲信號。
[0221] 圖32展示根據一配置的解碼具有窄帶部分及高帶部分的語音信號的高帶部分的 方法M300的流程圖。任務Z100接收表現高帶部分的頻譜包絡的特徵的一組濾波器參數及 表現高帶部分的時間包絡的特徵的一組增益因子。任務Z200通過將非線性函數應用於從 窄帶部分得到的信號來計算頻譜擴展信號。任務Z300根據(A)所述組濾波器參數及(B) 基於頻譜擴展信號的高帶激勵信號來產生經合成高帶信號。任務Z400基於所述組增益因 子來調製經合成高帶信號的增益包絡。舉例來說,任務Z400可經配置以通過將所述組增益 因子應用於從窄帶部分得到的激勵信號、頻譜擴展信號、高帶激勵信號或經合成高帶信號 來調製經合成高帶信號的增益包絡。
[0222] 圖33說明碼分多址(CDMA)無線電話系統3300,其可包括多個移動臺3302、多個 基站3304、一基站控制器(BSC) 3306及一移動交換中心(MSC) 3308。MSC 3308可經配置以 與公共交換電話網絡(PSTN) 3310介接。MSC 3308還可經配置以與BSC 3306介接。在系統 3300中可存在一個以上BSC 3306。每一基站3304可包括至少一扇區(未圖示),其中每一 扇區可具有全向天線或指向徑向遠離基站3304的特定方向的天線。或者,每一扇區可包括 用於分集接收的兩個天線。每一基站3304可經設計以支持多個頻率指派。扇區與頻率指 派的相交可稱為CDMA信道。移動臺3302可包括蜂窩式或可攜式通信系統(PCS)電話。
[0223] 在蜂窩式電話系統3300的操作期間,基站3304可從若干組移動臺3302接收若干 組反向鏈路信號。移動臺3302可進行電話呼叫或其它通信。由給定基站3304接收的每 一反向鏈結信號可在所述基站3304中被處理。可將所得數據轉發到BSC 3306。BSC 3306 可提供呼叫資源分配及包括基站3304之間的軟越區切換的編配的移動性管理功能性。BSC 3306還可將所接收數據路由到MSC 3308,其提供用於與PSTN 3310介接的額外路由服務。 相似地,PSTN 3310可介接MSC 3308,且MSC 3308可介接BSC 3306, BSC 3306又可控制基 站3304以將若干組前向鏈結信號傳輸到若干組移動臺3302。
[0224] 圖34描繪信號傳輸環境3400,其包括編碼器3402、解碼器3404及傳輸媒體3406。 編碼器3402可實施於移動臺3302內或基站3304中。解碼器3404可實施於基站3304 中或移動臺3302中。編碼器3402可編碼語音信號s (η) 3410,從而形成經編碼語音信號 senc (η) 3412。經編碼語音信號3412可在傳輸媒體3406上傳輸到解碼器3404。解碼器3404 可解碼sen。(η) 3412,從而產生經合成語音信號S(n) 3416。
[0225] 如本文中所使用的術語"編碼"可通常指涵蓋編碼及解碼兩者的方法。通常,編碼 系統、方法及設備試圖在維持可接受語音再現(即,S(n) 3410 ~ S(n) 3416 )的同時最小 化經由傳輸媒體3406傳輸的位數目(即,最小化sene(n)3412的帶寬)。設備可為移動電 話、個人數字助理(PDA)、膝上型計算機、數位相機、音樂播放器、遊戲裝置、基站或具有處理 器的任何其它裝置。經編碼語音信號3412的組成可根據由所述編碼器3402所利用的特定 語音編碼模式而改變。下文描述各種編碼模式。
[0226] 可將下文描述的編碼器3402及解碼器3404的組件實施為電子硬體、計算機軟體 或所述兩者的組合。在下文中就其功能性而描述所述組件。將功能性實施為硬體或軟體可 視特定應用及施加於整個系統的設計約束而定。傳輸媒體3406可表示許多不同傳輸媒體, 包括(但不限於):基於陸地通信線、基站與衛星之間的鏈路、蜂窩式電話與基站之間,或在 蜂窩式電話與衛星之間的無線通信。
[0227] 通信的每一方可傳輸數據以及接收數據。每一方可利用編碼器3402及解碼器 3404。然而,在下文中將信號傳輸環境3400描述為包括在傳輸媒體3406的一端處的編碼 器3402及在另一端處的解碼器3404。
[0228] 出於此描述的目的,s (η) 3410可包括在包括不同有聲聲音及靜默周期的典型對話 期間獲得的數字語音信號。可將語音信號s (η) 3410分割為幀,且可將每一幀進一步分割為 子幀。所述任意選擇的幀/子幀邊界可在執行一些塊處理的情況下得以使用。描述為對幀 執行的操作還可對子幀執行,在此意義上,本文中可將幀與子幀互換使用。然而,如果實施 連續處理而非塊處理,則不可將s (η) 3410分割為幀/子幀。因而,可將下文描述的塊技術 擴展到連續處理。
[0229] 可將編碼器3402實施為窄帶(ΝΒ)編碼器或寬帶(WB)編碼器。ΝΒ編碼器可數字 取樣在8kHz處的信號s (η) 3410及存在於50Hz到4kHz的帶寬中的編碼信號信息。ΝΒ編碼 器的一實例可包括增強型可變速率編碼器(EVRC-B)。WB編碼器可數字取樣在16kHz處的 信號s (η) 3410及存在於NB編碼器帶寬加上在4kHz到8kHz的範圍之間的碼信息。WB編碼 器的一實例可包括EVRC-WB編碼器。在一方面中,EVRC-WB為EVRC-B的寬帶擴展。從信號 s (η) 3410分割的每一幀可包括20毫秒(ms)的數據或160個樣本。每一子幀可包括53個 或54個數據樣本。雖然這些參數可適合於語音編碼,但其僅為實例,且可使用其它合適替 代參數。
[0230] 如果將編碼器3402實施為NB編碼器,則可將幀封裝為窄帶包3418。窄帶包3418 可包括窄帶識別符3422。識別符3422可對解碼器3404指示窄帶包3418是使用NB編碼 器而編碼的。如果將編碼器3402實施為WB編碼器,則可將幀封裝為寬帶包3420。寬帶包 3420可包括寬帶識別符3424。識別符3424可對解碼器3404指示寬帶包3420是使用WB 編碼器而編碼的。解碼器3404可包括包識別模塊3414,其可辨識識別符3422或3424且確 定應實施NB解碼器還是WB解碼器來解碼包3418或3420。
[0231] 圖35為說明用於在與語音信號相關聯的包中包括識別符的方法3500的一配置的 流程圖。在一方面中,識別符可指示包是由NB編碼器還是WB編碼器而編碼的。可由例如 編碼器3402的編碼器實施方法3500。
[0232] 可由編碼器3402接收3502信號。在一方面中,所述信號為一種類型的語音信號。 信號可經分析且分割3504為多個幀。使用特定編碼方案(例如,CELP、PPP、NELP)可將信號 的經分割幀以半速率進行編碼3506。在一方面中,可將包編碼為具有80位。術語"半速率" 可用於表示具有80位的包。確定3508幀是否為包括80位的寬帶半速率幀。換句話說,確 定3508編碼器3402是否用作WB編碼器且將幀編碼為寬帶半速率(WB-HR)幀。如果幀為 WB-HR幀,則可將寬帶識別符封裝3510到包中。在一方面中,寬帶識別符包括以二進位形式 的十進位數字" 126"及" 127"的前六位。十進位數字" 126"的二進位形式為" 1111110",且 "127"的二進位形式為"1111111"。因而,寬帶識別符可包括六個1的串(例如,"111111")。
[0233] 如果在3508中確定幀並非WB-HR幀,則可將窄帶識別符封裝3512到包中。在一 方面中,窄帶識別符可與延遲參數相關聯。舉例來說,用於表示延遲參數的位還可用作窄帶 識別符。可傳輸3514包。在一方面中,將包傳輸3514到解碼器。
[0234] 圖36為說明解碼包的方法3600的一配置的流程圖。可由解碼器3404實施方法 3600。在一方面中,接收3602半速率包。可分析3604包括於半速率包中的識別符。所述 識別符可指示半速率包是由WB編碼器還是NB編碼器而編碼的。在一方面中,所述識別符 為是無效/非法滯後的特殊包識別符(ID)。確定3606包是否為基於對識別符的分析的 WB-HR包。如果包為WB-HR包,則使用寬帶解碼方案來解碼3608所述包。在一配置中,解碼 器3404用作WB解碼器。然而,如果確定3606所述包並非WB-HR,則可使用窄帶解碼方案 來解碼3610所述包。解碼器3404可用作NB解碼器。可從一個或一個以上經解碼包重構 3612信號。
[0235] 圖37為說明在通信信道3706上與多模式解碼器3704進行通信的多模式編碼器 3702的一配置的框圖。通信信道3706可包括射頻(RF)接口。編碼器3702可包括相關聯 解碼器(未圖示)。編碼器3702及其相關聯解碼器可形成第一語音編碼器。解碼器3704 可包括相關聯編碼器(未圖示)。解碼器3704及其相關聯編碼器可形成第二語音編碼器。
[0236] 編碼器3702可包括一初始參數計算模塊3718、一速率確定模塊3720、一模式分類 模塊3722、多個編碼模式3724、3726、3728及一包格式化模塊3730。包格式化模塊3730可 插入包識別符3708。編碼模式3724、3726、3728的數目被展示為N,其可表示編碼模式3724、 3726、3728的任何數目。出於簡明性目的,展示三個編碼模式3724、3726、3728,其中虛線指 不其它編碼模式的存在。
[0237] 解碼器3704可包括一包分解器模塊3732、多個解碼模式3734、3736、3738及一後 濾波器3740。包分解器模塊3732可包括包識別模塊3714。解碼模式3734、3736、3738的 數目被展示為N,其可表示解碼模式3734、3736、3738的任何數目。出於簡明性目的,展示三 個解碼模式3734、3736、3738,其中虛線指示其它解碼模式的存在。
[0238] 可將語音信號s (η) 3710提供到初始參數計算模塊3718。可將語音信號3710劃分 為稱為幀的樣本塊。值η可表示幀數目,或值η可表示一幀中的樣本數目。在一替代配置 中,可替代語音信號3710使用線性預測(LP)殘餘誤差信號。LP殘餘誤差信號可由例如碼 激勵線性預測(CELP)編碼器等語音編碼器使用。
[0239] 初始參數計算模塊3718可基於當前幀得出各種參數。在一方面中,這些參數包括 以下參數中的至少一者:線性預測編碼(LPC)濾波器係數、線頻譜對(LSP)係數、規範化自 相關函數(NACF)、開環滯後、零交叉速率、帶能量及共振峰殘餘信號。
[0240] 初始參數計算模塊3718可耦合到模式分類模塊3722。模式分類模塊3722可在編 碼模式3724、3726、3728之間動態切換。初始參數計算模塊3718可將參數提供到模式分類 模塊3722。模式分類模塊3722可耦合到速率確定模塊3720。速率確定模塊3720可接收 速率命令信號。速率命令信號可引導編碼器3702以特定速率編碼語音信號3710。在一方 面中,特定速率包括可指示將使用一百七十一位來編碼語音信號3710的全速率。在另一實 例中,特定速率包括可指示將使用八十位來編碼語音信號3710的半速率。在另一實例中, 特定速率包括可指示將使用十六位來編碼語音信號3710的八分之一速率。
[0241] 如先前所陳述,模式分類模塊3722可經耦合而以逐幀為基礎在編碼模式3724、 3726、3728之間動態切換,以便選擇用於當前幀的最適合編碼模式3724、3726、3728。模式 分類模塊3722可通過將參數與預定義閾值及/或最高值比較來選擇用於當前幀的特定 編碼模式3724、3726、3728。此外,模式分類模塊3722可基於從速率確定模塊3720接收 的速率命令信號來選擇特定編碼模式3724、3726、3728。舉例來說,編碼模式A 3724可使 用一百七十一位來編碼語音信號3710,而編碼模式B 3726可使用八十位來編碼語音信號 3710。
[0242] 基於幀的能量含量,模式分類模塊3722可將幀分類為非語音或無效語音(例如, 靜默、背景噪聲或言語之間的停頓),或語音。基於幀的周期性,模式分類模塊3722可將語 音幀分類為特定類型的語音,例如有聲、無聲或過渡。
[0243] 有聲語音可包括展現相對高程度的周期性的語音且可包括元音聲。音高周期可為 可用於分析且重構幀的內容的語音幀的分量。無聲語音可包括輔音聲。過渡語音幀可包括 在有聲語音與無聲語音之間的過渡。可將並非被分類為有聲語音或無聲語音的幀分類為過 渡語音。
[0244] 語音模式(還稱為發聲模式)指示當前幀表示有聲語音還是無聲語音。此參數可 具有二進位值,所述值基於幀的周期性(例如零交叉、NACF、音高增益)及/或話音有效性 的一個或一個以上量度,例如所述量度與閾值之間的關係。在其它實施方案中,語音模式參 數具有用以指示例如靜默或背景噪聲,或靜默與有聲語音之間的過渡的模式的一個或一個 以上其它狀態。
[0245] 分類語音幀可允許使用不同編碼模式3724、3726、3728來編碼不同類型的語音, 從而導致在共享信道(例如通信信道3706)中更有效使用帶寬。舉例來說,因為有聲語音 為周期的且因此預測性高,所以低位速率、高預測性編碼模式3724、3726、3728可用於編碼 有聲語音。
[0246] 模式分類模塊3722可基於幀的分類來選擇用於當前幀的編碼模式3724、3726、 3728。可並聯耦合多種編碼模式3724、3726、3728。編碼模式3724、3726、3728中的一個或 一個以上模式可在任何給定時間操作。在一配置中,根據當前幀的分類來選擇一個編碼模 式 3724、3726、3728。
[0247] 不同編碼模式3724、3726、3728可根據不同編碼位速率、不同編碼方案或編碼位 速率與編碼方案的不同組合來操作。如先前所陳述,使用的各種編碼率可為全速率、半速 率、四分之一速率及/或八分之一速率。使用的各種編碼方案可為CELP編碼、原型音高周 期(PPP)編碼(或波形內插(WI)編碼)及/或噪聲激勵線性預測(NELP)編碼。因此,舉 例來說,特定編碼模式3724、3726、3728可為全速率CELP ;另一編碼模式3724、3726、3728 可為半速率CELP ;另一編碼模式3724、3726、3728可為全速率PPP ;且另一編碼模式3724、 3726、3728 可為 NELP。
[0248] 根據CELP編碼模式3724、3726、3728,可利用經量化版本的LP殘餘信號來激勵線 性預測聲道模型。在CELP編碼模式中,可量化整個當前幀。CELP編碼模式3724、3726、3728 可提供相對準確的語音再現,但是以相對高編碼位速率為代價。CELP編碼模式3724、3726、 3728可用於編碼分類為過渡語音的幀。
[0249] 根據NELP編碼模式3724、3726、3728,經濾波的偽隨機噪聲信號可用於模型化LP 殘餘信號。NELP編碼模式3724、3726、3728可為實現低位速率的相對簡單的技術。NELP編 碼模式3724、3726、3728可用於編碼分類為無聲語音的幀。
[0250] 根據PPP編碼模式3724、3726、3728,可編碼每一幀內的一子組音高周期。可通過 在所述原型周期之間內插而重構語音信號的剩餘周期。在ppp編碼的時域實施方案中,可 計算描述如何修改先前原型周期以近似於當前原型周期的第一組參數。可選擇一個或一 個以上碼向量,所述碼向量在相加時近似於在當前原型周期與經修改先前原型周期之間的 差。第二組參數描述所述經選擇碼向量。在PPP編碼的頻域實施方案中,一組參數可經計 算以描述原型的振幅及相位頻譜。根據PPP編碼的實施方案,解碼器3704可通過基於描述 振幅及相位的所述組參數而重構當前原型來合成輸出語音信號3716。過去的原型周期可 用作當前原型周期的振幅及/或相位的預測。可在當前重構原型周期與先前重構原型周期 之間的區域內內插語音信號。原型可包括當前幀的一部分,利用來自先前幀的類似定位於 幀內的原型而對所述部分線性內插,以便在解碼器3704處重構語音信號3710或LP殘餘信 號。
[0251] 編碼原型周期而非整個語音幀可降低編碼位速率。可利用PPP編碼模式3724、 3726、3728來編碼分類為有聲語音的幀。通過採用有聲語音的周期性,PPP編碼模式3724、 3726、3728可實現低於CELP編碼模式3724、3726、3728的位速率。
[0252] 經選擇編碼模式3724、3726、3728可耦合到包格式化模塊3730。經選擇編碼模式 3724、3726、3728可編碼或量化當前幀且將經量化幀參數3712提供到包格式化模塊3730。 包格式化模塊3730可將經量化幀參數3712彙編到經格式化包3713中。包格式化模塊3730 可將包格式化為寬帶包或窄帶包。包識別符3708可包括於所述包中。如先前所解釋,包識 別符3708可對解碼器3704指示包為寬帶包還是為窄帶包。包格式化模塊3730可經由通 信信道3706將經格式化包3713提供到接收器(未圖示)。接收器可接收、解調製及數位化 經格式化包3713,且將包3713提供到解碼器3704。
[0253] 在解碼器3704中,包分解器模塊3732接收來自接收器的包3713。包分解器模塊 3732可將包3713拆包,且包識別模塊3714可辨識包括於包3713中的包識別符3708。包 識別模塊3714可發現包3713為WB-HR包或窄帶半速率包。包分解器模塊3732還可經配置 而以逐包為基礎在解碼模式3734、3736、3738之間動態切換。解碼模式3734、3736、3738的 數目可與編碼模式3724、3726、3728的數目相同。每一編號的編碼模式3724、3726、3728可 與經配置以使用相同編碼位速率及編碼方案的相應類似編號的解碼模式3734、3736、3738 相關聯。
[0254] 如果包分解器模塊3732檢測到包3713,則包3713被分解且提供到相關解碼模式 3734、3736、3738。相關解碼模式3734、3736、3738可基於對包識別符3708的分析來實施 寬帶或窄帶解碼技術。如果包分解器模塊3732未檢測到包,則宣告包丟失,且擦除解碼器 (未圖示)可執行幀擦除處理。解碼模式3734、3736、3738的並聯陣列可耦合到後濾波器 3740。相關解碼模式3734、3736、3738可解碼(或去量化)包3713且將信息提供到後濾波 器3740。後濾波器3740可重構(或合成)語音幀,從而輸出經合成語音幀§(n) 3716。
[0255] 在一配置中,並不傳輸經量化參數本身。替代地,傳輸在解碼器3704中指定在各 種查找表(LUT)(未圖示)中的地址的碼簿索引。解碼器3704可接收碼簿索引且搜索各種 碼簿LUT以得到合適參數值。因此,可傳輸參數(例如音高滯後、自適應碼簿增益及LSP) 的碼簿索引,且可由解碼器3704搜索三個相關聯碼簿LUT。
[0256] 根據CELP編碼模式,可傳輸音高滯後、音高增益、碼簿參數及LSP參數。因為可在 解碼器3704處合成LP殘餘信號,所以傳輸LSP碼簿索引。此外,可傳輸當前幀的音高滯後 值與前一幀的音高滯後值之間的差。
[0257] 根據其中將在解碼器3704處合成語音信號3710的PPP編碼模式,傳輸音高滯後、 振幅及相位參數。由PPP語音編碼技術使用的較低位速率可能不允許傳輸絕對音高滯後信 息及相對音高滯後差值兩者。
[0258] 根據一實例,用低位速率PPP編碼模式來傳輸例如有聲語音幀的高周期性幀,所 述低位速率PPP編碼模式量化用於傳輸的當前幀的音高滯後值與前一幀的音高滯後值之 間的差,且不量化用於傳輸的當前幀的絕對音高滯後值。因為有聲幀是高周期性的,所以傳 輸與絕對音高滯後值相對照的差值可允許實現較低編碼位速率。在一方面中,一般化此量 化以使得計算出先前幀的參數值的經加權和,其中權重的和為1,且從當前幀的參數值減去 所述經加權和。可接著量化所述差。
[0259] 圖38為說明可變速率語音編碼方法3800的一實例的流程圖。在一方面中,由單 個移動臺3302來實施方法3800,所述單個移動臺3302可能夠將包編碼為寬帶包或窄帶包。 在其它方面中,可由一個以上移動臺3302來實施方法3800。換句話說,一移動臺3302可包 括用以編碼寬帶包或窄帶包的編碼器,而單獨的移動臺3302可包括用以使用寬帶或窄帶 解碼技術來解碼包的解碼器。可計算3802當前幀的初始參數。在一配置中,初始參數計算 模塊3718計算3802所述參數。參數可包括以下參數中的一者或一者以上:線性預測編碼 (LPC)濾波器係數、線頻譜對(LSP)係數、規範化自相關函數(NACF)、開環滯後、帶能量、零 交叉速率及共振峰殘餘信號。
[0260] 可將當前幀分類3804為有效或無效。在一配置中,分類模塊3722將當前幀分類 為包括"有效"語音或"無效"語音。如上文所描述,s(n)3710可包括語音周期及靜默周期。 有效語音可包括有聲話語,而無效語音可包括背景噪聲、靜默、停頓等。
[0261] 確定3806將當前幀分類為有效的或是無效的。如果將當前幀分類為有效的,則進 一步將有效語音分類3808為有聲、無聲或過渡幀。可以許多不同方式分類人類語音。語音 的兩種分類可包括有聲聲音及無聲聲音。可將並非有聲或無聲的語音分類為過渡語音。
[0262] 基於在步驟3806及3808中進行的幀分類,可選擇3810編碼器/解碼器模式。如 圖37中所示,可並聯連接多種編碼器/解碼器模式。不同編碼器/解碼器模式根據不同編 碼方案來操作。某些模式可在語音信號s (η) 3710的展現某些特性的編碼部分處更為有效。
[0263] 如先前所解釋,CELP模式可經選擇以編碼分類為過渡語音的幀。ΡΡΡ模式可經選 擇以編碼分類為有聲語音的幀。NELP模式可經選擇以編碼分類為無聲語音的幀。相同編碼 技術可頻繁地以不同位速率操作,並具有不同性能水平。在圖37中的不同編碼器/解碼器 模式可表示不同編碼技術,或以不同位速率操作的相同編碼技術,或以上的組合。
[0264] 所選擇的編碼模式可編碼3812當前幀且根據位速率將經編碼幀格式化3814到包 中。包識別符可包括3816於所述包中。包識別符可指示所述包被編碼為寬帶包還是窄帶 包。可將包發送3818到解碼器。
[0265] 圖39為說明規則窄帶半速率包3902及寬帶半速率包3904的一配置的框圖。在一 方面中,每一包可包括包識別符,例如包識別符A 3906及包識別符B 3907。包識別符A3906 可包括合法滯後值3908,且包識別符B 3907可包括非法滯後值3914。非法滯後值3914可 為對解碼器指示某包為寬帶半速率包3904或特殊窄帶半速率包的值。合法滯後值可對解 碼器指示某包是否為規則(非特殊)窄帶半速率CELP包3902。在其它配置中,合法滯後值 可對解碼器指示某包是否為包括範圍[0:100]內的音高滯後值的任何其它半速率包。範圍 [0:100]內的音高滯後值僅用作實例。本系統及方法可應用於具有一組有效值(與特定編 碼方案相關聯)及另一組非法/無效值的給定N位欄位。
[0266] 在一配置中,規則窄帶半速率包3902利用包括於包3902中的80個位中的每一 位。因而,延遲參數可用於存儲合法滯後值3908,其可對解碼器指示傳入包為規則(非特 殊)窄帶半速率CELP。在一方面中,延遲參數包括7個位。延遲參數可並非十進位數字 "101"與"127"之間的值3910。在此7位欄位中的合法(有效)滯後值可為十進位數字 "0"與"100"之間的值3910。"0"與"100"之間的值3910可以其二進位形式(例如,7位 二進位數)包括於規則(非特殊)窄帶半速率CELP包3902中。
[0267] 在一方面中,寬帶編碼器實施NELP編碼方案以編碼無聲聲音。可將無聲聲音的信 號在寬帶半速率包3904中封裝為具有80個位的包。然而,具有無聲聲音的包可不包括延 遲。在一配置中,因為可能在無延遲的情況下實現無聲聲音的信號的可接受再現,所以編碼 器可不分析無聲聲音的延遲。寬帶半速率包3904可利用80個位中的74個位,留下6個 位未使用。與寬帶半速率包3904相關聯的包識別符B 3907可包括六個1的串3912(即, "111111")。在一配置中,此可映射為十進位數字"126"及"127"(以7位),且可被保留作 為寬帶半速率包3904的識別符。
[0268] 在一配置中,可利用來自N位參數的至少兩個非法值。如果使用兩個非法值,則一 來自N位參數的位可經釋放以載送信息。在另一配置中,來自N位參數的可經釋放以載送 信息的位的數目可等於l〇g 2 (X),其中X為從N位參數提供的非法值數目。舉例來說,八個 非法值可釋放三個位以載送其它信息。
[0269] 圖40為說明分配到各種類型的包的位的數目的表4000。表4000包括多個參 數4002。在所述多個參數4002中的每一參數可利用某一數目的位。在表4000中說明的 各種包類型可已利用先前論述的各種編碼模式中的一者加以編碼。包類型可包括:全速 率 CELP (FCELP) 4004、半速率 CELP (HCELP) 4006、特殊半速率 CELP (SPLHCELP) 4008、全速率 PPP (FPPP) 4010、特殊半速率 PPP (SPLHPPP) 4012、四分之一速率 PPP (QPPP) 4014、特殊半速 率 NELP (SPLHNELP) 4016、四分之一速率 NELP (QNELP) 4018 及靜默編碼器 4020。
[0270] FCELP 4004及FPPP 4010可為具有總計171個位的包。FCELP 4004包可轉換為 SPLHCELP 4008包。在一方面中,FCELP 4004包針對例如固定碼簿索引(FCB索引)及固定 碼簿增益(FCB增益)的參數分配位。如圖所示,當FCELP 4004包轉換為SPLHCELP 4008 包時,針對例如FCB索引、FCB增益及Λ滯後的參數分配零位。換句話說,在無所述位的情 況下將SPLHCELP 4008包傳輸到解碼器。SPLHCELP 4008包包括針對例如線頻譜對(LSP)、 自適應碼簿(ACB)增益、特殊半速率識別(ID)、特殊包ID、音高滯後及模式位信息的參數分 配的位。傳輸到解碼器的位的總數可從171減少到80。
[0271] 類似地,FPPP 4010包可轉換為SPLHPPP 4012包。如圖所示,FPPP 4010包將位 分配到帶對準參數。FPPP 4010包可轉換為SPLHPPP 4012包。可廢棄分配到帶對準的位。 換句話說,在無所述位的情況下將SPLHPPP 4012包傳輸到解碼器。傳輸到解碼器的位的總 數可從171減少到80。在一配置中,分配到振幅及全域對準參數的位包括於SPLHPPP 4012 包中。振幅參數可指示信號s (η) 3710的頻譜的振幅和全域對準參數,且可表示可確保最大 程度對準的線性相移。
[0272] 此外,各種類型的包可包括分配到滯後/特殊包ID參數的位。滯後/特殊包ID 參數可表示使解碼器辨識出特定包是使用窄帶編碼技術還是寬帶編碼技術而編碼的包識 別符。
[0273] 本文中的各種配置被說明為具有用於不同參數及包的不同數目的位。與每一參數 相關聯的特定數目的位在本文中是以實例說明的,且並非意味著限制性的。參數可包括比 本文中所使用的實例更多或更少的位。
[0274] 圖41說明可在根據一配置的通信裝置4108中利用的各種組件。通信裝置4108 可包括處理器4102,其控制裝置4108的操作。處理器4102還可稱為CPU。可包括只讀存 儲器(ROM)及隨機存取存儲器(RAM)兩者的存儲器4104將指令及數據提供到處理器4102。 存儲器4104的一部分還可包括非易失性隨機存取存儲器(NVRAM)。
[0275] 通信裝置4108還可包括外殼4122,其含有傳輸器4110及接收器4112,以允許數 據在接入終端4108與遠程地點之間的傳輸及接收。可將傳輸器4110及接收器4112組合 為收發器4120。天線4118附接到外殼4122且電耦合到收發器4120。
[0276] 通信裝置4108還包括信號檢測器4106,其用於檢測且量化由收發器4120接收的 信號電平。信號檢測器4106檢測例如總能量、每偽噪聲(PN)碼片的導頻能量、功率譜密度 的信號及其它信號。
[0277] 通信裝置4108的狀態改變器4114基於當前狀態及由收發器4120所接收且由信 號檢測器4106所檢測的額外信號來控制通信裝置4108的狀態。裝置4108可能能夠以許 多狀態中的任一狀態操作。
[0278] 通信裝置4108還包括系統確定器4124,所述系統確定器4124用於控制裝置 4108,且在其確定當前服務提供者系統不合適時確定裝置4108應轉移到的服務提供者系 統。
[0279] 由總線系統4118將通信裝置4108的各種組件耦合在一起,所述總線系統4118除 數據總線之外還可包括電源總線、控制信號總線及狀態信號總線。然而,為了清晰起見,所 述各種總線在圖41中被說明為總線系統4118。通信裝置4108還可包括數位訊號處理器 (DSP) 4116以用於處理信號。
[0280] 可使用多種不同技術中的任何技術來表示信息及信號。舉例來說,在以上描述中 可參考的數據、指令、命令、信息、信號、位、符號及碼片可由電壓、電流、電磁波、磁場或磁粒 子、光場或光學粒子或其任何組合來表示。
[0281] 可將結合本文中所揭示的配置而描述的各種說明性邏輯塊、模塊、電路及算法步 驟實施為電子硬體、計算機軟體或所述兩者的組合。為清楚說明硬體與軟體的所述互換性, 已就其功能性在上文中大體描述了各種說明性組件、塊、模塊、電路及步驟。將所述功能性 實施為硬體還是軟體視特定應用及施加於整個系統的設計約束而定。所屬領域的技術人員 可針對每一特定應用以不同方式實施所描述功能性,但不應將所述實施方案決策解釋為導 致脫離本系統和方法的範圍。
[0282] 結合本文中所揭示的配置描述的各種說明性邏輯塊、模塊及電路可用通用處理 器、數位訊號處理器(DSP)、專用集成電路(ASIC)、現場可編程門陣列(FPGA)或其它可編程 邏輯裝置、離散門或電晶體邏輯、離散硬體組件或其經設計以執行本文中所描述的功能的 任何組合來實施或執行。通用處理器可為微處理器,但在替代例中,所述處理器可為任何處 理器、控制器、微控制器或狀態機。處理器還可實施為計算裝置的組合,例如DSP與微處理 器的組合、多個微處理器的組合、一個或一個以上微處理器與DSP核心的聯合,或任何其它 所述配置。
[0283] 結合本文中所揭示的配置描述的方法或算法的步驟可以硬體、由處理器執行的軟 件模塊或所述兩者的組合直接體現。軟體模塊可駐留於RAM存儲器、快閃記憶體、ROM存儲 器、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPR0M)、寄存器、硬 盤、可拆卸盤、緊密光碟只讀存儲器(CD-ROM)或在此項技術中已知的任何其它形式的存儲 媒體中。存儲媒體可耦合到處理器,使得處理器可從存儲媒體讀取信息且將信息寫入到存 儲媒體。或者,存儲媒體可與處理器成一體。處理器與存儲媒體可駐留於ASIC中。ASIC可 駐存於用戶終端中。在替代例中,處理器與存儲媒體可作為離散組件駐留於用戶終端中。
[0284] 本文中所揭示的方法包含用於實現所描述的方法的一個或一個以上步驟或動作。 方法步驟及/或動作可彼此互換,而不脫離本系統及方法的範圍。換句話說,除非針對配置 的適當操作指定特定順序的步驟或動作,否則可修改特定步驟及/或動作的順序及/或使 用,而不脫離本系統及方法的範圍。可以硬體、軟體或兩者實施本文中所揭示的方法。硬體 及存儲器的實例可包括RAM、ROM、EPROM、EEPR0M、快閃記憶體、光碟、寄存器、硬碟、可拆卸 盤、CD-ROM或任何其它類型的硬體及存儲器。
[0285] 雖然已說明且描述本系統及方法的特定配置及應用,但應了解,所述系統及方法 並不限於本文中所揭示的精確配置及組件。可在本文中所揭示的方法及系統的布置、操作 及細節中進行對於所屬領域的技術人員來說為顯而易見的各種修改、變化及改變,而不脫 離所主張的系統及方法的精神及範圍。
【權利要求】
1. 一種用於在與語音信號相關聯的包中包含識別符的方法,所述方法包含: 接收信號; 將所述信號分割為多個幀; 將所述信號的一幀編碼到包中; 確定是否使用多個編碼方案中的一個將所述包編碼; 基於所述確定在所述包中封裝識別符,其中所述識別符為N位參數,所述N位參數具有 識別具體編碼方案以及信息的合法值,如果所述包被所述具體編碼方案編碼,則所述信息 不是識別編碼方案的信息,其中所述N位參數具有非法值,所述非法值識別不同於所述具 體編碼方案的編碼方案,且如果所述包被不同於所述具體編碼方案的所述編碼方案編碼, 則所述非法值不用做所述合法值,其中所述非法值為至少兩個保留的非法值之一,且所述 非法值包括來自所述N位參數的用於載送信息的至少一個位;以及 傳輸所述包。
2. 根據權利要求1所述的方法,其中將所述包編碼為寬帶半速率包。
3. 根據權利要求2所述的方法,其中所述寬帶半速率包包括80個位。
4. 根據權利要求2所述的方法,其中所述非法值為寬帶識別符。
5. 根據權利要求4所述的方法,其中所述寬帶識別符包含二進位形式的十進位數 一百二十六。
6. 根據權利要求4所述的方法,其中所述寬帶識別符包含二進位形式的十進位數 一百二十七。
7. 根據權利要求4所述的方法,其中所述寬帶識別符包含二進位形式的六個一。
8. 根據權利要求2所述的方法,其中使用噪聲激勵線性預測(NELP)編碼方案來編碼所 述寬帶半速率包。
9. 根據權利要求1所述的方法,其中由移動臺上的寬帶編碼器來編碼所述幀。
10. 根據權利要求1所述的方法,其進一步包含由移動臺上的寬帶解碼器來解碼所述 幀。
11. 根據權利要求1所述的方法,其進一步包含將所述包從第一移動臺傳輸到第二移 動臺。
12. -種用於在與語音信號相關聯的包中包含識別符的設備,其包含: 處理器; 存儲器,其與所述處理器進行電子通信; 指令,其存儲於所述存儲器中,所述指令可執行以: 接收信號; 將所述信號分割為多個幀; 將所述信號的一幀編碼到包中; 確定是否用多個編碼方案中的一個將所述包編碼; 基於所述確定在所述包中封裝識別符,其中所述識別符為N位參數,所述N位參數具有 識別具體編碼方案以及信息的合法值,如果所述包被所述具體編碼方案編碼,則所述信息 不是識別編碼方案的信息,其中所述N位參數具有非法值,所述非法值識別不同於所述具 體編碼方案的編碼方案,且如果所述包被不同於所述具體編碼方案的所述編碼方案編碼, 則所述非法值不用做所述合法值,其中所述非法值為至少兩個保留的非法值之一,且所述 非法值包括來自所述N位參數的用於載送信息的至少一個位;以及 傳輸所述包。
13. 根據權利要求12所述的設備,其中將所述包編碼為寬帶半速率包。
14. 根據權利要求13所述的設備,其中所述寬帶半速率包包括80個位。
15. 根據權利要求13所述的設備,其中所述非法值為寬帶識別符。
16. 根據權利要求15所述的設備,其中所述寬帶識別符包含二進位形式的十進位數 一百二十六。
17. 根據權利要求15所述的設備,其中所述寬帶識別符包含二進位形式的十進位數 一百二十七。
18. 根據權利要求15所述的設備,其中所述寬帶識別符包含二進位形式的六個一。
19. 一種經配置以在與語音信號相關聯的包中包含識別符的系統,其包含: 用於處理的裝置; 用於接收信號的裝置; 用於將所述信號分割為多個幀的裝置; 用於將所述信號的一幀編碼到包中的裝置; 用於確定是否用多個編碼方案中的一個將所述包編碼的裝置; 用於基於所述確定在所述包中封裝識別符的裝置,其中所述識別符為N位參數,所述 N位參數具有識別具體編碼方案以及信息的合法值,如果所述包被所述具體編碼方案編碼, 則所述信息不是識別編碼方案的信息,其中所述N位參數具有非法值,所述非法值識別不 同於所述具體編碼方案的編碼方案,且如果所述包被不同於所述具體編碼方案的所述編碼 方案編碼,則所述非法值不用做所述合法值,其中所述非法值為至少兩個保留的非法值之 一,且所述非法值包括來自所述N位參數的用於載送信息的至少一個位;以及 用於傳輸所述包的裝置。
20. -種計算機可讀媒體,其經配置以存儲一組指令,所述指令可執行以: 接收信號; 將所述信號分割為多個幀; 將所述信號的一幀編碼到包中; 確定是否用多個編碼方案中的一個將所述包編碼; 基於所述確定在所述包中封裝識別符,其中所述識別符為N位參數,所述N位參數具有 識別具體編碼方案以及信息的合法值,如果所述包被所述具體編碼方案編碼,則所述信息 不是識別編碼方案的信息,其中所述N位參數具有非法值,所述非法值識別不同於所述具 體編碼方案的編碼方案,且如果所述包被不同於所述具體編碼方案的所述編碼方案編碼, 則所述非法值不用做所述合法值,其中所述非法值為至少兩個保留的非法值之一,且所述 非法值包括來自所述N位參數的用於載送信息的至少一個位;以及 傳輸所述包。
21. -種用於解碼包的方法,所述方法包含: 接收包; 確定N位參數的合法值還是非法值包含在所述包中,其中所述合法值識別用於編碼 所述包的多個編碼方案中的一個編碼方案以及信息,如果所述N位參數被確定為所述合法 值,則所述信息不是識別編碼方案的信息,其中如果所述N位參數被確定為所述非法值,則 所述非法值識別用於編碼所述包的所述多個編碼方案中的不同於所述合法值識別的編碼 方案的編碼方案,其中所述非法值為至少兩個保留的非法值之一,且所述非法值包括來自 所述N位參數的用於載送信息的至少一個位;以及 基於所述確定選擇用於所述包的解碼模式。
22. -種用於解碼包的設備,其包含: 處理器; 存儲器,其與所述處理器進行電子通信; 指令,其存儲於所述存儲器中,所述指令可執行以: 接收包; 確定N位參數的合法值還是非法值包含在所述包中,其中所述合法值識別用於編碼 所述包的多個編碼方案中的一個編碼方案以及信息,如果所述N位參數被確定為所述合法 值,則所述信息不是識別編碼方案的信息,其中如果所述N位參數被確定為所述非法值,則 所述非法值識別用於編碼所述包的所述多個編碼方案中的不同於所述合法值識別的編碼 方案的編碼方案,其中所述非法值為至少兩個保留的非法值之一,且所述非法值包括來自 所述N位參數的用於載送信息的至少一個位;以及 基於所述確定選擇用於所述包的解碼模式。
23. -種經配置以解碼包的系統,其包含: 用於處理的裝置; 用於接收包的裝置; 用於確定N位參數的合法值還是非法值包含在所述包中的裝置,其中所述合法值識別 用於編碼所述包的多個編碼方案中的一個編碼方案以及信息,如果所述N位參數被確定為 所述合法值,則所述信息不是識別編碼方案的信息,其中如果所述N位參數被確定為所述 非法值,則所述非法值識別用於編碼所述包的所述多個編碼方案中的不同於所述合法值識 別的編碼方案的編碼方案,其中所述非法值為至少兩個保留的非法值之一,且所述非法值 包括來自所述N位參數的用於載送信息的至少一個位;以及 用於基於所述確定選擇用於所述包的解碼模式的裝置。
24. -種計算機可讀媒體,其經配置以存儲一組指令,所述指令可執行以: 接收包; 確定N位參數的合法值還是非法值包含在所述包中,其中所述合法值識別用於編碼 所述包的多個編碼方案中的一個編碼方案以及信息,如果所述N位參數被確定為所述合法 值,則所述信息不是識別編碼方案的信息,其中如果所述N位參數被確定為所述非法值,則 所述非法值識別用於編碼所述包的所述多個編碼方案中的不同於所述合法值識別的編碼 方案的編碼方案,其中所述非法值為至少兩個保留的非法值之一,且所述非法值包括來自 所述N位參數的用於載送信息的至少一個位;以及 基於所述確定選擇用於所述包的解碼模式。
【文檔編號】G10L19/16GK104123946SQ201410359582
【公開日】2014年10月29日 申請日期:2007年7月31日 優先權日:2006年7月31日
【發明者】維韋克·拉金德朗, 阿南塔帕德馬那伯罕·A·坎達哈達伊 申請人:高通股份有限公司