新四季網

基於高頻帶信號特徵的時間增益調整的製作方法

2023-10-10 07:55:14


本申請案主張來自標題都為「基於高頻帶信號特徵的時間增益調整(TEMPORAL GAIN ADJUSTMENT BASED ON HIGH-BAND SIGNAL CHARACTERISTIC)」的2014年6月26日申請的第62/017,790號美國臨時專利申請案及2015年6月4日申請的第14/731,198號美國專利申請案的優先權,所述案的內容以全文引用的方式併入本文中。

技術領域

本發明大體上涉及信號處理。



背景技術:

技術的進步已產生體積較小且功能更強大的計算裝置。舉例來說,當前存在多種可攜式個人計算裝置,包含無線計算裝置,例如可攜式無線電話、個人數字助理(PDA)及傳呼裝置等,其體積小、重量輕且易於由用戶攜帶。更具體言之,可攜式無線電話(例如蜂窩式電話及網際網路協議(IP)電話)可經由無線網絡傳達語音及數據包。另外,許多所述無線電話包含併入於其中的其它類型的裝置。舉例來說,無線電話也可包含數字靜態相機、數字視頻攝像機、數字記錄器及音頻文件播放器。

由數位技術發射語音為普遍的,尤其在長距離及數字無線電電話應用中。確定可經由信道發送的最少信息量同時維持經重建話音的所感知質量可為關注事項。如果通過採樣及數位化來發射話音,則數量級為六十四千位/每秒(kbps)的數據速率可用於達成模擬電話的話音質量。經由在接收器處使用話音分析,繼之以解碼、發射及重新合成,可達成數據速率的顯著減小。

用於壓縮話音的裝置可用於許多電信領域中。例示性領域為無線通信。無線通信的領域具有許多應用,包含(例如)無線電話、傳呼、無線區域環路、例如蜂窩式及個人通信服務(PCS)電話系統的無線電話、移動網際網路協議(IP)電話及衛星通信系統。特定應用為用於移動訂戶的無線電話。

已開發出用於無線通信系統的各種空中接口,包括(例如)頻分多址接入(FDMA)、時分多址接入(TDMA)、碼分多址接入(CDMA)及時分同步CDMA(TD-SCDMA)。結合所述空中接口,已建立了各種國內及國際標準,包含(例如)高級行動電話服務(AMPS)、全球移動通信系統(GSM)及暫行標準95(IS-95)。例示性無線電話通信系統為碼分多址接入(CDMA)系統。IS-95標準及其衍生標準(IS-95A、ANSI J-STD-008及IS-95B)(本文中統稱為IS-95)由電信工業協會(TIA)及其它公認標準機構頒布以指定CDMA空中接口針對蜂窩式或PCS電話通信系統的使用。

IS-95標準隨後演進成例如cdma2000及WCDMA的「3G」系統,所述「3G」系統提供更大容量及高速度包數據服務。cdma2000的兩個變體由TIA發布的文件IS-2000(cdma2000 1xRTT)及IS-856(cdma2000 1xEV-DO)呈現。cdma2000 1xRTT通信系統給予153kbps的峰值數據速率,而cdma2000 1xEV-DO通信系統定義範圍介於38.4kbps到2.4Mbps的數據速率集合。WCDMA標準體現於第三代合作夥伴計劃「3GPP」第3G TS25.211號、第3G TS 25.212號、第3G TS 25.213號及第3G TS 25.214號文檔中。高級國際移動電信(高級IMT)規範闡述「4G」標準。對於高移動性通信(例如,來自火車及汽車),高級IMT規範設定100百萬位/秒(Mbit/s)的峰值數據速率用於4G服務,且對於低移動性通信(例如,來自行人及固定用戶)設定1十億位/秒(Gbit/s)的峰值數據速率。

使用通過提取關於人類話音產生模型的參數來壓縮話音的技術的裝置被稱為話音解碼器。話音解碼器可包括編碼器及解碼器。編碼器將傳入話音信號劃分成時間塊或分析幀。可將每一時間分段(或「幀」)的持續時間選擇為足夠短,以使得可預期信號的頻譜包絡為保持相對固定。舉例來說,一個幀長度為20毫秒,此對應於8千赫(kHz)採樣速率下的160個樣本,儘管可使用被視為適合於特定應用的任何幀長度或採樣速率。

編碼器分析傳入話音幀以提取某些相關參數,且接著將所述參數量化成二進位表示,即,量化成位集合或二進位數據包。經由通信信道(即,有線及/或無線網絡連接)將數據包發射到接收器及解碼器。解碼器處理數據包、去量化經處理數據包以產生參數並使用經去量化參數重新合成話音幀。

話音解碼器的功能為通過移除話音中固有的自然冗餘而將經數位化話音信號壓縮成低位速率信號。可通過用參數集合表示輸入話音幀及使用量化以通過位集合表示參數來達成數字壓縮。如果輸入話音幀具有位數目Ni,且由話音解碼器所產生的數據包具有位數目No,則由話音解碼器所達成的壓縮因數為Cr=Ni/No。挑戰為在達成目標壓縮因數時保持經解碼話音的高語音質量。話音解碼器的性能取決於:(1)話音模型或上文所描述的分析及合成過程的組合執行得有多好;及(2)在每幀No個位的目標位速率下參數量化過程執行得有多好。因此,話音模型的目標為在針對每一幀具有小參數集合的情況下擷取話音信號的本質或目標語音質量。

話音解碼器通常利用參數集合(包含向量)來描述話音信號。良好參數集合向感知上準確的話音信號的重建理想地提供低系統帶寬。音調、信號功率、頻譜包絡(或共振峰)、振幅及相譜為話音解碼參數的實例。

話音解碼器可經實施為時域解碼器,其試圖通過使用高時間解析度處理以每次編碼小的話音區段(通常為5毫秒(ms)的子幀)來擷取時域話音波形。對於每一子幀,藉助於搜索算法發現來自碼簿空間的高精確度代表。替代地,話音解碼器可經實施為頻域解碼器,其試圖用參數集合(分析)來擷取輸入話音幀的短期話音頻譜,且使用對應合成過程以從頻譜參數來重新產生話音波形。參數量化器通過根據已知量化技術用碼向量的所存儲表示來表示參數而保留參數。

一個時域話音解碼器為碼激勵線性預測(CELP)解碼器。在CELP解碼器中,通過找到短期共振峰濾波器的係數的線性預測(LP)分析來移除話音信號中的短期相關或冗餘。將短期預測濾波器應用於傳入話音幀產生LP殘餘信號,LP殘餘信號是用長期預測濾波器參數及後續隨機碼簿予以進一步建模及量化。因此,CELP解碼將編碼時域話音波形的任務劃分成編碼LP短期濾波器係數及編碼LP殘餘的單獨任務。可以固定速率(即,針對每一幀使用相同數目(No)個位)或以可變速率(其中針對不同類型的幀內容使用不同位速率)執行時域解碼。可變速率解碼器試圖使用將解碼解碼器參數編碼到充分獲得目標質量的等級所需要的位量。

例如CELP解碼器的時域解碼器通常可依賴於每幀高數目(N0)個位以保留時域話音波形的準確度。倘若每幀的位數目No相對大(例如,8kbps或高於8kbps),則這些解碼器可遞送極好的語音質量。在低位速率(例如,4kbps及低於4kbps)下,歸因於受限數目個可用位,時域解碼器可不能保持高質量及穩健性能。在低位速率下,受限碼簿空間削減在較高速率商業應用中所部署的時域解碼器的波形匹配能力。因此,儘管隨時間推移進行改良,但以低位速率操作的許多CELP解碼系統仍遭受特徵化為噪聲的感知明顯失真。

低位速率下對CELP解碼器的替代例為根據類似於CELP解碼器的原理操作的「噪聲激勵線性預測」(NELP)解碼器。NELP解碼器使用經濾波偽隨機噪聲信號來建模話音而非碼簿。由於NELP將較簡單模型用於經解碼話音,因此NELP達成比CELP低的位速率。NELP可用於壓縮或表示無聲話音或靜默。

以大約為2.4kbps的速率操作的解碼系統本質上大體上為參數的。即,這些解碼系統通過以規則間隔發射描述話音信號的音調周期及頻譜包絡(或共振峰)的參數進行操作。這些所謂的參數解碼器的說明為LP聲碼器系統。

LP聲碼器通過每音調周期單個脈衝來建模有聲話音信號。可擴增此基本技術以包含關於頻譜包絡以及其它事項的發射信息。儘管LP聲碼器提供大體合理的性能,但其可引入特徵化為傳言的感知顯著失真。

近年來,已出現為波形解碼器及參數解碼器兩者的混合的解碼器。這些所謂的混合解碼器的說明為原型波形內插(PWI)話音解碼系統。PWI解碼系統也可被稱為原型音調周期(PPP)話音解碼器。PWI解碼系統提供用於解碼有聲話音的高效方法。PWI的基本概念為以固定間隔提取代表性音調周期(原型波形)、發射其描述及通過在原型波形之間進行內插而重建話音信號。PWI方法可對LP殘餘信號抑或話音信號進行操作。

可存在對改良話音信號(例如,經解碼話音信號、經重建話音信號或二者)的音頻質量的研究關注及商業關注。舉例來說,通信裝置可接收具有低於最佳語音質量的語音質量的話音信號。為了說明,通信裝置可在語音呼叫期間從另一通信裝置接收話音信號。歸因於各種原因(例如,環境噪聲(例如,風、街道噪聲)、通信裝置的接口的限制、由通信裝置進行的信號處理、包丟失、帶寬限制、位速率限制等),語音呼叫質量可受損。

在傳統電話系統(例如,公眾交換電話網絡(PSTN))中,信號帶寬限於300赫茲(Hz)到3.4千赫茲(kHz)的頻率範圍。在例如蜂窩式電話及網際網路語音通訊協議(VoIP)的寬帶(WB)應用中,信號帶寬可跨越從50Hz到7kHz的頻率範圍。超寬帶(SWB)解碼技術支持擴展到16kHz左右的帶寬。將信號帶寬從3.4kHz的窄頻電話擴展到16kHz的SWB電話可改良信號重建的質量、可懂度及自然度。

SWB解碼技術通常涉及編碼及發射信號的較低頻率部分(例如,0Hz到6.4kHz,也稱為「低頻帶」)。舉例來說,可使用濾波器參數及/或低頻帶激勵信號表示低頻帶。然而,為了改良解碼效率,信號的較高頻率部分(例如,6.4kHz到16kHz,也稱為「高頻帶」)可能未經充分編碼並發射。實情為,接收器可利用信號建模以預測高頻帶。在一些實施中,可將與高頻帶相關聯的數據提供到接收器以輔助預測。此數據可被稱為「旁側信息」,且可包括增益信息、線譜頻率(LSF,也被稱為線譜對(LSP))等。在使用信號建模編碼及解碼高頻帶信號時,非所要的噪聲或可聽偽訊在某些條件下可被引入到高頻帶信號中。



技術實現要素:

在特定方面中,一種方法包含在編碼器處確定輸入音頻信號的高頻帶部分的較高頻率範圍的信號特徵是否滿足閾值。所述方法還包含產生對應於所述高頻帶部分的高頻帶激勵信號;基於所述高頻帶激勵信號產生經合成高頻帶部分;及基於所述經合成高頻帶部分與所述高頻帶部分的比較來確定時間增益參數的值。所述方法進一步包含響應於所述信號特徵滿足所述閾值,調整所述時間增益參數的所述值。調整所述時間增益參數的所述值控制所述時間增益參數的可變性。

在另一特定方面中,一種設備包含預處理模塊,其經配置以對輸入音頻信號的至少一部分進行濾波以產生多個輸出。所述設備還包含第一濾波器,其經配置以確定所述輸入音頻信號的高頻帶部分的較高頻率範圍的信號特徵。所述設備進一步包含高頻帶激勵產生器,其經配置以產生對應於所述高頻帶部分的高頻帶激勵信號;及第二濾波器,其經配置以基於所述高頻帶激勵信號產生經合成高頻帶部分。所述設備還包含時間包絡估計器,其經配置以:基於所述經合成高頻帶部分與所述高頻帶部分的比較來確定時間增益參數的值;及響應於所述信號特徵滿足閾值,調整所述時間增益參數的所述值。調整所述時間增益參數的所述值控制所述時間增益參數的可變性。

在另一特定方面中,一種非暫時性處理器可讀媒體包含指令,所述指令在由處理器執行時使得所述處理器執行包含以下操作的操作:確定輸入音頻信號的高頻帶部分的較高頻率範圍的信號特徵是否滿足閾值。所述操作還包含:產生對應於所述高頻帶部分的高頻帶激勵信號;基於所述高頻帶激勵信號產生經合成高頻帶部分;及基於所述經合成高頻帶部分與所述高頻帶部分的比較來確定時間增益參數的值。所述操作進一步包含響應於所述信號特徵滿足所述閾值,調整所述時間增益參數的所述值。調整所述時間增益參數的所述值控制所述時間增益參數的可變性。

在另一特定方面中,一種設備包含用於對輸入音頻信號的至少一部分進行濾波以產生多個輸出的裝置。所述設備還包含用於基於所述多個輸出確定所述輸入音頻信號的高頻帶部分的較高頻率範圍的信號特徵是否滿足閾值的裝置。所述設備進一步包含用於產生對應於所述高頻帶部分的高頻帶激勵信號的裝置;用於基於所述高頻帶激勵信號產生經合成高頻帶部分的裝置;及用於估計所述高頻帶部分的時間包絡的裝置。所述用於估計的裝置經配置以:基於所述經合成高頻帶部分與所述高頻帶部分的比較來確定時間增益參數的值;及響應於所述信號特徵滿足所述閾值,調整所述時間增益參數的所述值。調整所述時間增益參數的所述值控制所述時間增益參數的可變性。

在另一特定方面中,一種調整編碼器的線性預測係數(LPC)的方法包含在所述編碼器處基於使用線性預測(LP)階數的第一值的LP增益操作來確定LP增益。所述LP增益與LP合成濾波器的能量等級相關聯。所述方法還包含比較所述LP增益與閾值,及在所述LP增益滿足所述閾值情況下將所述LP階數從所述第一值減小到第二值。

在另一特定方面中,一種設備包含編碼器及存儲指令的存儲器,所述指令由所述編碼器可執行以執行操作。所述操作包含基於使用線性預測(LP)階數的第一值的LP增益操作來確定LP增益。所述LP增益與LP合成濾波器的能量等級相關聯。所述操作還包含比較所述LP增益與閾值,及在所述LP增益滿足所述閾值情況下將所述LP階數從所述第一值減小到第二值。

在另一特定方面中,一種非暫時性計算機可讀媒體包含用於調整編碼器的線性預測係數(LPC)的指令。所述指令在由所述編碼器執行時使得所述編碼器執行操作。所述操作包含基於使用線性預測(LP)階數的第一值的LP增益操作來確定LP增益。所述LP增益與LP合成濾波器的能量等級相關聯。所述操作還包含比較所述LP增益與閾值,及在所述LP增益滿足所述閾值情況下將所述LP階數從所述第一值減小到第二值。

在另一特定方面中,一種設備包含用於基於使用線性預測(LP)階數的第一值的LP增益操作來確定LP增益的裝置。所述LP增益與LP合成濾波器的能量等級相關聯。所述設備還包含用於比較所述LP增益與閾值的裝置,及用於在所述LP增益滿足所述閾值情況下將所述LP階數從所述第一值減小到第二值的裝置。

附圖說明

圖1為說明可操作以基於高頻帶信號特徵調整時間增益參數的系統的特定方面的圖;

圖2為說明可操作以基於高頻帶信號特徵調整時間增益參數的編碼器的組件的特定方面的圖;

圖3包含說明根據特定方面的信號的頻率分量的圖;

圖4為說明解碼器的組件的特定方面的圖,所述解碼器可操作以使用基於高頻帶信號特徵調整的時間增益參數來合成音頻信號的高頻帶部分;

圖5A描繪流程圖以說明基於高頻帶信號特徵調整時間增益參數的方法的特定方面;

圖5B描繪流程圖以說明計算高頻帶信號特徵的方法的特定方面;

圖5C描繪流程圖以說明調整編碼器的調整線性預測係數(LPC)的方法的特定方面;且

圖6為可操作以執行根據圖1到5B的系統、設備及方法的信號處理操作的無線裝置的框圖。

具體實施方式

揭示基於高頻帶信號特徵調整時間增益信息的系統及方法。舉例來說,時間增益信息可包含增益形狀參數,其在按子幀基礎上於編碼器處產生。在某些情形下,輸入到編碼器的音頻信號在高頻帶中可具有極少內容或無內容(例如,關於高頻帶可為「頻帶受限」的)。舉例來說,頻帶受限信號可於在與SWB模型兼容的電子裝置、不能越過整個高頻帶擷取數據的裝置等處的音頻擷取期間產生。為了說明,特定無線電話可能不能或可經編程以避免在高於8kHz、高於10kHz等的頻率下擷取數據。當編碼這些頻帶受限信號時,信號模型(例如,SWB諧波模型)可歸因於時間增益的大的變化引入可聽偽訊。

為了減小這些偽訊,編碼器(例如,話音編碼器或「聲碼器」)可確定待編碼的音頻信號的信號特徵。在一個實例中,信號特徵為音頻信號的高頻帶部分的較高頻率區中的能量的總和。作為非限制性實例,信號特徵可通過對12kHz到16kHz頻率範圍內的分析濾波器組輸出的能量求和來確定,且可因此對應於高頻帶「信號底限」。如本文所使用,音頻信號的高頻帶部分的「較高頻率區」可對應於低於音頻信號的高頻帶部分的帶寬的任何頻率範圍(在音頻信號的高頻帶部分的較高部分處)。作為非限制性實例,如果音頻信號的高頻帶部分由6.4kHz到14.4kHz頻率範圍特徵化,則音頻信號的高頻帶部分的較高頻率區可由10.6kHz到14.4kHz頻率範圍特徵化。作為另一非限制性實例,如果音頻信號的高頻帶部分由8kHz到16kHz頻率範圍特徵化,則音頻信號的高頻帶部分的較高頻率區可由13kHz到16kHz頻率範圍特徵化。編碼器可處理音頻信號的高頻帶部分以產生高頻帶激勵信號,且可基於高頻帶激勵信號產生高頻帶部分的經合成版本。基於「原始」高頻帶部分與經合成高頻帶部分的比較,編碼器可確定增益形狀參數的值。如果高頻帶部分的信號特徵滿足閾值(例如,信號特徵指示音頻信號為頻帶受限的且具有極少高頻帶內容或無高頻帶內容),則編碼器可調整增益形狀參數的值以限制增益形狀參數的可變性(例如,受限動態範圍)。限制增益形狀參數的可變性可減小在頻帶受限音頻信號的編碼/解碼期間產生的偽訊。

參看圖1,可操作以基於高頻帶信號特徵調整時間增益參數的系統的特定方面經展示,並通常指定為100。在特定方面中,系統100可集成到編碼系統或設備中(例如,無線電話或解碼器/解碼器(解碼解碼器)中)。

應注意,在以下描述中,將由圖1的系統100執行的各種功能描述為由某些組件或模塊執行。然而,組件及模塊的此劃分僅是為了說明。在替代方面中,由特定組件或模塊所執行的功能可替代地劃分於多個組件或模塊之間。此外,在替代方面中,圖1的兩個或多於兩個組件或模塊可集成到單個組件或模塊中。可使用硬體(例如,現場可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、數位訊號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行的指令)或其任何組合實施圖1中所說明的每一組件或模塊。

系統100包含經配置以接收音頻信號102的預處理模塊110。舉例來說,音頻信號102可由麥克風或其它輸入裝置提供。在特定方面中,音頻信號102可包含話音。音頻信號102可為超寬帶(SWB)信號,其包含在大約50赫茲(Hz)到大約16千赫茲(kHz)的頻率範圍內的數據。預處理模塊110可基於頻率將音頻信號102濾波成多個部分。舉例來說,預處理模塊110可產生低頻帶信號122及高頻帶信號124。低頻帶信號122及高頻帶信號124可具有相等或不等帶寬,且可重疊或不重疊。

在特定方面中,低頻帶信號122及高頻帶信號124對應於不重疊頻帶中的數據。舉例來說,低頻帶信號122及高頻帶信號124可對應於50Hz到7kHz及7kHz到16kHz的不重疊頻帶中的數據。在替代方面中,低頻帶信號122及高頻帶信號124可對應於50Hz到8kHz及8kHz到16kHz的不重疊頻帶中的數據。在另一替代方面中,低頻帶信號122及高頻帶信號124對應於重疊頻帶(例如,50Hz到8kHz及7kHz到16kHz),其可使預處理模塊110的低通濾波器及高通濾波器能夠具有平滑滾降,其可簡化設計且減少低通濾波器及高通濾波器的成本。使低頻帶信號122及高頻帶信號124重疊也可實現接收器處低頻帶及高頻帶信號的平滑摻合,其可引起更少聽覺偽訊。

在特定方面中,預處理模塊110包含分析濾波器組。舉例來說,預處理模塊110可包含正交鏡像濾波器(QMF)濾波器組,其包含多個QMF。每一QMF可對音頻信號102的一部分進行濾波。作為另一實例,預處理模塊110可包含複合低延遲濾波器組(CLDFB)。預處理模塊110還可包含經配置以翻轉音頻信號102的頻譜的頻譜翻轉器。因此,在特定方面中,儘管高頻帶信號124對應於音頻信號102的高頻帶部分,但高頻帶信號124可作為基帶信號進行傳達。

在特定SWB方面中,濾波器組包含40個QMF濾波器,其中每一濾波器(例如,說明性QMF濾波器112)對音頻信號102的400Hz部分進行操作。每一QMF濾波器112可產生包含實部及虛部的濾波器輸出。預處理模塊110可對來自對應於音頻信號102的高頻帶部分的較高頻率部分的QMF濾波器的濾波器輸出求和。舉例來說,預處理模塊110可對來自對應於12kHz到16kHz頻率範圍的10個QMF的輸出求和,所述QMF使用著色圖案展示於圖1中。預處理模塊110可基於經求和的QMF輸出來確定高頻帶信號特徵126。在特定方面中,預處理模塊110對QMF輸出的總和進行長期求平均運算以確定高頻帶信號特徵126。為了說明,預處理模塊110可根據以下偽碼進行操作:

儘管以上偽碼說明使用分析濾波器組在10個頻帶(例如,表示12到16kHz數據的10個400Hz頻帶)上的長期求平均運算,但應了解,預處理模塊110可根據基本上類似於針對不同分析濾波器組的偽碼、頻帶的不同數目及/或數據的不同頻率範圍操作。作為非限制性實例,預處理模塊110可將複合低延遲分析濾波器組用於表示13到16kHz數據的20個頻帶。

在特定方面中,高頻帶信號特徵126在按子幀基礎上確定。為了說明,音頻信號102可被劃分成多個幀,其中每一幀對應於大約20毫秒(ms)的音頻。每一幀可包含多個子幀。舉例來說,每一20ms幀可包含四個5ms(或大約5ms)子幀。在替代方面中,幀及子幀可對應於不同時間長度,且不同數目個子幀可包含於每一幀中。

應注意,儘管圖1的實例說明SWB信號的處理,但此僅為了說明。在替代方面中,音頻信號102可為具有大約50Hz到大約8kHz的頻率範圍的寬帶(WB)信號。在此方面中,低頻帶信號122可對應於大約50Hz到大約6.4kHz的頻率範圍,且高頻帶信號124可對應於大約6.4kHz到大約8kHz的頻率範圍。

系統100可包含經配置以接收低頻帶信號122的低頻帶分析模塊130。在特定方面中,低頻帶分析模塊130可表示碼激勵線性預測(CELP)編碼器的方面。低頻帶分析模塊130可包含線性預測(LP)分析及解碼模塊132、線性預測係數(LPC)到線譜對(LSP)變換模塊134及量化器136。LSP也可被稱作線譜頻率(LSF),且所述兩個術語在本文中可以互換地使用。LP分析及解碼模塊132可將低頻帶信號122的頻譜包絡編碼成LPC的集合。可針對音頻的每一幀(例如,對應於16kHz的採樣速率下的320個樣本的20毫秒的音頻)、音頻的每一子幀(例如,5ms的音頻)或其任何組合產生LPC。可由所執行LP分析的「階數」確定針對每一幀或子幀所產生的LPC的數目。在特定方面中,LP分析及解碼模塊132可產生對應於第十階LP分析的十一個LPC的集合。

LPC到LSP變換模塊134可將由LP分析及解碼模塊132所產生的LPC的集合變換成對應LSP集合(例如,使用一對一變換)。替代性地,LPC的集合可經一對一地變換成部分自相關係數、對數面積比率值、導譜對(ISP)或導譜頻率(ISF)的對應集合。LPC集合與LSP集合之間的變換可為可逆的而不存在誤差。

量化器136可量化由變換模塊134產生的LSP的集合。舉例來說,量化器136可包含或耦合到包含多個條目(例如,向量)的多個碼簿。為量化LSP的集合,量化器136可識別「最接近」(例如,基於例如最小平方或均方誤差的失真度量)LSP集合的碼簿的條目。量化器136可輸出對應於碼簿中所識別條目的位置的索引值或一系列索引值。因此,量化器136的輸出可表示包含於低頻帶位流142中的低頻帶濾波器參數。

低頻帶分析模塊130也可產生低頻帶激勵信號144。舉例來說,低頻帶激勵信號144可為通過量化LP殘餘信號產生的經編碼信號,在由低頻帶分析模塊130執行的LP過程期間產生所述LP殘餘信號。LP殘餘信號可表示預測誤差。

系統100可進一步包含高頻帶分析模塊150,其經配置以從預處理模塊110接收高頻帶信號124及高頻帶信號特徵126並從低頻帶分析模塊130接收低頻帶激勵信號144。高頻帶分析模塊150可產生高頻帶旁側信息(例如,參數)172。舉例來說,高頻帶旁側信息172可包含高頻帶LSP、增益信息等。

高頻帶分析模塊150可包含高頻帶激勵產生器160。高頻帶激勵產生器160可通過將低頻帶激勵信號144的頻譜擴展到高頻帶頻率範圍(例如,8kHz到16kHz)中而產生高頻帶激勵信號161。為了說明,高頻帶激勵產生器160可對低頻帶激勵信號應用變換(例如,非線性變換,例如絕對值或平方運算),且可將經變換低頻帶激勵信號與噪聲信號(例如,根據對應於低頻帶激勵信號144的包絡而調製的白噪聲,其模仿低頻帶信號122的緩慢變化的時間特徵)混合來產生高頻帶激勵信號161。

高頻帶激勵信號161可用於確定包含於高頻帶旁側信息172中的一或多個高頻帶增益參數。如所說明,高頻帶分析模塊150也可包含LP分析及解碼模塊152、LPC到LSP變換模塊154及量化器156。LP分析及解碼模塊152、變換模塊154及量化器156中的每一者可如上文參考低頻帶分析模塊130的對應組件所描述但以相對減少的解析度(例如,對於每一係數、LSP等使用較少位)起作用。LP分析及解碼模塊152可產生由變換模塊154變換到LSP並由量化器156基於碼簿163量化的LPC的集合。舉例來說,LP分析及解碼模塊152、變換模塊154及量化器156可使用高頻帶信號124來確定包含於高頻帶旁側信息172中的高頻帶濾波器信息(例如,高頻帶LSP)。在特定方面中,高頻帶分析模塊150可包含本地解碼器,其基於由變換模塊154產生的LPC使用濾波器係數,且接收高頻帶激勵信號161作為輸入。本地解碼器的合成濾波器(例如,合成模塊164)的輸出,例如高頻帶信號124的經合成版本,可與高頻帶信號124進行比較,且增益參數(例如,幀增益及/或時間包絡增益塑形值)可經確定、量化並包含於高頻帶旁側信息172中。

在特定方面中,高頻帶旁側信息172可包含高頻帶LSP以及高頻帶增益參數。舉例來說,高頻帶旁側信息172可包含時間增益參數(例如,增益形狀參數),其指示高頻帶信號124的頻譜包絡隨時間如何演進。舉例來說,增益形狀參數可基於「原始」高頻帶部分與經合成高頻帶部分之間的歸一化能量的比率。增益形狀參數可在按子幀基礎上來經確定並應用。在特定方面中,也可確定並應用第二增益參數。舉例來說,「增益幀」參數可跨越整個幀來確定並應用,其中增益幀參數對應於特定幀的高頻帶與低頻帶的能量比率。

舉例來說,高頻帶分析模塊150可包含合成模塊164,其經配置以基於高頻帶激勵信號161產生高頻帶信號124的經合成版本。高頻帶分析模塊150也可包含增益調整器162,其基於「原始」高頻帶信號124與由合成模塊164產生的高頻帶信號的經合成版本的比較來確定增益形狀參數的值。為了說明,對於包含四個子幀的特定音頻幀,高頻帶信號124對於相應子幀可具有10、20、30、20的值(例如,振幅或能量)。高頻帶信號的經合成版本可具有值10、10、10、10。增益調整器162可確定相應子幀的增益形狀參數的值為1、2、3、2。在解碼器處,增益形狀參數值可用以使高頻帶信號的經合成版本塑形以更緊密地反映「原始」高頻帶信號124。在特定方面中,增益調整器162可使增益形狀參數值歸一化為0與1之間的值。舉例來說,增益形狀參數值可經歸一化為0.33、0.67、1、0.33。

在特定方面中,增益調整器162可基於高頻帶信號特徵126是否滿足閾值165來調整增益形狀參數的值。所述閾值165可為固定或可調整的。滿足閾值165的高頻帶信號特徵126可指示,音頻信號102在高頻帶部分(例如,8kHz到16kHz)的較高頻率區(例如,12kHz到16kHz)中包含小於閾值量的音頻內容。因此,與經合成域相對,高頻帶信號特徵可在濾波/分析域(例如,QMF域)中確定。當音頻信號102在高頻帶部分的較高頻率區中包含極少內容或不包含內容時,增益的大擺動可由高頻帶分析模塊150編碼,從而在信號解碼上引起可聽偽訊。為了減小這些偽訊,增益調整器162可在高頻帶信號特徵滿足閾值165時調整增益形狀參數值。調整增益形狀參數值可限制增益形狀參數的可變性(例如,動態範圍)。為了說明,增益調整器可根據以下偽碼操作:

在替代方面中,閾值165可存儲於預處理模塊110處或可用於所述預處理模塊,且預處理模塊110可確定高頻帶信號特徵126是否滿足閾值165。在此方面中,預處理模塊110可發送指示符(例如,位)到增益調整器162。指示符在高頻帶信號特徵126滿足閾值165時可具有第一值(例如,1),且在高頻帶信號特徵126並不滿足閾值165時可具有第二值(例如,0)。增益調整器162可基於指示符具有第一值抑或第二值而調整增益形狀參數的值。

低頻帶位流142及高頻帶旁側信息172可由多路復用器(MUX)180進行多路發射以產生輸出位流192。輸出位流192可表示對應於音頻信號102的經編碼音頻信號。舉例來說,輸出位流192可經發射(例如,經由有線、無線或光學通道)及/或存儲。在接收器處,反向操作可由解多路復用器(DEMUX)、低頻帶解碼器、高頻帶解碼器及濾波器組來執行以產生音頻信號(例如,音頻信號102的提供到揚聲器其它輸出裝置的經重建版本)。用於表示低頻帶位流142的位數目可大體上大於用於表示高頻帶旁側信息172的位數目。因此,輸出位流192中的大部分位可表示低頻帶數據。高頻帶旁側信息172可用於接收器處以根據信號模型從低頻帶數據重新產生高頻帶激勵信號。舉例來說,信號模型可表示低頻帶數據(例如,低頻帶信號122)與高頻帶數據(例如,高頻帶信號124)之間的關係或相關性的預期集合。因此,不同信號模型可用於不同種類的音頻數據(例如,話音、音樂等),且在使用中的特定信號模型在傳達經編碼音頻數據之前可由發射器及接收器協商(或通過業界標準界定)。使用信號模型,發射器處的高頻帶分析模塊150可能能夠產生高頻帶旁側信息172,使得接收器處的對應高頻帶分析模塊能夠使用信號模型從輸出位流192重建高頻帶信號124。

通過在高頻帶信號特徵滿足閾值時選擇性地調整時間增益信息(例如,增益形狀參數),圖1的系統100在經編碼信號經頻帶受限(例如,包含很少高頻帶內容或不包含高頻帶內容)時可減小可聽偽訊。圖1的系統100因此在輸入信號並不附接到使用中的信號模型時可實現約束時間增益。

參看圖2,展示用於編碼器200中的組件的特定方面。在說明性方面中,編碼器200對應於圖1的系統100。

編碼器200可接收具有為「F」的帶寬的輸入信號201(例如,具有從0Hz到F Hz的頻率範圍的信號,例如當F=16,000=16k時為0Hz到16kHz)。分析濾波器202可輸出輸入信號201的低頻帶部分。從分析濾波器202輸出的信號203可具有從0Hz到F1Hz(例如,在F1=6.4k時為0Hz到6.4kHz)的頻率分量。

例如ACELP編碼器(例如,圖1的低頻帶分析模塊130中的LP分析及解碼模塊132)的低頻帶編碼器204可編碼信號203。ACELP編碼器204可產生例如LPC的解碼信息及低頻帶激勵信號205。

來自ACELP編碼器的低頻帶激勵信號205(其也可由接收器中的ACELP解碼器再現,例如圖4中所描述)可在採樣器206處經增加採樣,使得經增加採樣信號207的有效帶寬在從0Hz到F Hz的頻率範圍內。低頻帶激勵信號205可由採樣器206接收,此是由於樣本集合對應於12.8kHz的採樣速率(例如,6.4kHz低頻帶激勵信號205的奈奎斯採樣速率)。舉例來說,低頻帶激勵信號205可以低頻帶激勵信號205的帶寬的速率兩倍的速率進行採樣。

第一非線性變換產生器208可經配置以基於經增加採樣信號207產生說明為非線性激勵信號的經帶寬擴展信號209。舉例來說,非線性變換產生器208可對經增加採樣信號207執行非線性變換操作(例如,絕對值運算或平方運算)以產生經帶寬擴展信號209。非線性變換操作可將原始信號(從0Hz到F1Hz(例如,0Hz到6.4kHz)的低頻帶激勵信號205)的諧波擴展到較高頻帶,例如從0Hz擴展到F Hz(例如,從0Hz到16kHz)。

經帶寬擴展信號209可經提供到第一頻譜翻轉模塊210。第一頻譜翻轉模塊210可經配置以執行經帶寬擴展信號209的頻譜鏡像操作(例如,「翻轉」頻譜)以產生「經翻轉」信號211。翻轉經帶寬擴展信號209的頻譜可將經帶寬擴展信號209的內容改變(例如,「翻轉」)到經翻轉信號211的範圍為0Hz到F Hz(例如,從0Hz到16kHz)的頻譜的相對末端。舉例來說,經帶寬擴展信號209在14.4kHz處的內容可在經翻轉信號211的1.6kHz處,經帶寬擴展信號209在0Hz處的內容可在經翻轉信號211的16kHz處等。

經翻轉信號211可提供到切換器212的輸入,其以第一操作模式選擇性地路由經翻轉信號211到包含濾波器214及降混器216的第一路徑,或以第二操作模式路由所述經翻轉信號到包含濾波器218的第二路徑。舉例來說,切換器212可包含多路復用器,其對控制輸入處指示編碼器200的操作模式的信號作出響應。

在第一操作模式中,經翻轉信號211在濾波器214處經帶通濾波,以產生帶通信號215,所述帶通信號在從(F-F2)Hz到(F-F1)Hz的頻率範圍外部具有減少或移除的信號內容,其中F2>F1。舉例來說,當F=16k、F1=6.4k且F2=14.4k時,經翻轉信號211可經帶通濾波到頻率範圍1.6kHz到9.6kHz。濾波器214可包含極零濾波器,其經配置以作為具有在大約F-F1處(例如,在16kHz-6.4kHz=9.6kHz處)的截止頻率的低通濾波器操作。舉例來說,極零濾波器可為高階濾波器,其在截止頻率處具有急劇下降,且經配置以濾除經翻轉信號211的高頻分量(例如,經翻轉信號211的在(F-F1)與F之間例如在9.6kHz與16kHz之間的分量)。此外,濾波器214可包含高通濾波器,其經配置以使輸出信號中在F-F2以下(例如,在16kHz-14.4kHz=1.6kHz以下)的頻率分量衰減。

帶通信號215可經提供到降混器216,其可產生具有從0Hz擴展到(F2-F1)Hz例如從0Hz到8kHz的有效信號帶寬的信號217。舉例來說,降混器216可經配置以將帶通信號215從在1.6kHz與9.6kHz之間的頻率範圍降混到基帶(例如,0Hz與8kHz之間的頻率範圍)以產生信號217。降混器216可使用兩階赫伯特(Hilbert)變換來實施。舉例來說,降混器216可使用具有虛數分量及實數分量的兩個五階無限脈衝響應(IIR)濾波器來實施。

在第二操作模式中,切換器212提供經翻轉信號211到濾波器218以產生信號219。濾波器218可作為低通濾波器操作以使(F2-F1)Hz以上(例如,8kHz以上)的頻率分量衰減。濾波器218處的低通濾波可作為重新採樣過程的部分執行,在所述重新採樣過程處,採樣速率經轉換成2*(F2-F1)(例如,成2*(14.4Hz-6.4Hz=16kHz))。

切換器220輸出信號217、219中的一者以根據操作模式在適應性白化及按比例調整模塊222處處理,且適應性白化及按比例調整模塊處的輸出經提供到例如加法器的組合器240的第一輸入。組合器240的第二輸入接收從隨機噪聲產生器230的輸出產生的信號,所述輸出已根據噪聲包絡模塊232(例如,調製器)及按比例調整模塊234進行了處理。組合器240產生高頻帶激勵信號241,例如圖1的高頻帶激勵信號161。

具有在0Hz與F Hz之間的頻率範圍內的有效帶寬的輸入信號201也可在基帶信號產生路徑處處理。舉例來說,輸入信號201可在頻譜翻轉模塊242處在頻譜上翻轉以產生經翻轉信號243。經翻轉信號243可在濾波器244處經帶通濾波以產生帶通信號245,所述帶通信號具有在從(F-F2)Hz到(F-F1)Hz(例如,從1.6kHz到9.6kHz)的頻率範圍外部的經移除或減小的信號分量。

在特定方面中,濾波器244確定輸入信號201的高頻帶部分的較高頻率範圍的信號特徵。作為說明性非限制性實例,濾波器244可基於對應於12kHz到16kHz頻率範圍的濾波器輸出確定高頻帶信號底限的長期平均值,如參看圖1所描述。圖3說明這些頻帶受限信號(指示為1到7)的實例。這些頻帶受限信號的線性預測係數(LPC)估計引起在高頻帶中導致偽訊的量化及穩定性的問題。舉例來說,如果經32kHz採樣的輸入信號經頻帶受限到10kHz(即,在10kHz以上且直到奈奎斯存在極其有限的能量)且高頻帶正從8到16kHz或6.4到14.4kHz編碼,則來自8到10kHz的頻帶受限頻譜內容可引起高頻帶LPC估計中的穩定性問題。詳言之,LP係數在以所要固定點精度Q格式表示時可歸因於精度損失而飽和。在這些情境下,較低預測階數可用於LP分析(例如,使用LPC階數=2或4而非10)。用於LP分析的LPC階數的此減小以限制飽和度及穩定性問題可基於LP合成濾波器的LP增益或能量來執行。如果LP增益高於特定閾值,則LPC階數可經調整到較低值。LP合成濾波器的能量通過|1/A(z)|^2給出,其中A(z)為LP分析濾波器。對應於48dB的為64的典型LP增益值為良好指示符以檢查這些頻帶受限情境下的高LP增益,且控制預測階數以避免LPC估計中的飽和度問題。

帶通信號245可在降混器246處進行降混以產生高頻帶「目標」信號247,其具有在從0Hz到(F2-F1)Hz(例如,從0Hz到8kHz)的頻率範圍內的有效信號帶寬。高頻帶目標信號247為對應於第一頻率範圍的基帶信號。

表示對高頻帶激勵信號241的修改使得其表示高頻帶目標信號247的參數可經提取並發射到解碼器。為了說明,高頻帶目標信號247可由LP分析模塊248處理以產生LPC,所述LPC在LPC到LSP轉換器250處經轉換成LSP,並在量化模塊252處量化。量化模塊252可產生待發送到解碼器的LSP量化索引,例如在圖1的高頻帶旁側信息172中。

LPC可用以配置合成濾波器260,其接收高頻帶激勵信號241作為輸入並產生經合成高頻帶信號261作為輸出。經合成高頻帶信號261在時間包絡估計模塊262處與高頻帶目標信號247進行比較(例如,信號261及247的能量可在相應信號的每一子幀處進行比較)以產生增益信息263,例如增益形狀參數值。增益信息263經提供到量化模塊264以產生經量化增益信息索引以發送到解碼器,例如在圖1的高頻帶旁側信息172中。

如上文所描述,如果LP增益高於特定閾值以減小飽和度,則較低預測階數可用於LP分析(例如,使用LPC階數=2或4而非10)。為了說明,LP分析模塊248可根據以下偽碼進行操作:

基於偽碼,LP分析模塊248可基於使用LP階數的第一值的LP增益操作來確定LP增益。舉例來說,LP分析模塊248可使用函數「ener_1_Az」估計LP增益(例如,「enerG」)。函數可使用16階濾波器(例如,十六階增益計算)來估計LP增益。LP分析模塊248也可比較增益與閾值。根據偽碼,閾值具有為64的數值。然而,應理解,偽碼中的閾值僅用作非限制性實例,且其它數值可用作閾值。LP分析模塊248也可確定能量等級(「enerG」)是否超出限值。舉例來說,LP分析模塊248可使用函數「is_numeric_float」確定能量等級是否為「無限的」。如果LP分析模塊248確定能量等級(例如,LP增益)滿足閾值(例如,大於閾值)或超出限值或兩者,則LP分析模塊248可將LP階數從第一值(例如,16)減小到第二值(例如,2或4)以減小LPC飽和度的似然度。

在特定方面中,在由濾波器244確定的信號特徵滿足閾值時(例如,當信號特徵指示輸入信號201在高頻帶部分的較高頻率範圍中具有極少內容或不具有內容時),時間包絡估計模塊262可調整增益形狀參數的值。當編碼這些信號時,增益形狀參數的值的寬擺動在幀間及/或在子幀間發生,從而導致經重建音頻信號的可聽偽訊。舉例來說,如圖3中用圓圈表示,高頻帶偽訊可存在於經重建音頻信號中。本發明的技術在輸入信號201在高頻帶部分或至少其較高頻率區中具有極少內容或無內容時,可通過選擇性地調整增益形狀參數值來實現減小或消除這些偽訊的存在。

如關於第一路徑所描述,在第一操作模式中,高頻帶激勵信號241產生路徑包含降混操作以產生信號217。此降混操作在經由赫伯特變換器實施情況下可為複合的。替代實施可基於正交鏡像濾波器(QMF)。在第二操作模式中,降混操作並非包含於高頻帶激勵信號241產生路徑中。此導致高頻帶激勵信號241與高頻帶目標信號247之間的失配。應了解,根據第二模式(例如,使用濾波器218)產生高頻帶激勵信號241可繞過極零濾波器214及降混器216,且減小與極零濾波及降混器相關聯的複雜且計算上昂貴的操作。儘管圖2描述第一路徑(包含濾波器214及降混器216)及第二路徑(包含濾波器218)與編碼器200的獨特操作模式相關聯,但在其它方面中,編碼器200可經配置而以第二模式操作,而非經配置以又以第一模式操作(例如,編碼器200可省略切換器212、濾波器214、降混器216及切換器220,從而使濾波器218的輸入經耦合以接收經翻轉信號211且使信號219提供到適應性白化及按比例調整模塊222)。

圖4描繪解碼器400的特定方面,所述解碼器可用以解碼經編碼音頻信號,例如由圖1的系統100或圖2的編碼器200產生的經編碼音頻信號。

解碼器400包含接收經編碼音頻信號401的低頻帶解碼器404,例如ACELP核心解碼器404。經編碼音頻信號401為音頻信號的經編碼版本,例如圖2的輸入信號201;且包含對應於音頻信號的低頻帶部分的第一數據402(例如,低頻帶激勵信號205及經量化LSP索引)及對應於音頻信號的高頻帶部分的第二數據403(例如,增益包絡數據463及經量化LSP索引461)。在特定方面中,增益包絡數據463包含增益形狀參數值,其在輸入信號(例如,輸入信號201)在高頻帶部分(或其較高頻率區)中具有極少內容或無內容時經選擇性地調整以限制可變性/動態範圍。

低頻帶解碼器404產生經合成低頻帶解碼信號471。高頻帶信號合成包含提供圖2的低頻帶激勵信號205(或低頻帶激勵信號205的表示,例如低頻帶激勵信號205的接收自編碼器的經量化版本)到圖2的增加採樣器206。高頻帶合成包含如由切換器212及220所控制使用增加採樣器206、非線性變換模塊208、頻譜翻轉模塊210、濾波器214及降混器216(在第一操作模式中)或濾波器218(在第二操作模式)產生高頻帶激勵信號241,且使用適應性白化及按比例調整模塊222來提供第一輸入到圖2的組合器240。到組合器的第二輸入由隨機噪聲產生器230的由噪聲包絡模塊232處理的輸出產生,且在圖2的按比例調整模塊234處進行按比例調整。

圖2的合成濾波器260可根據例如由圖2的編碼器200的量化模塊252輸出的接收自編碼器的LSP量化索引而在解碼器400中配置,且處理由組合器240輸出的激勵信號241以產生經合成信號。經合成信號提供到時間包絡應用模塊462,其經配置以應用例如增益形狀參數值的一或多個增益(例如,根據從圖2的編碼器200的量化模塊264輸出的增益包絡索引)來產生經調整信號。

高頻帶合成以混頻器464進行的處理繼續,所述混頻器經配置以將信號從0Hz到(F2-F1)Hz的頻率範圍升混(upmix)到(F-F2)Hz到(F-F1)Hz(例如,1.6kHz到9.6kHz)的頻率範圍。由混頻器464輸出的升混信號在採樣器466處經增加採樣,且採樣器466的經增加採樣輸出經提供到頻譜翻轉模塊468,所述頻譜翻轉模塊468可如關於頻譜翻轉模塊210所描述而操作,以產生具有從F1Hz擴展到F2Hz的頻帶的高頻帶經解碼信號469。

由低頻帶解碼器404輸出的低頻帶解碼信號471(從0Hz到F1Hz)及從頻譜翻轉模塊468輸出的高頻帶經解碼信號469(從F1Hz到F2Hz)經提供到合成濾波器組470。合成濾波器組470基於低頻帶經解碼信號471與高頻帶經解碼信號469的組合產生經合成音頻信號473,例如圖2的音頻信號201的經合成版本,且具有從0Hz到F2Hz的頻率範圍。

如關於圖2所描述,根據第二模式(例如,使用濾波器218)產生高頻帶激勵信號241可繞過極零濾波器214及降混器216,且減小與極零濾波及降混器相關聯的複合且計算上昂貴的操作。儘管圖4描述第一路徑(包含濾波器214及降混器216)及第二路徑(包含濾波器218)為與解碼器400的獨特操作模式相關聯,但在其它方面中,解碼器400可經配置而以第二模式操作而無需可配置而以第一模式操作(例如,解碼器400可省略切換器212、濾波器214、降混器216及切換器220,使濾波器218的輸入耦合以接收經翻轉信號211並使信號219提供到適應性白化及按比例調整模塊222的輸入)。

參看圖5A,展示基於高頻帶信號特徵調整時間增益參數的方法500的特定方面。在說明性方面中,可由圖1的系統100或圖2的編碼器200執行方法500。

方法500可包含在502處確定音頻信號的高頻帶部分的較高頻率範圍的信號特徵是否滿足閾值。舉例來說,在圖1中,增益調整器162可確定信號特徵126是否滿足閾值165。

前進到504,方法500可產生對應於高頻帶部分的高頻帶激勵信號。方法500可在506處進一步基於高頻帶激勵信號來產生經合成高頻帶部分。舉例來說,在圖1中,高頻帶激勵產生器160可產生高頻帶激勵信號161,且合成模塊164可基於高頻帶激勵信號161產生經合成高頻帶部分。

繼續到508,方法500可基於經合成高頻帶部分與高頻帶部分的比較來確定時間增益參數(例如,增益形狀)的值。方法500還可包含在510處確定信號特徵是否滿足閾值。當信號特徵滿足閾值時,方法500可包含在512處調整所述時間增益參數的值。調整時間增益參數的值可限制時間增益參數的可變性。舉例來說,在圖1中,在高頻帶信號特徵126滿足閾值165(例如,高頻帶信號特徵126指示音頻信號102在高頻帶部分(或至少其較高頻率區)中具有極少內容或無內容)時,增益調整器162可調整增益形狀參數的值。在說明性方面中,調整增益形狀參數的值包含基於歸一化常數(例如,0.315)與增益形狀參數的第一值的特定百分數(例如,10%)的總和來計算增益形狀參數的第二值,如參看圖1描述的偽碼中所展示。

當信號特徵並不滿足閾值時,方法500可包含在514處使用時間增益參數的未調整值。舉例來說,在圖1中,當音頻信號102在高頻帶部分(或至少其較高頻率區)中包含足夠內容時,增益調整器162可避免限制增益形狀參數值的可變性。

在特定方面中,圖5A的方法500可經由例如中央處理單元(CPU)、數位訊號處理器(DSP)或控制器等的處理單元的硬體(例如,現場可編程門陣列(FPGA)裝置、專用集成電路(ASIC)等)實施,經由固件裝置實施,或其任何組合來實施。作為實例,可由執行指令的處理器(如關於圖6所描述)執行圖5A的方法500。

參看圖5B,展示計算高頻帶信號特徵的方法520的特定方面。在說明性方面中,可由圖1的系統100或圖2的編碼器200執行方法520。

方法520包含在522處經由對音頻信號執行頻譜翻轉操作而產生音頻信號的經頻譜翻轉版本以在基帶下處理音頻信號的高頻帶部分。舉例來說,參看圖2,頻譜翻轉模塊242可通過對輸入信號201執行頻譜翻轉操作而產生經翻轉信號243(例如,輸入信號201的頻譜經翻轉版本)。在頻譜上翻轉輸入信號201可實現基帶下處理輸入信號201的高頻帶部分的較高頻率範圍(例如,12到16kHz部分)。

在524處,可基於音頻信號的經頻譜翻轉版本來計算能量值的總和。舉例來說,參看圖1,預處理模塊110可對能量值的總和執行長期求平均運算。能量值可對應於QMF輸出,所述QMF輸出對應於輸入信號201的高頻帶部分的較高頻率範圍。能量值的總和可指示高頻帶信號特徵126。

圖5B的方法520可減小在頻帶受限音頻信號的編碼/解碼期間產生的偽訊。舉例來說,能量值的總和的長期平均值可指示高頻帶信號特徵126。如果高頻帶信號特徵126滿足閾值(例如,信號特徵指示音頻信號為頻帶受限的且具有極少高頻帶內容或無高頻帶內容),則編碼器可調整增益形狀參數的值以限制增益形狀參數的可變性(例如,受限動態範圍)。限制增益形狀參數的可變性可減小在頻帶受限音頻信號的編碼/解碼期間產生的偽訊。

在特定方面中,圖5B的方法520可經由例如中央處理單元(CPU)、數位訊號處理器(DSP)或控制器的處理單元的硬體(例如,現場可編程門陣列(FPGA)裝置、專用集成電路(ASIC)等)實施,經由固件裝置實施,或其任何組合實施。作為實例,可由執行指令的處理器(如關於圖6所描述)執行圖5B的方法520。

參看圖5C,展示調整編碼器的LPC的方法540的特定方面。在說明性方面中,可由圖1的系統100或圖2的LP分析模塊248執行方法540。根據一個實施,LP分析模塊248可根據上文所描述以執行方法540的對應偽碼而操作。

方法540包含於542處在編碼器處基於使用線性預測(LP)階數的第一值的LP增益操作來確定LP增益。所述LP增益可與LP合成濾波器的能量等級相關聯。舉例來說,參看圖2,LP分析模塊248可基於使用LP階數的第一值的LP增益計算來確定LP增益。根據一個實施,第一值對應於十六階濾波器。所述LP增益可與LP合成濾波器260的能量等級相關聯。舉例來說,能量等級可對應於脈衝響應能量等級,其基於音頻幀的音頻幀大小且基於針對音頻幀產生的LPC的數目。合成濾波器260(例如,LP合成濾波器)可對從低頻帶激勵信號的非線性擴展產生(例如,從經帶寬擴展信號209產生)的高頻帶激勵信號241作出響應。

在544處,可比較LP增益與閾值。舉例來說,參看圖2,LP分析模塊248可比較LP增益與閾值。在546處,如果LP增益滿足閾值,則LP階數可從第一值減小到第二值。舉例來說,參看圖2,如果LP增益滿足(例如,高於)閾值,則LP分析模塊248可將LP階數從第一值減小到第二值。根據一個實施,第二值對應於二階濾波器。根據另一實施,第二值對應於四階濾波器。

方法540還可包含確定能量等級是否超出限值。舉例來說,參看圖2,LP分析模塊248可確定合成濾波器260的能量等級是否超出限值(例如,可使得能量值被解釋為具有不正確數值的「無限」限值)。LP階數響應於合成濾波器260的能量等級超出限值而可從第一值減小到第二值。

在特定方面中,圖5C的方法540可經由例如CPU、DSP或控制器的處理單元的硬體(例如,FPGA裝置、ASIC等)實施,經由固件裝置實施,或其任何組合來實施。作為實例,可由執行指令的處理器(如關於圖6所描述)執行圖5C的方法540。

參看圖6,裝置(例如,無線通信裝置)的特定說明性方面的框圖經描繪並通常指定為600。在各種方面中,裝置600可具有比圖6中所說明較少或較多的組件。在說明性方面中,裝置600可對應於一或多個系統、設備或參看圖1、2及4描述的裝置的一或多個組件。在說明性方面中,裝置600可根據例如圖5A的方法500、圖5B的方法520及/或圖5C的方法540的全部或一部分的本文中所描述的一或多種方法而操作。

在特定方面中,裝置600包含處理器606(例如,中央處理單元(CPU))。裝置600可包含一或多個額外處理器610(例如,一或多個數位訊號處理器(DSP))。處理器610可包含話音及音樂解碼器解碼器(解碼解碼器)608及回波消除器612。話音及音樂解碼解碼器608可包含聲碼器編碼器636、聲碼器解碼器638或所述兩者。

在特定方面中,聲碼器編碼器636可包含圖1的系統100或圖2的編碼器200。聲碼器編碼器636可包含增益形狀調整器662,其經配置以基於高頻帶信號特徵來選擇性地調整時間增益信息(例如,增益形狀參數值)(例如,當高頻帶信號特徵指示輸入音頻信號在高頻帶部分的較高頻率範圍內具有極少內容或無內容)。

聲碼器解碼器638可包含圖4的解碼器400。舉例來說,聲碼器解碼器638可經配置以基於經調整的增益形狀參數值執行信號重建672。儘管話音及音樂解碼解碼器608說明為處理器610的組件,但在其它方面中,話音及音樂解碼解碼器608的一或多個組件可包含於處理器606、解碼解碼器634、另一處理組件或其組合中。

裝置600可包含存儲器632及經由收發器650耦合到天線642的無線控制器640。裝置600可包含耦合到顯示控制器626的顯示器628。揚聲器648、麥克風646或所述兩者可耦合到解碼解碼器634。解碼解碼器634可包含數/模轉換器(DAC)602及模/數轉換器(ADC)604。

在特定方面中,解碼解碼器634可從麥克風646接收模擬信號、使用模/數轉換器604將模擬信號轉換成數位訊號並將數位訊號例如以脈碼調製(PCM)格式提供到話音及音樂解碼解碼器608。話音及音樂解碼解碼器608可處理數位訊號。在特定方面中,話音及音樂解碼解碼器608可將數位訊號提供到解碼解碼器634。解碼解碼器634可使用數/模轉換器602將數位訊號轉換成模擬信號且可將模擬信號提供到揚聲器648。

存儲器632可包含指令656,所述指令可由處理器606、處理器610、解碼解碼器634、裝置600的另一處理單元或其組合執行以執行本文中所揭示的方法及過程(例如,圖5A到5B的方法中的一或多者)。圖1、2或4的系統的一或多個組件可由執行指令以執行一或多個任務或其組合的處理器經由專用硬體(例如,電路)來實施。作為實例,存儲器632或處理器606、處理器610及/或解碼解碼器634的一或多個組件可為存儲器裝置,例如隨機存取存儲器(RAM)、磁阻式隨機存取存儲器(MRAM)、自旋扭矩轉移MRAM(STT-MRAM)、快閃記憶體存儲器、只讀存儲器(ROM)、可編程只讀存儲器(PROM)、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPROM)、寄存器、硬碟、裝卸式磁碟或光碟只讀存儲器(CD-ROM)。存儲器裝置可包含指令(例如,指令656),其在由計算機(例如,解碼解碼器634中的處理器、處理器606及/或處理器610)執行時可使得計算機執行圖5A到5B的方法的至少一部分。作為實例,存儲器632或處理器606、處理器610、解碼解碼器634的一或多個組件可為包含指令(例如,指令656)的非暫時性計算機可讀媒體,所述指令在由計算機(例如,解碼解碼器634中的處理器、處理器606及/或處理器610)執行時使得計算機執行圖5A到5B的方法的至少一部分。

在特定方面中,裝置600可包含於系統級封裝或系統單晶片裝置622(例如,移動臺數據機(MSM))中。在特定方面中,處理器606、處理器610、顯示控制器626、存儲器632、解碼解碼器634、無線控制器640及收發器650包含於系統級封裝或系統單晶片裝置622中。在特定方面中,例如觸控式屏幕及/或小鍵盤等的輸入裝置630及電力供應器644耦合到系統單晶片裝置622。此外,在特定方面中,如圖6中所說明,顯示器628、輸入裝置630、揚聲器648、麥克風646、天線642及電力供應器644在系統單晶片裝置622外部。然而,顯示器628、輸入裝置630、揚聲器648、麥克風646、天線642及電力供應器644中的每一者可耦合到系統單晶片裝置622的組件,例如接口或控制器。在說明性方面中,裝置600對應於移動通信裝置、智慧型電話、蜂窩式電話、可攜式計算機、計算機、平板計算機、個人數字助理、顯示裝置、電視、遊戲控制臺、音樂播放器、收音機、數字視頻播放器、光碟播放器、調諧器、攝像機、導航裝置、解碼器系統、編碼器系統或其任何組合。

在說明性方面中,處理器610可操作以根據所描述技術執行信號編碼及解碼操作。舉例來說,麥克風646可擷取音頻信號。ADC 604可將所擷取音頻信號從模擬波形轉換成包含數字音頻樣本的數字波形。處理器610可處理數字音頻樣本。回波消除器612可減少可已由進入麥克風646的揚聲器648的輸出所產生的回波。

聲碼器編碼器636可壓縮對應於經處理話音信號的數字音頻樣本且可形成發射包(例如,數字音頻樣本的經壓縮位表示)。舉例來說,發射包可對應於圖1的位流192的至少一部分。發射包可存儲在存儲器632中。收發器650可調製某一形式的發射包(例如,可將其它信息隨附於所述發射包)且可經由天線642發射經調製數據。

作為另一實例,天線642可接收包含接收包的傳入包。可由另一裝置經由網絡發送接收包。舉例來說,接收包可對應於在圖4的ACELP核心解碼器404處接收到的位流的至少一部分。聲碼器解碼器638可解壓縮並解碼接收包以產生經重建音頻樣本(例如,對應於經合成音頻信號473)。回波消除器612可移除來自經重建音頻樣本的回波。DAC602可將聲碼器解碼器638的輸出從數字波形轉換成模擬波形且可將經轉換波形提供到揚聲器648以用於輸出。

所屬領域的一般技術人員將進一步了解,各種說明性邏輯塊、配置、模塊、電路及結合本文中所揭示的方面描述的算法步驟可實施為電子硬體、由例如硬體處理器的處理裝置執行的計算機軟體,或兩者的組合。上文已大體在功能性方面描述了各種說明性組件、塊、配置、模塊、電路及步驟。此功能性經實施為硬體或是軟體取決於特定應用及強加於整個系統的設計約束。對於每一特定應用來說,所屬領域的一般技術人員可以變化的方式實施所描述的功能性,但不應將所述實施決策解釋為導致脫離本發明的範圍。

結合本文中所揭示的方面所描述的方法或算法的步驟可直接具體化於硬體中、由處理器執行的軟體模塊中或兩者的組合中。軟體模塊可駐留於存儲器裝置中,例如隨機存取存儲器(RAM)、磁阻式隨機存取存儲器(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體存儲器、只讀存儲器(ROM)、可編程只讀存儲器(PROM)、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程只讀存儲器(EEPROM)、寄存器、硬碟、裝卸式磁碟或光碟只讀存儲器(CD-ROM)。例示性存儲器裝置耦合到處理器,使得處理器可從存儲器裝置讀取信息並將信息寫入到存儲器裝置。在替代方案中,存儲器裝置可與處理器成一體式。處理器及存儲媒體可駐留於專用集成電路(ASIC)中。ASIC可駐留於計算裝置或用戶終端機中。在替代例中,處理器及存儲媒體可作為離散組件駐留於計算裝置或用戶終端機中。

提供所揭示方面的先前描述以使得所屬領域的一般技術人員能夠製作或使用所揭示方面。對於所屬領域的一般技術人員來說,對這些方面的各種修改將易於顯而易見,且可在不背離本發明的範圍的情況下將本文中所界定的一般原理應用於其它方面。因此,本發明並非意欲限於本文中所展示的實施例,而應符合可能與如以下權利要求書所界定的原理及新穎特徵相一致的最廣泛範圍。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀