一種用於音頻處理框架中的編碼和解碼方法
2023-12-08 23:17:11 4
專利名稱:一種用於音頻處理框架中的編碼和解碼方法
技術領域:
本發明涉及信號處理中的編、解碼技術,特別是一種用於音頻處理框 架中的編碼和解碼方法。
背景技術:
音頻編解碼技術主要包括可以很好利用心理聲學模型的T/F (時/頻) 轉換的方法,和對音頻信號模型參數提取的方法。現有的音頻處理框架中, AAC (Advance Audio Coding,高級音頻編碼)框架利用的是T/F轉換的 方法,而AMR-WB十(Extended Adaptive Multi-rate wideband Codec,多碼 率可調寬帶擴展編解碼)框架則同時利用了這兩種方法從而對不同信號進 行不同處理。
該AMR-WB+框架包括預處理,TCX/ACELP複合激勵編解碼,立 體聲處理,帶寬擴展4個部分。其中,該TCX/ACELP複合激勵編碼方法 流程如圖1所示預處理後的低頻信號將將繼續進行模式選擇,該模式選 擇是對各TCX (Transform coded excitation,變換編碼激勵)模式和ACELP (Algebraic Code Excited Linear Prediction,線性預測及代數碼本激勵)模 式的選擇;然後再對信號進行LPC (linear prediction coding,線性預測編 碼)分析,然後依據上述模式選擇的結果進行TCX80、 TCX40、 TCX20、ACELP中某一種模式進行編碼流程後將編碼碼流輸出。該TCX20、 TCX40、 TCX80三種模式均依次包括加權濾波、T/F轉換、參數量化步驟。 再請參閱圖2,它是對應於上述編碼方法的解碼方法。如圖所示該方法 依次包括碼流解析、TCX和ACELP模式選擇、TCX80或TCX40或TCX20 或ACELP解碼流程後輸出低頻碼流;其中,TCX80、 TCX40、 TCX20解 碼流程進一步包括FAT轉換和LPC綜合等步驟。
在上述AMR-WB+採用的TCX/ACELP複合激勵編解碼方法中,TCX
所採用變換編碼激勵方法主要適合較高碼率的音頻編解碼,可以在大於 24kbps的情況對寬帶音頻獲得較好的輸出。而AMR-WB+的比特率範圍是 6kbps到48kbps,這樣在極低碼率的情況下,TCX方法對信號頻譜直接量 化,將會使得較大的量化誤差存在於信號的整個頻譜範圍內,因此使得最 終解碼輸出的主觀質量降低。
發明內容
本發明的目的在於提供一種用於音頻處理框架中的編碼和解碼方法, 主要解決上述現有技術中所存在的技術問題,它基於信號的產生機理出 發,對信號的產生模型進行模擬,使用模型參數來對信號信息進行提取, 以此減少所需量化的參數,提高各參數的量化比特數;同時可以依據各模 型參數的重要性不同來進行比特分配,進一步保證對信號中重要信息的保 留,提髙壓縮信號的主觀質量。
為解決上述問題,本發明是這樣實現的
一種用於音頻處理框架中的編碼方法,其特徵是該方法步驟為
A經過預處理後的低頻段信號首先通過PCX (Parametric Coded excitation,模型參數編碼激勵)/ACELP模式選擇,然後對信號進行LPC 分析;
B依據模式選擇的結果,進入ACELP或PCX其中一種模式進行編碼; 對於PCX模式,首先對輸入低頻信號進行LPC綜合及感知加權處理,獲 取LPC殘差;然後對LPC殘差進行模型參數提取,最後將LPC係數及模 型參數一起進行量化編碼。
所述的用於音頻處理框架中的編碼方法,其特徵是所述步驟B中的模 型參數提取步驟為
Bl對信號進行正弦模型參數提取,提取參數包括正弦頻率及其對應幅 度、相位;
B2結合B1中提取的參數對正弦殘差進行編碼。 所述的用於音頻處理框架中的編碼方法,其特徵是所述步驟B2進一 步包括
B21對提取的正弦分量進行合成,合成過程中,要充分考慮前後幀的 頻率分量的連續性,並對前後幀相應幅度,相位做相應插值平滑;LPC殘 差和正弦合成信號之差包含了信號中的暫態及噪聲分量即正弦殘差;
B22正弦殘差經過暫態信號處理提取暫態分量;
B23暫態提取後的殘差,即信號的噪聲分量,提取頻譜LPC殘差頻譜 對應的BARK BAND能量作為噪聲分量參數。
所述的用於音頻處理框架中的編碼方法,其特徵是所述步驟B22進一步包括
B221將正弦殘差經過T/F變換轉換到頻域;
B222對殘差信號頻譜進行LPC線性預測分析,從而達到對信號時域 包絡的提取。
所述的用於音頻處理框架中的編碼方法,其特徵是所述步驟B中在獲 取LPC殘差後,首先對LPC殘差進行暫態判定,並採用不同幀長的模型 參數編碼方法,使用短幀來提高時域解析度,以減少暫態信號編碼時造成 的預回聲現象;或者對判定出的暫態使用幅度按指數衰減的正弦模型來提 取。
所述的用於音頻處理框架中的編碼方法,其特徵是所述步驟B中將 LPC殘差通過濾波器組將信號分成多頻帶,以不同的分析長度對信號不同 頻帶進行模型參數編碼,實現多解析度的模型參數編碼激勵。
一種用於音頻處理框架中的解碼方法,對應於如上所述的編碼方法, 其特徵是它包括如下步驟
C輸入碼流經過解析和反量化獲得編碼模式,ACELP參數或PCX參
數;
D依據解碼獲得的模式進入不同的解碼分支;對於PCX的解碼,通過 模型參數使用和編碼端相應模型的合成方法,合成LPC激勵信號,該信 號通過時域LPC濾波,獲取最終低頻信號。
所述的用於音頻處理框架中的解碼方法,其特徵是步驟D中通過模型
參數使用和編碼端相應模型的合成方法進一步包括
Dl通過模型參數進行殘差合成,通過BARK BAND (頻帶)能量加上隨機相位獲取重構殘差頻譜;
D2通過暫態參數和重構的殘差信號合成獲得除正弦外的信號分量;用 殘差頻譜通過頻域LPC濾波器重構暫態頻譜,再通過F/T轉換獲取正弦 殘差;
D3通過正弦頻率、幅度、相位參數進行正弦合成;
D4正弦合成後的正弦分量與重構的正弦殘差相加即時域LPC分析的 激勵信號,該信號通過時域LPC濾波,獲取最終低頻信號。
所述的用於音頻處理框架中的解碼方法,其特徵是所述步驟D3的合 成過程中要考慮到前後幀的正弦連續性,對相應參數進行平滑插值;或者 使用編碼端傳輸的前後幀正弦連續性的信息,直接進行合成。
藉由上述技術方案,本發明的有益效果是
本發明方法減少了所需量化的參數,提高了各參數的量化精度,保證 了編碼信號的主觀質量。實施例中所描述正弦暫態噪聲模型為例,所需量 化參數包括正弦頻率、幅度、相位、頻域LPC係數、BARK BAND噪聲能量。 對512個樣值將提取32個正弦頻率/幅度/相位,使用8階頻域LPC, 20 個BARK BAND能量,總計124個參數。而對於TCX編碼激勵,所需量化參 數為512個頻譜值,是模型參數編碼激勵所需量化參數的4倍多。
圖1是現有AMR-WB+框架編碼方法流程示意圖; 圖2是現有AMR-WB+框架解碼方法流程示意圖; 圖3是本發明方法的AMR-WB+框架編碼實施例的流程示意圖4是本發明編碼實施例中模型參數編碼激勵編碼流程示意圖5是本發明方法的AMR-WB+框架解碼實施例的流程示意圖;
圖6是本發明解碼實施例中模型參數編碼激勵解碼流程示意圖。
具體實施例方式
本發明提供了一種用於音頻處理框架中的編碼和解碼方法。以下結合 圖3—4,通過一基於AMR-WB+框架的編碼實施例介紹本發明的編碼流 程。
如圖3,經過預處理後的低頻段信號,將首先通過PCX/ACELP模式選 擇,然後對信號進行LPC分析,然後依據模式選擇的結果,進入ACELP 或PCX其中一種模式進行編碼。對於ACELP編碼,將使用AMR—WB 十中原有方法;對於PCX編碼,首先對輸入低頻信號進行LPC綜合及感 知加權處理,獲取LPC殘差。然後對LPC殘差進行模型參數提取,最後 將LPC係數及模型參數一起進行量化編碼即完成了對低頻段信號的編碼 過程。
再請結合參閱圖4,該模型參數提取步驟是首先對信號進行正弦模 型參數提取,提取參數將包括正弦頻率及其對應幅度相位。然後對正弦殘 差進行編碼,為了對殘差進行編碼,需要對提取的正弦分量進行合成,合 成過程中,要充分考慮前後幀的頻率分量的連續性,並對前後幀相應幅度, 相位做相應插值平滑。LPC殘差和正弦合成信號之差包含了信號中的暫態 及噪聲分量一一正弦殘差。正弦殘差經過暫態信號處理提取暫態分量,提
取方法可以首先將正弦殘差經過T/F變換轉換到頻域,然後對殘差信號頻譜進行LPC線性預測分析,從而達到對信號時域包絡的提取。經過暫態提取後的殘差,即信號的噪聲分量即非周期性分量,可以利用人耳聽覺對非周期性信號的具體頻譜形狀及相位不敏感,不能區分非周期性信號在一定頻帶(BARKBAND)中的能量變化的特性,提取頻譜LPC殘差頻譜對應的BARK BAND能量作為噪聲分量參數。這裡,首次將頻域線性預測方法提取暫態信號的方法應用到了模型參數編碼中.
基於以上方法,還可以使用對LPC殘差,首先進行暫態判定,採用不同幀長的模型參數編碼方法,使用短幀來提高時域解析度,以減少暫態信號編碼時造成的預回聲現象。或者使用對判定出的暫態信號採取短時時頻變換編碼的方法,進行編碼。或者使用將LPC殘差通過濾波器組將信號依據頻率分成多個頻帶,依據不同頻帶,使用不同的幀長進行模型參數分析的方法,以提高模型參數分析的準確度。或者對判定出的暫態使用幅度按指數衰減的正弦模型來提取。
再請參閱圖5、 6,它是對應於上述編碼實施例的解碼實施例。如圖5所示首先,將輸入碼流經過解析和反量化獲得編碼模式,ACELP參數或PCX參數。再依據解碼獲得的模式進入不同的解碼分支;其中,對於ACELP的解碼,將使用AMR—WB+相同的方法;對於PCX的解碼,通過模型參數使用和編碼端相應模型的合成方法,合成LPC激勵信號,該信號通過時域LPC濾波,獲取最終低頻信號。從而實現對應PCX核心編碼的解碼過程。
對應以上所描述PCX編碼示例方法,如圖6所示,可以首先通過模型參數進行殘差合成,通過BARK BAND能量加上隨機相位獲取重構殘 差頻譜。然後通過暫態參數和重構的殘差信號合成獲得除正弦外的信號分 量,可以用殘差頻譜通過頻域LPC濾波器重構暫態頻譜,再通過F/T轉 換獲取正弦殘差。通過正弦頻率、幅度、相位參數進行正弦合成,合成過 程中要考慮到前後幀的正弦連續性,對相應參數進行平滑插值。或者使用 編碼端傳輸的前後幀正弦連續性的信息,直接進行合成。正弦合成後的正 弦分量與重構的正弦殘差相加即時域LPC分析的激勵信號,該信號通過 時域LPC濾波,獲取最終低頻信號。
綜上所述僅為本發明的較佳實施例而已,並非用來限定本發明的實施 範圍。即凡依本發明申請專利範圍的內容所作的等效變化與修飾,都應為 本發明的技術範疇。
權利要求
1、一種用於音頻處理框架中的編碼方法,其特徵是該方法步驟為A經過預處理後的低頻段信號首先通過PCX/ACELP模式選擇,然後對信號進行LPC分析;B依據模式選擇的結果,進入ACELP或PCX其中一種模式進行編碼;對於PCX模式,首先對輸入低頻信號進行LPC綜合及感知加權處理,獲取LPC殘差;然後對LPC殘差進行模型參數提取,最後將LPC係數及模型參數一起進行量化編碼。
2、 根據權利要求1所述的用於音頻處理框架中的編碼方法,其特徵 是所述步驟B中的模型參數提取步驟為Bl對信號進行正弦模型參數提取,提取參數包括正弦頻率及其對應幅 度、相位;B2結合Bl中提取的參數對正弦殘差進行編碼。
3、 根據權利要求2所述的用於音頻處理框架中的編碼方法,其特徵是 所述步驟B2進一步包括B21對提取的正弦分量進行合成,合成過程中,要充分考慮前後幀的 頻率分量的連續性,並對前後幀相應幅度,相位做相應插值平滑;LPC殘 差和正弦合成信號之差包含了信號中的暫態及噪聲分量即正弦殘差;B22正弦殘差經過暫態信號處理提取暫態分量;B23暫態提取後的殘差,即信號的噪聲分量,提取頻譜LPC殘差頻譜 對應的BARK BAND能量作為噪聲分量參數。
4、 根據權利要求3所述的用於音頻處理框架中的編碼方法,其特徵是 所述步驟B22進一步包括B221將正弦殘差經過T/F變換轉換到頻域;B222對殘差信號頻譜進行LPC線性預測分析,從而達到對信號時域 包絡的提取。
5、 根據權利要求1所述的用於音頻處理框架中的編碼方法,其特徵是 所述步驟B中在獲取LPC殘差後,首先對LPC殘差進行暫態判定,並採 用不同幀長的模型參數編碼方法,使用短幀來提高時域解析度,以減少暫 態信號編碼時造成的預回聲現象;或者對判定出的暫態使用幅度按指數衰 減的正弦模型來提取。
6、 根據權利要求5所述的用於音頻處理框架中的編碼方法,其特徵是 所述步驟B中將LPC殘差通過濾波器組將信號分成多頻帶,以不同的分析 長度對信號不同頻帶進行模型參數編碼,實現多解析度的模型參數編碼激 勵。
7、 一種用於音頻處理框架中的解碼方法,對應於如權利要求l或2或 3或4或5或6所述的編碼方法,其特徵是它包括如下步驟C輸入碼流經過解析和反量化獲得編碼模式,ACELP參數或PCX參數;D依據解碼獲得的模式進入不同的解碼分支;對於PCX的解碼,通過 模型參數使用和編碼端相應模型的合成方法,合成LPC激勵信號,該信 號通過時域LPC濾波,獲取最終低頻信號。
8、 根據權利要求7所述的用於音頻處理框架中的解碼方法,其特徵是步驟D中通過模型參數使用和編碼端相應模型的合成方法進一步包括 Dl通過模型參數進行殘差合成,通過BARK BAND能量加上隨機相位獲取重構殘差頻譜;D2通過暫態參數和重構的殘差信號合成獲得除正弦外的信號分量;用殘差頻譜通過頻域LPC濾波器重構暫態頻譜,再通過FAT轉換獲取正弦殘差;D3通過正弦頻率、幅度、相位參數進行正弦合成;D4正弦合成後的正弦分量與重構的正弦殘差相加即時域LPC分析的 激勵信號,該信號通過時域LPC濾波,獲取最終低頻信號。
9、根據權利要求8所述的用於音頻處理框架中的解碼方法,其特徵是 所述步驟D3的合成過程中要考慮到前後幀的正弦連續性,對相應參數進 行平滑插值;或者使用編碼端傳輸的前後幀正弦連續性的信息,直接進行 合成。
全文摘要
一種用於音頻處理框架中的編碼和解碼方法,該編碼方法步驟為A經預處理後的低頻段信號先通過PCX/ACELP模式選擇,再對信號進行LPC分析;B依據選擇的結果,進入ACELP或PCX模式進行編碼;對於PCX模式,先對輸入低頻信號進行LPC綜合及感知加權處理,獲取LPC殘差;再對LPC殘差進行模型參數提取,最後將LPC係數及模型參數一起進行量化編碼。解碼步驟為C輸入碼流經過解析和反量化獲得編碼模式,ACELP參數或PCX參數;D依據解碼獲得的模式進入不同的解碼分支;對於PCX的解碼,通過模型參數使用和編碼端相應模型的合成方法,合成LPC激勵信號,該信號通過時域LPC濾波,獲取最終低頻信號。
文檔編號H03M7/30GK101197577SQ20061011930
公開日2008年6月11日 申請日期2006年12月7日 優先權日2006年12月7日
發明者張本好, 曇 李, 林福輝, 黃鶴雲 申請人:展訊通信(上海)有限公司