用於語音編碼的混合碼本激勵的系統和方法
2023-05-05 20:29:51 1
用於語音編碼的混合碼本激勵的系統和方法
【專利摘要】根據實施例,一種編碼音頻/語音信號的方法包括基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括來自第一碼本的第一碼本條目和來自第二碼本的第二碼本條目的總和。所述方法進一步包括基於所述確定的混合碼本向量生成已編碼的音頻信號,以及發送所述確定的混合碼本向量的碼激勵索引。
【專利說明】用於語音編碼的混合碼本激勵的系統和方法
[0001] 本發明要求2013年2月15日遞交的發明名稱為"用於語音編碼的混合碼本激 勵的系統和方法(System and Method for Mixed Codebook Excitation for Speech Coding)"的第13/768814號美國非臨時申請案、2012年2月17日遞交的發明名稱為"語 音編碼的激勵的脈衝噪聲混合碼本結構(Pulse-Noise Mixed Codebook Structure of Excitation for Speech Coding)"的第61/599937號美國臨時申請案以及2012年2月17日 遞交的發明名稱為"語音編碼的混合碼本激勵的快速搜索方法(Fast Searching Approach of Mixed Codebook Excitation for Speech Coding)" 的第 61/599938 號美國臨時申請 案,這些在先申請的內容以全文引用的方式併入本文中。
【技術領域】
[0002] 本發明大體涉及信號編碼領域。具體而言,本發明涉及低比特率語音編碼領域。
【背景技術】
[0003] 傳統來講,所有的參數語音編碼方法利用語音信號本身的冗餘,來減少必須要發 送的信息量並估算一個信號的語音樣本在短時段內的參數。這種冗餘主要起因於語音波形 周期性的重複和語音信號的頻譜包絡慢變過程。
[0004] 語音波形的冗餘對應於不同類型的語音信號,例如濁音和清音。就濁音語音而言, 語音信號基本上是周期性的;然而,這種周期性在語音段中是變化的,而且周期波形在語音 段之間緩慢變化。低比特率的語音編碼可以很大地受益於這種周期性。濁音語音周期還稱 為基音周期,這種基音周期預測通常被命名為長時預測(LTP :L〇ng-Term Prediction)。至 於清音語音,其信號更像是一個隨機噪聲,可預測性也較小。
[0005] 針對任一種情形,參數編碼可用於通過分割頻譜包絡分量和語音信號的激勵分 量來減少語音段的冗餘。頻譜包絡慢變過程可以被描述成線性預測編碼(LPC:Linea r Prediction Coding),也稱為短時預測(STP:Short_Term Prediction)。低比特率的語音 編碼也同樣受益於短時預測。這種編碼的優點就來自於參數的慢速變化。然而,參數值不 會在幾毫秒內有很大不同。因此,在8千赫茲(kHz)、12. 8kHz或16kHz採樣率時,語音編碼 算法將10毫秒至30毫秒範圍內的語音段作為常用的幀長,其中20毫秒是最常用的幀長。 在G. 723. 1、G. 729、G. 718、EFR、SMV、AMR、VMR-WB或AMR-WB等較近期的知名標準中已經採 用了碼激勵線性預測技術(〃CELP〃:Code Excited Linear Prediction Technique),CELP 通常理解為一種碼激勵、長時預測和短時預測技術的結合。儘管不同編解碼器的CELP細節 可能顯著不同,但利用碼激勵線性預測(CELP:Code_Excited Linear Prediction)的語音 編碼算法在語音壓縮領域已經相當流行。
[0006] 圖1示出了常規CELP編碼器,其中利用所謂的綜合分析方法最小化合成語音102 和原始語音101之間的加權誤差109。W(z)是誤差加權濾波器110,1/B(z)是長時線性預 測濾波器105,以及1/A(z)是短時線性預測濾波器103。碼激勵108,也稱為固定碼本激勵, 在通過線性濾波器之前乘以增益Gcl06。短時線性預測濾波器103通過分析原始信號101
[0007] ,、 獲取並由一組係數表示:
【權利要求】
1. 一種編碼音頻/語音信號的方法,其特徵在於,所述方法包括: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於第一碼本,所述第二碼本條目屬於第二碼本,其 中所述第一碼本包括類脈衝條目,所述第二碼本包括類噪聲條目; 基於所述確定的混合碼本向量生成已編碼的音頻信號;以及 發送所述確定的混合碼本向量的碼激勵索引,其中使用基於硬體的音頻編碼器執行所 述確定和生成。
2. 根據權利要求1所述的方法,其特徵在於,所述第一碼本和所述第二碼本都包括固 定碼本。
3. 根據權利要求1所述的方法,其特徵在於,所述確定混合碼本向量包括: 計算已濾波的目標向量和所述第一碼本中已濾波的條目之間的第一相關係數,其中所 述已濾波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述第二碼本中已濾波的條目之間的相關係數; 確定第二組最高第二相關係數;以及 計算所述第一組最高第一相關係數和所述第二組最高第二相關係數的組合的第一判 據函數,其中所述第一判據函數包括所述第一組最高第一相關係數中的一個、所述第二組 最高第二相關係數中的一個以及所述第一碼本和所述第二碼本的對應條目的能量的函數。
4. 根據權利要求3所述的方法,其特徵在於,進一步包括: 基於計算出的最大第一判據函數確定第三組候選相關係數;以及 基於將第二判據函數應用於所述第三組候選相關係數來選擇所述混合碼本向量,其中 所述混合碼本向量對應於來自所述第一碼本的與所述第二判據函數的最大值相關聯的碼 本條目以及所述第二碼本的與所述第二判據函數的最大值相關聯的碼本條目。
5. 根據權利要求4所述的方法,其特徵在於: 所述第一判據函數為:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的 相關係數,R_CB2(j)是已濾波的目標向量和所述第二碼本中第j個條目之間的相關係數, E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本中 的所述第j個條目的能量,I:是所述第一組最高第一相關係數中第一碼本條目的數目, 1^2是所述第二組最高第二相關係數中第二碼本條目的數目;以及 所述第二判據函數為:
其中Zc:B1(ik)是所述第一碼本中所述第i個條目的已濾波的向量,zra2(j k)是所述第二 碼本的所述第j個條目的已濾波的向量以及K是所述第三組候選相關係數的條目數目。
6. 根據權利要求3所述的方法,其特徵在於,基於計算出的最高第一判據函數選擇所 述混合碼本向量。
7. 根據權利要求6所述的方法,其特徵在於,所述第一判據函數是:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的相 關係數,R-CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關係 數,E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本 中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 是所述第二組最高第二相關係數中第二碼本條目的數目。
8. 根據權利要求3所述的方法,其特徵在於,進一步包括計算來自所述第一碼本和所 述第二碼本的所述對應條目的能量。
9. 根據權利要求3所述的方法,其特徵在於,將來自所述第一碼本和所述第二碼本的 對應條目的所述能量存儲在存儲器中。
10. 根據權利要求3所述的方法,其特徵在於,所述第一組最高第一相關係數比第二組 最高第二相關係數包括更多的條目。
11. 根據權利要求1所述的方法,其特徵在於,進一步包括: 將第一強調函數應用於所述第一碼本條目;以及 將第二強調函數應用於所述第二碼本條目。
12. 根據權利要求11所述的方法,其特徵在於: 所述第一強調函數包括低通濾波函數;以及 所述第二強調函數包括高通濾波函數。
13. 根據權利要求1所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括處理 器。
14. 根據權利要求1所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括專用硬 件。
15. -種用於編碼音頻/語音信號的系統,其特徵在於,所述系統包括: 基於硬體的音頻編碼器用於: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於類脈衝碼本,所述第二碼本條目屬於類噪聲碼 本。 基於所述確定的混合碼本向量生成已編碼的音頻/語音信號;以及 發送所述確定的混合碼本向量的碼激勵索引。
16. 根據權利要求15所述的系統,其特徵在於,所述基於硬體的音頻編碼器進一步用 於: 計算已濾波的目標向量和所述類脈衝碼本中條目之間的第一相關係數,其中所述已濾 波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述類噪聲碼本中條目之間的相關係數; 確定第二組最高第二相關係數;以及 計算所述第一組最高第一相關係數和第二組最高第二相關係數的組合的第一判別函 數,其中所述第一判別函數包括所述第一組最高第一相關係數中第一個、所述第二組最高 第二相關係數中的一個以及所述類脈衝碼本和所述類噪聲碼本的對應條目的能量的函數。
17. 根據權利要求16所述的系統,其特徵在於,進一步包括存儲器,用於存儲來自所述 類脈衝碼本和所述類噪聲碼本的對應條目的所述能量值。
18. 根據權利要求16所述的系統,其特徵在於,所述基於硬體的音頻編碼器還用於基 於計算出的最大第一判據函數選擇所述混合碼本向量。
19. 根據權利要求16所述的方法,其特徵在於,所述第一判據函數是:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的相 關係數,R-CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關係 數,E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本 中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 夂是所述第二組最高第二相關係數中第二碼本條目的數目。
20. 根據權利要求15所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括處理 器。
21. 根據權利要求15所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括專用 硬體。
22. -種用於編碼音頻/語音信號的混合碼本的快速搜索方法,其特徵在於,所述方法 包括: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於第一碼本,所述第二碼本條目屬於第二碼本; 計算已濾波的目標向量和所述第一碼本中已濾波的條目之間的第一相關係數,其中所 述已濾波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述第二碼本中已濾波的條目之間的相關係數; 確定第-組最1?第-相關係數; 計算所述第一組最高第一相關係數和所述第二組最高第二相關係數的組合的第一 判別函數,其中所述第一判別函數包括所述第一組最高第一相關係數中的一個、所述第二 組最高第二相關係數中的一個以及所述第一碼本和所述第二碼本的對應條目的能量的函 數; 基於計算出的最大第一判別函數確定第三組候選相關係數; 基於將第二判據函數應用於所述第三組候選相關係數來選擇所述混合碼本向量,其中 所述混合碼本向量對應於來自所述第一碼本的與所述第二判據函數的最大值相關聯的碼 本條目和所述第二碼本的與所述第二判據函數的最大值相關聯的碼本條目; 基於所述確定的混合碼本向量生成已編碼的音頻信號;以及 發送所述確定的混合碼本向量的碼激勵索引,其中使用基於硬體的音頻編碼器執行所 述確定和生成。
23. 根據權利要求22所述的方法,其特徵在於: 所述第一判據函數為:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的 相關係數,R_CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關 係數,E-CBl(i)是所述第一碼本中所述第i個條目的能量以及E-CB2(i)是所述第二碼 本中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 是所述第二組最高第二相關係數中第二碼本條目的數目;以及 所述第二判據函數為:
其中Zc:B1(ik)是所述第一碼本的所述第i個條目的已濾波的向量,zra2(j k)是所述第二 碼本的所述第j個條目的已濾波的向量以及K是所述第三組候選相關係數的條目數目。
24. 根據權利要求22所述的方法,其特徵在於,所述第一碼本包括類脈衝碼本,所述第 二碼本包括類噪聲碼本。
【文檔編號】G10L19/12GK104126201SQ201380009887
【公開日】2014年10月29日 申請日期:2013年7月29日 優先權日:2013年2月15日
【發明者】高揚 申請人:華為技術有限公司