新四季網

用於語音編碼的混合碼本激勵的系統和方法

2023-05-05 20:29:51

用於語音編碼的混合碼本激勵的系統和方法
【專利摘要】根據實施例,一種編碼音頻/語音信號的方法包括基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括來自第一碼本的第一碼本條目和來自第二碼本的第二碼本條目的總和。所述方法進一步包括基於所述確定的混合碼本向量生成已編碼的音頻信號,以及發送所述確定的混合碼本向量的碼激勵索引。
【專利說明】用於語音編碼的混合碼本激勵的系統和方法
[0001] 本發明要求2013年2月15日遞交的發明名稱為"用於語音編碼的混合碼本激 勵的系統和方法(System and Method for Mixed Codebook Excitation for Speech Coding)"的第13/768814號美國非臨時申請案、2012年2月17日遞交的發明名稱為"語 音編碼的激勵的脈衝噪聲混合碼本結構(Pulse-Noise Mixed Codebook Structure of Excitation for Speech Coding)"的第61/599937號美國臨時申請案以及2012年2月17日 遞交的發明名稱為"語音編碼的混合碼本激勵的快速搜索方法(Fast Searching Approach of Mixed Codebook Excitation for Speech Coding)" 的第 61/599938 號美國臨時申請 案,這些在先申請的內容以全文引用的方式併入本文中。

【技術領域】
[0002] 本發明大體涉及信號編碼領域。具體而言,本發明涉及低比特率語音編碼領域。

【背景技術】
[0003] 傳統來講,所有的參數語音編碼方法利用語音信號本身的冗餘,來減少必須要發 送的信息量並估算一個信號的語音樣本在短時段內的參數。這種冗餘主要起因於語音波形 周期性的重複和語音信號的頻譜包絡慢變過程。
[0004] 語音波形的冗餘對應於不同類型的語音信號,例如濁音和清音。就濁音語音而言, 語音信號基本上是周期性的;然而,這種周期性在語音段中是變化的,而且周期波形在語音 段之間緩慢變化。低比特率的語音編碼可以很大地受益於這種周期性。濁音語音周期還稱 為基音周期,這種基音周期預測通常被命名為長時預測(LTP :L〇ng-Term Prediction)。至 於清音語音,其信號更像是一個隨機噪聲,可預測性也較小。
[0005] 針對任一種情形,參數編碼可用於通過分割頻譜包絡分量和語音信號的激勵分 量來減少語音段的冗餘。頻譜包絡慢變過程可以被描述成線性預測編碼(LPC:Linea r Prediction Coding),也稱為短時預測(STP:Short_Term Prediction)。低比特率的語音 編碼也同樣受益於短時預測。這種編碼的優點就來自於參數的慢速變化。然而,參數值不 會在幾毫秒內有很大不同。因此,在8千赫茲(kHz)、12. 8kHz或16kHz採樣率時,語音編碼 算法將10毫秒至30毫秒範圍內的語音段作為常用的幀長,其中20毫秒是最常用的幀長。 在G. 723. 1、G. 729、G. 718、EFR、SMV、AMR、VMR-WB或AMR-WB等較近期的知名標準中已經採 用了碼激勵線性預測技術(〃CELP〃:Code Excited Linear Prediction Technique),CELP 通常理解為一種碼激勵、長時預測和短時預測技術的結合。儘管不同編解碼器的CELP細節 可能顯著不同,但利用碼激勵線性預測(CELP:Code_Excited Linear Prediction)的語音 編碼算法在語音壓縮領域已經相當流行。
[0006] 圖1示出了常規CELP編碼器,其中利用所謂的綜合分析方法最小化合成語音102 和原始語音101之間的加權誤差109。W(z)是誤差加權濾波器110,1/B(z)是長時線性預 測濾波器105,以及1/A(z)是短時線性預測濾波器103。碼激勵108,也稱為固定碼本激勵, 在通過線性濾波器之前乘以增益Gcl06。短時線性預測濾波器103通過分析原始信號101
[0007] ,、 獲取並由一組係數表示:

【權利要求】
1. 一種編碼音頻/語音信號的方法,其特徵在於,所述方法包括: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於第一碼本,所述第二碼本條目屬於第二碼本,其 中所述第一碼本包括類脈衝條目,所述第二碼本包括類噪聲條目; 基於所述確定的混合碼本向量生成已編碼的音頻信號;以及 發送所述確定的混合碼本向量的碼激勵索引,其中使用基於硬體的音頻編碼器執行所 述確定和生成。
2. 根據權利要求1所述的方法,其特徵在於,所述第一碼本和所述第二碼本都包括固 定碼本。
3. 根據權利要求1所述的方法,其特徵在於,所述確定混合碼本向量包括: 計算已濾波的目標向量和所述第一碼本中已濾波的條目之間的第一相關係數,其中所 述已濾波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述第二碼本中已濾波的條目之間的相關係數; 確定第二組最高第二相關係數;以及 計算所述第一組最高第一相關係數和所述第二組最高第二相關係數的組合的第一判 據函數,其中所述第一判據函數包括所述第一組最高第一相關係數中的一個、所述第二組 最高第二相關係數中的一個以及所述第一碼本和所述第二碼本的對應條目的能量的函數。
4. 根據權利要求3所述的方法,其特徵在於,進一步包括: 基於計算出的最大第一判據函數確定第三組候選相關係數;以及 基於將第二判據函數應用於所述第三組候選相關係數來選擇所述混合碼本向量,其中 所述混合碼本向量對應於來自所述第一碼本的與所述第二判據函數的最大值相關聯的碼 本條目以及所述第二碼本的與所述第二判據函數的最大值相關聯的碼本條目。
5. 根據權利要求4所述的方法,其特徵在於: 所述第一判據函數為:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的 相關係數,R_CB2(j)是已濾波的目標向量和所述第二碼本中第j個條目之間的相關係數, E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本中 的所述第j個條目的能量,I:是所述第一組最高第一相關係數中第一碼本條目的數目, 1^2是所述第二組最高第二相關係數中第二碼本條目的數目;以及 所述第二判據函數為:
其中Zc:B1(ik)是所述第一碼本中所述第i個條目的已濾波的向量,zra2(j k)是所述第二 碼本的所述第j個條目的已濾波的向量以及K是所述第三組候選相關係數的條目數目。
6. 根據權利要求3所述的方法,其特徵在於,基於計算出的最高第一判據函數選擇所 述混合碼本向量。
7. 根據權利要求6所述的方法,其特徵在於,所述第一判據函數是:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的相 關係數,R-CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關係 數,E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本 中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 是所述第二組最高第二相關係數中第二碼本條目的數目。
8. 根據權利要求3所述的方法,其特徵在於,進一步包括計算來自所述第一碼本和所 述第二碼本的所述對應條目的能量。
9. 根據權利要求3所述的方法,其特徵在於,將來自所述第一碼本和所述第二碼本的 對應條目的所述能量存儲在存儲器中。
10. 根據權利要求3所述的方法,其特徵在於,所述第一組最高第一相關係數比第二組 最高第二相關係數包括更多的條目。
11. 根據權利要求1所述的方法,其特徵在於,進一步包括: 將第一強調函數應用於所述第一碼本條目;以及 將第二強調函數應用於所述第二碼本條目。
12. 根據權利要求11所述的方法,其特徵在於: 所述第一強調函數包括低通濾波函數;以及 所述第二強調函數包括高通濾波函數。
13. 根據權利要求1所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括處理 器。
14. 根據權利要求1所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括專用硬 件。
15. -種用於編碼音頻/語音信號的系統,其特徵在於,所述系統包括: 基於硬體的音頻編碼器用於: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於類脈衝碼本,所述第二碼本條目屬於類噪聲碼 本。 基於所述確定的混合碼本向量生成已編碼的音頻/語音信號;以及 發送所述確定的混合碼本向量的碼激勵索引。
16. 根據權利要求15所述的系統,其特徵在於,所述基於硬體的音頻編碼器進一步用 於: 計算已濾波的目標向量和所述類脈衝碼本中條目之間的第一相關係數,其中所述已濾 波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述類噪聲碼本中條目之間的相關係數; 確定第二組最高第二相關係數;以及 計算所述第一組最高第一相關係數和第二組最高第二相關係數的組合的第一判別函 數,其中所述第一判別函數包括所述第一組最高第一相關係數中第一個、所述第二組最高 第二相關係數中的一個以及所述類脈衝碼本和所述類噪聲碼本的對應條目的能量的函數。
17. 根據權利要求16所述的系統,其特徵在於,進一步包括存儲器,用於存儲來自所述 類脈衝碼本和所述類噪聲碼本的對應條目的所述能量值。
18. 根據權利要求16所述的系統,其特徵在於,所述基於硬體的音頻編碼器還用於基 於計算出的最大第一判據函數選擇所述混合碼本向量。
19. 根據權利要求16所述的方法,其特徵在於,所述第一判據函數是:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的相 關係數,R-CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關係 數,E - CB1 (i)是所述第一碼本中所述第i個條目的能量以及E - CB2 (i)是所述第二碼本 中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 夂是所述第二組最高第二相關係數中第二碼本條目的數目。
20. 根據權利要求15所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括處理 器。
21. 根據權利要求15所述的方法,其特徵在於,所述基於硬體的音頻編碼器包括專用 硬體。
22. -種用於編碼音頻/語音信號的混合碼本的快速搜索方法,其特徵在於,所述方法 包括: 基於輸入音頻/語音信號確定混合碼本向量,所述混合碼本向量包括第一碼本條目和 第二碼本條目的和,所述第一碼本條目屬於第一碼本,所述第二碼本條目屬於第二碼本; 計算已濾波的目標向量和所述第一碼本中已濾波的條目之間的第一相關係數,其中所 述已濾波的目標向量基於所述輸入音頻信號; 確定第一組最高第一相關係數; 計算已濾波的目標向量和所述第二碼本中已濾波的條目之間的相關係數; 確定第-組最1?第-相關係數; 計算所述第一組最高第一相關係數和所述第二組最高第二相關係數的組合的第一 判別函數,其中所述第一判別函數包括所述第一組最高第一相關係數中的一個、所述第二 組最高第二相關係數中的一個以及所述第一碼本和所述第二碼本的對應條目的能量的函 數; 基於計算出的最大第一判別函數確定第三組候選相關係數; 基於將第二判據函數應用於所述第三組候選相關係數來選擇所述混合碼本向量,其中 所述混合碼本向量對應於來自所述第一碼本的與所述第二判據函數的最大值相關聯的碼 本條目和所述第二碼本的與所述第二判據函數的最大值相關聯的碼本條目; 基於所述確定的混合碼本向量生成已編碼的音頻信號;以及 發送所述確定的混合碼本向量的碼激勵索引,其中使用基於硬體的音頻編碼器執行所 述確定和生成。
23. 根據權利要求22所述的方法,其特徵在於: 所述第一判據函數為:
其中R - CB1 (i)是所述已濾波的目標向量和所述第一碼本中第i個第一條目之間的 相關係數,R_CB2(j)是所述已濾波的目標向量和所述第二碼本中第j個條目之間的相關 係數,E-CBl(i)是所述第一碼本中所述第i個條目的能量以及E-CB2(i)是所述第二碼 本中所述第j個條目的能量,是所述第一組最高第一相關係數中第一碼本條目的數目, 是所述第二組最高第二相關係數中第二碼本條目的數目;以及 所述第二判據函數為:
其中Zc:B1(ik)是所述第一碼本的所述第i個條目的已濾波的向量,zra2(j k)是所述第二 碼本的所述第j個條目的已濾波的向量以及K是所述第三組候選相關係數的條目數目。
24. 根據權利要求22所述的方法,其特徵在於,所述第一碼本包括類脈衝碼本,所述第 二碼本包括類噪聲碼本。
【文檔編號】G10L19/12GK104126201SQ201380009887
【公開日】2014年10月29日 申請日期:2013年7月29日 優先權日:2013年2月15日
【發明者】高揚 申請人:華為技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀