立體聲音頻編碼的方法及裝置製造方法
2023-06-14 10:59:56 2
立體聲音頻編碼的方法及裝置製造方法
【專利摘要】本發明公開了一種立體聲音頻編碼的方法及裝置,其中,該方法包括:獲取立體聲信號;根據上述立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號;對上述輸入信號進行編碼。通過本發明,採用根據立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號,對選擇的輸入信號進行編碼,提高了立體聲壓縮編碼的效率。
【專利說明】立體聲音頻編碼的方法及裝置【技術領域】
[0001]本發明涉及通信領域,具體而言,涉及一種立體聲音頻編碼的方法及裝置。
【背景技術】
[0002]近年來,隨著通訊網絡的寬帶化,人們越來越需要具有親臨其境的現場感的通信語音,以及高質量的音樂。為了對應該需求,基於立體聲的編碼技術逐步應用於通訊系統中。
[0003]和差立體聲編碼(Mid-Side Coding)是對立體聲進行編碼的常用技術,該技術不是直接編碼立體聲的左右聲道信號,而是先將左右聲道信號變換成和差聲道信號再進行編碼,這樣如果左右聲道相關性很強,則可以非常有效地去除左右聲道信號間的冗餘以提高編碼效率。
[0004]然而,即使左右聲道信號的主分量(主要頻率成分)相同,在聲源激勵位置不同的情況下,相同時刻的左右聲道信號間相關性也較低。此時如果也簡單地採用和差立體聲編碼,在聲源激勵位置差異很大的情況下,和差立體聲編碼方式反而會降低編碼的效率。
[0005]針對相關技術中立體聲壓縮編碼的效率低的問題,目前尚未提出有效的解決方案。
【發明內容】
[0006]針對相關技術中立體聲壓縮編碼效率低的問題,本發明提供了一種立體聲音頻編碼的方法及裝置,以至少解決上述問題。
[0007]根據本發明的一個方面,提供了一種立體聲音頻編碼的方法,包括:獲取立體聲信號;根據所述立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號;對所述輸入信號進行編碼。
[0008]優選地,根據所述立體聲信號的相關性特徵選擇所述立體聲壓縮編碼的輸入信號,包括:將所述立體聲信號劃分為高頻信號和低頻信號,其中,所述高頻信號的頻率大於等於第一預設值,所述低頻信號的頻率小於所述第一預設值;選擇所述低頻信號的和聲道信號與差聲道信號作為所述輸入信號的低頻部分;根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分;利用所述低頻部分和所述高頻部分合成所述輸入信號。
[0009]優選地,根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括:確定所述高頻信號的相關性特徵,其中,所述相關性特徵包括兩個或兩個以上的特徵參數;根據所述高頻信號的相關性特徵,判斷並選擇所述輸入信號的所述高頻部分;如果所述特徵參數滿足預設條件,選擇高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;如果所述特徵參數不滿足所述預設條件,選擇高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
`[0010]優選地,確定所述高頻信號的所述相關性特徵,包括:確定所述高頻信號的左聲道和右聲道的互相關係數以及第一特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括:如果所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,則選擇所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;否則,選擇所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
[0011]優選地,確定所述高頻信號的所述相關性特徵,還包括:確定所述高頻信號的左聲道和右聲道的互相關係數、第一特徵以及第二特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;所述第二特徵為所述高頻信號的左聲道信號與右聲道信號的能量中的最小值,與所述高頻信號的和聲道信號和差聲道信號的能量中的最小值的比值;根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括:如果所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,或者所述第二特徵小於第四預設值,選擇所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;否則,選擇所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
[0012]根據本發明的另一個方面,提供了一種立體聲音頻編碼的裝置,包括:獲取模塊,用於獲取立體聲信號;選擇模塊,用於根據所述立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號;編碼模塊,用於對所述輸入信號進行編碼。
[0013]優選地,所述選擇模塊包括:劃分單元,用於將所述立體聲信號劃分為高頻信號和低頻信號,其中,所述高頻信號的頻率大於等於第一預設值,所述低頻信號的頻率小於所述第一預設值;低頻輸出單元,用於輸出所述低頻信號的和聲道信號與差聲道信號作為所述輸入信號的低頻部分;高頻輸出單元,用於根據所述高頻信號的相關性特徵選擇並輸出所述輸入信號的高頻部分;數據合成單元,用於利用所述輸入信號的低頻部分和高頻部分,合成所述輸入信號。
[0014]優選地,所述高頻輸出單元包括:特徵計算單元,用於確定所述高頻信號的所述相關性特徵,其中,所述相關性特徵包括兩個或兩個以上的特徵參數;判斷單元,根據所述高頻信號的相關性特徵,判斷並選擇所述輸入信號的所述高頻部分;第一輸出單元,用於在所述特徵參數滿足預設條件的情況下,輸出所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;第二輸出單元,用於在所述特徵參數不滿足所述預設條件的情況下,輸出所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
[0015]優選地,所述特徵計算單元,用於確定所述高頻信號的左聲道和右聲道的互相關係數以及第一特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;所述判斷單元,用於在所述互相關係數小於第二預設值且所述第一特徵大於第三預設值的情況下,選擇所述第一輸出單元;否則,選擇所述第二輸出單元。
[0016]優選地,所述特徵計算單元,還用於確定所述高頻信號的左聲道和右聲道的互相關係數、第一特徵以及第二特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;所述第二特徵為所述高頻信號的左聲道和右聲道的能量中的最小值,與所述高頻信號的和聲道與差聲道的能量中的最小值的比值;所述判斷單元,還用於在所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,或者所述第二特徵小於第四預設值的情況下,選擇所述第一輸出單元;否則,選擇所述第二輸出單元。
[0017]通過本發明,採用獲取立體聲信號,根據立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號,對選擇的輸入信號進行編碼的技術方案,解決了相關技術中立體聲壓縮編碼的效率低的問題,進而達到了提高立體聲壓縮編碼效率的效果。
【專利附圖】
【附圖說明】
[0018]此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用於解釋本發明,並不構成對本發明的不當限定。在附圖中:
[0019]圖1是根據本發明實施例的立體聲音頻編碼裝置的結構框圖;
[0020]圖2是根據本發明實施例優選的選擇模塊的結構框圖;
[0021]圖3是根據本發明實施例優選的高頻輸出單元的結構框圖;
[0022]圖4是根據本發明實施例的立體聲音頻編碼方法的流程圖;
[0023]圖5是根據本發明實施例實施方式一輸入信號確定方法的流程圖;以及
[0024]圖6是根據本發明實施例實施方式二輸入信號確定方法的流程圖。
【具體實施方式】
[0025]下文中將參考附圖並結合實施例來詳細說明本發明。需要說明的是,在不衝突的情況下,本申請中的實施例及實施例中的特徵可以相互組合。
[0026]根據本發明實施例,提供了一種可根據立體聲的左右聲道信號間的相關性特徵來動態判決和選擇更合適於立體聲壓縮編碼的輸入數據的裝置及其方法,在立體聲左右兩個聲道相關性較低的情況下,通過選擇冗餘性少的線性變換的信號,提高立體聲壓縮編碼效率,獲得高質量的立體聲音質。
[0027]在本發明實施例中,以立體聲信號的採樣率是48kHz,編碼碼率是64kbps,編碼幀長為20ms為例,分別對本發明實施例的裝置和方法進行描述。
[0028]圖1是根據本發明實施例的立體聲音頻編碼的裝置的結構框圖。如圖1所示,該裝置主要包括:獲取模塊10、選擇模塊20和編碼模塊30。
[0029]獲取模塊10,用於獲取立體聲信號;
[0030]選擇模塊20,與獲取模塊10相連接,用於根據立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號;
[0031]編碼模塊30,與選擇模塊20相連接,用於對選擇的輸入信號進行編碼。
[0032]通過本發明實施例,根據立體聲信號的相關性特徵動態選擇立體聲壓縮編碼的輸入信號,提高了立體聲信號壓縮編碼的效率。
[0033]圖2是根據本發明實施例優選的選擇模塊的結構框圖。如圖2所示,選擇模塊20主要包括:
[0034]劃分單元202,用於將立體聲信號劃分為高頻信號和低頻信號,其中,高頻信號的頻率大於等於第一預設值,低頻信號的頻率小於第一預設值。優選地,本實施例中的高低頻劃分界限是2kHz,即第一預設值取值為2kHz。在實際應用中,還可以將所述輸入信號的高頻頻段進行擴展到全頻帶,即第一預設值取零值的情況。此時,全頻帶的信號均根據所述相關性特徵來選擇所述輸入信號。
[0035]在本發明實施例中,以改進離散餘弦變換(Modified Discrete CosineTransform,簡稱為MDCT)域的劃分為例進行說明,每個聲道信號按照統一規則劃分為低頻和高頻兩個頻帶,分別將左聲道頻域信號表示為XS右聲道頻域信號表示為Xk,高頻信號的左聲道表示為低頻信號的左聲道表示為X/,高頻信號的右聲道表示為Xa'低頻信號的右聲道表示為,其中,Xi = [Xf Xt] 』XR = [Xf Xf] c
[0036]進一步地對Xf , Xi , Xf , JTf 的定義如下:Xf = {# |0</S80),Xf ={Xl;\0<i< SOj -X;; = {X!?\S0<i< 960} ,x;! = {Xll |80< /< 960!,其中,下標 I 表示 MDCT
係數的序號。
[0037]進一步地定義和聲道信號ΧΜ=Χι+Χκ,差聲道信號Xs=X1-Xk ;
[0038]優選地,和差聲道也按照劃分單元202進行頻帶劃分,劃分為高頻信號的和聲道 與低頻信號的和聲道X高頻信號的差聲道與低頻信號的差聲道Xf=[xr Xf],
Is? l.[0039]低頻輸出單元204,與劃分單元202相連接,用於輸出低頻信號的和聲道與低頻信號的差聲道作為輸入信號的低頻部分;
[0040]高頻輸出單元206,與劃分單元202相連接,用於根據高頻信號的相關性特徵選擇並輸出輸入信號的高頻部分。
[0041]數據合成單元208,與低頻輸出單元204和高頻輸出單元206相連接,用於利用所述輸入信號的低頻部分和高頻部分,合成所述輸入信號。
[0042]圖3是根據本發明實施例優選的高頻輸出單元的結構框圖,如圖3所示,高頻輸出單元206可以包括:
[0043]特徵計算單元2062,用於確定所述高頻信號的所述相關性特徵,其中,所述相關性特徵包括兩個或兩個以上的特徵參數;
[0044]判斷單元2064,與特徵計算單元2062相連接,用於根據所述高頻信號的相關性特徵,判斷並選擇輸入信號的高頻部分;
[0045]第一輸出單元2066,與判斷單元2064相連接,用於在所述特徵參數滿足預設條件的情況下,輸出所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;
[0046]第二輸出單元2068,與判斷單元2064相連接,用於在所述特徵參數不滿足所述預設條件的情況下,輸出所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
[0047]通過本優選實施方式,對於相關性大的立體聲信號,選擇高頻信號的和聲道與高頻信號的差聲道作為立體聲壓縮編碼的輸入信號的高頻部分,可以降低輸入信號的冗餘性,對於相關性小的立體聲信號,選擇高頻信號的左聲道和高頻信號的右聲道作為立體聲壓縮編碼的輸入信號的高頻部分,避免了採用和差編碼時編碼效率低的問題。
[0048]下面對根據不同特徵參數確定相關性來選擇輸入信號的實施方式進行描述。
[0049]方式一
[0050]在本發明實施例實施方式一中,特徵計算單元2062,用於確定高頻信號的左聲道和右聲道的互相關係數以及第一特徵,其中,第一特徵為高頻信號的左聲道和右聲道的能量比值,在本發明實施例中可以是能量的最大值與最小值的比值;判斷單元2064,用於在所述互相關係數小於第二預設值且所述第一特徵大於第三預設值的情況下,選擇第一輸出單元2066 ;否則,選擇第二輸出單元2068。
[0051]在本發明實施例實施方式一中,優選地,第二預設值取0.7,第三預設值取0.9。
[0052]優選地,特徵計算單元2062可以按照以下方式確定高頻信號的左聲道的能量和高頻信號的右聲道的能量:
[0053]高頻信號的左聲道的能量
【權利要求】
1.一種立體聲音頻編碼的方法,其特徵在於,包括: 獲取立體聲信號; 根據所述立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號; 對所述輸入信號進行編碼。
2.根據權利要求1所述的方法,其特徵在於,根據所述立體聲信號的相關性特徵選擇所述立體聲壓縮編碼的輸入信號,包括: 將所述立體聲信號劃分為高頻信號和低頻信號,其中,所述高頻信號的頻率大於等於第一預設值,所述低頻信號的頻率小於所述第一預設值; 選擇所述低頻信號的和聲道信號與差聲道信號作為所述輸入信號的低頻部分; 根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分; 利用所述低頻部分和所述高頻部分合成所述輸入信號。
3.根據權利要求2所述的方法,其特徵在於,根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括: 確定所述高頻信號的相關性特徵,其中,所述相關性特徵包括兩個或兩個以上的特徵參數; 根據所述高頻信號的相關性特徵,判斷並選擇所述輸入信號的所述高頻部分; 如果所述特徵參數滿足預設條件,選擇高頻信號的左聲道和右聲道作為所述輸入信號的聞頻部分; 如果所述特徵參數不滿足所述預設條件,選擇高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
4.根據權利要求3所述的方法,其特徵在於, 確定所述高頻信號的所述相關性特徵,包括:確定所述高頻信號的左聲道和右聲道的互相關係數以及第一特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值; 根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括:如果所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,則選擇所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;否則,選擇所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
5.根據權利要求3所述的方法,其特徵在於, 確定所述高頻信號的所述相關性特徵,還包括:確定所述高頻信號的左聲道和右聲道的互相關係數、第一特徵以及第二特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;所述第二特徵為所述高頻信號的左聲道信號與右聲道信號的能量中的最小值,與所述高頻信號的和聲道信號和差聲道信號的能量中的最小值的比值; 根據所述高頻信號的相關性特徵選擇所述輸入信號的高頻部分,包括:如果所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,或者所述第二特徵小於第四預設值,選擇所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分;否則,選擇所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
6.一種立體聲音頻編碼的裝置,其特徵在於,包括:獲取模塊,用於獲取立體聲信號; 選擇模塊,用於根據所述立體聲信號的相關性特徵選擇立體聲壓縮編碼的輸入信號; 編碼模塊,用於對所述輸入信號進行編碼。
7.根據權利要求6所述的裝置,其特徵在於,所述選擇模塊包括: 劃分單元,用於將所述立體聲信號劃分為高頻信號和低頻信號,其中,所述高頻信號的頻率大於等於第一預設值,所述低頻信號的頻率小於所述第一預設值; 低頻輸出單元,用於輸出所述低頻信號的和聲道信號與差聲道信號作為所述輸入信號的低頻部分; 高頻輸出單元,用於根據所述高頻信號的相關性特徵選擇並輸出所述輸入信號的高頻部分; 數據合成單元,用於利用所述輸入信號的低頻部分和高頻部分,合成所述輸入信號。
8.根據權利要求7所述的裝置,其特徵在於,所述高頻輸出單元包括: 特徵計算單元,用於確定所述高頻信號的所述相關性特徵,其中,所述相關性特徵包括兩個或兩個以上的特徵參數; 判斷單元,根據所述高頻信號的相關性特徵,判斷並選擇所述輸入信號的所述高頻部分; 第一輸出單元,用於在所·述特徵參數滿足預設條件的情況下,輸出所述高頻信號的左聲道和右聲道作為所述輸入信號的高頻部分; 第二輸出單元,用於在所述特徵參數不滿足所述預設條件的情況下,輸出所述高頻信號的和聲道與差聲道作為所述輸入信號的高頻部分。
9.根據權利要求8所述的裝置,其特徵在於, 所述特徵計算單元,用於確定所述高頻信號的左聲道和右聲道的互相關係數以及第一特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值; 所述判斷單元,用於在所述互相關係數小於第二預設值且所述第一特徵大於第三預設值的情況下,選擇所述第一輸出單元;否則,選擇所述第二輸出單元。
10.根據權利要求8所述的裝置,其特徵在於, 所述特徵計算單元,用於確定所述高頻信號的左聲道和右聲道的互相關係數、第一特徵以及第二特徵,其中,所述第一特徵為所述高頻信號的左聲道和右聲道的能量中的最大值,與所述高頻信號的左聲道和右聲道的能量中的最小值的比值;所述第二特徵為所述高頻信號的左聲道和右聲道的能量中的最小值,與所述高頻信號的和聲道與差聲道的能量中的最小值的比值; 所述判斷單元,還用於在所述互相關係數小於第二預設值且所述第一特徵大於第三預設值,或者所述第二特徵小於第四預設值的情況下,選擇所述第一輸出單元;否則,選擇所述第二輸出單元。
【文檔編號】G10L19/008GK103854650SQ201210504521
【公開日】2014年6月11日 申請日期:2012年11月30日 優先權日:2012年11月30日
【發明者】王楊忠, 白雪, 袁浩 申請人:中興通訊股份有限公司