新四季網

一種立體聲編解碼方法

2023-10-07 13:45:09

一種立體聲編解碼方法
【專利摘要】本發明公開了一種立體聲編碼方法,所述方法包含以下步驟:時域信號獲取步驟;塊長選擇步驟;時頻變換步驟;立體聲參數編碼步驟;單聲道處理步驟;封裝步驟。本發明還公開了一種立體聲解碼方法,所述方法包括以下步驟:解封裝步驟;單聲道解碼步驟;立體聲參數解碼步驟;立體聲處理步驟;時頻反變換步驟。本發明的編解碼方法不僅提供了與核心單聲道編解碼器更加緊湊的融合框架,復用了時頻變換步驟,從而消減了由於反覆時頻變換帶來的計算量和延時開銷;而且提供了更靈活的幀間組合以及幀內組合的編碼方法,減小了最終的編碼結果的數據量,從而保證在不同立體聲參數碼率配置下獲得較高的音頻質量。
【專利說明】一種立體聲編解碼方法

【技術領域】
[0001] 本發明涉及聲像【技術領域】,具體說涉及一種立體聲編解碼方法。

【背景技術】
[0002] 在現有技術中,由於用數字方法記錄聲音比用模擬方法記錄聲音具有更強的優 勢,例如傳輸時抗噪聲能力強、增加音頻動態範圍、多次翻錄沒有信號衰減等。因此通常採 用數字方法記錄音頻文件。但是隨著人們對多媒體聲音的要求越來越高,記錄聲音所需的 數據量越來越大。大數據量的音頻文件不僅在傳輸過程中需要佔用很寬的傳輸帶寬,而且 在存儲過程中需要佔用大量的存儲空間。為解決音頻文件數據量過大的問題,通常在數字 音頻中採用數字音頻壓縮技術,對音頻數據進行壓縮。
[0003] 通常許多基於頻域的音頻編碼方法通過採用自適應塊長的時頻變換模塊,提供音 頻信號最適合的時頻解析度,獲得更高的編碼壓縮增益。例如,在先進音頻編碼(Advanced Audio Coding,AAC)中採用1024點的長塊和128點的短塊組合的兩種濾波器組結構,分別 對平穩信號和瞬時信號進行不同長度的修正型離散餘弦變換(MDCT)。
[0004] 在此基礎上,又進一步提出參數立體聲編碼。該技術是指利用一路下混聲道經過 單聲道編碼器,另外附加少量的立體聲參數信息的基本框架,對雙聲道音頻數據進行編碼。 由於立體聲編碼模塊與單聲道編碼模塊採用了不同解析度的時頻變換,音頻信號需要經過 多次的時頻變換過程,因此增加了編解碼流程整體的複雜性,同時也增加了編解碼過程中 的延時。
[0005] 因此,針對現有立體聲編解碼方法整體流程過於複雜的問題,需要一種新的立體 聲編解碼方法以減小整體流程的複雜程度。


【發明內容】

[0006] 針對現有立體聲編解碼方法整體流程過於複雜的問題,本發明提供了一種立體聲 編碼方法,所述方法包含以下步驟:
[0007] 時域信號獲取步驟,獲取目標音頻的配對聲道時域信號;
[0008] 塊長選擇步驟,對所述配對聲道時域信號進行塊長選擇處理從而獲得配對聲道時 域信號的時頻變換塊以及相應的塊長控制信號;
[0009] 時頻變換步驟,基於所述塊長控制信號對所述時頻變換塊進行時頻變換從而獲得 相應的配對聲道頻譜係數塊;
[0010] 立體聲參數編碼步驟,基於所述塊長控制信號對所述配對聲道頻譜係數塊進行立 體聲參數編碼從而獲得立體聲參數編碼數據塊;
[0011] 單聲道處理步驟,基於所述塊長控制信號以及所述立體聲參數編碼數據塊根據所 述配對聲道頻譜係數塊獲取單聲道編碼數據塊;
[0012] 封裝步驟,將所述單聲道編碼數據塊、所述立體聲參數編碼數據塊以及所述塊長 控制信號進行碼流封裝從而獲得立體聲編碼數據包。
[0013] 在一實施例中,所述立體聲參數編碼步驟包含以下步驟:
[0014] 立體聲參數提取模式選擇步驟,根據所述目標音頻的立體聲參數部分的編碼碼率 以及所述塊長控制信號選擇相應的立體聲參數提取模式並生成相應的立體聲參數提取模 式標記;
[0015] 立體聲參數提取步驟,根據所述立體聲參數提取模式從所述配對聲道頻譜係數塊 中提取對應的立體聲參數;
[0016] 立體聲參數量化編碼步驟,對所述立體聲參數進行量化編碼從而獲得量化的立體 聲參數,進而獲得所述立體聲參數編碼數據塊。
[0017] 在一實施例中,所述立體聲參數提取模式包含普通提取模式以及超幀提取模式, 其中:
[0018] 在所述普通提取模式下,一個所述單聲道編碼數據塊對應一個所述立體聲參數編 碼數據塊;
[0019] 在所述超幀提取模式下,多個連續的所述單聲道編碼數據塊對應一個所述立體聲 參數編碼數據塊。
[0020] 在一實施例中,所述立體聲參數提取模式選擇步驟包含以下步驟:
[0021] 編碼碼率分析步驟,根據所述立體聲參數部分的編碼碼率選擇相應的立體聲參數 提取模式,當所述立體聲參數部分的編碼碼率高於特定值時選擇所述普通提取模式;
[0022] 塊長分析步驟,當所述立體聲參數部分的編碼碼率低於或等於特定值時分析所述 塊長控制信號並根據塊長控制信號分析結果選擇相應的立體聲參數提取模式。
[0023] 在一實施例中,所述立體聲參數提取模式選擇步驟還包含下混能量衰減分析步 驟,分析所述配對聲道頻譜係數塊在不同立體聲參數提取模式下的下混能量衰減並基於分 析結果選擇相應的立體聲參數提取模式。
[0024] 在一實施例中,所述單聲道處理步驟包含以下步驟:
[0025] 頻譜下混步驟,基於所述量化的立體聲參數對所述配對聲道頻譜係數塊進行下混 處理從而獲得對應的單聲道頻譜係數塊;
[0026] 單聲道編碼步驟,基於所述塊長控制信號對所述單聲道頻譜係數塊進行單聲道編 碼處理從而獲得所述單聲道編碼數據塊。
[0027] 在一實施例中,在所述封裝步驟中,將所述單聲道編碼數據塊以及與所述單聲道 編碼數據塊對應的所述立體聲參數編碼數據塊、所述塊長控制信號以及所述立體聲參數提 取模式標記以一定格式進行碼流封裝從而獲得所述立體聲編碼數據包。
[0028] 本發明還提供了一種立體聲解碼方法,所述方法包括以下步驟:
[0029] 解封裝步驟,對所述立體聲編碼數據包進行解封裝處理從而獲得單聲道編碼數據 塊、立體聲參數編碼數據塊、塊長控制信號以及立體聲參數提取模式標記;
[0030] 單聲道解碼步驟,基於所述塊長控制信號對所述單聲道編碼數據塊進行單聲道解 碼處理從而獲得單聲道頻譜係數塊;
[0031] 立體聲參數解碼步驟,基於所述塊長控制信號以及立體聲參數提取模式標記,對 所述立體聲參數編碼數據塊進行解碼處理從而獲得所述單聲道頻譜係數塊對應的立體聲 參數;
[0032] 立體聲處理步驟,基於所述塊長控制信號根據所述單聲道頻譜係數塊以及所述立 體聲參數進行立體聲處理從而獲得配對聲道頻譜係數塊;
[0033] 時頻反變換步驟,基於所述塊長控制信號對所述配對聲道頻譜係數塊進行時頻反 變換從而獲得目標音頻的配對聲道時域信號。
[0034] 在一實施例中,在所述立體聲參數解碼步驟中,根據所述塊長控制信號以及立體 聲參數提取模式標記選擇相應的立體聲參數解碼模式。
[0035] 在一實施例中,所述立體聲參數解碼模式包含普通解碼模式以及超幀解碼模式。
[0036] 與現有技術相比,本發明具有如下優點:
[0037] 本發明的編解碼方法提供了與核心單聲道編解碼器更加緊湊的融合框架,復用了 時頻變換步驟,從而消減了由於反覆時頻變換帶來的計算量和延時開銷;
[0038] 本發明的編碼方法提供了更靈活的不同模式混合使用的立體聲編碼方法,減小了 最終的編碼結果的數據量,從而保證了在不同立體聲碼率配置下可以獲得較高的音頻質 量。
[0039] 本發明的其它特徵或優點將在隨後的說明書中闡述。並且,本發明的部分特徵或 優點將通過說明書而變得顯而易見,或者通過實施本發明而被了解。本發明的目的和部分 優點可通過在說明書、權利要求書以及附圖中所特別指出的步驟來實現或獲得。

【專利附圖】

【附圖說明】
[0040] 附圖用來提供對本發明的進一步理解,並且構成說明書的一部分,與本發明的實 施例共同用於解釋本發明,並不構成對本發明的限制。在附圖中:
[0041] 圖1是根據本發明一實施例編碼流程圖;
[0042] 圖2是根據本發明一實施例時頻變換塊劃分示意圖;
[0043] 圖3是根據本發明一實施例立體聲參數提取模式選擇流程圖;
[0044] 圖4是根據本發明一實施例編碼數據結構簡圖;
[0045] 圖5是根據本發明一實施例立體聲編碼數據包結構簡圖;
[0046] 圖6是根據本發明一實施例解碼流程圖。

【具體實施方式】
[0047] 以下將結合附圖及實施例來詳細說明本發明的實施方式,藉此本發明的實施人員 可以充分理解本發明如何應用技術手段來解決技術問題,並達成技術效果的實現過程並依 據上述實現過程具體實施本發明。需要說明的是,只要不構成衝突,本發明中的各個實施 例以及各實施例中的各個特徵可以相互結合,所形成的技術方案均在本發明的保護範圍之 內。
[0048] 本發明提出了一種立體聲編解碼方法。接下來基於流程圖來具體描述本發明方法 的編解碼具體流程。附圖的流程圖中示出的步驟可以在包含諸如一組計算機可執行指令的 計算機系統中執行。雖然在流程圖中示出了各步驟的邏輯順序,但是在某些情況下,可以以 不同於此處的順序執行所示出或描述的步驟。
[0049] 首先針對編碼過程進行描述。如圖1所示,首先執行步驟S100,時域信號獲取步 驟,獲取目標音頻的配對聲道時域信號。本發明的編碼方法首先要對音頻的時域信號進行 時頻變換,將時域信號轉化為相應的頻譜係數。配對聲道時域信號為眾多個信號樣點對的 集合。由於在對音頻進行編碼處理時,通常以幀為單位對音頻信號進行處理。因此在時頻 變換前,首先將所有的時域信號分為多個連續的時域信號幀。定義M為幀長度,連續M個信 號樣點對為一中貞。
[0050] 在本實施例中,配對聲道為左右聲道,每個編碼周期處理一個超幀長度的時域信 號塊。超幀長度為幀長度的整數倍,定義N為超幀長度參數,一個超幀長度的時域信號塊包 含N個時域信號幀,即MXN個信號樣點對。即步驟S100每次讀入左右聲道各MX N個樣點 (MXN個樣點對)。
[0051] 為了獲得更高的編碼壓縮增益,本發明的編碼方法通過採用自適應塊長的時頻變 換來提供音頻信號最適合的時頻解析度,這就需要根據音頻信號的實際情況將一個時域信 號幀劃分為一個或多個時頻變換塊。因此在本實施例中,在步驟S100之後執行步驟S110, 塊長選擇步驟,對配對聲道時域信號進行塊長選擇處理從而獲得配對聲道時域信號的時頻 變換塊以及相應的塊長控制信號。
[0052] 在本實施例中,對音頻信號的處理支持幀間長塊組合以及幀內短塊組合。
[0053] 幀內短塊組合是指時頻變換後的一幀頻譜係數數據(即以M個樣點對頻譜係數構 成的數據塊),可以是多個m(m小於M)個樣點對頻譜係數構成的數據塊的組合結果。比如 可以是兩個M/2樣點對頻譜係數構成的數據塊的組合,或者4個M/4樣點對頻譜係數構成 的數據塊的組合。在這種情況下,時頻變換後的頻譜係數的子帶劃分和立體聲參數提取都 是對應在每個時頻變換塊內進行的。對於不同的時頻變換塊長,選擇劃分的方式也可以不 同,包括頻譜子帶的數目,或是各子帶係數的個數。
[0054] 幀間長塊組合是指允許連續2個(或多個)M點信號幀的頻譜係數進行組合,構成 一個係數矩陣。但要求這些頻譜係數均是採用M點的時頻變換得到的。在這種情況下,頻 譜係數的子帶劃分和立體聲參數提取都是對應在係數矩陣內進行的。
[0055] 基於幀內短塊組合以及幀間長塊組合,在步驟S110中,將每個時域信號幀(M個樣 點對)劃分為一個時頻變換塊(M個樣點對)或多個時頻變換塊(m個樣點對)。假設一個 超幀長度的時域信號塊包含3M個信號樣點對(超幀長度N = 3)。則如圖2所示,超幀長度 的時域信號塊210包含信號幀211、212以及213,每個信號幀(211、212或213)包含M個信 號樣點對。根據音頻信號的實際情況對每個信號幀(211、212或213)做進一步劃分。首先 對每個信號幀的時域信號(M個信號樣點對)進行1/2下混,假設左右聲道的信號分別為\ 和X K,下混結果XM的計算公式如下:

【權利要求】
1. 一種立體聲編碼方法,其特徵在於,所述方法包含w下步驟: 時域信號獲取步驟,獲取目標音頻的配對聲道時域信號; 塊長選擇步驟,對所述配對聲道時域信號進行塊長選擇處理從而獲得配對聲道時域信 號的時頻變換塊W及相應的塊長控制信號; 時頻變換步驟,基於所述塊長控制信號對所述時頻變換塊進行時頻變換從而獲得相應 的配對聲道頻譜係數塊; 立體聲參數編碼步驟,基於所述塊長控制信號對所述配對聲道頻譜係數塊進行立體聲 參數編碼從而獲得立體聲參數編碼數據塊; 單聲道處理步驟,基於所述塊長控制信號W及所述立體聲參數編碼數據塊根據所述配 對聲道頻譜係數塊獲取單聲道編碼數據塊; 封裝步驟,將所述單聲道編碼數據塊、所述立體聲參數編碼數據塊W及所述塊長控制 信號進行碼流封裝從而獲得立體聲編碼數據包。
2. 如權利要求1所述的方法,其特徵在於,所述立體聲參數編碼步驟包含W下步驟: 立體聲參數提取模式選擇步驟,根據所述目標音頻的立體聲參數部分的編碼碼率W及 所述塊長控制信號選擇相應的立體聲參數提取模式並生成相應的立體聲參數提取模式標 記; 立體聲參數提取步驟,根據所述立體聲參數提取模式從所述配對聲道頻譜係數塊中提 取對應的立體聲參數; 立體聲參數量化編碼步驟,對所述立體聲參數進行量化編碼從而獲得量化的立體聲參 數,進而獲得所述立體聲參數編碼數據塊。
3. 如權利要求2所述的方法,其特徵在於,所述立體聲參數提取模式包含普通提取模 式W及超峽提取模式,其中: 在所述普通提取模式下,一個所述單聲道編碼數據塊對應一個所述立體聲參數編碼數 據塊; 在所述超峽提取模式下,多個連續的所述單聲道編碼數據塊對應一個所述立體聲參數 編碼數據塊。
4. 如權利要求2所述的方法,其特徵在於,所述立體聲參數提取模式選擇步驟包含W 下步驟: 編碼碼率分析步驟,根據所述立體聲參數部分的編碼碼率選擇相應的立體聲參數提取 模式,當所述立體聲參數部分的編碼碼率高於特定值時選擇所述普通提取模式; 塊長分析步驟,當所述立體聲參數部分的編碼碼率低於或等於特定值時分析所述塊長 控制信號並根據塊長控制信號分析結果選擇相應的立體聲參數提取模式。
5. 如權利要求4所述的方法,其特徵在於,所述立體聲參數提取模式選擇步驟還包含 下混能量衰減分析步驟,分析所述配對聲道頻譜係數塊在不同立體聲參數提取模式下的下 混能量衰減並基於分析結果選擇相應的立體聲參數提取模式。
6. 如權利要求2所述的方法,其特徵在於,所述單聲道處理步驟包含W下步驟: 頻譜下混步驟,基於所述量化的立體聲參數對所述配對聲道頻譜係數塊進行下混處理 從而獲得對應的單聲道頻譜係數塊; 單聲道編碼步驟,基於所述塊長控制信號對所述單聲道頻譜係數塊進行單聲道編碼處 理從而獲得所述單聲道編碼數據塊。
7. 如權利要求2所述的方法,其特徵在於,在所述封裝步驟中,將所述單聲道編碼數據 塊W及與所述單聲道編碼數據塊對應的所述立體聲參數編碼數據塊、所述塊長控制信號W 及所述立體聲參數提取模式標記W-定格式進行碼流封裝從而獲得所述立體聲編碼數據 包。
8. -種針對如權利要求1-7中任一項所述的方法生成的立體聲編碼數據包的立體聲 解碼方法,其特徵在於,所述方法包括W下步驟: 解封裝步驟,對所述立體聲編碼數據包進行解封裝處理從而獲得單聲道編碼數據塊、 立體聲參數編碼數據塊、塊長控制信號W及立體聲參數提取模式標記; 單聲道解碼步驟,基於所述塊長控制信號對所述單聲道編碼數據塊進行單聲道解碼處 理從而獲得單聲道頻譜係數塊; 立體聲參數解碼步驟,基於所述塊長控制信號W及立體聲參數提取模式標記,對所 述立體聲參數編碼數據塊進行解碼處理從而獲得所述單聲道頻譜係數塊對應的立體聲參 數; 立體聲處理步驟,基於所述塊長控制信號根據所述單聲道頻譜係數塊W及所述立體聲 參數進行立體聲處理從而獲得配對聲道頻譜係數塊; 時頻反變換步驟,基於所述塊長控制信號對所述配對聲道頻譜係數塊進行時頻反變換 從而獲得目標音頻的配對聲道時域信號。
9. 如權利要求8所述的方法,其特徵在於,在所述立體聲參數解碼步驟中,根據所述塊 長控制信號W及立體聲參數提取模式標記選擇相應的立體聲參數解碼模式。
10. 如權利要求9所述的方法,其特徵在於,所述立體聲參數解碼模式包含普通解碼模 式W及超峽解碼模式。
【文檔編號】G10L19/008GK104347077SQ201410573759
【公開日】2015年2月11日 申請日期:2014年10月23日 優先權日:2014年10月23日
【發明者】竇維蓓, 盧敏 申請人:清華大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀