一種編解碼方法及裝置的製作方法
2023-06-13 12:55:41 3
專利名稱:一種編解碼方法及裝置的製作方法
技術領域:
本發明涉及音頻編碼技術領域,尤其涉及一種編解碼方法及裝置。
技術背景獲得立體聲信號的途徑主要有以下兩種 一是採用雙麥克風或多麥克風自 然錄音獲得立體聲信號,另一個是通過音頻工作室人工混音獲得立體聲信號。 其中,在第一個途徑中,各聲道音頻來自同一個音頻場景,除了由於麥克風放 置方向不同而造成的時間差、強度差等不同,各麥克風所記錄的音頻信息基本 一致,因此各聲道音頻之間具有很強的相關性。而在第二個途徑中,在大多數 情況下都是力求營造具有真實感的音頻場景,因此各聲道音頻間也具有很強的相關性。因此,利用上述的相關性降低多聲道編碼的碼率的相關技術已成為音 頻編碼領域中的一個重要i果題。其中,較早提出的是和差立體聲(Sum-difference Stereo)方法。該方法 將原始立體聲信號中的左聲道L與右聲道R在頻域對應頻率處進行相加和相減 處理,分別得到和聲道S與差聲道D。該方法可以用較小的碼率進行編碼。但是, 在該方法中,由於仍需要對變換後的兩個聲道的和聲道S與差聲道D獨立進行 編碼,因而碼率的下降有限。為了使碼率進一步下降,引入了心理聲學以去除聲道間的主觀冗餘的技術。 人的聽覺可以用 一個非均勻帶寬的濾波器組描述,每個濾波器組通道被稱為一 個子帶,它是最小的聽覺單位。空間感主要來自左、右聲道對應子帶信號的整 體特性,如強度差、延時、相關度,而對子帶信號的細節不敏感。該方法使碼 率有明顯下降,但由於不能重建頻鐠細節,它也帶來一定的音質損失,因此主 要用於人耳不敏感的較高頻率子帶。基於空間心理聲學的空間音頻編碼包括雙耳線索編碼,參數立體聲技術和MPEG環繞聲技術。該方法的基本原理是通過在頻域逐子帶提取對應聲道間的 時間差,強度差和相關度參數來記錄聲道間的空間信息,而不對每個聲道進行 獨立的編碼,因而有很低的碼率,同時還可以保證較高的立體聲或環繞聲音質。 但是空間音頻編碼的一個突出問題就是編解碼延時的增加。2005年,3GPP ( 3rd Generation Partnership Project,第三代移動通信合 作組織)提出的AMR-WB+ (Adaptive Multi Rate Wide Band Plus,寬帶自適應 多率編碼器)採用了基於時域聲道間預測的技術,即將和聲道和右聲道經LPC (linear predictive coding線性預測編碼)濾波,分別^f尋到和聲道殘差信號 和右聲道殘差信號;然後再通過一個預測濾波器,由和聲道殘差信號預測左、 右聲道的殘差信號,最後向解碼器傳送濾波器係數以及左右聲道的增益。eAAC+技術採用了參數立體聲技術。這種方法的原理是將立體聲信號在混 合正交鏡像濾波器域(Hybrid Quadrature Mirror Filter, HQMF)中逐子帶提耳又 空間參數,包括相位差(對應於時間差)、強度差、和相關度;然後將立體聲信 號下混成一路信號並反變換到時域進行感知音頻編碼,解碼器根據下混聲道的 編碼數據以及空間參數重建立體聲信號。在實現本發明的過程中,發明人發現時域聲道間預測技術的預測有效性 依賴於左、右聲道的相關度,對於立體聲信息豐富的信號還原失真較大。而參 數立體聲技術由於是在頻域進行音頻編碼,需要進行複雜的傅立葉變換等操作, 因而在參數立體聲技術中最突出的問題是引入了附加延時,並且解碼的複雜較 高。發明內容本發明實施例提供了一種編解碼方法及裝置,以降低多聲道壓縮編解的複雜度,並減少延時。本發明實施例編碼方法採用以下技術方案獲取估計聲道信號的估計聲道分段信號和被估計聲道信號的被估計聲道分段信號;利用所述估計聲道分段信號和被估計聲道分段信號,確定所述估計聲道分 段信號中與所述被估計聲道分段信號的各分段具有相關度的至少 一個分段;利用估計聲道分段信號中所述具有相關度的分段,對所述被估計聲道分段 信號進行估計,獲得所述被估計聲道分段信號的估計參數;將所述具有相關度的分段所對應的起始位置參數和所述估計參數進行編碼 形成估計參數碼流;將所述估計聲道分段信號進行編碼,形成估計聲道信號碼流。本發明實施例解碼方法採用以下4支術方案解析碼流獲得估計參數碼流以及估計聲道信號碼流;將所述估計聲道信號碼流進行解碼,獲得估計聲道分段信號;將所述估計參數碼流進行解碼,獲得起始位置參數和估計參數,其中所述 起始位置參數為所述估計聲道分段信號中與被估計聲道分段信號的各分段具有 相關度的至少 一個分萃爻所對應的起始位置參數;利用所述起始位置參數、估計參數以及所述估計聲道分段信號,獲得被估 計聲道分段信號。本發明實施例編碼裝置採用以下技術方案分段信號獲取單元,用於獲取估計聲道信號的估計聲道分段信號和被估計 聲道信號的被估計聲道分段信號;位置確定單元,用於利用所述估計聲道分段信號和^皮估計聲道分段信號,所述具有相關度的分段, 對所述被估計聲道分段信號進行估計,獲得所述被估計聲道分段信號的估計參 數;參數編碼單元,用於將所述最大相關度的分段所對應的起始位置參數和所 述估計參數進行編碼形成估計參數碼流;信號編碼單元,用於將所述估計聲道分段信號進行編碼,形成估計聲道信 號碼流。本發明實施例解碼裝置釆用以下技術方案碼流解析單元,用於解析碼流,獲得估計參數碼流以及估計聲道信號碼流; 信號解碼單元,用於將所述估計聲道信號碼流進行解碼,獲得估計聲道分段信號;參數碼流解碼單元,用於將所述估計參數碼流進行解碼,獲得起始位置參 數和估計參數,,其中所述起始位置參數為所述估計聲道分段信號中與被估計聲 道分段信號的各分段具有相關度的至少一個分段所對應的起始位置參數;信號獲取單元,用於利用所述起始位置參數、估計參數以及所述估計聲道 分段信號,獲得被估計聲道分段信號。通過以上描述的本發明實施例的技術方案可以看出,在編碼端,首先通過 對時域的估計、被估計聲道信號進行加窗處理而得到估計、被估計聲道分段信 號;然後,再通過估計聲道分段信號對被估計聲道信號進行估計,得到估計參 數;最後將估計聲道分段信號以及估計參數進行編碼並形成編碼碼流。在解碼 端,首先解析編碼碼流得到估計參悽i碼流以及估計聲道信號碼流,並利用估計參數以及對估計聲道信號碼流解碼後得到的估計聲道分段信號,重構被估計聲 道分段信號。因此,相較於現有技術中的方案,本發明實施例的技術方案是在時域中對 估計、被估計聲道信號進行處理,因此避免了複雜的頻域變換中的操作,降低 了多聲道編解碼的複雜度。
圖1為本發明實施例一編碼方法的流程圖; 圖2為本發明實施例三解碼方法的流程圖; 圖3為本發明實施例五編碼裝置的示意圖; 圖4為本發明實施例五編碼裝置的結構圖; 圖5為本發明實施例六解碼裝置的示意圖; 圖6為本發明實施例六解碼裝置的結構圖。
具體實施方式
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需 要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明 的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下, 還可以根據這些附圖獲得其他的附圖。為降低多聲道編碼的複雜度並減少延時,本發明實施例提供了一種編碼方 法。本發明實施例所描述的編碼方法,既可以應用在雙聲道的編碼技術中,也 可以對多聲道輸入信號的編碼技術中。下面我們分別結合當需進行編碼的是雙 聲道信號,以及多路(大於兩路)聲道信號為例描述本發明實施例編碼方法的 實現過程。實施例一 需進行編碼的聲道為兩路輸入聲道信號如圖l所示,本發明實施例一所述的編碼方法包括如下步驟 步驟11、獲取估計聲道信號的估計聲道分段信號和被估計聲道信號的被估 計聲道分段信號。在本發明的實施例中,估計、被估計聲道信號是一個相對的概念。在實際 應用中,若將左聲道信號作為估計聲道信號,則右聲道信號就成為被估計聲道 信號;同樣,若將右聲道信號作為估計聲道信號,則左聲道信號就成為被估計 聲道信號。並且,在本發明實施例中,對左右聲道信號中哪個聲道的信號作為 估計聲道信號不做限制。在此步驟中,主要是通過分別對估計聲道信號、被估計聲道信號進行加窗 處理,得到估計聲道分段信號、被估計聲道分段信號。分別對時域的估計、被 估計聲道信號進行加窗處理的過程具體為利用一定的幀長,對所述估計、被 估計聲道信號進行分幀截斷,得到估計、被估計聲道分段信號。例如,可利用 矩形窗、正弦窗、餘弦窗等,將估計、被估計聲道信號進行分幀截斷操作。當 然,還可以採用其他的方式。步驟12、利用所述估計聲道分段信號和被估計聲道分段信號,確定所述估 計聲道分段信號中與所述被估計聲道分段信號的各分段具有相關度的至少 一個 分段。具有相關度的至少一個分段是指,在對被估計聲道分段信號進行估計的過 程中,在被估計聲道分段信號中,只要是與被估計聲道分段信號的各分段具有 相關度的分段都能用來對被估計聲道分段信號進行估計。只是相關度的大小不 同,帶來的估計效果不同。在實際應用中,為了達到更好的估計效果, 一般採 用具有最大相關度的分段。在此步驟中,具體可通過利用被估計聲道分段信號,在估計聲道分段信號的前後相鄰三幀中,利用定長滑動窗技術計算估計、被估計聲道分段信號中各 對應分段之間的相關度。
下面簡要介紹一下最大相關度段的選取方法。以估計聲道信號為左聲道信
號,被估計聲道信號為右聲道信號為例,對於被估計的第i幀右聲道信號,從 與它對齊的第i幀左聲道信號以及第i-l幀和第i+l幀左聲道信號這連續三幀 左聲道信號中,尋找與它具有最大相關度的一段長度等於幀長的信號,作為所 述第i幀右聲道信號的估計信號。也就是說,在左聲道相鄰的三幀中有一個窗 在滑動,以尋找與右聲道的這幀信號具有最大相關度的一段來估計右聲道。這 時需要記錄滑動窗的位置或極大相關度段的起始位置參數t。
具體可以這樣搜索最大相關度段被估計的右聲道信號R恰為一個窗長共 16點,記為R[O: 15], L的相鄰三個窗長段記為L[-16: 31],具有相同序號的 時間窗點在時間上是對齊的。滑動窗/人L[-16]起始,逐點滑動,計算與R
的線性相關係數,這樣會得到33個線性相關係數r
,即計算向量 Uj-16: j-l]與向量R
的線性相關係數的平方,其計算公式如公式(1 ) 所示
其中,j = 0, 1,…,32。
然後獲取r2[j]值中最大的值,該最大值所對應的序號j就可認為是極大相 關度段起始位置參數t。
步驟13、利用所述估計聲道分段信號中具有相關度的分段,對所述被估計 聲道分段信號進行估計,獲得所述被估計聲道分段信號的估計參數。
在此需要說明的是,利用估計聲道分段信號中具有相關度的分段,對所述 被估計聲道分段信號進^f亍估計可以採用一階線性回歸估計,高階線性回歸估計
砂- 或者線性預測等估計方法。但是,利用一階線性回歸估計方法進行估計的話, 計算量較小,且可降低編碼的複雜度。
當採用 一階線性回歸估計時,所述的回歸參數相應的稱為線性回歸估計參 數。其中所述線性回歸估計參數可包括第一線性回歸估計參數k和第二線性回
歸估計參數b。 k和b的計算公式如公式(2 )和公式(3 )所示
formula see original document page 14(3)
其中,用k表示第一線性回歸估計參數,用b表示第二線性回歸估計參數,
x,, X分別是估計聲道分段信號和被估計聲道分段信號的第!'個分量,7, ^分別為
估計聲道分段信號和被估計聲道分段信號的平均值。
上述兩個線性回歸估計參數是在最小均方誤差和能量守恆兩個約束條件下
計算得到的。因此,在解碼時,可通過此線性回歸估計參數,起始位置參數以
及估計聲道分段信號,最大相似的還原出被估計聲道分段信號。 步驟14、將所述估計參數進行量化編碼,得到估計參數碼流。 在對估計參數進行量化編碼的過程中,量化階梯可由均勻信噪比原則得到。
然後,再將量化後的整數進行編碼,例如利用霍夫曼(Huffman)編碼技術進行
編碼。其中在進行霍夫曼編碼的過程中,Huffman碼錶3耍照標準的碼錶構造方法,
根據上述量化得到的整數的分布而生成。
步驟15、對所述估計聲道分段信號進行編碼,形成估計聲道信號碼流。 在對估計聲道分段信號進行編碼的過程中,可以利用例如ACELP( Algebraic
Code excited Linear Prediction,代數碼激勵線性預測)編碼器,感知音頻
編碼器如MPEG-2/4 AAC,對所述估計聲道分段信號進行編碼。
最後再將所述估計聲道信號碼流以及所述估計參數碼流復接形成編碼碼流。
實施例二需進行編碼的聲道為多路(大於兩路)輸入聲道
在實施例二中,以輸入聲道信號為四路信號為例進行描述,並分別設這四 路輸入聲道信號分別為A,B,C,D。並且,在此實施例中,同樣以利用估計聲道分 段信號中,與被估計聲道分段信號的各分段具有最大相關度的分段為例,並以 線性回歸估計為例進行描述。
首先,需從這四路輸入聲道信號中任選一路輸入聲道信號作為估計聲道信 號,那麼其他三路輸入聲道信號則作為被估計聲道信號。在此,選擇輸入聲道
信號A作為估計聲道信號,B,C,D則同為^:估計聲道信號。具體過程如下
步驟lla、與實施例一中描述的相同,首先分別對這四路輸入聲道信號進行
加窗處理,得到相應的輸入分段信號。
步驟12a、利用分段聲道信號A和分段聲道信號B, C和D,分別確定分段
聲道信號A中與分段聲道信號B, C和D的各分段具有最大相關度的分段的起始
位置參數tl, t2,和t3。確定所述起始位置參數的過程與實施例一中所描述的相同。
步驟13a、分別利用所述分段聲道信號A中具有最大相關度的分段,對所述 分段聲道信號B, C, D進行線性回歸估計,獲得所述分段聲道信號B, C, D相應的 線性回歸參數。
步驟14a、分別將分^a聲道信號B, C, D所對應的線性回歸估計參數和相應的 起始位置參數進行編碼,分別形成與各分段聲道信號B, C, D相應的估計參數碼 流。
步驟15a、將分段聲道信號A進行編碼,形成估計聲道信號碼流。
步驟16a、最後再將上述估計參數碼流和估計聲道信號碼流進行復接形成編碼碼流。
當然,在多聲道輸入信號時,還可有其他實現編碼的方式。但其利用一路 輸入聲道信號對另一5^輸入聲道進^f亍估計的原理相同,最終形成編碼碼流的過 程也相同。
此外,在形成所述編碼碼流後,還可以將所述編碼碼流存儲或發送到解碼 器,以方便解碼端的操作。
通過此步驟可以看出,在本發明第一實施例和第二實施例的技術方案中, 利用估計聲道分段信號對被估計聲道分段信號進行線性回歸估計,而在編碼的 時候並不利用被估計聲道分段信號。因此,本發明實施例所述的編碼方法,只 是利用了估計聲道信號,以及估計聲道信號與被估計聲道信號之間的線性相關 度進行編碼,因此編碼的結果只與其中的 一個聲道信號有關。
並且,本發明實施例所述的編碼方法在時域中對估計、-故估計聲道信號進 行處理,因此避免了複雜的頻域變換中的操作,降低了多聲道編碼的複雜度,
提高了編碼效率和靈活性;同時,在進行編碼的過程中,只是對估計、被估計
聲道信號進行一次加窗處理,因此本發明實施例的技術方案減小了多聲道編碼 中的延時。
與本發明實施例一編碼方法相對應,本發明實施例三提供了一種解碼方法。
如圖2所示,本發明實施例三解碼方法包括如下步驟
步驟21、解析碼流獲得估計參數碼流以及估計聲道信號碼流。
根據編碼端將估計參數碼流以及估計聲道信號碼流進行編碼的規則,從所
述編碼碼流中解析得出估計參數碼流以及估計聲道信號碼流。
步驟22、利用與編碼端的編碼方法相對應的解碼方法,將所述估計聲道信 號碼流進行解碼,獲得估計聲道分段信號。步驟23、將所述估計參數碼流進行解碼,將所述估計參l史碼流進行解碼,
獲得起始位置參數和估計參數。其中所述起始位置參數為所述估計聲道分段信 號中與被估計聲道分段信號的各分段具有相關度的至少 一個分段所對應的起始
位置參數。
步驟24、利用所述起始位置參數、估計參數以及所述估計聲道分段信號, 獲得被估計聲道分段信號。
在此步驟中,可根據所述起始位置參數,確定估計聲道分段信號中具有所 述起始位置參數的分段,其中該分段為與被估計聲道分段信號的各分段具有相 關度的分段。然後再利用所述估計參數,以及估計聲道分段信號中具有所述起 始位置參數的分段,進行估計,獲得被估計聲道分段信號。
同時,才艮據實施例一和二所描述的編碼方法可知,可利用估計聲道分l爻信 號中與被估計聲道分段信號中具有最大相關度的分段,對被估計聲道分段信號 進行線性回歸估計,以達到最好的估計效果,並降低編碼的複雜度。因此,在 上述步驟23中所獲得的估計參數相應為線性回歸估計參數,並且包括第一線性 回歸估計參數k和第二線性回歸估計參數b。
因此,在步驟24中,可首先根據所述起始位置參數,確定估計聲道分段信 號中具有所述起始位置參數的分段,其中該分段為具有與被估計聲道分段信號 最大相關度的分段;利用所迷線性回歸估計參數,以及估計聲道分段信號中具 有所述起始位置參數的分段,進行線性回歸估計,獲得被估計聲道分段信號。
在此步驟中,可通過建立被估計聲道信號和估計聲道信號之間的線性關係 來獲得被估計聲道信號。例如,上述線性關係可表示成公式(4)所示的形式
7 =議+ 6, (4) 其中k為第一線性回歸估計參數,b為第二線性回歸估計參數,X為解碼得
17到的估計聲道分段信號中具有最大相關度的分段信號,Y為還原出的被估計聲道 分段信號。
由實施例一可以看出,由於k和b的獲取是在最小均方誤差和能量守恆兩 個約束條件下計算得到的,並且在還原被估計聲道分段信號時是利用的估計聲 道分段信號中具有最大相關度的分段,因此,利用上述方法還原出的被估計聲 道分段信號與編碼端輸入的估計聲道信號具有最大的相似度。
此外,為便於重建估計、被估計聲道分段信號,本發明實施例三在步驟22 後,所述的方法還包括對所述估計聲道分l殳信號進行加窗處理。
當編碼端的估計聲道信號和被估計聲道信號的個數超過兩路時,在解碼端 進行解碼時,與實施例三中不同的是,在解析碼流時獲得的是至少一路估計聲 道信號碼流。在對所述估計參數碼流進行解碼後得到的線性回歸估計參數中, 包括的線性回歸估計參數是多路被估計聲道分段信號所對應的,而起始位置參 數是多路估計聲道分段信號所對應的。
那麼在獲取每一路被估計聲道信號時,都要利用其相應的線性回歸估計參 數,相應的估計聲道分段信號及起始位置參數。在獲取過程中的具體方式與實 施例三中所描述的相同。
另外,在還原估計聲道分段信號、被估計聲道分^:信號後,可以根據不同 應用場合的要求,例如對估計聲道分段信號、被估計聲道分段信號進行提高聲 音效果的處理等等。
通過實施例編碼方法和解碼方法的技術方案可以看出,在編碼端,首先通 過對時域的估計、被估計聲道信號進行加窗處理而得到估計、被估計聲道分段 信號;然後,再通過估計聲道分段信號對被估計聲道信號進行線性回歸估計, 得到估計參數;最後將估計聲道分段信號以及估計參^:進行編碼並形成編碼碼
18流。在解碼端,首先解析編碼碼流得到估計參數碼流以及估計聲道信號碼流, 並利用估計參數以及對估計聲道信號碼流解碼後得到的估計聲道分段信號,重 構被估計聲道分段信號。
因此,相較於現有技術中的方案,本發明實施例的技術方案是在時域中對 估計、被估計聲道信號進行處理,因此避免了複雜的頻域變換中的操作,降低
了多聲道編解碼的複雜度;同時,在進行編碼的過程中,只是對估計、被估計 聲道信號進行一次加窗處理,因此本發明實施例的技術方案減小了多聲道編碼 技術中的延時。
^流程,
觀
是可以通過電腦程式來指令相關的硬體來完成,所述的程序可存儲於一計算 機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。
其中,所述的存儲介質可為磁碟、光碟、只讀存儲記憶體(Read-0nly Memory, 讓)或隨機存儲記憶體(Random Access Memory, RAM)等。
此外,本發明實施例五還提供了一種編碼裝置。如圖3所示,本發明實施 例所述的編碼裝置包括分段信號獲取單元31,位置確定單元32,估計參數計 算單元33,參數編碼單元34,信號編碼單元35。
其中,所述分段信號獲取單元31,用於獲取估計聲道信號的估計聲道分段 信號和被估計聲道信號的被估計聲道分段信號;起始位置參數計算單元32,用 於利用所述估計聲道分萃殳信號和^皮估計聲道分段信號,確定所述估計聲道分4殳 信號中與所述被估計聲道分段信號的各分段具有相關度的至少一個分段;估計 參數計算單元33,用於利用估計聲道分段信號中所述具有相關度的分段,對所 述被估計聲道分段信號進行估計,獲得所述被估計聲道分段信號的估計參數; 參數編碼單元34,用於將所述最大相關度的分段所對應的起始位置參數和所述估計參數進行編碼形成估計參數碼流;信號編碼單元35,用於將所述估計聲道分段信號進行編碼,形成估計聲道信號碼流。
最後,還可將參數編碼單元34和信號編碼單元35所分別得到的估計參數碼流和估計聲道信號碼流復接形成編碼碼流,以便於發送或存儲。
其中,如圖4所示,所述位置確定單元32包括:相關度計算模塊321,用於計算所述估計聲道分段信號和被估計聲道分段信號中對應分段之間的相關度;分段定位模塊322,用於在所述估計聲道分段信號中,確定所述估計聲道分段信號中與所述被估計聲道分段信號的各分段具有相關度的至少 一個分段所對應的起始位置參數。
同樣,在此實施例中,也可利用估計聲道分段信號中具有最大相關度的分段對被估計聲道分段信號進行估計,以最大程度上的估計被估計聲道分段信號。其原理與實施例一和實施例二中所描述的原理相同,在此不再贅述。
本發明實施例編碼裝置的技術方案是在時域中對估計、被估計聲道信號進行相應的處理,因此避免了複雜的頻域變換中的操作,降低了音頻編碼的複雜度;同時,在進行編碼的過程中,只是對估計、被估計聲道信號進行以此加窗處理,因此本發明實施例的技術方案減小了多聲道編碼中的延時。
與本發明實施例編碼裝置相對應,本發明實施例六提供了 一種解碼裝置。如圖5所示,本發明實施例解碼裝置包括碼流解析單元51,信號解碼單元52,參數碼流解碼單元53,以及信號獲取單元54。
其中,碼流解析單元51,用於解析碼流,獲得估計參數碼流以及估計聲道信號碼流。信號解碼單元52,用於將所述估計聲道信號碼流進行解碼,獲得估計聲道分段信號。參數碼流解碼單元53,用於將所述估計參數碼流進行解碼,獲得起始位置參數和估計參數;其中所述起始位置參數為所述估計聲道分段信號中與被估計聲道分段信號的各分段具有相關度的至少 一個分段所對應的起始
位置參數。信號獲取單元54,用於利用所述起始位置參數、估計參數以及所述估計聲道分段信號,獲得被估計聲道分段信號。
其中,如圖6所示,為便於重建估計、被估計聲道信號,所述解碼裝置還可包括第二分段信號獲取單元55,用於對所述估計聲道分段信號進行加窗處理。操作單元56,用於對對所述估計聲道分段信號、^皮估計聲道分段信號進行再處理,得到估計聲道信號和^皮估計聲道信號。
如圖6所示,所述信號獲取單元54包括分段確定模塊541,用於根據所述起始位置參數,確定估計聲道分段信號中具有所述起始位置參數的分段,其中該分段為與被估計聲道分段信號的各分段具有相關度的分段;被估計聲道分段信號獲取模塊542,用於利用所述估計參數,以及估計聲道分段信號中具有所述起始位置參數的分段,進行估計,獲得被估計聲道分^:信號。
當編碼端是利用估計聲道分段信號中具有最大相關度的分段對被估計聲道分段信號進行線性回歸估計的時候,參數碼流解碼單元53所獲得的估計參數相應的為線性回歸估計參數;所述分段確定模塊541所確定的分段相應的為估計聲道分段信號中具有最大相關度的分段,因此被估計聲道分段信號獲取模塊542,用於利用所述線性回歸估計參數,以及估計聲道分段信號中具有最大相關度的分段,進行估計,獲得被估計聲道分段信號。其獲得被估計聲道分段信號的原理與實施例三和實施例四中描述的相同。
綜上所述,相較於現有技術中的方案,本發明實施例的技術方案是在時域中對估計、被估計聲道信號進行相應的處理,因此避免了複雜的頻域變換中的操作,降低了音頻編碼的複雜度;同時,在進行編碼的過程中,只是對估計、被估計聲道信號進行以此加窗處理,因此本發明實施例的技術方案減小了延時。
21而且,本發明實施例所述的裝置可以作為單聲道編碼系統的預處理子系統,使其擴展成一個多聲道編解碼系統,並可以提供高保真的單聲道信號,通過靈活使用編碼端提取的估計參數,可以實現多種後處理效果。
此外,現有技術中的其他多聲道編碼方案中都是傳送下混聲道,即"和聲道"或"差聲道"。雖然在將各聲道下混之前已經提取了各聲道間的差異性信息,但是,用於重建立體聲的參考信號並不是原始用於提^^差異性信息的參考信號,所以無法近似恢復原聲的聲像位置。同時由於使用的參考信號是下混信號,在下混處理過程中,如"和聲道"處理,參考信號的聲^f象位置已經向兩聲道中心偏移,必然導致聲道間距離變窄,即聲場變窄。而本發明只是將估計聲道信號進行編碼,因此,利用本發明實施例改善了聲場寬度。
以上所述,僅為本發明的具體實施方式
,但本發明的保護範圍並不局限於此,任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內,可輕易想到變化或替換,都應涵蓋在本發明的保護範圍之內。因此,本發明的保護範圍應所述以權利要求的保護範圍為準。
權利要求
1、一種編碼方法,其特徵在於,所述方法包括如下步驟獲取估計聲道信號的估計聲道分段信號和被估計聲道信號的被估計聲道分段信號;利用所述估計聲道分段信號和被估計聲道分段信號,確定所述估計聲道分段信號中與所述被估計聲道分段信號的各分段具有相關度的至少一個分段;利用估計聲道分段信號中所述具有相關度的分段,對所述被估計聲道分段信號進行估計,獲得所述被估計聲道分段信號的估計參數;將所述具有相關度的分段所對應的起始位置參數和所述估計參數進行編碼形成估計參數碼流;將所述估計聲道分段信號進行編碼,形成估計聲道信號碼流。
2、 根據權利要求1所述的編碼方法,其特徵在於,獲取估計聲道信號的估 計聲道分段信號和被估計聲道信號的被估計聲道分段信號的步驟具體為利用一定的幀長,對所述估計聲道信號、被估計聲道信號進行分幀截斷, 得到估計聲道分段信號、被估計聲道分段信號。
3、 根據權利要求1所述的編碼方法,其特徵在於,利用所述估計聲道分段 信號和被估計聲道分段信號,確定所述估計聲道分段信號中與所述被估計聲道 分段信號的各分段具有相關度的至少 一個分段的步驟具體為計算所述估計聲道分段信號和被估計聲道分段信號中對應分段之間的相關度;在所述估計聲道分段信號中,確定所述估計聲道分段信號中與所述被估計 聲道分段信號的各分段具有相關度的至少 一個分段所對應的起始位置參數。
4、 根據權利要求1所述的編碼方法,其特徵在於,所述估計參數包括第一 估計參數和第二估計參數;在利用估計聲道分段信號中所述具有相關度的分段,對所述被估計聲道分 段信號進行估計,獲得所述被估計聲道分段信號的估計參數的步驟中,第一估計參數的計算公式為formula see original document page 3 第二估計參數的計算^^式為formula see original document page 3其中,用k表示第一估計參數,用b表示第二估計參數,"',X分別是估計 聲道分段信號和被估計聲道分段信號的第''個分量,f, ^分別為估計聲道分段信 號和被估計聲道分段信號的平均值。
5、 一種解碼方法,其特徵在於,所述方法包括如下步驟 解析碼流獲得估計參數碼流以及估計聲道信號碼流; 將所述估計聲道信號碼流進行解碼,獲得估計聲道分段信號; 將所述估計參數碼流進行解碼,獲得起始位置參數和估計參數,其中所述起始位置參數為所述估計聲道分段信號中與被估計聲道分段信號的各分段具有 相關度的至少一個分段所對應的起始位置參數;利用所述起始位置參數、估計參數以及所述估計聲道分段信號,獲得被估 計聲道分段信號。
6、 根據權利要求5所述的解碼方法,其特徵在於,將所述估計聲道信號碼 流進行解碼,獲得估計聲道分段信號的步驟後還包括對所述估計聲道分段信號進行加窗處理。
7、 根據權利要求5或6所述的解碼方法,其特徵在於,利用所述起始位置 參數、估計參數以及所述估計聲道分段信號,獲得被估計聲道分段信號的步驟 具體為根據所述起始位置參數,確定估計聲道分段信號中具有所述起始位置參數 的分段,其中該分段為與被估計聲道分段信號的各分段具有相關度的分段;利用所述估計參數,以及估計聲道分段信號中具有所述起始位置參數的分 段,進行估計,獲得被估計聲道分段信號。
8、 根據權利要求7所述的解碼方法,其特徵在於,所述方法還包括 對所述估計聲道分段信號、被估計聲道分段信號進行再處理,得到估計聲道信號和被估計聲道信號。
9、 一種編碼裝置,其特徵在於,所述裝置包括分段信號獲取單元,用於獲取估計聲道信號的估計聲道分段信號和被估計 聲道信號的被估計聲道分段信號;位置確定單元,用於利用所述估計聲道分段信號和被估計聲道分段信號, 確定所述估計聲道分段信號中與所述被估計聲道分段信號的各分段具有相關度 的至少一個分>^;估計參數計算單元,用於利用估計聲道分段信號中所述具有相關度的分段, 對所述被估計聲道分段信號進行估計,獲得所述被估計聲道分段信號的估計參 數;參數編碼單元,用於將所述最大相關度的分段所對應的起始位置參數和所 述估計參數進行編碼形成估計參數碼流;信號編碼單元,用於將所述估計聲道分段信號進行編碼,形成估計聲道信 號碼流。
10、 根據權利要求9所述的編碼裝置,其特徵在於,所述位置確定單元包括相關度計算模塊,用於計算所述估計聲道分段信號和被估計聲道分段信號 中對應分段之間的相關度;分段定位模塊,用於在所述估計聲道分段信號中,確定所述估計聲道分段信號中與所述被估計聲道分段信號的各分段具有相關度的至少一個分段所對應 的起始位置參數。
11、 一種解碼裝置,其特徵在於,所述裝置包括碼流解析單元,用於解析碼流,獲得估計參數碼流以及估計聲道信號碼流; 信號解碼單元,用於將所述估計聲道信號碼流進行解碼,獲得估計聲道分 段信號;參數碼流解碼單元,用於將所述估計參數碼流進行解碼,獲得起始位置參 數和估計參數,其中所述起始位置參數為所述估計聲道分段信號中與被估計聲 道分段信號的各分段具有相關度的至少 一個分段所對應的起始位置參數;信號獲取單元,用於利用所述起始位置參數、估計參數以及所述估計聲道 分段信號,獲得被估計聲道分段信號。
12、 根據權利要求11所述的解碼裝置,其特徵在於,所述信號獲取單元包括分段確定模塊,用於根據所述起始位置參數,確定估計聲道分段信號中具 有所述起始位置參數的分段,其中該分段為與被估計聲道分段信號的各分段具 有相關度的分段;被估計聲道分段信號獲取模塊,用於利用所述估計參數,以及估計聲道分 段信號中具有所述起始位置參數的分段,進行估計,獲得被估計聲道分段信號。
13、 根據權利要求11或12所述的解碼裝置,其特徵在於,所述裝置還包括第二分段信號獲取單元,用於對所述估計聲道分段信號進行加窗處理。
14、 根據權利要求13所述的解碼裝置,其特徵在於,所述裝置還包括 操作單元,用於對對所述估計聲道分段信號、被估計聲道分段信號進行再處理,得到估計聲道信號和被估計聲道信號。
全文摘要
本發明提供了一種編解碼方法及裝置,涉及音頻編碼技術領域,為降低多聲道壓縮編解的複雜度、減少延時而發明。其中,編碼方法包括獲取估計聲道信號的估計聲道分段信號和被估計聲道信號的被估計聲道分段信號;利用估計聲道分段信號和被估計聲道分段信號,確定估計聲道分段信號中與被估計聲道分段信號的各分段具有相關度的至少一個分段;利用估計聲道分段信號中具有相關度的分段,對被估計聲道分段信號進行估計,獲得被估計聲道分段信號的估計參數;將具有相關度的分段所對應的起始位置參數和估計參數進行編碼形成估計參數碼流;將估計聲道分段信號進行編碼,形成估計聲道信號碼流。本發明主要應用於多聲道編解碼技術中。
文檔編號G10L19/00GK101673545SQ20081014958
公開日2010年3月17日 申請日期2008年9月12日 優先權日2008年9月12日
發明者吳文海, 張樹華, 竇維蓓, 萍 遲 申請人:華為技術有限公司;清華大學