Transform-basedcoding/decoding,withadaptivewindows的製作方法
2023-04-23 00:27:36 1
專利名稱:Transform-based coding/decoding, with adaptive windows的製作方法
一種具有合適的窗口的基於變換的編碼和解碼方法本發明涉及一種數位訊號的編碼和解碼方法。為了能降低在基於變換的編碼中的比特率,通常是在保證最小失真的同時降低採 樣編碼過程中的精確度。為了實現這一目的,可使用感知加權來控制量化精度的降低。根 據人眼(對於圖像編碼)和人耳(對於聲音編碼)的已知特性為例,本發明能夠將量化噪 聲設置在最小的感知頻帶中。為使用在心理視覺或心理聲學模型中的信息,特別是在頻域中,運用時間/頻率 變換,在頻域中執行的量化都可標準化實踐。
圖1圖示說明了基於變換的編碼器的結構,包括-用於接收輸入信號X的分析濾波器FAl至FAn組BA;-量化組Q(包括頻帶量化模塊Ql至Qn),其後為包括編碼模塊CODl至CODn的編 碼組COD ;以及-用於傳輸已編碼信號X'的合成濾波器FSl至FSn組BS。為了在傳輸前進一步的降低比特率,通常使用熵(無損)編碼過程編碼已量化的 頻域採樣。在標準的方法中,該量化是通過均勻或非均勻標量量化器或矢量量化器來實現 的。在量化步驟中引入的噪聲通過合成濾波器組進行成型(這一過程通常稱之為應 用逆變換)。因此,該與分析變換相關聯的逆變換必須選擇能集中在頻域或時域中的量化噪 聲,從而防止量化噪聲變成可感知的噪聲。分析變換必須最優化的集中信號的能量,以便於對變換域中的採樣進行編碼。這 種處理方法被稱為能量壓縮。具體地,取決於輸入信號的分析變換的編碼增益必須最大化。 為此,使用以下類型的公式,式中K為常數,其優選值為6. 02,以及R為每個選擇採樣的比特 數SNR = GTC+K 『 R (1)因此,獲得的信噪比(SNR)與R成正比,再加上表示變換編碼增益的分量GTC。編碼增益越高,重構的質量就越高。由此可見,在編碼過程中使用變換的重要性。 它有助於對採樣進行編碼,通過其能夠集中信號(通過分析部分的方法)和量化噪聲(通 過合成部分的方法)的能量的方法。通常,聲音和圖像都是不穩定的,時間頻率變換必須適用於如一濾波器組的輸入 信號特性為函數的時間變化。以下討論幾種常用的編碼技術的應用。對於調製變換,標準的語音編碼技術集成了餘弦調製濾波器組,從而能夠實現這 些採用基於餘弦變換或者快速傅立葉變換的快速算法的編碼技術。這類最為常用的變換(尤其是MP3,MPEG-2和MPEG-4的AAC編碼中)是改進離散 餘弦變換(MDCT),其表達式如下^
權利要求
一種使用具有重疊的加權窗口對數位訊號進行基於變換的編碼方法,其特徵在於,兩個具有相同尺寸(2M)的信號採樣連續塊分別通過第一分析窗口(ha1)和第二分析窗口(ha2)進行加權,以及,所述第一窗口和第二窗口各自包括上升沿和下降沿且第二窗口(ha2)的上升沿不同於時間反轉的第一窗口(ha1)的下降沿。
2.根據權利要求1所述的編碼方法,其特徵在於,所述第一和第二窗口是根據適用於 兩個塊各自確定的信號特性的標準所選擇的各個加權窗口相互獨立選擇。
3.根據權利要求2所述的編碼方法,其特徵在於,所述選擇加權窗口的標準是下述條 件的一個或其組合 最大化編碼增益(Gtc); 最小化變換採樣的熵(Jh); 優化由編碼/解碼所引起的失真以及所述編碼所需的比特率的折衷(Jed)。
4.根據權利要求1至3中任一所述的編碼方法,其特徵在於,所述用於塊編碼的各個加 權窗口選自可能加權窗口的庫,所述窗口索引都與來自所述庫的各個窗口有關,以及所述選擇窗口的索引發送至解碼器,以解碼與在編碼中選擇窗口類似的窗口。
5.根據上述權利要求中任一所述的編碼方法,其特徵在於,所述至少一些分析窗口在 該窗口結束部分包含確定數量(Mz)值為零的連續加權係數,以及所述確定數量(Mz)的零系 數小於窗口係數總數(2M)的四分之一。
6.一種使用具有重疊的加權窗口對數位訊號進行基於變換的解碼方法,其特徵在於, 兩個具有相同尺寸(2M)的信號採樣連續塊分別通過第一合成窗口(hsl)和第二合成窗口 (hs2)進行加權,以及,其中所述第一窗口和第二窗口各自包括上升沿和下降沿且第二窗口(hs2)的上升沿不 同於時間反轉的第一窗口(hsl)的下降沿。
7.根據權利要求6所述的解碼方法,其特徵在於,接收在所述編碼器處的分析窗口中 的連續用於編碼的信息(cod(hai)),並且所述第一和第二合成窗口(hsl,hs2)從連續用於 編碼的第一和第二分析窗口(hsl,ha2)中進行推斷,通過分別反轉所述第二和第一分析窗 口的加權係數的時間位置和分別對第二和第一分析窗口的每個加權係數應用校正因子(1/ D (η)),所述第一和第二合成窗口可以分別通過所述第二和第一分析窗口推斷出來。
8.根據權利要求7所述的解碼方法,其特徵在於,所述第一合成窗口(hsl)和第二分合 成窗口(hs2)可以分別通過第一分析窗口(hal)和第二分析窗口(ha2),使用以下類型的公式 進行推斷,, 「、 hal (M -1 - ) (" + M) = V)式中 數字M使得一個採樣塊包括2M個採樣; η是包括在0至M-I之間的時間位置索引; h(n)表示具有時間位置索引η的窗口 h的加權係數; -η與所述索引η相等且相反,表示所述時間位置的反轉;以及, D(n)表示所述校正因子應用於時間位置係數n,其中該因子是在包括在0至M-I之間 的非零值,並且通過公式表示為D (n) = hal (n+M) · ha2 (M-l-n) +ha2 (n) · hal (2M_l-n)。
9.根據權利要求7或8所述的解碼方法,其特徵在於,所述分析窗口中的信息包括選自 用於編碼的窗口的庫(DIC)中的索引,以及提供用於解碼的包括與用於編碼的分析窗口相 似的分析窗口的相似庫(DIC'),以及通過所述校正因子(1/D(n))預先校正,每個在相似 庫中的窗口都有可以由發送至解碼器的所述分析窗口索引所確定的庫索引。
10.根據權利要求7或8所述的解碼方法,其特徵在於,所述在分析窗口中的信息包括 從用於編碼的窗口的庫(DIC)中的索引,以及還提供用於解碼的包括從用於編碼的分析濾 波器組的原形濾波器中分別獲得的窗口的相同的庫,以及其中為編碼應用 時間位置反轉;以及, 如果預測的係數的校正因子完全不同於在預定閾值中的單位值,將所述校正因子(1/ D(η))應用於選自所述庫的窗口的係數。
11.根據權利要求6至10任一所述的解碼的方法,其特徵在於,所述至少一些合成窗口 包括在該窗口開始部分具有確定數量的值為零的連續加權係數,以及所述零係數的確定數 量(Mz)小於窗口係數總數(2Μ)的四分之一。
12.根據權利要求11所述的解碼方法,其特徵在於,包括使用對應兩個時間反轉分析 窗口部分的加權窗口的合成操作,其中通過所述合成窗口進行的加權是籍助於累加來實現 的,所述分析窗口部分(hal)和(ha2)可以通過hal(n+M) =h(n+M)/A (η)以及ha2(n) =h(n)/ Δ (η)類型公式表示為初始窗口 h (η)的函數,式中數字M使得一個採樣塊包括2Μ個採樣,η 是時間索引且0 < η < Μ,以及Δ (η)是定義任何索引η且0 < η < M的非零歸一化因子。
13.根據權利要求11或12所述的解碼方法,其特徵在於,所述根據hsl(n+M) =h(n+M)/ Δ (η)和hs2(n) =h(n)/A (η)且0彡η < M類型的公式,兩個合成窗口的部分(hsl)和(hs2) 直接由其開始部分包括Mz零係數的初始窗口 h(n)所確定,式中數字M使得一個採樣塊包 括2M個採樣,η為時間索引且0<η<Μ,並且Δ (η)是用於定義任何索引η且0彡η < M 的非零歸一化因子。
14.根據權利要求12或13所述的方法,其特徵在於,所述歸一化因子可以表示為類型 的公式Δ(η) = ^h(n)h(2M-]-n) + h(n + M)h(M-l-n)。
15.根據權利要求13或14所述的方法,其特徵在於,所述初始窗口h(n)通過下式表 示,式中Mz是在初始窗口起始處的所述零係數的確定數量當 0 彡 η < Mz 時 h (η) = 0 ;
16.一種用於具有重疊加權窗口的基於變換的數位訊號編碼的設備,其特徵在於,包括 實施根據權利要求1至5中任一所述方法的裝置。
17.一種用於具有重疊加權窗口的基於變換的數位訊號解碼的設備,其特徵在於,包括實施根據權利要求6至15中任一所述方法的指令。
18. 一種適用於存儲在編碼/解碼設備內存中的電腦程式,其特徵在於,當所述設備 的處理器執行這些指令時,包括執行根據權利要求1至5中任一所述的編碼方法的指令,或 者包括執行根據權利要求6至15中任一所述的解碼方法的指令。
全文摘要
文檔編號G10L19/02GK101952888SQ20088012730
公開日2011年1月19日 申請日期2008年12月11日 優先權日2007年12月21日
發明者Philippe Pierrick, Virette David 申請人:France Telecom