新四季網

一種基於極小化全局噪聲掩蔽比準則和熵編碼的量化的音頻編碼方法

2023-12-08 23:09:06

專利名稱:一種基於極小化全局噪聲掩蔽比準則和熵編碼的量化的音頻編碼方法
技術領域:
本發明涉及一種對輸入音頻信號進行編碼和量化的處理方法,具體地說是指一種基於極小化全局噪聲掩蔽比準則和熵編碼量化的音頻編碼方法。
MPEG2標準中AAC音頻編碼標是比MP1、MP2更為先進的音頻感知編碼標準。與MP1、MP2標準相同,AAC標準也將輸入的時域音頻信號分割成以幀為長度的塊;並將每幀時域信號變換成頻域係數,然後將頻域係數劃分若干頻域子帶;同時通過心理聲學模型對當前幀的時域信號進行分析得到各個頻域子帶的噪聲掩蔽閾值。AAC的比特分配和量化過程與MP1、MP2不同,其中,每個子帶的係數用同一個量化步長進行量化,每個子帶的量化步長由各自的稱為尺度因子的整型變量來表示,此時的比特分配是通過一種隱性的方式實現的,即當需要給某個子帶追加(或減少)比特時,就將該子帶的尺度因子增加(或減少)1,然後根據此時的尺度因子對該子帶進行量化、熵編碼和計算編碼所需比特數,此時所需比特數和變動前所需比特數之差就是此時對該子帶追加(或減少)的比特數。在比特分配和量化的過程中,AAC標準通過兩層循環來調整各個子帶的尺度因子的大小,並以此來實現各個子帶間的比特分配,其中外層循環用來控制各個子帶的量化噪聲不超過掩蔽閾值,內層循環用來控制量化編碼頻域係數所需要的比特數不超過當前可用比特數,這兩層循環交替進行,直至兩層循環的控制條件都被滿足或別的退出條件被滿足。在上述的外層循環中,各子帶的頻域係數被由尺度因子所確定的量化步長進行量化,得到量化係數,接著量化係數又被反量化得到反量化係數,然後由頻域係數與反量化係數相減得到各個子帶的量化噪聲;在內層循環中,同樣,各個子帶的頻域係數被量化成量化係數,然後量化係數被多碼書的Huffman編碼方法編碼成相應的碼字,再統計這些碼字的總長度,這個長度加上其它一些輔助信息的編碼長度後就得到了編碼當前幀所需的比特數。因此,AAC在比特分配過程中,是通過對係數進行實際的量化,然後根據頻域係數和反量化係數計算出量化噪聲,並且通過統計量化係數Huffman碼字的長度得到編碼比特數,這顯然要比MP1、MP2中在給定比特數時通過經驗值估計噪聲精確,但是兩層循環的分配過程要比MP1、MP2的比特分配過程複雜得多,並且在目標比特數比透明量化所需比特數小得多的情況下,當量化的兩層循環結束時,各個子帶的噪聲掩蔽比是極不均勻的,在這種情況下,量化是沒有達到感知最優解的。
本發明的一種基於極小化全局噪聲掩蔽比準則和熵編碼量化的音頻編碼方法,是對輸入音頻信號進行編碼和量化的處理方法,包括如下步驟,(A)將輸入音頻信號分割成長度為幀的塊,每次讀入一幀時域信號;(B)對當前幀信號進行時頻變換,得到當前幀的頻域係數;(C)將頻域係數按固定的頻帶分劃劃分為若干頻域子帶;(D)對當前幀輸入信號進行心理聲學分析,計算各個子帶的噪聲掩蔽閾值;(E)根據編碼碼率計算出當前幀信號的可用比特數;(F)根據當前幀可用比特數和各個子帶的噪聲掩蔽閾值對各個子帶的頻域係數進行比特分配和量化;(G)對量化係數進行熵編碼,並將編碼信息和相關邊信息寫入碼流文件。
所述的音頻編碼方法,其同一個頻域子帶的係數由同一個步長進行量化。
所述的音頻編碼方法,其對於每幀信號頻域係數的比特分配和量化過程包括如下步驟,(A)給各個子帶選擇合適的初始量化步長,並對各個子帶根據各自的尺度因子進行量化、計算各個子帶NMR值、各個子帶所需比特數和總共所需比特數;(B)根據最小化最大的子帶NMR的原則對各個子帶進行比特分配,分配過程包括一個循環過程,循環過程進行到比特恰好被分配完為止,每次循環通過調整一個子帶的量化步長來調整總體所需比特數,在每次循環中若步驟(A)中計算出的所需比特數大於可用比特數,則進行如下步驟,(a)在每次循環中找出NMR最小的子帶,適當增大該子帶的量化步長;(b)以此量化步長對所選子帶進行量化,該子帶計算NMR值;(c)對所選子帶的量化係數進行熵編碼,計算該子帶所需比特數和總的所需比特數;若步驟(A)中計算出的所需比特數小於可用比特數,則進行如下步驟,(a)在每次循環中找出NMR最大的子帶,適當減小該子帶的量化步長;(b)以此量化步長對所選子帶進行量化,該子帶計算NMR值;(c)對所選子帶的量化係數進行熵編碼,計算該子帶所需比特數和總的所需比特數。
所述的音頻編碼方法,其量化模型表示為 其中x是一個頻域係數,Scale_factor是整型的尺度因子, 表示不超過y的最大整數,α和β是兩個不大於1的實數。
本發明採用基於極小化全局噪聲掩蔽比準則和熵編碼量化對音頻信號進行編碼處理,其優點是量化方法快速的達到最優感知量化結果,既克服了MP1、MP2量化精度不高的缺點,又克服了AAC運算複雜度高的缺點,而且,在可用比特數不足的情況下,也能使量化達到感知效果最優的解。
圖2是本發明中比特分配和量化過程的流程框圖。
圖3是在圖2進行改進的一個實施例流程框圖。
圖4是本發明中比特分配和量化過程的另一個實施例流程框圖。
圖5是本發明中比特分配和量化過程的再一個實施例流程框圖。
圖6是本發明中對某一個子帶量化係數進行多碼書編碼的流程框圖。
本發明是一種基於極小化全局噪聲掩蔽比準則和熵編碼量化的音頻編碼方法,在時域音頻信號被分成一定長度的幀;每一幀時域信號通過時頻變換後被變換成為頻域係數;每一幀的頻域係數被劃分成不同的頻率子帶;同時,時域信號通過心理聲學模型分析得到各個頻域子帶的噪聲掩蔽閾值;在各個子帶噪聲掩蔽閾值的控制下,可用比特數被分配給頻域係數的各個子帶,比特分配時遵循最小化全局噪聲掩蔽比的準則。
參見

圖1,音頻編碼器先在步驟101中從音頻輸入文件中讀入長度為一幀的時域信號;然後在步驟102中將讀入的時域信號通過時頻變換成頻域係數;接著在103中根據心理聲學中的臨界子帶的頻率區域劃分將頻域係數劃分成若干子帶;在104中,根據心理聲學模型對當前幀的時域信號進行了心理聲學分析,得出當前幀的感知熵和各個子帶的感知噪聲閾值,為了使音頻編碼達到感知透明的效果,必須使各個子帶係數的編碼噪聲小於對應的感知噪聲閾值;根據得到的感知熵和目標碼率在105中計算當前幀編碼的可用比特數;在上述步驟完成後,在106中對各個子帶實施比特分配和量化的過程,在這個比特分配和量化過程實現了在量化係數所需編碼比特數小於目標比特數的前提下使得各個子帶噪聲掩蔽比的最大值達到最小的最優化過程,分配給各個子帶的比特數正是這個最優化過程的解;在完成量化以後,在107中比特分配信息和量化係數就被編碼寫入碼流文件,其中由熵編碼過程將量化係數編成碼流。這樣,對於一幀音頻時域信號的編碼就完成了。
在本發明的比特分配和量化過程106中,同一個子帶內的頻域係數用同一個量化步長進行量化,當前幀的可用比特數被分配給各個子帶,實際上就是給各個子帶設置合適的量化步長。比特分配的目的是使得在整幀係數編碼所需比特數不超過可用比特數的約束下,所有子帶中最大的NMR值最小化。對於這個目的,本專利是通過如下的過程實現的,首先,給各個子帶選定一個合適的量化步長的初始值201、301、401,並計算各子帶在初始量化步長下的NMR值、所需比特數以及所需總的比特數;然後進行比特調整循環,在每次循環中,先選出某個子帶,調整所選子帶的量化步長,然後根據調整後的步長重新量化該子帶,計算所選子帶NMR值以及所需比特數,並且根據所選子帶所需比特數的變動計算此時所需總的比特數,如此循環直至求出上述約束最小化問題的解。給每個子帶確定初始步長時,可以選取較大的步長,使得每個子帶的係數都被量化為0,此時每個子帶被分配的比特數是0,在以後的每次循環中,選出NMR最大的子帶,然後適當減小該子帶的量化步長,如此循環直到比特數被分配完畢;也可以在初始化時給每個子帶確定一個較小的量化步長,使得每個子帶的量化噪聲都小於感知噪聲閾值,並且所需比特數大於可用比特數,在每次循環中,選出NMR最小的子帶,適當增大它的量化步長,如此循環直到所需比特數小於可用比特數。參見圖2、3、4所示。
作為本發明的一個實施例,對於頻域係數的量化可以採取如下的模型, 其中x是一個頻域係數,Scale_factor是整型的尺度因子, 表示不超過y的最大整數,α和β是兩個不大於1的實數,例如它們可以取值為=34,]]>=316.]]>由公式(I)可知,量化步長是尺度因子的函數,並且是單調遞減的函數。每一個子帶的係數用同一個尺度因子,即同一個量化步長進行量化,對各個子帶分配比特的過程實際上是調整各個子帶的尺度因子的過程。
圖2和圖4分別給出了在以(I)式作為量化模型時實現比特分配和量化過程106的兩個流程,它們的不同之處在於初始點選取得不同,但它們實現的功能是相同的。
首先根據圖2來說明比特分配的實現過程。在201中的可用比特數、掩蔽閾值和頻域係數是由圖1中的步驟102、103、104和105得到的。比特分配過程開始時,在202中,先對每個子帶給出初始尺度因子,使得在用初始尺度因子進行量化時,子帶中的係數都被量化為0。例如,當α和β取值為=34,]]>=316]]>時,每個子帶的初始尺度因子可以取如下的值, 其中xmax是當前子帶中絕對值最大的係數。在得出各個子帶的初始尺度因子後,在203中計算每個子帶的噪聲掩蔽比,由於此時各個子帶都被量化為0,因此此時的量化噪聲就是子帶的能量,將子帶的能量與噪聲掩蔽值相比並且將比值求對數就得到了此時的噪聲掩蔽比值。在完成了上述初始化工作後,各個子帶被量化為0,分配給各個子帶的比特數為0,整幀係數編碼所需要的總的比特數只包括一些編碼邊信息的比特數,然後從這種初始狀態開始比特分配循環。每次比特分配循環從204開始,在204中,在所有子帶中找出NMR最大的子帶。在205中讓NMR最大的子帶的尺度因子加1,以此尺度因子對該子帶重新進行量化,計算該子帶新的NMR值和量化編碼該子帶所需的比特數,然後重新計算編碼整幀係數所需的比特數。完成了205中的調整後,在206中判斷所需比特數是否超過了可用比特數,如果是,表明比特數已經分配完畢,為了保證所需比特數小於可用比特數,於是轉到207,讓剛增加1的尺度因子減1,並以該尺度因子對對應子帶重新量化,然後結束比特分配過程,此時量化過程同樣也已完成;如果206中判斷所需比特數小於可用比特數,表明還存在多餘比特,則剛作的比特分配有效,並且分配過程轉到204繼續進行。可以看出,圖2中所述比特分配和量化過程將一直進行直到可用比特數被分配完畢,而隨著過程的進行各子帶NMR的最大值也逐漸減小。
在圖2所示的過程中,即使可用比特數足夠多,在比特分配的某一個循環中,所有子帶的量化係數已經達到了感知透明,即最大的NMR值小於等於0,此時比特分配過程也將繼續進行,因此,可以對圖2作些改動,使得當達到透明量化時,就結束比特分配過程,從而加快編碼速度,如圖3所示。圖3的整體結構與圖2基本一致,只是圖3的過程在每次比特分配的循環中,在找出了當前最大的子帶NMR後,增加了檢驗此最大NMR是否大於0的判斷,如果NMR大於0,則表明所有子帶的量化係數還未達到透明量化,於是繼續比特分配過程;如果NMR不大於0,則表明所有子帶都已達到感知透明,從而不需要繼續追加分配比特,於是直接結束比特分配的過程。
圖2和圖3都是從0分配比特數的起點出發,然後逐步給各個子帶分配比特,直到比特分配完畢或達到透明量化時為止;在圖4中給出的比特分配過程與圖2和圖3不同,是首先給各個子帶分配較多的比特數,使得所有子帶都已達到透明量化,然後逐步減少各個子帶的比特分配數,直到所需比特數小於可用比特數。在圖4所示的過程中,先在402中給每個子帶選擇合適的尺度因子,使得每個子帶在各自的尺度因子量化下,都達到感知透明,然後,在403中,計算每個子帶的NMR,並且在404中計算所需比特數。在到404為止的初始化工作完成後,進入比特調整循環,首先,在405中判斷當前所需比特數是否小於或等於可用比特數,如果是,則表明當前的比特分配結果已經在滿足比特分配數小於可用比特數的條件下達到了透明量化,為了充分利用可用比特數,要將多餘比特數繼續分配,於是轉406進入分配多餘比特的循環;如果所需比特數大於可用比特數,則必須減少當前比特分配數,於是轉410進入減少分配比特的循環。在分配多餘比特的循環中,首先在406中找出NMR最大的子帶,然後在407中讓該子帶的尺度因子加1,並以此尺度因子對該子帶作量化,同時計算該子帶的NMR和所需比特數、以及編碼整幀係數所需的比特數,做完407的調整後,在408中判斷目前所需比特數是否大於可用比特數,如果是,則表明比特數已經全部分配完畢,於是轉409將剛增加1的尺度因子減1,並以此尺度因子重新量化對應子帶,然後轉413中結束比特分配和量化過程;如果在408的判斷中所需比特數不大於可用比特數,則表明還存在比特數有待分配,於是再轉406進行下一次的比特分配循環。如果在405的判斷中所需比特數大於可用比特數,則必須進入減少比特分配的過程,該過程從410開始,即找出NMR最小的子帶,然後在411中將該子帶的尺度因子減1,以此尺度因子對該子帶重新量化,統計該子帶編碼所需比特數,並且重新計算對當前整幀量化係數編碼所需比特數,做完這一步調整後,在412中判斷所需比特數是否小於或等於可用比特數,如果是,則轉413結束比特分配,如果否,則轉410繼續下一次減少分配比特的循環。雖然初始點不同,但是圖2和圖4所表示的過程完成了同樣的優化過程,即在所需比特數不超過可用比特數的約束下,使得最大的子帶NMR最小。
在圖2、圖3、圖4所示的過程中,尺度因子的初始化,即各個子帶的初始比特分配都只利用了當前幀的信息,在圖5中,我們給出了一個充分利用前後連續的兩幀之間的相關性進行量化和比特分配的流程,這種量化和比特過程在當前幀信號與前一幀信號有很強的相關性時,能夠很大幅度地提高量化的速度。在圖5所示的流程中,在當前幀開始量化時,先在501中判斷當前幀的信號類型是否與前一幀信號類型相同,如果不相同,則轉502,採取框圖2、3、4中的某一個方法繼續量化,如果相同,則轉503,在利用前一幀量化信息的前提下,對當前幀係數進行量化和比特分配。在503中,我們將前一幀量化完成時尺度因子的取值作為當前幀尺度因子的初始值;然後在504中,以當前被初始化後的尺度因子對當前幀的係數進行量化,並且計算所需要消耗的比特數,以及各個子帶的NMR指標。完成504中的計算後,進入量化和比特分配的循環,在循環中,首先,在505中判斷當前總的所需消耗的比特數是否超過了目標比特數,如果否,則表明還存在多餘比特,則轉入506進入追加分配比特的子循環;如果是,則轉入511進行減少分配比特的子循環。在506中,我們在所有的子帶中,選擇NMR最大的子帶,讓該子帶的尺度因子增加1,然後以該尺度因子重新對該子帶進行量化,並重新計算該子帶所需比特數、總的所需比特數、以及該子帶的NMR;完成上述計算後,再在507中判斷當前總的所需比特數是否超過了目標比特,如果否,則重回506,繼續追加分配比特的過程,如果是,則轉入508。在508中,判斷是否存在這樣的子帶,這些子帶在以初始化後的尺度因子進行量化時被分配了比特,但在量化和比特分配的循環中未被追加分配過比特,如果存在這樣的子帶,則表明在這些子帶中可能還存在著多佔用的比特,需要繼續進行比特重新分配,則轉入515,如果不存在這樣的子帶,則表明所有子帶中都不存在多餘比特了,為了保證量化所需比特數小於目標比特,於是轉509,讓最近尺度因子增加1的子帶的尺度因子減小1,重新量化該子帶,計算比特數和NMR;然後,進入510,結束量化。如果在505的判斷中,所需比特數超過了目標比特數,則轉入511,執行與508中同樣的判斷,即判斷是否存在在初始化時被分配了比特,但在量化循環中未被追加分配比特的子帶,同樣,如果存在這樣的子帶,也轉入515,但如果不存在這樣的子帶,則轉入512,進行減少分配比特的子循環。在512中,在所有已經被分配比特的子帶中,選取NMR最小的子帶,讓該子帶的尺度因子減1,並重新量化、計算比特、NMR;然後在513中判斷目前所需比特總數是否超過目標比特,如果是,則轉512繼續減少比特分配的循環,如果否,則轉514結束量化過程。在515中我們選出可能佔用多餘比特數的子帶,減少這些子帶的比特分配,具體來說我們在所有以初始化後的尺度因子進行量化時被分配了比特,但在量化和比特分配的循環中未被追加分配過比特的子帶中,選擇NMR最小的子帶,讓該子帶的尺度因子減1,並且重新量化,計算比特數和NMR;完成該操作後,轉判斷505,開始新一輪的量化循環。
在圖2、圖3、圖4所示的過程中,需要對每個子帶的量化係數單獨進行編碼和統計比特數,為了提高編碼效率,本專利中對子帶的量化係數運用熵編碼技術進行編碼,圖6給出了運用多碼書的HUFFMAN編碼方法對單個子帶的量化係數進行編碼和統計比特數的過程。在多碼書的HUFFMAN編碼方法中,存有多個對應於不同概率特性的HUFFMAN碼錶,對於每個子帶的量化係數,選擇使得編碼長度最小的碼書對量化係數進行編碼,被選中的碼書的序號作為邊信息將與編碼所得HUFFMAN碼字一同編入碼流。編碼過程從601開始,將當前碼書序號置為1,然後在602中,用當前碼書序號所指碼書對當前子帶的量化係數進行編碼,並統計編碼碼字的所需比特數,接著在603中將當前碼書序號記為最優碼書序號,所需比特數記為最小所需比特數,然後進入選擇碼書的循環。在每次選擇碼書的循環中,首先在604中將當前碼書序號加1,然後在605中判斷當前序號是否已經超過了最大碼書序號,如果是,則表明整個選擇過程已經完成,於是轉609,將此時記錄的最優碼書序號對應的碼書作為對當前子帶實際編碼的碼書,記錄下該碼書的序號,並且將最小比特數記為所需比特數,然後在610中結束此次編碼過程;如果在605中判斷當前碼書序號不超過最大碼書序號,則轉606用當前碼書序號對應的碼書對當前子帶量化係數進行編碼,並統計碼字所佔比特數,然後在607中比較最小比特數和當前比特數,如果當前比特數小於最小比特數,則表明當前碼書優於當前的最優碼書,於是在608中將當前比特數記為最小比特數,當前碼書序號記為最優碼書序號,然後轉604進行下一個碼書的比較,若507中判斷當前比特數不小於最小比特數,則表明當前碼書並不優於當前最優碼書,於是直接轉604進行下一個碼書的比較。
上述對一個子帶內的量化係數所運用的多碼書的HUFFMAN編碼方法曾運用於AAC音頻編碼標準中,該方法在本發明中並不是關鍵的,對於單個子帶量化係數的編碼,也可以採取別的熵編碼形式,例如可以採取算術編碼的方式。
圖2、圖3、圖4和圖5隻是本發明的四個實施例的過程,但是本發明並不只是局限於這四個實現過程,根據本發明所提出的權利要求中的原則對比特分配和量化過程做的任何形式上而非本質的改動也是屬於本發明範圍之內的。
權利要求
1.一種基於極小化全局噪聲掩蔽比準則和熵編碼量化的音頻編碼方法,是對輸入音頻信號進行編碼和量化的處理方法,其特徵是包括如下步驟,(A)將輸入音頻信號分割成長度為幀的塊,每次讀入一幀時域信號(101);(B)對當前幀信號進行時頻變換,得到當前幀的頻域係數(102);(C)將頻域係數按固定的頻帶分劃劃分為若干頻域子帶(103);(D)對當前幀輸入信號進行心理聲學分析,計算各個子帶的噪聲掩蔽閾值(104);(E)根據編碼碼率計算出當前幀信號的可用比特數(105);(F)根據當前幀可用比特數和各個子帶的噪聲掩蔽閾值對各個子帶的頻域係數進行比特分配和量化(106);(G)對量化係數進行熵編碼,並將編碼信息和相關邊信息寫入碼流文件(107)。
2.根據權利要求1所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是同一個頻域子帶的係數由同一個步長進行量化。
3.根據權利要求1、2所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是對於每幀信號頻域係數的比特分配和量化過程包括如下步驟,(A)給各個子帶選擇合適的初始量化步長,並對各個子帶根據各自的尺度因子進行量化、計算各個子帶NMR值、各個子帶所需比特數和總共所需比特數;(B)根據最小化最大的子帶NMR的原則對各個子帶進行比特分配,分配過程包括一個循環過程,循環過程進行到比特恰好被分配完為止,每次循環通過調整一個子帶的量化步長來調整總體所需比特數,在每次循環中若步驟(A)中計算出的所需比特數大於可用比特數,則進行如下步驟,(a)在每次循環中找出NMR最小的子帶,適當增大該子帶的量化步長;(b)以此量化步長對所選子帶進行量化,該子帶計算NMR值;(c)對所選子帶的量化係數進行熵編碼,計算該子帶所需比特數和總的所需比特數;若步驟(A)中計算出的所需比特數小於可用比特數,則進行如下步驟,(a)在每次循環中找出NMR最大的子帶,適當減小該子帶的量化步長;(b)以此量化步長對所選子帶進行量化,該子帶計算NMR值;(c)對所選子帶的量化係數進行熵編碼,計算該子帶所需比特數和總的所需比特數。
4.根據權利要求3所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是量化模型表示為 其中x是一個頻域係數,Scale_factor是整型的尺度因子, 表示不超過y的最大整數,α和β是兩個不大於1的實數。
5.根據權利要求4所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是採用(I)式的量化模型,其中對於每幀信號頻域係數的比特分配和量化過程包括如下步驟,(A)給各個子帶選擇合適的尺度因子,使得各個子帶的係數在各自的尺度因子所對應的量化步長進行量化時,都被量化為0(202);(B)根據各個子帶所對應的掩蔽閾值和當前幀可用比特數對劃分成子帶的頻域係數進行比特分配和量化的循環,每次循環包括如下步驟,(a)選擇當前NMR最大的子帶,適當增大讓該子帶的尺度因子(204);(b)用增大後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算NMR(205);(c)對所選子帶進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(205);(d)如果此時所需比特數仍小於可用比特數(206),則進入下一次循環,如果所需比特數已經超過了目標比特數,則將剛增大後的尺度因子恢復為增大前的值,並對所選子帶重新量化,然後退出比特分配循環(207)。
6.根據權利要求4所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是採用(I)式的量化模型,其中對於每幀信號頻域係數的比特分配和量化過程包括如下步驟(A)給各個子帶選擇合適的尺度因子,使得各個子帶的係數在各自的尺度因子所對應的量化步長進行量化時,都被量化為0(302);(B)根據各個子帶所對應的掩蔽閾值和當前幀可用比特數對劃分成子帶的頻域係數進行比特分配和量化的循環,每次循環包括如下步驟(a)找出子帶NMR中最大的NMR,判斷最大NMR是否大於0(304),如果否,則退出比特分配循環,如果是,則繼續以下的步驟;(b)對於NMR最大的子帶,適當增大該子帶的尺度因子(306);(c)用增大後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算NMR(306);(d)對所選子帶的量化係數進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(306);(e)如果此時所需比特數仍小於可用比特數(307),則轉(a)進入下一次循環,如果所需比特數已經超過了目標比特數,則將增大後尺度因子恢復為增大前的值,並對所選子帶重新量化(308),然後退出比特分配循環。
7.根據權利要求4所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是採用(I)式的量化模型,其中對於每幀信號頻域係數的比特分配和量化過程包括如下步驟,(A)給各個子帶選擇合適的尺度因子對各個子帶的係數進行量化,使得各個子帶的量化噪聲都小於各自對應的感知噪聲閾值(402);(B)對量化係數進行熵編碼,統計對各個子帶的係數進行熵編碼所需比特數以及總共所需比特數(404);(C)判斷所需比特數是否大於目標比特(405),如果是,則轉步驟(D)減少分配比特循環,如果否,則轉步驟(E)繼續分配比特循環;(D)減少分配比特的循環;每次循環包括如下步驟,(a)選出NMR最小的子帶,適當減小該子帶的尺度因子(410);(b)用減小後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算NMR(411);(c)對所選子帶的量化係數進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(411);(d)若所需比特大於可用比特數(412),則轉(a)進入下一次循環,否則結束比特分配循環和量化過程;(E)繼續分配比特的循環;每次循環包括如下步驟,(a)選出NMR最大的子帶,適當增大該子帶的尺度因子(406);(b)用增大後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算NMR(407);(c)對所選子帶的量化係數進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(407);(d)如果此時所需比特數仍小於可用比特數(408),則轉(a)進入下一次循環,如果所需比特數已經超過了目標比特數,則將增大後尺度因子恢復為增大前的值,並對所選子帶重新量化(409),然後退出比特分配循環。
8.根據權利要求4所述的對輸入音頻信號進行編碼和量化的處理方法,其特徵是採用(I)式的量化模型,其中對於每幀信號頻域係數的比特分配和量化過程包括如下步驟,(A)判斷當前幀信號類型是否與前一幀信號類型相同(501),如果否,則對當前幀係數進行量化(502),如果是,則繼續以下的步驟;(B)以上一幀係數量化完成時各個子帶的尺度因子值作為當前係數各個子帶尺度因子的初始值(503),並且以這些尺度因子值對當前幀係數進行量化,計算各個子帶的NMR值(504);(C)對量化係數進行熵編碼,統計對各個子帶的係數進行熵編碼所需比特數以及總共所需比特數(504);(D)判斷所需比特數是否大於目標比特(505),如果是,則減少分配比特,如果否,則繼續分配比特;(E)減少分配比特過程,包括如下步驟(a)判斷是否存在初始化時被分配了比特,但在量化循環中未被分配比特的子帶(511),如果是,則轉步驟(G);如果否,則進行以下步驟進行減少比特的分配的子循環;(b)減少比特分配的子循環,包括如下步驟(I)在所有已經被分配了比特的子帶中,選出NMR最小的子帶,適當減小該子帶的尺度因子(512);(II)用減小後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算噪聲掩蔽比NMR(512);(III)對所選子帶的量化係數進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(512);(IV)若所需比特仍大於可用比特數(513),則轉(i)進入下一次子循環,否則結束比特分配循環和量化過程(514),(F)繼續分配比特過程,包括如下步驟(a)追加分配比特的子循環,包括如下步驟(I)選出NMR最大的子帶,適當增大該子帶的尺度因子(506);(II)用增大後的尺度因子所對應的量化步長對所選子帶的係數進行量化,並且計算噪聲掩蔽比NMR(506);(III)對所選子帶的量化係數進行熵編碼,計算該子帶編碼所需比特數,並且計算整幀係數編碼所需比特數(506);(IV)如果此時所需比特數仍未超過目標比特數(507),則轉(i)進入下一次子循環,否則跳出子循環,繼續子循環以下的步驟,(b)判斷是否存在初始化時被分配了比特,但在量化循環中未被分配比特的子帶(508),如果是,則轉步驟(G);如果否,則進行以下步驟;(c)對最後尺度因子增大的子帶,將增大後尺度因子恢復為增大前的值,並對該子帶重新量化(509),然後結束比特分配和量化過程(510),(G)在所有初始時被分配了比特,但在循環中未被追加分配比特的子帶中,選取NMR最小的子帶,適當減小該子帶的尺度因子,然後重新對該子帶進行量化,並計算該子帶的NMR和所需比特數(515);完成上述操作後,轉步驟(G)進行下次比特分配循環。
全文摘要
本發明公開了一種基於極小化全局噪聲掩蔽比準則和熵編碼量化的音頻編碼方法,是對輸入音頻信號進行編碼和量化的處理方法,在本發明中,時域音頻信號被分成一定長度的幀;每一幀時域信號通過時頻變換後被變換成為頻域係數;每一幀的頻域係數被劃分成不同的頻率子帶;同時,時域信號通過心理聲學模型分析得到各個頻域子帶的噪聲掩蔽閾值;在各個子帶噪聲掩蔽閾值的控制下,可用比特數被分配給頻域係數的各個子帶,比特分配時遵循最小化全局噪聲掩蔽比的準則,在量化和比特分配的過程中,我們對量化係數實行了熵編碼,從而有效地提高了壓縮效率。
文檔編號H03M7/30GK1461112SQ0314621
公開日2003年12月10日 申請日期2003年7月4日 優先權日2003年7月4日
發明者潘興德, 朱曉明 申請人:北京阜國數位技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀