高效視頻編碼標準量化參數的分配方法與流程
2023-06-01 22:52:26 3
本發明屬於視頻編碼
技術領域:
,具體涉及高效視頻編碼標準量化參數的分配。
背景技術:
:2007年隨著h.264/avc/svc視頻編碼標準的發布,分級預測編碼結構首次被引入,並因其高效的率失真性能而被廣泛應用。目前在面向高清視頻的新一代高效視頻編碼的測試模型(hm)中,其中一種編碼結構為隨機接入結構,其也屬於分級預測結構。視頻編碼中相鄰的視頻幀組成一個圖像組。每個圖像組(gop)通常包含8個視頻幀,每個視頻幀都被分配了時間層,如圖1所示,不同的標記表示處於不同時間層的幀。使用隨機接入結構編碼視頻時,會定期的插入i幀,以實現「隨機接入」的功能,所以隨機接入結構主要被應用視頻點播等領域。隨機接入結構的編碼性能與每個時間層分配的量化參數,即量化參數分配方法,密切相關。使用隨機接入結構編碼時,時間層低的幀要被更高時間層的幀直接或間接參考,所以時間層越低的幀重要性越高,為保證整個視頻的編碼性能,低時間層的幀通常分配更小的量化參數編碼。這也是目前所有針對隨機接入結構提出的量化參數分配方法遵循的基本分配規則。目前針對隨機接入結構提出的量化參數分配方法通常可以用下式表示:qpl=qpl-1+δl,l≥1其中,qpl表示第l個時間層分配的量化參數,δl表示第l個時間層與第l-1個時間層量化參數的差值。通常qp0由編碼者通過配置文件在編碼前設置,因此,一個優異的量化參數分配方法需要考慮設置最優的δl,l≥1以得到最高的編碼性能,這裡用δl,opt,l≥1表示最優的δl,l≥1值。目前hm中採用的量化參數分配方法為δl,l≥1都設置為1。由於不同的視頻具有不同的內容特性,因此在設置δl,l≥1時沒有考慮視頻內容特性使得目前的針對隨機接入結構的量化參數分配方法在提升編碼性能方面具有局限性。技術實現要素:本發明所要解決的技術問題在於克服上述現有技術的缺點,提供一種編碼效率高的高效視頻編碼標準量化參數的分配方法。解決上述技術問題所採用的技術方案是由以下步驟組成:(1)設置視頻第一個編碼幀的量化參數輸入的視頻第一個編碼幀為i幀、且處於隨機接入編碼結構的時間0層,使用編碼者在編碼配置文件中設定的量化參數,採用高效視頻編碼標準對第一幀進行編碼。(2)確定視頻第二個編碼幀的紋理複雜度等級和運動等級對視頻的第二個編碼幀,紋理複雜度等級採用第二個編碼幀的標準差σv進行衡量,運動等級採用第二個編碼幀與第一個編碼幀之間的背景幀差dv進行衡量。(3)確定時間1層的量化參數差值δ1,opt根據式(1)確定時間1層的量化參數差值δ1,optδ1,opt=p1+p2ln(dv)-p3(ln(dv))2+p4ln(σv)+p5(ln(σv))2(1)其中,p1~p5為模型參數,p1取值為5~6,p2取值為0.1~2,p3取值為0.1~1,p4取值為0.01~1,p5取值為0.1~1。(4)確定時間1層的量化參數對δ1,opt取整,將其值限制在1~10之間,如式(2)所示:qp1=qp0+clip3(1,10,round(δ1,opt))(2)其中,qp0是第一個編碼幀的量化參數,qp1是時間1層的量化參數,round(δ1,opt)表示對δ1,opt四捨五入取整,clip3(1,10,round(δ1,opt))表示將round(δ1,opt)的值限制在1~10。(5)確定時間2層以及更高時間層的量化參數根據視頻圖像組的大小及幀號來確定當前幀所處的時間層;根據式(3)確定當前幀的量化參數並編碼。qpl=qpl-1+1,l≥2(3)其中,qpl是第l個時間層的量化參數。(6)判斷是否編碼完畢編碼完一幀後,判斷當前幀是否為編碼的最後一幀,直到編碼完整個視頻。在本發明的確定視頻第二個編碼幀的紋理複雜度等級和運動等級步驟(2)中,紋理複雜度等級和運動等級採用式(4)和式(5)確定:式中x[n,k,i]為視頻的第i幀第k個圖像塊位於n的像素亮度值,其中n為[n1,n2],每幀圖像寬度為n1個像素,高度為n2個像素。bi為表示視頻第i幀中圖像塊的集合,為第i幀中的圖像塊總數,pi,k為表示第i幀第k個圖像塊中的像素集合,為第i幀第k個圖像塊中像素的總數;其中,i、k、n1、n2、n1、n2、和均為有限正整數;式(4)中的圖像塊為正方形塊,正方形塊邊長為能整除4的4~64個像素,式(5)中的圖像塊為正方形塊,正方形塊邊長為能整除4的4~64個像素。xbg(n,k,i)為背景亮度值採用式(6)確定:其中在本發明的確定時間1層的量化參數差值δ1,opt步驟(3)中,p1取值最佳為5.87、p2取值最佳為1.12、p3取值為0.78、p4取值最佳為0.03、p5取值最佳為0.38。在本發明的確定視頻第二個編碼幀的標準差和背景幀差步驟(2)中,式(4)中的圖像塊最佳為正方形塊,正方形塊邊長最佳為4個像素,式(5)中的圖像塊最佳為正方形塊,正方形塊邊長最佳為16個像素。本發明採用視頻圖像的背景幀差和標準差來衡量視頻的運動和紋理特性,為不同內容特性視頻分配最優的量化參數。實驗結果表明,本發明方法不需要預編碼、複雜度低,並可在同等編碼質量下,進一步節省編碼比特,有效地提高了視頻編碼性能。附圖說明圖1是高效視頻編碼標準的隨機接入結構示意圖。圖2是實施例1的流程圖。具體實施方式下面結合附圖和實施例對本發明進一步詳細說明,但本發明不限於下屬的實施例。實施例1本實施例以選用25個視頻,在hm14.0上實現,按照高效視頻編碼標準通測條件,採用隨機接入配置,gop大小為8。時間0層的量化參數被分別設置為22、27、32、37,其它時間層的量化參數由本發明方法確定。以量化參數22為例,每個視頻進行編碼需經過以下步驟:(1)設置視頻第一個編碼幀的量化參數輸入的視頻第一個編碼幀為i幀、且處於隨機接入編碼結構的時間0層,使用編碼者在編碼配置文件中設定的量化參數22,採用高效視頻編碼標準對第一幀進行編碼;(2)確定視頻第二個編碼幀的紋理複雜度等級和運動等級對視頻的第二個編碼幀,紋理複雜度等級採用第二個編碼幀的標準差σv進行衡量,運動等級採用第二個編碼幀與第一個編碼幀之間的背景幀差dv進行衡量,背景幀差是唯一的一種方法,在c.h.chou,andc.w.chen,「aperceptuallyoptimized3-dsubbandcodecforvideocommunicationoverwirelesschannels,」(ieeetransactionsoncircuitsandsystemsforvideotechnology,vol.6,no.2,pp.143-156,apr.1996)中報導。式中x[n,k,i]為視頻的第i幀第k個圖像塊位於n的像素亮度值,其中n為[n1,n2],每幀圖像寬度為n1個像素,高度為n2個像素。本實施例中i為2。bi為表示視頻第i幀中圖像塊的集合,為第i幀中的圖像塊總數,pi,k為表示第i幀第k個圖像塊中的像素集合,為第i幀第k個圖像塊中像素的總數;其中,k、n1、n2、n1、n2、和均為有限正整數;式(4)中的圖像塊為正方形塊,正方形塊邊長為4個像素,式(5)中的圖像塊為正方形塊,正方形塊邊長為16個像素;xbg(n,k,i)為背景亮度值採用式(6)確定;其中本實施例通過式(4)中的標準差和式(5)中的背景幀差來確定具有不同內容特性視頻的紋理複雜度等級和運動等級。(3)確定時間1層的量化參數差值δ1,opt根據式(1)確定時間1層的量化參數差值δ1,optδ1,opt=p1+p2ln(dv)-p3(ln(dv))2+p4ln(σv)+p5(ln(σv))2(1)其中,p1~p5為模型參數,本實施例的p1取值為5.87、p2取值為1.12、p3取值為0.78、p4取值為0.03、p5取值為0.38。(4)確定時間1層的量化參數對δ1,opt取整,將其值限制在1~10之間,如式(2)所示;qp1=qp0+clip3(1,10,round(δ1,opt))(2)其中,qp0是第一個編碼幀的量化參數,qp1是時間1層的量化參數,round(δ1,opt)表示對δ1,opt四捨五入取整,clip3(1,10,round(δ1,opt))表示將round(δ1,opt)的值限制在1~10。由於式(1)採用標準差和背景幀差來確定時間1層的量化參數差值δ1,opt,使得通過式(2)確定的時間1層的量化參數值與視頻的內容相適應。(5)確定時間2層以及更高時間層的量化參數根據視頻圖像組的大小及幀號來確定當前幀所處的時間層;根據式(3)確定當前幀的量化參數並編碼;qpl=qpl-1+1,l≥2(3)其中,qpl是第l個時間層的量化參數;(6)判斷是否編碼完畢編碼完一幀後,判斷當前幀是否為編碼的最後一幀,直到編碼完整個視頻。對每個視頻,通過在配置文件中設置時間0層的量化參數分別為22、27、32、37,對於每個配置文件中設置的量化參數,分別按照上述步驟獲得其它時間層量化參數,並採用高效視頻編碼方法進行編碼獲得編碼失真和編碼比特數。實施例2本實施例以選用25個視頻,在hm14.0上實現,按照高效視頻編碼標準通測條件,採用隨機接入配置,gop大小為8。時間0層的量化參數被分別設置為22、27、32、37,其它時間層的量化參數由本發明方法確定。以量化參數22為例,每個視頻進行編碼需經過以下步驟:在確定視頻第二個編碼幀的紋理複雜度等級和運動等級步驟(2)中,對視頻的第二個編碼幀,紋理複雜度等級採用第二個編碼幀的標準差σv進行衡量,運動等級採用第二個編碼幀與第一個編碼幀之間的背景幀差dv進行衡量;式中x[n,k,i]為視頻的第i幀第k個圖像塊位於n的像素亮度值,其中n為[n1,n2],每幀圖像寬度為n1個像素,高度為n2個像素。本實施例中i為2。bi為表示視頻第i幀中圖像塊的集合,為第i幀中的圖像塊總數,pi,k為表示第i幀第k個圖像塊中的像素集合,為第i幀第k個圖像塊中像素的總數;其中,k、n1、n2、n1、n2、和均為有限正整數;式(4)中的圖像塊為正方形塊,正方形塊邊長為4個像素,式(5)中的圖像塊為正方形塊,正方形塊邊長為4個像素;xbg(n,k,i)為背景亮度值採用式(6)確定;其中在確定時間1層的量化參數差值δ1,opt步驟(3)中,根據式(1)確定時間1層的量化參數差值δ1,optδ1,opt=p1+p2ln(dv)-p3(ln(dv))2+p4ln(σv)+p5(ln(σv))2(1)其中,p1~p5為模型參數,p1取值為5,p2取值為0.1,p3取值為0.1,p4取值為0.01,p5取值為0.1;其它步驟與實施例1相同。實施例3本實施例以選用25個視頻,在hm14.0上實現,按照高效視頻編碼標準通測條件,採用隨機接入配置,gop大小為8。時間0層的量化參數被分別設置為22、27、32、37,其它時間層的量化參數由本發明方法確定。以量化參數22為例,每個視頻進行編碼需經過以下步驟:在確定視頻第二個編碼幀的紋理複雜度等級和運動等級步驟(2)中,對視頻的第二個編碼幀,紋理複雜度等級採用第二個編碼幀的標準差σv進行衡量,運動等級採用第二個編碼幀與第一個編碼幀之間的背景幀差dv進行衡量。式中x[n,k,i]為視頻的第i幀第k個圖像塊位於n的像素亮度值,其中n為[n1,n2],每幀圖像寬度為n1個像素,高度為n2個像素。本實施例中i為2。bi為表示視頻第i幀中圖像塊的集合,為第i幀中的圖像塊總數,pi,k為表示第i幀第k個圖像塊中的像素集合,為第i幀第k個圖像塊中像素的總數;其中,k、n1、n2、n1、n2、和均為有限正整數;式(4)中的圖像塊為正方形塊,正方形塊邊長為64個像素,式(5)中的圖像塊為正方形塊,正方形塊邊長為64個像素;xbg(n,k,i)為背景亮度值採用式(6)確定;其中在確定時間1層的量化參數差值δ1,opt步驟(3)中,根據式(1)確定時間1層的量化參數差值δ1,optδ1,opt=p1+p2ln(dv)-p3(ln(dv))2+p4ln(σv)+p5(ln(σv))2(1)其中,p1~p5為模型參數,p1取值為6,p2取值為2,p3取值為1,p4取值為1,p5取值為1。其它步驟與實施例1相同。實施例4本實施例以選用25個視頻,在hm14.0上實現,按照高效視頻編碼標準通測條件,採用隨機接入配置,gop大小為8。時間0層的量化參數被分別設置為22、27、32、37,其它時間層的量化參數由本發明方法確定。以量化參數22為例,每個視頻進行編碼需經過以下步驟:在確定視頻第二個編碼幀的紋理複雜度等級和運動等級步驟(2)中,對視頻的第二個編碼幀,紋理複雜度等級採用第二個編碼幀的標準差σv進行衡量,運動等級採用第二個編碼幀與第一個編碼幀之間的背景幀差dv進行衡量;式中x[n,k,i]為視頻的第i幀第k個圖像塊位於n的像素亮度值,其中n為[n1,n2],每幀圖像寬度為n1個像素,高度為n2個像素。本實施例中i為2。bi為表示視頻第i幀中圖像塊的集合,為第i幀中的圖像塊總數,pi,k為表示第i幀第k個圖像塊中的像素集合,為第i幀第k個圖像塊中像素的總數;其中,k、n1、n2、n1、n2、和均為有限正整數;式(4)中的圖像塊為正方形塊,正方形塊邊長為32個像素,式(5)中的圖像塊為正方形塊,正方形塊邊長為32個像素;xbg(n,k,i)為背景亮度值採用式(6)確定;其中其它步驟與實施例1相同。為了驗證本發明的有益效果,發明人採用本發明實施例1高效視頻編碼標準量化參數的分配方法進行了實驗,試驗情況如下:分別採用高效視頻編碼標準(hm14.0)和本發明中的量化參數分配方法對視頻進行編碼和重建。重建視頻的失真採用亮度分量(y)、色度分量(uv)的聯合失真表示,如式(7)所示。將hm14.0中的方法選擇為基準方法,得到本發明中的量化參數分配方法對應的bd-rate值。實驗結果如表1所示。表1發明方法的實例測試結果videosbd-rate(yuv)videosbd-rate(yuv)peopleonstreet-1.00%traffic-3.96%parkscene-2.04%kimono-1.03%bqterrace-5.04%cactus-2.62%basketballdrill-8.34%basketballdrive-0.12%bqmall-4.04%bqsquare-8.49%partyscene-9.02%blowingbubbles-6.24%racehorses(wvga)0.10%racehorses(wqvga)-0.47%basketballpass-1.63%kristenandsara-10.62%fourpeople-12.58%vidyo1-9.92%johnny-9.09%chinaspeed-7.09%vidyo3-11.09%slideediting0.00%vidyo4-11.54%slideshow-5.96%basketballdrilltext-8.15%所有視頻的均值-5.60%預編碼次數0由表1可見,對於所有的測試視頻,用實施例1方法對應的亮度和色度分量的聯合bd-rate為-5.60%,所以本方法可以更加有效地提高視頻編碼性能。當前第1頁12