新四季網

一種視頻圖象編碼方法

2023-07-06 05:25:11

專利名稱:一種視頻圖象編碼方法
技術領域:
本發明涉及視頻處理領域,具體地說,是一種視頻圖象編碼方法。
背景技術:
目前,視頻領域的技術突飛猛進,關於視頻編碼的技術方案很多,但由於餘弦變換具有較好的去相關性能,並且,易於快速實現,因此,在視頻編碼領域得到了非常廣泛的應用,現有的視頻壓縮標準MPEG-1、MPEG-2、MPEG-4(Part 2)、H.261、H.263都是基於8×8 DCT變換的,其一般的處理框架示意圖如圖1所示。
H.263的編碼壓縮框架如圖2所示,其中的「T」指的就是圖象數據或預測差值數據的8×8 DCT變換。
餘弦變換的一般表示方式為F(u)=2nC(u)x=0n-1f(x)cos(2x+1)u2n,u=0,,n]]>其中 由於DCT變換要進行複雜的浮點運算,在IDCT中還存在由於失配而造成的精度不高問題,因此,一些專家分別提出了一些變換性能接近於DCT變換的整數變換方法,以降低計算複雜度,提高變換精度。
在文獻[1][Mathias Wien,Claudia Mayer,Jens-Rainer Ohm,「IntegerTransforms for H.26L using Adaptive Block Transforms」,ITU-T Q15/SG16,DocumenlQ15-K-24,Portland,August 2000.]給出了一種2D 8×8 DCT-like整數變換方法,其變換矩陣為
C=17171717171717172420126-6-1220-24237-7-23-23-772320-6-24-1212246-2017-17-171717-17-171712-24620-20-624-127-2323-7-723-2376-1220-2424-2012-6]]>還給出了相應的逆變換、量化和逆量化方法。
文獻[1]所給出的2D 8×8 DCT-like整數變換方法,雖然其變換性能比較接近於DCT變換,但其變換矩陣元素還較為複雜,變換計算處理過程和量化處理過程也較為複雜。

發明內容
本發明的目的就是給出了一種基於8×8 DCT-like整數變換的視頻圖象編碼方法,為此,本發明採用如下技術方案一種視頻圖象編碼方法,包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,並對I幀圖象進行幀內象素預測和補償處理,對P幀圖象進行幀間運動估計及運動補償處理;b、變換器對輸入預測差值數據進行變換處理;c、對變換係數進行量化及熵編碼處理,並將編碼碼流傳遞給接收端;d、接收端對編碼碼流進行熵解碼及逆量化處理;e、逆變換器對逆量化後係數進行逆變換處理;f、對逆變換處理後的圖象數據進行幀內象素補償或幀間運動補償,並將解碼後的視頻圖象輸出;其中所述的步驟b,採用2D 8×8 DCT-like整數變換方法對視頻圖象進行變換處理,其變換計算採用如下公式
所述的步驟e,採用2D 8×8 IDCT-like逆變換方法對視頻圖象進行逆變換處理,其逆變換採用如下公式 其中X為圖象數據距陣或預測差值數據距陣,Y為相應的變換係數距陣,表示兩個矩陣對應位置的元素相乘;
其中a=24,b=55,c=510,d=170385,e=170385,f=1703170,g=17085.]]>所述的視頻圖象編碼方法,在方法實施過程中,做如下近似取值E0.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.02710.00590.01710.00590.02710.00590.01710.00590.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.02710.00590.01710.00590.02710.00590.01710.0059.]]>所述的「E」相乘處理併入到量化和逆量化處理過程中。
本發明所提出的2D 8×8 DCT-like整數變換方法,與現有技術相比較,其變換矩陣元素更為簡單,變換和量化過程更為方便,基於本專利所提出的2D8×8 DCT-like整數變換方法和量化方法的視頻壓縮方法,可以得到更好的計算性能和更好的處理結果。


圖1是基於DCT的視頻編碼框架示意圖;
圖2是現有技術中H.263視頻編碼示意圖;圖3是本發明對視頻圖象進行編碼處理的示意圖;圖4是本發明對視頻圖象進行編碼處理的流程圖。
具體實施例方式
下面結合說明書附圖來說明本發明的具體實施方式

如圖3及圖4所示,是本發明對視頻圖象進行編碼處理的示意圖及流程圖,從圖中可以看出,本發明主要包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,並對I幀圖象進行幀內象素預測和補償,對P幀圖象進行幀間運動估計及運動補償;b、變換器對輸入預測差值數據進行變換處理;c、對變換係數進行量化及熵編碼處理,並將編碼碼流傳遞給接收端;d、接收端對編碼碼流進行熵解碼及逆量化處理;e、逆變換器對逆量化後係數進行逆變換處理;f、對逆變換處理後的圖象數據進行幀內象素補償或幀間運動補償,並將解碼後的視頻圖象輸出。
對於b和e,本發明中,採用一種新的變換方法和相應的逆變換方法,提出一種新的2D 8×8 DCT-like整數變換方法和相應的量化方法,下面具體介紹一下其中X為8×8圖象數據矩陣或預測差值數據矩陣,Y為相應的8×8變換係數矩陣。
我們知道,2D 8×8正向DCT變換方法為
Y=AXXT]]> 其中a=122,b=12cos(8),c=12cos(38),d=12cos(16),e=12cos(316),f=12cos(516),]]>g=12cos(716).]]>(1)式可以改寫為Y=BCXCTB]]> 111111111edfdgd-gd-fd-ed-11cb-cb-1-1-cbcb11-ge-de-fefedege-11-1-111-1-11fd-1gded-ed-gd1-fdcb-11-cb-cb1-1cbge-fe1-dede-1fe-geTa00000000d00000000b00000000e00000000a00000000d00000000b00000000e]]>
由於ed0.8478,fd0.5665,cb0.4142,]]>若令ed=1,fd=12,cb=12,]]>並設ge=x,]]>則由ATA=I可得x=13,]]>於是有12224,b=55,c=510,d=317085,e=317085,f=3170170.]]>g=17085,]]>從而得到Y=BCXCTB=(CXCT)E]]> a2adabaea2adabaeadd2bddeadd2bddeabbdb2beabbdb2beaedebee2aedebee2a2adabaea2adabaeadd2bddeadd2bddeabbdb2beabbdb2beaedebee2aedebee2]]>
=(C1XC1T)E1]]> 於是,得到如下2D 8×8 DCT-like整數變換和量化方法正向變換
Y=(C1XC1T)E1]]> 逆向變換
X=C1T(YE1)C1]]>=111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2T]]>y00y01y02y03y04y05y06y07y10y11y12y13y14y15y16y17y20y21y22y23y24y25y26y27y30y31y32y33y34y35y36y37y40y41y42y43y44y45y46y47y50y51y52y53y54y55y56y57y60y61y62y63y64y65y66y67y70y71y72y73y74y75y76y77a2ad6ab2ae6a2ad6ab2ae6ad6d236bd12de36ad6d236bd12de36ab2bd12b24be12ab2bd12b24be12ae6de36be12e236ae6de36be12e236a2ad6ab2ae6a2ad6ab2ae6ad6d236bd12de36ad6d236bd12de36ab2bd12b24be12ab2bd12b24be12ae6de36be12e236ae6de36be12e236]]>111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2------(3)]]>其中E10.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.02710.00590.01710.00590.02710.00590.01710.00590.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.002710.00590.01710.00590.02710.00590.01710.0059]]>其相乘處理可以併入到對變換係數的量化處理過程中。
下面我們來看一個例子。為了便於說明問題,給出一個數據相差較大的8×8圖象矩陣X=117120109777364546013912310274756064871091009385706897103971171177874941037916414988879991746814794901028472821029592116119114122137150111112140150157163161157]]>經過DCT變換後的係數矩陣為Y0=821.375062.617949.6950-2.76004.37501.57893.36365.9850-122.003791.852731.8023-6.4128-13.8361-16.3052-4.16394.381951.7449-42.7379-28.7305-19.70966.1113-1.070212.12025.0589-48.176764.228615.555617.715323.6346-6.44751.8404-4.952829.625019.3788-27.502719.7915-31.3750-14.1192-3.3556-2.0230-19.1515-45.1924-14.6669-27.3522-24.992811.32365.00133.5050-11.2860-0.5628-0.6298-2.284615.734014.3038-0.2695-1.32588.7752-0.52282.270210.02885.5691-7.7676-9.8236-5.8917]]>經過(2)式所述DCT-like整數變換後的係數矩陣為Y1=821.375061.327349.3584-0.97564.37502.89976.881713.8481-120.703490.417531.3614-6.9679-14.2546-12.8207-0.820816.372552.4433-42.3567-29.4000-20.42454.9833-0.513010.05000.1881-52.817960.286214.141714.758220.0811-6.05343.18062.660929.625019.4307-27.210418.2654-31.3750-16.0703-5.2997-0.2981-44.8497-51.1884-16.2279-29.1519-28.102714.55533.7278-1.2213-7.5936-3.6936-2.7000-1.966516.136414.44950.4000-1.0602-5.77239.32226.29287.12722.7913-10.0949-9.7641-4.3660]]>兩者的差為Y0-Y1=0.00001.29060.3366-1.78440.0000-1.3208-3.5181-7.8631-1.30031.43520.44090.55510.4185-3.4845-3.3431-11.9906-0.6984-0.38120.66950.72491.1280-0.55722.07024.87084.64123.94241.41392.97713.5535-0.3941-1.3402-7.61370.0000-0.0519-0.29231.52610.00001.95111.9441-1.724925.69825.99601.56101.79973.1099-3.23171.27354.7263-3.69243.13082.07020.3181-0.4024-0.1457-0.6695-0.265614.5475-9.8448-4.02262.90162.77782.3273-0.0595-1.5257]]>通過該例可以看出,本發明所給出的8×8整數變換的變換性能與DCT變換較為接近,從而也具有較好的去相關性能,但具有比DCT低得多的計算複雜度。
以上所述,僅為本發明較佳的具體實施方式
,但本發明的保護範圍並不局限於此,任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內,可輕易想到的變化或替換,都應涵蓋在本發明的保護範圍之內。因此,本發明的保護範圍應該以權利要求書的保護範圍為準。
權利要求
1.一種視頻圖象編碼方法,包括以下步驟a、將輸入視頻圖象分割成16×16宏塊,並對I幀圖象進行幀內象素預測和補償處理,對P幀圖象進行幀間運動估計及運動補償處理;b、變換器對輸入預測差值數據進行變換處理;c、對變換係數進行量化及熵編碼處理,並將編碼碼流傳遞給接收端;d、接收端對編碼碼流進行熵解碼及逆量化處理;e、逆變換器對逆量化後係數進行逆變換處理;f、對逆變換處理後的圖象數據進行幀內象素補償或幀間運動補償,並將解碼後的視頻圖象輸出;其特徵在於所述的步驟b,採用2D 8×8 DCT-like整數變換方法對視頻圖象進行變換處理,其變換計算採用如下公式Y=(111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2x00x01x02x03x04x05x06x07x10x11x12x13x14x15x16x17x20x21x22x23x24x25x26x27x30x31x32x33x34x35x36x37x40x41x42x43x44x45x46x47x50x51x52x53x54x55x56x57x60x61x62x63x64x65x66x67x70x71x72x73x74x75x76x77111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2TE)]]>所述的步驟e,採用2D 8×8 IDCT-like逆變換方法對視頻圖象進行逆變換處理,其逆變換採用如下公式X=111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2T(y00y01y02y03y04y05y06y07y10y11y12y13y14y15y16y17y20y21y22y23y24y25y26y27y30y31y32y33y34y35y36y37y40y41y42y43y44y45y46y47y50y51y52y53y54y55y56y57y60y61y62y63y64y65y66y67y70y71y72y73y74y75y76y77E)111111116632-2-3-6-621-1-2-2-1126-2-6-3362-61-1-111-1-113-626-6-26-31-22-1-12-212-36-66-63-2]]>其中X為圖象數據距陣或預測差值數據距陣,Y為相應的變換係數距陣,T表示矩陣的轉置,表示兩個矩陣對應位置的元素相乘,E=a2ad6ab2ae6a2ad6ab2ae6ad6d236bd12de36ad6d236bd12de36ab2bd12b24be12ab2bd12b24be12ae6de36be12e236ae6de36be12e236a2ad6ab2ae6a2ad6ab2ae6ad6d236bd12de36ad6d236bd12de36ab2bd12b24be12ab2bd12b24be12ae6de36be12e236ae6de36be12e236]]>其中a=24,b=55,c=510,d=317085,e=317085,f=3170170,g=17085.]]>
2.如權利要求1所述的視頻圖象編碼方法,其特徵在於在方法實施過程中,做如下近似取值E0.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.02710.00590.01710.00590.02710.00590.01710.00590.12500.02710.07910.02710.12500.02710.07910.02710.02710.00590.01710.00590.02710.00590.01710.00590.07910.01710.05000.01710.07910.01710.05000.01710.02710.00590.01710.00590.02710.00590.01710.0059.]]>
3.如權利要求1所述的視頻圖象編碼方法,其特徵在於將所述的「E」相乘處理併入到量化和逆量化處理過程中。
全文摘要
一種視頻編碼方法,該方法先對圖像進行宏塊預測和補償處理,然後對預測差值進行8×8 DCT-like整數變換處理,再對變換係數分別進行量化和熵編碼處理。該方法採用了一種新的8×8 DCT-like整數變換方法和相應的逆變換、量化、逆量化方法,該變換方法的變換矩陣元素較為簡單,計算複雜度較低,變換過程只涉及到加法和乘法運算,變換性能較為接近於8×8 DCT,從而具有類似於DCT的較好的去相關性能,可以得到較好的視頻壓縮效果。
文檔編號H04N7/26GK1533183SQ0312095
公開日2004年9月29日 申請日期2003年3月24日 優先權日2003年3月24日
發明者熊聯歡 申請人:華為技術有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀