新四季網

基於數學模型預測的運動估計快速半像素級搜索方法

2023-10-25 13:32:02 1

專利名稱:基於數學模型預測的運動估計快速半像素級搜索方法
技術領域:
本發明涉及視頻編碼技術領域,具體地說是一種基於數學模型預測的運動估計快速半像素級搜索方法,用於各種數字視頻編碼器的軟硬體實現,特別是用於低功耗實時視頻編碼的實現。
背景技術:
隨著計算機技術,網絡技術和集成電路技術的發展,視頻壓縮技術得到了越來越廣泛的應用。現有的視頻編碼器大都採用圖1所示的結構,主要由運動估計和變換編碼及熵編碼構成。由於圖像序列在前後幀之間存在較大的相關性,運動估計就是找到前後幀之間的偏移,即運動矢量,這樣傳輸時只需要傳輸運動矢量和殘差值,大大減少了傳輸的數據量,達到了壓縮的目的。運動估計能夠去除圖像序列在時域上的相關性,從而在視頻壓縮中佔有非常重要的地位。
基於視頻編碼的可攜式設備應用越來越廣泛,如具有最吸引人的遠程可視功能和可錄像播放視頻功能的第三代移動通信終端,個人數字助理,數碼錄像機,可攜帶移動數位電視等。這些應用有一個很重要的特點就是低功耗,所以要求視頻編碼算法的計算複雜度要低。而運動估計在整個視頻編碼中佔有50%~80%的運算量,所以研究低複雜度的快速運動估計方法對硬體的實現是非常重要的。
目前,應用最廣泛的運動估計方法是塊匹配方法,該方法被多種視頻壓縮標準,如H.261,H.263,H.264,MPEG2,MPEG4所採用。為了提高圖像序列的壓縮效率和重建圖像質量,新近的標準如H.263,H.264,MPEG4都建議進行半像素精度甚至更高精度級的運動估計。
如圖2所示,精度到半像素級的運動估計一般分兩步進行首先在(-W,W-1)範圍內進行精度為一個整點像素的運動估計,得到運動矢量(vx0,vy0);然後搜索(vx0,vy0)周圍的8個半像素位置,得到半像素精度的運動矢量(vxh,vyh),則最終的運動矢量(vx,vy)=(vx0,vy0)+(vxh,vyh)。
圖2中*為整點像素匹配位置,#為半像素匹配位置,W=4。半像素位置的像素值通過周圍整點像素值線性插值得到。
圖3給出了半像素和整點像素位置關係,其中B、C、D為整點像素,a、b、c、d、e為半像素值,計算公式如下,該式是以H.263為例 考慮到實現的複雜度,塊匹配時最佳匹配準則一般選用最小絕對誤差和(SAD)準則,其定義如下式。
SAD(i,j)=1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i,n+j)|]]>式中M和N為宏塊的大小參數,fk(m,n)為當前幀的灰度像素值,fk-1(m+i,n+j)為參考幀的灰度像素值,最小的SAD(i,j)對應的(i,j)即為所求的運動矢量。
近年來,提出了各種基於塊匹配的快速運動估計方法,如新三步搜索法、鑽石搜索法、分層搜索法、基於投影的搜索法、基於預測的搜索法、六邊形搜索法以及其它快速方法,這些方法在很大程度上降低了整像素精度運動估計的複雜度,從而降低了實時視頻編碼器的成本和實現難度。
隨著整點像素級搜索的複雜度降低,相對地半像素精度搜索的複雜度同整點像素級搜索幾乎相當,但是大多數快速運動估計方法的討論都停留在整點像素精度的運動估計,從而尋找半像素精度搜索快速方法是很必要的。半象素級精度運動估計與只做整點象素級運動估計相比,可以提高重建圖像質量1-2dB,但隨之帶來的是計算複雜度的提高,傳統的半像素級運動估計需要大量的插值運算和隨之帶來的存儲器的增加。美國摩託羅拉公司的Krit Panusopone和David M。Baylon在An analysis and efficientimplementation of half-pixel motion estimation(IEEE Trans.Circuits and systems forvideo technology,2002,12(8)724-729)中分析並提出了半像素級運動估計的實現方法,降低了一定的計算複雜度。杜誠,何芸,鄭君禮在新的低碼率視頻編碼快速半像素搜索方法(清華大學學報(自然科學版),2001,41(1)1-4)一文中提出了新的快速半像素級運動估計方法,這種方法雖說對運算複雜度又有一定的降低,但是仍然相對複雜,不利於硬體實現。上述兩種方法都沒有避開計算量大的半像素插值過程。
發明的技術方案本發明的目的是提供一種編碼性能高,且計算複雜度低的快速半像素級運動估計搜索方法,以滿足低功耗實時編碼硬體的實現。
實現本發明目的的技術關鍵是通過研究在最小絕對誤差和準則下的整點像素級塊匹配及半像素級塊匹配的聯繫,從而在二者之間建立合理的數學模型,提出了基於數學預測模型的快速半像素級搜索方法。該方法的理論依據如下假設(i,j)和(i+1,j)為相鄰整像素匹配位置,則二者之間的半像素匹配位置為(i+0.5,j),其中i和j為整數,且-M<=i,j<=M-1。由於SAD(i+0.5,j)=1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i+0.5,n+j)|]]>=1M*Nm=1Mn=1N|fk(m,n)-(fk-1(m+i,n+j)+fk-1(m+i+1,n+j)+1)/2|]]>12(1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i,n+j)|+]]>1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i+1,n+j)|)]]>即有SAD(i+0.5,j)12(SAD(i,j)+SAD(i+1,j))]]>由上式可知SAD(i,j)在一維方向上的整數區間內是凹函數,由於最佳整像素匹配位置的SAD小於其臨近的整點位置的SAD,所以可以假設SAD(i,j)在相鄰整數區間內是光滑的,則可用凹函數來擬合SAD(i,j)在一維方向的投影SAD(i,J)或者SAD(I,j),其中i∈[i-1,i+1],J為常數;j∈[j-1,j+1],I為常數。
下面以SAD(i,J)為例,列出本發明涉及的三種常見的凹函數模型。
1.線性模型設f(i)=MAD(i,J),i∈[-1,+1],且已知整像素相臨近三點[-1,f(-1)]、
、[1,f(1)]。用線性函數來擬合f(i),幾何曲線見圖4。
f(i)=a|i-b|+c(a>0,-1<b<1,c>0)根據已知三點可以擬合出的線性模型為
對應該線性模型,有如下判斷準則 2.拋物線模型同上,用下式所示的拋物線來擬合f(i),幾何曲線見圖5。
f(i)=ai2+bi+c (a>0,-1<b<1,c>0)把已知整像素相臨近三點[-1,f(-1)]、
、[1,f(1)]代入上式,可得到拋物線模型為f(i)=12(f(1)+f(-1)-2f(0))i2+12(f(1)-f(-1))i+f(0)]]>對應該拋物線模型,有如下判斷準則 3.雙曲線模型同上,用下式所示的雙曲線來擬合f(i),幾何曲線見圖6。
f(i)=acc2+(i-b)2---(a>0,-1b1,c>0)]]>代入所述的已知整像素相臨近三點[-1,f(-1)]、
、[1,f(1)]得b的值如下式b=f2(-1)-f2(0)f2(-1)+f2(1)-2f2(0)-12]]>對應該雙曲線模型,有如下判斷準則 以上只給出了利用水平方向上的判斷準則,可以得到水平方向上的最佳半像素級匹配位置vxh,同理,利用類似準則可以得到垂直方向上的最佳半像素級匹配位置vyh。
本發明正是利用最小絕對差和SAD準則下的整像素塊匹配和半像素級塊匹配的聯繫,對絕對差和SAD進行數學曲線擬合,通過數學曲線來預測最小絕對差和SAD所在半像素位置,從而得到半像素級最佳匹配矢量,並通過計算得到半像素級最佳匹配矢量對應的參考塊像素值,具體過程如下(1)記最佳整點匹配位置的最小絕對誤差和SAD值為m0,若整像素搜索中搜索了最佳整點匹配位置臨近的上、下、左、右4個位置,則分別記錄SAD為m1、m2、m3、m4;否則通過計算得到m1、m2、m3、m4這四個值,計算公式為SAD(i,j)=1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i,n+j)|]]>式中M為宏塊的豎直方向像素數N為宏塊的豎直方向像素數fk(m,n)為當前幀的灰度像素值fk-1(m+i,n+j)為參考幀的灰度像素值(i,j)為這四個位置的坐標;(2)在水平方向和豎直方向上分別應用線性、拋物線、雙曲線三種不同的凹函數預測模型,並由各自的判斷準判斷,得到三種數學模型各自的最佳半像素級匹配位置(vxh1,vyh1)、(vxh2,vyh2)、(vxh3,vyh3);(3)對三種數學模型的最佳半像素級匹配位置結果(vxh1,vyh1)、(vxh2,vyh2)、(vxh3,vyh3)進行投票,得到最終的半像素匹配位置(vxh,vyh);(4)按照視頻編碼標準規定的插值方法,得到半像素匹配位置(vxh,vyh)對應的參考塊像素值;(5)輸出半像素運動矢量即半像素匹配位置(vxh,vyh)和參考塊像素值。
在水平或者豎直方向上分別運用以上提到的三種模型,可能得到的結果有三種情況1.三種模型得到的結果一致;2.兩中模型得到的結果一致,另一個不同;3.三種模型得到的結果各不相同。
本發明採用民主集中制的原則來對三種模型的結果投票,第1種情況無疑取一致的結果,第2種情況選取2種模型一致的那個結果,對於第3種情況,取整像素位置。
本發明由於是根據整點像素搜索的結果直接推算出半像素級運動估計的結果,與標準的先插值再搜索的方法相比免去了插值過程,節省了運算量和存儲器,且流程簡單從而容易硬體實現。標準的先插值再搜索的方法首先要插值256×8=2048個像素值,然後再匹配8個位置,而本發明的快速方法只需簡單的比較再插值256個像素值,運算量為標準的先插值再搜索方法的1/8,而且還節省了半像素插值像素的存儲空間。在硬體實現中,本發明的快速方法使半像素級搜索時間降為1/8,這對實時圖像編碼器的低功耗硬體實現是很有意義的。此外,由於本發明的數學預測是在一維方向上提出的,因此,可推廣到二維方向上可得到相似的結果。
本發明通過實際編碼實驗比較了採用三種不同數學模型得到的重建圖像的峰值信噪比(PSNR),結果表明本發明可以得到接近標準半像素級全搜索方法的重建圖像質量。


圖1是現有視頻編碼器的結構框2是現有運動估計過程示意3是現有半像素與整像素位置關係示意4是現有線性模型曲線5是現有拋物線模型曲線6是現有雙曲線模型7是本發明快速半像素級搜索方法示意8是本發明的實施流程9是本發明與現有方法對mother daughter序列實驗的PSNR比較10是本發明與現有方法對mother daughter序列實驗的每幀編碼比特數比較11是本發明與現有方法對foreman序列實驗的PSNR比較12是本發明與現有方法對foreman序列實驗的每幀編碼比特數比較圖具體實施方式
以下參照附圖詳細說明本發明的過程與效果。
圖7給了本發明的快速半像素級搜索示意圖,圖7中的實線為整像素匹配位置網格,虛線為半像素匹配位置網格。整點像素匹配位置在實線與實線的交點上,半像素匹配位置位於虛線與虛線或者實現的交點上,m0為最佳整像素匹配位置的SAD值,m3和m4分別為水平方向上最佳整像素匹配位置相鄰最近的兩個整像素位置的SAD值,m1和m2為豎直方向上最佳整像素匹配位置相鄰最近的兩個整像素位置的SAD值。
在圖7所示區域的水平與垂直兩個方向上分別用線性、拋物線,雙曲線三種數學預測模型,可以得到兩個方向上的最小SAD對應的半像素級匹配位置(vxh,vyh),其具體實施步驟如圖8所示,即1.記最佳整像素匹配位置的SAD值為m0,如果最佳整像素匹配豎直方向和水平方向上最近的整像素位置的SAD值在整像素匹配過程中已經得到,則分別記最佳整點匹配位置鄰近的上、下、左、右四個整點位置的SAD值為m1、m2、m3、m4;否則匹配這四個位置按最小絕對差和SAD準則計算得到m1、m2、m3、m4,其計算方法為SAD(i,j)=1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i,n+j)|]]>式中,M為宏塊的豎直方向像素數N為宏塊的豎直方向像素fk(m,n)為當前幀的灰度像素值fk-1(m+i,n+j)為參考幀的灰度像素值(i,j)為最佳整點匹配位置鄰近的上、下、左、右四個位置的坐標;2.在水平方向和豎直方向上分別運用線性、拋物線、雙曲線三種不同的數學模型,得到各自對應的結果(vxh1,vyh1),(vxh2,vyh2),(vxh3,vyh3);具體方法如下A.水平方向已知整像素相鄰的三點為(-1,m3)、(0,m0)、(1,m4)。
(1)應用下式對應的線性模型 判斷最佳半像素匹配位置vxh1,即f(vxh1)對應的最小值,其判斷準則為如果m3-m02(m4-m0)-14,]]>即2(m3-m0)<(m4-m0),則vxh1=-0.5;如果m3-m42(m3-m0)>14,]]>即2(m4-m0)<(m3-m0),則vxh1=0.5;否則,vxh1=0。
(2)應用下式對應的拋物線模型的對稱軸判斷最佳半像素精度的匹配位置vxh2拋物線模型為f(vxh2)=12(m4+m3-2m0)vxh22+12(m4-m3)vxh2+m0]]>拋物線的對稱軸為vxh2=m3-m42(m3+m4-2m0)]]>判斷最佳半像素匹配位置vxh2,即f(vxh2)對應的最小值,其判斷準則為如果m3-m42(m3+m4-2m0)-14,]]>即3(m3-m0)<(m4-m0),則vxh2=-0.5;如果m3-m42(m3+m4-2m0)>14,]]>即3(m4-m0)<(m3-m0),則vxh2=0.5;否則,vxh2=0。
(3)應用雙曲線模型的對稱軸vxh3=m32-m02m32+m42-2m02-12]]>判斷最佳半像素精度的匹配位置vxh3,即f(vxh3)對應的最小值,其判斷準則為如果m32-m02m32+m42-2m02-12-14,]]>即3(m32-m02)<(m42-m02),則vxh3=-0.5;如果m32-m02m32+m42-2m02-12>14,]]>即3(m42-m02)<(m32-m02),則vxh3=0.5;否則,vxh3=0。
B.豎直方向已知整像素相鄰的三點為(-1,m1)、(0,m0)、(1,m2)。
(1)應用下式對應的線性模型 判斷最佳半像素精度的匹配位置vyh1,即f(vyh1)對應的最小值,其判斷準則為如果m1-m02(m2-m0)-14,]]>即2(m1-m0)<(m2-m0),則vyh1=-0.5;如果m1-m22(m1-m0)>14,]]>即2(m2-m0)<(m1-m0),則vyh1=0.5;否則,vyh1=0。
(2)應用下式對應的拋物線模型的對稱軸判斷最佳半像素精度的匹配位置vyh2拋物線模型為f(vyh2)=12(m2+m1-2m0)vyh22+12(m2-m1)vyh2+m0]]>拋物線的對稱軸為vyh2=m1-m22(m1+m2-2m0)]]>由拋物線的對稱軸判斷最佳半像素精度的匹配位置vyh2,即f(vyh2)對應的最小值,其判斷準則為如果m1-m22(m1+m2-2m0)-14,]]>即3(m3-m0)<(m4-m0),則vyh2=-0.5;如果m1-m22(m1+m2-2m0)>14,]]>即3(m4-m0)<(m3-m0),則vyh2=0.5;否則,vyh2=0。
(3)應用雙曲線的對稱軸vyh3=m12-m02m12+m22-2m02-12]]>判斷最佳半像素精度的匹配位置vyh3,即f(vyh3)對應的最小值,其判斷方法為如果m12-m02m12+m22-2m02-12-14,]]>即3(m32-m02)<(m42-m02),則vyh3=-0.5;如果m12-m02m12+m22-2m02-12>14,]]>即3(m42-m02)<(m32-m02),則vyh3=0.5;否則,vyh3=0。
3.確定半像素精度的最終位置,即對上述水平方向半像素運動矢量vxh1、vxh2、vxh3和豎直方向半像素運動矢量vyh1、vyh2、vyh3分別進行投票,確定出半像素精度的最終位置(vxh,vyh),其確定方法為(1)水平方向如果vxh1=vxh2=vxh3,則vxh=vxh1;如果vxh1≠vxh2≠vxh3,則vxh=0;否則vxh取vxh1,vxh2,vxh3中二者相同的,比如如果vxh1=vxh2≠vxh3,則vxh=vxh1。
(2)豎直方向如果vyh1=vyh2=vyh3,則vyh=vyh1;如果vyh1≠vyh2≠vyh3,則vyh=0;否則vyh取vyh1,vyh2,vyh3中二者相同的,比如如果vyh1=vyh2≠vyh3,則vyh=vyh1;4.如果得到的半像素運動矢量(vxh,vyh)為(0,0),則轉步驟6,否則轉步驟5;5.按照視頻標準中規定的插值方法得到半像素運動矢量(vxh,vyh)對應的參考塊像素值;6.輸出半像素運動矢量(vxh,vyh)和對應的參考塊像素值。
實驗結果本發明在基於MPEG4的編碼程序上,對不同的圖像序列,不同的半像素級運動估計方法進行了仿真。實驗中,編碼模式為IP模式,每種圖像序列長度為50幀,第1幀I幀編碼,其餘49幀P幀編碼,整像素級運動估計採用全搜索法,半像素級搜索採用了不同的方法,分別為標準的先插值再搜索的方法(full),本文的基於數學預測模型的方法(model),和不進行半像素搜索的方法(integer)。
實驗中I幀和P幀的量化參數(QP)都為10,實驗對兩種具有代表性的運動序列進行了測試,即具有小運動特性的motherdaughter序列和具有較大運動特性的foreman序列,二者都為4∶2∶0的CIF(352*288)格式。
在實驗中對本發明的峰值信噪比PSNR採用如下公式進行了計算,即
PSNR=10log10MN*2552i=1Mj=1N(fi,j-fi,j)2]]>其中M和N分別為圖像在水平方向和豎直方向上像素的個數,fi,j為原始圖像的亮度值,f′i,j為對應重建圖像的亮度值。
圖9給出了上述三種方法對motherdaughter序列的峰值信噪比(PSNR)比較曲線,其中,橫軸為motherdaughter序列的幀序號,縱軸為motherdaughter序列的重建圖像峰值信噪比PSNR。從圖9可以看出,本發明的方法比全搜索方法的峰值信噪比(PSNR)平均高出0.15dB,比只作整像素搜索方法的峰值信噪比(PSNR)平均要高出2dB。
圖10給出了上述三種方法對motherdaughter序列每幀編碼比特數的比較曲線,其中橫軸為motherdaughter序列幀序號,縱軸為motherdaughter序列的每幀編碼比特數。從圖10可看出,採用本發明方法編碼的比特數比全搜索方法編碼的比特數平均要高2000比特,比只作整像素的搜索方法平均略高。
參照圖9和圖10的結果,本發明的方法比全搜索方法的峰值信噪比(PSNR)高,但是每幀的編碼比特數也相對要高,因此總體看,二者的性能相當。本發明的方法比只作整像素搜索方法的峰值信噪比(PSNR)要高很多,且每幀編碼比特數略高,因此總體看,本發明的方法比只作整像素搜索方法的性能高很多。
圖11給出了上述三種方法對foreman序列的峰值信噪比(PSNR)比較曲線,其中,橫軸為foreman序列的幀序號,縱軸為foreman序列的重建圖像峰值信噪比(PSNR)。從圖11可以看出,本發明的方法比全搜索的方法的PSNR平均低0.2dB,但比只作整像素搜索的方法要高出2dB。
圖12給出了上述三種方法對foreman序列每幀編碼比特數的比較曲線,其中,橫軸為foreman序列幀序號,縱軸為foreman序列的每幀編碼比特數。從圖12可以看出,本發明對應的每幀編碼比特數比全搜索方法對應的每幀編碼比特數平均要高100比特,比只作整像素搜索方法對應的每幀編碼比特數平均要低100比特。
參照圖11和圖12的結果,本發明的方法比全搜索方法的PSNR略低,每幀的編碼比特數略高,因此總體看,本發明的方法性能與全搜索的方法性能基本相當。本發明的方法比只作整像素搜索方法的PSNR要高很多,且每幀編碼比特數略低,。本發明的方法比只作整像素搜索的方法性能高很多。
綜上試驗結果表明本發明的方法可獲得較好的重建圖象質量,本發明的方法與只做整像素搜索的運動估計方法相比明顯提高了編碼性能,與一般的全搜索半像素搜索方法相比極大的降低了計算複雜度。本發明的方法可以利用硬體或軟體實現,併集成到現有的視頻編碼器中,特別適合於低功耗實時視頻編碼器的實現。本發明的方法可以進一步推廣到更高精度的亞像素級運動估計搜索方法中。
權利要求
1.一種基於數學模型預測的運動估計快速半像素級搜索方法,利用最小絕對差和SAD準則下的整象素塊匹配和半象素級塊匹配的聯繫,對絕對差和SAD進行數學曲線擬合,通過數學曲線來預測最小絕對差和SAD所在位置,從而得到半象素級最佳匹配矢量,並通過視頻編碼標準的插值計算得到半象素級最佳匹配矢量對應的參考塊像素值,具體過程如下(1)記最佳整點匹配位置的最小絕對誤差和SAD值為m0,若整像素搜索中搜索了最佳整點匹配位置臨近的上、下、左、右4個位置,則分別記錄SAD為m1、m2、m3、m4;否則通過計算得到m1、m2、m3、m4這四個值,計算公式為SAD(i,j)=1M*Nm=1Mn=1N|fk(m,n)-fk-1(m+i,n+j)|]]>式中M為宏塊的豎直方向像素數;N為宏塊的豎直方向像素數;fk(m,n)為當前幀的灰度像素值;fk-1(m+i,n+j)為參考幀的灰度像素值;(i,j)為這四個位置的坐標;(2)在水平方向和豎直方向上分別應用線性、拋物線、雙曲線三種不同的凹函數預測模型,並由各自的判斷準判斷,得到三種數學模型各自的最佳半像素級匹配位置(vxh1,vyh1)、(vxh2,vyh2)、(vxh3,vyh3);(3)對三種數學模型的最佳半像素級匹配位置結果(vxh1,vyh1)、(vxh2,vyh2)、(vxh3,vyh3)進行投票,得到最終的半像素匹配位置(vxh,vyh);(4)按照視頻編碼標準的插值方法,得到半像素匹配位置(vxh,vyh)對應的參考塊像素值;(5)輸出半像素運動矢量即半像素匹配位置(vxh,vyh)和參考塊像素值。
2.根據權利要求1所述的搜索方法,其特徵在於獲取線性數學模型對應的最佳半像素級匹配位置(vxh1,vyh1)的過程為(1)在水平方向根據已知整像素相鄰的三點(-1,m3)、(0,m0)、(1,m4),應用線性模型對應式 判斷水平方向的最佳半像素匹配位置vxh1,即按如下準則判斷f(vxh1)對應的最小值如果2(m3-m0)<(m4-m0),則vxh1=-0.5;如果2(m4-m0)<(m3-m0),則vxh1=0.5;否則vxh1=0;(2)在豎直方向根據已知整像素相鄰的三點(-1,m1)、(0,m0)、(1,m2),應用線性模型對應式 判斷豎直方向的最佳半像素匹配位置vyh1,即按如下準則判斷f(vyh1)對應的最小值如果2(m1-m0)<(m2-m0),則vyh1=-0.5;如果2(m2-m0)<(m1-m0),則vyh1=0.5;否則vyh1=0。
3.根據權利要求1所述的搜索方法,其特徵在於獲取拋物線數學模型對應的最佳半像素級匹配位置(vxh2,vyh2)的過程為(1)在水平方向根據已知整像素相鄰的三點(-1,m3)、(0,m0)、(1,m4),應用拋物線模型的對稱軸判斷水平方向的最佳半像素匹配位置vxh2。拋物線模型為f(vxh2)=12(m4+m3-2m0)vxh22+12(m4-m3)vxh2+m0,]]>拋物線的對稱軸vxh2=m3-m42(m3+m4-2m0)]]>判斷水平方向的最佳半像素匹配位置vxh2,即按如下準則判斷f(vxh2)對應的最小值如果3(m3-m0)<(m4-m0),則vxh2=-0.5;如果3(m4-m0)<(m3-m0),則vxh2=0.5;否則vxh2=0;(2)在豎直方向根據已知整像素相鄰的三點(-1,m1)、(0,m0)、(1,m2),應用拋物線模型的對稱軸判斷在豎直方向的最佳半像素匹配位置vyh2。拋物線模型為f(vyh2)=12(m2+m1-2m0)vyh22+12(m2-m1)vyh2+m0]]>拋物線的對稱軸為vyh2=m1-m22(m1+m2-2m0)]]>判斷豎直方向的最佳半像素匹配位置vyh2,即按如下準則判斷f(vyh2)對應的最小值如果3(m3-m0)<(m4-m0),則vyh2=-0.5;如果3(m4-m0)<(m3-m0),則vyh2=0.5;否則vyh2=0。
4.根據權利要求1所述的搜索方法,其特徵在於獲取雙曲線模型數學模型對應的最佳半像素級匹配位置(vxh3,vyh3)的過程為(1)在水平方向根據已知整像素相鄰的三點(-1,m3)、(0,m0)、(1,m4),應用雙曲線模型的對稱軸vxh3=m32-m02m32+m42-2m02-12]]>判斷水平方向的最佳半像素匹配位置vxh3,即按如下準則判斷f(vxh3)對應的最小值如果3(m32-m02)<(m42-m02),則vxh3=-0.5;如果3(m42-m02)<(m32-m02),則vxh3=0.5;否則vxh3=0;(2)在豎直方向根據已知整像素相鄰的三點(-1,m1)、(0,m0)、(1,m2),應用雙曲線模型的對稱軸vyh3=m12-m02m12+m22-2m02-12]]>判斷豎直方向的最佳半像素匹配位置vyh3,即按如下準則判斷f(vyh3)對應的最小值如果3(m32-m02)<(m42-m02),則vyh3=-0.5;如果3(m42-m02)<(m32-m02),則vyh3=0.5;否則,vyh3=0。
5.根據權利要求1所述的搜索方法,其特徵在於對三種數學模型對應的最佳半像素級匹配位置(vxh1,vyh1)、(vxh2,vyh2)、(vxh3,vyh3)結果進行投票,得到半像素匹配位置(vxh,vyh),具體過程為(1)在水平方向如果vxh1=vxh2=vxh3,則vxh=vxh1;如果vxh1≠vxh2≠vxh3,則vxh=0;否則vxh取vxh1,vxh2,vxh3中二者相同的,即如果vxh1=vxh2≠vxh3,則vxh=vxh1;(2)在豎直方向如果vyh1=vyh2=vyh3,則vyh=vyh1;如果vyh1≠vyh2≠vyh3,則vyh=0;否則vyh取vyh1,vyh2,vyh3中二者相同的,即如果vyh1=vyh2≠vyh3,則vyh=vyh1。
全文摘要
本發明涉及一種快速半象素級運動估計搜索方法。主要解決現有半象素級運動估計搜索方法性能低、計算複雜的問題。本發明利用最小絕對差和(SAD)準則下的整象素塊匹配和半象素級塊匹配的聯繫,對絕對差和(SAD)進行數學曲線擬合,即在水平方向和豎直方向上分別應用線性、拋物線、雙曲線三種不同的凹函數預測模型,並由各自的判斷準則,得到三種數學模型各自的最佳半像素級匹配位置(ν
文檔編號H04N7/32GK1589031SQ200410073170
公開日2005年3月2日 申請日期2004年10月13日 優先權日2004年10月13日
發明者趙波, 吳成柯, 肖嵩, 宋銳, 王柯儼, 韓偉, 石迎波, 陳晨 申請人:西安電子科技大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀