改進的用於表示目標輪廓的輪廓近似方法
2023-07-25 20:18:11 1
專利名稱:改進的用於表示目標輪廓的輪廓近似方法
技術領域:
本發明涉及一種用於視頻信號編碼器中的輪廓近似方法,更具體地,涉及一種改進的用於精確重建目標輪廓的輪廓近似方法。
在數字視頻系統、如電視電話、電視會議及高清晰度電視系統中,為了確定每個視頻幀信號需要大量數字數據,因為在視頻幀信號中的視頻行信號內包括一系列的被稱為象素值的數字數據。但是,由於在傳統的傳輸信道中可獲得的頻帶寬度是有限的,為了通過這種傳輸信道傳輸大量的數字數據,不可避免地要通過使用各種數據壓縮技術來壓縮或減少數據量,尤其是在如電視電話及電視會議系統這樣的低比特率視頻信號編碼器的情況下。
這些用於低比特率編碼系統對視頻信號進行編碼的方法中的一種是所謂的面向目標的分析綜合編碼技術(見Michael Hotter寫的「基於運動兩維目標的面向目標的分析綜合編碼「Signal ProcessingImage Comunication,第二卷4期第409至428頁(1990年12月))。
根據該面向目標的分析綜合編碼技術,輸入視頻圖象視分成目標及用於確定其運動的三組參數,每個目標的輪廓及象素數據通過不同的編碼信道被處理。
尤其是,在處理目標輪廓圖象時,輪廓信息對於物體形狀的分析及綜合是很重要的。用於表示輪廓信息的傳統編碼方法是一種鏈式編碼技術。但是,鏈式編碼方法需要大量的比特,儘管在輪廓信息中未損失掉比特。
在這方面,對輪廓近似的多種方法已被建議出來,例如多邊形近似及B-樣條函數近似法。在多邊形近似法中其缺點之一是輪廓圖象表示粗糙。B-樣條函數近似法正相反,能更精確地表示輪廓圖象,但它需要高階多項式來減小近似誤差,由此增加了視頻編碼器的整體計算複雜性。
為了改善整體計算複雜性問題而導入的一種技術是採用多邊形近似及離散正弦變換(DST)的輪廓近似法。該技術被描述在與此同一持有人的待審查美國專利申請,系列號NO.08/423604中,其名稱為「用於表示目標輪廓的輪廓近似裝置」,申請日為1995年4月17日。但是,在處理複雜的輪廓圖象時,上述採用多邊形近似及DST的技術可能得出與原始輪廓圖象很不相同的重建圖象。
因此,本發明的主要目的是提供一種在視頻信號編碼器中使用的改進的輪廓近似方法,它能夠降低在編碼的輪廓信息中的近似誤差。
根據本發明,提供了一種用於視頻信號編碼器中的用於表示目標輪廓圖象的輪廓近似方法,其包括(a)確定輪廓圖象上的一些頂點;(b)利用多個直線段來適配該輪廓圖象,以提供輪廓圖象的多邊形近似,每個直線段連接兩個相鄰的頂點;(c)提供一直線段兩頂點的位置作為線段數據;(d)對於一直線段確定一些抽樣點並提供代表該抽樣點位置的抽樣點信息,所述抽樣點將每條直線分成等長的小線段;(e)計算在直線段的每個抽樣點及頂點上的第一次誤差,該第一次誤差表示連接兩頂點的直線段及這兩頂點間輪廓線之間的距離;(f)將抽樣點及頂點上的第一次誤差變換成一組離散正弦變換係數;(g)將每組離散正弦變換係數轉換成一組量化的變換係數;(h)將該組量化的變換係數轉換成一組重建的第一次誤差;(i)基於每個直線段的線段數據、抽樣點信息及該組第一次誤差提供一重建的輪廓線;(j)計算第二次誤差,它是重建的輪廓線及其相應的輪廓線之間的失配象素數目;(k)將第二次誤差與一預定閾值相比較;(l)如果第二次誤差小於所述閾值,則對輪廓線的該組量化的變換係數及線段數據進行編碼;或如果第二次誤差等於或大於所述閾值,則通過在該輪廓線上增加一個附加頂點使該輪廓線再分成一對新的分段輪廓線,並對相對於每個新分段的輪廓線的直線段重複步驟(c)至(l);及(m)對在步驟(a)中確定的頂點形成的所有直線段重複步驟(c)至(l)。
從以下結合附圖對優選實施例的描述中,本發明的上述及其它目的和特徵將變得更加明顯,附圖為
圖1表示本發明的用於表示輪廓圖象的輪廓近似裝置的方框圖;圖2A至2C表示一個示例的輪廓圖象的多邊形近似處理過程;圖3A及3B為示例圖,其中每個圖表示出連接兩個頂點的直線段及其相應輪廓圖象之間的誤差;圖4A至4C例舉表示根據本發明的附加頂點增設操作;及圖5表示根據本發明的曲率計算圖。
參見圖1,它表示本發明的用於表示以視頻信號表達的目標輪廓圖象的輪廓近似裝置。
代表目標輪廓的輪廓圖象數據被傳送到一個多邊形近似單元100,第一及第二次誤差檢測單元120及150以及曲率計算單元160。在多邊形近似單元100上,利用多邊形近似技術對輪廓圖象進行近似。該輪廓圖象的多邊形近似是通過利用線段適配輪廓圖象的傳統近似算法來獲得的。
參見圖2A至2C,它表示根據多邊形近似技術對一例舉的輪廓圖象10的分段處理過程。
首先,選擇兩個起始頂點。如果輪廓圖象是開環形的,則選擇兩個端點,例如圖2A中所示的A及B作為起始頂點。另一方面,如果輪廓圖象是閉環形式的,則選擇輪廓上兩個最遠的點作為起始頂點。然後,確定出輪廓上的距線段AB的最遠點,如果線段AB及該最遠點、例如C點之間的距離Dmax大於一預定閾值時,該點C就成為一個頂點。這個過程重複進行,如圖2C中所示,直到對於每個線段的Dmax小於預定閾值TH1時為止。
對於一個給定輪廓,其頂點的數目取決於預定閾值TH1。如從圖2C中可看到的,利用較小的閾值,由線段來表示輪廓圖象可變得更精確,其代價是降低了編碼效率。
再參照圖1,代表輪廓圖象10的確定出的頂點如A、B、C、D及E的位置的頂點信息,如圖2C所示,由多邊形近似單元100提供給緩衝器110。
緩衝器110接收來自多邊形近似單元100的頂點信息並作為頂點數據存儲該信息。在多邊形近似單元100上確定出的所有頂點的頂點信息均存儲在緩衝器110中後,就開始了本發明處理的輪廓近似,例如利用一個過程控制器(未示出)從例如圖2C中所示的線段AD開始。這就是,響應於來自過程控制器的起始信號,該緩衝器110將代表該線段例如AD的兩個頂點位置的線段數據提供給抽樣電路115。
抽樣電路115為每個直線段確定預定數量,例如為4個的抽樣點,其中這些抽樣點將線段分成等長度的分線段,並將代表確定的抽樣點位置的抽樣點信息及線段數據通過導線L11提供給第一次誤差檢測單元120及輪廓重建單元145。
基於來自於抽樣電路115的線段數據及抽樣點信息及導線L10上的輪廓圖象數據,第一次誤差檢測單元120計算每個抽樣點及線段頂點上的第一次誤差。第一次誤差代表連接頂點的直線段及兩頂點間的輪廓線之間的距離。
圖3A及3B示出了代表直線段及相應輪廓線之間的第一次誤差的示例圖,其中圖3A描繪出直線段AD及其相應的輪廓線之間的第一次誤差,及圖3B表示出直線段DC及其相應輪廓線之間的第一次誤差。每個誤差d1至d4或d1』至d4』代表直線段AD上的每個抽樣點S1至S4或直線段DC上的每個抽樣點S1』至S4』與相應輪廓線之間的距離。如從圖3A及3B中可看到的,對於頂點的近似誤差均為「零」。因為所有的頂點都位於輪廓上。
由第一次誤差檢測單元120計算的第一次誤差被提供給離散正弦變換(DST)單元125。該DST單元125對線段的一組第一次誤差執行一維DST操作,以產生一組DST係數。該組DST係數提供給量化(Q)單元130。量化單元130使該組DST係數量化,以通過導線L12將對應於直線段的一組量化DST係數提供給逆向量化(IQ)單元135及方式選擇單元155,用於進一步的處理。
在逆向量化單元135,該組量化的DST係數被變換回一組重建的DST係數。然後在逆向DST單元140上,該組重建的DST係數被逆變換成一組重建的第一次誤差。此後,將這組重建的第一次誤差提供給輪廓重建單元145。
基於來自於IDST單元140的該組重建的第一次誤差及來自抽些電路115的線段數據和抽樣點信息,輪廓重建單元145產生出一條重建的輪廓線,並將該重建的輪廓線數據提供給第二次誤差檢測單元150。
第二次誤差檢測單元150計算第二次誤差,它是位於來自輪廓重建單元145的重建的輪廓線與自導線L10上的輪廓圖象數據提供的與其對應的原始輪廓線之間的失配象素的數目,並提供在導線L13上的第二次誤差及提供在導線14上的線段數據、即重建的輪廓線兩頂點的位置數據。參照圖4A,它表示對於線段AD的原始輪廓線100及示例的重建輪廓線200。在此情況下,第二次誤差相當於在被輪廓線100及200所包圍的區域300中所包含的象素數目。
在方式選擇單元155,將第二次誤差與預設閾值TH2相比較。如果第二次誤差小於預設閾值TH2,則該方式選擇單元155將來自量化單元130的量化的DST係數及來自於第二次誤差檢測單元150的相應輪廓線的線段數據分別通過導線L16及L17提供給輪廓編碼器165;並提供第一許可信號給緩衝器110。在此情況下,由緩衝器110將用於待處理的下一線段的一對頂點例如D及C的線段數據提供給抽樣電路115;並重複上述處理過程直到輪廓圖象的所有線段均被處理為止,一要是線段的第二次誤差小於預設閾值TH2的話。
另一方面,如果對於重建的輪廓線的第二次誤差等於或大於閾值TH2,則根據本發明通過在原始輪廓線上再增加一個附加頂點使相應於每個重建的輪廓線的原始輪廓線進一步被分段。這就是,如果對於重建的輪廓線的第二次誤差等於或大於閾值TH2時,方式選擇單元155就將用於線段頂點的線段數據及第二許可信號分別提供給曲率計算單元160及緩衝器110。在曲率計算單元160,對應來自方式選擇單元155的線段數據,計算原始輪廓線上每個被選擇的象素的曲率。
參見圖5,它表示根據本發明的在曲率計算單元160上進行的曲率計算過程聽的明用圖。首先,如圖5所示,輪廓線上每第N個、例如第六個象素被選擇作為目標象素,例如T1、T2或T3。然後通過每對相鄰的兩個目標象素、如T1及T2劃一條直線。通過某一目標象素的兩條直線形成的角度變化被規定為這個目標象素的曲率。然後,曲率計算單元160將代表每個目標象素位置及曲率的目標象素信息提供給附加頂點選擇單元170。
附加頂點選擇單元170將來自曲率計算單元160的目標象素的各曲率作出比較,並從它們中選擇出具有最大曲率的一個目標象素、例如圖4A中所示的F,作為附加頂點,並將代表該附加頂點位置的附加頂點信息提供給緩衝器110。該附加頂點信息被作為頂點數據存儲在緩衝器110中。因此,通過在兩個頂點、例如A及D之間增加例如一個附加頂點F,可將具有大的失配的一個複雜輪廓線,例如圖4A中所示的輪廓線100分成兩個不太複雜的輪廓線,如圖4B及圖4所示,它們可以通過DST被更精確地近似。
然後,響應於第二許可信號,緩衝器110將用於頂點A及F的線段數據提供給抽樣電路115;並對線段AF重複進行上述的輪廓近似處理。
與此同時,在輪廓編碼器165,通過使用例如JPEG(Joint Photographic Experts Group)的二進位算術碼對導線L16上的每組量化的DST係數進行編碼,而對導線L17上的線段數據通過使用例如固定長度碼無壓縮地進行編碼,因為這些頂點很少相關。包括被編碼量化的DST係數及線段數據的編碼數位訊號被傳輸到一個發送器,用於將其發送出去。
雖然本發明是相對特定的實施例作出描述的,但顯然對於熟悉本領域的技術人員而言,在不偏離以下權利要求書中所限定的本發明精神和範圍的情況下,可以作出各種變化及改型。
權利要求
1.一種用於視頻信號編碼器中的用於表示目標輪廓圖象的輪廓近似方法,包括(a)確定輪廓圖象上的一些頂點;(b)用多個直線段來適配該輪廓圖象,以提供輪廓圖象的多邊形近似,每個直線段連接兩個相鄰的頂點;(c)提供一直線段兩頂點的位置作為線段數據;(d)對於一直線段確定一些抽樣點並提供代表抽樣點位置的抽樣點信息,所述抽樣點將每條直線分成等長的小線段;(e)計算在直線段的每個抽樣點及頂點上的第一次誤差,該第一次誤差表示連接兩頂點的直線段與這兩頂點間輪廓線之間的距離;(f)將抽樣點及頂點上的第一次誤差變換成一組離散正弦變換係數;(g)將每組離散正弦變換係數轉換成一組量化的變換係數;(h)將該組量化的變換係數轉換成一組重建的第一次誤差;(i)基於每個直線段的線段數據、抽樣點信息及該組第一次誤差提供一重建的輪廓線;(j)計算第二次誤差,它是重建的輪廓線及其相應的原始輪廓線之間的失配象素數目;(k)將第二次誤差與一預定閾值相比較;(l)如果第二次誤差小於所述閾值,則對輪廓線的該組量化的變換係數及線段數據編碼;或如果第二次誤差等於大於所述閾值,則通過在該輪廓線上增加一個附加頂點使該輪廓線再分成一對新的分段輪廓線,並對相應於每個新分段輪廓線的直線段重複步驟(c)至(l);及(m)對在步驟(a)中確定的頂點形成的所有直線段重複步驟(c)至(l)。
全文摘要
一種輪廓近似方法,基於輪廓圖像上像素的曲率,通過在複雜的輪廓線上增加附加的頂點來精確地重建目標輪廓。將具有最大曲率的目標像素選擇為附加頂點。
文檔編號G06T9/20GK1131875SQ9511645
公開日1996年9月25日 申請日期1995年9月7日 優先權日1995年3月20日
發明者金鎮憲 申請人:大宇電子株式會社