新四季網

用於檢索圖象數據的非線性量化方法和相似性匹配方法

2023-06-28 23:04:06

專利名稱:用於檢索圖象數據的非線性量化方法和相似性匹配方法
技術領域:
本發明涉及一種用於檢索圖象數據的方法,具體涉及一種用於構造具有減少的比特的邊緣直方圖描述符的比特表達式的方法和一種利用從所述描述符的編碼表達式中有效提取出的信息來檢索圖象數據的方法。
背景技術:
聯合圖象專家組(JPEG)是用於靜止圖象的國際標準,而運動圖象專家組-1(MPEG-1),2是用於運動圖象的標準。關於壓縮的圖象信息,可提取每個圖象的特徵信息用作諸如提取關鍵幀、圖象搜索、瀏覽等的應用。
為了提取特徵信息,亮度或顏色直方圖被廣泛地使用。亮度和顏色直方圖分別表示在一個圖象中的亮度和顏色(紅色、綠色或蘭色)的相對頻率。特別是,近來直方圖比較的各種方法已經被提出,用於搜索靜止圖象或數字存儲的數字視頻影象。隨著直方圖被用於圖象搜索和鏡頭邊界檢測,傳統的直方圖應被改進。即有必要採用諸如邊緣直方圖的直方圖描述符,它可以更有效地表示圖象內容。而且,描述符的二進位表達式應當短小並且相似性匹配的計算複雜性應當低。
在U.S.Patent No.5,805,733 entitled「Method and system for detectingscenes and summarizing video sequences」(美國專利第5,805,733號,題目為「用於檢測場景和匯總視頻序列的方法和系統」)中公開了一種採用顏色直方圖和邊緣圖用於鏡頭邊界檢測的方法。雖然所述方法在提取相對於人的視覺系統的色彩信息上是有效的,但是所述方法不包括亮度信息的提取。
在an article by M.J.Swain,et al.,「Color Indexing」,International Journal ofComputer Vision,Vol.7-1,pp.11-32.1991(M.J.Swain等的文章「色彩索引」,《計算機視覺國際期刊》,第7-1期,第11-32頁,1991年)中公開了通過利用直方圖相交技術測量圖象的相似性而接收和索引色彩信息的方法。但是,這種方法不使用亮度和邊緣信息,因此不能保證準確性。而且,因為在傳統的方法中利用離散量化技術來產生直方圖,因此需要較大數量的直方圖方柱(histogram bin)來獲得相同的性能。因此導致了在存儲和相似性測量方面的效率低。另外,因為特徵的提取在傳統上是按照像素來進行的,因此存在特徵信息被限制性地產生的問題。
同時,隨著近來直方圖被廣泛地用於圖象搜索等,需要存儲直方圖信息的有效方式。按照存儲直方圖的傳統方式,一個直方圖方柱值通過利用標準線性量化而被存儲在固定大小的存儲區域中。因此,這個對直方圖存儲的線性量化的方法因為比特數量的增加而導致問題。

發明內容
本發明的一個目的在於提供一種用於構造具有圖象信息的資料庫的方法,所述圖象信息表示多個要存儲在資料庫中具有較少比特的圖象。
本發明的另一個目的在於提供一種用於響應於查詢圖象而以高檢索速度和精度基於資料庫來檢索對應圖象的方法。
按照本發明的一個方面,提供了一種用於構造具有表示多個圖象的圖象信息的資料庫的方法,所述方法包括步驟a)計算L×5個標準化的邊緣直方圖方柱以產生一個目標圖象的L個邊緣直方圖,其中每個邊緣直方圖具有5個標準化的邊緣直方圖方柱並且表示在子圖象中的5個參考邊緣的空間分布,L是一個正整數,其中參考邊緣包括4個定向邊緣和1個非定向邊緣;b)非線性地量化L×5個標準化的邊緣直方圖方柱以產生該目標圖象的L×5個量化索引值;c)將L×5個量化索引值存儲到資料庫;d)重複步驟a)到c)直到所有的存儲圖象被處理,以便因此構造具有圖象信息的資料庫。
按照本發明的另一個方面,提供了一種用於響應於一個查詢圖象而基於資料庫檢索對應圖象的方法,所述方法包括步驟a)計算查詢圖象的L個局部邊緣直方圖來作為該查詢圖象的一個圖象描述符,其中每個局部邊緣直方圖表示在子圖象中的5個參考邊緣的空間分布,L是正整數,其中參考邊緣包括四個定向邊緣和一個非定向邊緣;b)根據來自資料庫的圖象信息而提取多個目標圖象的圖象描述符,其中每個目標圖象的圖象描述符包括每個目標圖象的L個局部邊緣直方圖;c)將該查詢圖象的圖象描述符與目標圖象的每個圖象描述符相比較以產生比較結果;d)根據比較結果來檢索至少一個與該查詢圖象相似的目標圖象。


通過參照下面

實施例,本發明的其他目的和方面將會變得更加清楚,其中圖1是圖解按照本發明的、用於構造具有多個對應圖象的圖象描述符的資料庫的步驟的方框圖;圖2示出描述具有要由圖象描述符表示的一個具有16個子圖象的圖象的說明圖;圖3A-3E圖解按照本發明的、要用於一個邊緣確定步驟中的5種類型的邊緣;圖4是一個說明圖,演示了被劃分成4個子塊的一個圖象塊,每個子塊被分配了過濾係數;圖5A-5E示出了圖象塊,其中每個圖象塊的子塊被提供5個邊緣的對應過濾係數;圖6是圖解對應於一個圖象的80個邊緣直方圖方柱組成的一個數組的說明圖;圖7是示出在利用Lloyd-Max量化器的非線性量化和線性量化之間的檢索性能上的差別的視圖;圖8A和8B描述了按照本發明的兩個方框圖,每個示出用於響應於查詢圖象的輸入而檢索所期望的圖象的步驟;圖9A-9C是演示按照本發明的、用於表示半全局邊緣直方圖的13組子圖象的說明圖。
具體實施例方式
以下,參照附圖來說明按照本發明的優選實施例。
參見圖1,示出了圖解按照本發明的、用於構造對應圖象的多個圖象描述符的步驟的方框圖。
在處理方框S101,要處理的圖象被輸入和劃分為N×N個子圖象,如4×4個子圖象,其中N是一個正整數。子圖象然後被連接到處理方框S103,以提取該圖象的第一圖象描述符。即,通過利用邊緣的多樣性來獲得每個子圖象的邊緣直方圖,然後該圖象的80個標準化的局部邊緣直方圖方柱被連接到處理方框S105作為第一圖象描述符。
在處理方框S105,第一圖象描述符被非線性量化,以便因此產生一個對應的第二圖象描述符,它是例如一組量化索引值。
其後,該圖象的第二圖象描述符被輸入和存儲在資料庫S107中。重複上述的步驟直到處理完了要利用第二描述符表示的所有圖象。
參見圖2-6,示出了用於獲得參照圖1描述的第一圖象描述符的步驟的說明圖。
如圖2所示,為了獲得對應的第一圖象描述符,輸入的圖象200被劃分成N×N個不重疊的子圖象。在如圖所示的示例中,圖象被劃分成4×4個子圖象,形成了16個矩形子圖象211到226。每個子圖象包括多個像素。
如上所述,第一圖象描述符表示標準化的邊緣直方圖方柱,用於產生每個子圖象的邊緣直方圖,其中邊緣直方圖表示在子圖象中的邊緣的空間分布。
為了提取邊緣直方圖,每個子圖象隨後被劃分為M×K個不重疊的矩形圖象塊,其中圖象塊的大小由圖象的尺寸大小決定。每個圖象塊被用於一個邊緣確定步驟中,其中一個圖象塊利用它的邊緣之一來描述。
按照如圖3A-3E所示的本發明的一個實施例,邊緣確定處理被提供了5個邊緣,其中之一被選擇用於一個圖象塊。所述邊緣可以包括各種類型定向邊緣,最好是,垂直、水平、45度和135度邊緣301、303、305和307;以及包括至少一個未指定方向的邊緣的非定向邊緣309。
為了產生子圖象的邊緣直方圖,有必要從圖象塊檢測邊緣特徵。即,執行邊緣確定步驟以便確定哪個邊緣可以被分配到一個圖象塊。可以採用在空間域中應用數字過濾器的方法來進行提取。
在邊緣確定步驟中,如圖4所示,一個圖象塊被劃分成4個子塊。即,如圖所示,參考數字400表示一個圖象塊,參考數字411、413、415和417表示圖象塊400的子塊,它們也分別被標記為0、1、2和3,其中每個子塊分配獲得一個對應的過濾係數以便能夠獲得一組邊緣幅度。
按照本發明的一個實施例,每個圖象塊400被劃分成2×2個子塊,其中每個子塊被標記為0,1,2和3。
對於每個圖象塊,通過利用下面的方程式來獲得對應於5種類型的邊緣的一組5個邊緣幅度mv(i,j)=|k=03ak(i,j)fv(k)|]]>方程式1mh(i,j)=|k=03ak(i,j)fh(k)|]]>方程式2md-45(i,j)=|k=03ak(i,j)fd-45(k)|]]>方程式3md-135(i,j)=|k=03ak(i,j)fd-135(k)|]]>方程式4mnd(i,j)=|k=03ak(i,j)fnd(k)|]]>方程式5其中mv(i,j),mh(i,j),md-45(i,j),md-135(i,j)和mmd(i,j)分別表示第(i,j)個圖象塊的垂直、水平、45度、135度和非定向邊緣幅度;ak(i,j)表示在第(i,j)個圖象塊中標號為k的子塊的平均灰度級,fv(k)、fh(k)、fd-45(k)、fd-135(k)和fmd(k)分別表示垂直、水平、45度、135度和非定向邊緣的過濾係數,其中k=0、1、2和3,每個表示標註每個子塊的編號。
參見圖5A-5E,示出了每個邊緣的過濾係數。
如圖所示,參考數字501、503、505、507和509分別示出垂直、水平、45度、135度和非定向邊緣的過濾係數。可以利用從5個邊緣幅度中選擇出的一個來表示每個圖象塊,其中對各個邊緣分別計算其幅度。
為了確定對應於一個圖象塊的一個邊緣,利用由上述方程式獲得的5個邊緣幅度彼此比較。根據比較結果,由相對於其他邊緣具有最大的邊緣幅度的一個邊緣來表示該圖象塊,其中所述最大邊緣幅度也應當大於預定的閾值。如果所述最大邊緣幅度小於預定的閾值,則可確定這個圖象塊不包含邊緣。
當該圖象塊的選定邊緣被確定為邊緣幅度比較的結果時,子圖象的對應邊緣直方圖方柱遞增1。有5種類型的邊緣直方圖方柱,即垂直、水平、45度、135度和非定向邊緣直方圖方柱。5種邊緣直方圖方柱是用於表示邊緣直方圖的分量。對包括在一個子圖象中的所有圖象塊的對應邊緣進行檢測,然後對應於每個已檢測的邊緣的邊緣直方圖方柱遞增1以便因此產生一個子圖象的被稱為局部邊緣直方圖的邊緣直方圖。對所有16個子圖象進行邊緣的檢測並產生邊緣直方圖。
局部邊緣直方圖表示在一個子圖象中的5種類型的邊緣的分布,即一個子圖象的邊緣直方圖。因為子圖象的數量被固定為16個,並且每個子圖象被分配了5個邊緣直方圖方柱,因此需要80個邊緣直方圖方柱來產生對所有16個子圖象對應的局部邊緣直方圖。即,如表1所示來定義BinCounts的每個方柱的語義表1

其中BinCounts
...BinCounts[79]表示邊緣直方圖描述符的最後的編碼比特。
參見圖6,示出了對應於一個圖象的80個邊緣直方圖方柱的示例數組。
例如,圖2所示的圖象200的在(0,0)的子圖象211的局部邊緣直方圖分別包括垂直、水平、45度、135度和非定向邊緣邊緣直方圖方柱600、601、602、603和604,如圖6所示。以相同的方式,圖2中的在(0,1)的子圖象212的局部邊緣直方圖包括與子圖象211的方柱具有相同順序的5個邊緣直方圖方柱605、606、607、608和609。結果,總共需要80個邊緣直方圖方柱來分別產生所有16個子圖象的16個局部邊緣直方圖方柱,其中通過將5個邊緣直方圖方柱與16個子圖象相乘而計算得到總共80個方柱。
為了獲得第一圖象描述符,一個子圖象的局部邊緣直方圖中的每個邊緣直方圖方柱通過將每個方柱除以包括在該子圖象中的圖象塊的總數而實現標準化。因此,局部邊緣直方圖的每個邊緣直方圖方柱具有範圍從0到1的一個方柱值。該圖象的標準化的方柱值隨後被連接到圖1所示的處理方框S105來作為第一圖象描述符。在處理方框S105,利用多個量化表來非線性量化第一圖象描述符。
即,為了獲得第二圖象描述符,標準化的方柱值被量化以獲得其二進位表達式。所述量化應當對80個標準化的方柱值來進行。在這種情況下,標準化的方柱值被非線性地量化以便能夠實現二進位表達式的比特總數的最小化。
結果,獲得一組量化索引值來作為第二圖象描述符。按照本發明的一個實施例,利用以例如Lloyd-Max算法設計的非線性量化器來進行非線性量化。
為了進行量化,在此使用分別用於垂直邊緣、水平邊緣、45度邊緣、135度邊緣和非定向邊緣的5個非線性量化表,它們被典型表示在表2-6中表2垂直邊緣直方圖方柱的量化表

表3水平邊緣直方圖方柱的量化表


表445度邊緣直方圖方柱的量化表

表5135度邊緣直方圖方柱的量化表

表6非定向邊緣直方圖方柱的量化表


其中每個方柱的比特的最佳數量被固定在3,以使在按照本發明的上述量化表中具有8個量化等級。第二圖象描述符隨後被存儲在資料庫S107中,並且響應於查詢圖象的輸入而被檢索。
參見圖7,示出了描述在利用Lloyd-Max量化器的非線性量化和線性量化之間的檢索性能上的差別的視圖。
如圖所示,所述視圖的Y軸表示指示檢索性能的一個平均標準化改進檢索等級(ANMRR),X軸表示在產生量化表時基於每個邊緣方柱的比特數量的每個圖象的比特數量。實線700和虛線701分別示出當使用非線性量化和線性量化時的檢索性能。
從實線700可以看出,如果每個邊緣方柱的比特數量是3,則每個圖象的比特數量是240,它是通過將3個比特與80個邊緣直方圖方柱相乘而獲得的。ANMRR是取值在0和1之間的一個實數。ANMRR越接近0,檢索性能,即檢索精度越好。因此,可以容易地理解,對每個邊緣直方圖方柱的三個比特的分配會導致在檢索性能和比特產生數量方面最有效的編碼。
參見圖8A和8B,示出了圖解按照本發明的優選實施例的、響應於查詢圖象的輸入而檢索所期望的圖象的兩種方法的方框圖。
如果接收到一個查詢圖象,則以圖1所示的處理方框S101和S103以相同方式來處理該查詢圖象。即,該查詢圖象的第一圖象描述符以上述的方式獲得,並且包括該查詢圖象的標準化的邊緣直方圖方柱。
其後,根據作為圖象描述符的標準化的邊緣直方圖方柱來產生該查詢圖象的全局邊緣直方圖和半全局邊緣直方圖。全局邊緣直方圖表示整個圖象空間的邊緣分布。下面將更詳細地說明全局邊緣直方圖和半全局邊緣直方圖。
另一方面,按照圖8A,示出了按照本發明的優選實施例的用於響應於查詢圖象的輸入而利用多個非線性反量化表來檢索所期望的圖象的方法,其中非線性反量化表可以是上述的表2、3、4、5和6。
當輸入查詢圖象時,在處理方框S801進行與處理方框S101相同的步驟,即圖象劃分步驟。
在處理方框S803,進行與處理方框S103中相同的步驟,即邊緣直方圖產生。
為了實現高檢索性能,根據在處理方框S803產生的局部邊緣直方圖方柱,可以在處理方框S805進一步產生該查詢圖象的全局邊緣直方圖和半全局邊緣直方圖。
對於一個數據匹配步驟,從預先建立的資料庫S107依序檢索目標圖象的多個第二圖象描述符。對於存儲的目標圖象,一組量化索引值被檢索並且被連接到非線性反量化表S807中。通過使用非線性反量化表,量化索引值隨後被轉換為該目標圖象的標準化的邊緣直方圖方柱。
在處理方框S809,標準化的邊緣直方圖方柱隨後被用於提取所述目標圖象的局部邊緣直方圖、一個全局邊緣直方圖和半全局邊緣直方圖。即,為了實現高檢索性能,具有標準化的邊緣直方圖方柱的局部邊緣直方圖、全局邊緣直方圖和半全局邊緣直方圖被用於數據匹配處理中作為一個目標圖象的一個圖象描述符。在數據匹配處理S811中,通過計算在該查詢圖象A和該目標圖象B的局部、半全局和全局邊緣直方圖之間的距離,兩個圖象之間的相似性被確定如下Distance(A,B)=i=079|Local_A[i]-Local_B[i]|+5i=04|Global_A[i]-Global_B[i]|]]>+i=064|Semi_Global_A[i]-Semi_Global_B[i]|]]>方程式6其中,Local_A[i]和Local_B[i]分別表示分配到圖象A和B的每個局部邊緣直方圖的第i個方柱的索引值;Global_A[]和Global_B[]分別表示分配到圖象A和B的每個全局邊緣直方圖的的第i個方柱的索引值;Semi_Global_A[]和Semi_Global_B[]分別表示分配到圖象A和B的每個半全局邊緣直方圖的第i個方柱的索引值。因為全局邊緣直方圖的方柱的數量比局部和半全局邊緣直方圖的相對小,因此在上述方程式中應用了加權係數5。
如上所述,利用方程式6,通過引用反量化表可以測量在兩個圖象A和B之間的相似性。在這種情況下,因為應當通過引用反量化表來解碼圖象的邊緣直方圖方柱值,因此方程式6一般應用於複雜但準確的檢索。在此,每個反量化表對應於表2-6所示的一個邊緣量化表。
隨後重複上述的步驟,直到處理了所有的目標圖象。
另一方面,按照圖8B,示出了按照本發明的優選實施例的、用於響應於查詢圖象的輸入不利用多個非線性反量化表而檢索所期望的圖象的第二種方法。即,在第二種方法中,可以不利用上述的反量化表而高速地還原一個圖象的局部邊緣直方圖。
對於一個輸入的查詢圖象,如上所述執行處理方框S801、S803和S805。
在處理方框S808,一組量化索引值被從資料庫S107中檢索並且被標準化,以便因此產生一組標準化的索引值。所述這組標準化的索引值隨後被連接到處理方框S810。
在處理方框S810,標準化的索引值被用做存儲的圖象的邊緣直方圖方柱的值。即,根據被稱為解碼圖象的局部邊緣直方圖方柱值的標準化的邊緣直方圖方柱的值來產生存儲的圖象的全局邊緣直方圖和半全局邊緣直方圖。
在處理方框S812中,通過計算在具有該查詢圖象的圖象描述符和解碼圖象的局部、半全局和全局邊緣直方圖的圖象描述符之間的距離,確定了在兩個圖象,即該查詢圖象A和該目標圖象B之間的相似性。
因為在非線性量化表中存在邊緣直方圖方柱值的單調增長,因此按照本發明的每個量化表在0周圍的一些部分中——在此邊緣發生概率高——具有線性增長的特性。這意味著一組索引值本身可以被用做在圖象檢索步驟中的相似性測量值而不用引用反量化表。
下面的方程式7被應用以獲得在根據存儲的圖象的索引值直接獲得的兩個圖象A和B之間的邊緣直方圖的距離如下Distance(A,B)=i=079|Local_A[i]-Local_B[i]|+5i=04|Global_A[i]-Global_B[i]|]]>+i=064|Semi_Global_A[i]-Semi_Global_B[i]|]]>方程式7利用方程式7,考慮到反量化表的部分線性特性,也可以通過利用一組編碼的索引值本身來測量相似性。因此,可以看出,圖8B所述的檢索步驟快於圖8A所述的。
參見圖9A-9C,示出了按照本發明的優選實施例的、用於表示半全局邊緣直方圖的13組子圖象的示例圖。
在建立邊緣檢測的圖象區域中,如圖2所示,該圖象被垂直和水平地劃分成4個等同的部分以形成16個子圖象,並且每個子圖象產生一個局部邊緣直方圖。而且,因為可以總是形成16個子圖象而與該圖象大小無關,因此可以以固定長度的比特來編碼圖象的量化索引值,並且將其存儲在資料庫中。
從每個子圖象編碼得到的局部邊緣直方圖可以被合併和重新使用,以便因此獲得全局邊緣直方圖和半全局邊緣直方圖的附加的邊緣直方圖。
通過將對於16個子圖象的每個的局部邊緣直方圖合併到一個圖象中,產生了全局邊緣直方圖。如上所述,每個邊緣直方圖具有5個邊緣直方圖方柱,即垂直、水平、45度、135度和非定向邊緣直方圖方柱。為了合併16個局部邊緣直方圖,有必要將來自每個邊緣直方圖的16個垂直邊緣直方圖方柱加到一起。以相同的方式,對於水平、45度、135度和非定向邊緣直方圖方柱進行求和。因此,可以從全局邊緣直方圖獲取整個圖象的邊緣分布信息。
再次參見圖9A-9C,4組4個圖象——每一組被包括在垂直方向上列1-4中的每列中——被分別依序設置為第一到第四組子圖象的901、903、905和907,並且四組四個子圖象——每一組被包括在水平方向上行5-8中的每行中——被分別依序設置為第五到第八組子圖象的909、911、913和915。而且,5組4個子圖象被設置為第9、10、11、12和13組子圖象的917、919、921、923和925。第9-12組917、919、921、923中的每個分別具有位於圖象左上、右上、左下和右下的子圖象,第13組925具有圍繞圖象的中心的4個子圖象。第1-13組子圖象901-925包括65個邊緣直方圖方柱,它們是通過13乘以5獲得的,13表示子圖象的總數,5表示每個子圖象的邊緣直方圖方柱的數量。結果,對於13組4個子圖象產生了具有65個邊緣直方圖方柱的半全局邊緣直方圖。
通過利用對於半全局邊緣直方圖的65個邊緣直方圖方柱和對於全局邊緣直方圖的5個邊緣直方圖方柱以及對於局部邊緣直方圖的80個邊緣直方圖方柱以確定在兩個圖象之間的相似性,從而提高了系統的檢索效率。
特別是,通過選擇上述13組4個子圖象以產生半全局邊緣直方圖,可以改進檢索性能,因為所述13組具有對在圖象中的物體位置改變敏感性低的特性。
按照本發明,可以大大降低用於存儲量化索引值所需要的比特數量。而且,可以通過利用非線性量化器來大大降低相似性計算的複雜度。
雖然已經說明性地公開了本發明的優選實施例,本領域的技術人員會明白,在不脫離所附的權利要求所公開的本發明的精神和範圍的情況下,可以進行各種改變、增加和替換。
權利要求
1.一種用於構造具有表示多個圖象的圖象信息的資料庫的方法,所述方法包括步驟a)計算L×5個標準化的邊緣直方圖方柱以產生一個目標圖象的L個邊緣直方圖,其中所述每個邊緣直方圖具有5個標準化的邊緣直方圖方柱並且表示一個子圖象中的5個參考邊緣的空間分布,L是一個正整數,其中參考邊緣包括4個定向邊緣和1個非定向邊緣;b)非線性地量化L×5個標準化的邊緣直方圖方柱以產生所述目標圖象的L×5個量化索引值;c)將所述L×5個量化索引值存儲到資料庫;d)重複步驟a)到c)直到所有的存儲圖象被處理,以因此構造具有圖象信息的資料庫。
2.按照權利要求1的方法,其中所述定向邊緣包括一個垂直邊緣、一個水平邊緣、一個45度邊緣和一個135度邊緣,並且所述非定向邊緣表示除了所述四個定向邊緣之外的未指定方向的一個邊緣。
3.按照權利要求2的方法,其中垂直邊緣、水平邊緣、45度邊緣、135度邊緣和非定向邊緣被分別表示為垂直邊緣(301)、水平邊緣(303)、45度邊緣(305)、135度邊緣(307)和非定向邊緣(309)。
4.按照權利要求3的方法,其中步驟a)包括步驟a1)將目標圖象劃分為L個子圖象,其中每個子圖象被進一步劃分成S×K個圖象塊,S和K是正整數;a2)向每個圖象塊分配參考邊緣之一,以因此產生目標圖象的L個邊緣直方圖,其中每個邊緣直方圖包括L×5個邊緣直方圖方柱;a3)以一個子圖象中包含的圖象塊的數量S×K來標準化邊緣直方圖方柱以因此產生L×5個標準化的邊緣直方圖方柱,每個標準化的邊緣直方圖方柱具有一個0和1之間的實數。
5.按照權利要求4的方法,其中步驟a1)包括步驟a1-1)將目標圖象劃分成N×N個不重疊的子圖象,以因此形成L個矩形子圖象,N是一個正整數;a1-2)將每個子圖象劃分成S×K個不重疊的塊以因此形成S×K個矩形圖象塊。
6.按照權利要求5的方法,其中步驟a2)包括步驟a2-1)向每個圖象塊分配參考邊緣之一;a2-2)對包括在子圖象中的每個參考邊緣的數量計數以產生目標圖象的L個邊緣直方圖。
7.按照權利要求6的方法,其中步驟a2-1)包括步驟a2-11)將每個圖象塊劃分成2×2的子塊;a2-12)向每個子塊分配一個對應的過濾係數;a2-13)利用所述過濾係數來計算對應於每個圖象塊的5個邊緣的一組5個邊緣幅度;a2-14)通過彼此比較所計算的邊緣幅度來將圖象塊表示為一個具有最大邊緣幅度的邊緣。
8.按照權利要求7的方法,其中利用5個方程式來獲得5個邊緣幅度,所述方程式被表示為mv(i,j)=|k=03ak(i,j)fv(k)|;]]>mh(i,j)=|k=03ak(i,j)fh(k)|;]]>md-45(i,j)=|k=03ak(i,j)fd-45(k)|;]]>md-135(i,j)=|k=03ak(i,j)fd-135(k)|;]]>mnd(i,j)=|k=03ak(i,j)fnd(k)|,]]>其中mv(i,j),mh(i,j),md-45(i,j),md-135(i,j)和mmd(i,j)分別表示第(i,j)個圖象塊的垂直、水平、45度、135度和非定向邊緣幅度;ak(i,j)表示在第(i,j)個圖象塊中分配為k的子塊的平均灰度級,fv(k)、fh(k)、fd-45(k)、fd-135(k)和fmd(k)分別表示垂直、水平、45度、135度和非定向邊緣的過濾係數,其中k表示分配到每個子塊的編號。
9.按照權利要求7的方法,其中當最大邊緣幅度小於預定的閾值時,圖象塊被表示為不包括邊緣。
10.按照權利要求1的方法,其中步驟b)包括步驟b1)利用對應的非線性量化表來非線性地量化每個標準化的邊緣直方圖方柱,其中步驟b1)被提供了5個非線性量化表,每個非線性量化表對應於一個特定的參考邊緣。
11.按照權利要求10的方法,其中步驟b1)包括步驟b2-1)將每個標準化的邊緣直方圖方柱映射為在每個對應的參考邊緣量化表中包含的一個代表值;b2-2)產生表示每個標準化的邊緣直方圖方柱的一個代表值的3比特的量化索引值,以因此產生L×5個量化索引值來作為目標圖象的第二圖象描述符。
12.按照權利要求10的方法,其中利用基於Lloyd-Max算法的非線性量化器來非線性地量化標準化的邊緣直方圖方柱。
13.按照權利要求5的方法,其中所述N是4。
14.按照權利要求12的方法,其中量化表包括一個用於表示在子圖象中的垂直邊緣的數量的垂直邊緣直方圖方柱的表,被表示為
15.按照權利要求12的方法,其中量化表進一步包括一個用於表示在子圖象中的水平邊緣的數量的水平邊緣直方圖方柱的表,被表示為
16.按照權利要求12的方法,其中量化表進一步包括一個用於表示在子圖象中的45度邊緣的數量的45度邊緣直方圖方柱的表,被表示為
17.按照權利要求12的方法,其中量化表進一步包括一個用於表示在子圖象中的135度邊緣的數量的135度邊緣直方圖方柱的表,被表示為
18.按照權利要求12的方法,其中量化表進一步包括一個用於表示在子圖象中的非定向邊緣的數量的非定向邊緣直方圖方柱的表,被表示為
19.按照權利要求6的方法,其中BinCounts的所述每個邊緣直方圖方柱的語義定義為
20.一種用於響應於一個查詢圖象而基於資料庫檢索對應圖象的方法,所述方法包括步驟a)計算查詢圖象的L個局部邊緣方框圖來作為所述查詢圖象的圖象描述符,其中每個局部邊緣直方圖表示在一個子圖象中的5個參考邊緣的空間分布,L是一個正整數,其中參考邊緣包括四個定向邊緣和一個非定向邊緣;b)根據來自資料庫的圖象信息而提取多個目標圖象的圖象描述符,其中每個目標圖象的圖象描述符包括每個目標圖象的L個局部邊緣直方圖;c)將查詢圖象的圖象描述符與目標圖象的每個圖象描述符相比較以產生一個比較結果;d)根據比較結果來檢索至少一個與該查詢圖象相似的目標圖象。
21.按照權利要求20的方法,其中每個局部邊緣直方圖具有對應於參考邊緣的5個邊緣直方圖方柱。
22.按照權利要求20的方法,其中定向邊緣包括一個垂直邊緣、一個水平邊緣、一個45度邊緣和一個135度邊緣,並且非定向邊緣表示除了所述四個定向邊緣之外的未指定方向的一個邊緣。
23.按照權利要求22的方法,其中其中步驟a)包括步驟a1)將查詢圖象劃分為N×N個不重疊的子圖象,以因此形成L個矩形子圖象,其中每個子圖象被進一步劃分成S×K個圖象塊,S和K是正整數;a2)向每個圖象塊分配參考邊緣之一,以因此產生查詢圖象的L個邊緣直方圖,其中每個邊緣直方圖包括L×5個邊緣直方圖方柱;a3)以一個子圖象中包含的圖象塊的數量S×K來標準化邊緣直方圖方柱以因此產生L×5個標準化的邊緣直方圖方柱,每個標準化的邊緣直方圖方柱具有一個0和1之間的實數。
24.按照權利要求23的方法,其中步驟a2)包括步驟a2-1)向每個圖象塊分配參考邊緣之一;a2-2)對包括在子圖象中的每個參考邊緣的數量計數以產生查詢圖象的L個邊緣直方圖。
25.按照權利要求17的方法,其中步驟a2-1)包括步驟a2-11)將每個圖象塊劃分成2×2的子塊;a2-12)向每個子塊分配一個對應的過濾係數;a2-13)利用所述過濾係數來計算對應於每個圖象塊的5個邊緣的一組5個邊緣幅度;a2-14)通過彼此比較所計算的邊緣幅度來將圖象塊表示為一個具有最大邊緣幅度的邊緣。
26.按照權利要求25的方法,其中利用5個方程式來獲得5個邊緣幅度,所述方程式被表示為mv(i,j)=|k=03ak(i,j)fv(k)|;]]>mh(i,j)=|k=03ak(i,j)fh(k)|;]]>md-45(i,j)=|k=03ak(i,j)fd-45(k)|;]]>md-135(i,j)=|k=03ak(i,j)fd-135(k)|;]]>mnd(i,j)=|k=03ak(i,j)fnd(k)|,]]>其中mv(i,j),mh(i,j),md-45(i,j),md-135(i,j)和mmd(i,j)分別表示第(i,j)個圖象塊的垂直、水平、45度、135度和非定向邊緣幅度;ak(i,j)表示在第(i,j)個圖象塊中分配為k的子塊的平均灰度級,fv(k)、fh(k)、fd-45(k)、fd-135(k)和fmd(k)分別表示垂直、水平、45度、135度和非定向邊緣的過濾係數,其中k表示分配到每個子塊的編號。
27.按照權利要求25的方法,其中當最大邊緣幅度小於預定的閾值時,圖象塊被表示為不包括邊緣。
28.按照權利要求20的方法,其中用於查詢和目標圖象的圖象描述符進一步分別包括基於L×5個標準化的邊緣直方圖方柱的一個全局邊緣直方圖和R個半全局邊緣直方圖,R是正整數。
29.按照權利要求28的方法,其中所述全局邊緣直方圖表示在查詢和目標圖象的整個空間中的邊緣分布,並且每個半全局邊緣直方圖表示在對應的一組查詢和目標圖象的子圖象中的邊緣分布。
30.按照權利要求28的方法,其中所述N和R分別是4和13。
31.按照權利要求30的方法,其中對應於13組4個子圖象中的每一組產生13個半全局邊緣直方圖,所述13組包括四組四個子圖象,每組包括在垂直方向上的圖象的第一到第四列的每列中的4個子圖象;四組四個子圖象,每組包括在水平方向上的第一到第四行中的每行中的四個子圖象;四組四個子圖象,每組包括一個對應的子圖象和三個與對應的子圖象相鄰的子圖象,其中對應的子圖象分別位於圖象的左上、右上、左下和右下;在圖象中心周圍的包括四個子圖象的一組。
32.按照權利要求20的方法,其中步驟b)包括步驟b1)檢索每個目標圖象的L×5個量化索引值;b2)利用5個非線性反量化表來將L×5個量化索引值中的每個轉換為每個目標圖象的L×5個標準化的邊緣直方圖方柱;b3)根據L×5個標準化的邊緣直方圖方柱來產生L個局部邊緣直方圖。
33.按照權利要求32的方法,其中步驟b)進一步包括步驟b4)根據L×5個標準化的邊緣直方圖方柱進一步產生每個目標圖象的一個全局邊緣直方圖和R個半全局邊緣直方圖。
34.按照權利要求20的方法,其中步驟b)包括步驟b1)檢索每個目標圖象的L×5個量化索引值;b2)通過標準化L×5個量化索引值來將L×5個量化索引值中的每個轉換為每個目標圖象的L×5個標準化的邊緣直方圖方柱;b3)根據L×5個標準化的邊緣直方圖方柱來產生L個局部邊緣直方圖。
35.按照權利要求34的方法,其中步驟b)還包括步驟b4)根據L×5個標準化的邊緣直方圖方柱進一步產生每個目標圖象的一個全局邊緣直方圖和R個半全局邊緣直方圖。
36.按照權利要求33的方法,其中步驟c)包括步驟通過下一方程式估計在查詢圖象和所述每個目標圖象之間的距離Distance(A,B)=i=079|Local_A[i]-Local_B[i]|+5i=04|Global_A[i]-Global_B[i]|]]>+i=064|Semi_Global_A[i]-Semi_Global_B[i]|]]>其中,Local_A[i]和Local_B[i]分別表示查詢圖象A和目標圖象B的BinCount[i]的邊緣直方圖方柱;Global_A[]和Global_B[]分別表示查詢圖象A和目標圖象B的全局邊緣直方圖的邊緣直方圖方柱;Semi_Global_A[]和Semi_Global_B[]分別表示查詢圖象A和目標圖象B的半全局邊緣直方圖的直方圖方柱值。
37.按照權利要求35的方法,其中步驟c)包括步驟通過下一方程式估計在查詢圖象和所述每個目標圖象之間的距離Distance(A,B)=i=079|Local_A[i]-Local_B[i]|+5i=04|Global_A[i]-Global_B[i]|]]>+i=064|Semi_Global_A[i]-Semi_Global_B[i]|]]>其中,Local_A[i]和Local_B[i]分別表示查詢圖象A和目標圖象B的BinCount[i]的邊緣直方圖方柱;Global_A[]和Global_B[]分別表示查詢圖象A和目標圖象B的全局邊緣直方圖的邊緣直方圖方柱;Semi_Global_A[]和Semi_Global_B[]分別表示查詢圖象A和目標圖象B的半全局邊緣直方圖的直方圖方柱值。
38.一種用於構造一個目標圖象的一個邊緣直方圖描述符的一個比特表達式的方法,所述方法包括步驟a)將目標圖象劃分成16個子圖象,其中每個子圖象被進一步劃分成S×K個圖象塊,S和K是正整數;b)向每個圖象塊分配5個參考邊緣之一,以因此產生目標圖象的16個邊緣直方圖,其中邊緣直方圖包括80個邊緣直方圖方柱,並且參考邊緣包括4個定向邊緣和一個非定向邊緣;c)通過S×K來標準化在每個邊緣直方圖中包含的邊緣直方圖方柱,以因此產生80個標準化的邊緣直方圖方柱,每個標準化的邊緣直方圖方柱具有一個0和1之間的實數;d)非線性量化80個標準化的邊緣直方圖方柱以產生80個量化索引值作為目標圖象的第二個圖象描述符。
39.按照權利要求38的方法,其中以3個比特表示每個量化索引值。
40.按照權利要求39的方法,其中定向邊緣包括一個垂直邊緣、一個水平邊緣、一個45度邊緣、一個135度邊緣,非定向邊緣表示除了四個定向邊緣之外的未指定方向的一個邊緣。
全文摘要
一種用於構造具有表示多個圖象的圖象信息的資料庫的方法,所述方法包括步驟a)計算Lx5個標準化的邊緣直方圖方柱以產生一個目標圖象的L個邊緣直方圖,其中每個邊緣直方圖具有5個標準化的邊緣直方圖方柱並且表示在一個子圖象中的5個參考邊緣的空間分布,L是一個正整數,其中參考邊緣包括4個定向邊緣和1個非定向邊緣;b)非線性地量化Lx5個標準化的邊緣直方圖方柱以產生所述目標圖象的Lx5個量化索引值;c)將Lx5個量化索引值存儲到資料庫;d)重複步驟a)到c)直到所有的存儲圖象被處理,以便因此構造具有圖象信息的資料庫。
文檔編號H04N7/26GK1470131SQ01817474
公開日2004年1月21日 申請日期2001年10月18日 優先權日2000年10月21日
發明者樸秀 , 樸秀晙, 元致善, 樸東權, 金賢進, 樸聖熙, 張明吉 申請人:韓國電子通信研究院

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀