新四季網

一種用於圖像匹配、識別、檢索的頻域形狀描述方法

2023-09-23 04:13:20

一種用於圖像匹配、識別、檢索的頻域形狀描述方法
【專利摘要】本發明屬於模式識別、圖像處理、計算機視覺【技術領域】,具體為一種用於圖像匹配、識別、檢索的頻域形狀特徵描述方法。本發明在圖像區域劃分為若干子區域,分別以各個特徵點作為參考點統計其它特徵點落在各個子區域的個數,得到直方圖,計算直方圖的功率譜作為一種形狀描述,計算兩幅圖像的形狀描述子之間的相似度進而得到圖像相似度,從而實現圖像匹配、識別、檢索。實驗表明,所發明的形狀上下文譜特徵具有較好的旋轉和伸縮不變性、對於噪聲和變形的魯棒性、且計算開銷較小。
【專利說明】—種用於圖像匹配、識別、檢索的頻域形狀描述方法
【技術領域】
[0001]本發明屬於模式識別、圖像處理、計算機視覺【技術領域】,具體涉及一種圖像形狀特徵提取方法,可以用於圖像匹配、識別、檢索。
【背景技術】
[0002]圖像包括形狀、紋理、顏色信息,其中,形狀是圖像識別、檢索所依賴的主要信息,形狀特徵描述對於圖像識別、檢索非常重要,【S- Belogie, J.Malik, J.Puzicha: 「Shapematching and object recognition using shape contexts,IEEE Transactions onPattern Analysis and Machine Intelligence」,Volume 24,pp.509-52,2002】論文中提出了一種稱為形狀上下文(Shape Contexts)的形狀描述方法,首先提取圖像特徵點(邊緣點),然後以每個特徵點作為參考點構造一個網格,統計網格各個區域中包含的特徵點數,得到直方圖形式的形狀描述子。形狀上下文是一種對於噪聲幹擾較為魯棒的特徵,但是形狀上下文特徵不具有旋轉不變性,需要利用特徵點所在位置的圖像灰度域的切向量作為參考方向以獲得旋轉不變性,但是這種依賴外在條件的旋轉不變性不夠穩健,尤其對於二值圖像而言,無法獲得可以作為參考方向的切向量。因此,發明人在已獲得授權的中國發明專利【楊夙:一種通用的用於符號識別的特徵描述方法,發明專利,授權時間: 2008年2月6日,授權國別:中國,授權號:200410016733.0】和論文【S.Yang: 「Symbolrecognition via statistical integration of pixel-level constraint histograms:Anew descriptor,,,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.27,N0.2,pp.278-281,2005】中提出了點約束直方圖特徵,該特徵具有內在的旋轉和伸縮不變性,且對於噪聲和變形較為魯棒,但是缺點是計算複雜度較高,大約為0(N3)。

【發明內容】

[0003]本發明的目的在於提出一種能以較低的計算開銷,獲得較好的旋轉與伸縮不變性、對噪聲和變形的魯棒性的用於圖像匹配、識別、檢索的頻域形狀描述方法,即圖像形狀特徵提取方法。
[0004]本發明提出的用於圖像匹配、識別、檢索的頻域形狀描述方法,包括以下計算步驟:
[0005](a)以圖像特徵點的統計量作為圖像形狀描述的基本元素;假設一幅圖像有K個特徵點,記作P= {Pp P2,…,PkI,任選一個特徵點Pk e P作為參考點,對其它特徵點的空間分布進行統計,得到一個相應的直方圖,記作h(Pk);分別以各個特徵點作為參考點,則對應每個特徵點分別得到一個直方圖,共得到K個直方圖1h(Pk) I k=l,2,...,!(};
[0006](b)對每個特徵點對應的直方圖求傅立葉變換;設h(Pk)的傅立葉變換為F(Pk),對矩陣F(Pk)中的每個元素進行函數f(.)定義的數學變換,得到f (F(Pk))Jf{f (F (Pk)) I k=l, 2,…,K}作為K個特徵點分別對應的形狀描述子;
[0007](c)以所有特徵點的形狀描述子"^fXF(PK))]作為輸入進行函數g(.)定義的數學變換,得到g(f (F(P1)), f (F(P2)),…,f (F(Pk))),g(f(F(P1)), f (F(P2)),-,f (F(Pk)))是最終用於圖像匹配、識別、檢索的形狀描述子。
[0008]上面所述的形狀描述方法的計算步驟(a)、(b)、(c)各有若干種實現方案。上面所述的形狀描述方法的計算步驟(a)的兩種實現方案在下面分別用(al)和(a2)表示,計算步驟(b)的兩種實現方案在下面分別用(bl)和(b2)表示,計算步驟(C)的兩種實現方案在下面分別用(cI)、( c2 )表示,具體計算方法如下:
[0009](al)以參考點為中心,將圖像最小外接圓所在的空間劃分為MX N的網格,計算落入網格每個區間的特徵點的個數得到直方圖,M和N都是自然數;
[0010](a2)以參考點為中心,將圖像最小外接圓所在的空間劃分為M個同心圓環形成的區域,計算落入每個圓環的特徵點的個數得到直方圖,M是自然數;
[0011](bl) F(Pk)的數學變換f(.)定義為矩陣F(Pk)中每個元素的模值的W次方,設Fij (Pk)表示矩陣F (Pk)的第i行、第j列的元素,則f (Fij (Pk)) = I Fij (Pk) w,W是自然數;
[0012](b2) F(Pk)的數學變換f(.)定義為矩陣F(Pk)中每個元素的模值的對數值,設Fij(Pk)表示矩陣 F(Pk)的第 i 行、第 j 列的元素,則 MFij(Pk)) =1g(IFij(Pk));
[0013](Cl)以所有特徵點的形狀描述子[MF(P1)), f (F(P2)),…,f (F(Pk))]作為輸入進行的函數g(.)定義的數學變換為:輸出等於輸入,g (f (F (P1)), f (F(P2) ),...,f (F (Pk) )) = [f (F (P1)), f (F (P2) ),..., f (F (Pk))];
[0014](c2)以所有特徵點的形狀描述子Lf(F(P1))1T(F(P2))1 -,f (F(Pk))]作為輸入進行的函數g(.)定義的數學變換為:將所有特徵點的對應形狀描述子進行矩陣加
g (f (F (P1)), f (F (P2) ),..., f (F (Pk) )) =f (F (P1)) ? f(F(P2)),…,? f (F(Pk)),這裡運算符「Θ」表示參與運算的各個矩陣的對應位置的元素相加,MF(P1)) ? f(F(P2)),...,? f (F(Pk))表示所有K個矩陣的下標相同的元素相加。
[0015]本發明提出了形狀上下文譜特徵,點約束直方圖可以近似看作形狀上下文的自相關,因此其傅立葉變換相當於形狀上下文的功率譜,形狀上下文譜特徵與點約束直方圖特徵相比計算開銷較小,同時繼承了點約束直方圖特徵的旋轉和伸縮不變性、以及對噪聲和變形的魯棒性。因此,本發明方法克服了形狀上下文和點約束直方圖的缺點,具有廣泛的應用前景。
【專利附圖】

【附圖說明】
[0016]圖1為圖像識別系統的組成框圖。
【具體實施方式】
[0017]一個圖像識別系統通常由以下幾個環節組成,圖像採集、預處理、特徵提取、相似度計算、分類,圖像識別系統的目標是從圖像資料庫中返回與輸入圖像最相似的圖像,整個圖像識別系統的組成見圖1。這裡,圖像採集可以通過相機、掃描儀等各種能夠完成物理成像的傳感設備完成。
[0018]實施例1:
[0019]步驟1:對一幅輸入圖像提取特徵點,並計算各個特徵點的形狀描述子,令P=IP1, P2,…,PJ和{f (F(Pk)) k=l, 2,…,K}分別表示所得到的特徵點及其對應的形狀描述子,形狀描述子的計算步驟如下:
[0020](a)任選一個特徵點Pk e P作為參考點,對其它特徵點的空間分布進行統計,得到一個相應的直方圖,記作h(Pk);這裡,直方圖的具體計算方法如下:以參考點Pk為中心,將圖像最小外接圓所在的空間劃分為MX N的網格,計算落入網格每個區間的特徵點的個數得到直方圖,M和N都是自然數;分別以各個特徵點作為參考點,則對應每個特徵點分別得到一個直方圖,共得到K個直方圖1h(Pk) I k=l,2,…,K};
[0021](b)對每個特徵點對應的直方圖求傅立葉變換,設h (Pk)的傅立葉變換為F(Pk),對矩陣F (Pk)中的每個元素進行函數f(.)定義的數學變換,F (Pk)的數學變換f(.)定義為矩陣F(Pk)中每個元素的模值的W次方,設Fij (Pk)表示矩陣F(Pk)的第i行、第j列的元素,則MFij (Pk) H Fij (Pk) |w,W=2;將{f (F(Pk)) k=l,2,…,K}作為K個特徵點分別對應的形狀描述子;
[0022]步驟2:對圖像庫中任選的一幅圖像提取特徵點,基於步驟I所述的形狀描述子計算方法計算各個特徵點的形狀描述子,令Q={Qi,Q2,…,QJ和^(F(Q1)) |?=1,2,...,?分別表示所得到的特徵點及其對應的形狀描述子;
[0023]步驟3:計算輸入圖像和圖像庫圖像的各形狀描述子之間的相似度,記作{dkl=d (f (F (Pk) ),f(F (Q1))) I k=l, 2,…,K; 1=1,2,...,L},這裡採用內積作為相似度度量,即分別將矩陣f (F(Pk))和MF(Q1))拉直為向量,然後求兩個向量的內積;
[0024]步驟4:按照最近鄰原則對點集合P= (P1, P2,…,Ρκ}和Q=IQ2,…,QJ進行匹配,計算方法如下:進行m=min {K, L}次迭代,每次迭代得到一個匹配的點對,每次迭代的具體計算步驟如下:(a)找到集合D={dkl|k=l, 2,…,K; 1=1,2,…,L}中的最大元素dst ; (b)將PS<-?Q,作為一個匹配對記錄到集合PeQ中;(c)令dsl=- 和dkt=_:k=l, 2,...,K且1=1,2,…,L ;
[0025]步驟5:採用發明人提出的點集合匹配的校正方法對步驟4得到的初始的點集合匹配關係PoQ=PrQ:?…,Ρβ4.>0?}進彳丁校正,得到經過校正的點集合匹配關係{P.4>Q., P十+>Cb』…,P十η≤m;令
{(X:!(Xi,y,), ***, (XSJ Yn)4->(x,,y=)}表示匹配點對..% P..eCU 的坐標值;
[0026]步驟6:基於步驟5得到的經過校正的點集合之間的匹配關係計算投影變換,步驟如下:
[0027](a)令
【權利要求】
1.一種用於圖像匹配、識別、檢索的頻域形狀描述方法,其特徵在於包含以下計算步驟: (a)以圖像特徵點的統計量作為圖像形狀描述的基本元素;假設一幅圖像有#個特徵點,記作盧ΙΛ,Λ,…,P K、,任選一個特徵點A e產作為參考點,對其它特徵點的空間分布進行統計,得到一個相應的直方圖,記作A(A);分別以各個特徵點作為參考點,則對應每個特徵點分別得到一個直方圖,共得到#個直方圖卿I左=1,2,…,幻; (b)對每個特徵點對應的直方圖求傅立葉變換,設A的)的傅立葉變換為/^的),對矩陣/^的)中的每個元素進行函數/(.)定義的數學變換,得到/(^的)),將{f (FQ3k)) \k=l, 2,…,幻作為#個特徵點分別對應的形狀描述子; (c)以所有特徵點的形狀描述子[/(ΜΛ)),f(HP2))作為輸入進行函數H.)定義的數學變換,得到S(Z^Od1)), /W2)),…,f{F{PK))),g{f(Fipi)),f (FiP2)),…,f(F(Pk)))是最終用於圖像匹配、識別、檢索的形狀描述子。
2.根據權利要求1所述的方法,其特徵在於計算步驟(a)中所述的直方圖定義如下:以參考點為中心,將圖像最小外接圓所在的空間劃分為的網格,計算落入網格每個區間的特徵點的個數得到直方圖,#和#都是自然數。
3.根據權利要求1所述的方法,其特徵在於計算步驟(a)中所述的直方圖定義如下:以參考點為中心,將圖像最小外接圓所在的空間劃分為#個同心圓環形成的區域,計算落入每個圓環的特徵點的個數得到直方圖,#是自然數。
4.根據權利要求1所述的方法,其特徵在於計算步驟(b)中所述的/^的)的數學變換/(.)定義為矩陣/^的)中每個元素的模值的r次方,設A7(A)表示矩陣的第i行、第j列的元素,則f(Fu(Pk)) = \Fiy (Pk) ,r是自然數。
5.根據權利要求1所述的方法,其特徵在於計算步驟(b)中所述的/^的)的數學變換/(.)定義為矩陣中每個元素的模值的對數值,設表示矩陣的第i行、第j 列的元素,則 fiFij (Pk)) =1g ( Ia7 (Pk) I)。
6.根據權利要求1所述的方法,其特徵在於計算步驟(c)中,所述的以所有特徵點的形狀描述子[/(ΜΛ)),f{F{P2))r'',作為輸入進行的函數g(.)定義的數學變換為:輸出等於輸入'(/(/7Od1)), f(FiP2)),''', fiF(Pk))) = If (FiPl)), f(F(P2)),-,/嶋))]。
7.根據權利要求1所述的方法,其特徵在於計算步驟(c)中,所述的以所有特徵點的形狀描述子[/(ΜΛ)),f(F(P2)),-,作為輸入進行的函數H.)定義的數學變換為:將所有特徵點的對應形狀描述子進行矩陣加法,ff(f (J7(P1)), f(F(P2)),-,f (FQ3k) )) =ZXZ7Od1) ) ? f {F{P2)),…,? f(F(pK)),這裡運算符「 ? 」表示參與運算的各個矩陣的對應位置的元素相加,/(/7Od1)) ? f (FQ32)),''', ?/(/7?))表示所有#個矩陣的下標相同的元素相加。
【文檔編號】G06K9/62GK103679200SQ201310687697
【公開日】2014年3月26日 申請日期:2013年12月14日 優先權日:2013年12月14日
【發明者】楊夙 申請人:復旦大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀