基於mod字典學習採樣的譜聚類圖像分割方法
2023-12-08 20:17:51
專利名稱:基於mod字典學習採樣的譜聚類圖像分割方法
技術領域:
本發明屬於圖像處理技術領域,涉及圖像分割,可用於對紋理圖像和SAR圖像進行目標檢測和目標識別。
背景技術:
聚類就是按照一定的要求和規律對事物進行區分和分類的過程,在這一過程中沒有任何關於類別的先驗知識,僅靠事物間的相似性作為類屬劃分的準則,因此屬於無監督分類的範疇。聚類分析則是指用數學的方法研究和處理給定對象的分類,是多元統計分析的一種,也是無監督模式識別的一個重要分支。它把一個沒有類別標記的樣本集按某種準則劃分成若干個子集,使相似的樣本儘可能歸為一類,而不相似的樣本儘量劃分到不同的類中。作為一種無監督分類方法,聚類分析已經被廣泛地應用於模式識別、數據挖掘、計算機視覺和模糊控制等許多領域。但傳統的聚類算法,如k-means算法,EM算法等都是建立在凸球形的樣本空間上,但當樣本空間不為凸時,算法會陷入局部最優。譜聚類方法是一種建立在譜圖理論基礎之上,利用數據相似性矩陣的特徵向量進行聚類的方法。譜聚類方法實現簡單,與維數無關,能在任意形狀的樣本空間上聚類並收斂於全局最優解,因此得到了越來越廣泛的應用。目前譜聚類方法已被成功應用於語音識別、 視頻分割、圖像分割、VLSI設計和網頁劃分等領域。但是,譜聚類方法需要計算一個nXn相似性矩陣的主要特徵向量,η是樣本個數。這對於大規模數據,計算量是相當大的,這也成為了譜聚類方法的瓶頸問題。Fowlkes等人提出了基於NystKm逼近的譜聚類方法。該方法首先從所有樣本中隨機選取一個樣本子集作為代表求解特徵問題,然後再將其特徵向量擴展為整個樣本集合權值矩陣的特徵向量。然而,選取結果對聚類影響很大,聚類結果表現出不穩定性。後來提出的k均值NystKm譜聚類方法,在一定程度上解決了不穩定問題。該方法用k-means方法對數據集預聚類,將與預聚類得到的中心點最近鄰的數據點作為採樣點,取代了原來的隨機採樣。但由於k-means方法本身並不是一種完全穩定聚類方法,當樣本空間不為凸時,算法會陷入局部最優,所以k均值NystKndf聚類方法圖像分割結果很不穩定。
發明內容
本發明的目的在於克服上述已有技術的缺點,提出了一種基於MOD字典學習採樣的譜聚類圖像分割方法,以得到穩定的、更準確的圖像分割結果。為實現上述目的,本發明通過對樣本進行MOD學習得到字典,並根據樣本與字典的距離,把那些距離較小的樣本作為採樣點,最大化保留圖像信息,再利用Nystrttoi逼近譜聚類算法劃分得到所有樣本的標籤,具體步驟包括如下(1)使用灰度共生矩陣對待分割的圖像進行特徵提取,並將提取的特徵數據X = Ix1,. . .,Xi,. . .,、} (i = 1,. . .,η)歸一化到
之間,得到數據X'以去除數據間量級的影響;
4
(2)用MOD字典方法對X'進行學習,得到字典D = W1,…,d」,dffl}, j = 1,. . .,m,dj為字典中的原子,m為字典原子數,取300 ;(3)計算特徵數據X'與字典D的歐氏距離,並取距離較小的前1個數據作為採樣子集S,1取300 ;(4)利用NystKm方法,從選出的採樣子集S得到所有特徵數據的特徵向量;(5)對前k個特徵值對應的特徵向量進行k-means聚類,得到最終的圖像分割結果,其中k是類別數,1且為整數;本發明由於對特徵數據通過字典學習得到字典,並選擇與字典距離最近的特徵數據作為採樣子集,最大化地保留了圖像信息,使採樣子集具有代表性;同時本發明利用字典採樣子集對剩餘數據進行NystKm嵌入,使圖像分割性能有明顯提升。
圖1是本發明圖像分割的流程圖;圖2是現有的一幅2分類紋理圖像;圖3是用本發明與現有NystKndf聚類方法對圖2的仿真分割結果圖;圖4是現有的一幅3分類紋理圖像;圖5是用本發明與現有NystKndf聚類方法對圖4的仿真分割結果圖;圖6是現有的一幅2分類SAR圖像;圖7是用本發明與現有NystKm譜聚類方法對圖6的仿真分割結果圖;圖8是現有的一幅2分類SAR圖像;圖9是用本發明與現有NystKndf聚類方法對圖8的仿真分割結果圖。
具體實施例方式參照圖1,本發明的實施步驟如下步驟1.使用待分割圖像的灰度共生矩陣對圖像進行特徵提取,並將提取的特徵數據歸一化,以去除數據間量級的影響。(Ia)對待分割的圖像生成灰度共生矩陣P,窗口大小取16 ;(Ib)在0°,45°,90°和135°這4個方向上,從圖像的灰度共生矩陣P中抽取以下三種二次統計量
n-\ n-\角二階矩.Λ二,
/=0 J=O η-\ η-\同質區/2=21^(^)^ + 0-7+)2]2,
/=0 J=O n-\ n-\對比度/3= Σ ΣI7' — J\p(^ J),
/=0 j=Q其中,η是樣本總數,p(i,j)是灰度共生矩陣P第i行第j列的元素;在4個方向上分別計算上述統計量,得到每個樣本的特徵數據向量Xi = (fn,
fi2, 「,f"ii2),土 1,...,η ;(Ic)將η個樣本的特徵數據向量作為列向量構成的特徵數據X= Ix1,... Xi,…,
5xn},i = 1,. . .,n,並把X歸一化到
之間,得到數據X',以去除數據間量級的影響。步驟2.用MOD字典對歸一化後的特徵數據進行學習,得到字典D。(2a)隨機選取m個特徵數據作為初始字典原子,構成初始字典D=(屯,···,…,···, dm),j = 1,...,m,其中字典原子Clj e Rtx1, t是每個特徵數據的維數,m取300 ;(2b)根據初始字典D',利用正交匹配追蹤算法對特徵數據X的第i個特徵數據 Xi進行稀疏編碼,獲得稀疏表示係數向量α i
權利要求
1.一種基於MOD字典學習採樣的譜聚類圖像分割方法,包括如下步驟(1)使用灰度共生矩陣對待分割的圖像進行特徵提取,並將提取的特徵數據歸一化到
之間,以去除數據間量級的影響;(2)用MOD字典方法對歸一化後的特徵數據集X=Ix1,…,Xi,…,i}(i = l,..., η)進行學習,得到字典D= W1, ···,(!」,-,dm}, j = 1,...,m,且m<=n,dj為字典中的原子,m為字典原子數,取300 ;(3)計算特徵數據與字典原子的歐氏距離,從X'中取距離較小的前1(1<n,l取300) 個數據構成採樣子集&;(4)利用NystKm方法,從選出的採樣子集S得到所有特徵數據的特徵向量;(5)對前k個特徵值對應的特徵向量進行k-means聚類,得到最終的圖像分割結果,其中k是類別數,1且為整數。
2.根據權利要求1所述的基於MOD字典學習採樣的譜聚類圖像分割方法,其中步驟 (2)所述的用MOD字典學習方法對歸一化後的特徵數據進行學習,得到字典,按照如下步驟進行Oa)隨機選取m個特徵數據作為初始字典原子,構成初始字典D= (d」 ···, dj,…, dm),j = 1,...,m,其中字典原子Clj e Rtx1, t是每個特徵數據Xi的維數,m取300 ;(2b)根據已有字典D,利用正交匹配追蹤算法對特徵數據X的第i個特徵數據Xi進行稀疏編碼,獲得稀疏表示係數向量α i mJnINs. t. I II。< L其中L為編碼的稀疏度,L取4 ;(2c)對η個特徵數據都進行稀疏編碼,將得到的η個稀疏表示係數向量作為列向量構成稀疏表示係數矩陣A= (Q1,... , Qi,... , aj,i = 1,... ,η,、是第i個特徵數據Xi 在字典D上的稀疏表示係數向量;(2d)根據字典D和稀疏表示係數矩陣A,利用最小二乘法求解目標函數 mm\X-DAf2 ,把得到的最優解作為新的字典D';(2e)用D'更新D,重複執行步驟(2b)、步驟Qc)和步驟Qd)N次,得到最終的字典 D",N取 25。
3.根據權利要求1所述的基於MOD字典學習的譜聚類圖像分割方法,其中步驟(2)所述的計算特徵數據與字典原子的歐氏距離,並取距離較小的前1個數據構造採樣子集S,按照如下步驟進行(3a)根據下式計算第j個字典原子…與第i個特徵數據Xi的歐氏距離Wji Wji = I I (Ij-Xi I, j = 1, . . . , m, i = 1, . . . , η將η個特徵數據分別與第j個字典原子…的歐氏距離構成第j個字典原子…的距離向量:Wj = {wn, . . . , Wji, . . . , WjJ , i = 1, . . . , η ;(3b)比較全部字典原子的距離向量%(」=1,. . .,m)的值,把歐氏距離較小的前1個 Wji對應的第i個特徵數據χ' i作為採樣點,並去掉重複特徵數據,得到規模為300的採樣子集S。
4.根據權利要求1所述的基於MOD字典學習的譜聚類圖像分割方法,其中步驟(4)所述的利用NystKm方法,從選出的採樣子集S得到所有特徵數據的特徵向量,按照如下步驟進行(4a)計算採樣子集S的權值矩陣W = G(S,S),其中η為特徵數據個數,G為高斯核函數;(4b)對權值矩陣W進行特徵分解,求出特徵值λ = {λ」...,Xi,..., λ^和特徵向量於{徹..#...湖,其中Xi是λ的第i個元素,燼是於的第i列向量,1 = 1,2,..., 1 ;(4c)由w的特徵值λ和特徵向量於,根據下式計算得到Φ的第j個列向量φ」
全文摘要
本發明公開了一種基於字典學習採樣譜聚類的圖像分割方法,主要解決現有譜聚類方法分割結果不穩定的問題。其實現過程是(1)對待分割的圖像進行特徵提取,並將提取的特徵數據歸一化到
之間,以去除數據間量級的影響;(2)用MOD字典學習方法對歸一化後的特徵數據進行學習,得到字典D;(3)計算特徵數據與字典原子的歐氏距離,並取距離小的前l個數據作為採樣子集S,l取300;4)利用方法,從選出的採樣子集S得到所有特徵數據的特徵向量;(5)對前k個特徵值對應的特徵向量進行k-means聚類,得到最終的圖像分割結果。本發明與現有的技術相比圖像分割結果穩定、準確度高,可用於目標檢測和目標識別。
文檔編號G06T5/00GK102436645SQ20111034665
公開日2012年5月2日 申請日期2011年11月4日 優先權日2011年11月4日
發明者莊廣安, 張向榮, 李陽陽, 楊淑媛, 楊靜瑜, 焦李成, 緱水平, 趙一帆 申請人:西安電子科技大學