一種基於ELM與DSmT的飛機姿態識別方法與流程
2023-04-30 23:02:46 2
本發明屬於自動目標識別技術領域,特別涉及一種基於elm與dsmt的飛機姿態識別方法。
背景技術:
自動目標識別技術(automatictargetrecognition,atr)是取得戰場控制信息權的關鍵因素之一。從二十世紀八十年代開始,國內外很多的專家、學者積極參與了atr技術的研究,使得atr理論方面得到了完善,應用領域也得到很大的擴展。飛機目標識別作為atr的重要領域之一,在現代戰爭和未來戰爭中都將佔有著極為重要的地位。現代軍事活動中,飛機的姿態識別越來越發揮著重要的作用,通過定位飛機的姿態,能夠更方便準確的定位飛機的局部關鍵部位(如螺旋漿、機艙、油箱)。
早期的研究主要集中於利用單特徵結合模式分類方法對飛機目標做分類和識別。劉剛等(劉剛,梁曉庚,張京國.基於紅外圖像的飛機目標關鍵攻擊部位識別[j].計算機工程與應用,2011,47(24):174-178)基於紅外圖像,將飛機圖像分割成背景、機身、尾焰三部分,通過計算一種組合矩,同時結合面積比特徵來實現飛機識別。塗建平等(塗建平,彭應寧,莊志洪.彈道終端飛機目標紅外圖像瞄準點識別方法[j].光學技術,2003,29(3):261-265)通過對飛機目標進行骨架提取、霍夫變換等過程,檢測飛機機軸,識別飛機。
基於單一特徵的飛機目標識別在面對飛機種類繁多時,其算法性能很差,同時基於單一特徵的算法在面對圖像存在噪聲如遮擋、縮放等情況下,誤識別率很低。為了解決這個問題,一部分學者提出了基於多特徵融合的方法來提高飛機目標識別算法的魯棒性。曾接賢等(曾接賢,季康.基於多特徵融合的多視點飛機目標識別算法[j].南昌航空大學學報:自然科學版,2016,30(2):9-15)提出一種基於dsmt理論和svm分類器相結合的多特徵融合額多視點飛機目標識別算法,該方法首先對處理後的圖像提取仿射不變矩與傅立葉描述子,利用svm分類器對這兩個證據源構建信度賦值,最後利用dsmt在決策級進行融合,從而完成對飛機目標的識別。
基於決策級的多特徵融合的目標識別算法流程為:
(1)圖像特徵提取與表示;
(2)分類器的構建與訓練;
(3)多特徵融合;
多特徵融合識別算法在特徵方面彌補了單一特徵在識別方面的不足,但是面對飛機在飛行過程中姿態多變、外界環境複雜等情況,會給識別結果帶來較大的影響,導致識別錯誤。同時在實際軍事應用中,算法的實時性是很關鍵的指標之一。綜上,如何選擇魯棒性好的多個特徵,同時降低算法的時間複雜度是很有意義的工作。
技術實現要素:
發明目的:針對現有技術中存在的由於飛機種類繁多、姿態多變導致識別率較低,同時算法的實時性普遍很差等問題,本發明提供一種將sift算法引入飛機姿態識別方法中,提取飛機圖像的sift特徵與輪廓局部奇異值特徵;將elm算法訓練後的slfns作為分類器,可以有效的提高算法的實時性;最終在決策級,採用dsmt融合理論中的pcr5公式實現多特徵融合,可以在有效的提高算法的魯棒性的基於elm與dsmt的飛機姿態識別方法。
技術方案:為解決上述技術問題,本發明提供一種基於elm與dsmt的飛機姿態識別方法,具體步驟如下:
第一步:對於飛機圖像進行去噪、灰度化和二值化預處理;
第二步:對經過預處理的飛機圖像提取二值化圖像的sift特徵描述子和飛機輪廓特徵;
第三步:對sift特徵描述子採用經典的bow模型進行描述並最終得到bowsift向量;
第四步:對第二步中得出的飛機輪廓特徵進行處理得到飛機目標輪廓局部奇異值向量;
第五步:根據bowsift向量,構建slfns網絡,採用實時性好的elm算法訓練slfns網絡,得到訓練好的slfns1;對於輪廓局部奇異值向量,構建slfns,然後採用實時性好的elm算法訓練slfns網絡,得到訓練好的slfns2;
第六步:將兩個訓練好的slfns1和slfns1作為算法的分類器,採用dsmt融合理論中的pcr5公式,實現多特徵的決策級融合,得到最終的識別結果。
進一步的,所述第二步中對sift特徵進行提取的具體步驟如下:
2.1:sift特徵點檢測
i(x,y)表示一幅圖像,σ是尺度空間因子,則其尺度空間l(x,y,σ)定義為:
l(x,y,σ)=g(x,y,σ)*i(x,y)
其中g(x,y,σ)為高斯核函數,二維高斯核函數定義為:
lowe用計算簡單、運算速度快的dog算子替代log算子,dog算子計算公式為:
d(x,y,σ)=l(x,y,kσ)-l(x,y,σ)
其中,k為相鄰兩個高斯尺度空間的比例因子。
通過dog算子構建圖像差分金字塔後,對每個採樣點與同尺度的8個鄰點以及上下兩個尺度的9個鄰點共計26個點進行比較,如果該採樣點是最大值或者最小值,則認為其是圖像在該尺度下的一個特徵點,然後對篩選出來的特徵點中的不穩定的邊界點進行剔除;
2.2:sift特徵點描述:
關鍵點檢測完後,利用關鍵點鄰域像素的梯度方向分布特性為每個關鍵點確定主方向和輔助方向,關鍵點(x,y)處的梯度幅值m(x,y)和方向θ(x,y)計算公式為:
利用直方圖統計關鍵點鄰域內方向分布,將0~360度的角度範圍分為36個柱,每柱10度,直方圖的峰值方向為關鍵點的主方向,將大於主方向峰值80%的方向作為該關鍵點處的輔助方向;
將每個關鍵點的鄰域點分配到4×4的子區域中,計算影響子區域的採樣點的梯度方向和幅值,將每個子區域上計算得到的梯度分配到8個方向上,利用直方圖統計每個方向的鄰域點對關鍵點的貢獻;對於每個關鍵點,形成了一個4×4×8=128維的特徵向量,該向量為每個特徵點的特徵描述子,最後對特徵描述子進行歸一化處理。
進一步的,所述第二步中提取飛機輪廓特徵的具體步驟如下:首先提取出飛機圖像的輪廓,同時計算圖像的質心,然後選定固定起始點,從起始點將整條輪廓進行n等分,採樣點記為[p1,p2,…,pn],計算每個採樣點到質心的距離,並進行歸一化,得到歸一化距離向量[d1,d2,…,dn]。
進一步的,所述第三步中對sift特徵採用經典的bow模型進行描述並最終得到bowsift向量的具體步驟如下:
3.1:提取訓練樣本庫中所有圖像的sift特徵描述子;
3.2:使用kmeans聚類算法,將所有sift特徵描述子聚為k類,生成k個視覺單詞;
3.3:計算樣本中每個sift特徵描述子與k個視覺單詞的歐氏距離,通過歐式距離最小的原則統計所有sift特徵描述子,然後得到k維向量,即為樣本的bowsift向量。
進一步的,所述第四步中對輪廓特徵進行處理得到輪廓局部奇異值的具體步驟如下:對於得到的歸一化距離向量[d1,d2,…,dn],借鑑數位訊號處理中的採樣思想,利用一個長度為w的採樣窗口對歸一化距離向量進行採樣,兩個採樣窗口的重疊部分的長度為m,可以得l個採樣後維度為w的距離向量,將這l個w維的歸一化距離向量構造出l個w×w的循環矩陣,分別計算奇異值,最終按順序可以組合為一個l×w的輪廓局部奇異值向量,完成圖像輪廓局部奇異值的表示。
與現有技術相比,本發明的優點在於:
本發明將對噪聲有不錯穩定性的sift特徵引入飛機姿態識別方法中,可以提高算法的識別準確率,同時在發生外界幹擾如光照、遮擋等情況下,算法也具有一定的準確率;由於elm算法相比於基於梯度法的訓練算法有收斂速度快、不會陷入局部最優解等優點,將elm算法訓練的slfns作為算法的分類器,可以在提升算法識別率的同時,大大降低算法的訓練時間開銷。
附圖說明
圖1為本發明的總體流程圖;
圖2為具體實施例中飛機7個姿態說明圖;
圖3為具體實施例中sift特徵128維向量生成過程圖;
圖4為具體實施例中飛機目標輪廓離散採樣圖;
圖5為具體實施例中物體的bow模型描述過程圖;
圖6為具體實施例中基於bow模型的物體識別過程圖;
圖7為具體實施例中slfns網絡結構圖;
圖8為具體實施例中經典dsmt組合規則在μf(θ)的描述圖。
具體實施方式
下面結合附圖和具體實施方式,進一步闡明本發明。
如圖1所示一種基於elm與dsmt的飛機姿態識別方法,首先,對於待識別的飛機姿態圖像,提取具備平移、旋轉、縮放不變性的sift特徵與輪廓局部奇異值特徵,可以有效解決單一特徵提供的目標信息有限而造成算法魯棒性差這一問題;然後,採用學習速度很快的elm算法訓練泛化能力強的slfns,將訓練好的slfns作為算法的分類器;最終,採用dsmt融合理論中的pcr5公式,實現多特徵的決策級融合。下面對本發明加以具體說明。
1、圖像特徵提取
如圖2所示,將飛機飛行的360度姿態分為具有代表性的7類。飛機在飛行過程中姿態多變,同時由於外界環境的影響,容易造成遮擋、縮放的發生,這就要求提取的特徵在飛機圖像發生平移、旋轉、縮放時,具備不變性。對於特定物體識別,局部特徵相比於全局特徵有更好的魯棒性,因為全局特徵易受外界噪聲如光照、遮擋等因素的影響。本發明使用了在目標跟蹤與識別方法中應用廣泛的sift特徵,同時提取了輪廓局部奇異值特徵,以這兩種特徵來描述飛機目標。
1.1sift特徵提取
應用於飛機姿態識別方法中的sift特徵提取可以分為兩個步驟
1.1.1sift特徵點檢測
設i(x,y)表示一幅圖像,σ是尺度空間因子,則其尺度空間l(x,y,σ)定義為:
l(x,y,σ)=g(x,y,σ)*i(x,y)
其中g(x,y,σ)為高斯核函數,二維高斯核函數定義為:
lowe用計算簡單、運算速度快的dog算子替代log算子,dog算子計算公式為:
d(x,y,σ)=l(x,y,kσ)-l(x,y,σ)
其中,k為相鄰兩個高斯尺度空間的比例因子。
通過dog算子構建圖像差分金字塔後,通過比較每個採樣點與同尺度的8個鄰點以及上下兩個尺度的9個鄰點共計26個點進行比較,如果此採樣點是最大值或者最小值,則認為其是圖像在該尺度下的一個特徵點,之後還需要對篩選出來的特徵點進行剔除一些不穩定的邊界點。
1.1.2sift特徵點描述
關鍵點檢測完後,為了讓算子具備旋轉不變形,需要為每個特徵點計算一個方向,然後利用關鍵點鄰域像素的梯度方向分布特性為每個關鍵點確定主方向和輔助方向。關鍵點(x,y)處的梯度幅值m(x,y)和方向θ(x,y)計算公式為:
利用直方圖統計關鍵點鄰域內方向分布,可以將0~360度的角度範圍分為36個柱,每柱10度,直方圖的峰值方向為關鍵點的主方向,為增加魯棒性,將大於主方向峰值80%的方向作為該關鍵點處的輔助方向。
接下來就是通過一組向量將每個關鍵點描述出來,將每個關鍵點的鄰域點分配到4×4的子區域中,計算影響子區域的採樣點的梯度方向和幅值,將每個子區域上計算得到的梯度分配到8個方向上,利用直方圖統計每個方向的鄰域點對關鍵點的貢獻。對於每個關鍵點,形成了一個4×4×8=128維的特徵向量,如圖3所示。最後還需要對向量進行歸一化處理,以降低光照對特徵描述子的影響。
1.2輪廓奇異值
對於飛機的二值化圖像,首先提取出輪廓,同時計算圖像的質心,選定固定起始點,從起始點將整條輪廓進行n等分,採樣點記為[p1,p2,…,pn],計算每個採樣點到質心的距離,並進行歸一化,得到歸一化距離向量[d1,d2,…,dn],飛機輪廓的離散採樣過程如圖4所示。
2圖像特徵描述
2.1sift特徵表示
每張圖像經過sift特徵點提取與表示後,均由多個1×128的sift特徵描述子表示,不同圖像的特徵點個數可能不同,難以直接採用分類器進行分類。可以採用經典的bow模型進行描述,可以有效的解決這個問題。基於bow模型的物體描述如圖5所示,具體步驟如下
2.1.1:首先提取訓練樣本庫中所有圖像的sift特徵描述子;
2.1.2:接著使用kmeans聚類算法,將所有sift特徵描述子聚為k類,生成k個視覺單詞;
2.1.3:最後計算樣本中每個sift特徵描述子與k個視覺單詞的歐氏距離,通過歐式距離最小的原則統計所有sift特徵描述子,如此可以得到k維向量,即為樣本的bowsift向量。
基於bow的物體識別過程如圖6所示。
2.2輪廓局部奇異值
對於得到的歸一化距離向量[d1,d2,…,dn],借鑑數位訊號處理中的採樣思想,利用一個長度為w的採樣窗口對歸一化距離向量進行採樣,兩個採樣窗口的重疊部分的長度為m,可以得l個採樣後維度為w的距離向量,將這l個w維的歸一化距離向量構造出l個w×w的循環矩陣,分別計算奇異值,最終按順序可以組合為一個l×w的輪廓局部奇異值向量,完成圖像輪廓局部奇異值的表示。
3分類器訓練環節
單隱層前饋神經網絡(singlehidden-layerfeedforwardneuralnetworks)具有較強的學習能力,能夠逼近複雜非線性函數,能夠解決傳統方法無法解決的問題等優點,其網絡結構如圖7所示。訓練slfns通常採用的算法是基於梯度下降法,這類學習算法普遍具有收斂速度慢、易陷入局部最優點等缺點,黃廣斌等(huanggb,zhuqy,siewck.extremelearningmachine:anewlearningschemeoffeedforwardneuralnetworks[c].in:proccedingsoftheijcnn.2004,2:985-990)提出極限學習機算法,可以改善單隱層神經網絡的學習算法以及泛化過程存在的問題。
設h(x)為隱層輸出矩陣,β為輸出權重,t為給定的監督矩陣,slfns一般模型可以表示為:
hβ=t
其中
極限學習機算法可以總結為如下流程:
給定訓練集xi∈rn,tj∈rm,激活函數g,隱層節點個數為
(1)隨機生成輸入權重wi和隱層偏置
(2)計算隱層輸出矩陣h;
(3)計算輸出權重β:
β=h+t
h+是隱藏層輸出矩陣h的moore-penrose增廣逆,簡稱為偽逆。
當β計算完成後,一個單隱層反饋神經網絡的訓練環節就結束了。對於一個測試樣本x,它的標籤可以通過訓練好的單隱層反饋神經網絡推測:
fl(x)=h(x)β
其中h(x)是神經網絡隱層關於此樣本的響應,初始化參數後,h(x)即保持不變。
4多特徵融合識別環節
實際中進行飛機目標識別時,由於飛機種類繁多,可能會出現同類飛機差距很大,不同類飛機在某個姿態下很相似等情況,飛機目標識別在本質上具有高衝突和模糊性的特點,dsmt證據融合理論針對這一特性,為基於決策級融合的飛機目標識別提供了一個非常好的思路。經典dsmt組合規則在μf(θ)的描述如圖8所示。本文針對基於決策級融合的飛機目標識別,在實驗過程中做了一定的簡化,在超冪集dθ的基礎上,採用完全排他性的約束條件下的dsmt模型,即僅θ1,θ2,…θn具有信度賦值。本文中只有輪廓局部奇異值和sift兩種特徵,採用pcr5組合規實現兩特徵對應的決策級融合。
以上所述僅為本發明的實施例子而已,並不用於限制本發明。凡在本發明的原則之內,所作的等同替換,均應包含在本發明的保護範圍之內。本發明未作詳細闡述的內容屬於本專業領域技術人員公知的已有技術。