基於近鄰邊界最大的半監督高光譜數據降維方法
2023-08-05 08:29:41
基於近鄰邊界最大的半監督高光譜數據降維方法
【專利摘要】本發明公開了一種基於近鄰邊界最大的半監督高光譜數據降維方法,主要解決現有技術需要大量監督信息且降維後數據判別性差的問題。其步驟為:1.將遙感資料庫樣本集劃分為訓練數據集和標記樣本集;2.生成標記樣本集的散度矩陣;3.生成訓練數據集的空間近鄰矩陣;4.生成訓練數據集的相似度矩陣;5.根據散度矩陣,通過最大邊界準則構造半監督判別項;6.構造半監督正則項;7.通過最小化判別項和正則項之和獲取最優投影矩陣,以實現降維。本發明採用低秩表示的流形正則和空間一致性的空間正則來構造正則項,採用空譜聯合的正則策略,使得投影矩陣更加魯棒、完備,提高了降維後數據的判別的性能,可用於高光譜數據的分類識別。
【專利說明】基於近鄰邊界最大的半監督高光譜數據降維方法
【技術領域】
[0001]本發明屬於圖像處理【技術領域】,更進一步涉及一種數據降維方法,可用於遙感影像數據的降維與分類。
【背景技術】
[0002]高光譜遙感技術現已經成功應用於國防安全,環境監測,資源勘查等領域,是現代高科技技術之一,但是,高光譜遙感影像的數據處理技術的發展則相對滯後於影像成像設備等硬體方面的發展,這使得高光譜遙感技術進一步的推廣應用受到制約。分類是對高光譜遙感影像豐富的地物信息進行分析和對遙感信息解譯的重要途徑,因此,對高光譜遙感數據地物分類的研究有著十分重要的實用價值。
[0003]高光譜遙感影像包含豐富的地物空間、輻射和光譜信息,具有較高光譜解析度和空間解析度等優點,並且,將決定地物性質的光譜和決定地物空間與幾何特性的圖像有機的結合在一起,有利於進行地物的分類和目標識別。
[0004]高光譜遙感數據提供了豐富的地物信息,但是,在帶來豐富信息的同時,其海量的高維數據也給傳統的分類算法提出了很大的挑戰。一方面,對於高光譜遙感影像的分類算法,有監督分類算法需要較大規模的標記樣本,否則分類精度很低,再者高維的海量數據為數據訓練學習帶來巨大的時間複雜度和計算複雜度,因此,在減少運算量的同時提高分類精度,已成為高光譜遙感領域的研究熱點。另一方面,高光譜數據中相鄰波段之間存在高度的冗餘性,因此,在對高光譜遙感數據進行利用之前對數據進行預處理,減少冗餘信息,不僅可以降低數據的維數,為後續的分類處理減少計算量,並且還可以獲取更加魯棒、精準的分類結果。
[0005]現有的經典的降維方法主要有以下三類:
[0006](一)無監督降維方法:如主成分分析PCA,是通過最大方差理論,將數據投影到最大方差的方向。這種方法由於沒有監督信息,降維後的數據不具有很好的判別性能。
[0007]( 二)監督降維方法:如線性判別分析LDA,通過最大化類間散度矩陣和最小化類內散度矩陣的比值而獲得投影矩陣,LDA比PCA具有較好的判別性能,但LDA降維後的最高維數為c-1,且不適合非高斯分布數據的降維,使得普適性變差,其中c為樣本類別數。
[0008](三)半監督降維方法:通過大量無標記樣本來學習數據的結構,是無監督學習的重點。現有的半監督方法主要集中在數據的流形正則,沒有考慮到數據的全局結構,且忽略了影像數據的空間信息,使得影像數據的空間結構信息不能有效地利用。
【發明內容】
[0009]本發明的目的在於針對上述已有技術的不足,提出一種基於近鄰邊界最大的半監督降維方法,利用少量的監督信息,實現對高光譜遙感數據的高效降維。
[0010]實現本發明目的的技術方案是:通過低秩表示正則獲取數據的結構和空間一致性約束獲取影像的空間結構信息,進而通過特徵值分解獲得最優投影矩陣,實現數據的降維。具體步驟包括如下:
[0011](I)將遙感影像資料庫樣本集劃分為訓練數據集X和標記樣本集Y ;
[0012](2)生成標記樣本集的散度矩陣:
[0013]2a)通過相似散度矩陣公式生成標記樣本集的相似散度矩陣:
【權利要求】
1.一種基於近鄰邊界最大的半監督高光譜數據降維方法,包括以下步驟 (1)將遙感影像資料庫樣本集劃分為訓練數據集X和標記樣本集Y; (2)生成標記樣本集的散度矩陣: 2a)通過相似散度矩陣公式生成標記樣本集的相似散度矩陣:
2.根據權利要求1所述的基於近鄰邊界最大的半監督高光譜數據的降維方法,其中,步驟(1)所述的將遙感影像資料庫樣本集劃分為訓練數據集X和標記樣本集Y,按如下步驟進行: Ia)將待處理遙感數據集中,隨機選擇40%的數據構成訓練樣本數據集X e Rdxm,剩餘的60%數據作為測試樣本數據集T e Rdxt,其中,D表示訓練集樣本和測試集樣本的維數,Rn表示η維實數空間,M表示訓練集樣本的總數,T表示測試集樣本的總數; Ib)在訓練數據集X中,每類隨機選取k個樣本構成有監督信息的標記樣本集Y e Rdxq,其中Q = cXk,c為類別數; Ic)在標記樣本集Y中,對每個標記樣本yi通過歐式距離計算其同質近鄰集J \和異質近鄰集I"、
【文檔編號】G06K9/62GK104008394SQ201410213709
【公開日】2014年8月27日 申請日期:2014年5月20日 優先權日:2014年5月20日
【發明者】楊淑媛, 焦李成, 馮志璽, 劉芳, 緱水平, 侯彪, 王爽, 楊麗霞, 鄧曉政, 任宇 申請人:西安電子科技大學