新四季網

典型資源要素提取方法及裝置與流程

2023-05-14 09:55:36


本發明涉及遙感數據產品處理
技術領域:
,具體涉及一種典型資源要素提取方法及裝置。
背景技術:
:土地覆蓋是指地球表面的植被覆蓋物和人工覆蓋物的總稱,是自然植被與自然營造體和人工建造所覆蓋的地表諸要素的綜合反映。土地覆蓋是人類認識自然、掌握自然規律必備的信息,也是各種資源管理和地理信息服務所需要的最基本數據。因此,土地覆蓋信息的獲取、分析和更新顯得極其重要。遙感影像數據以其宏觀性,實時性的特點,一直以來都是土地覆蓋檢測的重要手段。目前基於遙感數據的土地覆蓋分類方法一般分為兩種,一種是基於遙感原始圖像作為目視解譯的傳統方法;另一種則是利用機器學習人工智慧的思想基於遙感的數據產品(包括1級產品和更高級產品)的智能分類。為了獲取一級土地分類產品,目前一般是用遙感數據的反射率產品數據或ndvi產品數據作為分類依據的分類模型。而隨著遙感數據的高級產品的出現,特別是多種陸表參量產品(代表性的glass產品)的出現,現有的土地覆蓋分類技術方案已經無法滿足土地覆蓋分類的精度要求。技術實現要素:針對現有的土地覆蓋分類技術方案已經無法滿足土地覆蓋分類的精度要求的缺陷,本發明提出如下技術方案:本發明一方面提供了一種典型資源要素提取方法,包括:選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據;將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據;根據所述關係式數據訓練決策樹模型;根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。可選地,所述根據所述關係式數據訓練決策樹模型之前,所述方法還包括:對所述關係式數據進行清洗,以保留用於土地分類的有效值。可選地,所述對所述關係式數據進行清洗,以保留用於土地分類的有效值,包括:將所述關係式數據中的無效數據及水體數據刪除,並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。可選地,述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。可選地,所述根據所述關係式數據訓練決策樹模型,包括:將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」,並將所述土地分類數據作為「屬性-值」的「值」。另一方面,本發明還提供了一種典型資源要素提取裝置,包括:數據選取單元,用於選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據;數據轉化單元,用於將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據;模型訓練單元,用於根據所述關係式數據訓練決策樹模型;土地分類單元,用於根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。可選地,所述裝置還包括:數據清洗單元,用於對所述關係式數據進行清洗,以保留用於土地分類的有效值。可選地,所述數據清洗單元具體用於將所述關係式數據中的無效數據及水體數據刪除,並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。可選地,所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。可選地,所述模型訓練單元具體用於將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」,並將所述土地分類數據作為「屬性-值」的「值」。本發明的典型資源要素提取方法及裝置,通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據,並將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據,再根據所述關係式數據訓練決策樹模型,進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取,可以顯著提高遙感數據的土地覆蓋分類的精度,並提高分類算法的合理性和可信度。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本發明一個實施例的典型資源要素提取方法的流程示意圖;圖2是本發明一個實施例的中國區域gmmis-ndvi遙感數據可視化結果示意圖;圖3是本發明一個實施例的中國區域glass-lai遙感數據可視化結果示意圖;圖4是本發明一個實施例的中國區域glass-fapar遙感數據可視化結果示意圖;圖5是本發明一個實施例的中國區域glass-albedo遙感數據可視化結果示意圖;圖6是本發明一個實施例的將遙感數據以象元為主鍵轉為關係式資料庫用於建模訓練和分析的結果示意圖;圖7是本發明一個實施例的中國區域modis-mcd12cm土地覆蓋分類數據可視化結果示意圖;圖8是本發明一個實施例的清洗後的數據作散點圖;圖9是本發明一個實施例的僅用ndvi的模型的訓練結果;圖10是本發明一個實施例的使用四種陸表特徵參量數據的模型的訓練結果;圖11是本發明一個實施例的分類精度對比圖;圖12為現有技術中一個典型的決策樹的結構示意圖;圖13為本發明一個實施例的決策樹的結構示意圖;圖14為本發明一個實施例的典型資源要素提取裝置的結構示意圖。具體實施方式為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。圖1為本發明一個實施例的典型資源要素提取方法的流程示意圖;如圖1所示,該方法包括:s1:選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據;s2:將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據;其中,所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。s3:根據所述關係式數據訓練決策樹模型;具體來說,所述根據所述關係式數據訓練決策樹模型之前,所述方法還可以包括:s31:對所述關係式數據進行清洗,以保留用於土地分類的有效值。進一步地,作為本實施例的優選,步驟s31中所述對所述關係式數據進行清洗,以保留用於土地分類的有效值,可以包括:將所述關係式數據中的無效數據及水體數據刪除,並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。作為本實施例的優選,所述根據所述關係式數據訓練決策樹模型,還可以包括:將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」,並將所述土地分類數據作為「屬性-值」的「值」。s4:根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。本實施例的典型資源要素提取方法,通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據,並將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據,再根據所述關係式數據訓練決策樹模型,進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取,可以顯著提高遙感數據的土地覆蓋分類的精度,並提高分類算法的合理性和可信度。本發明另一實施例的典型資源要素提取方法包括以下步驟:a1:數據選取。本實施例以中國區域的遙感高級產品數據為例,其中數據的時間解析度為月數據,空間解析度為0.05°(gimms-ndvi本身是0.08°重採樣到相同解析度),都選用2010年8月份的數據。如圖2~7所示,陸表特徵參量產品包括glass-lai、glass-fapar、glass-albedo、gimms-ndvi,土地分類樣本選用modis-mcd12cm產品,使用2000年到2010年的不變象元保證結果可靠性。a2:數據預處理。將hdf等格式的遙感產品數據使用rgdal讀入計算機內存中並將柵格數據提取出成矩陣。按照相同時空位置將5種數據轉化在同一個dataframe數據類型中,每一行代表同一時空位置。包括5個欄位,分別是5種數據的值。a3:數據清洗。將無效數據及水體數據刪除不參與模型訓練,將mcd12cm種15種類型通過相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種大類型。一方面排除中國有些土地覆蓋類型面積分布相差較大的影響,另一方面使得大類土地類型的特徵更鮮明,便於機器學習模型的訓練。a4:構建訓練樣本。對數據進行分層抽樣,把清洗後221370條數據分層抽取70%數據作為訓練集,剩下30%作為驗證數據集。a5:觀察數據特點。分別以兩種依據數據為x,y軸作散點圖,不同土地類型的散點用不同符號標識表示,參見圖8。a6:模型準備。加載r語言的決策樹模型rpart包。因為傳統的機器學習模型常用ndvi作為依據數據進行模型訓練。所以單獨以ndvi作為訓練輸入數據進行模型訓練,並進行訓練集預測,作為實驗參照,預測結果如圖9所示,預測精度為61.4%。以四種陸表特徵參量數據作為訓練輸入數據進行模型訓練,並進行訓練集預測,預測結果如圖10、圖11所示,預測精度為82.3%。實驗結果表明,通過本技術方案,選取陸表特徵參量產品的組合用於遙感數據的土地覆蓋分類,分類驗證精度顯著提高。具體來說,決策樹可以看作一個樹狀預測模型,它是由節點和有向邊組成的層次結構。樹中包含3中節點:根節點、內部節點、葉子節點。決策樹只有一個根節點,是全體訓練數據的集合。樹中每個內部節點都是一個分裂問題:指定了對實例的某個屬性的測試,它將到達該節點的樣本按照某個特定的屬性進行分割,並且該節點的每一個後繼分支對應於該屬性的一個可能值。每個葉子節點是帶有分類標籤的數據集合即為實例所屬的分類。決策樹算法很多,例如:id3、c4.5、cart等。這些算法均採用自上而下的貪婪算法,每個內部節點選擇分類效果最好的屬性來分裂節點,可以分成兩個或者更多的子節點,繼續此過程直到這棵決策樹能夠將全部的訓練數據準確的分類,或所有屬性都被用到為止。該算法的簡化版本是在使用了全部樣本的假設來構建決策樹的。具體步驟如下:(1):假設t為訓練樣本集。(2):從屬性集合attributes中選擇一個最能區別t中樣本的屬性。(3):創建一個樹節點,它的值為所選擇的屬性。創建此節點的子節點,每個子鏈代表所選屬性的一個唯一值(唯一區間),使用子鏈的值進一步將樣本細分為子類。對於每一個分支繼續重複(2)(3)的過程,直到滿足以下兩個條件之一:(a):所有屬性已經被這條路徑包括;(b):與這個節點關聯的所有訓練樣本都具有相同的目標屬性(熵為0)。下面以一具體的實施例來說明決策樹概念,但不限定本發明的保護範圍。圖12為現有技術中一個典型的決策樹的結構示意圖;如圖12所示,該決策樹表示概念buys_computer,即它目的是預測顧客是否可能購買計算機。內部節點用矩形表示,葉子節點用橢圓表示。為了對未知的樣本分類,樣本的屬性值在決策樹上測試。我們用一些訓練樣本構造了圖2中的決策樹,每個內部節點表示一個屬性上的測試,每個葉子節點代表一個分類(buys_computer=yes,buys_computer=no)。在此基礎上,決策樹的適用情況通常決策樹學習最適合具有以下特徵的問題:(1):實例是由「屬性-值」對表示的;(2):目標函數具有離散的輸出值,例如上面的yes和no;(3):實例的所有屬性都是離散值。如果是連續值或者離散值種類太多,可以把它分為不同的區間,例如上面的age分為了3個區間而不是每個獨立的值為一個判斷分支。三:決策屬性的選擇建樹算法中屬性的選擇非常重要。屬性選擇方法很多種,例如信息增益(informationgain)、信息增益比(informationgainratio)、gini指標(giniindex)等方法。id3算法依據的是信息增益來選擇屬性,每次計算所有剩餘候選屬性的信息增益,然後根據信息增益最大的一個作為此次的分類屬性。信息增益是用熵作為尺度,是衡量屬性對訓練數據分類能力的標準。本實施例的訓練樣本集如下表一所示,其中共有14條數據,屬性有:age、income、student、credit_rating,目標屬性是:buys_computer表一訓練樣本集ageincomestudentcredit_ratingbuys_computer<=30highnofairno<=30highnoexcellentno31...40highnofairyes>40mediumnofairyes>40lowyesfairyes>40lowyesexcellentno31...40lowyesexcellentyes<=30mediumnofairno<=30lowyesfairyes>40mediumyesfairyes<=30mediumyesexcellentyes31...40mediumnoexcellentyes31...40highyesfairyes>40mediumnoexcellentno下面具體說明某具體屬性的信息增益的計算過程,對於某個具體的屬性a,它的信息增益計算表達式是:gain(a)=i(s1,s2,...,sm)-e(a)(1)1)i(s1,s2,...,sm)是對給定樣本分類所需的期望信息,計算過程如下:設s是s個訓練樣本的集合,s=14。假定類標號屬性有m個不同值,定義m個不同類ci(i=1,2,...m),設si是類ci中的樣本數,實例中m=2,其中c1=yesc2=nos1=9s2=5。則:其中pi是任意樣本屬於ci的概率,pi=si/s.公式中的對數函數以2為底,因為信息用二進位編碼。在本實施例中,2)e(a)是根據a劃分子集的熵或期望值,計算過程如下:設屬性a有v個不同的值{a1,...av},對應實例中的數據,例如屬性age,分為3個不同的值:a1為40;屬性a把訓練樣本集合s劃分為v個子集{s1,...sv};其中sj包含訓練樣本集s中在屬性a上有值aj的樣本。sij是子集sj中屬於類ci的樣本數。其中充當第j個子集的權值,等於子集(即a值為aj)的樣本總數除以s中的樣本總數即sj/s。對於給定的子集sj有其中,pij=sij/sj,是sj中的樣本屬於ci的概率。具體地,圖13示出了本發明一個實施例的決策樹的結構。圖14為本發明一個實施例的典型資源要素提取裝置的結構示意圖。如圖14所示,該裝置,包括:數據選取單元10,用於選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據;數據轉化單元20,用於將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據;模型訓練單元30,用於根據所述關係式數據訓練決策樹模型;土地分類單元40,用於根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。進一步地,作為上述裝置實施例的優選,所述裝置還包括:數據清洗單元50,用於對所述關係式數據進行清洗,以保留用於土地分類的有效值。進一步地,作為上述裝置實施例的優選,所述數據清洗單元50具體用於將所述關係式數據中的無效數據及水體數據刪除,並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。進一步地,作為上述裝置實施例的優選,所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。進一步地,作為上述裝置實施例的優選,所述模型訓練單元30具體用於將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」,並將所述土地分類數據作為「屬性-值」的「值」。本實施例所述的裝置可以用於執行上述方法實施例,其原理和技術效果類似,此處不再贅述。需要說明的是,對於裝置實施例而言,由於其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。本發明的典型資源要素提取方法及裝置,通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據,並將所述樣本數據與所述土地分類數據進行關聯,並轉化為關係式數據,再根據所述關係式數據訓練決策樹模型,進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取,可以顯著提高遙感數據的土地覆蓋分類的精度,並提高分類算法的合理性和可信度。以上實施例僅用於說明本發明的技術方案,而非對其限制;儘管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特徵進行等同替換;而這些修改或替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。當前第1頁12

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀