典型資源要素提取方法及裝置與流程

2023-05-14 09:55:36 1

本發明涉及遙感數據產品處理
技術領域：
，具體涉及一種典型資源要素提取方法及裝置。
背景技術：
：土地覆蓋是指地球表面的植被覆蓋物和人工覆蓋物的總稱，是自然植被與自然營造體和人工建造所覆蓋的地表諸要素的綜合反映。土地覆蓋是人類認識自然、掌握自然規律必備的信息，也是各種資源管理和地理信息服務所需要的最基本數據。因此，土地覆蓋信息的獲取、分析和更新顯得極其重要。遙感影像數據以其宏觀性，實時性的特點，一直以來都是土地覆蓋檢測的重要手段。目前基於遙感數據的土地覆蓋分類方法一般分為兩種，一種是基於遙感原始圖像作為目視解譯的傳統方法；另一種則是利用機器學習人工智慧的思想基於遙感的數據產品(包括1級產品和更高級產品)的智能分類。為了獲取一級土地分類產品，目前一般是用遙感數據的反射率產品數據或ndvi產品數據作為分類依據的分類模型。而隨著遙感數據的高級產品的出現，特別是多種陸表參量產品(代表性的glass產品)的出現，現有的土地覆蓋分類技術方案已經無法滿足土地覆蓋分類的精度要求。技術實現要素：針對現有的土地覆蓋分類技術方案已經無法滿足土地覆蓋分類的精度要求的缺陷，本發明提出如下技術方案：本發明一方面提供了一種典型資源要素提取方法，包括：選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據；將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據；根據所述關係式數據訓練決策樹模型；根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。可選地，所述根據所述關係式數據訓練決策樹模型之前，所述方法還包括：對所述關係式數據進行清洗，以保留用於土地分類的有效值。可選地，所述對所述關係式數據進行清洗，以保留用於土地分類的有效值，包括：將所述關係式數據中的無效數據及水體數據刪除，並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。可選地，述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。可選地，所述根據所述關係式數據訓練決策樹模型，包括：將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」，並將所述土地分類數據作為「屬性-值」的「值」。另一方面，本發明還提供了一種典型資源要素提取裝置，包括：數據選取單元，用於選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據；數據轉化單元，用於將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據；模型訓練單元，用於根據所述關係式數據訓練決策樹模型；土地分類單元，用於根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。可選地，所述裝置還包括：數據清洗單元，用於對所述關係式數據進行清洗，以保留用於土地分類的有效值。可選地，所述數據清洗單元具體用於將所述關係式數據中的無效數據及水體數據刪除，並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。可選地，所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。可選地，所述模型訓練單元具體用於將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」，並將所述土地分類數據作為「屬性-值」的「值」。本發明的典型資源要素提取方法及裝置，通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據，並將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據，再根據所述關係式數據訓練決策樹模型，進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取，可以顯著提高遙感數據的土地覆蓋分類的精度，並提高分類算法的合理性和可信度。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案，下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖是本發明的一些實施例，對於本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。圖1為本發明一個實施例的典型資源要素提取方法的流程示意圖；圖2是本發明一個實施例的中國區域gmmis-ndvi遙感數據可視化結果示意圖；圖3是本發明一個實施例的中國區域glass-lai遙感數據可視化結果示意圖；圖4是本發明一個實施例的中國區域glass-fapar遙感數據可視化結果示意圖；圖5是本發明一個實施例的中國區域glass-albedo遙感數據可視化結果示意圖；圖6是本發明一個實施例的將遙感數據以象元為主鍵轉為關係式資料庫用於建模訓練和分析的結果示意圖；圖7是本發明一個實施例的中國區域modis-mcd12cm土地覆蓋分類數據可視化結果示意圖；圖8是本發明一個實施例的清洗後的數據作散點圖；圖9是本發明一個實施例的僅用ndvi的模型的訓練結果；圖10是本發明一個實施例的使用四種陸表特徵參量數據的模型的訓練結果；圖11是本發明一個實施例的分類精度對比圖；圖12為現有技術中一個典型的決策樹的結構示意圖；圖13為本發明一個實施例的決策樹的結構示意圖；圖14為本發明一個實施例的典型資源要素提取裝置的結構示意圖。具體實施方式為使本發明實施例的目的、技術方案和優點更加清楚，下面將結合本發明實施例中的附圖，對本發明實施例中的技術方案進行清楚地描述，顯然，所描述的實施例是本發明一部分實施例，而不是全部的實施例。基於本發明中的實施例，本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例，都屬於本發明保護的範圍。圖1為本發明一個實施例的典型資源要素提取方法的流程示意圖；如圖1所示，該方法包括：s1：選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據；s2：將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據；其中，所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。s3：根據所述關係式數據訓練決策樹模型；具體來說，所述根據所述關係式數據訓練決策樹模型之前，所述方法還可以包括：s31：對所述關係式數據進行清洗，以保留用於土地分類的有效值。進一步地，作為本實施例的優選，步驟s31中所述對所述關係式數據進行清洗，以保留用於土地分類的有效值，可以包括：將所述關係式數據中的無效數據及水體數據刪除，並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。作為本實施例的優選，所述根據所述關係式數據訓練決策樹模型，還可以包括：將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」，並將所述土地分類數據作為「屬性-值」的「值」。s4：根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。本實施例的典型資源要素提取方法，通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據，並將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據，再根據所述關係式數據訓練決策樹模型，進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取，可以顯著提高遙感數據的土地覆蓋分類的精度，並提高分類算法的合理性和可信度。本發明另一實施例的典型資源要素提取方法包括以下步驟：a1：數據選取。本實施例以中國區域的遙感高級產品數據為例，其中數據的時間解析度為月數據，空間解析度為0.05°(gimms-ndvi本身是0.08°重採樣到相同解析度)，都選用2010年8月份的數據。如圖2～7所示，陸表特徵參量產品包括glass-lai、glass-fapar、glass-albedo、gimms-ndvi，土地分類樣本選用modis-mcd12cm產品，使用2000年到2010年的不變象元保證結果可靠性。a2：數據預處理。將hdf等格式的遙感產品數據使用rgdal讀入計算機內存中並將柵格數據提取出成矩陣。按照相同時空位置將5種數據轉化在同一個dataframe數據類型中，每一行代表同一時空位置。包括5個欄位，分別是5種數據的值。a3：數據清洗。將無效數據及水體數據刪除不參與模型訓練，將mcd12cm種15種類型通過相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種大類型。一方面排除中國有些土地覆蓋類型面積分布相差較大的影響，另一方面使得大類土地類型的特徵更鮮明，便於機器學習模型的訓練。a4：構建訓練樣本。對數據進行分層抽樣，把清洗後221370條數據分層抽取70％數據作為訓練集，剩下30％作為驗證數據集。a5：觀察數據特點。分別以兩種依據數據為x，y軸作散點圖，不同土地類型的散點用不同符號標識表示，參見圖8。a6：模型準備。加載r語言的決策樹模型rpart包。因為傳統的機器學習模型常用ndvi作為依據數據進行模型訓練。所以單獨以ndvi作為訓練輸入數據進行模型訓練，並進行訓練集預測，作為實驗參照，預測結果如圖9所示，預測精度為61.4％。以四種陸表特徵參量數據作為訓練輸入數據進行模型訓練，並進行訓練集預測，預測結果如圖10、圖11所示，預測精度為82.3％。實驗結果表明，通過本技術方案，選取陸表特徵參量產品的組合用於遙感數據的土地覆蓋分類，分類驗證精度顯著提高。具體來說，決策樹可以看作一個樹狀預測模型，它是由節點和有向邊組成的層次結構。樹中包含3中節點：根節點、內部節點、葉子節點。決策樹只有一個根節點，是全體訓練數據的集合。樹中每個內部節點都是一個分裂問題：指定了對實例的某個屬性的測試，它將到達該節點的樣本按照某個特定的屬性進行分割，並且該節點的每一個後繼分支對應於該屬性的一個可能值。每個葉子節點是帶有分類標籤的數據集合即為實例所屬的分類。決策樹算法很多，例如：id3、c4.5、cart等。這些算法均採用自上而下的貪婪算法，每個內部節點選擇分類效果最好的屬性來分裂節點，可以分成兩個或者更多的子節點，繼續此過程直到這棵決策樹能夠將全部的訓練數據準確的分類，或所有屬性都被用到為止。該算法的簡化版本是在使用了全部樣本的假設來構建決策樹的。具體步驟如下：(1)：假設t為訓練樣本集。(2)：從屬性集合attributes中選擇一個最能區別t中樣本的屬性。(3)：創建一個樹節點，它的值為所選擇的屬性。創建此節點的子節點，每個子鏈代表所選屬性的一個唯一值(唯一區間)，使用子鏈的值進一步將樣本細分為子類。對於每一個分支繼續重複(2)(3)的過程，直到滿足以下兩個條件之一：(a)：所有屬性已經被這條路徑包括；(b)：與這個節點關聯的所有訓練樣本都具有相同的目標屬性(熵為0)。下面以一具體的實施例來說明決策樹概念，但不限定本發明的保護範圍。圖12為現有技術中一個典型的決策樹的結構示意圖；如圖12所示，該決策樹表示概念buys_computer，即它目的是預測顧客是否可能購買計算機。內部節點用矩形表示，葉子節點用橢圓表示。為了對未知的樣本分類，樣本的屬性值在決策樹上測試。我們用一些訓練樣本構造了圖2中的決策樹，每個內部節點表示一個屬性上的測試，每個葉子節點代表一個分類(buys_computer＝yes,buys_computer＝no)。在此基礎上，決策樹的適用情況通常決策樹學習最適合具有以下特徵的問題：(1)：實例是由「屬性-值」對表示的；(2)：目標函數具有離散的輸出值，例如上面的yes和no；(3)：實例的所有屬性都是離散值。如果是連續值或者離散值種類太多，可以把它分為不同的區間，例如上面的age分為了3個區間而不是每個獨立的值為一個判斷分支。三：決策屬性的選擇建樹算法中屬性的選擇非常重要。屬性選擇方法很多種，例如信息增益(informationgain)、信息增益比(informationgainratio)、gini指標(giniindex)等方法。id3算法依據的是信息增益來選擇屬性，每次計算所有剩餘候選屬性的信息增益，然後根據信息增益最大的一個作為此次的分類屬性。信息增益是用熵作為尺度，是衡量屬性對訓練數據分類能力的標準。本實施例的訓練樣本集如下表一所示，其中共有14條數據，屬性有：age、income、student、credit_rating，目標屬性是：buys_computer表一訓練樣本集ageincomestudentcredit_ratingbuys_computer＜＝30highnofairno＜＝30highnoexcellentno31...40highnofairyes＞40mediumnofairyes＞40lowyesfairyes＞40lowyesexcellentno31...40lowyesexcellentyes＜＝30mediumnofairno＜＝30lowyesfairyes＞40mediumyesfairyes＜＝30mediumyesexcellentyes31...40mediumnoexcellentyes31...40highyesfairyes＞40mediumnoexcellentno下面具體說明某具體屬性的信息增益的計算過程，對於某個具體的屬性a，它的信息增益計算表達式是：gain(a)＝i(s1，s2，...，sm)-e(a)(1)1)i(s1，s2,...，sm)是對給定樣本分類所需的期望信息，計算過程如下：設s是s個訓練樣本的集合，s＝14。假定類標號屬性有m個不同值，定義m個不同類ci(i＝1,2,...m)，設si是類ci中的樣本數，實例中m＝2,其中c1＝yesc2＝nos1＝9s2＝5。則：其中pi是任意樣本屬於ci的概率，pi＝si/s.公式中的對數函數以2為底，因為信息用二進位編碼。在本實施例中，2)e(a)是根據a劃分子集的熵或期望值，計算過程如下：設屬性a有v個不同的值{a1,...av},對應實例中的數據，例如屬性age，分為3個不同的值：a1為40；屬性a把訓練樣本集合s劃分為v個子集{s1,...sv}；其中sj包含訓練樣本集s中在屬性a上有值aj的樣本。sij是子集sj中屬於類ci的樣本數。其中充當第j個子集的權值，等於子集(即a值為aj)的樣本總數除以s中的樣本總數即sj/s。對於給定的子集sj有其中，pij＝sij/sj，是sj中的樣本屬於ci的概率。具體地，圖13示出了本發明一個實施例的決策樹的結構。圖14為本發明一個實施例的典型資源要素提取裝置的結構示意圖。如圖14所示，該裝置，包括：數據選取單元10，用於選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據；數據轉化單元20，用於將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據；模型訓練單元30，用於根據所述關係式數據訓練決策樹模型；土地分類單元40，用於根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取。進一步地，作為上述裝置實施例的優選，所述裝置還包括：數據清洗單元50，用於對所述關係式數據進行清洗，以保留用於土地分類的有效值。進一步地，作為上述裝置實施例的優選，所述數據清洗單元50具體用於將所述關係式數據中的無效數據及水體數據刪除，並將所述土地分類數據按照相似類型合併成植被、溼地、作物、建築用地、冰雪及裸地六種類型。進一步地，作為上述裝置實施例的優選，所述關係式數據對應的矩陣中的每一行觀測值表示相同時空位置的多種陸表特徵參量產品數據數值和土地分類結果。進一步地，作為上述裝置實施例的優選，所述模型訓練單元30具體用於將所述陸表特徵參量產品的樣本數據作為「屬性-值」中的「屬性」，並將所述土地分類數據作為「屬性-值」的「值」。本實施例所述的裝置可以用於執行上述方法實施例，其原理和技術效果類似，此處不再贅述。需要說明的是，對於裝置實施例而言，由於其與方法實施例基本相似，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。本發明的典型資源要素提取方法及裝置，通過選取相同時空位置的多種陸表特徵參量產品的樣本數據以及與所述樣本數據對應時空位置的土地分類數據，並將所述樣本數據與所述土地分類數據進行關聯，並轉化為關係式數據，再根據所述關係式數據訓練決策樹模型，進而根據訓練的所述決策樹模型對待分類的土地分類數據進行典型資源要素提取，可以顯著提高遙感數據的土地覆蓋分類的精度，並提高分類算法的合理性和可信度。以上實施例僅用於說明本發明的技術方案，而非對其限制；儘管參照前述實施例對本發明進行了詳細的說明，本領域的普通技術人員應當理解：其依然可以對前述各實施例所記載的技術方案進行修改，或者對其中部分技術特徵進行等同替換；而這些修改或替換，並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍。當前第1頁12

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

典型資源要素提取方法及裝置與流程

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法