基於不確定性空間數據挖掘的區域成礦預測方法
2023-05-05 00:48:51
專利名稱:基於不確定性空間數據挖掘的區域成礦預測方法
技術領域:
本發明涉及一種新的區域成礦預測方法,屬於資源信息技術領域。
背景技術:
區域成礦預測方法經歷了從早期的礦床統計預測、中期的"地質異常"預測到最近 的"三聯式"定量成礦預測和多重分形非線性成礦預測理論與方法。這些區域成礦預測理 論、技術和方法日趨成熟,在區域成礦預測中發揮了重要作用。但是,隨著區域和全球性地 質空間數據的日益採集與獲取,面對海量多源的地質空間數據,傳統的區域成礦預測方法 很難快速有效地處理海量的地質空間數據。上世紀九十年代興起的空間數據挖掘技術為海 量空間數據信息提取提供了很好的理論方法。申請人根據空間數據普遍存在的不確定性和 空間自相關性,提出了不確定性空間數據挖掘算法模型。同時,如何快速利用好已有的海量 多源地質空間數據,高效進行區域成礦定量預測,顯得極具科學意義和經濟價值。
發明內容
本發明目的在於針對現有區域成礦預測方法的不足,提出一種從海量多源地質空 間數據快速提取區域成礦信息,達到高效地進行區域成礦預測的方法。顧及地質空間數據 的不確定性和成礦信息提取的不確定性的基礎上,提出基於不確定性空間數據挖掘算法模 型的區域成礦預測方法,並建立相應的評價指標來客觀評價區域成礦預測結果。以下是本 發明的具體內容 1、多源多尺度地質空間數據預處理 按照四種不同尺度(區域成礦可行地段、區域成礦有利地段、區域成礦潛在地段、
區域成礦遠景地段)成礦預測要求,按四種不同比例尺(i : 50萬、1 : 20萬、1 : 5萬和 i : i萬)進行多源地質空間數據的地質要素數位化和坐標投影轉換(i : 50萬、1 : 20
萬和l : 5萬採用6度帶的高斯-克呂格北京1954平面坐標系,1 : l萬採用3度帶的高 斯_克呂格北京1954平面坐標系)。遙感數據的投影坐標轉換利用同區域的地形圖建立對 應控制點,採用多項式擬合方法進行坐標配準。
2、遙感礦化信息提取 根據區域內地物對象的複雜性,對不同地物進行不同的掩膜方法基礎上,採用特 徵主成分分析和閥值異常分割方法提取鐵礦化信息和泥化信息,具體如下(以LandSAT ETM多光譜數據為例) (1)掩膜方法選擇(以西北高寒山區為例),對於雲和雪,採用TM1高值區(DN值 140 165)作為閥值;對於水體,採用TM7/TM1 (0. 3 0. 4)作為閥值;對於植被,採用TM4/ TM3(1. 05 1. 2)作為閥值;對於沙漠和水體,直接通過目視圈定感興趣區進行掩膜。
(2)特徵主成分分析方法具體如下選擇TM1 、 TM3、 TM4和TM5作主成份分析獲取 鐵礦化信息,在獲得的4個PC圖像中,選擇TM3和TM1特徵向量載荷因子絕對值較大且符 號相反的PC圖象作為鐵礦化異常信息提取的圖象;選擇TM1、 TM4、 TM5和TM7作主成份分析獲取泥化信息,在獲得的4個PC圖像中,TM5和TM7特徵向量載荷因子絕對值較大且兩 者符號相反PC圖象作為泥化異常信息提取的圖象。 (3)閥值異常分割方法具體如下首先對提取的礦化信息進行3X3或5X5的均 值濾波,以2.5 3.0倍標準離差o作為閥值,限定異常水平,對異常進行閥值分割。
3、基於不確定性空間數據挖掘算法模型的成礦預測 (1)根據不同地質空間數據的不確定性類型,採用Monte Carlo模擬法進行空間 數據不確定性模型 ①確定每個待輸入空間數據集Di( )的不確定性類型(位置數據的圓形正態模 型,屬性數據的一維正態模型); ②取用依空間數據集Di ( )分布的隨機採樣來代替原輸入空間數據; ③對每一次實現,存儲其結果Y( ); 隨機抽取10000組以上實驗數據作為樣本數據。 (2)以EM (Expectation Maximization)算法為基礎,考慮地質空間數據的空間自 相關性,建立空間自相關矩陣的基礎上,採用鄰域EM算法對地質空間屬性數據進行模糊離 散化,具體如下 ①空間自相關矩陣建立借用Voronoi和Delaunay圖,結合距離標準來構建空間 權重矩陣。考慮到空間數據的不確定性,採用三種方法計算空間數據間空間自相關矩陣中 心法、最小法和最大法。假設區域s中有n個位置不確定的點,第i個點Pi的誤差帶用一 個圓形Qi表示。具體算法如下 輸入區域s中的一組點的誤差帶Q = &, Q2, ...Qn}和鄰域距離d 輸出區域S中一組點的鄰域圖和空間自相關距陣 步驟1 :構造點集P的Voronoi多邊形 步驟2 :對所有相鄰的Voronoi多邊形進行如下運算步驟2. 1 :計算cUter(Ci, C》、《 & , Q》、計算& , Q》 步驟2. 2 :如果d <《,則在鄰域圖中連接Pi和Pj, 為1 ;否則Wij為0其中,d 為鄰域距離;cU^(Ci, Cj)表示相鄰誤差帶(Qi, Qj)質心之間的距離;cU(Qi, Qj)表示相鄰 誤差帶(Qi,Qj)內空間數據之間的最大距離;cLn(Qi,Qj)表示相鄰誤差帶(Qi,Qj)內空間數 據之間的最小距離。 ②基於鄰域EM算法的地質空間屬性數據進行模糊離散化,其算法如下 根據地質空間數據的地理坐標和不確定性模型,按照①算法可建立離散空間數據
的的空間鄰近關係矩陣V:formula see original document page 4
為了考慮空間數據的空間自相關性,改進函數
formula see original document page 4 引入新的項formula see original document page 4
然後,建立新的標準函數為U(c, e) =D(c, e) + p *G(C)(|3 >0)
其中,e是控制空間數據集的空間同質性的參數。
則,E-步驟
其最優化必要條件為如下形式
5q = log( " I ) +1 — log c汰+ A, +化;f w
最後得到如下方程
M步l
沐
argmaxZ)(cw+1,0)
6> 6>
(3)成礦關聯信息挖掘及不確定性評價 ①顧及不確定性的成礦關聯規則挖掘地質空間數據不確定性MonteCarlo模擬 —空間自相關矩陣構建一連續型數據UNEM方法離散化一Apriori空間關聯規則提取 [OO43]②成礦關聯規則的不確定性評價,採用支持度(su卯ort)、可信度(confidence) 和興趣度(interesting)三個評價指標進行成礦預測信息的不確定性評價
圖1 :青海東崑崙地區成礦關聯規則挖掘結果的不確定性評價指標(支持度)圖
圖2 :青海東崑崙地區成礦關聯規則挖掘結果的不確定性評價指標(可信度)圖
圖3 :青海東崑崙地區成礦關聯規則挖掘結果的不確定性評價指標(興趣度)圖
具體實施例方式
為了更好地理解本發明的技術方案,以下以中國西部重要金屬成礦帶-青海東昆 侖為例,提供具體實施例。 首先,數位化多源地質空間數據,包括地質礦產數據、地球化學數據和礦床數據; 然後提取遙感礦化信息(該說明以LandSAT ETM數據為例);最後採用該發明中的不確定 性空間數據挖掘算法提取成礦關聯規則信息指導成礦預測,以下結果為青海東崑崙成礦帶 鐵礦床的成礦關聯規則挖掘結果(如下表1)。 表1青海東崑崙成礦帶鐵礦床的成礦關聯規則挖掘結果及不確定性評價
5編號關聯規則
支持度 可信度
興趣度
1 北西向斷裂A矽卡巖化A遙感礦化異常 代-熱液型鐵礦床
2 北西向斷裂A碳酸鹽化A遙感礦化異常 代-熱液型鐵礦床
3 近東西向斷裂A矽卡巖化A遙感礦化異常 交代-熱液型鐵礦床
4 近東西向斷裂A綠泥石化A遙感礦化異常 交代-熱液型鐵礦床
5 近東西向斷裂A碳酸鹽化A遙感礦化異常 交代-熱液型鐵礦床
6 近東西向斷裂A矽化A遙感礦化異常一5 熱液型鐵礦床
7 北西向斷裂A矽卡巖化-c
8 北西向斷裂A碳酸鹽化一:=
9 北西向斷裂A遙感礦化異常 床
10 近東西向斷裂A矽卡巖化-U 近東西向斷裂A碳酸鹽化-
12 近東西向斷裂A矽化一>
13 矽卡巖化A遙感礦化異常-
14 綠泥石化A遙感礦化異常-
15 碳酸鹽化A遙感礦化異常-
16 矽化A遙感礦化異常-->
17 北西向斷裂一> 接觸交代-熱液型鐵礦床
18 砂卡巖化一> 接觸交代-熱液型鐵礦床
19 綠泥石化一> 接觸交代-熱液型鐵礦床 19 碳酸鹽化--> 接觸交代-熱液型鐵礦床
-> 接觸交0.17310l細OO0.992736
> 接觸交0.08000l細OO0.996772
—> 接觸0.096181.000000.995964
-->接觸0.096181.000000.995964
> 接觸0,08000l細OO0.996772
接觸交代-0.057691.000000,997579
接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床 -->接觸交代-熱液型鐵礦
■->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床
0.38466 0.11541
0.21156
0.13464 0.09618 0.09618 0.34620 0.13464 0.15387
0.48084 0.59623 0.23079 0.21156
0.95238 0.75000
l細OO 1.00000 l細OO 1.00000 0.77778 1.00000 1.00000 0.80645 0.96875
0.84615
0.936239 0.745157
0.78571 0.776836
0.99435 0.995964 0.995964 0.985472 0.772128 0.993543 0.996772 0.786274
0.94373 0.790315 0.837276
21 矽化一> 接觸交代-熱液型鐵礦床
0.13464
0.77778 0.772128
權利要求
基於不確定性空間數據挖掘的區域成礦預測方法,其特徵在於充分利用多源海量地質空間數據(基礎地質礦產數據、遙感找礦數據、地球化學數據、礦山地質數據、礦床數據),同時顧及地質空間數據的不確定性和成礦信息提取的不確定性,採用申請人建立的不確定性空間數據挖掘算法模型,快速高效地進行區域成礦預測,包括三個主要步驟多源多尺度地質空間數據的標準化處理;遙感礦化信息提取;基於不確定性空間數據挖掘算法模型的成礦預測。
2. 權利要求1所述的多源多尺度地質空間數據的標準化,其特徵在於按照不同尺度成 礦預測要求,按不同比例尺進行多源地質空間數據的預處理和幾何配準,包括l : 50萬、i : 20萬、1 : 5萬和i : i萬四種不同的數據比例尺要求,進行地質要素數位化、投影坐 標轉換。
3. 權利要求1所述的遙感礦化信息提取,其特徵在於根據區域內地物對象的複雜性,對不同地物(雲、雪、水體、植被、沙漠等)進行不同的掩膜方法基礎上,採用特徵主成分分析和閥值異常分割方法提取鐵礦化信息和泥化信息,具體如下(以LandSat ETM多光譜數 據為例)(a) 掩膜方法選擇(以西北高寒山區為例),對於雲和雪,採用TM1高值區(DN值 140 165)作為閥值;對於水體,採用TM7/TM1 (0. 3 0. 4)作為閥值;對於植被,採用TM4/ TM3(1. 05 1. 2)作為閥值;對於沙漠和水體,直接通過目視圈定感興趣區進行掩膜;(b) 特徵主成分分析方法具體如下選擇TM1、 TM3、 TM4和TM5作主成份分析獲取鐵礦 化信息;選擇TM1、 TM4、 TM5和TM7作主成份分析獲取泥化信息;(c) 閥值異常分割方法具體如下首先對提取的礦化信息進行均值濾波,以2. 5 3. 0 倍標準離差o作為閥值,限定異常水平,對異常進行閥值分割。
4. 權利要求1所述的基於不確定性空間數據挖掘算法模型的成礦預測,具體如下(a) 根據不同地質空間數據的不確定性類型,採用Monte Carlo模擬法進行空間數據 不確定性模型;(b) 顧及地質空間數據的空間自相關性,建立空間自相關矩陣的基礎上,採用鄰域EM 算法對地質空間屬性數據進行模糊離散化;(c) 對多源海量地質空間數據進行成礦關聯信息挖掘,並採支持度(support)、可信度 (confidence)和興趣度(interesting)三個評價指標進行成礦預測信息的不確定性評價。
全文摘要
一種基於不確定性空間數據挖掘的區域成礦預測方法,屬於資源信息處理與應用技術領域。本發明充分利用多源海量地質空間數據(基礎地質礦產數據、遙感找礦數據、地球化學數據、礦山地質數據、礦床數據),基於不確定性空間數據挖掘算法模型,高效提取區域成礦關聯信息,達到快速高效地進行區域成礦預測的目的。該發明包括三個主要步驟多源多尺度地質空間數據的幾何配準;遙感礦化信息提取;基於不確定性空間數據挖掘算法模型的成礦預測。本發明能夠更加高效、客觀地評價區域成礦遠景區。
文檔編號G06F17/30GK101739396SQ200810046559
公開日2010年6月16日 申請日期2008年11月14日 優先權日2008年11月14日
發明者何彬彬, 陳翠華 申請人:電子科技大學