一種將地理數據與傳感器信號數據相融合的數據處理方法與流程
2023-06-18 01:47:46 2
本發明涉及數據處理技術領域,具體來說是一種將地理數據與傳感器信號數據相融合的數據處理方法。
背景技術:
現有的信號採集通常使用分散在多個地點的傳感器來完成,用於從多個側面觀察目標區域的情況。如果需要了解整個區域的情況,必須同時處理分散在各地的信號,而這些信號一般又來自多個信號源,帶來的信息冗餘甚至矛盾。所以必須對多個地點的傳感器進行合理組合分析,將其採集的信息依據某種準則組合,生成對目標區域一致性的解釋和描述。
而對地理數據與傳感器數據融合就是對分散的傳感器數據進行多級別、多方面、多層次的處理,即根據地理數據融合來自多個地點的傳感器數據,以獲得綜合的、更好的判斷。因此,如何將地理數據與傳感器數據進行有效融合處理已經成為急需解決的技術問題。
技術實現要素:
本發明的目的是為了解決現有技術中難以將地理數據與傳感器數據進行融合處理的缺陷,提供一種將地理數據與傳感器信號數據相融合的數據處理方法來解決上述問題。
為了實現上述目的,本發明的技術方案如下:
一種將地理數據與傳感器信號數據相融合的數據處理方法,包括以下步驟:
地理數據處理,對傳感器的地理數據進行分類;
傳感器信號數據處理,對傳感器信號數據進行降噪處理,並根據同類地理數據的傳感器信號數據分析識別異常傳感器;
數據融合處理,根據處理後的地理數據與傳感器信號數據進行融合處理。
所述的地理數據處理包括以下步驟:
獲取傳感器的地理數據,傳感器{S1、S2、S3、…、Sn}所對應的地理數據為{G1、G2、G3、…、Gn},
其中:Si為傳感器,Gi為傳感器Si所對應的地理數據;
對傳感器的地理數據進行聚類分析,對傳感器的地理數據{G1、G2、G3、…、Gn}進行聚類處理,形成地理數據的聚類。
所述的傳感器信號數據處理包括以下步驟:
獲取傳感器的信號數據,傳感器信號數據為{v1、v2、v3、…、vn},
其中,vi為傳感器Si的信號數據;
對傳感器的信號數據進行降噪處理,使用限幅濾波與均值濾波相結合的方法處理傳感器信號數據;
對異常傳感器信號數據進行處理,對處於同一地理數據類的傳感器信號數據進行分析處理,識別出異常傳感器信號數據並剔除對應的信號數據。
所述的數據融合處理包括以下步驟:
計算各個地理數據類別在評價體系中的權值,使用ANP算法對地理數據類{C1、C2、C3、…、Cp}計算權值,得到對應的權值{W1、W2、W3、…、Wp};
獲取傳感器信號數據權值,將地理數據類Ci對應的權值Wi,賦給Ci類所包含的傳感器信號數據;
傳感器Si歸屬於地理數據類Ci,傳感器Si對應的傳感器信號數據Vi的權值Di為地理數據類Ci的權值Wi,得到傳感器信號數據{V1、V2、V3、…、Vk}對應的權值{D1、D2、D3、…、Dk};
融合地理數據與傳感器信號數據,將處理後的傳感器信號數據{V1、V2、V3、…、Vk}與其所對應的權值{D1、D2、D3、…、Dk}進行合併計算,得出整體評估值H,其計算公式如下:
所述的對傳感器的地理數據進行聚類分析採用CURE聚類算法,
將地理數據聚合為以下類{C1、C2、C3、…、Cp},其中,Cm為地理數據類別;地理數據類Cm包含x個地理數據{Gm1、Gm2、Gm3、…、Gx};
根據地理數據關聯傳感器,地理數據類Cm{Gm1、Gm2、Gm3、…、Gx}對應傳感器Sm{Sm1、Sm2、Sm3、…、Sx}。
所述的對傳感器的信號數據進行降噪處理包括以下步驟:
計算傳感器信號數據的算數平均差T,
確定傳感器信號數據中兩次相鄰採集允許的最大偏差值為ΔT,把傳感器信號數據中兩次相鄰的採集值進行相減,取其差值的絕對值與ΔT進行比較;
若小於或等於ΔT,則取當前採樣值,如果大於ΔT,則取前次採樣值,其公式表示如下:
得到採樣序列{Ti}|i=0-n;
使用均值濾波算法取均值剔除不明顯的噪聲數據,
對採樣序列{Ti}|i=0-n中的數據求和後,再取其平均值T,其公式如下:
經過信號數據降噪處理後,傳感器{S1、S2、S3、……、Sn}對應的信號數據為{V1、V2、V3、……、Vn}。
所述的對異常傳感器信號數據進行處理包括以下步驟:
匯聚傳感器信號數據,將處於同一地理數據類的傳感器信號數據匯聚成一個數據集;
地理數據類Cm中包含的傳感器{Sm1、Sm2、Sm3、……、Sx}對應的信號數據為(Vm1、Vm2、Vm3、……、Vx),通過地理數據類Cm匯聚後的信號數據集Fm為{Vm1,Vm2,Vm3,……,Vx};
計算傳感器信號數據集Fm的特徵數據組:(c,s,dmax,dmin,n),
其中:c為數據集Fm的均值點,
xi為信號數據集Fm中的傳感器信號數據點,dis(c,xi)為兩點間的歐幾裡德距離,
dmax、dmin分別為c到距離其最遠數據點、最近數據點的距離,n為數據集中信號數據個數;
計算傳感器信號數據點xi離群度l(xi),其離群度l(xi)定義如下:
其中:為Fm中各傳感器信號數據點到均值點的平均距離;
處理異常傳感器信號數據,利用檢測離群點的方法丟棄遠離簇的數據點,在整體區域分析中,剔除該信號數據結果集中包含的傳感器信號數據,其具體步驟如下:
設定離散閥值Φ,當l(xi)大於離散閥值Φ時,則信號數據點xi為異常傳感器信號數據,從數據集Fm中剔除;
獲得正常傳感器{S1、S2、S3、……、Sk}的傳感器信號數據為{V1、V2、V3、……、Vk},其所屬的地理數據類別為{C1、C2、C3、……、Cp}。
有益效果
本發明的一種將地理數據與傳感器信號數據相融合的數據處理方法,與現有技術相比將分布在不同地點的多個傳感器數據,根據其地理數據信息對傳感器數據進行分析處理,減少了異常傳感器對數據的影響,獲取到更精確的整體情況。本發明有利於對異常傳感器的監管,提高對區域情況判斷的準確性。
附圖說明
圖1為本發明的方法順序圖。
具體實施方式
為使對本發明的結構特徵及所達成的功效有更進一步的了解與認識,用以較佳的實施例及附圖配合詳細的說明,說明如下:
如圖1所示,本發明所述的一種將地理數據與傳感器信號數據相融合的數據處理方法,包括以下步驟:
第一步,地理數據處理,對傳感器的地理數據進行分類,其中地理數據包含地理位置、分布特點的自然現象和社會現象的諸要素數據,分為自然地理數據和社會經濟數據。其具體步驟如下:
(1)獲取傳感器的地理數據,傳感器{S1、S2、S3、…、Sn}所對應的地理數據為{G1、G2、G3、…、Gn},
其中:Si為傳感器,Gi為傳感器Si所對應的地理數據。
(2)對傳感器的地理數據進行聚類分析,對傳感器的地理數據{G1、G2、G3、…、Gn}進行聚類處理,形成地理數據的聚類,方便根據地理數據來對傳感器信號數據進行處理與分析。由於地理數據聚類強,地理數據的類別未定,且聚類類型無法判斷,故使用CURE聚類算法。該算法具有效率較高,可發現任意形狀的聚類類型,同時對數據輸入順序不敏感,異常數據對聚類結果影響較小的優點。
CURE聚類算法如下:
首先,將地理數據聚合為以下類{C1、C2、C3、…、Cp},其中,Cm為地理數據類別;地理數據類Cm包含x個地理數據{Gm1、Gm2、Gm3、…、Gx}。
最後,根據地理數據關聯傳感器,得出地理數據類Cm{Gm1、Gm2、Gm3、…、Gx}對應傳感器Sm{Sm1、Sm2、Sm3、…、Sx}。
第二步,傳感器信號數據處理。對傳感器信號數據進行降噪處理,並根據同類地理數據的傳感器信號數據分析識別異常傳感器。其具體步驟如下:
(1)獲取傳感器的信號數據,傳感器信號數據為{v1、v2、v3、…、vn},其中,vi為傳感器Si的信號數據。
(2)對傳感器的信號數據進行降噪處理,使用限幅濾波與均值濾波相結合的方法處理傳感器信號數據,剔除噪聲數據,提高濾波的效果。其具體步驟如下:
A、計算傳感器信號數據的算數平均差T。
確定傳感器信號數據中兩次相鄰採集允許的最大偏差值為ΔT,其中最大偏差值ΔT根據實際經驗獲得。
把傳感器信號數據中兩次相鄰的採集值進行相減,取其差值的絕對值與ΔT進行比較;
若小於或等於ΔT,則取當前採樣值,如果大於ΔT,則取前次採樣值,其公式表示如下:
得到採樣序列{Ti}|i=0-n,由此得到的採樣序列{Ti}能有效克服因偶然因素引起的幹擾。
B、使用均值濾波算法取均值剔除不明顯的噪聲數據。
對採樣序列{Ti}|i=0-n中的數據求和後,再取其平均值T,其公式如下:
經過信號數據降噪處理後,傳感器{S1、S2、S3、……、Sn}對應的信號數據為{V1、V2、V3、……、Vn}。
(3)對異常傳感器信號數據進行處理,對處於同一地理數據類的傳感器信號數據進行分析處理,識別出異常傳感器信號數據並剔除對應的信號數據。此步驟能夠保證信號數據的數據質量,更真實反應地區情況。其具體步驟如下:
A、匯聚傳感器信號數據,將處於同一地理數據類的傳感器信號數據匯聚成一個數據集。
地理數據類Cm中包含的傳感器{Sm1、Sm2、Sm3、……、Sx}對應的信號數據為(Vm1、Vm2、Vm3、……、Vx),通過地理數據類Cm匯聚後的信號數據集Fm為{Vm1,Vm2,Vm3,……,Vx}。
B、計算傳感器信號數據集Fm的特徵數據組:(c,s,dmax,dmin,n),
其中:c為數據集Fm的均值點,
xi為信號數據集Fm中的傳感器信號數據點,dis(c,xi)為兩點間的歐幾裡德距離,
dmax、dmin分別為c到距離其最遠數據點、最近數據點的距離,n為數據集中信號數據個數。
C、計算傳感器信號數據點xi離群度l(xi),其離群度l(xi)定義如下:
其中:為Fm中各傳感器信號數據點到均值點的平均距離。
D、處理異常傳感器信號數據,利用檢測離群點的方法丟棄遠離簇的數據點,在整體區域分析中,剔除該信號數據結果集中包含的傳感器信號數據,其具體步驟如下:
設定離散閥值Φ,當l(xi)大於離散閥值Φ時,則信號數據點xi為異常傳感器信號數據,從數據集Fm中剔除,認為其為偏差數據;
從而獲得正常傳感器{S1、S2、S3、……、Sk}的傳感器信號數據為{V1、V2、V3、……、Vk},其所屬的地理數據類別為{C1、C2、C3、……、Cp}。
第三步,數據融合處理。根據處理後的地理數據與傳感器信號數據進行融合處理。其具體步驟如下:
(1)計算各個地理數據類別在評價體系中的權值,使用ANP算法對地理數據類{C1、C2、C3、…、Cp}計算權值,得到對應的權值{W1、W2、W3、…、Wp}。不同地理數據類之間的傳感器信號數據有一定的關聯性,不是相互獨立的,故選用ANP算法。該算法適用於元素間相互依存的情形,允許考慮系統中各要素的相互作用,更符合地理數據與傳感器數據融合的實際情況。該算法對各相互作用並影響的因素進行綜合分析得出其混合權重,可以更準確的計算各個傳感器信號數據對應的權值、更符合決策問題的實際情況。
(2)獲取傳感器信號數據權值,將地理數據類Ci對應的權值Wi,賦給Ci類所包含的傳感器信號數據;
傳感器Si歸屬於地理數據類Ci,傳感器Si對應的傳感器信號數據Vi的權值Di為地理數據類Ci的權值Wi,得到傳感器信號數據{V1、V2、V3、…、Vk}對應的權值{D1、D2、D3、…、Dk}。
(3)融合地理數據與傳感器信號數據,將處理後的傳感器信號數據{V1、V2、V3、…、Vk}與其所對應的權值{D1、D2、D3、…、Dk}進行合併計算,得出整體評估值H,其計算公式如下:
整體評估值方法結合實際情況,融合多個傳感器數據與地理數據,客觀準確的反應區域的情況。
以上顯示和描述了本發明的基本原理、主要特徵和本發明的優點。本行業的技術人員應該了解,本發明不受上述實施例的限制,上述實施例和說明書中描述的只是本發明的原理,在不脫離本發明精神和範圍的前提下本發明還會有各種變化和改進,這些變化和改進都落入要求保護的本發明的範圍內。本發明要求的保護範圍由所附的權利要求書及其等同物界定。