一種基於海量數據挖掘的設備狀態預測方法
2023-10-08 18:07:34 2
專利名稱:一種基於海量數據挖掘的設備狀態預測方法
一種基於海量數據挖掘的設備狀態預測方法技術領域
本發明屬於基於工業設備海量數據的數據挖掘領域,特別是涉及一種基於海量數據挖掘的設備狀態預測算法。
背景技術:
現代大型工業企業的發展離不開設備。這些設備穩定、持續的運行與企業的利益息息相關,它們的故障甚至是異常停機將給企業帶來難以想像的重大損失。因此在其運行過程中,提前發現可能的故障並加以預防和排除非常重要。對此有一些傳統方法,如定期的人工巡視、設備停工進行例行檢查等。這些傳統方法有幾個問題1.定期的檢測需要耗費大量的人力、物力,效率很低2.對一些不必要的設備也進行了檢測,造成資源的浪費3.停機檢測可能會帶來巨大的經濟上的損失。在這樣的背景下,企業對設備狀態預警方面的需求日益突出。近年來設備狀態預警技術逐漸進入人們的視野,該技術是利用現代傳感技術和計算機技術對運行中的設備進行監測,獲取反映運行狀態的各種數據值,並對其進行分析處理,預測運行狀況,在必要時提供報警和故障診斷信息,避免因故障的進一步擴大而導致事故的發生,為狀態檢修提供實時數據。狀態預警技術在很多領域,如電力、醫學、航空、核工業等都有著深刻而廣闊的應用前景。本發明立足設備狀態預警技術,實現了一種基於工業設備海量數據的設備狀態預測算法。發明內容
本發明的目的是提供一種設備狀態預測方法,該方法從歷史數據中充分挖掘有用知識,結合設備實時情況對設備狀態進行的有效的預測。
本發明的技術方案為包括階段一學習算法;階段二 預測算法; 所述階段一學習算法包括步驟如下反映設備歷史運行狀態的數據樣本作為訓練數據圯,聚類結果的類集合為 C,其中,■■■,*}, O, =( ■■■,O*.-> I ,I < k < H , V* 為數據集11中向量0I的第fc維參數的值,n為每個數據向量的維度;步驟I [初始化]:C = ·,讀入第一個訓練數據向量並對其標準化,記錄結果為O1,生成初始聚類G,並記錄 upper limit 和 lower limit , C = {C^ ;步驟2 [處理新數據向量]:讀入一個新的訓練數據向量並對其標準化,記錄結果為O2 ,如果3C』eC,使得= O ,那麼轉至步驟3,否則轉至步驟4 ;步驟3[ Of併入C』—]:q—同時更新Cj的參數,現有的類總個數不變;步驟4[七自成一類]:由=其中n為聚類結果集中聚類的個數;步驟5 :所有歷史訓練數據向量都已經處理完,則階段一終止;否則,返回步驟2 ;階段二 預測算法包括如下步驟步驟6 [初始化]:1=d ;步驟7[計算距離]:計算向量0與聚類結果集C = Cj中聚類的距離,若4 二 O,轉至步驟9 ;若i ,轉至步驟8 ;否則,令i = i+Ι,轉至步驟7 ;步驟8[尋找最近距離]:從距離集合= …》rfj中找到一個< 使得^為集合 d中的最小值;步驟9 [確定相似模型]:根據4確定聚類模型在聚類結果集中的序號為i,即相似的聚類模型為Ci ;步驟10 [計算預測向量]:根據聚類模型Ci得到向量0的預測向量。
根據階段一學習算法設定預測向量安全範圍。
本發明方法的有益效果是,能在較低開銷下以較高的效率完成知識學習,並且實時的給出設備狀態的預測與診斷結果,為企業實現大型設備的狀態監測、預警診斷等起到良好的作用。
圖1是算法模擬實際應用模型。
圖2是初始類Ci的第Jt維分量的可吸收範圍示意圖。
圖3是聚類《^經過擴展後的第Jfc維分量的可吸收範圍示意圖。
圖4是實時數據向量0各難度與類模型Ci計算距離示意圖。
圖5是實時數據向量| 通過相似類模型C1-確定各維度預測值示意圖。
具體實施方式
下面結合附圖詳細說明本發明的優選實施例。
算法的實現分為兩大步驟,一是利用設備運行的歷史數據建立起設備運行狀態模型,這一步通過聚類算法實現;二是利用經過聚類得到的設備狀態模型,結合設備運行的實時狀態數據對當前運行狀態進行回歸預測。在此之後再結合一些報警規則實現設備的在線實時預警,算法的整體應用模型如附圖1所示。
算法步驟一學習算法。該算法將反映設備歷史運行狀態的數據樣本作為訓練數據集,依次讀入訓練集中的數據向量(Data Vector),根據訓練集的最大值、最小值向量將其標準化,然後確定其所在的類(或者屬於某個當前已有類,或者自成一個新的類),直到所有數據向量被掃描一遍,聚類過程結束。這樣的處理過程避免了需要把所有數據一次性全部讀入內存而後才能進行聚類的弊端,是凝聚型層次聚類算法的一種改進方法。該算法思想的實現過程如下假定數據向量訓練集經標準化後為D…聚類結果的類集合為G,其中,Vi= {KX O1 = {αΛ,... ,Oa OxI κ > I J < fc < * , 為數據集U 中向量 % 的第 fc維參數的值。Η為每個數據向量的維度。
步驟I [初始化].C =傘,讀入第一個訓練數據向量並對其標準化,記錄結果為 ι,生成初始聚類C1,並記錄upper limit和lower limit , C = (1 ,生成過程的示意圖如附圖2所示;步驟2 [處理新數據向量].讀入一個新的訓練數據向量並對其標準化,記錄結果為O2 ,如果BCj. eC ,使彳= O ,那麼轉至步驟3,否則轉至步驟;/* flfisteniceCOiXy表示向量 與某個類£;各個維度的歐式距離之和,如果β的每個維度分量值都在類G對應的分量值範圍內(包括擴展和擾動範圍),那麼步驟3[ Of-併入C』].Ci=CjU0f,同時更新Cj的參數,現有的類總個數不變;步驟4[七自成一類]., C = CuCim1其中η為聚類結果集中聚類的個數;/*此時,C中類的總個數要加I*/步驟5.若所有歷史訓練數據向量都已經處理完,則算法終止,終止後的訓練結果示意圖如附圖3所示;否則,返回步驟步驟2。
算法步驟二預測算法。按照學習算法的聚類結果,每個類代表了設備運行過程中的一種正常狀態 ,當異常的實時數據輸入時,將無法把它合併到任何一個正常類中。基於歷史訓練數據集的完整性,算法結果正確性,正常的設備狀態必定落在學習算法聚類結果中的某個類中。如果測得的實時數據向量正常,根據其相似的聚類模型得到的預測值必定與其自身相差不大,而若實時數據向量異常,那麼預測值與其相差會很明顯。預測算法正是利用這種原理給出設備運行狀態的實時情況。該算法思想的實現過程如下步驟I [初始化]. -0 ;步驟2[計算距離].計算向量O (該向量為接收到的實時的數據向量)與聚類結果集 C =中聚類的距離,計算距離的示意圖如附圖4所示,若《=0,轉至步驟4;若 =1 ,轉至步驟3 ;否則,令i =1-H ,轉至步驟2 ;步驟3[尋找最近距離].從距離集合*# = {4,4,.-.<}中找到一個^使得《 力集合 d中的最小值;步驟4 [確定相似模型].根據沁確定聚類模型在聚類結果集中的序號為i,即相似的聚類模型為G;步驟5 [計算預測向量].根據聚類模型q得到向量·的預測向量,得到預測向量的示意圖如附圖5所示。
根據階段一學習算法設定預測向量安全範圍。該安全範圍可根據設備可靠性要求調整範圍大小,並輔以超範圍報警機制,即可更好實現大型設備的狀態監測、預警診斷坐 寸ο
本發明按照優選實施例進行了說明,應當理解,但上述實施例不以任何形式限定 本發明,凡採用等同替換或等效變換的形式所獲得的技術方案,均落在本發明的保護範圍 之內。
權利要求
1.一種基於海量數據挖掘的設備狀態預測方法,其特徵在於包括階段一學習算法;階段二 預測算法; 所述階段一學習算法包括步驟如下 反映設備歷史運行狀態的數據樣本作為訓練數據集B = .,.,Oj ,聚類結果的類集合為 C,其中,Vl={1,2, o, = ( ,...OmX為數據集U中向量的第fc維參數的值為每個數據向量的維度; 步驟I [初始化]:C = # ,讀入第一個訓練數據向量並對其標準化,記錄結果為O1,生成初始聚類^ ,並記錄 upper limit 和 lower limit , C = {(^ ; 步驟2[處理新數據向量]:讀入一個新的訓練數據向量並對其標準化,記錄結果為O2,如果彐Cj- e C,使得 dis Ibd Csfoi^Cj)= O,那麼轉至步驟3,否則轉至步驟4 ; 步驟3
=Cjf = CjUOl,同時更新€^ 的參數,現有的類總個數不變; 步驟4 [ Of自成一類]:山Cm1 = 0 } , C = Cu。其中n為聚類結果集中聚類的個數; 步驟5 :所有歷史訓練數據向量都已經處理完,則階段一終止;否則,返回步驟2 ; 階段二 預測算法包括如下步驟 步驟6 [初始化];步驟7[計算距離]:計算向量o與聚類結果集C =CiJ中聚類的距離,若4 = 0,轉至步驟9 ;若轉至步驟8 ;否則,令# = £+1,轉至步驟7 ; 步驟8[尋找最近距離]:從距離集合中找到一個沁,使得rff為集合d中的最小值; 步驟9 [確定相似模型]:根據嶙確定聚類模型在聚類結果集中的序號為f,即相似的聚類模型為G; 步驟10[計算預測向量]:根據聚類模型q得到向量0的預測向量rf。
2.根據權利要求1所述的方法,其特徵在於根據階段一學習算法設定預測向量安全範圍。
全文摘要
本發明屬於基於工業設備海量數據的數據挖掘領域,提供一種設備狀態預測方法,該方法從歷史數據中充分挖掘有用知識,結合設備實時情況對設備狀態進行的有效的預測,能在較低開銷下以較高的效率完成知識學習,並且實時的給出設備狀態的預測與診斷結果,為企業實現大型設備的狀態監測、預警診斷等起到良好的作用。
文檔編號G06K9/62GK103020006SQ20111028614
公開日2013年4月3日 申請日期2011年9月24日 優先權日2011年9月24日
發明者唐勝, 胡潔 申請人:國家電網公司, 江蘇瑞中數據股份有限公司