新四季網

一種基於海量數據挖掘的設備狀態預測方法

2023-10-08 18:07:34 2

專利名稱:一種基於海量數據挖掘的設備狀態預測方法
一種基於海量數據挖掘的設備狀態預測方法技術領域
本發明屬於基於工業設備海量數據的數據挖掘領域,特別是涉及一種基於海量數據挖掘的設備狀態預測算法。
背景技術:
現代大型工業企業的發展離不開設備。這些設備穩定、持續的運行與企業的利益息息相關,它們的故障甚至是異常停機將給企業帶來難以想像的重大損失。因此在其運行過程中,提前發現可能的故障並加以預防和排除非常重要。對此有一些傳統方法,如定期的人工巡視、設備停工進行例行檢查等。這些傳統方法有幾個問題1.定期的檢測需要耗費大量的人力、物力,效率很低2.對一些不必要的設備也進行了檢測,造成資源的浪費3.停機檢測可能會帶來巨大的經濟上的損失。在這樣的背景下,企業對設備狀態預警方面的需求日益突出。近年來設備狀態預警技術逐漸進入人們的視野,該技術是利用現代傳感技術和計算機技術對運行中的設備進行監測,獲取反映運行狀態的各種數據值,並對其進行分析處理,預測運行狀況,在必要時提供報警和故障診斷信息,避免因故障的進一步擴大而導致事故的發生,為狀態檢修提供實時數據。狀態預警技術在很多領域,如電力、醫學、航空、核工業等都有著深刻而廣闊的應用前景。本發明立足設備狀態預警技術,實現了一種基於工業設備海量數據的設備狀態預測算法。發明內容
本發明的目的是提供一種設備狀態預測方法,該方法從歷史數據中充分挖掘有用知識,結合設備實時情況對設備狀態進行的有效的預測。
本發明的技術方案為包括階段一學習算法;階段二 預測算法; 所述階段一學習算法包括步驟如下反映設備歷史運行狀態的數據樣本作為訓練數據圯,聚類結果的類集合為 C,其中,■■■,*}, O, =( ■■■,O*.-> I ,I < k < H , V* 為數據集11中向量0I的第fc維參數的值,n為每個數據向量的維度;步驟I [初始化]:C = ·,讀入第一個訓練數據向量並對其標準化,記錄結果為O1,生成初始聚類G,並記錄 upper limit 和 lower limit , C = {C^ ;步驟2 [處理新數據向量]:讀入一個新的訓練數據向量並對其標準化,記錄結果為O2 ,如果3C』eC,使得= O ,那麼轉至步驟3,否則轉至步驟4 ;步驟3[ Of併入C』—]:q—同時更新Cj的參數,現有的類總個數不變;步驟4[七自成一類]:由=其中n為聚類結果集中聚類的個數;步驟5 :所有歷史訓練數據向量都已經處理完,則階段一終止;否則,返回步驟2 ;階段二 預測算法包括如下步驟步驟6 [初始化]:1=d ;步驟7[計算距離]:計算向量0與聚類結果集C = Cj中聚類的距離,若4 二 O,轉至步驟9 ;若i ,轉至步驟8 ;否則,令i = i+Ι,轉至步驟7 ;步驟8[尋找最近距離]:從距離集合= …》rfj中找到一個< 使得^為集合 d中的最小值;步驟9 [確定相似模型]:根據4確定聚類模型在聚類結果集中的序號為i,即相似的聚類模型為Ci ;步驟10 [計算預測向量]:根據聚類模型Ci得到向量0的預測向量。
根據階段一學習算法設定預測向量安全範圍。
本發明方法的有益效果是,能在較低開銷下以較高的效率完成知識學習,並且實時的給出設備狀態的預測與診斷結果,為企業實現大型設備的狀態監測、預警診斷等起到良好的作用。


圖1是算法模擬實際應用模型。
圖2是初始類Ci的第Jt維分量的可吸收範圍示意圖。
圖3是聚類《^經過擴展後的第Jfc維分量的可吸收範圍示意圖。
圖4是實時數據向量0各難度與類模型Ci計算距離示意圖。
圖5是實時數據向量| 通過相似類模型C1-確定各維度預測值示意圖。
具體實施方式
下面結合附圖詳細說明本發明的優選實施例。
算法的實現分為兩大步驟,一是利用設備運行的歷史數據建立起設備運行狀態模型,這一步通過聚類算法實現;二是利用經過聚類得到的設備狀態模型,結合設備運行的實時狀態數據對當前運行狀態進行回歸預測。在此之後再結合一些報警規則實現設備的在線實時預警,算法的整體應用模型如附圖1所示。
算法步驟一學習算法。該算法將反映設備歷史運行狀態的數據樣本作為訓練數據集,依次讀入訓練集中的數據向量(Data Vector),根據訓練集的最大值、最小值向量將其標準化,然後確定其所在的類(或者屬於某個當前已有類,或者自成一個新的類),直到所有數據向量被掃描一遍,聚類過程結束。這樣的處理過程避免了需要把所有數據一次性全部讀入內存而後才能進行聚類的弊端,是凝聚型層次聚類算法的一種改進方法。該算法思想的實現過程如下假定數據向量訓練集經標準化後為D…聚類結果的類集合為G,其中,Vi= {KX O1 = {αΛ,... ,Oa OxI κ > I J < fc < * , 為數據集U 中向量 % 的第 fc維參數的值。Η為每個數據向量的維度。
步驟I [初始化].C =傘,讀入第一個訓練數據向量並對其標準化,記錄結果為 ι,生成初始聚類C1,並記錄upper limit和lower limit , C = (1 ,生成過程的示意圖如附圖2所示;步驟2 [處理新數據向量].讀入一個新的訓練數據向量並對其標準化,記錄結果為O2 ,如果BCj. eC ,使彳= O ,那麼轉至步驟3,否則轉至步驟;/* flfisteniceCOiXy表示向量 與某個類£;各個維度的歐式距離之和,如果β的每個維度分量值都在類G對應的分量值範圍內(包括擴展和擾動範圍),那麼步驟3[ Of-併入C』].Ci=CjU0f,同時更新Cj的參數,現有的類總個數不變;步驟4[七自成一類]., C = CuCim1其中η為聚類結果集中聚類的個數;/*此時,C中類的總個數要加I*/步驟5.若所有歷史訓練數據向量都已經處理完,則算法終止,終止後的訓練結果示意圖如附圖3所示;否則,返回步驟步驟2。
算法步驟二預測算法。按照學習算法的聚類結果,每個類代表了設備運行過程中的一種正常狀態 ,當異常的實時數據輸入時,將無法把它合併到任何一個正常類中。基於歷史訓練數據集的完整性,算法結果正確性,正常的設備狀態必定落在學習算法聚類結果中的某個類中。如果測得的實時數據向量正常,根據其相似的聚類模型得到的預測值必定與其自身相差不大,而若實時數據向量異常,那麼預測值與其相差會很明顯。預測算法正是利用這種原理給出設備運行狀態的實時情況。該算法思想的實現過程如下步驟I [初始化]. -0 ;步驟2[計算距離].計算向量O (該向量為接收到的實時的數據向量)與聚類結果集 C =中聚類的距離,計算距離的示意圖如附圖4所示,若《=0,轉至步驟4;若 =1 ,轉至步驟3 ;否則,令i =1-H ,轉至步驟2 ;步驟3[尋找最近距離].從距離集合*# = {4,4,.-.<}中找到一個^使得《 力集合 d中的最小值;步驟4 [確定相似模型].根據沁確定聚類模型在聚類結果集中的序號為i,即相似的聚類模型為G;步驟5 [計算預測向量].根據聚類模型q得到向量·的預測向量,得到預測向量的示意圖如附圖5所示。
根據階段一學習算法設定預測向量安全範圍。該安全範圍可根據設備可靠性要求調整範圍大小,並輔以超範圍報警機制,即可更好實現大型設備的狀態監測、預警診斷坐 寸ο
本發明按照優選實施例進行了說明,應當理解,但上述實施例不以任何形式限定 本發明,凡採用等同替換或等效變換的形式所獲得的技術方案,均落在本發明的保護範圍 之內。
權利要求
1.一種基於海量數據挖掘的設備狀態預測方法,其特徵在於包括階段一學習算法;階段二 預測算法; 所述階段一學習算法包括步驟如下 反映設備歷史運行狀態的數據樣本作為訓練數據集B = .,.,Oj ,聚類結果的類集合為 C,其中,Vl={1,2, o, = ( ,...OmX為數據集U中向量的第fc維參數的值為每個數據向量的維度; 步驟I [初始化]:C = # ,讀入第一個訓練數據向量並對其標準化,記錄結果為O1,生成初始聚類^ ,並記錄 upper limit 和 lower limit , C = {(^ ; 步驟2[處理新數據向量]:讀入一個新的訓練數據向量並對其標準化,記錄結果為O2,如果彐Cj- e C,使得 dis Ibd Csfoi^Cj)= O,那麼轉至步驟3,否則轉至步驟4 ; 步驟3
=Cjf = CjUOl,同時更新€^ 的參數,現有的類總個數不變; 步驟4 [ Of自成一類]:山Cm1 = 0 } , C = Cu。其中n為聚類結果集中聚類的個數; 步驟5 :所有歷史訓練數據向量都已經處理完,則階段一終止;否則,返回步驟2 ; 階段二 預測算法包括如下步驟 步驟6 [初始化];步驟7[計算距離]:計算向量o與聚類結果集C =CiJ中聚類的距離,若4 = 0,轉至步驟9 ;若轉至步驟8 ;否則,令# = £+1,轉至步驟7 ; 步驟8[尋找最近距離]:從距離集合中找到一個沁,使得rff為集合d中的最小值; 步驟9 [確定相似模型]:根據嶙確定聚類模型在聚類結果集中的序號為f,即相似的聚類模型為G; 步驟10[計算預測向量]:根據聚類模型q得到向量0的預測向量rf。
2.根據權利要求1所述的方法,其特徵在於根據階段一學習算法設定預測向量安全範圍。
全文摘要
本發明屬於基於工業設備海量數據的數據挖掘領域,提供一種設備狀態預測方法,該方法從歷史數據中充分挖掘有用知識,結合設備實時情況對設備狀態進行的有效的預測,能在較低開銷下以較高的效率完成知識學習,並且實時的給出設備狀態的預測與診斷結果,為企業實現大型設備的狀態監測、預警診斷等起到良好的作用。
文檔編號G06K9/62GK103020006SQ20111028614
公開日2013年4月3日 申請日期2011年9月24日 優先權日2011年9月24日
發明者唐勝, 胡潔 申請人:國家電網公司, 江蘇瑞中數據股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀