基於多分類器和d-s證據融合的工業過程故障診斷方法
2023-10-21 02:49:52 3
基於多分類器和d-s證據融合的工業過程故障診斷方法
【專利摘要】本發明公開了一種基於多分類器和D-S證據融合的工業過程故障診斷方法,該方法首先根據對工業過程的故障數據進行獨立重複採樣,然後對新的訓練數據應用多個分類器方法,獲得各自的離線建模模型,同時每個分類器方法的性能以融合矩陣的形式表現。然後,通過D-S證據理論計算不同類別的基本概率賦值函數,根據相似性指數,對多個分類器決策進行選擇性集成和綜合,求得聯合基本概率賦值函數,通過比較,獲得最後的分類診斷結果。相比目前的其它方法,本發明可以大大提高工業過程的診斷效果,減小延遲診斷時間,提高診斷準確率,很大程度上改善了監測性能,增強了過程操作員對過程的理解能力和操作信心,更加有利於工業過程的自動化實施。
【專利說明】基於多分類器和D-S證據融合的工業過程故障診斷方法
【技術領域】
[0001]本發明屬於工業過程控制領域,尤其涉及一種基於多分類器和Dempster-Shafer(D-S)證據融合的工業過程故障診斷方法。
【背景技術】
[0002]近年來,工業生產過程的監測問題越來越得到工業界和學術界的廣泛重視。一方面,實際的工業過程因為其過程複雜,操作變量多,存在非線性、非高斯、動態性等階段,在單一假設下,運用某一種方法,其監測效果有很大的局限。另一方面,如果不對過程進行很好的監測,並對可能發生的故障進行診斷,有可能會發生操作事故,輕者影響產品的質量,重者將會造成生命和財產的損失。因此,找到更好的過程監測方法、並進行及時正確地預報已經成為工業生產過程的研究熱點和迫切需要解決的問題之一。
[0003]傳統的工業過程監測方法除了基於機理模型的方法外,大多採用多元統計分析方法,比如主元分析方法(PCA)和偏最小二乘方法(PLS)等。在機理模型難以獲取的情況下,基於數據驅動的多元統計分析方法已經成為工業過程監測的主流方法。但是,傳統的多元統計分析方法都存在一些基本的假設條件,比如主元分析方法(PCA)的假設條件是數據服從獨立同分布,且假設過程服從線性的高斯分布,但實際過程卻相對複雜,過程可能是一部分線性、一部分非線性或者一部分非高斯的結合。而想找到一種適用於各種環境的方法是不可能的。相比之下,將多種不同假設條件下的方法進行集成,即信息融合方法在處理複雜工業過程的監控和故障診斷方面有其自身的優勢,本發明採用該方法替代原有的單一多元統計分析方法對過程故障進行診斷。為了提高融合的效果,在增加分類器多樣性上,可以先對訓練數據進行重複採樣預處理,並且利用一定的相似性指標,有選擇的進行融合。傳統的監測方法假設過程運行在單一條件下,已經無法滿足實際工業過程的監測要求。即使對過程的不同工作條件分別進行建模,也無法達到滿意的監測效果。因為對新的過程數據進行監測時,需要結合過程知識對該數據的工作條件進行判斷,並選取相應的監測模型,這就大大增強了監測方法對過程知識的依賴性,不利於工業過程的自動化實施。
【發明內容】
[0004]本發明的目的在於針對現有技術的不足,提供一種基於多分類器和D-S證據融合的工業過程故障診斷方法。
[0005]本發明的目的是通過以下技術方案來實現的:一種基於多分類器和D-S證據融合的工業過程故障診斷方法,包括以下步驟:
[0006](I)利用系統收集過程正常運行的數據以及各種故障數據組成建模用的訓練樣本集:假設故障類別為C,再加上一個正常類,建模數據的總類別為C+1,即,Xi=Lx1Ix2;...;xn],i=l,2,...,C+l ;其中 Xi e RnXm, R 為實數集,Rnxm 表示 X 滿足 nXm的二維分布,η為每一類的樣本數,m為過程變量數;那麼完整的訓練樣本集為X且X=[X1;X2;...;XC+1],X e R((G+1)to)Xm,將這些數據存入歷史資料庫;[0007](2)收集與訓練數據不同的另外的故障類數據,作為離線測試數據,總共C類,SP:Yj=Ly1; y2;...; yN],j=l, 2,...,C,其中Yj e RNXm,且N為每一類的樣本數,m為過程變量數;那麼完整的測試樣本集為Y,即Y=[Y1;Y2;...;YC],Y e R(WN)Xm,同時將這些數據存入歷史資料庫;
[0008](3)從資料庫中調用訓練樣本X,採用獨立重複採樣方法對每一類數據矩陣進行重排處理,並且保證重排規則一致,得到數據矩陣集
【權利要求】
1.一種基於多分類器和D-S證據融合的工業過程故障診斷方法,其特徵在於,包括以下步驟: (O利用系統收集過程正常運行的數據以及各種故障數據組成建模用的訓練樣本集:假設故障類別為C,再加上一個正常類,建模數據的總類別為C+1,即,Xi{x1;x2;...;xn],i=1,2,...,C+l ;其中 Xi ∈ RnXm, R 為實數集,Rnxm 表示 X 滿足 nXm的二維分布,η為每一類的樣本數,m為過程變量數;那麼完整的訓練樣本集為X且X=[X1;X2;...;XC+1],X e R((G+1)to)Xm,將這些數據存入歷史資料庫; (2)收集與訓練數據不同的另外的故障類數據,作為離線測試數據,總共C類,即:Yj=Ly1; y2;...; yN],j=l, 2,...,C,其中Yj ∈ RNXm,且N為每一類的樣本數,m為過程變量數;那麼完整的測試樣本集為Y,即Y=[Y1;Y2;...;YC],Y ∈ R(WN)Xm,同時將這些數據存入歷史資料庫; (3)從資料庫中調用訓練樣本X,採用獨立重複採樣方法對每一類數據矩陣進行重排處理,並且保證重排規則一致,得到數據矩陣集X ∈ R((c+1)*n)×m; (4)對數據隼文進行預處理和歸一化,即在每一個類別內,分別使得各個過程變量的均值為零,方差為1,得到新的數據矩陣集為X ∈ R((c+1)*n)×m; (5)對數據集Y進行預處理和歸一化,即按照步驟4得到的各類訓練樣本的均值和方差,使得在每一個類內,各個過程變量的均值為零,方差為1,得到新的數據矩陣集為Y ∈ R(C*N)xm ; (6)選擇分類器方法的個數為G,包括無監督方法和有監督方法,調用不同的分類器,在訓練數據集交下建立不同的分類器模型,對無監督模型計算相應的T2和SPE統計量的檢測統計限;對有監督模型計算相應的標籤指標; (7)在測試數據集f下,利用不同的分類器模型及其參數,離線計算每一個分類器方法的融合矩陣; (8)根據提出的相似性指數,計算不同分類器方法之間的相似性,為之後的選擇性融合過程做準備; (9)將建模數據和各個模型參數,一起存入歷史資料庫和實時資料庫中備用; (10)收集新的在線過程數據,並對其進行預處理和歸一化; (11)分別採用不同的分類器模型進行監測,對於無監督模型,建立統計量T2和SPE統計量,對於有監督模型,得到相應的分類標籤; (12)通過D-S證據理論,利用融合矩陣中對不同故障檢出率的先驗知識,計算當前樣本在所有分類器方法下的綜合分類率,利用之前計算出的相似性指數,有選擇的進行融合,並做出最後決策。
2.根據權利要求1所述基於多分類器和D-S證據融合的工業過程故障診斷方法,其特徵在於,所述步驟3具體為:對與樣本數目相等,即為η的自然數數組進行隨機重複採樣,獲得一個新的自然數數組,按照該數組,將訓練樣本集X中每一個類別數據進行重新排列,重新構成新數據矩陣X
3.根據權利要求1所述基於多分類器和D-S證據融合的工業過程故障診斷方法,其特徵在於,所述步驟6具體為:根據選擇的對象特徵,為了能夠同時處理具有線性、非線性、非高斯的過程,選擇G為6,不同的多分類器方法具體包括:無監督方法:主元分析(PCA)、核主元分析(KPCA)、獨立主元分析(ICA);有監督方法:費舍爾判據(FDA)、k-近鄰(KNN)、神經網絡(BP-ANN); Ca)對於無監督的方法,具體實現步驟如下所示: (1)通過PCA分析,得到數據矩陣的協方差矩陣Σe Rnxn、酉矩陣U e RnXn、特徵值構成的對角矩陣D e Rnixni如下所示:
4.根據權利要求1所述基於多分類器和D-S證據融合的工業過程故障診斷方法,其特徵在於,所述步驟7具體為:對於測試數據集f: Ca)調用無監督的分類器方法,具體的實現步驟如下: (1)PCA方法,根據上述步驟中得到的各類參數,計算6類故障樣本在6種分類器方法下的T2和SPE統計量值,利用聯合該兩個統計量的指標來做故障重構,即,聯合判別指數λ i,如下所示:
5.根據權利要求1所述基於多分類器和D-S證據的工業過程故障診斷方法,其特徵在於,所述步驟8具體為:為了衡量不同分類器方法間的相似性,採用基於融合矩陣的相似性指數計算方法,如下所示:
6.根據權利要求1所述基於多分類器和D-S證據的工業過程故障診斷方法,其特徵在於,所述步驟11具體為:對於歸一化之後的新數據,分別採用不同的模型對其進行監測; (a)對於無監督的方法,建立相應的監測統計量如下: (1)對於PCA分析
7.根據權利要求1所述基於多分類器和D-S證據融合的工業過程故障診斷方法,其特徵在於,所述步驟12具體為: Ca)首先調用不同的分類器方法,計算出相應的基本概率賦值函數,如下:
【文檔編號】G05B23/02GK103914064SQ201410128630
【公開日】2014年7月9日 申請日期:2014年4月1日 優先權日:2014年4月1日
【發明者】張富元, 葛志強 申請人:浙江大學