機器狀態監控中異常檢測的條件相關性建模的系統和方法
2023-04-29 03:00:36 2
專利名稱:機器狀態監控中異常檢測的條件相關性建模的系統和方法
技術領域:
本公開涉及基於傳感器輸出監控機器狀態(condition)的方法。
背景技術:
機器狀態監控任務是為了儘早檢測出機器異常和故障,以避免對機器的進一步損害。這可以通過分析安裝在機器不同部分的一組傳感器數據,以及測量如溫度,壓力,震動等指示器而實現。當機器操作正常時,全部的傳感器遵循特定關係。在監控期間,違背這種關係或相關性(cbpendency)可指示故障。傳感器值的這種關係可以以概率P (x)的形式數學地表示,其中χ為所有傳感器值在數據點的向量。如果POO大於閾值Τ,機器操作正常,否則,檢測到異常。這是許多現有技術監控技術背後的基本思想。該傳感器可以被劃分為兩種類別。 向量X可以表示到該機器的輸入的傳感器值,如氣流,入口溫度。向量y可以表示該機器的操作的輸出的傳感器值,如各種溫度,壓力,震動傳感器值。基於此條件概率的典型監控模型如下y = f (x) +e (1)在式(1)中,y= [yph,...,yM]T*M 維向量,且 X = [X1, &,. . .,%]τ 為 N 維向量。f(x) = [100,400,...,400]!1為函數向量,其中每個乙00作為預測一個輸出值
所有輸入值的公式。e= [ei,e2,...,eM]T*另一表示模型誤差的M維向量。假定e服從具有零均值和對角協方差矩陣的高斯分布P(e) =N(e|0,σ2ΙΜ),其中Im為MXM的單位矩陣,且σ 2為方差。在該公式中, 都是彼此獨立的。因此,給定式(1)時,P(y|x)服從高斯分布P(y|x) = N(y|f(x), σ 2Im) (2)至少有兩種方法將式⑴應用於異常檢測。首先,可以將P(y|x)或P(y|x)的對數似然(log likelihood)與閾值T比較。如果In P(y|x) > T,機器操作正常,否則存在異常。其次,計算出7 1與乙(》的偏差,或ym_fm(x)。如果偏差大於S(另一固定閾值),存在異常,因為ym與其均值&00的差異太大。注意參考文獻[5]為一種上下文異常檢測的方法。給定乂時71,72,...,7 的條件獨立性假定,如式(2)中所示,提出了問題。如果Y1 和y2僅僅由χ確定,給定χ時假定I1,12是條件獨立的是有效的。但是,一旦存在一些未知變量(向量)U,Y1和y2就會彼此相關。這會在機器狀態監控應用中經常發生,因為許多系統輸入,如氣體質量和空氣濃度水平,不會被任何傳感器測量到。該隱藏變量U表示這種缺失的信息。只有當所有的信息,χ和u 二者,都被給出,才可以說Y1和y2是獨立的P(Yl, y21 χ, u) = P(yi|x,u)P(y2|x,u)。因此,式⑵應被修改以處理給定χ時y的條件相關性(conditional dependence)。圖1圖解說明了簡單情況中的條件相關性,在該情況中M = 2,yi和y2的相關性與 X和u有關,其中χ已知而u為未知隱藏向量。71和72中的每一個取決於χ和u 二者。
發明內容
如在這裡描述的本發明的示例性實施例通常包括系統和方法,用於通過邊緣化(marginalize)隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。根據本發明的一個實施例,條件概率P(y|x)用於異常檢測(也稱為上下文 (contextual)異常檢測),其中In P(y|x)與T相比較。為了檢測機器系統的異常,根據本發明的一個實施例,假定有一些未知隱藏輸入值,也需要該未知隱藏輸入值來確定輸出。如果給定所有已知輸入值和隱藏的輸入值,輸出值可以視為條件獨立的。否則,更實際地,輸出值是條件相關的。根據本發明的一個實施例,給出了具有解析解的線性模型。測試結果證明了依據本發明一個實施例的算法的有效性。根據本發明的一個方面,提供了一種方法,用於預測機器傳感器監控系統的傳感器輸出值,該方法包括為監控機器性能的多個傳感器提供一組輸入傳感器數據X和一組輸出傳感器數據Y;通過最大化邊緣化條件概率函數P (Y Ix)的對數(logarithm)來習知將輸入傳感器數據映射到輸出傳感器數據的函數關係,其中描出傳感器數據Y相對於未知隱藏機器輸入u的相關性已被邊緣化;提供另一組輸入傳感器數據X』 ;以及利用輸入傳感器數據X'和邊緣化的條件概率函數P (Y |X)計算輸出傳感器數據Y'的期望值,其中所計算的期望值反映了輸出傳感器數據Y"相對於未知隱藏機器輸入u的相關性。根據本發明的另一個方面,將輸入傳感器數據映射到輸出傳感器數據的函數關係為y = f (x,u) = Ax+Bu,其中χ和y分別為輸入傳感器數據X和輸出傳感器數據Y的向量, u是表示未知隱藏輸入值的向量,且A和B為該模型的矩陣參數。根據本發明的另一個方面,給定χ時對於函數關係f (x,u) = Ax+Bu,y的條件概率為 P(y|x) = N(y|Ax, BBt+σ 2Im),並且習知函數關係 f (x,u) = Ax+Bu 包括通過 A = (YXt) (XXt)―1估計A,通過(Y-AX) (Y-AX)T/L的前K個特徵向量估計B,且通過(Y-AX) (Y_AX)T/L的剩餘L-K個次分量(minor component)的均方差計算σ 2。根據本發明的另一個方面,所述邊緣化條件概率函數Ρ(Υ|Χ)的對數使用梯度下降最優化法(gradient descent optimization)而最大化。根據本發明的另一個方面,所述邊緣化條件概率函數P(Y|X)的對數使用期望值最大化算法而最大化。根據本發明的另一個方面,梯度下降最優化法用在期望值最大化算法的每次迭代處。根據本發明的另一個方面,將輸入傳感器數據映射到輸出傳感器數據的函數關係為y = f (X,u)+e,其中f (X,u)被向量θ參數化;y為表示輸出傳感器數據值y的M維向量;χ為表示輸入傳感器數據值χ的N維向量;且u為K維向量,表示未知隱藏機器輸入;且e為M維向量,表示建模誤差,e具有均值為零、標準偏差為O2Im的高斯分布P(e) =N(e|0, o2IM),其中Im為MXM的單位矩陣。根據本發明的另一個方面,邊緣化條件概率函數Ρ(Υ|Χ)通過積分P(y χ)= f沾(7|^斤(11)(111所計算,其中?(7|1,11) =N(y|f(x,u), σ 2Im)為給定輸入傳感器數據值χ和未知隱藏機器輸入u時輸出傳感器數據值y的條件概率;N為高斯分布,其均值通過 f(x, u)給出;而標準偏差通過O2Im給出,其中Im為MXM的單位矩陣,且P(U) =N(u|0, Ik)為均值為O、標準偏差為Ik的u的高斯概率分布,其中Ik為KXK的單位矩陣。根據本發明的另一個方面,K由交叉驗證確定。根據本發明的另一個方面,提供了一種計算機可讀的程序存儲設備,有形地包含計算機可執行以便執行預測機器傳感器監控系統的傳感器輸出值的方法步驟的指令程序。
圖1根據本發明的一個實施例圖解例示給定X時yi和y2的條件相關性。圖2是依據本發明的一個實施例的方法的流程圖,該方法通過邊緣化隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。圖3是根據本發明的一個實施例的對於所選輸入值的傳感器值的圖。圖4是依據本發明的一個實施例用於實現方法的示例性計算機系統的框圖,該方法用於通過邊緣化隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。
具體實施例方式如在這裡描述的本發明的示例性實施例通常包括系統和方法,用於通過邊緣化隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。相應地,儘管本發明容許各種修改和替換形式,其特定實施例通過例子在附圖中示出並且將在此詳細描述。應當理解的是,不意圖限制本發明於公開的特定形式,相反地,發明涵蓋了落入本發明精神和範圍內的所有修改、等同和替換物。模型依據本發明的一個實施例,以下的模型可以處理y1; y2,..., yM的條件相關性y = f (x, u)+e,(3)其中函數f(x,u)由參數向量θ參數化,且誤差項e表示測量中的噪聲影響。在利用徑向基函數(radial basis function)表示f的情況下,θ可以表示核寬度(kernel Width)和每個核的係數。!(維向量!!二^^ 卜…,!^^表示圖!中的隱藏向量。依據本發明的一個實施例,假定u具有固定的高斯分布P(u) = N(u I 0,Ik)(4)參數U(如果存在的話)將由函數f承載。依據本發明的一個實施例,可以假定K 是已知的。依據本發明的其它實施例,K可以通過交叉驗證習知。誤差e同樣具有固定的高斯分布P(e) =N(e|0,σ2ΙΜ),並且表示與式(1)中相同的建模誤差。式(3)具有以下的條件概率P(y|x,u) = N(y|f(x,u), σ 2Im) (5)
式(5)指示,如果χ和u都被給定,y1; y2,...,yM是獨立的。然而實際上,u是未知的,所以對u進行邊緣化P (y I χ) = / UP (y | x,u) P (U) du(6)依據本發明一個實施例的模型可以通過式(3),(4), (5)和(6)定義。在訓練階段期間,給定一組訓練數據X= [X1, X2,..., xL]和Y= [yi,y2,...,yJ, 將習知f(x,u)的參數θ和式(5)的方差σ2。注意,沒有u可用於訓練。依據本發明的實施例,可以通過最大化訓練數據的對數似然來完成訓練Max In P(y | χ)
θ,σ2(7)對於未來的測試數據,如果lnP(y|x) > T,機器正常操作;否則,就有異常。由於式(6)通常不具備解析形式(analytic form),最大化式(7)涉及迭代。依據本發明的實施例,存在求解式(7)的至少有三種方式。第一種方法依據本發明的實施例,採用標準梯度下降最優化方法。第二種方法依據本發明實施例,採用期望值最大化(EM)算法。第三種方法依據本發明的實施例在EM迭代循環中結合了梯度下降。依據本發明的實施例,f (X,u)的線性模型具有形式f(x,U) = Ax+Bu,(8)其中矩陣A和B是函數f的參數,即θ = {Α, B}。在這種情況下,式(6),給定χ 時y的條件概率具有高斯分布,並因此具有解析形式P(y|x) = N(y|Ax, BBt+σ2ΙΜ) (9)在依據本發明實施例的線性模型中,式(6)可以一趟就被最大化。首先,估計A A = (YXt) (XXt)(10)一旦A已知,式⑶縮小為概率主分量分析模型(PPCA)。B對應於(Y-AX) (Y-AX) Vl的前κ個特徵向量。σ 2是剩餘L-κ個次分量的均方差,其中L是以上訓練組χ和γ中的每一個中的項數。圖2是依據本發明的一個實施例概述方法的流程圖,該方法通過邊緣化隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。參照該圖,依據本發明的實施例的方法,通過分別提供輸入數據和輸出數據組X和Y而開始於步驟21。這些訓練數據組在步驟22中,被用來最大化邊緣化條件概率函數P (Y IX)的對數似然。對於依據本發明實施例的通用模型,該最大化可以涉及以上公開的方法中的一種,例如梯度下降或期望值最大化。對於根據本發明實施例的線性模型,來自式(9)的P(y|x) = N (y I Ax, BBt+σ2ΙΜ) 的對數似然通過根據式(10)估計A = (YXt) (XXt)"1而被最大化,並且隨後為B和ο 2求解該PPCA模型。在步驟23中,提供實際測試數據的數據組V,並且該數據在步驟M中用來根據P(y|x) =N(y|Ax, BBt+σ2ΙΜ)的對數似然計算輸出數據值y的期望值。測試結果來自於歐洲聯合循環發電廠的燃氣輪機的數據被用來測試依據本發明實施例的算法。總共利用了 35個傳感器。輸入χ包括N =3的過程驅動因子(process driver)氣流、入口溫度和入口導葉(IGV)致動器位置。輸出y包括M =32的葉片路徑溫度傳感器 BPTC1A、BPTC1B、. . .、BPTC16A和BPTC16B。總共有2279個數據點,都表示燃氣輪機的正常操作。圖3示出了在這2279個數據點處輸出傳感器BPTClA的傳感器值的圖。每個傳感器值被歸一化為零平均值和單位標準偏差。L = 1140個數據點被隨機選來進行訓練,並且剩餘的1139個數據點被用來進行測試。依據本發明的實施例,線性模型被測試。對於這個測試K被置為2。利用依據本發明實施例的線性模型,A,B和ο2相繼被習知。習知的模型隨後被應用於評估測試數據。對於每個測試數據點i,計算InP(YiIxi),其中P (y Ix)由式(9)定義。最後的測試分數是所有 1139個InP (yi |Xi)值的和。依據本發明的一個實施例,該測試分數為7795。因為該數據組包括了所有的正常數據點,較高的測試分數意味著數據點能夠通過lnP(yi|Xi) > T的異常檢測測試。依據本發明的另一個實施例,考慮相似的模型而不採用隱藏變量U。其等同於依據本發明實施例的線性模型,其中用f(x) =Ax來替換式(8),以及用P(y|x) =N(y|Ax, σ2ΙΜ)來替換式(9)。該模型的測試分數現在就極低_9164。這證明了依據本發明實施例的模型能夠對給定χ時的y的條件概率進行建模。系統實施可以理解的是本發明實施例可以被實施為硬體、軟體、固件、專用過程或其組合的各種形式。在一個實施例中,本發明可以在軟體中被實施為應用程式,有形地包含在計算機可讀程序存儲裝置上。該應用程式可以被上傳到包含任何合適架構的機器且被其執行。圖4是依據本發明的一個實施例用於實現方法的示例性計算機系統的框圖,該方法用於通過邊緣化隱藏輸入值來對給定輸入傳感器值時的輸出傳感器值的條件相關性進行建模。現在參照圖4,用來實現本發明的計算機系統41尤其可以包括中央處理單元 (CPU)42,存儲器43和輸入/輸出(I/O)接口 44。該計算機系統41通常通過I/O接口 44 耦合到顯示器45和各種輸入設備46,例如滑鼠和鍵盤。支持電路可以包括例如緩存、電源、 時鐘電路和通信總線這樣的電路。存儲器43可以包括隨機存取存儲器(RAM)、只讀存儲器 (ROM)、磁碟驅動器、磁帶驅動器等,或其組合。本發明可以實現為存儲在存儲器43中的例程47,並且由CPU42執行來處理來自信號源48的信號。因此,計算機系統41是通用計算機系統,其在執行本發明的例程47的時候成為專用的計算機系統。計算機系統41同樣包括作業系統和微指令代碼。在此描述的各種處理和功能可以是微指令代碼的一部分或者是通過作業系統執行的應用程式(或其組合)的一部分。除此以外,各種其他外圍設備可以連接到計算機平臺上,比如附加的數據存儲設備和列印設備。進一步可以理解的是,由於附圖描述的一些構成系統組件和方法步驟可以實施為軟體,系統組件(或過程步驟)之間的實際連接可能根據本發明被編程的方式而不同。給定在此提供的本發明的教導,本領域的普通技術人員將能夠預期本發明的這些及相似的實現或配置。
權利要求
1.一種預測機器傳感器監控系統的傳感器輸出值的計算機實現方法,包括以下步驟 為監控機器性能的多個傳感器提供一組輸入傳感器數據X和一組輸出傳感器數據Y ; 通過最大化邊緣化條件概率函數P(YIX)的對數,習知將輸入傳感器數據映射到輸出傳感器數據的函數關係,其中輸出傳感器數據Y相對於未知隱藏機器輸入U的相關性被邊緣化;提供另外一組輸入傳感器數據X';以及使用輸入傳感器數據X'和邊緣化條件概率函數P(YlX)計算輸出傳感器數據Y'的期望值,其中所計算的期望值反映了輸出傳感器數據Y"相對於未知隱藏機器輸入U的相關性。
2.根據權利要求1的方法,其中將輸入傳感器數據映射到輸出傳感器數據的函數關係為y = f (x,u) = Ax+Bu,其中χ和y分別為輸入傳感器數據X和輸出傳感器數據Y的向量, u為表示未知隱藏輸入值的向量,且A和B為模型的矩陣參數。
3.根據權利要求2的方法,其中給定χ時對於函數關係f(X,u) = Ax+Bu, y的條件概率為 P(y|x) =N(y|AX,BBT+。2IM),並且習知函數關係 f(x,u) = Ax+Bu 包括通過 A= (YXt) (XXt)―1估計A,通過(Y-AX) (Y-AX)T/L的前K個特徵向量估計B,且通過(Y-AX) (Y_AX)T/L的剩餘L-K個次分量的均方差計算ο2。
4.根據權利要求1的方法,其中所述邊緣化條件概率函數P(YlX)的對數使用梯度下降最優化法而最大化。
5.根據權利要求1的方法,其中所述邊緣化條件概率函數P(YlX)的對數使用期望值最大化算法而最大化。
6.根據權利要求5的方法,其中梯度下降最優化法用在期望值最大化算法的每次迭代處。
7.根據權利要求1的方法,其中將輸入傳感器數據映射到輸出傳感器數據的函數關係為y = f(x, u)+e,其中f(x,u)被向量θ參數化,y為表示輸出傳感器數據值y的M維向量,χ為表示輸入傳感器數據值χ的N維向量,且u為表示未知隱藏機器輸入的K維向量, 且e為表示建模誤差的M維向量,e具有均值為零、標準偏差為O2Im的高斯分布P(e)= N(e|0, σ 2Im),其中Im為MXM的單位矩陣。
8.根據權利要求7的方法,其中邊緣化條件概率函數Ρ(Υ|Χ)通過積分P(y|x)= / 1^(7|^斤(11)(111所計算,其中?(7|1,11) =N(y|f(x,u), σ 2Im)為給定輸入傳感器數據值χ和未知隱藏機器輸入u時輸出傳感器數據值y的條件概率;N為高斯分布,其均值通過 f(x, u)給出;而標準偏差通過O2Im給出,其中Im為MXM的單位矩陣,且P(U) =N(u|0, Ik)為均值為O、標準偏差為Ik的u的高斯概率分布,其中Ik為KXK的單位矩陣。
9.根據權利要求7的方法,其中K由交叉驗證確定。
10.一種預測機器傳感器監控系統的傳感器輸出值的計算機實現方法,包括以下步驟為監控機器性能的多個傳感器提供一組輸入傳感器數據X和一組輸出傳感器數據Y ; 提供將輸入傳感器數據y映射到輸出傳感器數據X的函數關係y = f (x,u) = Ax+Bu, 其中χ和y分別為輸入傳感器數據X和輸出傳感器數據Y的N維和M維向量,u是表示未知隱藏輸入值的K維向量,且A和B為函數關係的未知矩陣參數,其中給定χ時對於函數關係f(x,u) =Ax+Bu,y的條件概率為P(y|x) = N (y | Ax,BBt+ο 2Im),其中N為均值為Αχ、準偏差為BBt+ σ 2Im的高斯分布,其中Im為MXM的單位矩陣;通過 A= (YXt) (XXt)-1 估計 A ;通過(Y-AX) (Y-AX)VL的前K個特徵向量估計B ;以及通過(Y-AX) (Y-AX)VL的剩餘L-K個次分量的均方差計算σ 2。
11.根據權利要求10的方法,進一步包括提供另外一組輸入傳感器數據X』 ;以及使用輸入傳感器數據X'和邊緣化條件概率函數P(YlX)計算輸出傳感器數據Y'的期望值,其中所計算的期望值反映了輸出傳感器數據Y"相對於未知隱藏機器輸入u的相關性。
12.根據權利要求10的方法,其中該函數關係進一步包括M維向量項e,該e表示建模誤差,分布為均值為零、標準偏差為o2IM&P(e) =N(e|0, σ 2Im),其中Im為MXM的單位矩陣。
13.一種計算機可讀的程序存儲設備,有形地包含計算機可執行以便執行預測機器傳感器監控系統的傳感器輸出值的方法步驟的指令程序,該方法包括以下步驟為監控機器性能的多個傳感器提供一組輸入傳感器數據X和一組輸出傳感器數據Y ;通過最大化邊緣化條件概率函數P(YIx)的對數,習知將輸入傳感器數據映射到輸出傳感器數據的函數關係,其中輸出傳感器數據Y相對於未知隱藏機器輸入U的相關性被邊緣化;提供另外一組輸入傳感器數據X』 ;以及使用輸入傳感器數據X'和邊緣化條件概率函數P(YlX)計算輸出傳感器數據Y'的期望值,其中所計算的期望值反映了輸出傳感器數據Y"相對於未知隱藏機器輸入U的相關性。
14.根據權利要求13的計算機可讀的程序存儲設備,其中將輸入傳感器數據映射到輸出傳感器數據的函數關係為y = f (x,u) = Ax+Bu,其中χ和y分別為輸入傳感器數據X和輸出傳感器數據Y的向量,u為表示未知隱藏輸入值的向量,且A和B為模型的矩陣參數。
15.根據權利要求14的計算機可讀的程序存儲設備,其中給定χ時對於函數關係f(X, u) = Ax+Bu, y的條件概率為P(y|x) =N(y|Ax, BBt+σ 2Im),並且習知函數關係f (x,u)= Ax+Bu包括通過A= (YXt) (XXt) ―1估計A,通過(Y-AX) (Y_AX) T/L的前K個特徵向量估計B, 且通過(Y-AX) (Y-AX)VL的剩餘L-K個次分量的均方差計算ο 2。
16.根據權利要求13的計算機可讀的程序存儲設備,其中所述邊緣化條件概率函數 P(Ylx)的對數使用梯度下降最優化法而最大化。
17.根據權利要求13的計算機可讀的程序存儲設備,其中所述邊緣化條件概率函數 P(YlX)的對數使用期望值最大化算法而最大化。
18.根據權利要求17的計算機可讀的程序存儲設備,其中梯度下降最優化法用在期望值最大化算法的每次迭代處。
19.根據權利要求13的計算機可讀的程序存儲設備,其中將輸入傳感器數據映射到輸出傳感器數據的函數關係為7 = €(^)+^其中€0^,11)被向量θ參數化,y為表示輸出傳感器數據值y的M維向量,χ為表示輸入傳感器數據值χ的N維向量,且u為表示未知隱藏機器輸入的K維向量,且e為表示建模誤差的M維向量,e具有均值為零、標準偏差為σ 2Im 的高斯分布=P (e) =N(e|0, σ 2Im),其中Im為MXM的單位矩陣。
20.根據權利要求19的計算機可讀的程序存儲設備,其中邊緣化條件概率函數P(Y |Χ) 通過積分P(y|x) =/ {(又!^斤㈦如所計算,其中?…^) =N(y|f(x, u), σ2 Μ)為給定輸入傳感器數據值χ和未知隱藏機器輸入u時輸出傳感器數據值y的條件概率;N為高斯分布,其均值通過f(x,u)給出;而標準偏差通過O2Im給出,其中Im為MXM的單位矩陣,且P(u) =N(u|0, Ik)為均值為O、標準偏差為IkWu的高斯概率分布,其中、SKXK 的單位矩陣。
21.根據權利要求19的計算機可讀的程序存儲設備,其中K由交叉驗證確定。
全文摘要
本發明涉及對機器狀態監控中的異常檢測的條件相關性建模的系統和方法。一種預測機器傳感器監控系統的傳感器輸出值的方法包括為監控機器性能的多個傳感器提供(21)一組輸入傳感器數據X和一組輸出傳感器數據Y;通過最大化邊緣化條件概率函數P(Y|X)的對數,習知(22)將輸入傳感器數據映射到輸出傳感器數據的函數關係,其中輸出傳感器數據Y相對於未知隱藏機器輸入u的相關性被邊緣化;提供(23)另外一組輸入傳感器數據X』;以及使用輸入傳感器數據X′和邊緣化條件概率函數P(Y|X)計算(24)輸出傳感器數據Y′的期望值,其中所計算的期望值反映了輸出傳感器數據Y″相對於未知隱藏機器輸入u的相關性。
文檔編號G05B13/04GK102566421SQ201110349130
公開日2012年7月11日 申請日期2011年9月16日 優先權日2010年9月17日
發明者袁超 申請人:西門子公司