使用三維pareto-front遺傳規劃開發的推理傳感器的製作方法
2023-05-21 06:19:31 1
專利名稱:使用三維pareto-front遺傳規劃開發的推理傳感器的製作方法
技術領域:
本發明涉及軟或者推理傳感器,並且更具體地,涉及使用三維 Pareto-front遺傳規劃技術開發的推理傳感器。
背景技術:
通常通過測量各種過程參數來監視和控制工業過程。這些過程參 數依賴於工業過程,可以包括例如溫度、壓力、流速等等。 一些相關 的過程參數可以在過程在線時相對容易地測量,例如使用硬體傳感器 測量。然而,其它過程參數可能難以在正常運行狀況下進行測量。己 經使用推理傳感器或者軟傳感器,來基於容易測量的過程參數(輸入 變量),推理這些難以測量的過程參數(輸出變量)。
在開發針對給定過程的推理傳感器的典型方案中,針對較寬範圍 的過程狀況,收集歷史數據。使用該歷史數據,可以使用多種技術來 開發經驗模型(empirical model),該模型可以基於可獲得的輸入變量, 來預測所需的輸出變量。線性回歸是潛在可用的一種技術。然而,在 實際應用中,由於工業過程大多數是非線性的,特別是化學工業中, 因此線性回歸僅具有有限的可應用性。
神經網絡模型已用於對非線性工業過程進行建模。然而,神經網 絡模型通常與多個不同問題相關聯。第一,神經網絡模型可能經歷面 對過程改變的高靈敏度。因此,這就需要頻繁的模型重開發和重調整。
第二,在用於模型開發的範圍之外時,神經網絡模型通常展示較 差性能。換言之, 一旦已經用給定範圍的值訓練了神經網絡模型,則 該神經網絡模型可能無法在該範圍之外進行正確地外推(extrapolate)。
不能外推對於特定工業過程來說可能造成災難性的後果,特別是在化 學工業中。
第三,神經網絡模型可以看作是"黑匣子",因為神經網絡模型可以在不清楚表示預測機制的情況下進行預測。從而,可能很難解釋神 經網絡模型。
第四,神經網絡模型可能難於實施和支持。它們可能要求專用軟 件和專用訓練。
因此,需要其它方法來開發能夠基於容易測量的過程參數來推理 難以測量的過程參數的推理傳感器。
發明內容
在第一主要方面,示例實施例提供了一種開發預測算法的方法, 所述預測算法用於基於多個輸入變量來預測至少一個輸出變量。根據 所述方法,獲得代表物理、化學或者生物過程的第一數據集合。所述 第一數據集合包括所述至少一個輸出變量的第一集合測量以及所述輸 入變量的相應第一集合測量。使用應用至少三個適合度準則的遺傳規 劃技術對多個候選算法進行進化。所述至少三個適合度準則包括(i) 精確性準則,用於評估每一個候選算法基於所述輸入變量的所述相應 第一集合測量來預測所述至少一個輸出變量的所述第一集合測量的能 力;(ii)複雜度準則,用於評估每一個候選算法的複雜度;以及(iii) 平滑性準則,用於評估每一個候選算法的非線性。選擇所述候選算法 之一作為所述預測算法。
在第二主要方面,示例實施例提供了一種監視物理、化學或者生
物過程的方法。根據所述方法,確定所述物理、化學或者生物過程的
多個可測量參數的當前值。向推理傳感器提供所述當前值。所述推理
傳感器被配置為使用至少一個預測算法,所述至少一個預測算法基於
所述可測量參數來預測所述物理、化學或者生物過程的附加參數,所 述至少一個預測算法是已經在精確性、複雜度、以及平滑性方面經過
優化的。所述推理傳感器使用所述至少一個預測算法,以基於所述可 測量參數的所述當前值來確定所述附加參數的推理值。
在第三主要方面,示例實施例提供一種用於監視物理、化學或者 生物過程的系統。所述系統包括(i)至少一個硬體傳感器,用於獲 得所述物理、化學或者生物過程的多個參數的測量值;以及(ii)推理傳感器,用於基於所述測量值來確定所述物理、化學或者生物過程 的附加參數的推理值,所述推理傳感器被配置為使用至少一個預測算 法來確定所述推理值,所述至少一個預測算法是已經使用遺傳規劃技 術在精確性、複雜度以及平滑性方面進行了優化的。
圖1示出了根據示例實施例的預測算法的節點表示。 圖2示出了根據示例實施例的開發預測算法的流程圖。
圖3示出了根據示例實施例的可以實施預測算法的處理系統的示意圖。
圖4示出了根據示例實施例,用於使用遺傳規劃來開發VOC排 放預測算法的設置參數的截屏。
圖5示出了根據示例實施例,對用於開發圖4的預測算法的函數 進行選擇的截屏。
圖6示出了根據示例實施例,圖4的預測算法預測的VOC排放 與訓練數據中的實際VOC排放的比較。
圖7示出了根據示例實施例,圖4的預測算法預測的VOC排放 與測試數據中的實際VOC排放的比較。
圖8示出了由神經網絡模型預測的VOC排放與圖7的測試數據 的比較。
具體實施方式
1、綜述
可以使用應用至少三個適合度準則的遺傳規劃技術來開發一種 預測算法,該預測算法用於基於多個輸入變量來預測至少一個輸出變 量。輸入變量和至少一個輸出變量可以與例如工業過程或者任意物理、 化學或者生物過程的多種過程參數相對應。在一個有利的方案中,輸 入變量可以與當過程在線時例如使用硬體傳感器而容易測量的參數相 對應,而至少一個輸出變量可以與難以測量的一個或者更多參數相對 應。這樣,可以在推理傳感器中使用該預測算法,以基於容易測量的
7過程參數(輸入變量)的值來推理一個或者更多難以測量的過程參數 (輸出變量)的值。然後監視和/或控制該過程的系統可以使用該推理 傳感器的輸出。
遺傳規劃技術可以用於開發可精確地再現代表了物理、化學或者 生物過程的歷史數據的預測算法。該歷史數據可以包括至少一個輸出 變量的多個測量(例如,在不同時間和/或不同運行狀況下獲得的)、 以及輸入變量的相應測量。
為了找到具有所需精確性的預測算法,遺傳規劃技術可以通過多 個代來對候選算法的群體進行進化。在每一代中,可以基於多種適合 度準則,對候選算法進行評估。在示例實施例中,應用三個適合度準 則(i)精確性準則,評估每一個候選算法以輸入變量的相應測量為
基礎來預測至少一個輸出變量的測量的能力;(ii)複雜度準則,評估 每一個候選算法的複雜度;以及(iii)平滑性準則,評估每一個候選 算法的非線性。應當理解,這些適合度準則僅作示例之用,可以應用 附加的和/或備選的適合度準則。
通過例如複製、雜交(crossover)、突變(mutation)等遺傳操作 的使用,允許將基於所應用的適合度準則的最適合的候選算法傳播進 入下一代。這樣,從一代到下一代,遺傳規劃技術對候選算法進行進 化,該候選算法平均而言漸進地變得更適合(由所應用的適合度準則 來判斷)。
最終,例如以代的數量為基礎或者由於滿足某個其它終止準則, 進化過程終止。然後可以檢查該階段的群體,以確定哪個候選算法位 於針對三個應用的適合度準則的三維Pareto-front上。Pareto-front算法
是群體內的如下算法無法在該群體中以另一算法提高針對一種適合 度準則的適合度,而不降低對於另一適合度準則的適合度。這樣,可 以認為Pareto-front算法對於三個適合度準則來說是"最優"的。然後, 可以基於其它選擇準則,從Pareto-front算法中選擇一個特定算法,作 為預測算法使用。
可以使用例如附加歷史數據,對選擇的預測算法進行進一步測 試。如果發現該預測算法可接受,則可以將其作為例如推理傳感器的一部分來在線使用,該推理傳感器對物理、化學或者生物過程的一個 或者更多參數進行推理。通過這種方式來開發預測算法,可以在精確 性、複雜度以及平滑性方面對該預測算法進行優化。
在這三個適合度準則方面的優化可以提供多種優點。具體地,精 確性準則對於精確的算法的開發非常有利。然而,應當理解,不同的 應用可能要求不同級別的精確性。因此, 一旦獲得所需級別的精確性, 其它準則就可以變得重要了。在這方面,複雜度準則有利於儉省的算 法的開發,這些算法可能在計算上更高效並且對於過程改變而言更魯 棒。平滑性準則有利於更加線性的算法的開發,這些算法進行良好外 推的可能性更大。考慮到過程參數的可變性,這最後一點特別重要。 即使使用輸入變量的值落入特定開發範圍內的歷史數據,來開發預測 算法,也可能希望在輸入變量的值落在開發範圍外時,該預測算法還 是保持精確。
因此,通過應用複雜度和平滑性以及精確性適合度準則,遺傳規 劃技術可以開發滿足精確性之外的其他目標的預測算法。例如,該技 術可以得到對於過程改變的魯棒性增強以及在開發範圍之外進行外推 的能力增強的預測算法。
2、預測算法的示例節點表示
在示例實施例中,使用遺傳規劃技術,以數學表達式形式來開發 預測算法。然後,可以使用該數學表達式,基於輸入變量的值來計算 輸出變量的值。這種數學表達式的例子如下
(1) V=[x/y+a exp(-z)]p 其中V是輸出變量,x、 y以及z是輸入變量,並且a和P是常數。 為了說明遺傳規劃技術,可以根據如何要解析數學表達式,以樹 結構來表示表達式。因此,可以通過如圖1所示的樹結構10來表示上述 數學表達式(l)。在樹結構10中,節點12-32表示函數、輸入變量以及 常數。具體地,節點28、 30和32分別表示輸入變量x、 y以及z。節點20 和16分別表示常數a和(3。節點24表示除法函數,如"/"符號所指示的。 節點26表示符號改變函數,如符號"-"所指示的。節點22表示指數函 數,如"exp"符號所指示的。節點18表示乘法函數,如"*"符號所指示的。節點14表示加法函數,如"+ "符號所指示的。節點12表示
冪函數,如"A"符號所指示的。
應當理解,表達式(1)以及相應的樹結構10僅作示例之用。一 般而言,由遺傳規劃開發的表達式可以包括任意數量的節點,並且這 些節點可以包括任意數量的函數、輸入變量以及常數。函數可以包括 代數函數(例如,加法、減法、乘法、除法、符號改變、平方根、冪 等等)、超越函數(transcendental function)(例如,指數、對數、正弦、 餘弦等等)、條件函數(例如,依賴於自變量是否滿足特定條件,比如 自變量是否大於零,而取不同值的函數)、或者其它類型的函數。然而, 函數不一定是數學函數。例如,如果輸入變量表示邏輯狀態,則函數 可以包括邏輯函數,比如與、或、異或以及非。作為另一示例,輸入 變量可以包括文本信息,在該情況中,函數可以包括字符串函數。還 可以使用其它類型的函數。
遺傳規劃技術的基本思想是通過應用對節點進行操作的遺傳操 作,來對表達式的群體進行進化,表達式的群體可以概念化為圖l中的 樹結構。對節點的操作可以涉及改變一個或更多節點的"突變"。例如, 突變可以將一個函數改變為另一個函數。因此,可以通過將節點18從 乘法函數改變為加法函數,對樹結構10進行突變。備選地,突變可以 影響一個或者更多的終端節點,即,表示輸入變量和常數的節點。因 此,可以通過將節點20從常數a改變為輸入變量,比如x,來將樹結構 IO進行突變。
節點的操作還可以涉及"雜交(crossover)"操作,在該操作中, 兩個表達式交換一個或者更多節點。例如,在樹結構10中,可以用從 另一個表達式中捐獻的一個或者更多節點來替代節點22、 26、 32。該 捐贈的節點可以包括不同的函數、不同的輸入變量、和/或不同的常數。 另外,由於雜交操作,表達式中的節點數量可以增加或者減少。例如, 樹結構10中表示exp (-z)的節點22、 26、 32可以用單個節點來替換, 比如用輸入變量z。備選地,可以用表示更大數量的節點的更複雜的表 達式,比如log (x+yz),來替代節點22、 26以及32。
儘管突變和雜交是典型的遺傳操作,但是應當理解,可以用其它方式來操作節點。作為一個例子,可以應用編輯操作。這種編輯操作 可以移除現有節點和/或向表達式中插入新節點,同時確保表達式整體 依然有效。作為另一個例子,可以應用簡化操作。這種簡化操作可以 嘗試對表達式進行簡化,例如通過用更簡單的等價的表達式來替代子 樹。因此,可以用新的常數來替代包括函數和常數但是沒有變量的子 樹。表達式的節點表示還可以用於其它目的。例如,表達式中節點的數量可以作為對該表達式的複雜度的度量。例如,由圖i中樹結構io表示的表達式具有ll個節點,可以認為它比節點數量更少的表達式復 雜,但是不及節點數量更多的表達式複雜。因此,本方案認為每一個 節點對於表達式的複雜度的貢獻是等量的。備選地,為了確定複雜度, 可以向不同的節點賦予不同的權重。作為一個例子,可以認為表示超 越函數的節點比表示加法函數的節點複雜,因此,在確定複雜度時, 向其賦予更多權重。作為另一個例子,可以按照從屬於節點的所有子樹中的節點數量,來計算該節點的複雜度加權。因此,根據"exp(-z)" 子樹中的三個節點、"-z"子樹中的兩個節點以及"z"子樹中的一個 節點,圖1中的節點22具有複雜度加權6。然後,樹結構10的複雜度可 以採用它的每一個節點(即節點12-32)的複雜度加權之和。 3、開發預測算法的示例方法圖2示出了用於使用遺傳規劃來開發預測算法的示例方法的流程 圖。在本示例中,針對物理、化學或者生物過程,對預測算法進行開 發,以基於多種輸入變量,預測特定輸出變量。該方法可以開始於選擇要用於幵發預測算法的歷史數據,如塊 100所示。歷史數據可以表示該預測算法預期應用的相同過程或者類似 過程。歷史數據可以包括多個數據點,每一個數據點包括輸出變量的 測量以及輸入變量的相應測量。數據中的一些或全部已被收集作為過 程的正常操作的一部分。備選地,數據可以是專門針對模型開發目而 已收集的,例如,通過使過程離線和/或通過系統地調整輸入參數而收 集的。另外,可以用多種方式來獲得這些測量。例如,可以使用硬體 傳感器來獲得對一個或者更多過程變量的直接測量。備選地,可以間接地獲得這些測量中的一些或全部,例如,通過推理傳感器進行推理 或者基於其它考慮而計算。在使用歷史數據來開發預測算法之前,歷史數據還可以經歷一個 或者更多預處理步驟。可以使用此類預處理來識別和去除野值。還可 以通過例如靈敏度研究,使用預處理步驟來確定哪些輸入變量與待預 測的輸出變量相關。因此,可以精選歷史數據,以集中在對最有可能 與感興趣的輸出變量相關的最可靠數據進行表示的測量上。可以將預處理後的歷史數據進一步分為要作為"訓練數據"用於 開發預測算法的第一集合、以及要用於測試所幵發的預測算法的第二 集合。這兩個集合可以定義輸入和/或輸出變量的不同範圍。通過使用 不同範圍,可以使用數據的第二集合來測試預測算法在用於開發的範 圍之外的外推能力。該開發方法中的另一個重要步驟是適合度準則的定義,如塊102 所示。適合度準則將用於評估通過遺傳規劃而進化的候選算法的適合 度。在示例實施例中,使用三個適合度準則(i)精確性準則,評估 每一個候選算法以歷史數據中的輸入變量的相應測量為基礎來預測至少一個輸出變量的能力;(ii)複雜度準則,評估每一個候選算法的復 雜度;以及(iii)平滑性準則,評估每一個候選算法的非線性。精確性準則可以應用對候選算法和歷史數據之間適合度的好壞 的任意統計測量。這種統計測量的例子包括相關係數和W值。基於統 計測量,候選算法越精確,則認為該候選算法更適合。複雜度準則可以向每一個候選算法應用複雜度測量。可以通過對 候選算法的樹結構表示中的節點或者級別的數量進行計數,來測量候 選算法的複雜度。備選地,可以向每一個節點給予複雜度加權,該復 雜度加權對整個表達式的複雜度做出貢獻。如上所述,可以將節點的 複雜度加權計算為從屬於該節點的每一個子樹的節點數量。基於複雜 度測量,候選算法越複雜,則認為該候選算法越不適合。平滑性準則可以對每一個候選算法應用非線性測量。基於非線性 測量,候選算法越非線性,則認為該候選算法越不適合。可以用多種方法來測量非線性。在一個方案中,可以通過應用由訓練數據定義的區間中的輸入變量的一定範圍的值,並且計算輸出變 量的相應值,來對候選算法進行採樣。然後,可以將候選算法的非線 性量量化為輸出變量的採樣值中的變化的量。在另一個方案中,可以在不同的採樣點,獲得候選算法的局部導數(local derivative)。然後, 可以將候選算法的非線性量量化為所採樣的導數中的變化的量。在另一個方案中,可以逐個節點地計算候選算法的非線性,其中, 確定表達式中每一個函數節點的非線性,並且將整個表達式的非線性 取為節點的非線性之和。可以用多種方法來確定節點的非線性,比如 通過上述的採樣技術或者通過多項式擬合。在後一種方案中,可以將 節點的非線性程度取為為了在訓練數據的區間中用多項式擬合該節點 函數至規定容差之內而需要的多項式次數(polynomial degree)。在示例實施例中,獨立地應用這三個適合度準則。例如,可以針 對這三個適合度準則中的每一個,對每一代中的候選算法進行評估, 並且可以判斷位於Pareto-front上的候選算法是最適合的。備選地,可 以對這三個適合度準則一起進行加權,來指定整體適合度準則。在該 情況中,可以判斷具有最高整體適合度的候選算法是最適合的。還可 以用其它方式來應用這三個適合度準則。除了定義適合度準則外,還需要為遺傳規劃操作設置其它參數, 如塊104所指示。 一個考慮可以是要用於遺傳規劃的函數集合,典型地 包括簡單的代數函數,比如加法、減法、乘法以及除法。然而,根據 問題的需要,也可以選擇其它類型的函數,比如條件函數和/或超越函 數。例如,當數據具有周期性時,可以選擇正弦和餘弦函數。另一方 面,可以避免某些函數,例如由於它們的非線性或者由於它們在計算 上的效率較差而避免這些函數。可以使用多種其它參數來設置候選算法的初始群體。例如,當隨 機生成初始群體時,可以指定用於選擇函數作為節點的概率。更高的 函數選擇概率傾向於導致更複雜的表達式。還可以指定候選算法的初 始群體的大小。在遺傳規劃操作的整個過程中,群體的大小可以保持 恆定。備選地,可以允許群體在預設界限內增大或減小。群體大小的 典型設置是在100至1000之間的值。圖4中示出了這些其它參數的典型設置。可以使用其它參數來定義遺傳規劃中使用的進化過程。例如,在 使用雜交操作的地方,可以使用可選擇參數來確定雜交生成"後代"所佔的分數(fmction)。可以使用另一可選擇參數來確定隨機的雜交 和受到引導的雜交的概率。在使用突變操作的情況下,可以使用可選 擇參數來確定候選算法經歷突變的概率,以及確定當突變的確發生時 對函數或者終端節點進行突變的概率。對終端節點進行突變的概率的 典型值是0.3。還可以定義一個或者更多終止條件以用於遺傳規劃操作。在一個 方案中,可以將遺傳規劃操作設置為運行固定數量的代。在典型的例 子中,代的固定數量可以從幾百至幾千代。然而,可以指定用於終止 遺傳規劃操作的其他條件。應當理解,這些設置參數僅作示例之用。可以使用其它可選擇參 數來定義遺傳規劃操作。此外,可以用多種方式來選擇用於不同的可 選擇參數的值,例如,任意的、基於"經驗(rules of thumb)"的、基 於反覆試驗(trial-and-error)的、或者基於其它考慮的,比如試驗的 統計設計。一旦已對遺傳規劃操作進行了設置,就可以建立候選算法的初始 群體,如塊106所示。在一些情況下,可以隨機生成初始候選算法。例 如,可以隨機選擇用於頂級節點的函數。然後可以隨機選擇從屬節點 (例如,應用用於選擇函數或者終止節點的預設概率),直到創建了完 整的樹結構為止。備選地,可以基於其它考慮來選擇初始候選算法中的一些或者全 部。例如,較早的研究(經驗或者理論上)可能已經得到對一個或者 更多看起來有前景的算法的開發。可以將這些潛在有前景的算法包括 前在初始群體中。然後,如塊108所示,使用在塊100中選擇的歷史數據以及在塊102 中定義的適合度準則,對候選算法進行進化。在示例演進方案中,選 擇群體中最適合的候選算法,來生成"後代"算法,然後使用這些後 代算法來替代群體中最不適合的候選算法。例如,在示例實施中,將當前代作為算法的存檔(archive),通 過錦標賽(toumament)過程從該存檔中選擇"父輩"。在錦標賽方案中, 從存檔中隨機地選擇預定數量(例如3至5個)的潛在"父輩"算法。 然後使用錦標賽過程來確定"優勝者",S卩,將允許哪個潛在"父輩" 算法生成後代。在示例錦標賽過程中,"優勝者"可能是具有最高精確 性的兩個潛在"父輩"算法。然後,可以允許這兩個優勝者通過雜交 操作生成後代。應當理解,該錦標賽過程僅作示例之用,這是由於可 以使用其它方案來確定哪些候選算法生成後代。可以通過將一個父輩算法的子樹與另一個父輩算法的子樹結合 的雜交操作來生成後代算法。因此,兩個父輩算法可以交換子樹,以 生成兩個不同的後代算法。可以隨機地選擇用於雜交的子樹。然後,可以基於預選擇的突變概率,對後代算法進行突變。在一 個方案中,可以使用突變來改變候選算法中的一個節點(函數或者終 端節點,這依賴於遺傳規劃是如何設置的)。備選地,突變能夠改變候 選算法中的多個節點(例如,子樹)。另外, 一些突變可能增加或者減 少候選算法中節點的數量。例如,如果將僅具有一個從屬節點的函數 改變為具有兩個從屬節點的函數,則可以隨機地生成附加的終端節點。應當理解,雜交和突變操作的前述討論僅作說明之用。可以用多 種方式來應用雜交和突變操作。另外,可以使用其它遺傳操作來對候 選算法進行進化。可以用這種方式(例如,使用錦標賽方案來選擇"父輩")繼續 生成後代,直到達到由群體參數指定的後代的數量。然後,可以針對 精確性、複雜度以及平滑性準則,對包括"存檔"算法和"後代"算 法在內的所有候選算法進行評估。然後使用位於或者最接近 Pareto-front的"存檔"和"後代"算法的合併集合中的候選算法,來 構成新的存檔。可以將該新存檔的大小指定為"後代"群體的大小的百分比,例 如75%至100%。因此,使用100%的例子,可以使用100個算法的存檔 來生成100個後代。然後,將存檔和後代算法的合併集合中的200個算 法中的100個最適合的算法用於構成100個算法的新存檔。這樣,在精15確性、複雜度以及平滑性方面最適合的候選算法繼續到下一代,並且 隨著每一個後續代,候選算法平均上漸進地變得更適合。如塊110所示,候選算法可以這樣繼續進化,直到滿足終止條件。 當滿足終止條件時,如塊112所示,可以檢查候選算法的群體,以針對三個適合度準則,確定哪個候選算法位於Pareto-front上。儘管 Pareto-front算法典型地僅是群體的一個小子集,但是可能仍然存在多 於一個的算法。為了選擇Pareto-front算法中的一個作為預測算法,可 以如塊114所示,應用附加的選擇準則。附加的選擇準則可以例如確定哪個Pareto-front算法具有最希望的精確性、複雜度和平滑性的平衡。附加的選擇準則還可以基於 Pareto-front算法的表達式的內容,評估Pareto-front算法。例如,可以優選具有有意義的物理解釋和/或包括特定類型函數的表達式。在某些 情況下,可以基於附加的測試,例如,使用下述用於驗證過程的附加 數據,從Pareto-front算法中選擇預測算法。因此,可以基於預測算法 在訓練數據所用的範圍之外的精確外推能力,來選擇預測算法。然後如塊116所示,可以驗證所選擇的預測算法。備選地,可以 使用該驗證過程來選擇將哪個Pareto算法作為預測算法使用。驗證過 程可以涉及用附加數據測試預測算法。該附加數據可以是例如從在塊 100中選擇的歷史數據中保留的第二數據集合。如果預測算法能夠以希 望的精確性級別再現歷史數據的第二集合,則可以認為該預測算法是 有效的。如上所述,用於以在開發中使用的第一數據集合中包括的值 的範圍之外的值進行測試的第二數據集合可以用於測試預測算法成功 外推的能力。應當理解,還可以用其它方法來測試預測算法。例如, 可以基於試驗,在線使用預測算法,以確定它是否給出良好的結果。一旦己驗證了預測算法,則如下面更詳細的描述,可以以推理傳 感器實施算法。4、預測算法的示例實施可以以多種方式來使用通過例如如上所述的遺傳規劃技術而開 發的預測算法。例如,可以在監視和/或控制預測算法開發所針對物理、 化學或者生物過程的系統中實施該預測算法。物理、化學或者生物過1程可以是工廠或者其它設施中的工業過程。例如,預測算法可以用於 幫助監視工業製造過程或者幫助監視來自工業過程的排放。備選地, 可以在消費產品中使用預測算法,例如在汽車中使用以監視排放。預 測算法的其它實施也是有可能的。
圖3示意地示出了示例處理系統200,在該系統中可以實施預測算 法。處理系統200可以是工業設施、消費產品或者任意其它系統,在該 系統中物理、化學或者生物過程發生。在圖3中,將被監視的特定物理、 化學或者生物過程示意性地示為過程202。可以使用圖3中表示為硬體 傳感器204-208的一個或者更多硬體傳感器來獲得過程202的多個可測 量參數的測量值。依賴於過程202的性質,可測量參數可以包括例如溫 度、壓力、流速等等。優選地,可測量參數是在過程202在線時硬體傳 感器204-208可以測量的參數。儘管圖3示出了監視過程202的三個硬體 傳感器,但是應當理解,可以使用更多或者更少數量的硬體傳感器。
硬體傳感器204-208可以與推理傳感器210通信地連接。推理傳感 器210可以配置為使用由硬體傳感器204-208提供的可測量參數的測量 值,來確定過程202的附加的目標參數的推理值。推理傳感器210可以 使用一個或者更多預測算法來進行該確定。優選地,這些預測算法中 的至少一個是通過上述遺傳規劃技術並使用來自過程202的歷史數據 而開發的,從而在精確性、複雜度和平滑性方面是優化的。但是,推 理傳感器210還可以使用以其它方法開發的其它預測算法。
因此,推理傳感器210可以使用以硬體傳感器204-208提供的測量 值為基礎來預測目標參數的當前值的至少一個預測算法。在一些實施 中,推理傳感器210可以簡單地將預測值作為推理值。備選地,推理傳 感器210可以應用算法,以基於預測值來確定推理值。在推理傳感器210 使用多於一個的預測算法,從而獲得多於一個的預測值的情況中,推 理傳感器210可以通過選擇預測值之一、對預測值進行平均或者以某種 其它方式,來確定推理值。
推理傳感器210可以向控制系統212提供目標參數的推理值。然後 控制系統212可以使用推理值來確定是否採取附加行動。例如,控制系 統212可以將推理值與一個或者更多預設值進行比較,以確定目標參數是否在範圍之外。如果目標參數在範圍之外,控制系統212可以發起對過程202的控制,例如,嘗試將目標參數帶回至範圍內。備選地或者附加地,如果發現目標參數在範圍之外,控制系統212可以記錄該推理值或者觸發警報。
推理傳感器210和控制系統212都可以實施為執行適當的計算機代碼的計算機系統。從而,針對推理傳感器210的計算機代碼可以包括針對過程202、使用遺傳規劃開發的一個或者更多預測算法。推理傳感器210以及控制系統212也可以集成在一起。
因此,處理系統200可以基於過程202在線時由硬體傳感器能夠容易測量的參數,來有利地監視過程202的、在過程202在線時可能難以測量的目標參數。然而,應當理解,使用硬體傳感器來獲得針對推理傳感器210的輸入參數的當前值僅作示例之用。推理傳感器210還可以用其它方法來獲得一個或者更多參數的當前值,比如從其它推理傳感器獲得。
5、 VOC排放的預測算法
使用上述三維Pareto-front遺傳規劃技術開發了用於預測來自化學工廠的揮發性有機化合物(VOC)排放的預測算法。獲得該工廠的歷史數據集合,該集合包括對VOC排放的測量以及在相應時間進行的對多個不同過程變量的測量。過程變量是密度、速率、揮發性、真空、溫度、料鬥重量(hopper weight)、熔融指數(melt index)以及顆粒水溫(pellet water temperature )。
從歷史數據中取除明顯的野值。然後將該歷史數據分為兩個集合。選擇由251個數據點構成的一個集合用於模型開發(訓練數據)。選擇由108個數據點構成的另一個集合用於模型驗證(測試數據)。為了測試預測算法的外推能力,選擇測試數據,使得有20%在訓練數據的範圍之外。
圖4示出了用於三維Pareto-front遺傳規劃的設置參數。如圖5所示,從可用的函數的菜單中選擇用於遺傳規劃的函數集合(由複選標記來指示選擇的函數)。通過將每一個節點的複雜度加權求和,來確定複雜度,節點的複雜度加權是從屬於該節點的所有子樹中節點的數量。通過對上述將每個節點函數擬合至規定容差內而所需的多項式的次數進行求和,來確定非線性。
在遺傳規劃的完成時,從ioo個算法的群體中僅找到非常少的算法在最優精確性、複雜度以及平滑性方面位於Pareto-front上。選擇下述Pareto-front算法用於驗證
(2) VOC=8.0746 + 6.0157e-14^速率1 953 *料鬥重量* (真空+顆粒水溫)]
如圖6所示,用該預測算法進行的VOC預測與訓練數據良好地吻合(相關係數=0.92884)。
接下來,使用測試數據來驗證該預測算法P圖7比較了由算法(2)預測的VOC排放與實際測量的VOC排放。可以發現,在訓練範圍之外高達20%的區域中(這些是在圖7中樣本70和85之間的VOC值,由箭頭指示),該預測算法具有良好的外推性能。
為了比較的目的,使用相同訓練數據開發了神經網絡模型。然後使用與基於GP的預測算法的相同的測試數據,來驗證該神經網絡模型。然而,如圖8所示,神經網絡模型在訓練範圍之外的外推性能不好。
因此,該例子證明了遺傳規劃技術如何能夠用於開發相對簡單的分析表達式,該表達式從多個相關的輸入變量聯繫到所需的輸出變量(比如VOC排放)。相反,神經網絡模型典型地是難以解釋的"黑匣子"。另外,通過使用有利於線性的適合度準則(平滑性準則),遺傳規劃技術可以用於開發具有良好外推能力的預測算法。
6、結論
己經在如上描述了本發明的示例實施例。然而,本領域技術人員將理解,在不背離由權利要求限定的本發明的範圍和精神的情況下,可以對這些實施例做出改變和修改。
權利要求
1、一種開發預測算法的方法,所述預測算法用於基於多個輸入變量來預測至少一個輸出變量,所述方法包括獲得代表物理、化學或者生物過程的第一數據集合,所述第一數據集合包括所述至少一個輸出變量的第一集合測量以及所述輸入變量的相應第一集合測量;使用應用至少三個適合度準則的遺傳規劃技術,對多個候選算法進行進化,所述至少三個適合度準則包括精確性準則,用於評估每一個候選算法基於所述輸入變量的所述相應第一集合測量來預測所述至少一個輸出變量的所述第一集合測量的能力;複雜度準則,用於評估每一個候選算法的複雜度;以及平滑性準則,用於評估每一個候選算法的非線性;以及選擇所述候選算法之一,作為所述預測算法。
2、 根據權利要求l所述的方法,其中所述物理、化學或者生物過 程是工業過程。
3、 根據權利要求l所述的方法,其中所述至少一個輸出變量涉及 排放監視。
4、 根據權利要求l所述的方法,其中所述至少一個輸出變量是物 理屬性、化學屬性、機械屬性、材料屬性或者生物屬性。
5、 根據權利要求l所述的方法,其中對於所述三個適合度準則, 所述預測算法是所述候選算法中最優的。
6、 根據權利要求l所述的方法,其中選擇所述候選算法之一作為 所述預測算法包括確定所述候選算法中的哪一個位於針對所述三個適合度準則的 三維Pareto-front上,以獲得多個Pareto-front算法。
7、 根據權利要求6所述的方法,其中選擇所述候選算法之一作為 所述預測算法還包括應用至少一個附加選擇準則,以從所述多個Parato-front算法中選擇所述預測算法。
8、 根據權利要求l所述的方法,還包括獲得代表所述物理、化學或者生物過程的第二數據集合,所述第 二數據集合包括所述至少一個輸出變量的第二集合測量以及所述輸入 變量的相應第二集合測量;以及使用所述第二數據集合來測試所述預測算法。
9、 根據權利要求8所述的方法,其中使用所述第二數據集合來測試所述預測算法包括評估所述預測算法的下述能力基於所述輸入變量的所述相應第 二集合測量、預測所述至少一個輸出變量的所述第二集合測量的能力。
10、 一種監視物理、化學或者生物過程的方法,所述方法包括 確定所述物理、化學或者生物過程的多個可測量參數的當前值; 向推理傳感器提供所述當前值,所述推理傳感器被配置為使用至少一個預測算法,所述至少一個預測算法基於所述可測量參數來預測 所述物理、化學或者生物過程的附加參數,所述至少一個預測算法是 已經在精確性、複雜度和平滑性方面經過優化的;以及所述推理傳感器使用所述至少一個預測算法,以基於所述可測量 參數的所述當前值,來確定所述附加參數的推理值。
11、 根據權利要求10所述的方法,其中確定所述物理、化學或者 生物過程的多個可測量參數的當前值包括:使用硬體傳感器來測量所述可獲得參數中的至少一個。
12、 根據權利要求10所述的方法,其中所述過程是工業過程。
13、 根據權利要求12所述的方法,還包括基於所述附加參數的所述推理值來控制所述工業過程。
14、 根據權利要求13所述的方法,其中基於所述附加參數的所述 推理值來控制所述工業過程包括將所述推理值與預設值迸行比較。
15、 根據權利要求10所述的方法,其中所述附加參數是物理屬性、 化學屬性、機械屬性、材料屬性或者生物屬性。
16、 根據權利要求10所述的方法,還包括使用向所述可測量參數的歷史值和所述附加參數的歷史值應用的遺傳規劃技術,來開發所述至少一個預測算法,所述歷史值是已經 針對所述物理、化學或者生物過程而預先獲得的。
17、 根據權利要求16所述的方法,其中所述可測量參數的所述歷 史值定義第一範圍,並且所述可測量參數的所述當前值的至少一個子 集在所述第一範圍之外。
18、 根據權利要求16所述的方法,其中所述附加參數的所述歷史 值定義第二範圍,並且所述附加參數的所述推理值在所述第二範圍之 外。
19、 一種用於監視物理、化學或者生物過程的系統,所述系統包括至少一個硬體傳感器,用於獲得所述物理、化學或者生物過程的多個參數的測量值;以及推理傳感器,用於基於所述測量值來確定所述物理、化學或者生 物過程的附加參數的推理值,所述推理傳感器被配置為使用至少一個 預測算法來確定所述推理值,所述至少一個預測算法是已經使用遺傳 規劃技術在精確性、複雜度以及平滑性方面進行了優化的。
20、 根據權利要求19所述的系統,還包括控制系統,用於基於所述推理值,控制所述物理、化學或者生物 過程。
全文摘要
使用遺傳規劃技術來開發一種用於基於多個輸入變量來預測至少一個輸出變量的預測算法,所述遺傳規劃技術通過多代對候選算法的群體進行進化。在每一代中,基於三個適合度準則對候選算法進行評估(i)精確性準則,評估每一個候選算法基於輸入變量的相應歷史測量,預測至少一個輸出變量的歷史測量的能力;(ii)複雜度準則,評估每一個候選算法的複雜度;以及(iii)平滑性準則,評估每一個候選算法的非線性。可以用於監視比如工廠中工業過程等物理、化學或者生物過程的推理傳感器實施該預測算法。
文檔編號G05B13/02GK101636698SQ200880008403
公開日2010年1月27日 申請日期2008年2月21日 優先權日2007年3月19日
發明者亞瑟·卡爾·科登, 吉多·弗雷迪·斯米茨 申請人:陶氏環球技術公司