新四季網

成套設備的控制方法及控制裝置的製作方法

2023-04-28 06:50:11

專利名稱:成套設備的控制方法及控制裝置的製作方法
技術領域:
本發明涉及具有鍋爐的成套設備的控制方法及控制裝置。
背景技術:
以往,在成套設備控制領域以PID控制為基本的控制邏輯是主流。另夕卜, 還提出利用以神經網絡為代表的帶教師學習功能,能與成套設備的特性靈活對 應的多種技術方案。
為了使用帶教師學習功能來構成控制裝置,由於需要預先準備成為教師數 據的成功案例,因此還提出了無教師學習方法。
作為無教師學習的例子,有強化學習法。
強化學習法是為了通過與控制對象等環境的反覆試驗的相互作用,將從環 境得到的計測信號作為理想的信號,生成對環境的操作信號的學習控制的構 架。由此有如下優點,即,即使在不能預先準備成功案例的場合,只要通過預 先定義所希望的狀態,就能自己根據環境學習所希望的行動。
在強化學習中具有如下學習功能,即,以使用從環境得到的計測信號所計 算的標量的評價值(在強化學習中被稱為報酬)為線索,生成對環境的操作信 號,使得從現有狀態到將來所得到的評價值的預期值達到最大。作為實現這種 學習功能的方法,有例如非專利文獻l (強化學習(ReinforcementLearning), 三上貞芳、皆川雅章共同翻譯,森北出版株式會社,2000年12月20日出版) 所述的Actor-Critic、Q學習、實時動態程序設計(実時間Dynamic Programming) 等算法。
另夕卜,作為改進上述方法的強化學習的構架,上述文獻介紹了被稱為動態 一體系結構(Dyna-7 —矢^夕f Y )的構架。這是一種以模擬控制對象的模型為對象預先學習生成怎樣的操作信號比較好,然後使用該學習結果決定對 控制對象施加的操作信號的方法。而且,具有減小控制對象和模型的誤差的模 型調整功能。
另外,在具備燃燒裝置的成套設備的控制裝置中存在如下問題,即,在例 如像煤燃料那樣燃料性質不定的場合或變更了煤種類的場合等,成套設備的燃 燒特性或導熱特性發生變化。作為對應該問題的方法,可列舉例如專利文獻
l一日本特開2004 - 190913號公報所述的技術。
這是一種在燒煤鍋爐中從主蒸汽壓力的實測值和設定值的偏差運算燃料 發熱量比的方法。
另外,專利文獻2—日本特開平8-200604號^^艮的控制裝置包括算出 基於與燒煤鍋爐在爐膛上的溫度、壓力、流量等有關的流體計測數據而估算的 爐膛的吸收熱量估算值的第一估算單元;算出基於與最終二次燃燒器的溫度、 壓力、流量等有關的流體計測數據而估算的最終二次燃燒器的吸收熱量估算值 的第二估算單元;求出用上述第一估算單元算出的爐膛的吸收熱量估算值和用 上述第二估算單元算出的最終二次燃燒器的吸收熱量估算值之比的單元;以 及,基於利用該單元求出的吸收熱量估算值之比掌握鍋爐的燃燒特性,輸出氣 體分配阻尼器設定值、氣體再循環鼓風機的轉數設定值以及鍋爐輸入加速設定 值的運算單元。
另外,在鍋爐等成套設備控制領域,以往,以PID控制為基本的控制邏 輯成為主流。另外,還提出利用以神經網絡為代表的帶教師學習功能,能與成 套設備的特性靈活對應的多種技術方案。並且,為了使用帶教師學習功能來構 成控制裝置,由於需要預先準備成為教師數據的成功案例,因此還提出了強化 學習法等的無教師學習方法。
該強化學習法是為了通過與控制對象等環境的反覆試驗的相互作用,將從 環境得到的計測信號作為理想的信號,生成對環境的操作信號的學習控制的構 架。由此有如下優點,即,即使在不能預先準備成功案例的場合,只要通過預 先定義所希望的狀態,就能自己根據環境學習所希望的行動。
並且,在該強化學習中具有如下學習功能,即,以使用從環境得到的計測 信號所計算的標量的評價值(在強化學習中被稱為報酬)為線索,生成對環境的操作信號,使得從現有狀態到將來所得到的評價值的預期值達到最大。在實
現這種學習功能的方法中,以往有Actor-Critic、Q學習、實時動態程序設計(実 時間Dynamic Programming)等算法。
另外,作為改進上述方法的強化學習的構架,有被稱為動態4繫結構 (Dyna- T —矢r夕f々)的構架。這是一種以模擬控制對象的模型為對象 預先學習生成怎樣的操作信號比較好,然後使用該學習結果決定對控制對象施 加的搡作信號的方法,這時,具有減小控制對象和模型的誤差的模型調整功能。
另一方面,伴隨數值分析技術的進步,燃燒反應也可以在某種程度上通過 計算再現,其結果,可以利用模擬成套設備的模擬器構築模型(例如,參照專 利文獻3—日本特開2003 - 281462號公報)。
上述文獻是才艮據發電功率值、溫度、壓力等的變化進行熱平衡的計算等而 估算燃料發熱量的變化並進行控制的方法,並考慮到了對導熱性能的影響。但 是,燃料性能的變化不僅影響導熱性能,還影響燃燒廢氣的組成。
若N0x、 CO等增加,則有可能對外部環境帶來影響,或者使廢氣處理裝 置的負載上升等,但在上述文獻中沒有記載考慮對燃燒廢氣組成的影響的方 法。
另外,由於燃燒現象是燃料和空氣(氣體)的流動、傳熱和燃燒反應的復 雜的複合現象,因此控制其舉動是比較困難的問題。
尤其是關於廢氣組成相對燃料性質的變化產生的變化,要導出適當的操作 方法是困難的。既使利用上述強化學習理論,在反覆的試驗中為了對多種燃料 性質學習其操作方法也需要長期的學習時間,且學習期間還存在廢氣性質惡化
的可能性。

發明內容
本發明目的在於提供一種相對燃料組成的變化也能適當控制燃燒氣體成 分的控制裝置。
另外,如上所述,強化學習法雖然在控制對象的特性、控制方法在事先不 能定型化的場合是有效的,但在成套設備的運轉控制中,需要在模型建立之前 匯集反覆試驗運行的實際效果的時間,從而存在這期間產品質量下降,且損耗 增多的問題,而且,通過這時的反覆試驗運行,雖然也能考慮由成套設備排出
6物的性質變動引起的對環境的影響,但是並沒有考慮對這些問題比較有效的模 型構築方法。
另外,在專利文獻3中,為了提高計算精度需要細化計算網格,但在鍋爐 等大型裝置的場合計算量龐大,更由於運轉條件還連續變化,因此計算時間長, 以實用的時間構築模型是困難的。
如上所述,雖然強化學習法對於控制方法不能預先定型化的成套設備的控 制是有效的方法,但為了構築模型需要很多時間來進行根據成套設備的試運轉 的數據積累,試運轉期間有時得不到所希望的控制性能。
本發明的第二目的在於提供一種利用模型構築期間短並具有優良的性能 的強化學習法的成套設備控制方法和裝置。
本發明的控制裝置,具備輸入具有燃燒裝置的控制對象物的計測數據並 運算對上述控制對象物的搡作指令值的基本控制指令運算單元;相對向上述燃 燒裝置供給的燃料的多個燃料組成,存儲上述燃燒裝置的操作參數和上述氣體 中成分的數據組的燃料數據存儲單元;存儲上述控制對象物的過去的運轉實際 值的運轉實際資料庫;算出上述控制對象物的過去的運轉實際值和上述數據組 的數據間距離,決定使數據間距離為最短的數據組的數據生成單元;使用由上 述數據生成單元決定的數據組,將上述燃燒裝置的操作參數和上述燃燒裝置的 燃燒氣體中的成分的關係模型化的模型化單元;以及使用上述模型化單元的模 型算出比當前的氣體中成分條件更好的燃燒裝置的操作參數,用算出的操作參 數校正上述基本控制指令運算單元的操作指令值的校正單元。
上述第二目的通過如下方法實現在具有學習操作量和成套設備狀態的關 系的學習功能,並具有利用該學習功能計算對應於成套設備狀態的操作指令值 的功能的成套設備控制裝置的控制方法中,利用多個操作條件的流動及反應現 象的數值分析來計算規定成套設備的狀態的過程值,將各操作條件的過程值近 似地生成連續模型,使其相對操作條件參數的變化成為連續的關係,使用通過 數值分析計算的過程值和成套設備實際機器的運轉數據再次生成連續模型,使 用再次生成的上述連續模型進行學習。
本發明的效果是,本發明由上述單元構成,即使燃料組成(性質)變化, 也能夠自動地適當控制廢氣成分,所以能夠減少廢氣中的NOx、 CO等有害物質的產生量。
本發明由於具備實現上述第二目的的方法,所以可以從成套設備試運轉時 開始,使用數值分析的結果利用強化學習法來控制成套設備,從而能夠縮短控 制裝置的導入期間。


圖l是說明本發明的第一實施方式的控制裝置的結構圖。
圖2是說明本發明的第二實施方式的控制裝置的結構圖。
圖3是說明本發明的第三實施方式的控制裝置的結構圖。
圖4是說明數據生成單元的運算過程的圖。
圖5是說明模型誤差的顯示畫面例子圖。
圖6是說明模型誤差的顯示畫面例子圖。
圖7是說明火力發電成套設備的結構圖。
圖8是說明發電廠組和分析中心的通信關係的圖。
圖9是說明強化學習的概念圖。
圖10是說明燃料資料庫顯示及燃料性質輸入畫面例子圖。 圖11是i兌明校正迴路的圖。
圖12是iJL明狀態評價單元300和數據組切換單元310的處理過程的圖。 圖13是說明校正迴路的圖。
圖14是表示本發明的成套設備控制裝置的 一個實施方式的方框構成圖。 圖15是表示本發明的一個實施方式的運轉實際資料庫或數值分析資料庫 的一例的說明圖。
圖16是表示本發明的一個實施方式的學習結果資料庫的一例的說明圖。 圖17是表示根據本發明的一個實施方式的處理過程的流程圖。 圖18是本發明的一實施方式的連續模型的說明圖。
圖19是表示根據本發明的一個實施方式的數值分析數據追加處理過程的 流程圖。
圖20是本發明的一個實施方式的誤差評價的說明圖。
圖21是本發明的一個實施方式的數值分析數據追加的說明圖。
圖22是本發明的一個實施方式的連續模型修正的說明圖。
8圖中
100-成套設備;200-控制裝置;210-數據生成單元;220-輸入輸出接口; 221-輸入輸出單元;230-基本控制指令運算單元;240-運轉實際資料庫; 250-模型化單元;260-校正單元;270_燃料數據存儲單元。 1001-成套設備(例如鍋爐設備);1002-外部輸出接口; 1003 -外部輸入接 口; 1004-基本控制指令運算單元;1005 -運轉實際資料庫;1006-數值分析 單元;1007-數值分析資料庫;1008 -連續模型化單元;1009-連續模型;1010 -誤差評價單元;1011-參數追加單元;1012-連續一莫型修正單元;1013-控 制方法學習單元;1014-學習結果資料庫;1015-操作量運算單元;1016-減 法器;1017-加法器;1018-切換器。
具體實施例方式
以下,參照

最佳實施方式。圖l表示第一實施方式。本發明的控 制裝置200從作為控制對象的成套設備100接收過程值的計測信息205,使用 它在控制裝置200內進行預程序化的運算並將操作指令信號(控制信號)向成 套設備100發送。成套設備100按照接收到的操作指令信號285,使例如稱為 閥的開度或阻尼器開度的驅動器動作而控制成套設備的狀態。
本實施例是應用於火力發電成套設備的燃燒控制的例子。在本例中,特別 以應用於將降低廢氣中的NOx及CO的濃度作為目的的控制功能上的例子為 中心進行說明。
圖7表示作為控制對象的火力發電成套設備的結構。通過燃燒器102將作 為燃料的煤、煤搬運用的一次空氣及燃燒調整用的二次空氣投入鍋爐101內, 用鍋爐101燃燒煤。煤和一次空氣從配管134引出,二次空氣從配管141引出。 另夕卜,將二段燃燒用的後續空氣通過後續空氣口 103投入鍋爐101內。該後續 空氣從配管142引出。
通過煤的燃燒產生的高溫氣體沿著鍋爐101的路徑流動後,通過空氣加熱 器104。之後,在用廢氣處理裝置除去有害物質後,從煙囪排到大氣中。
在鍋爐101中循環的供水通過給水泵105引入到鍋爐101內,在換熱器 106中被氣體過熱,成為高溫高壓的蒸汽。另外,在本實施方式中將換熱器的 數量設定為1個,但也可以配置多個換熱器。
9通過了換熱器106的高溫高壓的蒸汽,通過渦輪調節器107引入汽輪機 108內。利用蒸汽所具有的能量驅動汽輪機108,用發動機109發電。
接著,說明從燃燒器102投入的一次空氣及二次空氣、從後續空氣口 103 投入的後續空氣的路徑。
一次空氣從風扇120引入配管130內,途中分支為通過空氣加熱器的配管 132和不通過它的131,在配管133再次合流,引入到碾磨機IIO。通過空氣 加熱器的空氣利用氣體過熱。使用該一次空氣將在碾磨機110內生成的煤(細 煤粉)吹送到燃燒器102中。
二次空氣及後續空氣從風扇121引入到配管140內,在用空氣加熱器104 過熱後,分支為二次空氣用的配管141和後續空氣用的配管142,分別引入到 燃燒器102和後續空氣口 103。
控制裝置200為了降低NOx及CO的濃度,具有調整從燃燒器投入的空 氣量和從後續空氣口投入的空氣量的功能。另外,雖然在圖7中未表示,但存 在具有將燃燒廢氣的一部分返回爐膛的氣體再循環設備的情況,或者具有將燃 燒器的噴出角度做成上下可變的裝置的情況,也可以將這些作為控制操作的對 象。成為控制對象的向燃燒器供給的燃料流量、燃燒器空氣流量、向空氣口供 給的空氣流量、氣體再循環設備的操作量、燃燒器的噴出角度等都是對鍋爐的 操作參數。
控制裝置200包括基本控制指令運算單元230;變更或校正從基本控制 指令運算單元230輸出的基本操作指令值235的校正單元260;積累、存儲由 工序計測值205、操作員的輸入信號、來自上一級控制系統的指令信號等構成 的運轉實際數據的運轉實際資料庫240;用於與控制對象成套設備100或操作 員等的進行數據的接收和發送的輸入輸出接口 220;以及用於操作員看各種數 據或者輸入設定值或運轉模式、手動運轉時的操作指令等的輸入輸出單元 221。
基本控制指令運算單元230以PID (比例、積分、微分)控制器作為基本 結構單元,將工序計測值205、操作員的輸入信號、來自上一級控制系統的指 令信號等作為輸入,運算對設置在成套設備100上的閥、阻尼器、電機等各種 工作機器的基本操作指令值235並輸出。基本操作指令值235的功能及結構由於與現有的火力發電廠的控制裝置 相同,所以在此省略"i兌明。
本發明的特徵在於具備數據生成單元210、 ;f莫型化單元250、校正單元260 以及燃料數據存儲單元270。以下,說明各自的功能。
模型化單元250具有生成模擬了作為操作參數的燃料流量、空氣流量等和 在該操作參數的廢氣中的某種特定成分濃度的關係的模型的功能。
從燃料數據存儲單元270讀入數據275,用由輸入層、中間層、輸出層構 成的神經網絡利用誤差逆傳播法(後向傳播法)學習輸入輸出關係。神經網絡 的結構及學習方法是一般的方法,而且,這些方法也可以是其它方法,由於本 發明並不依賴於神經網絡的結構或學習方法,所以在此省略詳細說明。
輸入數據是燃燒器及後續空氣口的每個位置的空氣流量、每個燃燒器的燃 料流量、發動機功率,輸出數據是NOx及CO的濃度。
在本例中歲將燃料流量、空氣流量、發電功率和NOx及CO的關係模型 化,但本發明並不將輸入項目及輸出項目只限定於這些。另夕卜,模型化方法也 不局限於神經網絡,也可以使用回歸模型等其它統計方法生成模型。
儲有多個模型化單元250的輸入數據和輸出數據的數據組。
數據組有從實際運算資料庫240提取過去的實際數據的數據組,和進行鍋 爐內的燃燒數值分析而事先計算的計算結果。
僅就運轉實際數據而言,直到積累運算數據前不生成模型。而且,沒有使 用經驗的煤種類當然不能生成模型。因此,在本發明中,用逼真地模擬對象成 套設備的設計和運用條件的計算體系來進行燃燒數值分析,將其結果存儲在燃 料數據存儲單元270中。
燃燒現象由於是燃料和空氣(氣體)的流動、傳熱和燃燒反應等的複雜的 複合現象,所以把握其舉動一般比較困難。但是,通過進行改變了例如燃料性 質(組成、粒徑)、燃燒氣氛等條件的燃燒基礎實驗,根據其結果將要素現象 模型化,從而以實用的精度也能分析如火力發電廠的鍋爐那樣的大型且具有復 雜的內部舉動的現象。
另外,雖然數值分析技術以往就有,但為了在某種程度高精度地分析尤其如鍋爐那樣的大型裝置,需要龐大的計算格子(網格)數量,由於在工業上計 算它要花費過多的計算時間,因此事實上是不可能的。
但是,通過使用例如日本特開2003 - 281462號公報所述的數值分析技術, 可以保持精度並高速地進行分析,而且,近年的計算機的性能也有提高,可以 實現大型成套設備的詳細現象的數值分析。
在燃燒數值分析中對多種煤組成進行了計算。煤組成通過對代表性的煤品 牌(種類)進行組成分析決定。由於煤是天然資源,所以即使是相同產地其組 成往往也不完全相同。因此,分析多種情況的樣品,使用其平均組成。
另外,在發電廠將煤儲藏在室外的情況較多,由於天氣的影響含水量與曰 變化,所以即使是相同種類的煤也有特性變化的情況。
於是,對於同一種類的煤使含水量有多種變化情況來進行燃燒數值分析, 還存儲其結果。因此,可以評價含水量對NOx及CO濃度的影響度。
接著,使用圖4說明數據生成單元210。
在步驟500中,讀入用於判斷是否要變更在模型化單元250中使用的數據 組的基準值(數據間距離容許值)。基準值可以從鍵盤222輸入, 一旦輸入該 值就被存儲。而且,也可以在以後變更基準值。
在步驟510中,從運轉實際資料庫240讀入從規定期間(例如一個月)到 當前為止的燃燒器及後續空氣口的每個位置的空氣流量、每個燃燒器的燃料流 量、發電機功率、NOx濃度、CO濃度的實際值245。
在步驟520中從燃料數據存儲單元270讀入當前正使用的模型生成用的數 值分析結果數據組。
在步驟530中,為了使在步驟510讀入的運轉實際數據245與燃燒器及後 續空氣口的每個位置的空氣流量、每個燃燒器的燃料流量、發電機功率的值分 別相同,將在步驟520讀入的數值分析數據組插補在數據之間,計算此時的 NOx濃度、CO濃度的插補值。
作為插補方法雖使用三次樣條插補,但也可以使用其它插補方法。
數值分析數據組由於是以預定的條件計算的離散數據,由於不能成為與運 轉實際數據完全相同的條件的情況居多,因此進行這種數據插補,可使其與運 轉實際數據條件一致。
12在步驟540中,求出在步驟510讀入的實際值的數據點和在步驟530計算 的數值分析數據的插補值的數據間距離。
數據間距離定義為公式(1)表示的歐幾裡得距離。在兩個數據點P、 Q 的坐標為(Xpl, Xp2, Xp3,…,Xpn)、 (Xql, Xq2, Xq3,…,Xqn)時, 兩點間的距離d化的平方可以用公式1求出。在這裡,作為坐標的Xpi、 Xqi 是燃燒器及後續空氣口的每個位置的空氣流量、每個燃燒器的燃料流量、發電 機功率、NOx濃度、CO濃度。另外,j是燃料數據組號碼,k是j號碼的燃料 數據組中的NOx及CO的計測數據數。公式1
=2L (^^—^o2 …公式(i)
在步驟550中,對存儲在燃料數據存儲單元270中的全部燃料組成數據組, 判斷是否計算了運轉實際數據245的與各數據點的距離。
在對全部燃料組成數據組結束了計算的場合前進至步驟560。在剩下未計 算的燃料組成數據組的場合,返回到步驟520,變更作為計算對象的燃料組成 數據組並以同樣的過程計算數據間距離。在步驟560中,首先對各燃料數據組,用公式(2)求出與運轉實際數據 245的平均距離dj_ave。公式2

j =厶附=1 , …公式(2) 接著,選擇dj_ave為最小的數據組。
在步驟570中,比較在步驟500讀入的基準值(容許值)和dLave,若dLave
為容許值以下,則向模型化單元250發送dj,e最小的數據組號碼的信息215
而結束。
另外,在dj—ave超過容許值的場合,前進至步驟580。
在步驟580中,生成新數據組,將模型修正指令信號輸入到模型化單元250中。在dj一ave超過容許值的場合,意味著原有的燃料組成數據組與最近的運 轉實際數據不一致。從而,在dLave最小的燃料組成數據組上加上添加了最近 的運轉實際數據的數據組而生成新數據組。此時,設置數據標誌,以便能區分 數值分析數據和運轉實際數據。
對模型化單元250輸出新生成的數據組號碼和模型修正指令信號的信息
215。
模型化單元250 —接收模型修正指令信息215,就參照新數據組號碼,使 用該數據組的數據重新生成模型。模型生成方法雖與上述同樣,但用數據標誌 識別運轉實際數據,重視運轉實際數據的重要性而生成模型。具體地說,通過 增加運轉實際數據的輸入次數,使其比其它數值分析數據還強烈地反映在模型 特性上。
由此,至少對於存在運轉實際結果的悽i:據點近旁,由於可以將與運轉實際 數據接近的特性模型化,因而減少了模型的誤差。
數據生成單元210例如以一周間隔進行。在dj一ave超過容許值的場合,追
加一周時間部分的新積累的運轉實際數據,而再次重新生成;f莫型,因此用於才莫 型生成的數據組中的運轉實際數據的比例增力口,模型特性逐漸接近實際運轉特 性。
接著,說明校正單元260。校正單元260向模型化單元250輸出相當於操 作參數的模擬操作指令信號265。模型化單元250向生成的模型輸入燃燒器及 後續空氣口的每個位置的空氣流量、每個燃燒器的燃料流量、發電機功率等模 擬操作指令信號265,計算作為模型的輸出值的NOx及CO濃度並將這些氣體 成分信息輸出到校正單元260。
在校正單元260中從運轉數據205讀入作為當前的成套設備狀態的各操作 量值,以該狀態為基準在直到下次操作的時間前使燃燒器及後續空氣口的每個 位置的空氣流量在可變化的變化幅度的範圍內變化,作為這些模擬操作指令 265輸出。
操作量的可變幅度從預先登錄的阻尼器或閥等的驅動的器動作速度和操 作(控制)間隔求出。另外,將各操作量的可變幅度分割為規定數量,對它們 的全體組合改變操作量。行了變化的模擬操作指令信號265用模型化單元計算NOx 及CO濃度。從其中提取用公式(3 )定義的評價值J為最小的模擬操作指令 信號。在這裡,CNOx、 Cco分別是NOx及CO濃度的計算值,A,、 A2是係數。公式3
^A,Cnox + A2CC0 …公式(3)
對公式(3)輸入NOx及CO濃度的當前計測值,將計算得到的評價值作 為JR。比較用模型的計算值進行評價的J和用當前計測值進行評價的JR,在公 式(4)的條件成立的場合,在基本操作指令值235上添加校正而作為操作指 令信號285輸出。公式4
J<JR ...公式(4)
在公式(4)成立的場合,表示根據模型的模擬操作指令信號265的氣體 中成分比作為當前的計測值的氣體中成分條件更好。 使用圖11說明校正的方法。
用減法器281計算基本操作指令值235和評價值J為最小的模擬操作指令 信號265的偏差信號287,將它用加法器284加到基本操作指令值235上生成 校正操作指令值288。
如果,由於輸入數據的異常或運算迴路的異常而使作為模型化單元250 的輸出值的NOx及CO濃度計算值變得異常的場合,由於通過將用乘法器283 與偏差信號287相乘的係數設為零而使校正操作指令值288與基本操作指令值 235相等,由此可減少錯誤輸出異常信號的危險性。
作為模型化單元250的輸出值的NOx及CO濃度計算值255是否異常, 以向模型化單元250的輸入數據及輸出數據的上下限值4企驗以及變化率的上 下限檢驗進行判定。就連至少一個超出預先設定的上下限值的場合,也通過將 切換器282的輸出信號設為0而防止在有異常的可能性的狀態下評價的模擬操 作指令信號265的輸出。切換器282在除此之外的場合將輸出信號設定為1。
切換器286接收公式(4 )的判定結果,選擇基本操作指令值235和校正 操作指令值288中的一個作為操作指令信號285輸出。
根據以上內容,通過使用基於燃燒數值分析的結果的模型而評價操作量和
15NOx及CO產生量的關係,可以進行減少NOx及CO的產生量的操作。
另外,對於燃料性質(煤種類)變化的場合,由於也可以選擇適當的數值 分析數據組,所以能夠維持模型的高精度。因此,在煤種類變更的場合也能夠 抑制對NOx及CO的控制性能下降。
因此,以往由操作員向控制裝置輸入燃料性質變化的信息,或者依賴於操 作員的經驗和知識來變更控制參數的方式被自動化。因此,不依賴於操作員的 技術水平而可以進行高性能且穩定的運轉,能夠減少操作員的作業負荷。
再有,在預先準備的數值分析結果數據組和運轉實際數據的偏差大的場 合,由於生成追加了運轉實際數據的新數據組,因此可以向與運轉實際數據接 近的模型逐漸自動變更模型。
另外,在本實施方式的例子中雖將控制對象過程值定為NOx及CO濃度, 但本發明並不局限於此,也可以將氣體中的C02、 SOx、 Hg(汞)量、氟、由 煤塵或霧構成的微粒子類、VOC (揮發性有機化合物)作為對象。
接著,使用圖2說明第二實施方式。
與上述的第一實施方式的不同點在於,使用強化學習單元2卯學習減少 NOx及CO的操作方法。
強化學習單元290具有如下功能,即,使用積累在運轉實際資料庫240 中的運轉數,據根據強化學習理論學習對應於成套設備狀態的適當的操作方 法。
強化學習理論的詳細的說明,由於在例如"強化學習(Reinforcement Learning),三上貞芳、皆川雅章共同翻譯,森北出版抹式會社,2000年12月 20日出版,,中已有敘述,所以在此僅說明強化學習的概念。
圖9表示根據強化學習理論的控制的概念。控制裝置610對控制對象600 輸出控制指令630。控制對象600按照控制指令630動作。這時,通過根據控 制指令630的動作,控制對象600的狀態發生變化。從控制對象600接收報酬 620,該報酬620是表示變化的狀態對於控制裝置610是希望的或不希望的, 以及它們是什麼程度的量。
實際上,從控制對象接收的信息是控制對象的狀態量, 一般控制裝置610 基於該信息計算報酬。 一般設定為越接近所希望的狀態報酬越大,越成為不希
16望的狀態報酬越小。
控制裝置610反覆試驗地進行操作,通過學習使報酬達到最大(即,儘量
接近所希望的狀態)的操作方法,從而按照控制對象600的狀態自動構築適當 的操作(控制)邏輯。
以神經網絡為代表的帶教師學習理論需要預先將成功案例作為教師數據 提供,在新成套設備或現象複雜而不能預先準備成功案例的場合不適合使用。
與此相應,將強化學習理論分類為無教師學習,在自身具有反覆試驗地生 成所希望的操作的能力這一方面,具有的優點是也可以應用於控制對象的特性
不一定明確的場合。
在本第二實施方式中利用了該強化學習理論。
強化學習雖是反覆試驗地學習,但在成套設備控制的場合,在運轉的危險 性或成套設備對製造產品的損壞等方面,要直接將實際成套設備作為對象進行 反覆試驗地操作實現起來是困難的。於是,在本發明中,從成套設備的運轉實 際結果生成運轉特性模型,採用以該模型作為對象進行學習的方式。
強化學習單元290對由模型化單元250生成的模型,輸出由燃燒器及後續 空氣口的每個位置的空氣流量、每個燃燒器的燃料流量構成的模擬操作指令信 號265。模擬操作指令信號265對應於成套設備的操作條件,分別設定有上下 限值、變化幅度(節距寬度)、以一次操作可採用的最大變化幅度。模擬操作 指令信號265的各量在可採用值的範圍內隨機決定各數值。
模型化單元250對已生成的模型輸入模擬操作指令信號265,計算作為輸 出數據255的NOx及CO濃度。
強化學習單元290接收模型化單元250的輸出數據255 ,計算報酬值。
報酬值用公式(5)定義。在這裡,R為報酬值,ONOx為NOx值,Oco為 CO值,SNQx及Sco為NOx及CO的目標設定值,kl、 k2、 k3、 k3為正的常數。
公式5
R=Ri + R2 + R3 + R4
…公式(5)八3 - l 0( a^S廳) —I 0(<9CO—SCO)
如公式(5)所示,NOx、 CO值比目標設定值還下降了的場合,給予報酬 Rt及R2,再有,比目標設定值還下降的場合與該偏差成比例地給予報酬。
另外,才艮酬的定義方法還可以考慮其它多種方法,並不局限於公式(5) 的方法。
強化學習單元290由於學習模擬操作指令信號265的組合即操作量,而使 以公式(5)計算的報酬達到最大,因此從結果來看可以對應於現狀而學習減 少NOx、 CO的操作量的組合。
強化學習單元2卯在結束了學習的狀態下,讀入當前時刻的運轉數據205, 基於學習結果輸出使公式(5)的報酬為最大的操作量295。
校正單元260對基本操作指令值235施加校正並作為操作指令信號285 輸出。
校正方法基本上與第一實施方式相同。如圖13所示的校正迴路,與圖11 所示的第一實施方式的不同點在於,使用以強化學習單元290計算的操作量 295來代替模擬指令信號265這點上。
通常,切換器282的輸出設定為1,用加法器284將基本操作指令值235 與操作量295的偏差加在基本操作指令值235上而成為對基本操作指令值235 的強化學習指令值288。
切換器286通常選擇強化學習指令值288作為操作指令值285輸出。
但是,在模型化單元250的輸入輸出值或強化學習單元290的輸入輸出值 中有任何一個超出上下限值及變化率的限制範圍的場合,設定為作為切換器 282的輸出選擇0,並且在切換器286中選擇基本操作指令值235並輸出。
由此,雙重防止由於數據或運算迴路的異常而輸出異常操作指令值的情況。
另夕卜,作為強化學習指令值288的控制結果,在控制偏差超過規定範圍的場合,或者其頻度或持續時間超過規定範圍的場合,判斷為強化學習指令值
288無效,可以在切換器282及286中進行與數據異常時同樣的選擇(處理) 而停止強化學習指令值288的輸出。即使在這時也能利用基本操作指令值235 繼續進運轉,不會對成套設備的運轉帶來障礙。
根據以上內容,在第二實施方式中可以利用強化學習單元290自動構築最 佳操作方法。另外,在結束了學習的狀態下,若輸入當前的運轉狀態數據205 由於瞬時輸出報酬為最大的操作量,因此沒必要如第一實施方式那樣在每個控 制定時改變才莫擬操作指令信號265的組合併求出適當的操作量的組合,能夠減 少控制時的計算機負荷。由此,由於計算機動作的穩定性提高,且控制裝置的 可靠性提高,因此還具有成套設備運轉的完全性、穩定性也提高的效果。
接著,使用圖3說明第三實施方式。
與第二實施方式的不同點在於,具備狀態評價單元300和數據組切換單元 310。狀態評價單元300監視作為由模型化單元250生成的模型的計算值255 和與它對應的運轉實際數據205的偏差的模型誤差。
在步驟600中,讀入相對模型誤差的容許值的設定值。
在步驟610中,讀入運轉實際數據205和將此時的操作量實際值輸入到模 型中而得到的計算值255。
在步驟620中,計算由步驟610讀入的運轉實際數據205與對應的操作條 件下的模型計算值255的偏差(模型誤差)。
在步驟630中,對由步驟620計算的模型誤差的過去的時間系列數據計算 移動平均值,並計算移動平均值在規定時間間隔的變化率。
在步驟640中,比較由步驟630計算的模型誤差的移動平均值、移動平均 值的變化率值以及每一時刻的模型誤差和對由步驟600讀入的各個值的各容 許值。
若在容許範圍內則結束處理,在容許範圍外的場合向數據生成單元210 輸出數據組切換指示315,並向模型化單元250輸出模型變更指示316。
從步驟600到步驟630由狀態評價單元300進行,步驟640由數據組切換 單元310進行。圖5表示狀態評價單元300的運算結果的畫面輸出例子。
在顯示畫面400上,將模型誤差的時間系列序圖表顯示在圖表區域401 內。在圖表上顯示每個時刻的模型誤差408及其移動平均值409。
圖表的縱軸是;f莫型誤差(%),可以輸入在輸入欄403顯示的範圍值(例 如0, 100)。橫軸是時刻,在顯示欄404上顯示日期或時刻。另外,通過用鼠 標操作移動杆402,橫軸可以變更顯示時間。
顯示期間可以使用顯示期間選擇按鈕405,選擇年單位、月單位、周單位、 曰單位、小時單位。若用滑鼠選擇顯示期間選擇按鈕405的任何一個按鈕,則 顯示顯示期間輸入窗口 410,可以指定顯示的期間的開始時刻。若什麼也不輸 入就按"OK"按鈕,則按照以選擇的當前時刻為基準選擇的顯示期間自動選擇 顯示開始時刻。另外,若按"返回"按鈕,則輸入的信息被刪除。
利用該畫面,可以按時間系列監視模型誤差的變遷,很容易掌握使用中的 模型相對模型誤差的容許值407處於何種狀態。容許值的設定變更可以通過單 擊"設定"按鈕406而轉移到i殳定畫面。
另外,用數據組切換單元310運算的結果,超過容許範圍的場合作為警告 顯示在畫面上。警告內容有"模型誤差超過容許值"、"顯示模型誤差超過容許 值的持續時間"、"模型誤差變化率超過容許值"。
若出現任何一種警告,則自動地顯示顯示畫面400,促4吏#:作員注意。與 此同時數據組切換單元310向數據生成單元210輸出數據組切換指令315,向 模型化單元250輸出模型變更指示316。
尤其在"模型誤差變化率超過容許值"、"模型誤差超過容許值"的場合,可
以認為成套設備特性急劇變化。在這種場合,燃料性質變化的可能性大,用第
型。另外,以再次構築的模型為對象進行強化學習,自動地追隨狀態變化。 由此,可以經常自動監視模型誤差的傾向,由於可以根據監視結果進行模
型變更及強化學習的再次學習,因此總是能維持穩定的控制性能。
圖6是表示用數據生成單元210變更燃料數據組而再次構築模型,並評價
了;f莫型誤差的結果的例子。顯示了關於燃料組成A D的^t型誤差。作為悽t據
生成單元210的數據組選擇的基準,可以計算圖6所表示的模型誤差的平均值,
20選擇該平均值為最小的燃料組成數據組t
在畫面的上段上,用圓形圖431和表433表示選擇的數據組的組成。
另外,在下段的輸入畫面上,操作員可以輸入實際使用的燃料性質。在將 多種煤混合了的場合,可以在輸入欄435上輸入煤種類名稱及其配合比例。
該信息可以發送到分析中心30。如圖8所示,分析中心30通過專用通信 線路網與多個發電廠50、 51、 52連接,可以相互進行數據的發送接收。
在燃料組成數據組的顯示畫面例子430中,若按"向分析中心發送"按鈕 434,則操作員將輸入到輸入欄435的信息被發送到分析中心30。而且,將由 數據生成單元210選擇的數據組名稱和最近的運轉實際數據(操作指令值、過 程值)同時發送到分析中心30。
分析中心30若從發電廠50 ~ 51接收上述信息,就將燃燒數值分析的對象 成套設備構造數據和接收到的操作量實際值輸入到分析模型,在對作為計算條 件的燃料組成數據進行各種變更的同時計算NOx及CO濃度,選擇接收 到的NOx及CO濃度與實測值的誤差為最小的燃料組成數據。
通過專用通信線路網40向對象發電廠發送這樣選擇的燃料組成數據組和 從根據該數據組構築的模型及以該模型為對象進行強化學習的學習結果。
控制裝置200若確認該接收信息,就將新接收到的燃料組成數據組保存在 燃料數據存儲單元270中,將接收到的模型置於模型化單元250中,將接收到 的強化學習結果置於強化學習單元290中。
分析中心30的模型構築方法及強化學習方法與在上述第一及第二實施方 式中所述的方法相同。
根據以上內容,在能得到關於燃料變更的詳細信息的場合,由於可以更新 為精度更高的數據組及使用它的模型,因此能夠維持高性能的控制性能。
在本例中,從發電廠接收數據後雖然進行了由分析中心30進行了改變燃
料組成數據組的數值分析和模型構築以及強化學習,但如果事先進行多種情況 的對燃料組成進行各種改變的數值分析並保存結果,則只要根據接收燃料性質 變更的數據時保存的分析結果選擇數據組或模型等即可,可以立即向發電廠提 供新模型。因此,能夠縮短由於燃料變更而使控制性能下降的時間。另夕卜,在從發電廠接收燃料性質數據之前,也可以事先對各種燃料性質進 行分析,並依次向發電廠發送新的燃料組成數據組、使用它構築的模型及以該 模型為對象進行強化學習的學習結果,在發電廠中預先保存這些信息。
在這種場合,雖有可能增加發電廠一方的存儲容量、通信負荷、通信成本,
但由於在煤種類變更時無需與分析中心30通信,可以迅速變更為新的模型或 新的強化學習結果,因此能夠縮短由於煤種類變更而發生使控制性能下降的風 險的時間。
作為根據上述實施例的效果,可以列舉如下。
即使燃料組成(性質)變化,由於可以自動地適當控制排氣成分,所以能 夠減少廢氣中的NOx、 CO等有害物質的產生量。
另外,不需要長期的學習期間,可以從初期就開始發揮控制裝置的效果。 一般,對於學習中的反覆試驗運轉,雖有可能增加有害物質排出量,但在本發 明中由於不需要反覆試驗運轉的學習,因此能夠減少有害物質的排出量。
再有,由於減少了廢氣中的NOx量等,因此能夠削減脫硝裝置的氨使用 量等實用量,還可以期待裝置的小型化或催化劑的壽命延長。
另外,由於能夠自動追隨燃料性質的變化,因此除了能夠減少搡作員的調 整作業負荷以外,還可以不依賴於操作員的經驗或知識而實現適當的控制,還 具有提高成套設備運轉的可靠性的優點。
在上述實施例中,雖然主要說明了具有鍋爐的成套設備的控制裝置,但本 控制裝置還可使用於控制具有燃燒裝置的控制對象物的情況。
以下,利用圖示的實施方式詳細說明實現第二目的的成套設備控制方法和 裝置。
圖14是在將本發明應用在火力發電設備的鍋爐設備上,並操作供給由鍋 爐設備構成的成套設備1001的鍋爐的空氣流量,學習使所排出的CO濃度為 最小的控制方法的場合的一個實施方式,在這種場合,在成套設備1001上設 有外部輸出接口 1002和外部輸入接口 1003。
首先,外部輸出接口 1002從加法器1017輸入信號,並向成套設備1001 輸出而操作空氣流量。根據需要也可以具備用於人進行操作的鍵盤或顯示器。
其次,外部輸入接口 1003輸入從成套設備1001輸出的信號,作為成套設備的運轉數據輸出到運轉實際資料庫1005、基本控制指令運算單元1004和操 作量運算單元1015。這時,根據需要也可以具備用於人進行操作的鍵盤或顯 示器。
接著,基本控制指令運算單元1004是輸出例如用於操作成套設備1001 的空氣流量等的基本控制指令信號的單元,由以一般的PID控制邏輯構成的 控制裝置構成。
另外,在運轉實際資料庫1005中存儲有從外部輸入接口 1003輸出的成套 設備的運轉數據。
在這裡,該運轉數據指的是規定成套設備1001的狀態的過程值,如例如 圖15所示,雖然是表示相對空氣流量的NOx、 CO的濃度的關係的數據,但 除了這些從成套設備排出的NOx、 CO以外,還有C02、 SOx、汞、氟、煤塵 或霧等微粒子類或者揮發性有機化合物中的至少 一種量或濃度。
接著,數值分析單元1006是模擬成套設備的運轉的模擬器,例如是使用 專利文獻3所記載的模擬方法,以成套設備1001的鍋爐的形狀、煤的種類等 所提供的條件和空氣流量等操作條件為基礎進行模擬,計算成套設備運轉時產 生的CO濃度等。
作為這時的操作條件,除了上述空氣流量之外,還有燃料流量、空氣溫度、 鍋爐的燃燒器內的空氣分配、鍋爐的燃燒器傾角或鍋爐的並聯阻尼器角度中的 至少一種。
而且,該數值分析單元1006的分析結果,作為例如相對空氣流量的CO 濃度的值提供,並存儲在數值分析資料庫1007中。這時被存儲的數據是與圖 15所示的運轉實際資料庫1005同樣的形式。
連續模型化單元1008對於存儲在數值分析資料庫1007中的離散的空氣流 量和CO濃度的關係,近似地生成連續;溪型1009,使其相對參數的變化成為 連續的關係。從而,該連續模型1009利用連續模型化單元1008或連續模型修 正單元1012生成。
接著,誤差評價單元1010評價存儲在數值分析資料庫1007中的數據與由 連續模型化單元1008生成的連續模型1009的誤差。另外,在利用誤差評價單 元1010評價的誤差滿足一定條件的場合,參數追加單元1011設定追加進行數
23量的值,追加數據點。而且,對於追加的數據點利用數值分析
單元1006進行數值分析。
另一方面,連續模型修正單元1012使用在運轉實際資料庫1005中的運轉 數據修正連續模型1009的模型。而且,控制方法學習單元1013以連續模型 1009為基礎利用強化學習法學習控制流量的操作方法。學習結果存儲在學習 結果資料庫1014中。這時,存儲在學習結果資料庫104中的學習結果的一例 表示在圖16中。
接著,操作量運算單元1015使用從外部輸入接口 1003輸出的運轉數據和 學習結果資料庫1014,計算要操作的空氣流量的值。例如,學習結果為圖16 的場合,若空氣流量為0,45,則控制空氣流量使其為+0.05。計算的控制信號 輸出到加法器1016。
於是,加法器1016輸入基本控制指令運算單元1004的輸出信號和操作量 運算處理1015的輸出信號,計算這兩種信號的差並輸出到加法器1017。這時, 設有切換器1018,利用它將減法器1016的輸出從加法器1017的輸入切斷, 如現有技術還可以進行只用基本控制指令運算單元1004的輸出的運算。
另夕卜,加法器1017輸入基本控制指令運算單元1004的輸出信號和減法器 1016的輸出信號,計算這兩種信號的和並輸出。從而,利用這些減法器1016 和加法器1017,向成套設備的輸出信號可以作為利用操作量運算處理1015的 輸出信號校正了基本控制指令運算單元1004的輸出信號的信號。
下面,利用圖17的流程圖說明該實施方式的動作。
在圖14的實施方式中,為了操作鍋爐的空氣流量而控制CO濃度,需要 知道相對空氣流量的變化的CO濃度的變化。於是,首先利用數值分析計算空 氣流量和CO濃度的關係(步驟1101)。圖18表示這時的計算結果的一例。圖 中的點是將空氣流量從0.3變化到0.7,以間隔0.1計算的結果。
這時的分析最好儘量以細小的間隔進行,但是由於在各點的計算上要花費 一定程度的時間,因此實際上只能得到離散的數據。於是,由於對沒有點的部 分進行插補,因而生成近似的連續模型,使其相對參數的變化成為連續的關係 (步驟1102)。
在這時的連續才莫型的生成中,有利用多項式近似的方法、使用了神經網絡
24的方法等。
在這裡,根據圖18的虛線的特性,是這樣對數據點近似地生成連續模型 的結果,只要根據它就能從作為連續模型所提供的空氣流量連續地估算CO濃 度。
接著,利用強化學習法構築要保存在學習結果資料庫1014中的數據(步 驟1103 )。
在該實施方式中,由於使用學習結果操作成套設備,所以控制性能依賴於 用於學習上的連續模型的精度的程度較大。
在這裡為了提高精度,只要將進行數值分析的空氣流量的間隔細小化,增 加數據點的數量即可。但是,如上所述,由於在實際使用的時間中要進行許多 數據點的數值分析是困難的,所以重要的是有效地選擇數據點以抑制數據點的 個數。例如在圖18的場合,可以認為在CO濃度低的空氣流量0.5附近數據 的重要性高。於是,通過以下過程追加數據點。
圖19是表示利用數值分析生成連續模型的詳細的流程圖,在這裡的步驟 1201 ~步驟1208相當於圖17的步驟1101 ~步驟1103。
首先,在步驟1201中,設定用數值分析計算的空氣流量的點。在這裡設 定的點由於為初始設定,所以這時的點的間隔和點的數量,只要考慮分析的精 度、所需時間等,在空氣流量的變化範圍內適當設定即可。
接著,在步驟1202中,使用數值分析單元計算各空氣流量的點的CO濃 度。計算結果存儲在數值分析資料庫中。
然後,在步驟1203中,對離散的數據進行插補,生成連續模型,之後在 步驟1204中,臨時計算除去了任意數據點的場合的連續模型,在步驟1205 中計算與除去了的數據點的誤差。
圖20是這時的計算結果的一例,在這種場合,由於除去空氣流量0.5的 點而生成的連續模型與空氣流量0.5的點的誤差增大,由此判明該空氣流量0.5 附近的點對連續模型的影響較大,斷定在該部分需要以細小的間隔進行計算。
於是,在步驟1205之後,將該誤差與某個閾值進行比較(步驟1206), 在誤差超過該閾值的場合,判斷為該點附近的數據的重要性高,在到前後的點 之間追加數據點而使間隔細小化(步驟1207)。而且,對該追加了的數據點,使用數值分析單元計算CO濃度,再次計算連續模型。
通過這樣反覆進行步驟1202- 1207直到誤差變小,可以有效地追加數據,泉。
在這裡,圖21是表示由步驟1207追加數據點,再次生成了連續模型的場 合的數據例子圖,通過以上過程可以理解,能夠抑制進行數值分析的點的數量 的同時能夠生成精度高的連續模型。而且,之後,前進至步驟1208或步驟1103, 使用所生成的連續模型進行強化學習。
但是,由於由上述過程得到的模型使用了數值計算的結果,不可避免地在 與實際的成套設備之間存在誤差,所以最好儘量使用成套設備實際機器的運轉 數據。
於是,若最初使用由數值分析生成的連續模型進行強化學習,得到成套設 備實際機器的運轉數據,則使用運轉數據修正模型比較好。
從而,在該實施方式中,通過以下過程修正連續^^莫型,以該修正模型為對 象再次學習操作方法,因此,設有圖17的步驟1104,在這裡利用連續模型修 正單元修正連續模型。例如,在利用數值分析生成了連續模型的數據中包含糊 不清成套設備實際機器的運轉數據,再次生成連續模型。這時,由於優先使用 運轉數據,因此可以預先加以適當的重視。
圖22是這樣追加運轉數據而修正連續模型的場合的一例,與圖21的連續 模型相比,可知反映了成套設備實際機器的運轉數據的傾向。例如,在得到了 運轉數據的空氣流量附近,成為反映了運轉數據的傾向的連續模型。
另外,由於即使在沒有連續數據的部分,也能生成以數值分析的結果為基 礎的連續模型,所以可以得到精度更高的模型。
接著,在步驟1105中,使用修正了的連續模型進行強化學習。在再次學 習中,懂得了部分重新學習的方法,根據該方法,能夠以較小負荷構築控制才莫 型。
並且,這些步驟1104- 1105的過程在每次追加成套設備數據時都進行。 由此,可以將以數值分析結果為基礎的連續模型逐漸修正為與成套設備實際機 器的特性一致的模型,而且也可以將控制空氣流量的模型修正為與成套設備實 際機器的特性一致的模型。
26於是,使用該強化學習的結果計算空氣流量的操作量(步驟1106),接著 向成套設備1001輸出操作信號(步驟1107),控制要向成套設備1001的鍋爐 供給的空氣流量,而這時通過上述過程,由於能根據成套設備試運轉以分析結 果為基礎進行控制,能夠縮短直到引入的時間,可以伴隨運轉數據的積累修正 為成套設備實際機器的特性,所以能得到性能好的CO抑制控制。
從而,根據上述實施方式,從成套設備運轉前,可以利用數值分析結果構 築用於學習的模型,從而能夠縮短成套設備控制的引入期間,從未充分積累成 套設備運轉實際數據的階段開始發揮說明書規格性能,可以得到預定的CO的 控制。總之,不僅能夠對應在試運轉期間的燃料或原料的較多消耗,而且還能 夠對應由來自成套設備的排出物引起的對環境的影響。
另夕卜,根據上述實施方式,利用數值分析結果的誤差評價生成操作條件參 數,通過追加數值分析數據,降低模型的誤差,就可以進行性能好的控制。這 時,通過使用成套設備運轉數據修正模型,再次進行強化學習,從而總是能進 行性能好的控制。
減少增加NOx、 CO等環境負荷物質的產生的風險。
本發明由於從成套設備試運轉時開始,就能利用數值分析結果控制成套設 備,所以能夠縮短控制裝置的引入期間。另外,通過利用數值分析的誤差評價 生成操作條件參數,追加數值分析數據而降低模型的誤差,以及使用成套設備 運轉數據修正模型,再次進行強化學習,從而總是能進行性能好的控制。
另外,通過將本發明應用於火力發電設備的鍋爐上,能夠減少增加NOx、 CO等環境負荷物質的產生的風險。
權利要求
1. 一種成套設備控制方法,該成套設備所使用的控制裝置具有學習操作量和成套設備狀態的關係的學習功能,並具有利用該學習功能計算對應於成套設備狀態的操作指令值的功能,其特徵在於,利用多個操作條件的流動及反應現象的數值分析而計算規定成套設備的狀態的過程值,將各操作條件的過程值近似地生成連續模型,使其相對操作條件參數的變化成為連續的關係,使用通過數值分析計算的過程值和成套設備實際機器的運轉數據再次生成上述連續模型,使用再次生成的上述連續模型進行學習。
2. 根據權利要求1所述的成套設備控制方法,其特徵在於, 評價通過上述數值分析計算的過程值與利用上述連續模型的計算值的誤差,基於數值分析結果生成新的操作條件參數,使用生成的新的操作條件參數再次進行上述數值分析並計算新的過程值, 使用通過上述數值分析計算的舊的過程值和新的過程值再次生成上述連 續模型。
3. 根據權利要求1所述的成套設備控制方法,其特徵在於, 在規定上述成套設備的狀態的過程值中,使用從成套設備排出的微粒子類或揮發性有機化合物的至少 一種量或濃度,在上述操作條件中,使用空氣流量、燃料流量、空氣溫度、鍋爐的燃燒器 內的空氣分配、鍋爐的燃燒器傾角或鍋爐的並聯阻尼器角度中的至少一種。
4. 一種成套設備控制方法,該成套設備所使用的控制裝置具有模擬成套設備的特性的連續值;溪型,以及使用該連續值模型學習上述成套設備的操:作方法,並基於用該學習功能學習的結果計算對應於成套設備狀態的搡作指令值的 功能,其特徵在於,利用多個操作條件的流動及反應現象的數值分析而計算規定成套設備的狀態的過程值,將各操作條件的過程值近似地生成連續模型,使其相對操作條件參數的變 化成為連續的關係,使用通過數值分析計算的過程值和成套設備實際機器的運轉數據再次生 成上述連續模型。
5. —種成套設備控制裝置,具有學習操作量和成套設備狀態的關係的學 習功能,並具有利用該學習功能計算對應於成套設備狀態的操作指令值的功 能,其特徵在於,具有存儲成套設備的操作條件的過程值的運轉實際資料庫;存儲通過成套設備的操作條件的流動及反應現象的數值分析計算的過程 值的數值分析資料庫;從上述數值分析資料庫將各操作條件的過程值近似地生成連續模型,使其 相對操作條件參數的變化成為連續的關係的連續模型化單元;以及,追加上述運轉實際資料庫的過程值並再次生成上述連續才莫型的連續模型 修正單元,上述學習功能是使用利用上述連續模型修正單元再次生成的連續模型進 行學習的功能。
6. 根據權利要求5所述的成套設備控制裝置,其特徵在於,具備 評價通過數值分析計算的過程值和利用上述連續模型的計算值的誤差的單元;基於誤差評價結果生成新的操作條件參數的單元; 使用已生成的新的操作條件參數再次進行數值分析並計算新的過程值的 單元;以及,^使用上述連續^^莫型化單元通過數值分析計算的舊的過程值和新的過程值 再次生成連續模型的單元。
7. 根據權利要求5所述的成套設備控制裝置,其特徵在於, 在規定上述成套設備的狀態的過程值中,使用從成套設備排出的微粒子類或揮發性有機化合物的至少 一種量或濃度,在上述操作條件中,使用空氣流量、燃料流量、空氣溫度、鍋爐的燃燒器 內的空氣分配、鍋爐的燃燒器傾角或鍋爐的並聯阻尼器角度中的至少一種。
全文摘要
本發明涉及具備燃燒裝置的控制對象物的控制裝置。能夠抑制在燃料性質變化時氣體成分的控制性能下降的情況。本發明的控制裝置具有存儲燃燒裝置的操作參數和氣體中成分的數據組的燃料數據存儲單元;存儲控制對象物的過去的運轉實際值的運轉實際資料庫;決定使過去的運轉實際值和數據組的數據間距離為最短的數據組的數據生成單元;使用由數據生成單元決定的數據組,對操作參數和燃燒廢氣中成分的關係進行模型化的模型化單元;以及,使用模型校正基本控制指令運算單元的操作指令值的校正單元。
文檔編號F23N5/00GK101504152SQ20091012648
公開日2009年8月12日 申請日期2007年2月28日 優先權日2006年3月27日
發明者關合孝朗, 山田昭彥, 林喜治, 楠見尚弘, 深井雅之, 清水悟, 金田昌基 申請人:株式會社日立製作所

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀