基於動態模糊神經網絡的青黴素髮酵過程軟測量建模方法
2023-05-08 23:23:46 1
專利名稱:基於動態模糊神經網絡的青黴素髮酵過程軟測量建模方法
技術領域:
本發明涉及一種生物發酵過程中軟測量優化建模技術領域,具體是在青黴素髮酵 過程中用動態模糊神經網絡模型估計發酵過程中關鍵生化變量的軟測量建模方法。
背景技術:
微生物發酵工程被廣泛地應用於抗生素、胺基酸及精細化工產品的生產,在醫藥 工業、化學工業、輕工食品和環境保護等諸多領域都涉及微生物發酵,已成為生物化學工程 和現代生物技術及其產業化的基礎。然而在現代微生物發酵工業中,一些關鍵性的生物發 酵過程狀態變量,如菌絲濃度、基質濃度、產物濃度等缺乏在線直接測量手段。而這些關鍵 生化變量是否準確實時的測量直接制約著發酵工業的發展。為解決這些生化發酵過程中遇 到的難題,一種結合現代智能控制算法的軟測量技術隨之產生。所謂軟測量就是根據某種 準則,選擇一組既與被估計變量(即被測量或主導變量)有密切聯繫又容易測量的直接可 測變量(即輔助變量),通過構造一定的函數關係,用計算機軟體實現對被測量的估計。早期的軟測量技術主要用於控制變量或擾動不可測的場合,其目的是實現工業過 程的複雜控制,因此採用的軟測量模型也是與控制系統模型相對應的線性模型和機理模 型。隨著測量技術的發展,為了滿足對測量的更高要求,近年來軟測量技術能夠實現難測參 數的在線測量,軟測量模型也發展到基於神經網絡模型和基於人工智慧的混合模型研究。 軟測量技術已成為過程控制和過程檢測領域的主要發展趨勢之一。由於模糊神經網絡兼備 模糊邏輯和神經網絡的優勢,善於利用已有經驗知識且對複雜非線性函數具有任意逼近能 力的特性,其在軟測量領域的應用所形成的基於模糊神經網絡的軟測量方法,為生化、化工 過程的關鍵生化量的軟測量問題的解決,提供了強有力的手段。但傳統的模糊神經網絡在 初始模型的建立、規則數的確定等方面嚴重依賴於經驗選擇,而在微生物發酵過程中,專家 的經驗往往是不全面甚至是片面的,這便導致測量結果的誤差和不精確。
發明內容
本發明的目的是提供一種青黴素髮酵過程中基於動態模糊神經網絡的軟測量建 模方法,對青黴素髮酵過程中關鍵生化變量參數進行軟測量建模分析,具有良好的建模精 度,並具有較高的實用性。本發明採用以下步驟實現1)確定青黴素髮酵過程的溶解氧、pH值和發酵液體積為在線可測變量,葡萄糖、 玉米漿、麩質粉、磷酸二氫鉀和氨水流加速率為過程輸入變量,菌絲濃度X、基質濃度S、產 物濃度P為需離線化驗的不直接可測變量;2)將三個不直接可測變量作為主導變量,對於過程輸入變量、在線可測變量用一 致相關度算法分析其與主導變量的關聯度,進行二次變量選擇,設定關聯度閾值為0. 7,在 關聯度大於0. 7條件下確認關聯度較大的外部變量中的葡萄糖流加速率、氨水流加速率、 溶解氧、PH值這四個變量作為軟測量模型的輔助變量;
3)將確定的輔助變量作為軟測量模型的輸入變量,主導變量作為軟測量模型的輸 出變量,採用動態模糊神經網絡建立軟測量模型,利用訓練樣本集對該軟測量模型進行訓 練確定軟測量模型的結構和參數,通過驗證集驗證軟測量模型的精度,對軟測量模型的參 數進行優化本發明對獲取的現場測量數據以及離線測量數據通過一致相關度算法分析並確 定軟測量模型的輔助變量和主導變量,運用動態模糊神經網絡建立軟測量模型,利用訓練 樣本集對該模型進行訓練確定網絡模型的結構和參數,並通過驗證集驗證模型的精度。最 終通過該軟測量模型實現在線檢測發酵過程的關鍵生化變量,以實現對菌絲濃度X、基質濃 度S、產物濃度P的在線軟測量,其有益效果在於1.本發明給出了發酵過程中軟測量模型輔助變量的選擇和動態模糊神經網絡模 型的結構參數的優化方法,基於一致相關度法分析獲得軟測量模型輔助變量的過程,能夠 反映該輔助變量對主導變量的影響程度,使得輔助變量的選擇有了理論依據。對機理分析 獲得的大量輸入變量進行輔助變量的選擇,使得軟測量模型的複雜度降低,達到進一步提 高模型穩定性的目的。2.採用動態模糊神經網絡進行軟測量模型的優化,其參數的調整過程和結構的辨 識在訓練學習過程中同時進行,克服了傳統模糊神經網絡在初始模型的建立、規則數的確 定等方面嚴重依賴於經驗選擇的問題。通過對青黴素髮酵過程關鍵生物量參數進行軟測量 建模進行分析,對於缺乏經驗知識的微生物發酵過程,該方法有著良好的建模精度。3.本發明所提供的軟測量方法與軟測量系統不僅對青黴素髮酵過程有效,而且可 推廣到其它的化工、生化過程,具有廣闊的應用前景。
圖1是青黴素髮酵過程中基於動態模糊神經網絡的軟測量儀表優化建模方法的 基本結構框圖。圖2是動態模糊神經網絡的結構示意圖。圖3是動態模糊神經網絡的算法流程圖。圖4是動態模糊神經網絡的模糊規則產生圖。圖5是基於動態模糊神經網絡軟測量模型的訓練誤差變化圖。圖6是基於動態模糊神經網絡的軟測量模型預測結果。
具體實施例方式如圖1所示,本發明具體實施步驟如下1.確定青黴素髮酵過程的在線可測變量、過程輸入變量以及需離線化驗的不直接 可測變量。根據以下公式(1)所示的青黴素流加發酵過程的動力學模型,結合實際青黴素髮 酵過程情況,選擇青黴素髮酵過程的直接在線可測變量為溶解氧、PH值和發酵液體積;過 程輸入變量為葡萄糖、玉米漿、麩質粉、磷酸二氫鉀和氨水流加速率;需離線化驗的不直接 可測變量為菌絲濃度X、基質濃度S、產物濃度P,確定青黴素髮酵過程的在線可測變量、過 程輸入變量與需離線化驗的不直接可測變量。 其中 X表示菌絲濃度(g/L),m為菌絲細胞比生長速率QT1),V表示反應器中培養液的體積(L),S 基質濃度(g/L),μ pp為產物生長比速率QT1),mx為青黴素菌體細胞基質維持係數(kg/(kgXh)),YX/S、YP/S分別表示菌絲細胞對基質的得率係數和產物對基質的得率係數(kg/kg),pH為發酵液的pH值,Fsf為葡萄糖流加速率(g/(LXh)),P表示產物濃度(g/L),K為青黴素產物分解係數OT1),Cl為溶解氧濃度(mol/L),Yx/0, ΥΡ/。分別表示菌絲細胞對氧的得率係數和產物對氧的得率係數(g/g),m。氧維持係數(g/(gXh)),KLa為體積傳氧係數(m/h)。Cl*為氣相飽和氧濃度(mol/L),Fnh表示加入氨水的流加速率(g/(LXh)),Cl、c2、C3 為常數,F為發酵過程的各流加速率,μ χ為青黴素菌體比生長速率QT1),Kx為青黴素菌絲生長基質限制飽和常數(g/g),Kox為青黴素菌絲生長氧限制飽和常數(mol/g),μ ρ為青黴素菌體比合成速率QT1),Kp為青黴素產物生長基質限制飽和常數(g/L),K1為青黴素產物生長基質抑制常數(g/L),
Kop為青黴素產物生長氧限制飽和常數(mol/g)。2.確定青黴素髮酵過程中軟測量模型的輔助變量與主導變量。將菌絲濃度X、基質濃度S、產物濃度P三個不直接可測關鍵生化變量作為主導變 量,對於選取的過程輸入變量、在線可測變量用一致相關度算法分析其與主導變量(菌絲 濃度X、基質濃度S、產物濃度P)的關聯度,進行二次變量選擇,取關聯度較大的外部變量作 為軟測量模型的輔助變量。本發明以溶解氧Cp菌絲濃度X為例,一致相關度的具體算法如下 其中v(k)為變化率關聯繫數,r為關聯度,b為數據變化率對關聯度的影響;
1
JC
1 +定義Xk為符合因子,則當DX(k)DCL(k) > 0 或者 DX (k) = DCl (k) = 0 時則稱 X、CL 在 k 點趨勢相同時,Xk =1,關聯度為正;當DX (k) DCJk) = 0,則稱X、Q在k點趨勢無關時,Xk = 0,對相關聯度無貢獻;當 DX(k)DCL(k) < 0,則稱X、Q在k點趨勢相反,xk = -1,關聯度為負。對於溶解氧CL和菌絲濃度X,設有Hi1個趨勢相同的點WPk ,%},m2個趨勢無關
聯的點&i,K,^2},m3個趨勢相反的點飩,K,43},代入公式⑵可得 其中ki+k2+k3 = k-l,另M,Z,N分別表示正關聯度、零關聯度和負關聯度;當M > |N|時,溶解氧q、菌絲濃度χ以正相關為主,它們的變化趨勢相似,相關程度由r、M兩因素 的大小來衡量^r = Z = O時,溶解氧Q和菌絲濃度X無關;當M < INI時,溶解氧Cp菌 絲濃度X相關為主,即它們的變化趨勢相反,相關程度由由r、|N|兩因素的大小來衡量。
外部變量與菌絲濃度X的關聯度計算結果如表1所示
表1外部變量的關聯度計算值 由上計算結果可知,通過一致相關度算法分析並根據發酵過程經驗,設定關聯度 閾值為0. 7,即當在r > 0. 7的條件下,外部變量中的葡萄糖流加速率、氨水流加速率、溶解 氧、PH值與青黴素髮酵過程中的菌絲濃度X最為相關,因此,選擇上述四個變量作為軟測量 模型的輔助變量。3.軟測量模型的建立與參數的優化採用動態模糊神經網絡算法對軟測量模型參數進行優化,進而最終確定動態模糊 神經網絡的各權參數及結構。分為以下三步(1)獲取青黴素髮酵過程的現場數據以及離線測量數據,即如圖1所示的在線可 測變量、過程輸入變量和不直接可測變量。a)青黴素髮酵培養
P + N
(3)
<1ι
\J 2 a
8ι
d,
O
a
、=
容/ 2 ο
a
O
a
^3=
K
M =
Z =
N =
8
發酵培養基在50L發酵罐內經高溫消毒後降溫至25°C,分別進行種罐種子液接 種、發酵罐前期發酵液接種、混合接種和補料分批發酵培養,並對發酵過程中的可測量進行 控制罐內溫度0 50°C 士 0. 5°C ;pH 值2 12pH 士 0. 15PH;溶解氧0 100 % 士0. 5%罐壓0 0. 25Mpa ;電機攪拌轉速0 500轉/分,連續可調;空氣流量和補料速率根據發酵過程中的參數變化進行控制。b)數據採集與測定發酵過程中採集現場可測數據葡萄糖、玉米漿、麩質粉、磷酸二氫鉀、氨水流加速 率、溶解氧、PH值和發酵液體積;每4小時取樣化驗一次獲得離線生化量菌絲濃度X、基質 濃度S、產物濃度P ;總共採集10個發酵批次的數據作為樣本數據(每個發酵批次時間跨度為200小 時),其中前9個批次用於動態模糊神經網絡模型的訓練,第10批次的數據用來對動態模糊 神經網絡模型進行驗證。(2)數據處理為了提高模型的精確度,對樣本數據進行歸一化處理,歸一化公式選為
_ ^ItHX 一X入~(4)
γ 一γ夕
max min式中為歸一化後的數據,χ為原始樣本數據,Xmax、Xmin為樣本數據的最大值、最 小值。歸一化後樣本數據在W,l]之間。(3)確定動態模糊神經網絡各權參數及結構採用動態模糊神經網絡建立軟測量模型,其動態模糊神經網絡結構如圖2所示。 根據以上一致相關度算法所確定的輔助變量做為模型的輸入變量,主導變量(菌絲濃度X、 基質濃度S、產物濃度P)做為模型的輸出變量,其中用X1, X2, X3, X4依次表示輸入變量為葡 萄糖流加速率、氨水流加速率、溶解氧、PH值;Y是系統的輸出變量,包括菌絲濃度X、基質濃 度S、產物濃度P。MFij是第i個輸入變量的第j個隸屬函數,民表示第j條模糊規則,Nj是 第j個歸一化節點,%是第j個規則的連接權系,u是系統的總的規則數。網絡的各層的關 系如下第一層為輸入層,輸出節點為Xi,i = 1,2,3,4;第二層隸屬函數層,每個結點分別代表一個隸屬函數,(5)
σ其中i = 1,2,3,4,j = 1,2,...,u,Uij 是 Xi 的第 j 個隸屬函數,Cij 是 Xi 的第 j 個高斯隸屬函數的中心,σ是Xi的第j個高斯隸屬函數的寬度,r是輸入變量數,u是隸屬 函數的數量。第三層稱為T-範數層,第j個規則Rj的輸出為
9
其中 j = 1,2, . . .,u。
第四層歸一化層,第j個節點 的輸出為 φ.
第五層輸出層,該層的每個節點分別表示一個輸出變量,該輸出是所有輸入信號 的疊加 其中y是變量的輸出,wk是第k個規則的連接權。將式(5),式(6),式(7)分別代 入式(8)中,則可以得到網絡模型的輸入輸出關係
其中X為輸入變量,Wj是第k個規則的連接權系,u是系統的總的規則數,r是系 統輸入變量的個數,Cij是Xi的第j個高斯隸屬函數的中心,%是Xi的第j個高斯隸屬函 數的寬度。動態模糊神經網絡的各權參數及結構通過下一步的樣本集訓練和驗證確定。參數優化過程算法如圖3所示,通過以上所確定的樣本集中取前9個批次的數據 進行訓練,算法步驟如下所示a)初始化系統並預定義系統的初始參數ke、kd、kOT,其中為根據動態模糊神經 網絡的精度期望預先設定值,kd為高斯函數覆蓋範圍的有效半徑,kerr預設的誤差下降率的 閾值。ke,kd由下式確定ke = max[efflaxX β Sefflin](10)kd = max Kax X γ、Clmin](11)其中emax是預先設定好的最大誤差,emin是期望的精度,β (0 < β < 1)是收斂常 數,dmax是輸入空間的最大長度,dmin是最小長度,Y (0 < γ < 1)是衰減常數。b)第一條數據進入後,產生第一條模糊規則。即第一個數據(Xpt1)得到後,其中 X1是軟測量的第1個輸入向量,ti是期望的第1個輸出,這個數據就被選擇為第一條規則 C1 = X1, O1 = 0(|,其中1^&>1)是重疊因子,0。預先設置的常數。c)對於給定的第i個數據(XiAi),其中Xi是軟測量的第i個輸入向量,、是期望 的第i個輸出,i > 1,計算Xi和現有RBF單元中心C1之間的距離Cli (j),即
Cli(J) = I Ixi-CjI(12)其中j = 1,2,. . .,u,u為現有的模糊規則或者RBF單元的數量。並且計算出Cllllin = Brgmin((Ii (j))(13)如果dmin > kd則考慮增加一條新的模糊規則。同時根據式(9)計算得到全部輸出yi;定義ei為第i組數據的實際輸出誤差IeiN = Nti-YiI(14)如果I IeiI I > ke則考慮增加一條新規則。d)只有idmin>kd、| IeiI I >ke時才需要增加一條模糊規則。新產生的規則的初 始參數按如下規則進行分配Ci =Xi, O^kXdmin(15)其中k(k > 1)是重疊因子。其它情況如下第一種情況dmin彡kd,I IeiI I ( ke,此時可以動態模糊神經網絡可以完全容納待 入數據不需要更新數據。第二種情況dmin>kd,I IeiI I ke,這種情況表示覆蓋Xi的RBF單元的泛化能力 不是很好,該RBF節點以及結果參數同時被更新。對於接近Xi的第k個RBF單元按下式調 整σΧχσ^1,其中kw(0<kw< 1)是預定的常數。e)產生新的模糊規則之後,計算模型的誤差下降率,以進行模糊規則的修剪。一般 情況下一個模糊規則建立之後很難再剔除,在學習過程中檢測到不活躍的模糊規則時加以 剔除,可以獲得更為緊湊的動態模糊神經網絡結構。在此採用誤差下降率方法,引入Hi反 映第i個規則的重要性,Hi值越大,表示第i個規則的重要性。如果Hi < kerr(kerr為預設 的閾值),則第i個規則可以剔除;如果Hi彡,只需調整其結果參數。f)判斷訓練是否結束,如果沒有結束返回步驟C。用構成的前9批訓練樣本集對網絡進行訓練,訓練過程中模糊規則的產生如圖4 所示,訓練的過程中,模糊規則的建立隨著樣本數的增加而增加,但是樣本數目在360左右 後趨於穩定。同時圖5(a)所示為訓練過程中的實際輸出誤差變化曲線圖,圖5(b)為均方 根誤差變化圖,可以看出其實際輸出誤差變化曲線和均方根誤差變化曲線在訓練的過程中 逐漸趨於0,說明訓練達到了預期的效果。然後用第10批驗證樣本集對動態模糊神經網絡進行驗證,對該批的實際輸出值 跟預測值測試結果如圖6所示。圖6 (a)、(b)、(c)依次為菌絲濃度X、基質濃度S和產物濃 度的預測值和真實值的變化曲線,其中的實線代表真實值,星號線代表軟測量模型的預測 值。從圖6可以看出,本發明能達到很好的預測效果。
1權利要求
一種基於動態模糊神經網絡的青黴素髮酵過程軟測量建模方法,其特徵是採用如下步驟1)確定青黴素髮酵過程的溶解氧、pH值和發酵液體積為在線可測變量,葡萄糖、玉米漿、麩質粉、磷酸二氫鉀和氨水流加速率為過程輸入變量,菌絲濃度X、基質濃度S、產物濃度P為需離線化驗的不直接可測變量;2)將三個不直接可測變量作為主導變量,對於過程輸入變量、在線可測變量用一致相關度算法分析其與主導變量的關聯度,進行二次變量選擇,設定關聯度閾值為0.7,在關聯度大於0.7條件下確認關聯度較大的外部變量中的葡萄糖流加速率、氨水流加速率、溶解氧、pH值這四個變量作為軟測量模型的輔助變量;3)將確定的輔助變量作為軟測量模型的輸入變量,主導變量作為軟測量模型的輸出變量,採用動態模糊神經網絡建立軟測量模型,利用訓練樣本集對該軟測量模型進行訓練確定軟測量模型的結構和參數,通過驗證集驗證軟測量模型的精度,對軟測量模型的參數進行優化。
2.根據權利要求1所述的基於動態模糊神經網絡的青黴素髮酵過程軟測量建模方法, 其特徵是動態模糊神經網絡的確定包括以下步驟1)共採集10個青黴素髮酵發酵批次的數據作為樣本數據,其中前9個批次的樣本數據 用於動態模糊神經網絡模型的訓練,第10批次的樣本數據用於對動態模糊神經網絡模型 進行驗證;2)對10個樣本數據進行歸一化處理,歸一化公式選為χ\_ Xweoi~XX'為歸一化後的數據,X為原始樣本數據,Xmax、Xmin為樣本數據的最大值、最小值;歸-化後樣本數據在W,1]之間;3)確定動態模糊神經網絡各權參數及結構,模型的輸入輸出關係式為4uΣ(χ )2£[〒xp(-^^)]y = = ^-.^——u Σ(χ<- )2Σβχρ(~-2^)J=Iσ χ為輸入變量,y為輸出變量,Wj是第k個規則的連接權系,u是系統的總的規則數,r 是系統輸入變量的個數,Cij是Xi的第j個高斯隸屬函數的中心,C^是Xi的第j個高斯隸 屬函數的寬度;取前9個批次的樣本數據進行訓練,步驟如下a)初始化並預定義初始參數k。kd ke = max[emaxX β \ emin],kd = max[dmaxX y \ dmin]ke為根據動態模糊神經網絡的精度期望預先設定值,kd為高斯函數覆蓋範圍的有效半 徑,emax是預先設定好的最大誤差,emin是期望的精度,β (0 < β < 1)是收斂常數,(1_是輸入空間的最大長度,dmin是最小長度,γ (0 < γ 1,j = 1,2,...,U,U為現有的模 糊規則或者神經網絡單元的數量;根據全部輸出變量定義ei為第i組數據的實際輸出誤差=Mei I I = IVyiI ; 當dmin > kd、I IeiI I > ke時增加一條模糊規則,新產生的規則的初始參數按如下規則 進行分配=Ci = Xi, ο i = kXdmin,其中k(k > 1)是重疊因子; 其它情況如下第一種情況dmin彡kd,I I e, I I彡ke,不需要更新數據; 第二種情況dmin > kd,I I e, I I彡ke,結果參數需要調整;第三種情況dmin彡kd,I IeiI I > ke,接近Xi的第k個神經網絡單元按下式調整 σ; = ^χσ;"1,kw (O < kw < 1)是預定的常數;d)產生新的模糊規則之後,計算模型的誤差下降率,進行模糊規則的修剪,e)判斷訓練是否結束,若沒有結束則返回步驟c)。
全文摘要
本發明公開一種基於動態模糊神經網絡的青黴素髮酵過程軟測量建模方法,先確定青黴素髮酵過程的在線可測變量、過程輸入變量和為需離線化驗的不直接可測變量;再將不直接可測變量作為主導變量,對過程輸入變量、在線可測變量用一致相關度算法分析其與主導變量的關聯度,進行二次變量選擇確定輔助變量,最後將確定的輔助變量作為軟測量模型的輸入變量,主導變量作為輸出變量,採用動態模糊神經網絡建立軟測量模型並對其參數進行優化,本發明克服了傳統模糊神經網絡在初始模型的建立、規則數的確定等方面嚴重依賴於經驗選擇的不足,使得軟測量模型的複雜度降低,進一步提高模型穩定性,有著良好的建模精度。
文檔編號G06N3/00GK101929993SQ20101025985
公開日2010年12月29日 申請日期2010年8月20日 優先權日2010年8月20日
發明者夏成林, 孫玉坤, 朱湘臨, 王博, 黃永紅 申請人:江蘇大學