基於數據的城市汙水泵站系統建模方法
2023-05-20 18:55:46 1
專利名稱:基於數據的城市汙水泵站系統建模方法
技術領域:
本發明屬於自動化技術領域,具體涉及一種基於數據的城市汙水泵站系統建模方法。
背景技術:
隨著城市的飛速發展,城市排水已成為制約城市快速發展的瓶頸之。城市排水主要針對城市現有排水設施,通過排水系統管網泵站模型和實時監測數據,整體優化排水系統運行,提高泵站網絡的綜合運行效率、節能降耗,提高城市的預洪、防洪能力。
排水管網泵站系統模型是城市排水泵站規劃設計、運行控制、維護管理的核心。受天氣、居民生活汙水排放及管道淤堵、滲漏等複雜因素影響,泵站汙水流量具有不確定性、非線性和滯後性。現有排水管網泵站模型(SWMM,STORM和DHI等)多採用基於聖維南方程的水力學建模,建模複雜度高,往往由於缺乏準確的邊界條件信息而難以解析求解。同時排水管網系統存在的大量不確定因素,如降雨分布、生活汙水排放、管道淤堵、滲漏等,都將增加建模複雜性。
發明內容
本發明的目標是針對現有排水泵站系統建模難題,提供一種基於數據的城市汙水泵站系統建模方法,避免傳統基於聖維南方程的水力學建模的不足,保證模型精度的同時,也保證模型結構簡單並滿足實際排水系統運行要求。
本發明首先利用汙水泵站系統已知的先驗知識,確定系統模型的類型結構和部分參數取值範圍;然後根據泵站已有的大量運行數據認知模型參數,獲得可行的數據模型。所建模型是實際系統的一個近似,結構簡單,建模時間相對較短,適用於城市排水管網泵站實時優化運行和控制。
本發明利用數據採集、數據挖掘、系統辨識、預測機理、數據驅動和數值計算等手段,對難以建立機理模型的情況下,建立基於數據的城市排水管網系統汙水泵站模型,以實現對排水運行過程的優化控制和調度。
本發明方法的具體步驟 步驟(1)建立排水管網泵站預測模型。
現有城市排水系統數據採集與監控系統(SCADA系統)可採集泵站的水位信息,但因測量難題無法獲得管道汙水流量數據,為預測汙水在排水管網系統中各泵站的分布情況,改進Gelormino和Ricker(1994)提出的管網模型,分別建立排水管網泵站汙水儲量(水位)和汙水入流量的預測模型 x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1) 和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1) 其中k表示採樣時刻,x(k)為k時刻該泵站汙水儲水量,可以通過泵站前池截面積乘以泵站前池水位求得;x′(k-1)為採樣周期[k-1 k]內該泵站的汙水入流量;s(k-1)為採樣周期[k-1 k]內該泵站排出的汙水量;u(k-1)和ε(k-1)分別為採樣周期[k-1 k]內本地流入該泵站的汙水量之和的均值和噪聲;v(k-1)為採樣周期[k-1 k]內上遊泵站排出的汙水量;由於上遊泵站排出汙水量經管網流入下遊泵站的過程是非線性和滯後過程,採用T(z-1)v(k-1)表示上遊泵站排出的汙水量經管網延遲流入該泵站的汙水量,描述為 其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步採樣周期的相應量;na和nb分別表示上遊泵站排水量v對流入該泵站的汙水量x′的最小和最大遲延,nb>na;係數ai(i=na,…,nb)表示採樣周期[k-i-1 k-i]內上遊泵站排出量流入該泵站的汙水量的比例。
由於汙水在管網流動的延遲和不確定特性,不確定延遲算子T(z-1)的結構(na和nb)和參數ai(i=na,…,nb)未知,後面將利用SCADA系統採集的運行數據辨識不確定算子T(z-1),建立數據模型。
步驟(2)數據預處理。
SCADA系統採集的原始數據可能存在噪聲、數據不完整甚至是不一致,在利用這些數據進行分析建模前,需要對數據進行預處理。主要包括 遺漏數據處理SCADA採集的是時間序列數據,每隔10~30秒採樣1次。針對可能存在的遺漏項,首先粗選時間序列數據,每分鐘選1個數據;再利用忽略元組或歷史數據補全方法處理遺漏數據。
噪聲數據處理採用分箱(按周圍值的平均值平滑)方法處理噪聲數據。
步驟(3)系統辨識。
由步驟(1)給出的排水管網泵站預測模型可知,由於上遊泵站排水量大小對下遊泵站的影響不同,不確定延遲算子T(z-1)中模型結構(na和nb)和模型參數(係數
…,
)發生變化。辨識不確定延遲算子T(z-1)具體步驟如下 a.確定模型集類型 根據先驗信息分析,確定影響上遊泵站排水量大小的兩個具體因素①開泵臺數;②開泵時間。採用開泵率綜合評估影響上遊泵站排水量大小開泵率(即計量時間內上遊泵站所開泵運行總時間與計量時間內上遊泵站可用泵總可運行時間的比值)。根據泵站大量歷史運行數據統計分析,計量時間(如一天)內開泵率情況可聚類為3~5類模式,每一類對應建立一個預測模型。實際運行過程中,跟蹤開泵率指標,動態判斷當前運行時刻屬於何種模式,從而切換至合適的模型。
b.模型結構辨識 對流入泵站的汙水量x′與上遊泵站排水量v進行互相關性分析,從而確定模型結構,即不確定延遲算子T(z-1)中na和nb值。
n組採樣數據構成的時間序列[x′t]和[vt](t=1,2,…,n)與時延q相關,其中1≤q≤n,互相關係數rq(x′,v)為 式中 計算不同時延q下相關係數rq(x′,v),相關係數大於置信上限值的時刻就是模型結構na和nb,從而確定各模式下預測模型的結構。
c.模型參數辨識 確定模型結構後,需對模型參數進行辨識,確定
的值,採用最小二乘法進行參數辨識。
為便於使用最小二乘法,將步驟(1)得到的模型轉化為 z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1) 將上式化為一個標準的最小二乘形式 z(k)=hT(k)θ+ε(k-1) 式中,係數
h(k)=[v(k-na-1),…,v(k-nb-1)]T 將上式可寫成矩陣形式 ZL=HLθ+∑L 式中ZL=[z(1),z(2),…,z(L)]T,∑L=[ε(1),ε(2),…,ε(L)]T,L為辨識數據維數;
最小二乘法的準則函數J(θ)取為 J(θ)=(ZL-HLθ)TΛL(ZL-HLθ) 其中,ΛL為加權陣,一般取為正定對角陣。
極小化J(θ),可求出係數θ的估計值
步驟(4)模型參數在線動態修正。
隨著觀測數據的增多,常規最小二乘法計算量增加,不能及時辨識模型參數。本發明採用遺忘因子最小二乘法,克服數據飽和現象,減弱舊觀測數據對未知參數估計的影響,動態修正模型參數。
選擇準則函數為 JL+1=αJL+[z(L+1)-hT(L+1)θL]2 給出遞推公式求解模型係數θ的估計值
其中α為遺忘因子,一般取0.95<α<1;K(L+1)為權因子;P(L+1)為正定的協方差陣。
本發明方法的有益效果 (1)該方法突破傳統建模需對機理特性完全了解的束縛,建模時間相對較短,獲得模型結構較為簡單,是實際系統的一個合理近似。
(2)該方法避免求解傳統水力學數學模型-聖維南方程組,同時也避免計算機模擬模型對邊界參數等基礎數據的需求,只需利用大量的泵站歷史運行數據,實用更強。
(3)該方法通過模型結構聚類,建立不同模式下預測模型,可更好地模擬預測各種條件下的排水情況。
(4)該方法通過遺忘因子最小二乘法對模型參數進行在線辨識,克服了數據飽和現象,減弱舊觀測數據對未知參數估計的影響,能及時反映模型參數的變化,從而可以減少降雨分布、生活汙水排放、管道淤堵、滲漏諸多不確定因素對系統性能的影響,提高系統的魯棒性和可靠性,彌補了傳統建模方法的不足。
(5)該方法建立的基於數據的城市汙水泵站系統模型,可以很好的預測汙水泵站系統的多個參數(汙水流入量、汙水儲量、汙水水位),用於指導泵站的實際運行(a)合理設置泵站的控制水位,以避免不必要的頻繁開關泵,從而降低能耗,延長水泵的壽命;(b)實現預警判斷,為保證安全裕度提前開泵,甚至排空泵站汙水,以避免汙水溢出,實現安全生產。
具體實施例方式 以杭州留下和磁帶廠兩個上下遊泵站為例,對本發明作進一步說明。
(1)建立排水管網泵站預測模型;排水管網泵站預測模型包括排水管網泵站汙水儲量預測模型和汙水入流量的預測模型,分別為 x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1) 和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1) 其中k為採樣時刻,x(k)為k時刻磁帶廠泵站汙水儲水量,x′(k-1)為採樣周期[k-1 k]內磁帶廠泵站的汙水入流量;s(k-1)為採樣周期[k-1 k]內磁帶廠泵站排出的汙水量;u(k-1)為採樣周期[k-1 k]內本地流入磁帶廠泵站的汙水量之和的均值;ε(k-1)為採樣周期[k-1 k]內本地流入磁帶廠泵站的汙水量之和的噪聲;v(k-1)為採樣周期[k-1 k]內留下泵站排出的汙水量,T(z-1)v(k-1)為留下泵站排出的汙水量經管網延遲流入該泵站的汙水量 其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步採樣周期的相應量;na和nb分別表示留下泵站排水量v對流入磁帶廠泵站的汙水量x′的最小遲延和最大遲延,nb>na;係數ai(i=na,…,nb)為採樣周期[k-i-1 k-i]內上遊泵站排出量流入該泵站汙水量的比例; (2)數據預處理對SCADA採集的數據進行數據遺漏處理和噪聲處理。
遺漏數據處理泵站SCADA每隔20秒採樣1次數據,首先從採集的時間序列數據中進行粗選,每分鐘選1個數據,根據前後數據補全,關聯數據補全方法進行遺漏數據處理;對於連續缺失較多的數據,通過對比前一天的數據,進行類比補全。
噪聲數據處理對開關泵時水面波動造成的水位測量誤差,通過多傳感器測量值平均和前後數據平滑校正進行處理;對於明顯的偏大偏小的數據,通過去除毛刺方法進行校正。
(3)數據聚類根據預處理後的歷史數據計算統計指標值-開泵率,通過統計分析將開泵率聚類為3~4類模式,每一類對應建立一個預測模型。實際運行過程中,跟蹤開泵率指標,動態判斷當前運行模式,切換至合適的預測模型。
(4)模型結構辨識分別對每種模式的杭州磁帶廠泵站汙水流入量x′與其上遊留下泵站的排水量v進行相關性分析,獲得每類模式下留下泵站和磁帶廠泵站互相關係數值rq(x′,v),汙水泵站液位控制的運行機理決定了互相關係數的周期性。
根據經驗公式計算得到的流速和上下遊泵站的距離計算汙水流經管網時間,確定正相關性對應的周期,即上遊留下泵站的排水量影響下遊磁帶廠泵站流入量的時間段。該周期內的相關係數大於置信上限值時所對應的最小時刻和最大時刻就是模型中不確定延遲算子T(z-1)中na和nb值,從而確定各模式下預測模型的結構。
(5)模型參數辨識採用最小二乘法對各種模式下預測模型進行參數辨識,即確定
的值。
將預測模型轉化為如下形式 z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1) 將上式轉化為一個標準的最小二乘形式 z(k)=hT(k)θ+ε(k-1) 式中,係數
h(k)=[v(k-na-1),…,v(k-nb-1)]T。
將上式可寫成矩陣形式 ZL=HLθ+∑L 式中ZL=[z(1),z(2),…,z(L)]T,∑L=[ε(1),ε(2),…,ε(L)]T,L為辨識數據維數;
根據
從而得到模型參數
的估計值
(6)模型參數在線動態修正。
通過步驟(2)至步驟(4)得到不同模式下的預測模型,在實際運行時,為了能及時反映不確定因素對模型參數的影響,採用遺忘因子最小二乘法對模型參數進行在線修正。
取遺忘因子α值為0.98。初值θ和P取步驟(4)中參數辨識的結果,即
誤差ε=0.01。按如下遞歸方程進行在線參數修正 (7)排水管網泵站汙水分布預測。
由步驟(3)至步驟(5)確定各模式下泵站預測模型,利用該模型可以預測下遊泵站的汙水流入量和汙水儲量,以及泵站前池水位。
權利要求
1.基於數據的城市汙水泵站系統建模方法,其特徵在於該方法包括如下步驟
步驟(1)建立排水管網泵站預測模型;排水管網泵站預測模型包括排水管網泵站汙水儲量預測模型和汙水入流量的預測模型,分別為
x(k)=x(k-1)+T(z-1)v(k-1)-s(k-1)+u(k-1)+ε(k-1)
和x′(k-1)=x(k)-x(k-1)+s(k-1)=T(z-1)v(k-1)+u(k-1)+ε(k-1)
其中k為採樣時刻,x(k)為k時刻該泵站汙水儲水量,x′(k-1)為採樣周期[k-1 k]內該泵站的汙水入流量;s(k-1)為採樣周期[k-1 k]內該泵站排出的汙水量;u(k-1)為採樣周期[k-1 k]內本地流入該泵站的汙水量之和的均值;ε(k-1)為採樣周期[k-1 k]內本地流入該泵站的汙水量之和的噪聲;v(k-1)為採樣周期[k-1 k]內上遊泵站排出的汙水量,T(z-1)v(k-1)為上遊泵站排出的汙水量經管網延遲流入該泵站的汙水量
其中T(z-1)為不確定延遲算子,z-1為一步延遲算子,表示延時一步採樣周期的相應量;na和nb分別表示上遊泵站排水量v對流入該泵站的汙水量x′的最小遲延和最大遲延,nb>na;係數ai(i=na,...,nb)為採樣周期[k-i-1 k-i]內上遊泵站排出量流入該泵站汙水量的比例;
步驟(2)對數據進行預處理,具體包括處理遺漏數據和處理噪聲數據;
處理遺漏數據的方法為對數據採集與監控系統採集的時間序列數據首先進行數據粗選,即每分鐘選1個數據;然後再利用忽略元組或歷史數據補全方法處理遺漏數據;
處理噪聲數據的方法為採用分箱方法處理噪聲數據;
步驟(3)辨識不確定延遲算子T(z-1),具體方法是
a、確定模型集類型;
根據泵站大量歷史運行數據將上遊泵站開泵率聚類為3~5類模式,每一類對應建立一個預測模型,跟蹤當前開泵率指標,動態判斷當前運行時刻屬於何種模式,從而切換至與該模式對應的預測模型;
所述的開泵率為計量時間內上遊泵站所開泵運行總時間與計量時間內上遊泵站可用泵總可運行時間的比值;
b、對流入泵站的汙水量x′與上遊泵站排水量v進行互相關性分析,確定模型結構na和nb;具體方法是
n組採樣數據構成時間序列[x′t]和[vt](t=1,2,...,n)與時延q相關,其中1≤q≤n,互相關係數rq(x′,v)為
式中
計算不同時延q的相關係數rq(x′,v),當rq(x′,v)大於設定的置信上限值時,rq(x′,v)所對應的最小時刻和最大時刻就是模型結構na和nb;
c、採用最小二乘法確定預測模型參數
將步驟(1)得到的預測模型轉化為
z(k)=x(k)-x(k-1)+s(k-1)-u(k-1)=T(z-1)v(k-1)+ε(k-1)
將上式化為一個標準的最小二乘形式
z(k)=hT(k)θ+ε(k-1)
式中,係數
h(k)=[v(k-na-1),...,v(k-nb-1)]T;
將上式寫成矩陣形式
ZL=HLθ+∑L
式中ZL=[z(1),z(2),...,z(L)]T,∑L=[ε(1),ε(2),...,ε(L)]T,L為辨識數據維數;
最小二乘法的準則函數J(θ)取為
J(θ)=(ZL-HLθ)TΛL(ZL-HLθ)
其中,ΛL為加權陣,取正定對角陣;
極小化J(θ),得到係數θ的估計值
d、在線動態修正模型參數
選擇準則函數JL+1,JL+1=αJL+[z(L+1)-hT(L+1)θL]2;
根據遞推公式求解係數θ的估計值
其中α為遺忘因子,一般取0.95<α<1;K(L+1)為權因子;P(L+1)為正定的協方差陣。
全文摘要
本發明涉及一種基於數據的城市汙水泵站系統建模方法。現有排水管網泵站模型建模複雜度高。本發明方法首先建立排水管網泵站預測模型;其次SCADA系統採集的原始數據進行預處理;然後確定模型集類型,辨識模型結構和模型參數辨識;最後對模型參數進行在線動態修正。本發明方法突破傳統建模需對機理特性完全了解的束縛,建模時間相對較短,獲得模型結構較為簡單。
文檔編號G05B13/02GK101807045SQ201010140199
公開日2010年8月18日 申請日期2010年4月2日 優先權日2010年4月2日
發明者徐哲, 左燕, 薛安克, 王建中, 何必仕, 張學同 申請人:杭州電子科技大學