基於曲波變換和核稀疏的抽油井半監督故障診斷方法與流程
2023-12-10 14:33:32 3

本發明涉及一種抽油井故障診斷技術,具體地說是一種基於曲波變換和核稀疏的抽油井半監督故障診斷方法。
背景技術:
在實際的石油開採過程中,常用的有杆泵抽油井系統所處的生產環境較為惡劣,故障發生率高,經常無法正常工作。各種故障會導致諸如產油量減少,油井停產甚至設備損壞等嚴重後果。在傳統的石油生產中,一般依靠有經驗的技術人員人為的對採集到的井上示功圖或者經轉化而得到的井下泵功圖進行分析,來判斷系統當前是否正常工作。這種方法效率低,且受主觀影響大,無法滿足企業的生產需求。因此,利用計算機自動實現有杆泵抽油井系統的故障診斷是一種非常有意義的技術。
有杆泵抽油井系統的故障診斷可以看成是一個模式識別問題,通常分為兩個步驟:特徵提取和分類。常用的針對井上示功圖或者井下泵功圖的特徵提取方法主要有網格法,鏈碼法,傅立葉級數法等;分類一般採用經典的支持向量機和bp神經網絡。這些經典方法往往並不能很好的結合實際生產情況。
當前的有杆泵抽油井系統的故障診斷方法大都為有監督方法,即所有的訓練數據都人為的標記出故障類型。在實際生產中,有標籤的數據是非常昂貴的,很難獲得大量的標記數據,相對的,存在大量的未被利用的無標記的數據。如何利用好這些無標記數據的信息,是一個亟待解決的問題。
技術實現要素:
針對現有技術中有杆泵抽油井系統故障診斷方法中存在大量的未被利用的無標記的數據、不能很好的結合實際生產情況等不足,本發明要解決的問題是提供一種可有效利用未標記數據信息的基於曲波變換和核稀疏的抽油井半監督故障診斷方法。
為解決上述技術問題,本發明採用的技術方案是:
本發明一種基於曲波變換和核稀疏的抽油井半監督故障診斷方法,包括以下步驟:
1)通過現場示功儀獲取n(n=l+u)個示功圖數據作為訓練樣本,其中l個示功圖為已知標籤數據,u個示功圖為無標籤數據;
2)根據波動方程,利用有限差分法將n個示功圖轉化為井下泵功圖,再將每個泵功圖轉化大小為m×m像素的灰度圖像;
3)對每個泵功圖xi進行曲波變換,得到第i個泵功圖的s個尺度的係數矩陣ci:
ci={cij},i=1,…,n,j=1,…,s,其中n為泵功圖總數量,s=log2m-3;
4)根據第一個尺度的係數矩陣ci1計算單幅泵功圖的特徵向量vi;
5)將全部有標籤的泵功圖的特徵向量作為字典d,d={vi},i=1,…,l;對每個未標記泵功圖特徵向量vj,j=l,…,l+u,求稀疏係數
6)利用稀疏係數,計算每個無標籤泵功圖的虛擬標籤j=l,…,l+u;
7)將訓練樣本中所有泵功圖的特徵向量作為字典d',d'={vi},i=1,…,l+u;對每一個待診斷的測試樣本,計算其特徵向量vtest,並求得其對應的稀疏係數
8)利用稀疏係數計算待診斷樣本的虛擬標籤ytest,並據此判斷故障類型。
步驟4)中,根據第一個尺度的係數矩陣ci1計算單幅泵功圖的特徵向量vi為:對由曲波變換得到的尺度係數矩陣中的第一個尺度的係數矩陣ci1,採用非重疊的方式按照2×2的大小進行二進剖分,分別計算每個剖分子塊的灰度均值,得到一個特徵矩陣c′i1,將矩陣c′i1按照如下公式進行歸一化:
將歸一化後的矩陣c′i1的每一列級聯成一個向量,即得到單幅泵功圖的特徵向量vi。
步驟6)利用稀疏係數計算每個無標籤泵功圖的虛擬標籤j=l,…,l+u為:
利用稀疏係數和全部有標籤的泵功圖的標籤集合yd={yi},i=1,...,l直接計算每個無標籤泵功圖的虛擬標籤j=l,…,l+u。
步驟8)利用稀疏係數計算待診斷樣本的標籤ytest為:
利用稀疏係數全部有標籤泵功圖的標籤集合yd={yi},i=1,...,l,以及全部無標籤泵功圖的虛擬標籤集合i=l,...,l+u直接計算待診斷樣本的虛擬標籤
標籤ytest中數值最大的元素所對應的序號i,即代表當前發生第i類故障。
本發明具有以下有益效果及優點:
1.本發明通過對井下泵功圖進行曲波變換後得到的特徵向量能更精確的描述出泵功圖的特徵,基於核方法的半監督稀疏表達分類器不僅可以有效的利用未標記數據的信息,而且對有標記的樣本數量要求不高,可以節省大量用來標記樣本的人力成本。
2.本發明通過有限差分法將井上示功圖轉化為井下泵功圖,並對得到的井下泵功圖進行曲波變換並提取特徵,所得到的特徵向量能更精確的描述出泵功圖的特徵,以便於後續診斷。
3.基於核方法的半監督稀疏表達分類器只需要計算訓練樣本間的稀疏關係,不需要預先測試超參數,具有很強的泛化能力,可以更好的結合實際生產情況。
附圖說明
圖1為本發明出基於曲波變換和核稀疏的抽油井半監督故障診斷方法流程圖;
圖2為本發明方法中有限差分法求解泵功圖中補格法示意圖;
圖3為本發明方法中利用有限差分法求得的泵功圖;
圖4為本發明方法對泵功圖進行曲波變換得到的係數矩陣可視化的結果示意圖。
具體實施方式
下面結合說明書附圖對本發明作進一步闡述。
如圖1所示,本發明一種基於曲波變換和核稀疏的抽油井半監督故障診斷方法包括以下步驟:
1)通過現場示功儀獲取n(n=l+u)個示功圖數據作為訓練樣本,其中l個示功圖為已知標籤數據,u個示功圖為無標籤數據;
2)根據經典波動方程,利用有限差分法將n個示功圖轉化為井下泵功圖,再將每個泵功圖轉化大小為256×256像素的灰度圖像;
3)對每個泵功圖xi進行曲波變換,得到第i個泵功圖的s個尺度的係數矩陣ci:
ci={cij},i=1,…,n,j=1,…,s,其中n為泵功圖總數量,s=log2256-3=5;
4)據第一個尺度的係數矩陣ci1計算單幅泵功圖的特徵向量vi;
5)將全部有標籤的泵功圖的特徵向量作為字典d,d={vi},i=1,…,l;對每個未標記泵功圖特徵向量vj,j=l,…,l+u,求稀疏係數
6)利用稀疏係數,計算每個無標籤泵功圖的虛擬標籤j=l,…,l+u。
7)將訓練樣本中所有泵功圖的特徵向量作為字典d',d'={vi},i=1,…,l+u;對每一個待診斷的測試樣本,其特徵向量vtest,求得其稀疏係數
8)利用稀疏係數計算待診斷樣本的標籤ytest。
步驟2)中,以某油田為例,三級組合杆柱每根杆長為523.61m,664.32m和618.35m,杆柱的直徑為0.025m,0.022m和0.019m。抽油杆密度為8456kg/m3,石油密度為843kg/m3,彈性模量e=2.1×1011pa,粘滯阻尼係數c=0.4654,應力傳播速度a=4970m/s。
根據如下波動方程:
利用有限差分法將所有井上示功圖轉化為井下泵功圖,設驢頭的下始點為坐標原點,將每根抽油杆分為k段,選取每段的步長為δx,同理,選取δt為時間t的步長,下角標i表示位置,j表示時間,則有:
將以上三式帶入波動方程可以得到:
根據井上示功圖可知地面光杆位移為u1,u2,…,uk,光杆動載荷為f1,f2,...,fk,根據胡克定律則波動方程的邊界條件為:
(1)u1,1=-u1;u1,2=-u2;…;u1,k=-uk
其中a為抽油杆截面積。
由於示功圖是一個周期函數,如圖2所示,採用補格法可得到邊界條件:
(3)ui,k=ui,0
(4)ui+1,1=ui,k+1
步長δx和δt的選取,應滿足如下的穩定性條件:
在杆柱末端(泵)處,位移為:
up=-ui+1
杆柱末端(泵)處,載荷為:
根據所求得的泵位移和泵載荷,即可繪製出井下泵功圖。所求得的泵功圖如圖3所示。之後將每個泵功圖轉化大小為256×256像素的灰度圖像。步驟3)中,利用第二代curvelet工具包對每個泵功圖xi進行曲波變換,得到5個尺度的係數矩陣ci,ci={cij},i=1,…,n,j=1,2,3,4,5。泵功圖及其對應的係數矩陣可視化結果如圖4所示。
步驟4)中,將第一個尺度的係數矩陣ci1,採用非重疊的方式按照2×2的大小進行二進剖分,分別計算每個剖分子塊的灰度均值,得到一個10×10的矩陣c′i1,將矩陣c′i1按照如下公式進行歸一化:
將歸一化後的矩陣c′i1的每一列級聯成一個100×1的向量,得到單幅泵功圖的特徵向量vi。
步驟5)中,關於稀疏係數的優化求解,本發明方法選取的核函數為如下形式的高斯函數:
k(x,xc)=exp(-||x-xc||/σ)
其中,xc為核函數中心和σ為核函數的寬度參數,控制了核函數的徑向控制範圍。取σ=8d,d為特徵向量的維度。
將全部有標籤的泵功圖的特徵向量作為字典d,d={vi},i=1,…,l。對每個未標記的泵功圖特徵向量vj,j=l,…,l+u,其相應的稀疏係數可通過求解如下優化問題得到:
其中,φ(·)代表非線性映射函數,並滿足φ(x1)φ(x2)=k(x1,x2),核函數向量kj=[k(vj,v1),...,k(vj,vl)],k為如下形式的核函數矩陣:
步驟6)中,利用稀疏係數和全部有標籤的泵功圖的標籤集合yd={yi},i=1,...,l直接計算每個無標籤泵功圖的虛擬標籤j=l,…,l+u。
其中,yd為全部有標籤的泵功圖的標籤向量集合,yd={yi},i=1,...,l。
步驟7)中,將訓練樣本中所有泵功圖的特徵向量作為字典d',d'={vi},i=1,…,l+u。對每一個待診斷的測試樣本,計算其特徵向量vtest,其相應的稀疏係數可通過求解如下優化問題得到:
其中,核向量ktest=[k(vtest,v1),...,k(vtest,vl)],k為如下形式的核函數矩陣:為
式中,αtest為待診斷樣本所對應的稀疏係數,vtest為待診斷樣本的特徵向量,λ為權衡因子,αij為αj中的第i個元素,vi,為單幅泵功圖的特徵向量;分別為αtest中的第i1,i2,個元素。
步驟8)中,根據稀疏係數計算待診斷樣本的虛擬標籤ytest。
其中,yd為全部有標籤的泵功圖的標籤向量集合,yd={yi},i=1,...,l;為全部無標籤泵功圖的虛擬標籤向量集合,i=l,...,l+u。
虛擬標籤ytest中數值最大的元素所對應的序號i,即代表當前發生第i類故障。
本發明通過有限差分法將所有訓練數據即井上示功圖轉化為井下泵功圖並轉為灰度圖像,利用曲波變換對泵功圖進行特徵提取後,將其中所有的有標籤的泵功圖的特徵向量作為字典,對每一個無標籤泵功圖特徵向量求其相對應的稀疏表達係數,根據稀疏表達係數計算虛擬標籤以補所有全訓練數據的標籤,最後將訓練樣本中所有泵功圖的特徵向量作為字典,對每一個待診斷的測試樣本,求其特徵向量所對應的稀疏係數,並計算診斷樣本的標籤,完成診斷。本發明所採用的曲波變換,能更精確的描述出泵功圖的特徵;基於核方法的稀疏表達分類器不僅可以有效的利用未標記數據以便提高故障診斷的正確率,而且對有標記的樣本數量要求不高。