基於k最近鄰分類算法的配電網拓撲結構校驗方法與流程
2023-06-05 11:00:11 1
![](https://img.xjishu.com/img/zl/2017/10/101819396298043.gif)
本發明涉及配電網拓撲結構校驗方法領域,具體涉及一種基於k最近鄰分類算法的配電網拓撲結構校驗方法。
背景技術:
電網公司通常使用電網GIS平臺維護配電網設備拓撲結構數據,主要包括電力用戶與臺區變壓器的連接關係,臺區變壓器與饋線的連接關係。配電網拓撲結構對95598客戶報修定位、配電網故障研判、停電計劃優化管理等業務都有著重要作用。目前,電網GIS平臺的配電網拓撲結構數據存在著大量錯誤或缺失,與配電網實際拓撲結構不一致,嚴重影響了電網公司日常業務正常開展。
為了校驗和修改這些錯誤,通常做法是:當配電網實際拓撲結構發生變化時,人工記錄這些變更並更新電網GIS平臺相關數據,或者組織人力進行實地巡測修正這些錯誤。這些方法既耗費大量的人力、時間,準確性又不夠,同時對於採用地下電纜鋪設的臺區、偏遠臺區等不具備良好的可操作性。
公開號CN 104218581的一種利用量測數據校驗配電網拓撲結構的方法,所述方法包括(1)計算智能電錶的分時電壓序列和分時電壓分布曲線;(2)分析電壓序列的相關係數;(3)評估每一對智能電錶的相對電距離;(4)通過比較電壓序列的電壓值,判斷出一組智能電錶在同一饋線上的相對上下遊位置,驗證GIS系統中數據、拓撲結構的正確性。該方法分析的數據來源是一定地理區域內、同一臺變下的不同智能電錶採集的每小時時序電壓,通過計算這些時序電壓之間的相關係數和其相對的電壓大小,並與同一區域內其他臺變下得出的同類數據作對比分析,驗證GIS系統中數據、拓撲結構的正確性。該方法的不足之處是:(1)無法快速大批量校驗配電網拓撲結構。(2)採用相關係數比較電壓曲線相似性對數據質量要求高,同時又很難確定一個相關係數的閥值判斷兩個用戶是否屬於同一個臺區。
技術實現要素:
有鑑於此,本發明的目的是針對現有技術的不足,提供一種基於k最近鄰分類算法的配電網拓撲結構校驗方法,用以解決現有校驗方法人力成本高、準確性不夠、可操作性差的問題。
為解決上述技術問題,本發明所採取的技術方案如下:
一種基於k最近鄰分類算法的配電網拓撲結構校驗方法,包括以下步驟:
(1)獲取校驗用戶所在臺區其它用戶和其鄰近臺區所有用戶,組成校驗用戶訓練樣本集合;
(2)提取校驗用戶及其訓練樣本集合所有用戶最近一段時間的電壓曲線數據;
(3)計算校驗用戶與其訓練樣本集合每個用戶之間電壓曲線的相似性;
(4)基於相似性大小選取校驗用戶的k個最近鄰,計算校驗用戶的正確臺區類別,進而判斷校驗用戶的配電網拓撲結構是否正確。
優選的,所述鄰近臺區是基於校驗用戶臺區變壓器與該地區其它臺區變壓器之間的距離搜索,若所述距離在預設範圍內,則判斷為鄰近臺區。
優選的,所述距離是根據電網GIS平臺中校驗用戶臺區變壓器與該地區其它臺區變壓器的經緯度坐標數據計算,包括:
設(jA,wA)為校驗用戶臺區變壓器經緯度坐標,(jB,wB)為該地區其它臺區變壓器經緯度坐標,R為地球半徑,利用公式dAB=R×cos-1[cos wA×cos wB×cos(jA-jB)+sin wA×sin wB]計算二者之間的物理距離。
優選的,所述計算校驗用戶與其訓練樣本集合每個用戶之間電壓曲線的相似性,是計算兩條電壓曲線之間的離散Fréchet距離,包括:
首先,將從用電信息採集系統提取的用戶智能電錶電壓序列數據表示成{(i,ui)}i=1…n;其中,i是提取的電壓值序列號,ui是提取的電壓值,n為提取的電壓值的數量;
其次,找出用戶電壓曲線的至高點;如果一個點的電壓值比前兩個點電壓值大同時還比後兩個點電壓值大,就稱它為一個至高點;並將它們表示成A=<(1,u1),…(m,um)>,其中(1,u1),…(m,um)是用戶電壓曲線的m個至高點;
最後,根據離散Fréchet距離的定義計算校驗用戶與訓練樣本集合中每個用戶電壓曲線之間的離散Fréchet距離。
優選的,對校驗用戶的k個最近鄰賦予不同的權值以體現其貢獻程度的高低,每個最近鄰權值是其與校驗用戶電壓曲線之間離散Fréchet距離的導數。
優選的,所述步驟(4),基於相似性大小選取校驗用戶的k個最近鄰,計算校驗用戶的正確臺區類別,進而判斷校驗用戶的配電網拓撲結構是否正確,包括:
步驟(41),基於離散Fréchet距離大小選取校驗用戶的k個最近鄰;
步驟(42),假設m個最近鄰{ai}i=1…m的臺區類別為A,它們與該用戶的離散Fréchet距離為{di}i=1…m;n個最近鄰{bi}i=1…n的臺區類別為B,它們與該用戶的離散Fréchet距離為{d′i}i=1…n;而且k=m+n;
步驟(43),若則判定校驗用戶的臺區類別為A;如果校驗用戶電網GIS平臺中臺區類別為A,則判定該用戶的配電網拓撲結構正確;否則判定該用戶的配電網拓撲結構錯誤,並在電網GIS平臺修正該用戶的所屬臺區為A。
本發明的有益效果是:
本發明分析的數據來源是電網公司用電信息採集系統裡的電壓序列數據,通過計算校驗用戶與其附近區域內每個用戶之間智能電錶電壓曲線的離散Fréchet距離,獲取與校驗用戶最相似的k個「最近鄰」,進而判斷校驗用戶的正確臺區類別,可有效驗證電網GIS平臺中配電網拓撲結構數據的正確性。本發明的校驗方法所需的物資和人力成本低、準確性高、可操作性好。
附圖說明
圖1為本發明提供的一種基於k最近鄰分類算法的配電網拓撲結構校驗方法的流程圖。
圖2為本發明兩個供電半徑交叉的臺區變壓器示意圖。
圖3為本發明校驗用戶m01及其訓練樣本集合中智能電錶電壓曲線圖。
具體實施方式
下面結合附圖對本發明的具體實施方式作進一步的詳細說明。
電網GIS平臺維護的配電網拓撲結構數據存在問題主要有2種:(1)未記錄用戶所屬的臺區或未記錄臺區變壓器所屬的饋線;(2)用戶所屬的臺區或臺區變壓器所屬的饋線記錄錯誤,而且通常是錯誤地把某個臺區用戶掛接到相鄰臺區,或者把某個饋線的臺區變壓器掛接到相鄰饋線。
在配電網中,由於各處負荷的不確定性,電壓經常波動。電氣距離比較近的負荷,其電壓波動曲線比較相似;而電氣距離比較遠的負荷,其電壓波動曲線相似度比較低。針對配電網拓撲結構數據第一種問題,可以根據用戶與附近區域用戶之間智能電錶電壓曲線的相似性對未記錄其臺區關係的用戶進行正確分類,標記該用戶所屬的臺區;或者是根據臺區變壓器與附近區域變壓器之間電壓曲線的相似性對未記錄其饋線關係的臺區變壓器進行正確分類,標記該變壓器所屬的饋線。針對配電網拓撲結構第二種問題,可以根據用戶與附近區域用戶之間智能電錶電壓曲線相似性識別、修正用戶所屬的臺區類別錯誤,或者根據臺區變壓器與附近區域變壓器之間電壓曲線相似性識別、修正臺區變壓器所屬的饋線類別錯誤。上述兩種問題可以歸納為校驗對象的分類問題。數據挖掘領域中的基於距離(相似性)度量的分類技術可以很好解決解決配電網用戶、臺區之間拓撲結構的校驗問題(臺區變壓器與饋線之間拓撲結構校驗相類似)。
如圖1所示,本發明提供一種基於k最近鄰分類算法的配電網拓撲結構校驗方法,包括以下步驟:
(1)獲取校驗用戶所在臺區其它用戶和其鄰近臺區所有用戶,組成校驗用戶訓練樣本集合;
(2)提取校驗用戶及其訓練樣本集合所有用戶最近一段時間的電壓曲線數據;
(3)計算校驗用戶與其訓練樣本集合每個用戶之間電壓曲線的相似性;
(4)基於相似性大小選取校驗用戶的k個最近鄰,計算校驗用戶的正確臺區類別,進而判斷校驗用戶的配電網拓撲結構是否正確。
實施例1:
本實施例提供一種基於k最近鄰分類算法的配電網拓撲結構校驗方法,包括以下步驟:
(1)獲取校驗用戶所在臺區其它用戶和其鄰近臺區所有用戶,組成校驗用戶訓練樣本集合。其中,鄰近臺區是基於校驗用戶臺區變壓器與該地區其它臺區變壓器之間的距離搜索。
國家電網公司企標《配電網規劃設計技術導則》明確,220/380V線路應該有明確的供電範圍,A類區域供電半徑不宜超過150米,B類不宜超過250米,C類不宜超過400米,D類不宜超過500米。參考圖2,兩個供電半徑交叉的臺區變壓器,兩臺配變與它所供電用戶之間距離應小於500米,若臺區變壓器A與臺區變壓器B之間物理距離小於1000米,則認為這兩臺變壓器是相鄰的,否則不相鄰。
從電網GIS平臺提取校驗用戶臺區變壓器以及該地區其它臺區變壓器的經緯度坐標。設(jA,wA)為校驗用戶臺區變壓器經緯度坐標,(jB,wB)為該地區其它臺區變壓器經緯度坐標,R為地球半徑,利用公式dAB=R×cos-1[cos wA×cos wB×cos(jA-jB)+sin wA×sin wB]計算二者之間的物理距離,若距離小於1000米,則判定鄰近臺區。
(2)從用電信息採集系統提取校驗用戶及其訓練樣本集合所有用戶最近一段時間的電壓曲線數據,最近24小時部分用戶電壓曲線分布圖如圖3所示。本實施例中為更方便的表示電壓曲線分布,圖3中選取最近24小時。最近一段時間的選取根據需求來選取,選取的時間段越長,計算結果越精確,同時計算量也越大,最近一段時間選取一周為最佳,可同時兼顧速度與準確性。
(3)計算校驗用戶與其訓練樣本集合每個用戶之間電壓曲線的離散Fréchet距離。
離散Fréchet距離具體定義如下:
定義1:給定一個有n個至高點的多邊形鏈P=〈p1,p2,p3,…pn〉,一個沿著P的k步(k-walk),分割P的至高點成為k個不相交的非空子集{Pi}i=1…k,使得和0=n0<n1<…<nk=n。
定義2:給定兩個多邊形鏈A=<a1,…am>,B=<b1,…bn>,一個沿著A和B的組合步(paired work)是一個沿著A的k步{Ai}i=1…k和一個沿著B的k步{Bi}i=1…k組成,使得對於1≤i≤k,要麼|Ai|=1,要麼|Bi|=1(就是說Ai,Bi中有一個恰好包含一個至高點)。
一個沿著鏈A和B的組合步W={(Ai,Bi)}的花費(cost)就是則鏈A和B間的離散Fréchet距離為
首先,將用戶電壓曲線表示成{(i,ui)}i=1…n,其中,i按提取電壓值的時間順序排列的序列號,ui是採集的電壓值。智能電錶採集間隔一般為15分鐘,若提取一周的電壓數據,則n=672。
接著,找出用戶電壓曲線的至高點。如果一個點比前兩個點電壓值大同時還比後兩個點大,就稱它為一個至高點;並將它們表示成A=<(1,u1),…(m,um)>,其中(1,u1),…(m,um)是用戶電壓曲線的m個至高點。
然後,根據上述離散Fréchet距離的定義計算校驗用戶與訓練樣本集合中每個用戶電壓曲線之間的離散Fréchet距離。
(4)基於離散Fréchet距離大小選取校驗用戶的k個最近鄰,假設m個最近鄰{ai}i=1…m的臺區類別為A,它們與該用戶的離散Fréchet距離為{di}i=1…m;n個最近鄰{bi}i=1…n的臺區類別為B,它們與該用戶的離散Fréchet距離為
{d′i}i=1…n;而且k=m+n。如果則判定校驗用戶的臺區類別為A。如果校驗用戶電網GIS平臺中臺區類別為A,則判定該用戶的配電網拓撲結構正確,否則判定該用戶的配電網拓撲結構錯誤,並在電網GIS平臺修正該用戶的所屬臺區為A。
上述雖然結合附圖對本發明的具體實施方式進行了描述,但並非對本發明保護範圍的限制,所屬領域的技術開發人員應該明白,在本發明的技術方案的基礎上,本領域及相關領域的技術開發人員不需要付出創造性勞動即可做出的各種修改或變形,仍在本發明的保護範圍以內。