一種電網故障特徵數據質量評價方法與流程
2023-12-07 04:00:01

本發明涉及一種評價方法,尤其涉及一種電網故障特徵數據質量評價方法。
背景技術:
為適應未來電網發展的要求和調度業務模式轉型的需要,國調中心組織研發了新一代的智能電網調度技術支持系統,並在國家電網省級以上電網全面推廣建設。隨著此系統的深化應用和實用化建設的開展,積累的數據量會越來越龐大和維度越來越複雜,系統的功能發揮很大程度依賴電網基礎數據質量,這將對數據質量評估提出了更為嚴格的要求。
數據質量問題包括數據清洗、數據整合、數據檢測和數據質量評估等一系列環節,其中數據質量評估是提高數據質量的基礎和前提。不同的背景下有著自己的定義,不同的行業對數據的評估點也不同。電力行業數據質量的評估必須根據電力系統的需求和數據特徵來決定。在電網信息化的進程中,由於人為、設備故障和外部環境等原因,電網的基礎統計數據質量面臨如下問題:1)異常;2)缺失;3)冗餘;4)不規範;5)不及時等。因此,有必要圍繞電網數據生命周期,借鑑成熟的數據治理管理經驗,制定全面有效的數據質量保障機制,實現對供電企業數據的全過程質量管理,保障數據的準確、及時、有效和可信。
有關電網數據質量綜合研究的文獻尚少,有些文獻提到電力大數據質量評價指標、評價模型等,但是缺少各個指標的具體設計過程、評價模型具體研究方法和實例。
技術實現要素:
針對現有技術中存在的上述缺陷,本發明提供了一種電網故障特徵數據質量評價方法,通過構建指標評價體系和計算方法,建立綜合評價模型實現電網故障特徵數據質量評價。
本發明是通過如下技術方案來實現的:一種電網故障特徵數據質量評價方法,包括以下步驟:
a、構建數據質量評價指標體系,基於綜合性、科學性和可操作性三個基本原則,所述評價指標體系包括數據實時性、數據正確性、數據完備性以及數據可靠性四個指標;
b、建立指標計算方法,具體如下:
(1)實時性評價指標
針對電網故障特徵數據,實時性是評價時效性的指標,具體計算公式如下:
其中,S表示間隔/廠站數據質量實時性評價指標,N表示統計時間範圍內的故障事件次數,Sil表示第i次故障事件中的第l故障特徵數據的實時性指標數值,Kl第l個故障特徵數據質量實時性指標的權重,指標權重大小由模糊熵綜合評判方法得出;
定義:
其中,Tdelay表示告警時延同門檻值之間的差值,t表示門檻值,n值根據故障特徵數據類別設定,具體含義指實時性指標Sil以百分制計算,若告警信息滿足時延性要求,則置為100分,若告警信息時延每超過告警時延門檻值t秒,則扣除5分,超過告警時延門檻nt秒,則認為告警信息的實時性指標為零;
(2)正確性評價指標
針對電網故障特徵數據,正確性是評價電網故障情況下各類故障特徵數據是否正確上送的指標,計算公式如下:
其中C表示間隔/廠站數據質量正確性評價指標,N表示統計時間範圍內的故障事件次數,Cil表示第i次故障事件中的第l個故障特徵數據的正確性指標數值,Kl表示對應第l個故障特徵數據質量正確性指標的權重;
定義:
另外若故障未採集,則不對該數據進行評價;
(3)完備性評價指標
針對電網故障特徵數據,完備性是評價每次故障事件中各類故障特徵數據完整程度的指標,計算公式如下:
其中,I表示間隔/廠站數據質量完備性評價指標,N表示統計時間範圍內的故障事件次數,Ii表示第i次故障事件的完備性指標數值;
(4)可靠性評價指標
針對電網故障特徵數據,可靠性是衡量電網正常運行或設備正常操作情況下錯誤告警信息的指標,計算公式如下:
其中R表示間隔/廠站數據質量可靠性評價指標,N表示統計時間範圍內的故障事件次數,Ri表示第i次故障事件的可靠性指標數值;
定義:
其中Mact為一周內故障特徵數據錯誤告警次數;
以上各指標值越大,數據質量越好;
c、根據上述各指標數據,採用層次分析法和熵值法相結合的評判方法確定各指標權重,具體如下:
W=(wi)1*n
其中式中n表示指標個數,i表示第i個指標,wi*表示層次法求得指標i權重,wi′表示熵值法求得指標i的權重;
d、由各指標的權重加權求得指標體系的綜合得分,實現不同單位或廠站的電網故障特徵數據質量綜合評價。
由上述可知,本發明設計了關於實時性、正確性、完備性和可靠性的四個評價指標,並對四個評價指標定義了計算方法,通過採用層次分析法和熵值法相結合的評判方法確定各指標權重,進一步得到指標體系的綜合得分,實現不同單位或廠站的電網故障特徵數據質量綜合評價,實現不同單位或廠站的數據質量綜合評價,形成有效的監測機制,運用綜合得分大小進行橫向、縱向的比較,分析影響數據質量的關鍵要素,呈現不同數據質量優勢及薄弱環節,方便為數據質量的提升點找到最佳路徑。
附圖說明
圖1為本發明實施例中所述電網故障特徵數據的類別圖;
圖2為本發明實施例中所述故障特徵數據質量指標得分圖;
圖3為本發明實施例中所述指標的權重圖;
圖4為本發明實施例中不同廠站不同時間的數據質量綜合得分及總體排名圖。
具體實施方式
下面通過非限定性的實施例並結合附圖對本發明作進一步的說明:
電網故障特徵數據是指反映設備短路故障、機組跳閘以及直流閉鎖等故障特徵的調度主站側數據。電網故障特徵數據主要包括三大類,如圖1所示,包括SCADA系統的遙測、遙信以及SOE數據,WAMS系統的三相電壓、電流以及保信系統的保護動作信號、故障簡報以及故障錄波文件等。
本發明實施例提供了一種電網故障特徵數據質量評價方法,包括以下步驟:
a、構建數據質量評價指標體系,基於綜合性、科學性和可操作性三個基本原則,所述評價指標體系包括數據實時性、數據正確性、數據完備性以及數據可靠性四個指標;
b、建立指標計算方法,具體如下:
(2)實時性評價指標
針對電網故障特徵數據,實時性是評價時效性的指標,具體計算公式如下:
其中,S表示間隔或廠站的數據質量實時性評價指標,N表示統計時間範圍內的故障事件次數,Sil表示第i次故障事件中的第l故障特徵數據的實時性指標數值,Kl第l個故障特徵數據質量實時性指標的權重,指標權重大小由模糊熵綜合評判方法得出;模糊熵綜合評價方法是一種基於模糊數學的綜合評價方法,該綜合評價法根據模糊數學的隸屬度理論把定性評價轉化為定量評價,即用模糊數學對受到多種因素制約的事物或對象做出一個總體的評價;
定義:
其中,Tdelay表示告警時延同門檻值之間的差值,t表示門檻值,n值根據故障特徵數據類別設定,具體含義指實時性指標Sil以百分制計算,若告警信息滿足時延性要求,則置為100分,若告警信息時延每超過告警時延門檻值t秒,則扣除5分,超過告警時延門檻nt秒,則認為告警信息的實時性指標為零;
(2)正確性評價指標
針對電網故障特徵數據,正確性是評價電網故障情況下各類故障特徵數據是否正確上送的指標,計算公式如下:
其中C表示間隔或廠站的數據質量正確性評價指標,N表示統計時間範圍內的故障事件次數,Cil表示第i次故障事件中的第l個故障特徵數據的正確性指標數值,Kl表示對應第l個故障特徵數據質量正確性指標的權重;
定義:
另外若故障未採集,則不對該數據進行評價;
(3)完備性評價指標
針對電網故障特徵數據,完備性是評價每次故障事件中各類故障特徵數據完整程度的指標,計算公式如下:
其中,I表示間隔或廠站的數據質量完備性評價指標,N表示統計時間範圍內的故障事件次數,Ii表示第i次故障事件的完備性指標數值;
(4)可靠性評價指標
針對電網故障特徵數據,可靠性是衡量電網正常運行或設備正常操作情況下錯誤告警信息的指標,計算公式如下:
其中R表示間隔或廠站的數據質量可靠性評價指標,N表示統計時間範圍內的故障事件次數,Ri表示第i次故障事件的可靠性指標數值;
定義:
其中Mact為一周內故障特徵數據錯誤告警次數;
以上各指標值越大,數據質量越好;
c、根據上述各指標數據,採用層次分析法和熵值法相結合的評判方法確定各指標權重,具體如下:
W=(wi)1*n
其中式中n表示指標個數,i表示第i個指標,wi*表示層次法求得指標i權重,wi′表示熵值法求得指標i的權重;
上述層次分析法是美國匹茲堡大學教授Satty T.L於上世紀70年代初提出的一種多目標決策分析方法。它把影響被評價對象的各種因素按照相互作用、影響及隸屬關係劃分為有序的遞歸層次結構,根據對客觀現實的主觀判斷,對相對於上一層次的下一層次中的因素進行兩兩比較,然後經過數學計算及檢驗,獲得最底層權值的一種定性與定量分析相結合的系統分析方法。
熵是德國物理學家克勞修斯在1850年提出的,它可以表示一種能量在空間中分布的均勻程度中。在系統論中,熵越大說明系統越混亂,攜帶的信息越少,熵越小說明系統越有序,攜帶的信息越多。熵值法是一種客觀賦權的方法,它的思想是通過計算指標的信息熵,根據指標的相對變化程度對系統整體的影響來決定指標的權重,相對變化程度大的指標具有較大的權重,此方法現廣泛應用在統計學等各個領域,具有較強的研究價值。熵值法首先是計算樣本的各指標得分,並利用各指標的信息效用值確定指標的權重,然後求加權和得到綜合得分。
在專家進行評分的基礎上,採用熵值法對專家主觀意見進行匯總。層次分析法和熵值法結合的評價模型同時考慮對定性指標量化處理以及數據信息離散度對指標權重的影響。每個專家按照保守、最可能情況對每個指標權重的進行打分,再合成一個綜合數據。此外,對調查結果的差異性的處理採用熵值法的思路對指標權重進行修正,使得評價模型更為科學合理。
d、由各指標的權重加權求得指標體系的綜合得分,實現不同單位或廠站的電網故障特徵數據質量綜合評價。
根據上述指標計算方法,得出某單位3個廠站的故障特徵數據質量指標得分如圖2所示。
運用Pluto數據挖掘平臺,結合上述採集的指標數據,得到四個指標的權重如圖3所示。
從圖3中可以看出,可靠性指標權重最大,實時性指標權重最小,權重符合熵值法的思想。進一步得到不同廠站不同時間的數據質量綜合得分及總體排名,如圖4所示。
運用綜合評價方法進行電網故障特徵數據的研究,得出上述指標的影響權重值,加權得到數據質量的綜合得分,從而實現不同單位或廠站的數據質量綜合評價,形成有效的監測機制;運用得分大小進行橫向、縱向的比較;分析影響數據質量的關鍵要素,呈現不同數據質量優勢及薄弱環節,方便為數據質量的提升點找到最佳路徑。
上述實施例僅用於對本發明的說明,並非對其限制,本領域的技術人員還可在此基礎上做出改變。