一種電力設備疑似重複數據識別方法
2023-11-06 12:34:07
一種電力設備疑似重複數據識別方法
【專利摘要】本發明涉及一種電力設備疑似重複數據識別方法,屬於電力工程及電力調度信息化建設領域。該方法通過詞組拆分、詞組判定、生成匹配結果、電力調度命名規則等技術或功能的組合,實現了電力企業疑似重複電力設備數據的抽取、識別、對應,建立統一的電網設備臺帳信息;拆分詞組,用於把電力設備名稱的長句拆分為有意義的詞組;詞組選擇,根據調度命名規則、電網公共模型及設備類別判斷出疑似重複的設備;生成匹配結果,根據前兩步判斷結果,程序可自動生成以廠站為單位的匹配列表;電力調度命名規則,根據電力調度規程,實現電力調度命名規則的結構化,支持詞組判定。
【專利說明】一種電力設備疑似重複數據識別方法
【技術領域】
[0001]本發明屬於電力工程及電力調度信息化建設領域,涉及一種關於電力設備疑似重複數據的識別方法。本方法主要是實現了調度控制中心在運行管理中,獲得不同的系統設備數據後完成重複數據的匹配,為進一步利用設備數據奠定基礎。
【背景技術】
[0002]現今的電力工程及電力調度信息化建設處於一個高速建設的過程中,但每個部門需求不同導致建設的系統中對設備臺帳的信息側重點不同,由於建設的時間、建設廠家也是不同的,所以在業務需要以橫向協同時,不同的設備數據難以在各個部門之間流轉。換而言之,就算是同一臺設備,由於系統最對應設備的命名不同,各個系統之間難以識別和對應其他系統發送過來的設備信息是本系統中哪一個設備。設備臺帳不統一,難以整合和利用,是如今電力企業在信息化建設過程中的一大難題。
[0003]目前,電力設備數據在電力企業,尤其在電網公司中,典型存在於電力調度自動化系統、電力調度運行管理系統、電網安全生產管理系統,這些系統中的電力設備其編碼、命名均存在差異,設備數據資源具有以下特點:
1)電力調度系統的電網模型面向電網網絡分析和計算,符合「模型互操作」的技術要求,嚴格遵循CIM模型標準,數據準確度較高,但數據模型主要為一次設備模型,僅包含一些保護設備模型,不能完整反應二次設備信息;
2)電力調度運行管理系統內部的設備臺帳主要為發電資源信息,如編制發電計劃所需的耗水率曲線、震動區和水頭等信息,此外還有小水電、小火電等信息;編制檢修計劃或申請所需的檢修設備庫;
3)電網安全生產管理系統的設備臺帳面向電網資產管理,幾乎包含了變電站內所有的一次設備、二次設備以及輔助設備,線路設備上還包含了杆塔、金具等信息,總體來看,設備信息較為全面,但一般不包含發電廠信息。由於該系統的設備臺帳面向電網資產管理,其數據建模視角與電力調度管理需要存在一定的差異,例如其設備數據分為功能位置碼和物理設備兩類,這些概念與調度需要有所差異。
[0004]由於每個系統的設備臺帳信息的主要內容不同,設備編碼、命名均尋在差異,設備臺帳的不完整、質量不高已成阻礙電網運行管理類系統提升功能的問題,一次設備和保護設備設備臺帳的完整性,設備臺帳的存量和增量的管理思路都是現存在的難以解決的問題。本發明是識別疑似重複數據的一套方法,主要是用於完成現有不同系統間重複設備的匹配。
【發明內容】
[0005]本發明為了解決上述難題,提出了一種電力設備疑似重複數據識別方法。通過該方法能夠快速識別同一系統或不同系統的電力設備,既解決了同一部門或不同部門間電力設備信息不一致問題,為電力調度提供準確的基礎信息;又能為跨部門的數據共享與交互提供統一的電力設備基礎信息,保證了數據能夠有效集成。該發明既提高了電力調度的安全性,又減少了因電力設備信息不一致增加的電網運營成本。
[0006]本發明採用的技術方案如下:
一種電力設備疑似重複數據識別方法,包括電力行業詞組拆分模塊、電力行業詞組判定模塊、生成匹配結果模塊、電力調度命名規則模塊、電力行業專有名詞庫模塊;其中以電力調度命名規則模塊為核心,由電力調度命名規則模塊分別連接電力行業詞組拆分模塊、電力行業詞組判定模塊,電力行業詞組拆分模塊分別連接電力行業詞組判定模塊、電力行業專有名詞庫模塊,詞電力行業組判定模塊分別連接電力行業專有名詞庫模塊、生成匹配結果模塊;電力調度命名規則模塊根據「電力調度規程」進行命名規則的維護和管理;電力設備數據識別以電力調度命名規則庫為基準依據,進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中:
電力調度命名規則模塊通過關係型資料庫進行存儲,實現規則的電子化、結構化;該模塊對關鍵詞的確認:根據調度的命名規則,程序識別出拆分的詞組中調度命名的數字組,並對數字組進行比對,還能夠根據電網公共模型,搜索上級廠站或線路,確認是否屬於同一線路或廠站,以及再次確認設備是否屬於同一類別,最終確認出重複數據,在完成對電力設備命名的拆分、判定後,自動生成匹配的對應關系列表;
電力行業專有名詞庫模塊採用語義分析功能,使每一次對設備命名的拆分都做到拆分成詞;
電力行業詞組拆分模塊通過對電力調度中詞組或語句的分析進行拆分,並通過電力行業專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調度設備命名欄位,將欄位分解為有意義的詞組,該拆分技術依賴於智能的語義分析以及電網行業詞庫的支持;(詞組拆分:選定需要拆分的數據範圍後,該方法實現的軟體系統自動根據電力命名規則、電力調度語義邏輯和電力專有名詞,對電力設備清單中指定列的內容進行詞組拆分,形成單詞和詞組的混合詞語庫;)
判斷疑似數據是否是同一個數據的方法是:完成詞組判定,採用設備類別、調度命名規貝U、電網模型規則三步;第一步根據調度命名規則,找出詞組中代表調度命名的數字組,判斷疑似重複設備的調度命名是否相同,如果相同則進入下一規則判斷;第二步根據兩個系統中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網模型關係,追溯疑似重複設備的上級線路或上級廠站容器,判斷是否屬於同一線路或廠站。
[0007]本發明的有益效果是,通過該方法能夠快速識別同一系統或不同系統的電力設備,既解決了同一部門或不同部門間電力設備信息不一致問題,為電力調度提供準確的基礎信息;又能為跨部門的數據共享與交互提供統一的電力設備基礎信息,保證了數據能夠有效集成。該發明既提高了電力調度的安全性,又減少了因電力設備信息不一致增加的電網運營成本。
【專利附圖】
【附圖說明】
[0008]圖1為本發明中電力設備疑似重複數據識別的框架和邏輯圖。【具體實施方式】
[0009]如圖1所示,一種電力設備疑似重複數據識別方法,包括電力行業詞組拆分模塊、電力行業詞組判定模塊、生成匹配結果模塊、電力調度命名規則模塊、電力行業專有名詞庫模塊;其中以電力調度命名規則模塊為核心,由電力調度命名規則模塊分別連接電力行業詞組拆分模塊、電力行業詞組判定模塊,電力行業詞組拆分模塊分別連接電力行業詞組判定模塊、電力行業專有名詞庫模塊,詞電力行業組判定模塊分別連接電力行業專有名詞庫模塊、生成匹配結果模塊;電力調度命名規則模塊根據「電力調度規程」進行命名規則的維護和管理;電力設備數據識別以電力調度命名規則庫為基準依據,進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中:
電力調度命名規則模塊通過關係型資料庫進行存儲,實現規則的電子化、結構化;該模塊對關鍵詞的確認:根據調度的命名規則,程序識別出拆分的詞組中調度命名的數字組,並對數字組進行比對,還能夠根據電網公共模型,搜索上級廠站或線路,確認是否屬於同一線路或廠站,以及再次確認設備是否屬於同一類別,最終確認出重複數據,在完成對電力設備命名的拆分、判定後,自動生成匹配的對應關系列表;
電力行業專有名詞庫模塊採用語義分析功能,使每一次對設備命名的拆分都做到拆分成詞;
電力行業詞組拆分模塊通過對電力調度中詞組或語句的分析進行拆分,並通過電力行業專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調度設備命名欄位,將欄位分解為有意義的詞組,該拆分技術依賴於智能的語義分析以及電網行業詞庫的支持;(詞組拆分:選定需要拆分的數據範圍後,該方法實現的軟體系統自動根據電力命名規則、電力調度語義邏輯和電力專有名詞,對電力設備清單中指定列的內容進行詞組拆分,形成單詞和詞組的混合詞語庫;)
判斷疑似數據是否是同一個數據的方法是:完成詞組判定,採用設備類別、調度命名規貝U、電網模型規則三步;第一步根據調度命名規則,找出詞組中代表調度命名的數字組,判斷疑似重複設備的調度命名是否相同,如果相同則進入下一規則判斷;第二步根據兩個系統中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網模型關係,追溯疑似重複設備的上級線路或上級廠站容器,判斷是否屬於同一線路或廠站。
[0010]本發明中的其餘模塊均與電力調度命名規則和電力專有名詞庫模塊連結;實現步驟如下:
第一步,建立基礎信息。通過電力調度命名規則和電力專有名詞庫,實現企業中電力調度命名規則和電力行業及企業制定的專有名詞的維護;
第二步,準備待識別的電力設備清單。若待別的電力設備位於不同信息系統的存儲介質,可通過系統接口或文件導入兩種方式,經電力設備清單導入到該方法實現的軟體系統中。其中系統接口方式,實現了按鈕操作,即只需點擊數據導入按鈕就實現數據導入;第三步,詞組拆分,選定需要拆分的數據範圍後,該方法實現的軟體系統自動根據電力命名規則、電力調度語義邏輯和電力專有名詞,對電力設備清單中指定列的內容進行詞組拆分,形成單詞和詞組的混合詞語庫;
第四步,詞組判定,按照電力調度命名規則、語義邏輯、專有名詞庫、電網模型結構等對拆分後的詞組進行判定,可錄入詞組判定說明內容;
第五步,生成匹配結果,根據詞組判定結果自動生成判定結果。
[0011]以電網企業中電力調度自動化系統、電力調度運行管理系統、電網安全生產管理系統等三大系統中的電力設備數據識別為例,構建電網公司統一的電力設備臺帳庫,其【具體實施方式】如下:
設備臺帳來源主要有以下途徑,其中每個系統所包含的數據存在重複數據需要匹配:
1)來源於電力調度自動化系統的電網模型,其中包含一次設備模型、保護設備模型;
2)來源於PMS系統的電網設備臺帳,其中包含一次設備臺帳數據、二次設備臺帳數據;
3)來源於電力調度運行管理系統的發電資源信息和檢修設備數據,如發電廠、水庫、小電廠等信息;
以上三個系統數據源各有特點,均有其利用價值,OMS系統設備臺帳可按照全景建模的技術思路,對三類數據資源進行整合,形成較為完備和準確的電網設備臺帳,方能較為全面地支持調度業務管理工作,對數據整合的基礎就是完成重複數據的匹配工作。首先,電力調度自動化系統電網模型的數據準確高,一次設備也較為全面,可以該系統電網模型為基礎,生成電網設備臺帳庫,作為設備臺帳庫的基礎資源;其次進一步完成電力調度自動化系統與電力調度運行管理系統、電網安全生產管理系統的設備臺帳數據的匹配。由於電力調度自動化系統與電網安全生產管理系統的設備編碼和命名存在一定的差異,利用本方法,實現兩系統間編碼的映射、匹配,以便於電力調度自動化系統與、電力調度運行管理系統、電網安全生產管理系統進行數據交換時,做相應的數據轉換。
【權利要求】
1.一種電力設備疑似重複數據識別方法,其特徵在於:包括電力行業詞組拆分模塊、電力行業詞組判定模塊、生成匹配結果模塊、電力調度命名規則模塊、電力行業專有名詞庫模塊;其中以電力調度命名規則模塊為核心,由電力調度命名規則模塊分別連接電力行業詞組拆分模塊、電力行業詞組判定模塊,電力行業詞組拆分模塊分別連接電力行業詞組判定模塊、電力行業專有名詞庫模塊,詞電力行業組判定模塊分別連接電力行業專有名詞庫模塊、生成匹配結果模塊;電力調度命名規則模塊根據「電力調度規程」進行命名規則的維護和管理;電力設備數據識別以電力調度命名規則庫為基準依據,進行電力設備名稱的詞組拆分、詞組判定、生成匹配結果;其中: 電力調度命名規則模塊通過關係型資料庫進行存儲,實現規則的電子化、結構化;該模塊對關鍵詞的確認:根據調度的命名規則,程序識別出拆分的詞組中調度命名的數字組,並對數字組進行比對,還能夠根據電網公共模型,搜索上級廠站或線路,確認是否屬於同一線路或廠站,以及再次確認設備是否屬於同一類別,最終確認出重複數據,在完成對電力設備命名的拆分、判定後,自動生成匹配的對應關系列表; 電力行業詞組拆分模塊通過對電力調度中詞組或語句的分析進行拆分,並通過電力行業專有名詞庫進行校驗;本模塊中的程序以自動智能的分解調度設備命名欄位,將欄位分解為有意義的詞組,該拆分技術依賴於智能的語義分析以及電網行業詞庫的支持; 判斷疑似數據是否是同一個數據的方法是:完成詞組判定,採用設備類別、調度命名規貝U、電網模型規則三步;第一步根據調度命名規則,找出詞組中代表調度命名的數字組,判斷疑似重複設備的調度命名是否相同,如果相同則進入下一規則判斷;第二步根據兩個系統中設備的基礎信息,對設備的類別做初步判斷,判斷是否是同一個類別設備;第三步利用電網模型關係,追溯疑似重複設備的上級線路或上級廠站容器,判斷是否屬於同一線路或廠站。
【文檔編號】G06Q10/06GK104036372SQ201410316351
【公開日】2014年9月10日 申請日期:2014年7月4日 優先權日:2014年7月4日
【發明者】陳飛, 蔣亞坤, 趙川, 趙瑩, 羅洪, 何文洪, 張榮奎 申請人:雲南電力調度控制中心, 雲南雲電同方科技有限公司