唐波 朱兵 葉水勇 韓輝
(國網安徽省電力公司黃山供電公司, 安徽黃山 245000)
一種PMS異常數據檢測工具設計
唐波 朱兵 葉水勇 韓輝
(國網安徽省電力公司黃山供電公司, 安徽黃山 245000)
隨著國網公司PMS系統建設的完成和深化應用的推進,數據質量已成為系統高效應用的重要因素,如何高效、全面的識別不完整數據及異常數據,是實現PMS系統數據的規范性、標準化的基礎。通過PMS數據質量檢測工具研制,依靠自動化數據質量分析工具提高數據質量管理水平,改善了數據質量,全面提升了PMS系統數據質量的自動化、信息化水平。
PMS系統 數據質量 數據檢測
電公司生產管理系統(PMS)于2013年正式上線運行,生產管理系統(PMS)是國家電網公司“SG186工程”八大業務應用之一,以提高輸電、變電、配電設備可靠運行為目標,實現電網生產的規范性、標準化和精細化管理,提高電網安全生產管理水平[1]。PMS系統中維護的設備類型包括輸電設備16種類型;變電設備32種類型;配電設備36種類型,數據類型繁多、數據量大。PMS系統數據質量分析工具較缺乏、運維工作量大、自動化水平低[2]。目前系統據質量標準體系不完整,缺乏有效的數據治理機制,在數據生命周期之中容易流入一些不一致、不準確、不可靠的數據,數據質量存在隱患。同時數據運維人員每日面對多種設備類型數據,按照現行的人工核對方式難以從容應對,即使加班加點維護、管理也不能滿足現在數據隨時間變化更新的步伐;缺乏有效的數據質量標準、分析和監控等自動化運維工具,在數據變化時,運維人員手工比對,難以做到數據變化,及時對數據迭代清洗更新[3]。
為此本文通過對各類設備臺賬的校驗規則進行分析,歸納出一種基于正則表達式的臺賬校驗規則表達方法,并以此方法為基礎研制了PMS數據質量檢測工具,以支撐PMS系統數據質量提升工作的標準化實踐。
工具統一管理設備類型和數據標準定義,并以運行過程數據質量分析和數據監控為主線,以數據質量體系為支撐,實現數據質量持續提升管理。
1.1 設備類型管理
通過界面方式對PMS系統所屬設備進行分類型管理。包括輸電設備、變電設備、配電設備等三大類設備。
1.2 設備類型數據標準定義
實現不同設備類型屬性數據的數據標準定義,通過此功能可以滿足數據標準定義隨實際需要方便變更。通過對臺賬字段的正確規則進行分析,將數據標準定義類型分為:選擇類型、手工類型、計算類型、拼接類型、關聯類型等。選擇類型針對該屬性內容是某個內容集合的子集,例如:電壓等級包含交流1000kV、交流500kV、交流220kV;手工類型針對屬性內容為指定正則表達式內容;計算類型針對屬性內容直接表達式計算,例如:額定電流=額定容量KVA/(電壓等級*1.732);拼接類型針對屬性內容中包含其他屬性內容關系,例如:設備型號中應含有字符或者數字加上容量及電壓等級信息;關系類型針對屬性內容包含負責的關系運算,例如:相數是單相,相別可以是A相、B相、C相;相數是三相,相別可以是ABC相等。如圖1所示。
1.3 數據質量分析管理
依據定義好的數據標準,對設備類型數據進行數據質量分析,給出數據分析中異常數據的結果。同時能導出EXCEL文檔異常數據,在文檔數據中標示出了異常數據并對異常數據給出了整改說