楊加圣,黃 超,蔡園園
(江蘇電力信息技術有限公司,南京 210029)
現如今,電力行業發展迅速,電網設備也逐漸增多,為了了解電力運行情況,必須要對電網設備的運行狀態進行評估。線路以及重要用戶是電網設備非常關鍵的內容,直接影響電力行業的發展,所以線路與重要用戶運行狀態是直接保證電力系統運行的決定性因素。目前這兩點依然還是以人工判斷為主,評判標準不統一,導致信息傳遞落后,嚴重影響了電力設備狀態評估的進行,建議應用大數據技術,加快行業改革。
當設備處于運行狀態下,具體方案見圖1。

圖1 電路運行方案
在數據中心以及大數據平臺的幫助下得到線路狀態評估的數據信息,具體如調度停運線路數據、計劃停電線路數據、域外廠站關聯線路數據。調度停運線路數據將另外兩種數據去除之后便可以獲得故障停運線路數據。這種方法可以全面提升評估的真實性與準確性,將線路運行狀態實時反映出來。
2.1.1 多源數據集成與規范化轉換
為了實時了解電力設備狀態,可以構建大數據分析平臺,不僅要在PMS以及設備狀態監測系統中采集數據,還要積極利用物聯網、收集無人機巡線以及移動互聯等技術等完成實時信息的檢測,形成完善的設備全景信息庫,使電網設備狀態等信息有大量數據作為支撐[1]。根據數據本身所具備的完整性、實用性以及安全性等特點,建議采用Web service、安全文件傳輸以及數據中心數據庫共享等多種數據接口采集電網業務系統數據,將跨平臺數據庫可能面臨的問題及時解決。
2.1.2 非結構性數據轉換
利用人工巡檢以及在線監測等手段獲取的紅外熱像、紫外成像等,一般是通過非結構化方式進行處理,在應該過程中及時發現電力設備中存在的問題,使設備狀態評估結果更加科學。電力設備相關的試驗、巡檢文檔以及檢修工單等,都可以通過非結構化文本進行儲存,并且為設備狀態評估提供有價值的數據[2]。此外,圖像處理以及文本挖掘技術可以更有效率的完成設備狀態檢測以及數據轉換,使數據統計分析工作能夠順利完成。
2.1.3 狀態數據質量評估以及數據清洗
數據質量為數據挖掘分析最終結果提供了條件,現如今電力設備狀態有關數據的渠道越來越多,信息量也逐漸增大,很容易出現信息結構不完整或是遺失等問題,特別是電力設備狀態監測系統不穩定,傳感器出現短期失效等諸多問題,導致監測數據內出現一些異常值,對最終狀態評估結果造成影響。
在數據預處理過程中,電力設備狀態數據清洗是非常重要的環節,一般是利用統計分布、聚類以及關聯分析等方式檢測數據質量,將不正確的數據清除,補充缺失數值,鑒別離群點,保證數據的準確性和完整性,并且能夠符合設備狀態數據挖掘分析需求。數據清洗過程中,最重要的一點在于,數據出現異常需要和設備狀態異常變化有效區分開,否則將會導致設備狀態異常或者出現漏判等現象。
2.2.1 數據信息儲存技術
以往設備狀態數據存儲主要是運用關系型數據庫和并行數據庫,但是隨著數據信息越來越多,使查詢性能不斷降低,無法滿足設備狀態大數據分析根本要求??紤]到電力設備狀態大數據存儲要求,尤其是在非結構化與結構化融合、儲存容量以及速度等多個方面的要求,更多采用主流分布式文件存儲以及分布式 NoSQL 列存儲數據庫這兩種形式[3]。為了有效提升數據庫的訪問性能,必須要積極優化電力設備的狀態數據,提升數據處理速度。例如,因為設備狀態數據本身帶有相關性、時空性這兩個特點,可以應用分布式存儲算法,根據設備主屬性以及時間戳等,將帶有相關性屬性的數據集合在集群內;針對Hadoop平臺中的數據劃分對策、調節數據塊尺寸、集群網絡拓撲方案等展開完善與優化。
2.2.2 快速檢索技術
大數據分布式存儲在應用過程中,并未將數據快速、高效檢索這一問題徹底解決,特別是在當前電力設備狀態分析條件多元、復雜的情況下,如果繼續使用單一行鍵查詢無法滿足根本需求。為了將設備狀態評估數據的檢索效率和分析準確性加以提升,考慮到設備狀態數據查詢頻率高、,類型較為固定這些特征,建議應用多數據源并行連接這種查詢方式,搭配二級索引技術,構建帶有復合性質的行鍵架構,充分平衡查詢性能與業務靈活性。這種技術是以增量索引、動態索引數據檢索為依據,全面提升了數據資源的利用效率、系統穩定性以及容錯性,能更高的滿足當前行業升級環境下大數據檢索的多樣化需求,為電力設備狀態評估提供豐富的數據支持。
綜上所述,電力設備狀態評估中應用大數據技術,不僅可以使資源利用效率提升,還能夠提高評估結果準確性,了解電力設備運行實時狀態,推動我國電力行業實現長久發展。