張中超,江志敏,程夢成
(廣東電網有限責任公司河源供電局,廣東 河源 517000)
隨著近些年電力事業的高速發展,電力設備自動化、智能化水平不斷提高,其運行過程中產生的數據呈現出海量化、多樣化等特征。傳統電力設備運行數據分析方法已經無法滿足實際需求,如何高效采集、處理、分析、應用這些數據成為電力企業關注與思考的重點問題之一。大數據技術的提出與推廣為電力設備運行數據分析優化發展提供了技術支持,有利于對海量數據的價值進行高效挖掘、采集、分析與利用,對電力設備運行狀態監測、電力設備運行故障防控提前感知,保障電力系統穩定運行。
隨著電網規模的不斷擴大,電力系統中運行的電力設備數量逐漸增多且電力設備結構日益復雜,電力設備運行管控難度與要求大幅度提高。利用大數據技術能夠實現對電力設備的集成化、網絡化、數據化、智能化管理,便于相關工作人員實時掌控電力設備運行狀態,及時發現和處理電力設備運行過程中存在的異常問題,讓電力設備運行管理更具時效性、準確性、全面性、科學性、可靠性。與此同時,大數據技術的科學使用,便于電力企業從海量化的電力設備運行數據中挖掘出有價值、有意義的數據信息,如消費者用電需求信息、區域內用電低谷期信息、區域內用電高峰期信息、電力設備停電故障規律等,從而為相關工作人員電力調度、電力設備管控等工作開展提供數據信息依據,促進電力調度質量、電力設備管控質量提升。
電能已經成為日常生產與生活過程中不可缺失的能源,隨著電網大規模互聯,缺電、停電等對社會與經濟產生的影響不斷擴大。例如,2021年5月13日、17日臺灣大面積停電故障導致半數以上地區商業、工業、交通業等陷入癱瘓,造成的經濟損失高達10億美元;2022年8月美國加州大面積停電故障導致200萬以上居民受到影響,各地發生不同程度交通癱瘓、商業區混亂、電梯被困、工業停產等問題,所造成的經濟損失相當嚴重。因此,為最大化程度降低缺電、停電,特別是大面積停電的影響,有必要加強電力設備運行故障分析力度,及時發現和處理電力設備運行安全隱患,最大程度保證電力系統處于不停機狀態。基于大數據的電力設備運行數據分析,能夠對電力系統主線、直線進行拓撲分析,可在電力系統未發生跳閘停電問題時,找到安全隱患并發出告警,為電力設備故障檢修工作人員提供指導,實現對電力設備運行故障的預防性處理。與此同時,在大數據分析下,相關工作人員能夠深入了解與掌握電力設備故障規律、類型、原因,并在大數據指導下更為及時、準確評估故障、識別故障、判斷故障、處理故障,切實提高電力設備故障防控能力。
電力設備運行數據分析過程中,數據有效采集是關鍵。為提高電力設備運行數據采集質量與效率。基于大數據支持,可采用多種傳感器技術、電力設備畫像技術、多線程數據采集技術等進行電力設備運行數據分析系統設計,滿足數據采集需求。以多線程數據采集技術為例,該技術應用后能夠對多個電力設備運行數據進行獨立同步采集與處理,既提高了電力設備運行數據采集效率,也保證了各電力設備運行數據處理的安全性。電力設備運行數據類型眾多,如臺賬信息、檢修信息、調度時間信息、量測數據、告警數據、測試報告、在線監測運行信息、在線監測狀態信息、故障濾波文件、監控信息點表、帶電檢測數據等,部分數據屬于實時數據,部分數據屬于非實時數據,在對其進行采集時,可引入數據標簽技術進行數據準確與規范描述,提高數據采集、存儲、處理效率。
電力系統規模的不斷擴大,導致電力設備數量日漸增多,電力設備運行數據具備了海量化、多樣化等特征。電力設備運行海量化的數據中并非所有數據均為有價值、有意義的數據。因此,在電力設備運行數據分析中,可利用大數據預處理技術進行數據清洗,將不完整數據、無價值數據、復雜多變數據等有效去除,一方面減輕數據分析壓力,提高數據分析效率,另一方面降低冗余數據分析的影響,提高數據分析結果準確性、真實性、有效性、可靠性。在大數據下可使用的數據清洗方法較多,如分箱法、聚類法等。以聚類法為例,根據電力設備某一特征進行數據集合分組,通過清除集合噪聲,達成數據清除目標。
大數據挖掘技術是實現電力設備運行數據深度分析的重要手段,是從已知信息中獲取未知有價值的過程。通常由數據準備、數據挖掘、結果解釋3個環節構成,涉及到算法、手段眾多。目前應用較為廣泛的大數據挖掘算法有神經網絡算法、遺傳算法、決策樹算法、模糊計算法、統計分析算法等。
基于大數據各類技術在電力設備運行數據分析中的推廣使用,提出如下電力設備運行數據分析系統設計方案。
系統采用瀏覽器/服務器(Browser/Server,B/S)結構進行設計,以Hadoop為基礎進行框架構建。設計采用RESTful Web服務實現客戶端與服務端分離與溝通。系統運行過程中,用戶經身份驗證成功登錄客戶端后,可根據自身實際需求選擇功能界面,發出資源共享申請,系統根據用戶提出的申請執行數據調取、分析、統計、挖掘、轉換、顯示等任務,最終將用戶所需資料以圖形、表格等形式呈現,滿足用戶申請需求。
系統設計分為4層:一是采集層,由傳感器、變電設備狀態接入控制器(condition acquisition controller,CAC)、變電設備狀態接入網關機(Condition information Acquisition Gateway,CAG)等構成,用于采集電力設備運行各種數據資料。二是存儲層,主要由HDFS分布式文件系統與MapReduce分布式計算框架構成,前者在電力設備運行數據分析系統中承擔著用戶數據、電力設備參數等信息存儲責任,后者在電力設備運行數據分析系統中承擔著用戶數據、電力設備參數等信息分析處理職責。在HDFS+MapReduce的數據存儲模式下,電力設備運行數據分析系統能夠有效提高數據處理效率,保障數據傳輸、處理、存儲安全。與此同時,可建立較好數據關聯模型,準確挖掘電力設備運行數據(包括運行狀態數據、故障設備數據、故障區域數據、故障影響因素數據等)之間的關系,為電力設備運行故障預防性管理提供指導。三是數據分析層,在MapReduce、大規模并行處理技術(Massively Parallel Processing,MPP)等支持下,實現對數據資源的有效統計、分析、處理、挖掘等。四是數據應用層,屬于面向客戶的應用環節,通過用戶接口可實現人機互動,為用戶提供系統訪問、數據查詢、數據統計、數據分析、數據挖掘、信息決策等服務。電力設備運行數據分析系統具體見圖1。

圖1 基于大數據的電力設備運行數據分析系統結構
基于大數據的電力設備運行數據分析系統實施了功能模塊設計,對其進行分析大致可分為以下幾部分:
(1)用戶管理功能:主要包括用戶注冊、用戶登錄、用戶登錄密碼修改等。與此同時,系統基于人性化、信息安全化等考慮,進行了差異化設計。即不同層級電力工作人員、不同崗位電力工作人員、不同等級用電用戶等,可根據其職責、需求等賦予不同權利,用戶經身份信息核實后,系統進入相應權限界面,為其提供權限范圍內的服務。
(2)數據監測功能:主要包括電力設備運行各項數據采集、記錄、傳出、存儲、統計、分析、更新、存儲等。該模塊在大數據及其相關技術支持下能夠將系統覆蓋范圍內所有電力設備運行數據采集,并將其輸送到系統服務器中,用于系統對電力設備運行數據進行處理與顯示。
(3)設備檢測功能:主要用于電力設備運行狀態針對性處理。即在該模塊設置下,基于大數據的電力設備運行數據分析系統發現異常數據后,能夠根據異常數據具體表現對相關聯的電力設備進行全面排查,以便快速、準確找到異常數據形成原因,確定具體的風險設備或故障設備,為電力設備檢查維修提供指導。
(4)信息管理功能:主要包括電力設備型號信息、電力設備出廠信息、電力設備運行信息、電力設備維修保養信息等記錄、存儲、更新、修改、刪除等。用戶可憑借該模塊全面掌握電力設備運行情況,便于智能電網電力設備全生命周期管理。
性能檢測功能:主要是針對電力設備電池性能的檢測與監管。在該模塊支持下,系統可實現電力設備電源指標系統化、全面化、智能化分析,為電力設備電源管理提供科學、合理方案,促進電力設備電源使用穩定性、可靠性、持久性提升。
以Hadoop為基礎構建電力設備運行數據分析系統時,需要根據系統實際情況合理選擇數據存儲模式,以便提高數據分析與處理效率和質量。通常情況下,Hadoop技術領域中較為常見的數據存儲方式有Hive、HBase、Impala 3種。其中Hive在結構化數據處理中具有較強適用性,能夠滿足結構化查詢語言匯總分析需求。與此同時,Hive可根據MapReduce任務要求對數據進行轉化處理。HBase在非結構數據處理中具有較強適用性,采用該方式進行數據存儲,利于數據更新、刪除等處理效率提升。Impala能夠與HBase配合促進數據查詢效率提升,能夠滿足結構化查詢語言實時查詢需求。電力設備因類型多樣、規模龐大,故在其運行數據分析處理過程中,設計根據數據類型合理選擇上述3種數據存儲模式,如結構化數據以Hive、Impala為主,半結構化、非結構化數據以HBase為主。此外,針對異常數據,系統構建了異常數據處理機制,該機制能夠對異常數據類型,從數據庫中提取經驗解析內容,根據數據提取結果進行常態化處理或特殊化處理。與此同時,該機制能夠對異常數據進行記錄、分析,形成二進制流文件,發出異常數據告警等。
為驗證基于大數據的電力設備運行數據分析系統應用效果進行了實驗分析。本次實驗分析以某電力企業220kV電力設備(基礎信息見表1)為對象,通過系統數據清洗能力、系統對電力設備運行異常檢出率、系統對電力設備運行異常檢測時間等指標觀察評價系統應用效果。

表1 電力設備基礎信息表
實驗結果顯示基于大數據的電力設備運行數據分析系統對電力設備運行數據的清洗率達到90%以上,平均值(95.60±3.50)%,說明基于大數據的電力設備運行數據分析系統數據清洗能力較強,能夠保證電力設備運行數據分析的可靠性、準確性。與此同時,基于大數據的電力設備運行數據分析系統對電力設備運行異常的檢出率高達97%,數據量為5GB時異常數據檢測時間不足1s,數據量為35GB時異常數據檢測時間不足4s,數據量為60GB時異常數據檢測時間不足6s。可見,基于大數據的電力設備運行數據分析系統電力設備運行異常檢出率較高,且檢測速度加快,能夠滿足電力設備運行狀態異常監測需求,為電力設備安全與穩定運行提供保障。
基于大數據的電力設備運行數據分析已經成為新時期電力設備運行管理的客觀要求與必然趨勢。在大數據技術支持下電力設備運行數據分析質量、速度、安全等水平全面提升,電力設備運行狀態監測與管理能力有效提高,電力系統運行穩定性、可靠性、安全性得到顯著保障。因此,相關企業以及工作人員重視大數據技術及其在電力設備運行管控中的推廣使用,能夠在不斷探究下進行系統優化設計,充分發揮大數據技術應用優勢,給予電力設備運行科學管控。