吳敏
摘 要:現如今,我國智能電網建設進入全面快速發展的新階段,在變電網領域,根據國家電網公司制定的發展規劃要求,在傳統變電站的運行模式滿足不了當前發展需求的情況下,智能變電站的應用勢在必行。變電設備在生產運維檢修過程中,會產生大量的變電缺陷相關數據。變電設備類型繁多,運行工況各有不同,人工分析缺陷數據時,往往不能形成有效結論。基于此,本文主要介紹了一種變電設備缺陷數據輔助分析的軟件開發思路及結果應用,可以通過從缺陷類型、電壓等級、生產廠家、運行工況等多個維度進行分析,形成有數據支撐的分析結果,用于有效指導下一步檢修工作。
關鍵詞:變電缺陷;大數據分析;應用
引言:變電站是在電力系統當中對電壓以及電流進行變換并接受電能及分配電能的場所,是電力供應的設施之一,也是電力系統的關鍵樞紐。由于變電站的運行狀況對整個電力系統有著極大地影響,變電站的正常運行保證了居民用電方面的安全,為生產和生活提供充足電力的同時,也改善了人們的經濟狀況,一定程度上促進了經濟的發展。
變電設備種類繁多,發生的缺陷數量較多,且類型與表象也多種多樣。以南方電網某地區級供電局為例,所轄47個110kV及以上電壓等級變電站,每年發生的缺陷在400~700條之間,平均每月缺陷發生50~70條左右。數據量較大,這對定期的缺陷分析帶來很大工作量與問題。因此,如何通過信息技術手段從海量缺陷文本中發掘內涵知識并讓其能夠方便快捷地輔助工作,成為核電設備管理人員和信息化人員的關注重點。
1變電設備缺陷數據概述
對變電設備缺陷分析需要結合核電廠業務及信息化的實際情況具體問題具體分析,設備缺陷分析主要涉及的數據包括主數據和業務數據,主數據主要是以設備為核心的一系列主數據對象。由于歷史原因,主數據存在著多頭管理、標準規范不齊全、管控流程體系缺失等一系列問題,因此需要建立設備主數據相關的標準規范,并對歷史數據進行清洗和轉換,確保在數據質量上滿足要求。對于業務數據,由于現場工作人員的素質不一,錄入的數據和使用的詞匯并不一定規范,導致業務數據在分析時需要花較多時間進行數據清理。如果由業務人員開展數據清理,需要一定的工作量投入,且該項工作的收益并不能直接體現,很難獲取業務人員和管理者的支持,這些都使得通過技術手段來提升數據質量成為開展大數據工作的重要組成部分之一,且不可越過該項任務。
2大數據技術在變電設備缺陷分析上的適用性分析
根據大數據技術的定義,大數據主要體現在數據量大、數據的種類和來源眾多、數據的價值密度低、數據處理的實時性強等特點。而變電站的設備無論在種類還是數量上都具有足夠的量級,因此在設備缺陷分析這一應用命題下能夠滿足大數據特點。設備缺陷數據往往以非結構化語句或者口語化表達呈現,這種情況下需要引入自然語言分析技術或者知識圖譜技術進行文本內容的抽取和分析。主要用的技術包括知識抽取、知識清洗、知識融合、知識推理、知識可視化等。
在技術平臺層面,變電站通常采用商業大數據技術平臺或基于當前主流的開源技術框架進行大數據平臺的搭建。一般而言,這類大數據系統的構成主要包括數據的采集及匯聚、數據的清理和轉化、數據的存儲和分析及數據的展現和應用集成等層面,每一個層面的組成都可通過一些開源的技術組件滿足,在方案的適用性上,往往需要根據行業的特點進行增強或改善。
3變電設備缺陷大數據分析軟件研究
按照大數據分析的一般標準化過程,從數據ETL操作、統計分析、數據挖掘和數據可視化四個方面進行邏輯設計,采用GO、HTML、JS語言完成前端設計、邏輯實現,最終完成缺陷分析的功能。
3.1數據ETL操作
由于基礎數據直接來源于南網資產管理系統的有效數據,不再設計數據抽取及清洗環節。轉換方面,需要通過基礎數據中的缺陷描述、設備分類等內容,將定級不規范、分類不準確等數據不精確的部分加以整理,其中數據整理邏輯是本次軟件設計重點。加載方面,將整理后的數據輸出到整理后數據庫,同時預留一個人工修改數據的輸入端口。
3.2統計分析
用數學統計方法歸納歷史數據。按照年、季、月的周期,利用故障樹分析法等分析理論,從電壓等級、設備類型、缺陷部位、制造廠家、運行年限、缺陷等級、缺陷原因、缺陷發現來源等維度,對周期內缺陷數據進行統計分析。
3.3數據挖掘
通過同比、環比,對歷史數據做深入分析,利用算法找出數據中潛在的關聯性,對缺陷發展趨勢進行一定的預測(如家族性缺陷、頻發性缺陷、按季節多發生的缺陷等)。
3.4數據可視化
將分析結果形成多圖表的報告,呈現給缺陷分析人員。
4變電站設備缺陷分析中大數據技術應用
在數據采集和清洗上,考慮到項目的數據主要存儲在企業核心組件(SAPECC)以及Oracle數據庫中,項目采用Kettle作為清洗、轉換、加載(ETL)工具,Kettle支持以SAPRFC的方式從企業資源計劃系統(SAP)中獲取數據,同時能夠支持ETL的常見數據拆分、轉換等清洗作用的算子。此外,Kettle還支持使用自定義腳本語言開發定制算子的方式來進行數據的清理,極大地提升了數據采集的有效性。
在數據存儲上,缺陷數據的特點是文本較多,結構化字段較少,因此比較適合用非結構化數據庫存儲。從實用性角度考慮,使用HBase符合當前主流的技術開發體系,因此項目上通過HBase作為存儲,使用缺陷的惟一標識作為HBase中的唯一惟行鍵。
在數據計算和分析上,不可避免地需要選擇計算框架,這個場景中使用了Spark作為分析計算工具,Spark可以通過另一種資源協調者(YARN)調度計算資源而不用擔心任務的執行需要。此外,為了使得Spark支持Python,需要使用PySpark,可以使用Python編程語言中的彈性分布式數據集(RDD),PySpark將PythonAPI鏈接到Spark核心并初始化Spark上下文。PySpark可以大規模地進行探索性數據分析,構建機器學習管道以及為數據平臺創建ETL。
在數據服務應用的技術選型上,采用Flask作為服務端的實現。Flask是一個使用Python編寫的輕量級Web應用框架,其WSGI工具箱采用Werkzeug,模板引擎則使用Jinja2。Flask使用開源軟件協議授權;Flask使用簡單的核心,用extension增加其他功能;Flask可以很便捷地提供Restful風格的服務供其他業務系統調用。
5結束語
隨著智能電網的推進,生產中產生的各類缺陷數據已成為電力企業的重要資產。變電設備缺陷分析是變電企業在利用大數據技術發掘現有文本信息資源價值的重要應用領域。通過對設備缺陷分析能夠發現重復性出現的設備故障類型,有助于提升設備采購的質量和維修計劃的針對性。該項工作不僅適合于變電企業,對于整個行業均有意義,能夠為企業的現代化、數字化、智能化建立良好的基礎條件。
參考文獻:
[1] 李方軍.基于電力企業大數據環境下的數據治理[J].電子技術與軟件工程,2019(02)
[2] 崔立真.面向智能電網的電力大數據存儲與分析應用[J].大數據,2017(06)
[3] 茍筱林.基于大數據挖掘技術的輸變電設備故障診斷方法分析[J].通信電源技 術,2019(01)
[4] 嚴浩軍.大數據技術在變電缺陷分析中的應用[J].工業指南,2017(23)
(國網南平供電公司 ?福建 ?南平 353000)