摘 要:隨著科學技術的不斷發展,大數據挖掘平臺技術在價值利用上被充分的使用,與傳統數據分析相比,挖掘出的數據更有效、合理。挖掘數據的方法和數據的處理雖然在方式上有些相同,但在挖掘過程中應根據實際有價值的指標進行研究、分析,以大數據挖掘為平臺進行分析,對挖掘技術進行展望,探究大數據挖掘在電力運營監測工作的應用。
關鍵詞:數據挖掘;運營監測;電力運行;應用分析
1 數據挖掘技術分析
1.1 大數據挖掘平臺的背景
在信息時代的激烈競爭中,作為供電企業,為了提高企業的管理水平,需要通過對公司的運營情況進行分析,全面客觀的反映公司整體發展水平,不斷提高企業的競爭能力。而進行分析,必須需要大量的數據作為技術支撐,下面,筆者就大數據挖掘平臺技術對電力運營監測工作的應用進行探討。
1.2 大數據挖掘平臺的現狀
大數挖掘平臺主要是利用平臺系統與供電企業生產、經營、財務、物資、可視化個性展示、ERP、統一視頻監控等多個系統中取數,通過接口接入海量數據平臺中時行存儲歷史數據,及時收集當前的數據。任務是對數據(供電量、售電量、售電均價、線損率、電費收入以及其它的各項數據指標)分類以及對信息的預處理數據預測進行分析,可以進行數據的穿透查詢,其中信息預處理是以由兩個(監測和分析)或兩個以上的變量值進行分析,得出兩者之間存在的規律,稱之為信息預處理。數據預處理有簡單處理和復雜處理,目的是對數據庫中的隱藏知識進行研究分析,結合相關重要的參數使得挖掘出的數據更符合應用的要求。數據的預測是結合歷史的數據總結出數據的規律,對同一類型的數據進行比較,可以運用數據的預測方式使得挖掘技術更好的展現。
1.3 大數據挖掘平臺的概念
大數據挖掘平臺是利用計算機軟件應用技術大量收集數據,而人工系統的挖掘數量往往會給企業工作人員造成工作量,工作效率不高,而且不能確保數據的質量。數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術。近年來,數據挖掘技術引起了信息產業界的廣泛關注,其主要原因在于存在大量數據,可以被廣泛使用,且迫切需要將這些數據轉換成有用的信息和知識。在人工智能領域,數據挖掘也習慣上被稱之為數據庫中的知識發現,一般應用于商務管理、生產控制、市場分析、工程設計和科學探索等領域。
數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設前提下去挖掘信息、發現知識。數據挖掘所得到的信息應該具有先前未知、有效和可實用三個特征。數據挖掘發現的那些不能靠直覺發現、甚至是違背直覺的信息和知識,挖掘出的信息越是出人意料,就越有可能具有價值。
2 大數據挖掘技術的流程展現
2.1 大數據挖掘平臺的應用
近年來,數據挖掘在電力系統中的應用還偏重于在一些專業領域的專業分析,成果主要還集中在研究探索階段,有些領域逐漸的引入了數據挖掘的概念進行了模型設計及驗證工作,但還未真正的開始廣泛應用。研究領域主要集中在電力系統的動態安全評估、負荷經濟調度、負荷預測、故障診斷等方面。
2.1.1 在電力系統動態安全評估中的應用
K.R.Niazi等提出了基于人工神經網絡和決策樹混合方法在電力系統在線安全評估中的應用。文獻[1]提出了電力系統在線動態安全預防中如何應用決策樹技術來測試每個發電調度的動態安全性,并且通過發電再分配來提供正確的指導,優化發電容量,節約發電成本。如何使用Kernel回歸樹方法在線安全評估和監控電力系統,處理頻率穩定性問題。如何描述從決策樹學習中提取規則,并利用該規則來獲得必要的控制措施,將暫態不安全穩定的電力系統保持安全的動態控制技術。
2.1.2 在電力系統負荷預測中的應用
電力負荷預測是電力調度一項非常重要工作,它關系到電廠各機組的運行計劃。文獻[2]結合區域電網氣象負荷數據庫,設計決策樹形式的數據挖掘模型,并應用于日負荷預測。以一種運用C4.5和CART算法的基于BP網絡加權組合的數據模型,并基于此設計出一種高精度的短期負荷預測系統。運用時間序列模型使用已有的數據序列預測負荷,用自適應決策樹對存儲在數據庫中的用戶用電記錄、季節、氣候等相關屬性進行聚類,制定合適的收費表,而且分析出用戶與其他屬性之間的相關聯的一些特點。
2.1.3 在電力系統故障診斷中的應用
電力系統故障診斷是通過利用有關電力系統及其保護裝置的信息來識別故障元件位置(區域)、類型和誤動作裝置,其中故障元件識別是關鍵問題。文獻[3]將基于事件序列的故障診斷模型用于高壓輸電線系統故障診斷領域,依據故障事件序列在時空特性上的關聯性,用動態規劃算法的優化相似性原理挖掘事件之間的關聯性和蘊含的知識,將診斷問題的求解轉化為尋求與實時故障事件序列模式最相似的,運算操作代價最小的標準故障序列模式,以實現對異常事件序列模式中的畸形事件的糾錯,保證故障診斷系統的高容錯性。基于粗糙集理論的故障診斷決策約簡新算法,從而建立故障綜合知識庫用于電網故障診斷。論述了用數據挖掘技術對變壓器油中各種氣體成分進行聚類分析,從而可以再預先不知道變壓器故障類型的情況下得出變壓器油中各種氣體成分含量與故障之間的直接關聯,為故障診斷提供依據。
2.1.4 在工程造價方面的應用
工程造價是一個多變量、非線性的復雜過程,利用已建工程的歷史造價資料,將數據挖掘與人工神經網絡相結合,構建工程造價模型,并運用在電網工程造價預測和預算審查中,可以克服現有人工審查帶來的主觀性和片面性影響,提高工程造價預測的準確性。
2.1.5 在營銷支持方面的應用
基于電力營銷的實際數據,從“量(電量)、價(電價)、費(電費)、損(線損)”等方面進行關聯規則、聚類挖掘。比如講用電客戶根據其屬性特性進行聚類分組,進行信用評價,防范惡意欠費。檢測用電異常情況,防著竊電行為發生。
2.2 大數據挖掘平臺的功能
大數據挖掘技術從數據庫到技術的運用過程中有不同的運行步驟,在確定業務對象問題方面可根據數據的準備對所有業務對象進行分析研究處理,保障數據的質量從而為進一步的分析工作做準備。在數據的轉換方面應建立一個針對性的分析模型,挖掘數據的成功關鍵因素,對所得的數據進行預處理,完善挖掘技術的措施,使數據分析工作自動順利的運行。在數據挖掘技術的結果分析上,應對數據結果做出正確的評估,與知識理念共同分析,完善數據挖掘技術的每一步結構。主要有以下三個方面的功能:
2.2.1 監測功能
(1)10千伏配網停運。手動導入Excel數據,對各地市公司10千伏線路停運情況進行匯總統計。
(2)項目預算執行情況。手動導入Excel數據,將項目預算執行情況按照專業和實施單位兩個維度分別進行統計。
(3)物資供應鏈。從數據中心定時抽取ERP數據并進行加工處理,使用Tableau工具對物資供應鏈全過程進行全面監測。
(4)配網運行。從數據中心定時抽取ERP數據并進行加工處理,使用Tableau工具對低電壓、重過載和三相不平衡事件進行全面監測。
2.2.2 運營可視化功能
將Tableau報告布局根據各地市大屏合適尺寸進行調整和展示。
2.2.3 分析功能
主要功能有統計數據和成果共享兩大模塊。(1)統計數據:將綜合計劃執行情況報表、供電單位經營指標完成情況表和生產報表中部分數據填入月報模板,導入到數據庫,在頁面上根據不同指標生成各類圖表。(2)成果共享:將省公司和地市公司每月的運營情況分析報告、專題分析報告、即時分析報告以及資料上傳到服務器,供大家交流和參考。
3 結束語
隨著信息的高速發展,數據挖掘技術在高速的社會發展下面臨著諸多挑戰,需要對數據挖掘技術必須作出優化處理措施,維護數據挖掘中的各種問題,完善數據挖掘技術的運用手段,使數據挖掘能夠長久地在未來時代中持續發展。
參考文獻
[1]Karapidakis E S, Hatziargyriou N D. Online preventive dynamic security of isolated power systems using decision trees [J].IEEE Transactions on Power System s, 2002,17(2):297-304.
[2]朱六璋,袁林,黃太貴.短期負荷預測的實用數據挖掘模型[J].電力系統自動化,2004,28(3):49-52.
[3]趙冬梅,韓月,高曙.電網故障診斷的決策表約簡新算法[J].電力系統自動化,2004,28(4):63-66.
[4]李永明,王玉斌,王穎,等.數據挖掘和神經網絡技術的電力工程造價應用[J].重慶大學學報,2008(6).
作者簡介:李夢鳴(1979-),男,湖北咸豐人,國網湖北省恩施供電公司,本科學歷,研究方向:電氣工程及自動化。