涂兵
惠州供電局信息中心
數據挖掘技術在電力行業中的應用研究
涂兵
惠州供電局信息中心
隨著全球信息時代的來臨,網絡信息技術不斷的被應用到我們的生產生活當中,并逐步改變著我們的生活。在電力系統中,信息技術也扮演著非常重要的角色,信息技術不僅提高了電力系統的工作效率,還保證了供電的質量和安全,但是隨著信息技術的不斷普及,在電力系統中累積了大量的數據,如何從龐大的數據儲存中找到我們所需要的信息成為了電力企業亟待解決的問題,在這種情況下,數據挖掘技術應運而生。
電力資源;數據信息;挖掘分析
電力系統本身是一個綜合性很高的行業,它是將自然界的一次性能源通過發電動力裝置轉化成電能,再經輸電、變電和配電將電能供應到各用戶的過程,在這個過程中要對電能進行測量、調節、控制、保護、通信和調度等工作,因此,電力系統所產生的數據量是非常龐大的,而要想在這些數據中找到我們需要的知識,必須采用科學有效的數據處理方法。
自從新中國成立以來,我國就十分重視電力行業的發展,經過電力企業幾十年的不斷創新和發展,我國的電力行業已經形成了一套具有我國特色管理模式和行業體系。隨著數字化、信息化技術的不斷應用和普及,我國的電力行業將會迎來新的發展機遇。但現階段,我國的電力行業發展還存在著一些問題,尤其是電力數據處理問題,嚴重影響著我國電力系統的正常運行。電力行業是一個綜合性很高的行業,它包含了電力的發電、配電、輸電、用電等一系列的過程,因此,電力系統每天都會產生數以萬計的數據資料,當這些數據累積到一定程度之后,就會對數據的查找工作產生很大影響,甚至使得一些數據資料成為了信息孤島。此外,一些電力企業缺乏有效的數據查找和處理方法,當需要查找電力數據時,往往是敷衍了事,或者是單憑經驗來判斷,這樣不僅無法保障用戶的用電質量,還會留下安全隱患,因此,電力企業必須找到科學有效的方法來簡化數據查找工作。數據挖掘技術是現在普遍被應用在電力行業的數據處理技術,它能從數量龐大的、信息不完全的數據中提取隱含在其中的對電力系統有用的數據和信息,再通過計算機技術對所得到的數據信息進行分析和整理,形成一套電力數據的分析報告,使電力管理者了解電力系統的運行狀況,幫助其進行決策。
在電力行業中,常用的數據挖掘方法有關聯分析、時間序列分析、聚類分析、分類分析、異常分析五種,這幾種方法是從不同的角度對電力數據進行分析,因此,電力企業要依據本企業的特點進行選擇。
3.1 關聯分析。關聯分析是一種簡單、實用的分析技術,廣泛應用在數學、經濟等行業中。它是依據電力系統中兩個或兩個以上事物之間存在的聯系,通過其他的事物對其中一個事物進行預測的方法,關聯分析的主要目的是挖掘隱藏在不同數據間的相互聯系,從而找到所要查找的數據信息。
3.2 時間序列分析。時間序列分析是一種動態數據處理的統計方法。它是利用時間數列,應用數理統計方法加以處理,以預測未來事物的發展。時間序列分析通常是對電力系統的趨勢、季節變動、循環波動和不規則波動等因素進行分析,然后得出相關的數據信息。
3.3 聚類分析。聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類。判別分析則先根據已知類別的事物的性質,利用某種技術建立函數式,然后對未知類別的新事物進行判斷以將之歸入已知的類別中。聚類分析是在不知道分析對象的類別的情況下,對數據信息進行分類。聚類分析的應用范圍非常廣泛,它是電力行業最常用的數據分析方法。
3.4 分類分析。分類分析是對電力系統中的相關信息進行分類的方法,分類模型以分析數據集中的某些數據得到另外的數據結果,主要分為預測離散變量的分類,預測的連續變量的回歸,數據挖掘中廣泛使用的分類方法有決策樹,神經網絡、徑向基礎函數等。
3.5 異常分析。電力數據的異常分析常被應用到電力企業防止用戶盜用電力資源的稽查工作中,電力系統中異常數據或者是孤點數據都是各種不正行為的反映,孤點就是離正常狀態下的大量狀態點較遠的點,電力檢查機關在稽查盜電案件時,可以對用戶一段時間內的用電數據進行收集和分析,選擇電力數據異常的用戶進行稽查,這樣不僅可以減小稽查的范圍,還可以有效的防止非法盜取電力資源案件的發生,保障電力系統的正常運行。
數據挖掘技術作為一種發現大量數據中潛在信息的數據處理方法,已經成為處理電力行業信息化建設過程中積累的大量歷史數據的重要手段,數據挖掘技術的應用不僅可以解決供電企業運營管理中關鍵和突出的問題,還會為電力企業帶來更大的發展空間。
4.1 負荷預測。電力負荷預測包括對未來電力需求量的預測和對未來用電量的預測以及對負荷曲線的預測。其主要工作是預測未來電力負荷的時間分布和空間分布,為電力系統規劃和運行提供可靠的決策依據,負荷預測結果的準確度直接影響電力企業的生產效益和經濟效益。用戶用電負荷規律具有一定的隨時間變化規律性,可以采時間序列模型,在對歷史用電數據進行挖掘后,對電力負荷進行預測,用決策樹按時間、區域、氣候等相關因素對用電記錄進行聚類分析,可以為調度部門做出相關決策提供有力的幫助。
4.2 電力設備狀態檢修。我國的電力設備檢修一般遵循著事后維修、預防性計劃檢修的模式,傳統的檢修模式具有臨時檢修頻繁、維修不足、過剩維修、盲目維修等缺點。為了解決這些不足,電力系統需要改變現在的檢修模式,向狀態檢修體制發展。狀態檢修是一種通過收集電力設備狀態數據,并以數據為基礎、預測電力設備狀態未來發展趨勢為根據的電力設備檢修體制。狀態檢修通過收集電力設備的日常檢查數成、定期重點檢查數據、在線狀態檢測數據、故障診斷數據等,經過數據挖掘系統分析處理,通過挖掘的結果來預判設備的健康和性能優劣狀況及其性能發展變化趨勢,確定設備的維修狀態和隱藏的安全隱患,從而科學的安排檢修工作。
4.3 電力營銷策略支持。通過利用數據挖掘技術,對固定時間里電力系統中電能用量與時間變化的關系數據進行挖掘,掌握數年內電能需求的時間序列反映的方向和趨勢,進行預測和推斷。采用聚類技術來進行電力客戶細分。分析用戶的數據情況和根據分析需要,采取不同聚類算法來進行客戶細分。利用關聯規則分析市場環境與銷售電量水平的關聯度,尋找不同市場環境中影響電量銷售變化的因素。
隨著電力行業的不斷發展,電力系統所產生的數據信息也會越來越多,在如此龐大的數據信息量中查找到所需的知識,傳統的數據處理方法是無法做得的,因此,數據挖掘技術是現階段我國電力行業數據查找和處理的首選方法。電力企業要意識到數據挖掘的重要性,從而保障電力系統的健康發展。
[1]張志磊電力信息系統中單一登錄和訪問控制方法的研究[D].華北電力大學(保定),2007.
[2]史小梅.數據挖掘在電力決策支持系統中的應用[J].上海電力學院學報,2010(4).
[3]西安美林電子有限責任公司,大話數據挖掘[M].清華大學出版社,2013(1).