舒永芳(國網安徽省電力公司淮南供電公司,安徽淮南232007)
大數據時代下數據挖掘技術在電力企業中的應用研究
舒永芳(國網安徽省電力公司淮南供電公司,安徽淮南232007)
首先,闡述了大數據的概念,論了電力企業在大數據時代將會受到巨大的挑戰;再以此為基礎指出,通過數據的挖掘對電力企業產生了巨大的影響;通過講述如何挖掘數據的一系列步驟,指出在大數據時代下,如何實現數據挖掘在電力企業中的運用。
大數據;電力企業;數據發掘
如今,電網企業的系統在工作中會大量產生關于電網輸變電設備運行檢修以及經營管理方面的數據等。面對如此繁雜的數據,如何運用所掌握的技術水平,從中對數據的潛藏價值進行充分地發掘,從而能夠為電力企業的管理水平改進、降低成本、提高效益等各項工作提供科學依據,這在電力系統的運用中已經廣泛地受到了關注。所以,在如今大數據的環境下,如何挖掘數據的潛藏價值在電力企業中就顯得非常的重要。
1.1 大數據含義
作為一種數量龐大、形式多種多樣、增長速度非常快的信息資源,大數據只有通過一種全新的使用模式才能發揮其優化作用、決策輔助作用和洞察作用。大數據從整體上來說具備價值性、多樣性、高速性、大量性等特點。
1.2 電力企業在大數據時代下面臨的挑戰
通過分析當前電力企業發展實際,可以發現其在日常的經營和管理中產生了非常多的數據。對于電網企業而言,業務數據主要包括生產數據、運營數據、電網企業管理數據。電網企業的大部分數據往往只是經過少量的應用,其后就被囤積起來了,無法對其進行進一步的分析利用,造成盡管電網企業的數據存儲量很大,卻缺乏有用的信息;在電力的使用方面,電網、電力用戶的信息等都會產生大量數據[1]。
因為我國屬于發展中國家,電力企業在具體的發展中需要不斷地適應社會經濟發展對電力的需求。電力企業在日常的生產經營中會產生大量的數據,大部分企業的數據庫往往都只具備簡單的數據儲存、統計的作用,不能夠對大數據作用進行充分地利用。因此,要把握大數據背后的價值,這對一個電力企業的發展顯得非常的重要。電力企業數據收集和統計具有較大的復雜性,因為所要收集的數據涉及面很廣,還需要刪除無用的數據,保證數據的真實性。
數據的挖掘總體來說就是對大量的數據進行建模,通過理論的模型科學合理的分析和處理企業中產生的大量數據,其能夠從大量數據中搜索出企業所需要或者對企業有用的信息,并且能夠幫助企業詳細的掌握各個客戶以及各個市場的劃分。
(1)存儲數據必須具備高質量、有效的特點,這是數據挖掘技術挖掘有價值的信息的基礎。因此,電力企業如果要解決數據質量的問題,應該為其開設一個工作部門進行專項數據管理工作,從而為確保數據挖掘能挖掘到有價值的信息,為電力企業做決策提供相應的依據。在大數據時代下,因為數據量比較大,使數據發掘是一種知識的自我發現過程。當目標不清晰時,需要多選擇幾個渠道從中獲得數據再進行處理。
(2)基于Deepweb的數據集成技術能夠實現對數據的自動化管理和處理。該技術主要分成五個部分。①數據來源部分,通過對自動記錄數據的系統、移動終端和互聯網的利用,該部分能夠對影響企業經營管理的各種市場數據和企業中產生的各種事務性數據進行存儲。②數據整理部分,內同交叉屬于大數據時代中數據來源的一個重要特征,因此,在對數據進行分類的時候必須將其互動性作為重要的依據。由于現有的數據中不可避免的存在各種問題,因此必須要采用合理的方式分析和整理數據,從而能夠使數據質量獲得保障。通常可以將數據劃分為以下三中:a.非結構化數據;b.半結構化數據;c.結構化數據。要合理的篩選其中的結構化數據,刪除其中的無效數據。依據相關標準和規范對半結構或非結構數據進行處理,將其轉換成為符合規范的機器語言。③數據管理部分。在數據庫中存儲經過篩選和轉化的數據。可以按照各種主題為依據對數據倉庫的屬性集進行設計,有效的控制處理數據的工作量。通過粗糙集屬性歸約法針對各種數據庫進行處理,將其中的無用數據刪除掉,并且在歸則知識庫中存儲分類規則知識,從而能夠處理相應的新數據。④數據分析部分:將電力企業數據區分為兩種:a.實時數據;b.非實時數據[2]。可以通過內存計算機技術對實時數據進行分析處理,并且進行內存運算;可以通過分布式文件系統、云計算等工具處理非實時數據。⑤數據展示部分:通過電力系統能夠可視化處理相應的數據,利用圖形的方式將發掘信息的成果展示出來,可以運用到企業規劃當中,使員工能清楚的認識到企業的發展前景,并且評價決策的可行與否。
在大數據時代下,數據挖掘的潛力是不可限量的。伴隨著電網制度的改革,大數據將會落實到每一個電力企業及其相關部門中。在電力企業中充分地應用數據挖掘技術,將價值更高、信息更多的數據挖掘出來,能夠有效地推動我國電力企業的發展。
[1]許 慧,李寶琴,周 瑩,所 瑪.大數據背景下高校圖書館數字化資源共享研究[J].中國中醫藥圖書情報雜志,2015(06).
[2]易正磊,顧 軍,張 興.基于大數據的業務并發度分析[J].中興通訊技術,2015(05).
TP311.1
A
2095-2066(2016)36-0102-01
2016-12-3