何宇雄 苑晉沛 聶宇 羅超
摘 要:電力調度自動化系統對電力數據的收集和整理工作質量有著較高要求,而為了滿足這一要求近年來數據挖掘技術日漸受到電力行業重視,基于此,文章就數據挖掘技術進行了簡單介紹,并對數據挖掘在電力調度自動化系統中的應用進行了深入論述,希望論述內容能夠為相關業內人士帶來一定啟發。
關鍵詞:數據挖掘;電力調度自動化系統;周期性關聯規則挖掘算法
中圖分類號:TM734 文獻標志碼:A 文章編號:2095-2945(2018)04-0143-02
Abstract: Power dispatching automation system has higher requirements for the quality of power data collection and collation. In order to meet this requirement, data mining technology has been paid more and more attention in recent years. On the basis of this, this paper briefly introduces the technology of data mining, and discusses the application of data mining in power dispatching automation system in depth, hoping that the content of the discussion can bring some inspiration to the relevant industry.
Keywords: data mining; power dispatching automation system; periodic association rule mining algorithm
前言
電力數據收集、整理質量直接影響電力調度自動化系統的控制和管理水平,但由于很多價值較高的數據信息往往位于隱藏的數據之中,這就使得傳統方法不能較好滿足電力調度自動化系統需要,而為了解決這一問題,正是本文就數據挖掘在電力調度自動化系統中應用展開具體研究的原因所在。
1 數據挖掘技術
在大數據時代到來的今天,數據挖掘技術能夠從海量數據信息中準確找到所求信息,因此本文將數據挖掘技術視作“采用有效工具和措施從海量數據庫中提取數據和模型關系”的技術,由此企業的決策能夠得到充足的判斷依據。為了更直觀了解數據挖掘技術,本文將數據挖掘的過程和步驟概括為以下幾個方面:(1)確定業務對象。確定業務對象屬于數據挖掘過程的基礎工作,這一過程的實質是了解業務問題。(2)準備數據。通過選擇數據、數據預處理、轉換數據三個層面的工作,即可完成針對于挖掘算法的分析模型構建,并最終完成一定領域的數據挖掘。
2 數據挖掘在電力調度自動化系統中的應用
2.1 應用方式
神經網絡、灰色分析法、關聯規則均能夠用于電力調度自動化系統的數據挖掘,具體應用如下所示。
(1)神經網絡。作為應用較為廣泛的一種人工智能研究方法,神經網絡早已在我國實現了較為廣泛的應用,電力調度自動化系統的數據挖掘也是其應用的重要領域,由于數據自行處理、數據分布存儲、高度容錯性是神經網絡的應用優勢所在,這就使得神經網絡較為適用于模糊、不完整、不準確數據的處理。在電力調度自動化系統的數據挖掘中,神經網絡主要通過關聯分析的方式實現數據邏輯處理,具體處理可以分為以下幾個方面:a.整合統一基礎數據。由于電力調度自動化系統包含的數據具備龐大復雜、種類繁多的特點,因此神經網絡的應用需要通過整合統一使相關數據形成結構模型,通過神經網絡系統實現數據統一管理。b.實現不同環節電力調度的關聯。應用數據挖掘神經網絡方法整理不同環節的電流狀態和參數,并保證相關數據信息的整合性,即可實現不同環節電力調度的關聯。c.分析與決策。結合神經網絡整理的整合數據,即可開展分析、決策以及數據共享。(2)灰色分析法?;疑治龇軌蜉^好分析電力調度過程出現的不完整數據,但不適用于較為龐大的數據是該數據挖掘方法存在的不足。一般情況下,灰色分析法的應用需要深入了解設備數據參數,如用戶用電情況預測、母線負荷數據值、電力銷售情況預測等,結合分析確定電力調度邊界電量,即可提升數據收集的可靠性,電力調度自動化系統的運行也將由此獲得較為有力的支持。(3)關聯規則。作為數據挖掘的重要分支,關聯規則能夠通過發覺大量數據項集之間的有趣關聯和相互聯系實現信息的高質量分析,剛剛提到的神經網絡嚴格意義上也屬于關聯規則范疇,不過本文關于關聯規則的研究主要圍繞周期性關聯規則挖掘算法展開。周期性關聯規則挖掘算法具備掃描數據庫次數較少、避免掃描數據庫的時間開銷、連接程序中相同項目的比較次數較少、數據項集頻度統計速度較高等優勢,由此實現的周期性數據集挖掘、關聯規則挖掘便能夠大大降低電力調度自動化系統的事故發生概率。
值得注意的是,本文研究的周期性關聯規則挖掘算法結合了蟻群算法,這是由于原算法使用了大量的搜索操作、分類檢索和路徑檢索,蟻群算法下走過的路上會留下信息素,這就使得較短路徑上的信息素濃度較高,結合負信息素理論,即可保證有信息素的地方螞蟻不能走過。如使用表1所示的事務數據庫D(部分),即可結合時態事務數據庫D分類數據集改進、每一個分類數據集周期性數據集挖掘改進,以數據項A分類為例,即可求得表2所示的時態屬性差,由此開展更深入計算則能夠更深入了解周期性關聯規則挖掘算法的思想,也能夠認識到蟻群算法的重要性。
2.2 應用實踐
為提升研究實踐價值,本文圍繞周期性關聯規則挖掘算法建立了基于周期性關聯規則挖掘的數據分析系統,這一系統的建立過程如下所示。(1)開發平臺選擇。結合系統功能需要,選擇了微軟的.net平臺作為主要系統開發平臺,該平臺具備的強大數據庫訪問能力、擴展豐富等特點,能夠較好滿足系統開發需要。(2)基于數據橋的數據集成模塊設計??紤]到我國當下電力事業的數據集成標準較為復雜、混亂,系統設計采用了自己的數據集成方法,同時應用了清晰數據清洗策略,由此即可實現不完整數據、重復數據、錯誤數據三類臟數據的清洗,數字數據不完整、日期數據不完整、錯誤日期型數據、重復數據等僅屬于清洗內容,其中除重復數據不予處理外,其他數據均采用修補空值和默認值的方式,如數字數據不完整采用“補0,補null,默認值”的清洗策略。此外,無類型文件數據集成、數據庫數據集成、異構數據庫數據集成也是這一環節設計的重要內容[3]。(3)數據庫管理模塊設計。采用微軟公司的SQL Server數據庫系統,由此數據庫管理被分為層次數建模、數據表管理、數據表導出三部分,其中數據表管理包含數據管理、結構管理、刪除三方面功能,而數據表導出則包括文本文件、Excel文件、Access文件、Xml文件、其他數據庫五部分內容。(4)數據分析功能模塊設計。數據分析功能模塊由同期數據分析、周期性數據分析、數據預警分析、數據關聯分析四部分組成,各部分設計如下所示:a.同期數據分析模塊設計。該模塊的運行流程主要由負荷數據、網損數據、力率數據、有功總加數據對比組成,分析流程可以概括為:“輸入所有對比條件→合法→根據條件生成SQL語句→顯示查詢結果→打印對比圖像”。b.周期性數據分析模塊設計。圍繞報警周期性、負荷周期性、遙測周期性三方面開展數據挖掘,即可完成該模塊設計。c.數據預警分析模塊設計。分析流程為:“初始化數據集及參數→輸入預警分析參數→合法→分析預測→判斷預測類型→有無建議→輸出報警類型和建議→輸出報警類型”。d.數據關聯分析模型設計。采用默認用戶手動輸入數據集方法,程序流程為:“初始化已有周期性數據集→輸入參數→合法?→數據集交叉?→計算Conf、Sup→計算下一對數據集→完成”。
3 結束語
數據挖掘能夠較好地服務于電力調度自動化系統。而在此基礎上,本文研究建立的基于周期性關聯規則挖掘的數據分析系統,則證明了研究的實踐價值。因此,在相關領域的理論研究和實踐探索中,本文內容能夠發揮一定參考作用。
參考文獻:
[1]王謙,李烽.電力調度的自動化網絡安全分析及實現[J].電子技術與軟件工程,2017(21):116.
[2]劉賓,朱亞奇,吳莎.數據挖掘在電力調度自動化系統中的應用[J].電子技術與軟件工程,2017(20):158.
[3]曹鐵生.電力調度自動化系統應用現狀與發展趨勢研究分析[J].硅谷,2014,7(23):74+76.
[4]周洋.數據挖掘在電力調度自動化系統中的應用解析[J].科技創新與應用,2017(35):149-150.
[5]李夢鳴.大數據挖掘平臺在電力運營監測工作的應用[J].科技創新與應用,2016(26):21-22.endprint