黃文思 陸鑫 薛迎衛



摘要:合理線損預測是實現線損精益化管理的前提。準確的電力線損預測可以保證電力供應的穩定,降低用電成本,提高供電質量。本文通過對國內線損管理的研究現狀以及現有線損計算方式的介紹和分析,考慮到配電網的網架結構特點和線損數據的時間相關性,將神經網絡與時間序列預測模型相結合,在Spark上使用時間序列神經網絡算法建立模型對售電量進行短期預測,使用某省電力公司線損數據進行模擬仿真,結果表明基于BP神經網絡的時間序列預測模型可以有效地進行同期線損預測,對線損率預測具有決策性意義。
關鍵詞:線損預測 BP神經網絡 時間序列
前言
智能電網的發展給線損治理帶來了新的機遇和挑戰。在智能電表覆蓋率完備的地區,智能電表采集數據計算同期線損,使以往復雜的配網線損計算變得簡單明了。但受我國智能電網建設相對這一因素的影響,供電公司還普遍存在著智能電表等智能設備使用不全面的情況,使得統計電量工作大多需要人工完成,在很大程度上增加了統計電量的缺失率,繼而導致了線損匯總數據不夠精確,影響線損數據的適用范圍和四分線損達標率。而隨著信息技術的不斷完善和大數據技術日趨成熟,為實現了運用歷史數據和運營數據預測線損數據提供了有效的支持。本研究分析了現有的線損計算及預測方法,在此基礎上結合當前智能電網的特點和發展提出了一種新型適用于配網環境的線損預測方法。
一、基于用戶用電量的時間序列一神經網絡線損預測模型
由于售電量具有明顯的不確定性、復雜性、以及多方案性等特征,使得我們在對售電量進行預測時,需要綜合考慮多種因素,常常面臨著預測不準確的現。就目前而言,用于預測售電量的方法多為根據歷史售電量數據的規律預測后分析后期售電量,根本不能全買考慮影響售電量的所有因素,使得其可操作性和實用性都處于一種相對較低的水平。針對上述問題,文章通過將時間序列算法與神經網絡模型相結合的方式預測售電量,運用時間序列典型分解方法確定樣本售電量序列中存在的趨勢成分、周期性成分,并把售電量的主要影響因素作為BP神經網絡輸入,并通過所預測的電量計算線損率,最終實現對異常線損進行修復。為充分考慮售電量的多種影響因素,提高售電量預測精度,本文把BP神經網絡和時間序列相結合來進行售電量預測,圖1為本文建立的BP神經網絡 時間序列的售電量訓練模型:
(5)閾值更新。我們可以根據網絡輸出與期望輸出兩者的關系,預測出售電量,具體情況如下圖2所示:
該模型在對樣本數據實行多次模擬訓練后,建立了以每日溫度、每日類型、歷史售電量以及預測電量等數據之間的對應關系,從而準確預測出售電量,可將其計算公式表示為:
Pl=PSu PSa
(2-5)
其中,Pl表示線損電量,PSu表示供電量,PSa表示售電量。從該公式(25)中我們可以得出在知道當日供電量之后,我們可以通過預測日供電量的方式,計算出日線損電量,通過BP神經網絡 時間序列模型預測售電量后,可得到線損電量P1,結合線損率計算公式(2-6),就可以計算出某一區域的日線損率Lr。
Lr=PI/PSu
(2-6)
二、基于大數據平臺的新型預測算法
大數據平臺的建立,為業務系統大數據的開發、運用以及運行奠定了堅實的基礎,主要包含數據整合、數據儲存、數據計算、數據分析、平臺服務安全管理以及配置管理等模塊能提供各種業務應用的服務。當前,我們主要運用大數據平臺的數據存儲、數據計算、數據分析以及安全模塊等木塊開展線損預測,下面對其進行分別介紹[2]。其中數據存儲的主要作用是對大數據進行存儲,用海量、規模的數據滿足計算需求。通常情況下,非結構化數據主要存儲在分布式的文件系統中,半結構化數據主要儲存在列式數據庫或鍵值數據庫中,結構化數據主要儲存于行式儲存數據庫中具有極高的實時性全面性以及準確性。數據計算指的是運用多樣化的大數據進行流計算、批量計算、內存計算以及查詢計算,同時還可以計算分布式存儲數據和內存數據,從而滿足實時決策、預警等等需求。數據分析指的是對多樣化數據進行加工、處理、分析以及挖掘的功能,為獲取新的業務價值、制定正確的對發展規劃提供可靠的參考依據。而安全管理則是指確保大數據環境下采集、儲存、分析以及應用數據所涉及的身份驗證、授權以及輸入驗證等環節安全的過程。例如,在對數據進行分析和挖掘時,常常會涉及到企業相關業務的核心數據,如果缺乏安全管理,就會有可能出現數據泄露,而控制訪問權限等安全措施在大數據應用中尤為關鍵。
(一)spark平臺
Spark平臺與Hadoop相比,有著較高的準確性、安全性以及全面性,是目前大規模處理分布式數據的最有效平臺。在傳統的Hadoop框架中,需要對數據進行大量的磁盤I/O后才能進行信息處理,在進行信息處理過程中需要對數據進行大量的磁盤,運行效率相對較低,而基于內存的分布式計算框架Spark平臺,則有效的解決了頻繁的磁盤I/O問題。這主要是由于Spark平臺可以實現計算節點將中間結果緩存與內存中,避免了反復迭代等高密度計算過程中的磁盤頻繁I/O操作。Spark主要囊括了分布式文件系統、彈性分布式數據集以及容錯機制等幾個模塊。
1.分布式文件系統
Spark平臺繼續使用了分布式文件系統HDFS,在極大程度上簡化了數據的儲存流程,使其可以進行大規模的數據處理,此外,HDFS系統中還使用了高容錯性策略:首先,數據復寫機制可以將同一份數據在不同的節點上產生副本,及時某一個節點發生故障,我們依然可以存取其他節點的數據。其次通過心跳機制檢測節點的可用性。HDFS系統只有一個主節點(namenode)和多個從節點(datanode),主節點的作用是管理HDFS文件系統命名空間,而從節點的作用則是將數據以塊為單位進行存儲,并周期性的將心跳包發送給主節點,如果主節點不能獲取集群上從節點的心跳包,則介意判斷該節點已經思想,放棄對其進行I/O操作。
2.彈性分布式數據集(RDD)
在存儲方面,Spark平臺運用了以分布式共享內存為基礎的彈性分布式數據集(Resilient Distributed Datasets,RDD)作為數據結構,同時兼容HDFS系統,可將HDFS系統中存在的海量數據作為數據源,并加載至RDD中進行數據處理同時,它還可以在內存中對必要的數據進行容錯緩存,為高性能的迭代計算提供依據。在計算模型方面,Spark平臺有著更高的靈活性和更加豐富的操作符、操作符間的組合方式。RDD是一種分布式彈性數據集,將數據分布存儲在不同節點的計算機內存中進行存儲和處理。每次RDD處理數據的結果都會被存放在不同的節點中,在需要進行下一步數據處理時,可實現從內存中直接提取數據,從而省去了大量的I/O操作,這對于傳統的MapReduce操作來說,更便于使用迭代運算提升效率。
3.Spark平臺的容錯機制
Spark平臺有著極高的容錯性,這主要是由于在只讀權限的RDD數據結構中,當數據集的某一分片丟失時,Spark平臺就會對原始的RDD提出新的申請,運用transformation操作對分片信息進行重新計算,lineage機制的主要作用是保存和記錄RDD與transformation之間的操作,并把集中式元數據存儲于主節點中,lineage機智的存在,可以實現對RDD數據的重新計算,并且只讀權限的RDD還能夠確保當需要重新執行lineage中已被執行過的某個操作,可以獲得相同的計算結果。
(二)新型預測算法在大數據平臺中的應用
基于spark的BP神經網絡并行化方法,通過采用spark并行編程對BP神經網絡的權值進行全局進化迅游,經過一定次數的迭代后,得到優化的神經網絡初始權值,在使用并行的BP神經網絡算法進行迭代,最終輸出網絡結構。在訓練過程中,各個階段均能進行多節點的并行處理,有效增強了BP神經網絡的收斂速度,在提升訓練質量和訓練效率等方面均起到了至關重要的作用。
三、結束語
綜上所述,基于用戶用電量的時間序列 神經網絡線損預測模型有著極高的準確性和實用性,能夠有效地幫助我們判斷實際線損是否存在異常,且能準確定位線損異常的原因和位置,是目前提升電網安全性和穩定的有效預測模型。與此同時,在同期線損數據急劇增加這一背景,我們還可以通過將該模型與大數據平臺相結合的方式,在sIJark上使用時間序列神經網絡算法對售電量進行并行預測,可保證數據的存儲空間和運算效率。從預測結果可知,該模型對售電量預測精度較高,對線損率預測具有決策性意義。
參考文獻
[1]劉晶,朱鋒峰,林輝,等.基于相似日負荷修正算法的短期負荷預測[J].計算機工程與設計.2010.31 (06):1279-1282.
[2]李翔,歐陽森,馮天瑞,等.一種基于用電行業分類的中長期電量預測方法[J].現代電力.2015,32 (06):86-91.
[3]劉耀年,王衛,楊冬峰.基于模糊劃分聚類的中長期用電量預測[J].東北電力大學學報.2004,24 (04):3942.
[4]張鑫,韋鋼,周敏,等.灰色理論在城市年用電量預測中的應用[J].上海電力學院學報,2002,18 (02):9-12.
[5]張士強,王雯,王健.ARIMA模型在城市年用電量預測中的應用[J].電力需求側管理.2010,12 《06):31-34.