南京恒星自動化設備有限公司 戴 明 中國鐵路上海局集團有限公司南京供電段 湯 浩
南京郵電大學自動化學院 胡 震
由于電力能源生產、分配、消費的過程幾乎同時進行,也意味著電力能源難以儲存、即發即用,這要求制定合理有效的供電計劃和電能調度方案,以保證電能的供需平衡。要保證鐵路電能供需平衡,必須分析鐵路電力負荷的變化情況及影響因素,并可靠預測未來鐵路用電趨勢。電力負荷預測的內涵是,在一定誤差范圍內挖掘電力負荷的歷史數據、實時數據及其他諸多影響因素間的映射關系,并建立對應的數學模型、估計未來電能趨勢。相關研究表明,短期負荷預測誤差每減小1%發電成本可降約0.1~0.3%,可節約甚至上百萬元,并可有效提高鐵路供電可靠性。因此,開展鐵路供電設備負荷數據預測的研究是實現鐵路安全運行的重要保障。
根據負荷預測周期時長,可分為短期、中長期和長期三種預測機制,具體長短期定義由地區和實際使用情況決定。其中,短期負荷預測主要預測未來較短時間內(日、周或月等)的負荷變化情況,主要用于對電力設備運行的安全性進行實時監督,提供負荷經濟分配的參考依據等。因此,短期負荷預測是電力供應充沛、合理調度的重要保障,對預測結果有較高的精度要求。
短期電力負荷預測方法可分為基于概率論和數理統計的回歸預測方法和基于機器學習的智能預測方法[1-2]。基于概率論和數理統計的回歸預測方法含回歸分析法和時間序列分析法?;貧w分析法擬合速度快、建模思路簡單,適用于樣本數少且簡單的預測對象;但高度依賴歷史數據且受多種因素制約。時間序列法考慮了數據的時序性特點,對平穩序列的預測精度較高,且低階模型建模簡單,擬合難度低;但僅考慮歷史數據,忽視了影響負荷變化的外部因素。鐵路負荷具有較強的隨機波動性,非線性特征明顯,因而單一回歸預測方法無法滿足復雜的非線性電力負荷預測要求。
基于機器學習的智能預測方法是在鐵路供電設備的歷史負荷數據中識別負荷的變化趨勢并做出預測,且將氣候、節假日等多種因素融合而提升預測精度。然而機器學習模型通常為淺層架構,僅含一個隱藏層,處理非線性能力有限,面臨復雜的鐵路供電負荷時可能無法準確預測[3];深度學習作為機器學習領域的最新成果,采用深層網絡架構,更強的數據表達能力,可直接識別深層次變化特征,為實現鐵路供電負荷的智能化預測提供了新思路。
短期電力負荷預測屬于非線性時間序列預測問題,深度學習方法可有效地挖掘負荷數據與各影響因素間存在的非線性關系。考慮到電力負荷時間序列輸入變量間存在復雜的依賴性,采用遞歸神經網絡可很好地解決該問題[4]。在遞歸神經網絡中,LSTM神經網絡憑借處理時間序列的優勢,可解決時間序列的長距離依賴問題,成為熱門研究對象。
本文構建了基于Tensorflow深度學習框架的高階LSTM網絡模型,對鐵路供電設備負荷進行預測。基于Keras的序貫模型堆疊構造LSTM模型,序貫模型具有編譯速度快、易于操作的優點。所構造的LSTM模型由1個輸入層、2個LSTM層及全連接層組成,將輸入層直接接收的特征傳遞至第一個LSTM層,再將輸出結果輸入至第二個LSTM層,然后將結果輸入至全連接層,最后輸出由全連接層模型的預測結果。
隨著網絡層數和神經元數目增多,模型參數也會相應增加,而當訓練樣本數量過少時就容易產生過擬合,得到的模型對未知數據集的預測精度很低,泛化能力很差。解決的常用方法主要有:在盡量多的數據上擬合,不斷完善修正;采用合適的模型,針對不同情況和分類要求對參數合理選擇;使用Dropout,即當神經網絡前向傳播時,可令當前網絡層中部分神經元以一定概率p暫停工作,前向傳播當前輸入數據,再反向傳播損失誤差,更新網絡中神經元的權重等參數,修正偏差,不斷循環迭代。這樣有利于減少隱含層的神經元間相互作用,加強模型的泛化能力。
當將神經網絡應用于預測研究時,期望獲得的神經網絡模型不應對某些輸入特征過于敏感,即使在受到外部因素干擾下,依然可從其他特征中提取到有用的信息學習。而Dropout方法則可有效避免上述問題,Dropout運算在更新網絡模型的權重時,不僅將有特定關系的隱含節點納入考慮范疇內,更有利于增強網絡模型的泛化能力和穩定性[5]。
基于LSTM神經網絡的鐵路供電設備負荷預測實現流程如下:選取預測模型的輸入特征和輸出變量;對歷史數據進行平穩性和隨機性檢驗,確定數據集所屬類別,針對不同數據集合理選擇模型參數;讀取歷史數據并歸一化處理,按8:2劃分為訓練集和測試集兩部分,有利于后續模型的訓練和預測;構建LSTM負荷預測模型,并利用訓練集訓練模型,再根據測試集上的預測結果評估泛化能力,驗證模型的預測性能。
實驗環境和實驗數據集:基于Keras深度學習庫平臺搭建LSTM的鐵路供電設備負荷預測模型,采用python語言代碼編程。Keras是一個基于TensorFlow的深度學習的高階API封裝,內置多種函數開源包,使用方便、頁面簡潔,使用Keras搭建神經網絡不僅支持底層文件修改和GPU加速,還能靈活切換不同后端,很適合研究深度學習模型的調試和參數尋優。鐵路供電設備負荷數據采用開源網站ENTSO的電力負荷數據集,本文選取法國某地區2020-01-01~2021-01-01的真實電力負荷數據作為實驗數據集,此數據集由一年中每個整點采樣值構成,共計8785條負荷數據(圖1)。

圖1 鐵路供電設備負荷數據集
數據歸一化處理:LSTM神經網絡的模型對輸入的電力負荷數據尺度較敏感,會直接影響到模型訓練效果,因此需作歸一化處理。可用公式Xnorm=(X-Xmin)/(Xmax-Xmin)對數據進行歸一化操作,將負荷數據映射到[0,1]區間。式中:X為原始樣本值、Xmin為樣本最小值、Xmax為樣本最大值、Xnorm為歸一化后的樣本值。
預測結果:將訓練集輸入到已設計好的LSTM模型中進行迭代訓練,通過不斷優化并綜合考慮模型的收斂速度等問題,最終確定模型的參數為:LSTM層數設為2層,第一、第二層的神經元個數分別設為64;Dense層為輸出層,神經元個數為1;Dropout值設為0.2;batch_size參數設為32;Epoch設為100,LSTM神經網絡預測結果如圖2。

圖2 LSTM神經網絡預測結果
預測結果分析:基于LSTM鐵路供電設備負荷預測模型的訓練損失曲線收斂迅速,迭代次數在100次以內就達到很好的收斂效果,表明預測模型達到預期。采用平均絕對百分比誤差(MAPE)、均方根誤(RMSE)及R2決定系數作為誤差評價指標,來研究LSTM模型采用不同優化算法性能。采用測試集驗證模型性能,LSTM模型分別采用SGD、AdaGrad、Adam以及RMSprop算法的性能比較如下。
MAPE:29.079、25.759、23.707、17.725;RMSE:9.924、9.189、8.875、8.069;R2系 數:-1.2658、0.9031、0.9299、0.787。由此可知,通過對比其它預測算法,從誤差評價指標MAPE、RMSE以及R2決定系數三個維度綜合來看,在LSTM模型中采用RMSprop優化算法具有更高的預測精度。
綜上,本文提出了一種基于長短時記憶網絡(LSTM)的鐵路供電設備負荷預測方法,可直接從歷史及當前數據中識別鐵路供電設備變化特征,進而對供電設備的負荷做出準確預測?;赥ensorFlow深度學習框架的高階API Keras構建了LSTM神經網絡,基于鐵路供電設備歷史負荷數據對模型進行訓練,訓練結果表明了構建模型的有效性。