陳建婷



摘要??? 傳統的線性模型難以解決多變量或多輸入問題,而神經網絡擅長于處理多變量的問題,本文提出一種基于改進型BP神經網絡的多變量時間序列預測方法。該方法對多變量時序數據建模預測能力較強,能夠在有效減少訓練時間的前提下,提高數據預測的精度。最后,使用這種方法對公開數據集中某地電力負荷值進行預測,最終證明基于改進型BP神經網絡的多變量時序預測方法預測精準,誤差較低。
【關鍵詞】改進型BP神經網絡 多變量 時間序列 數據預測
1 引言
在當今商業競爭激烈的環境中,供應,需求和價格都在不斷變化中變得越來越不穩定和不可預測。但是,行業的決策過程需要全面展望不確定的未來。許多決策都依賴于概率預測來量化這些不確定性。傳統的時間序列預測方法,如回歸模型,灰色預測模型和時間序列都沒有考慮到各種隨機擾動變量對數據預測的影響。但在實際預測中發現,影響預測精度的主要因素即是各種隨機擾動變量。例如,在電力負荷預測中,即為氣象和溫度因素等。如果不考慮氣象和溫度等擾動因素,使用任何技術建立預測模型都不會準確預測出電力負荷,從而影響電力系統運行的穩定性。
近年來,逐步引入人工智能和一些不確定的方法來處理各種影響預測的因素。模糊方法可以處理部分影響因素,但該方法仍不能模擬影響因素與被預測數據的非線性關系。基于多變量因素考慮,采用神經網絡來模擬非線性關系。由于不同變量因素對預測數據的影響模式不同,神經網絡過度擬合的存在導致預測精度較差。為了避免由不同變量類別導致的神經網絡的低泛化能力,必須對歷史數據進行分類。采用聯合數據挖掘技術對歷史負載數據進行分類。在模糊處理過程中,采用手動影響會導致局部聚類錯誤,算法復雜。
為解決以上問題,本文使用的改進型BP神經網絡模型結合遺傳算法,可以在訓練速度較快的前提下,有效提升預測精度。
2 改進型BP神經網絡原理
2.1 BP神經網絡
BP神經網絡的組成基本單位為神經元。在神經元模型中,w是權值,代表與BP神經元模型連接的強弱程度,b是神經元模型的閾值,P是輸入,f是激勵函數,y是輸出。所以,如圖1所示,基本的BP神經元的輸出即是:
y=f(wP+b)(1)
如圖2所示,是一個完整的多層BP神經網絡,結構一般分為三個部分。輸入層和輸出層一般都是單層。而神經元的數量則需要取決于訓練集和預測數據。中間的隱含層可以設置為不同的層數,層數越多,則預測結果更加精準。相對應的,運算也相對復雜,訓練時間相對較長。在本文中,選取了兩層隱含層,可以滿足多變量時序預測要求,并且訓練速度較快。
2.2 遺傳算法優化的BP神經網絡
多層神經網絡的性能表面可能具有許多局部最小值,難以收斂到全局最小點。因此,使用改進型BP神經網絡進行負荷預測至關重要。遺傳算法可以作為改進型BP神經網絡的優化方法,結合遺傳算法的BP神經網絡類似生物進化,模擬群體的集體進化,其中的個體都代表探究空間的近似解。從任意種群開始,遺傳算法利用個體遺傳和變異有效地實現了穩定優化的育種和選擇過程,從而可以將種群進化到更好的搜索空間區域。本文將遺傳算法與改進的BP神經網絡相結合,形成了一種新的預測模型。
遺傳算法可用于改進權重和閾值的初始分布,并使改進型BP神經網絡預測結果能夠非常接近測試集數據。改進型BP神經網絡原則描述如下:
(1)確定BP神經網絡拓撲。分析多變量時間序列數據預測影響因素,并定量改進型BP神經網絡的節點數。分析預測數據定量輸出神經元個數,然后進行多次實驗定量最為合適的節點個數。最后,我們可以得到遺傳算法的個體長度。
(2)遺傳算法結合的改進型BP神經網絡的權值和閾值更穩定。該模型隨機生成一個群體,利用遺傳算法通過適應度函數計算適應度值可以找到其中的最佳個體。
(3)使用改進的BP神經網絡進行預測。使用最佳個體初始化,可以在訓練期間再次局部優化BP神經網絡權重和閾值。優化的BP神經網絡可以獲得準確的預測和優異的效率。
3 基于改進型BP神經網絡的數據預測
3.1 數據處理
3.1.1 訓練測試集劃分根據2014年全球能源預測競賽
(GEFCom2014)給出的數據集進行測試,以2003年3月-2008年11月的數據作為訓練集,以2008年12月的數據作為測試集。
3.1.2 數據標準化
標準化采用了min-max標準化方法,對于GEFCom2014數據集中的每一個值x,其標準化計算公式為:
其中,xnorm為標準化后的值,max為GEFCom2014數據集中的最大值,min為GEFCom2014數據集中的最小值。
3.1.3 預測結果誤差評估標準
采用平均絕對百分誤差(MAPE)對預測集的準確性進行評估和分析,MAPE越小則表明誤差越小。
其中,n為預測結果總個數,yi為真實值,為預測值。
3.2 實驗結果
輸入數據集進行訓練之后,經過基于改進型BP神經網絡模型的預測,并將預測出的數據和測試集進行比較和分析。由圖3所示,可以看出,橙色線為預測值,藍色線為真實值。可以看出,真實值與預測值相差無幾,誤差非常小,整個圖形軌跡幾乎重合。
圖4則更加直觀的呈現了本方法的MAPE,本方法的MAPE一直保持在較小的范圍內。這表明改進型BP神經網絡在電力負載預測方面有著很好的效果,精度非常高,穩定性相比傳統方法也有了較大的提升。
4 結論
本文從多變量時序數據本身的特性出發,解釋了本文采用基于改進型BP神經網絡研究方法的原因,然后介紹了改進型BP神經網絡的原理,從原理上解釋了該方法對于負荷預測的適用性。最后采用實際數據進行仿真,將數據進行預處理后輸入進模型進行訓練預測,實驗結果表明基于改進型的BP神經網絡模型能較準確地對多變量時序數據進行預測。
參考文獻
[1]麥鴻坤,李驚濤,董雨等.一種基于ARIMA模型的電力負荷預測及預測結果評價的方法,CN104794549A[P].2015.
[2]石海波.PCA-SVM在電力負荷預測中的應用研究[J].計算機仿真,2010,27(10):279-282.
[3]鄭凱文,楊超.基于迭代決策樹(GBDT)短期負荷預測研究[J].貴州電力技術,2017,20(02):82-84.
[4]張振,王鋒,陳敏曦.基于BP網絡的電力負荷預測改進研究[J].中國電業:技術版,2015(10).
[5]呂嬋.基于BP神經網絡的短期負荷預測[D].華中科技大學,2007.
[6]Hong T, Pinson P, Fan S, et al,. Probabilistic energy forecasting: Global Energy Forecasting Competition 2014 and beyond[J]. International Journal of Forecasting, 2016.