(西安科技大學管理學院 陜西 西安 710054)
相比于最常用的傳統數理統計學以及計量經濟學預測方法,近年來隨著人工智能的高速發展,深度學習和機器學習的相關預測方案要更勝一籌。以RNN為代表,該類模型能夠實現以時間序列作為載體,進行多個輸入的同時實現多個輸出,且隱含層之間的自連接展開后的網絡結構,可以看做是相互作用、影響的時間序列。但是RNN作為神經網絡的子類也存在著和神經網絡的同樣問題,比如嚴重的梯度下降不穩定、難以收斂到最優解和局部最優等問題。但是近年來隨著人工智能研究人員的不斷驗證和實踐,LSTM 神經網絡的實現使以上這些問題有了進一步的緩解。但是將LSTM等循環神經網絡模型用于煤炭價格的分析和預測上是有效,正是本文作者研究的核心所在。
目前應用廣泛的煤炭價格預測算法分為兩大類:一類是基于簡單時間序列的價格預測算法,另一類是基于人工智能的價格預測算法。
1.基于計量經濟學的價格預測方法
時間序列數據根據其數據分布分為線性與非線性兩種,鄭榮[1](2015年)在并聯式組合預測的思想影響下,建立了ARIMA 與SVM的混合預測模型,擬合得到的混合模型的MAPE為1.36,遠遠小于其任意單一模型的MAPE值,說明該混合模型對數據源中的信息提取較為充分合理,進一步驗證了混合預測模型的可行性和有效性;郭建利,程蕾等[2](2016年)構建出ARIMA-SVM的組合式煤炭價格預測模型,在充分考慮了煤炭價格時間序列自身數據特性和對煤炭價格的多種影響因素之外,在最后模型輸出部分采用平均加權的方式將ARIMA和SVM的預測結果進行組合拼接,通過此種模型組合的方式使得模型最終得精度較高、誤差水平低。同時利用該組合模型對環渤海動力煤價格進行了預測;朱美峰,張華明[3](2016年)參考前人研究將灰度理論應用在煤炭得長期預測中,結合歷史數據構建了煤炭價格長期預測的灰度預測模型,預測未來八個季度得煤炭價格,并對最終結果進行誤差分析;符佳[4](2018年)通過二次指數平滑法建立了價格變化的預測模型,并對2018年6-8月動力煤價格進行了預測。最終分析得到:以秦皇島港口動力煤價格為輸入數據,采用二次指數平滑預測法對其進行預測分析是非常有效和準確得,在其論文中構建得三套預測模型精度都在90%以上,經過實證檢驗也證明了其模型具有較高的魯棒性和精度。
2.基于人工智能模型的價格預測方法
駱雙駿[5](2017年)應用LSTM模型和門限循環單元模型這兩種具有“記憶力”和選擇性記憶的深度學習模型來預測 COMEX 黃金期貨價格,最終實證效果較好;鄧鳳欣和王洪良[6](2018年)選取美港市場個股數據為研究對象,分析 LSTM 神經網絡對股票時間序列預測的有效性;韓山杰和談世哲[7](2018年)使用TensorFlow深度學習框架,構建多層感知器 MLP(Multi-layer Perceptron)神經網絡模型,用于預測每日收盤股價;王章章[8](2018年)通過對已有得Light GBM算法模型和基礎得卷積神經網絡(CNN)等神經網絡算法進行深入研究的基礎上,針對時間序列價格這一特定得預測問題,提出了一種 CNN-Light GBM 組合的價格預測算法;
LSTM作為傳統RNN神經網絡的升級版,目的在于解決RNN訓練過程中的梯度隨著傳導過程而逐漸減小,同時因為展開的循環神經網絡層數較多所以在傳遞過程計算出來的梯度隨著傳導的進行而慢慢消失,這也就是神經網絡難以完全從本質上解決的梯度消失問題,梯度消失會導致模型在訓練過程中陷入局部最優解。LSTM模型在結構上一定程度上緩解了循環神經網絡梯度消失的問題,通過增加門限機制來限制誤差傳導,每次誤差進入神經元時當前神經元不再作用于誤差,這樣做的好處在于誤差不會在傳遞過程中有損失,從而解決梯度消失的現象,因此LSTM模型的收斂性通常情況下是較好的。
LSTM的結構是基于RNN的網絡結構進行優化改進的,在應用中將神經網絡的每層每個神經元中均設置輸入門、輸出門和忘記門,針對序列數據而言,LSTM的優勢在于一方面可以提高模型的收斂速度,其次因為門限機制可以促使模型逃脫局部最優超正確的方向進行收斂。但是神經網絡因為其整體結構上的原因,無論怎么進行優化和改進,在某些場景下的訓練結果還是會或多或少的出現局部最優的情況,基于這個缺陷,本文將從數據層和結構層進行LSTM優化。
基于前文關于煤炭價格這一研究對象的相關分析,同時考慮數據的可得性和分析的有效性,從Wind數據庫中選取我國2007年7月至2019年9月秦皇島港口動力煤(Q5500,山西產),每周市場價的平均值作為本周價格,個別缺失數據使用前一個歷史數據代替,該時間序列則是本文用到的數據源。
據相關研究證明出現局部最優的情況和隱含層單元數的設定也有關系,隱藏層中的節點個數對整個LSTM模型的預測性能的重要性不言而喻,關于隱藏層的節點個數我們將通過對比試驗的方式進行確定。根據經驗法則神經元過少導致網絡會欠擬合;若數目過多,不僅增加神經網絡的訓練時間,更重要的是降低神經網絡的泛化能力,即過擬合,因此模型最終的擬合效果也取決于隱藏層選擇的神經元個數是否恰到好處,本文使用Keras作為基礎框架,使用一個隱藏層,單元數為32。

表3.2 模型預測結果
基于以上結果,LSTM系列模型在煤炭價格數據上的擬合效果較好,預測精度較高,誤差遠遠小于1%,同時也證明了LSTM系列模型應用于煤炭價格時間序列數據是有效且優秀的預測模型。
本文利用秦皇島動力煤周市場價格數據作為研究對象,提出了基于 LSTM 神經網絡的煤炭價格時間序列預測模型,驗證了LSTM處理非線性數據的優勢,充分發揮了其利用歷史數據進行記憶的特點,本文基于煤炭價格數據使用LSTM及其優化模型對數據源進行擬合和訓練,最終模型的預測效果無論是精準度還是趨勢性都符合煤炭價格原始序列,說明了運用LSTM長短期記憶神經網絡方法對煤炭價格進行研究是一個較為合理和先進的方法。