?張榮臻 黃成明 胡堅


摘要:農產品是人民生活的必要保障品,其價格波動對人民生活影響深遠,農產品價格預測對農產品市場的發展具有指導作用。本文提出了一種基于改進LSTM的農產品價格預測方法,該改進方法引入了DAE,提取更加魯棒的特征,提高了模型的泛化能力和整體預測精度。
關鍵詞:價格預測;LSTM;農產品價格;DAE
中國是農業生產的大國,農產品是人民生活的必要保障品,農產品的價格波動將直接影響到生產者和消費者,因此農產品價格預測能力對農產品市場的發展具有指導作用。另外,農產品市場又可以分為現貨市場和期貨市場,兩者密不可分,一般情況下現貨價格與期貨價格會保持一致性變化。期貨市場的T+0交易制度和做空機制下形成市場充分交易,使得期貨市場具備價格發現的功能。因此本文選用農產品期貨數據進行價格預測,提升價格預測模型的前瞻性。關于農產品價格預測的研究方法,主要從神經網絡算法、時間序列模型、條件異方差模型、灰色系統模型等基本方法出發,并結合經驗模態、濾波分解、小波分解等數據處理方法進行研究。LSTM是循環神經網絡算法中的一種典型方法,在時間序列數據的預測上具有較好的表現,本文根據農產品價格的特點,提出了一種基于改進LSTM算法的農產品價格預測方法。
1???? 研究方法
1.1? LSTM(Long Short Term Memory)
2???? 實驗
圖1DAE-LSTM模型? 圖2 模型預測效果
農產品價格是一種典型的時間序列數據,普通神經網絡對時間序列數據的處理效果不佳,它只能接收當前狀態的信息而無法接收上一個狀態的信息。循環神經網絡RNN的提出,在該問題上的處理效果顯著。RNN是一種特殊的神經網絡,RNN中的節點更新時,將上一個狀態的輸出作為輸入,從而在節點中建立了前后狀態之間的聯系。
然而,RNN對于時間序列的歷史狀態記憶長度十分有限,通常會喪失對久遠信息的記憶能力。LSTM是基于RNN變化而來的,該模型引入了記憶和遺忘模塊,可以有效記憶長期的輸入信息。LSTM的神經元結構中引入了遺忘門、輸入門和輸出門,通過這三個門控制所要記憶的輸入信息,遺忘不重要的輸入信息。[1]
1.2? DAE(Denoising Auto Encoder)
建立精確穩定的農產品價格預測模型需要對影響其價格波動的因素進行有效概括和表示,這個過程并不容易。本文引入的DAE方法為一組降噪自動編碼器,是一種強大的特征提取方法,在機器翻譯、自然語言處理等領域已有較為成功的應用。
DAE的基礎組件是自動編碼器(AE),AE是一種嘗試將輸入x復制到輸出z的神經網絡,該網絡由編碼器f和解碼器g兩個部分組成。AE的編碼器f對輸入x進行壓縮表示得到y,解碼器g又將壓縮表示的產物y進行解碼,還原生成新的輸入信息z。AE是一種自監督的算法,不需要對訓練樣本進行標記,AE所設定的損失函數L通過比較輸入x和輸出z來衡量壓縮而損失掉的信息,訓練過程調整編碼器和解碼器的參數,通過最小化損失函數進行模型優化。不過,在AE的應用過程中,經常會出現過擬合問題,所以實際應用中使用DAE的效果會更好。降噪自動編碼器DAE是Bengio在2008年的論文提出的,DAE在AE的基礎上,對輸入層的輸入數據加入噪音以防止過擬合,使習得的編碼器具有較好的魯棒性。DAE的降噪結構類似于dropout,其中x是原始的輸入數據,DAE以一定概率把輸入層節點的值置為0,從而得到含有噪音的模型輸入。[2]
1.3? 改進的LSTM
基于上述分析,提出了一種基于改進LSTM算法的農產品價格預測模型,在LSTM輸入層引入了DAE結構,其結構如圖1 所示。模型由兩部分組成,第一部分采用降噪自動編碼器DAE從原始輸入向量中提取特征,第二部分是LSTM單元用于完成農產品價格預測。
為了驗證改進LSTM模型的農產品價格預測效果,本文選擇了具有代表性的農產品期貨數據作為建模對象,對數據進行預處理后,對糅合了DAE的LSTM模型進行訓練,最后使用訓練好的模型進行預測并分析預測結果。
2.1? 數據說明與預處理
實驗選擇大連商品交易所的玉米期貨價格作為研究對象,其歷史交易數據在新浪網站上獲得。數據涵蓋2005年 1月到2020年 4月的日交易數據,本實驗從原始數據中提取了有效交易日的收盤價數據,并且計算了5、10、20和 30日收盤價數據的MA和EXPMA指標,以上數據作為模型的輸入。本文選用決定系數R2對模型的預測效果進行評價,計算公式為:
公式中,和 分別為預測值和實際值。R2的范圍為0 到1,R2越趨近于1,模型的預測效果越好。
2.2? 實驗及結果分析
使用訓練樣本和測試樣本,對DAE-LSTM模型進行訓練和預測。訓練300輪后終止訓練,使用所得的模型進行預測,得到的預測效果如圖2 所示。true曲線表示真實價格,DAE-LSTM曲線為使用模型預測的價格。模型預測結果的R2指標為0.75,結合觀測效果圖中的對比曲線,模型表現出較好的預測精度和穩定性。
3???? 結語
本文提出了一種基于改進LSTM的農產品價格預測方法,模型相對于傳統LSTM結構的改進在于DAE輸入層的引入,提升了模型的返回能力,達到更好的預測效果。由于數據源的限制,實驗僅驗證了價格因素作為輸入的模型效果,對于更廣泛的輸入因素的模型應用效果待進一步驗證。
參考文獻:
[1]?? 楊麗,吳雨茜,王俊麗等.循環神經網絡研究綜述[J].計算機應用,2018,38(S2):6-11+31.
[2]?? 鄧俊鋒等.基于自動編碼器組合的深度學習優化方法[J].計算機應用,2016,36(03):697-702.