陳立平邢小丹張玉亭何軍
(1.塔里木大學信息工程學院,新疆 阿拉爾 843300;2.塔里木大學自治區教育廳普通高等學校現代農業工程重點實驗室,新疆 阿拉爾 843300;3.阿拉爾市紅福天棗業有限公司,新疆 阿拉爾 843300)
自2019年4月30日,國內首個干果期貨品種紅棗期貨在鄭州商品交易所上市交易以來,公開透明的紅棗期貨市場價格機制已逐漸形成,對紅棗產業發展和價格穩定起到了重要作用。目前,全國共設立紅棗交割倉庫14家,其中,新疆9家(含3家兵團企業),庫容量占比近70%,明確了南疆為紅棗的基準價區地位,帶動了南疆紅棗種植、加工、倉儲等產業的綜合發展。近年來,圍繞紅棗農產品“保險+期貨”的農業新發展試點,正穩步推進,成為化解農業系統風險,提高農民收入的重要舉措。紅棗作為新疆特色林果產品與農業經濟支柱之一,其價格變化對當地產業發展,起著重要的風向標作用,因此,開展價格預測智能方法研究,對促進區域農業經濟和產業健康、可持續發展,具有技術支撐作用。
紅棗期貨上市后,兵團各級政府高度重視這一“數字杠桿”對區域農業經濟和特色林果產業發展的市場驅動作用,建立和完善了專門的期貨產品交易企業,并通過“保險+期貨”“套期保值”等系列舉措,完善期貨商品種植、加工等前端保障體系,持續推動當地紅棗產業的轉型升級。
2019年至今,紅棗干果期貨交易已歷時3.5年,其主力合約價格走勢如圖1所示。
針對農產品價格預測問題,國內外學者開展了大量工作;尤其近年來,基于LSTM的人工神經網絡方法,被廣泛地應用于各種農產品的價格預測,并取得了較為矚目的效果。
2021年,范俊明等[1]構建多層LSTM模型對大豆期貨價格進行預測。實證結果表明,LSTM模型相較于ARIMA、MLP和SVM模型具有更高的預測精度和表現,調優參數對于LSTM模型的預測效果有著較大影響。2020年,張翠萍[2]對比分析了SVR模型與LSTM神經網絡對天然橡膠期貨價格預測效果的差異,發現LSTM神經網絡的預測效果要好于SVR模型。Xiong等[3]結合傳統的VECM模型和SVR回歸方法預測代表性農產品期貨價格走勢,取得了優異的實證結果。2019年,Sayed和Auret[4]使用了4個GARCH模型,對美國、巴西、阿根廷和南非4大玉米出口國的玉米期貨進行了實證分析,結果表明,主要玉米出口國之間存在波動性顯著的溢出效應。2019年,Degiannakis等[5]采用異質自回歸模型(HAR)的變體預測玉米、大豆等5種廣泛交易的農產品波動率,并提供更好的擬合效果。2018年,Wang和Li[6]研究了商品期貨價格之間的相互影響,采用了奇異譜分析和因果檢驗,并構建了組合神經網絡模型,包括反向傳播、徑向基函數和小波神經網絡。該模型能夠有效預測玉米、黃金和原油的商品價格,并且其效果優于基準模型。2017年,Persio等[7]開展了不同模型對谷歌股價預測效果的比較實驗,建立了RNN、LSTM和GRU模型。實驗結果發現,LSTM模型的預測效果較另外2個模型的預測效果好。
由于期貨交易市場的多方參與特性,使得其價格預測更為困難。
針對黃豆、玉米、小麥大宗農產品價格預測,趙雪伶[8]開展了MVGG模型、ENSEMBLE模型、人工神經網絡(ANN)和長短期記憶模型(LSTM)的對比實驗研究,其結果表明,ENSEMBLE模型預測精度更高。國內,張璇[9]針對花生干果,采用了長短期記憶網絡(Long Short-Term Memory,LSTM)對河南省花生價格進行預測,開展了相關研究工作。
相較而言,目前,國內對紅棗干果期貨交易價格預測的研究,尚較為匱乏。出于區域特色林果產業健康、可持續發展需求,仍需加大研發投入,揭示紅棗期貨價格形成機制及相應產業發展對策的研究。
HochreiterS和SchmidhuberJ[10]于1997年提出了長短期記憶(LSTM)網絡,后經Graves A[11]的改進,使得LSTM得到了進一步推廣。LSTM基本單元結構如圖2所示。

圖2 LSTM基本單元結構
針對LSTM網絡模型的訓練學習過程,整個前向傳遞過程圖包含了遺忘門、輸入門和輸出門3個重要部分。
ft是遺忘門,用來控制前一時刻的記憶單元狀態是否需要被遺忘。輸出范圍是[0,1],表示保留多少前一時刻的記憶單元狀態[12]。公式:
ft=δ(wf×[ht-1,xt]+by)
(1)
式中,σ為激活函數;wf是權重矩陣;by為偏置項。
輸入門用于控制新信息被記憶單元更新的程度。公式:
it=δ(wi×[ht-1,xt]+bi)
(2)
(3)
式中,wi代表輸入矩陣;wc表示狀態矩陣。
Ct(記憶狀態)通過遺忘門和輸入門控制前一時刻的記憶單元狀態以及新信息,得到新的單元狀態。公式:
(4)
輸出門用于控制當前時刻的輸出。公式:
Ot=δ(wo×[ht-1,xt]+bo)
(5)
ht=Ot×tanh(Ct)
(6)
式中,w0是輸出矩陣;b0為偏置向量。
2.2.1 數據預處理
2.2.1.1 數據來源及預處理
數據來源于鄭州商品交易所紅棗期貨行情數據,選擇紅棗期貨主力合約為研究樣本,價格指標包括開盤價、收盤價、最高價、最低價、成交量、成交額、振幅、漲跌幅、漲跌額。具體數據形式如表1所示。
2.2.1.2 數據歸一化方法
Z-Score方法基本思想是將原始數據減去其均值,然后除以其標準差,從而將數據轉換為符合標準正態分布的數據。這樣做的優點是可以將數據的均值調整為0,標準差調整為1,使不同數據之間的比較更具有可比性。轉化公式:
(7)
式中,μ為數據均值;σ為數據標準差;Z經標準化處理,代表紅棗期貨價格和集合均值之間的距離,Z低于均值為負數,反之為正數,范圍為(-∞,+∞)。
2.2.2 模型構建
實驗中,超參數設定對預測結果影響較大,需要對影響預測精度的超參數進行實驗對比確定LSTM網絡模型的最優網絡結構,進而確定最佳時間窗口期。參考楊青等[13]選擇窗口期的方法與范俊明等[1]實驗選擇LSTM網絡模型的網絡層數,最終選擇構建3層LSTM網絡模型來對不同時間窗口長度w(10~50)進行測試實驗。其模型的預測性能評價指標采用均方根誤差(RMSE)、平均絕對誤差(MAE)、模型預測準確率(accurancy)來對實驗結果進行對比。其中,RMSE、MAE的計算公式:
(8)

(9)
(10)
數據來源于鄭州商品交易所紅棗期貨主力合約行情數據,將2019—2021年的紅棗期貨數據作為一組來訓練LSTM模型,2022年數據作為效用組來進行結構論證。LSTM模型預測流程圖如圖3所示。

圖3 LSTM模型預測流程圖
3.2.1 2019—2021年紅棗期貨價格預測實驗
在對紅棗期貨價格進行預測實驗中經過多次調試與測試,在權衡計算量與模型的預測準確度后將前饋網絡層的隱藏神經元個數設置為10個,由此來搭建不同時間窗口長度,并將6次實驗結果得到的各項指標平均值作為最終指標標準,通過比較來確定最佳時間窗口長度。所預測結果與指標如表2所示。

表2 2019—2021年不同時間窗口期各項指標均值
由表2可知,窗口期為20的模型性能最優,最終選定模型的窗口期為20。預測效果最好和最差的效果如圖4所示。

圖4 時間窗口期為20、40的LSTM模型預測結果圖
3.2.2 參數化模型對2022年紅棗期貨價格預測實驗
針對2022年開展相關基于LSTM的紅棗期貨價格預測實驗。搭建網絡層數為3,前饋網絡層的隱藏神經元個數為10,時間窗口長度為20的參數化LSTM模型,應用于2022年的紅棗期貨價格預測。預測結果圖如圖5所示。

圖5 2022年紅棗期貨價格預測圖
通過對2019—2021年歷年紅棗期貨價格預測結果進行比較與分析,實驗表明,時間窗口長度為20的LSTM神經網絡模型在紅棗期貨價格預測問題上具有優勢,這一模型也對2022年當年的紅棗期貨價格起到一定的指示作用。實現紅棗企業現貨、期貨雙軌交易模式下的風險智能控制,符合國家金融創新對經濟高質量發展導向、符合區域產業發展需求;采用現代智能技術對期貨價格進行預測使農業創新發展新模式具有更大的發展空間。