王曉蕾,張艷,柳平增,溫孚江,任萬明,鄭勇,王剛,延賓
基于LSTM與GARCH族組合模型的蘋果價格預測分析
王曉蕾1,張艷1,柳平增1,溫孚江1,任萬明2,鄭勇2,王剛3,延賓3
1. 山東農業大學信息科學與工程學院, 山東 泰安 271018 2. 山東省現代農業農村發展研究中心, 山東 濟南 250100 3. 德州市陵城區農業農村局, 山東 德州 253500
為提高蘋果價格的預測精度,提出了一種將深度神經網絡與計量經濟模型相結合的新方法。發揮LSTM模型的自身學習特性,以及GARCH族模型挖掘經濟特征的能力,研究構建了長短期記憶模型(LSTM)與GARCH族多模型結合的組合模型。對比分析多個組合模型的預測性能,實驗結果顯示,(1)加入波動聚集性、波動持續性、非對稱波動性、杠桿效應以及增強非對稱波動靈活性等特性的LSTM與GARCH族組合模型(LSTM-GTEP)預測性能最優。(2)對比含有GARCH項、TGARCH項、EGARCH項、PGARCH項的組合模型損失函數均值,含有非對稱波動效應的TGARCH項的組合模型整體最優,其次為含有波動聚集、波動持續效應的GARCH項的組合模型。最后,基于組合模型中的最優模型對蘋果價格進行預測,驗證了組合模型的有效性。
蘋果; 價格預測; 模型
我國是世界上最大的蘋果生產國和消費國,蘋果已成為部分農民增收致富的支柱產業,受供求、季節和自然災害等因素的影響,蘋果市場價格波動愈發顯著,價格波動直接影響著蘋果產業從業者的收益。開展蘋果市場價格的短期預測,對果農規避市場風險,以及對穩定農業生產、平衡物價水平、保障消費者福利水平至關重要,也是制定農業產業政策、維護市場健康發展的重要依據。
從農產品價格預測方面來看,學者們主要從兩個方面進行了探討:一是基于傳統的時間序列、神經網絡以及機器學習等單模型進行預測,二是使用組合模型進行農產品價格預測。單模型方面,
早期的農產品價格預測方法主要為時間序列預測,因ARIMA能較好的擬合時間序列,因此多采用ARIMA系列模型進行價格預測[1-3],但ARIMA未能完全提取季節因素特征,利用季節分解方法剔除季節因素后[4],再利用非平穩時間序列模型進行預測分析能得到更好的預測結果[5];神經網絡由于其自身自動學習數據特征、靈活考慮多種因素等特點[6-8],能充分考慮影響價格的多種因素,如種植面積、產量及自然災害等因素,也被廣泛應用于農產品價格預測[9]。組合模型方面,組合模型能夠滿足對預測精度進一步提高的要求[10-12],能夠預測序列波動趨勢[13-15],為防止特征項冗余,將多個特性項進行特征提取后,利用模型進行預測也能得到較好預測結果[16,17];利用機器學習模型對預測結果誤差進行分析[18],對預測精度也有所改善[19]。綜上組合模型研究結果發現,組合模型在農產品價格預測方面具有顯著性優勢。預測模型方面,學者們主要從兩方面對LSTM神經網絡模型開展了研究,一是使用LSTM模型對價格進行預測[20,21],利用改進和優化后的LSTM來提高預測精度[22-24]。二是采用與LSTM相結合的組合模型進行價格預測也能達到很好的效果[25,26],其中LSTM-BP與LSTM-RNN組合模式被廣泛應用于趨勢預測、特征信息融合及語義分類等[27],此類組合模型在趨勢預測方面未充分考慮數據的時間序列特性,以及特征項冗余問題對趨勢預測的影響。
本文擬采用能夠提取價格序列特征信息的GARCH族模型與LSTM組合模型,以提高蘋果價格預測精度。為避免數據特征的過度擬合,本文擬采用客觀賦權的熵值法對GARCH族進行成分提取,利用LSTM進行預測分析,并分析時間序列特征對數據的影響。最后基于LSTM與GARCH族組合模型對蘋果價格進行預測,并分析驗證預測結果的準確性。
本研究使用的數據源自中華人民共和國商務部創辦的全國農產品商務信息公共服務平臺,選取山東濟南市堤口果品批發市場、山東德州市黑馬農副產品批發市場、山東青島市城陽蔬菜水產品批發市場、山東威海市農副產品批發市場、山東壽光市農產品物流園五大市場富士蘋果平均日批發價格,單位為元/kg,選取區間為2014年1月1日—2020年12月31日。
1.2.1 GARCH族模型GARCH模型。廣義自回歸條件異方差(GARCH)模型能夠較好地解決蘋果價格序列在市場震蕩期內波動較劇烈而在市場穩定期內波動較小的異方差現象。均值方程、μ波動方程、條件方差方程如公式(1)、(2)、(3)所示。式中為解釋變量向量,為解釋變量前的系數向量,μ為擾動項,ε為獨立同分布,α為ARCH項系數,β為GARCH項系數。



TGARCH模型。該模型均值方程與GARCH模型相同,以TARCH(1,1)模型為例,該模型中的條件方差如公式(4)所示,其中,當均值方程中的μ<0時,其值為1,否則其值為0;若1*≠0則存在非對稱效應。式中d1為虛擬變量,1*μ-12d-1為非對稱效應項。





1.2.2 長短期記憶模型長短期記憶模型LSTM是一種時間遞歸神經網絡,能解決RNN的梯度消失和梯度爆炸問題,能夠用來預測特征間隔長、延遲長的價格數據[23]。LSTM的核心思想是門控邏輯,內部結構如圖1所示。LSTM由遺忘門、輸入門、輸出門組成,其中遺忘門通過sigmoid函數取舍,決定對前一時刻狀態的遺忘程度,如公式(7)所示,其中,f介于0與1之間,式中h1為輸出變量,X為輸入變量,U、W為變量的權重,b為截距項,為sigmoid函數。



公式(9)中輸出門根據激活函數確定輸出變量,并利用激勵函數處理細胞狀態。

LSTM是由記憶塊而不是神經元組成的,通過一個存儲單元和三個控制門使得LSTM能夠更好地選擇數據并學習,對時間間隔長的有效的歷史信息形成記憶。隨著信息量的增加,LSTM模型能夠可以有效地學習預測已實現的價格波動所需的特征,讓價格數據中的關鍵信息進行有效的更新和傳遞,能更好地捕捉蘋果市場價格波動規律,從而提高對蘋果市場價格的預測準確性。

圖 1 LSTM模型結構
1.2.3 熵值法熵值法是一種客觀賦權方法,它通過計算各GARCH項系數的信息熵,根據各項系數的相對變化程度對蘋果價格整體的影響來決定各項系數的權重,例如,相對變化程度大的GARCH項系數具有較大的權重,指標的信息熵值與權重分別如公式(10)、(11)所示,式中為指標信息熵值,為信息效用值。


1.2.4 GARCH-LSTM組合模型在預測數據精度上,深度學習與GARCH族模型各有特點。將含有序列信息的GARCH族模型系數加入到LSTM模型的輸入層中,利用LSTM模型能夠預測特征間隔長、延遲長的數據等優點來學習序列特征,提高模型預測性能。并通過熵值法將多個GARCH項系數進行數據降維后的系數。GARCH項系數表示波動持續性以及波動沖擊大小,TGARCH項系數代表沖擊的非對稱性,EGARCH項系數代表杠桿效應,PGARCH項系數代表靈活的非對稱沖擊性。
蘋果價格數據呈現出尖峰后尾現象,根據JB統計量<0.05說明分布不同于正態分布,可以假設時間序列存在依賴性或異質性,通過ARCH-LM檢驗結果表明,滯后3期的蘋果價格序列存在ARCH效應。進行ADF的單位根檢驗,結果表明價格序列一階差分平穩。圖2為樣本期內蘋果價格對數波動率,直觀地反映了價格波動的集聚性問題。運行基于蘋果價格數據的GARCH模型,誤差分布選擇學生t分布,以GARCH(p,q,r)模型為例,其中1≤≤3且1≤≤2且0≤≤,根據AIC、SC、HQ準則在15種GARCH(,,)模型中選取最優GARCH模型,得出GARCH項,TGARCH、EGARCH、PGARCH模型選取規則相同。

圖 2 蘋果價格對數波動率


2.2.1 單一模型首先生成了一個單獨LSTM模型。本文收集50個蘋果價格數據來預測下一日的價格,實驗在LSTM模型中使用了五個隱藏層,其中,三個LSTM層以及兩個全連接層,三個LSTM層的隱藏節點數分別為20、15和10,兩個全連接層包含的隱藏節點數分別是5和1。為了防止過擬合,在三個LSTM層中加入了dropout函數,分別設置為0.3、0.8、0.8。本文將10%樣本數據設為驗證區間。模型的輸入層變量如表1所示。
2.2.2 雙模型將LSTM分別與GARCH(LSTM-G)、TGARCH(LSTM-T)、EGARCH(LSTM-E)、PGARCH (LSTM-P)相結合,把GARCH族模型中的GARCH參數加入到LSTM的輸入層進行預測。
2.2.3 三模型將LSTM與兩個GARCH模型組合成LSTM-GT、LSTM-GE、LSTM-GP、LSTM-TE、LSTM-TP、LSTM-EP模型,分別用三模型對價格數據進行預測。
2.2.4 四模型將LSTM與三個GARCH模型合成一個組合模型,分別為LSTM-GTE、LSTM-GEP、LSTM-TEP,分別用四模型對價格數據進行預測。
2.2.5 GARCH族組合模型利用四個GARCH族模型與LSTM組合(LSTM-GETP)來預測蘋果價格。
2.2.6 組合熵值模型利用熵值法(Entropy Method)將GARCH、TGARCH、EGARCH、PGARCH四個模型的GARCH項進行數據降維,擬合為一個指標,與LSTM組合(LSTM-E-G)進行價格預測。
2.2.7 模型預測性能對比

表1 模型中的輸入層變量
根據損失函數值評估模型預測性能,結果如表2所示。

表2 模型損失函數比較
2.3.1 單一模型 比較各模型的損失函數發現,損失函數MAE為0.3557,說明深度學習模型對蘋果價格波動有良好的預測性能。
2.3.2 雙模型結合LSTM的單一GARCH類模型預測性能優于單一的LSTM模型,因捕捉到蘋果價格的波動沖擊大小、波動持久性、波動方向以及杠桿效應等經濟特征信息,LSTM-G對比LSTM損失函數HMAE從0.0577降低到0.0509。LSTM-T加入了TGARCH模型的系數,加入一個非對稱性附加項來解釋非對稱沖擊影響,使損失函數MAE從0.3557降低到0.3321。LSTM-E加入了EGARCH模型的系數,其中加入杠桿系數能夠捕捉到蘋果市場的杠桿效應,使損失函數HMSE從0.0053降低到0.0037。LSTM-P加入了PGARCH模型的系數,增強了時間序列非對稱波動的靈活性,使損失函數MSE從0.1930降低到0.1661。對比發現,加入序列特征項能夠提高模型預測性能,其中,加入了杠桿系數的的LSTM-E模型為雙模型中的最優模型,說明杠桿效應對蘋果價格影響較大。
2.3.3 三模型結合LSTM的兩個GARCH類模型預測性能較優于雙模型,LSTM-TE的損失函數MAE最小為0.2979,在三模型里最優,說明加入非對稱沖擊的杠桿系數后預測結果較好。
2.3.4 四模型四模型的預測精度接近三模型,但預測精度略低于雙模型與三模型,說明并不是輸入越多GARCH族系數模型越優。
2.3.5 GARCH族組合模型LSTM結合四個GARCH族模型的LSTM-GTEP組合模型預測性能是最優的,對比損失函數MAE,LSTM-GTEP模型損失函數低至0.2945。
2.3.6 組合熵值模型將多項GARCH系數擬合為一項系數后結合LSTM進行蘋果價格預測的結果優于單模型LSTM,對比損失函數MAE可以發現,LSTM-E-G優于LSTM-T、LSTM-P、LSTM-GE、LSTM-EP、LSTM-TEP模型,但預測精度低于LSTM-GTEP組合模型。
2.3.7 模型預測性能對比對比以上17個模型的預測結果,可以發現,組合模型的預測精度普遍高于單一模型,并且LSTM-GTEP組合模型預測性能是最優的,說明預測條件中加入波動聚集性和波動持續性的條件異方差、非對稱波動性、杠桿效應以及增強非對稱波動靈活性等特性,模型的預測性能得到了顯著提升。將單模型、雙模型、三模型、四模型以及熵值模型的損失函數均值對比LSTM-GTEP模型損失函數,從圖3可以看出不同模型個數的組合模型的MAE、MSE、HMAE、HMSE四類損失函數均值。根據MAE損失函數發現,單模型LSTM預測比模型LSTM-GTEP預測的精度降低20.79%,損失百分比最高,其中熵值模型損失對比LSTM-GTEP最低占比2.41%。加入GARCH族的其他預測模型的損失精度較為接近。以上結論證明,考慮蘋果價格的時間序列特性有助于提高預測精度,同時從圖4中根據真實值、單模型分別對比雙模型、三模型、四模型中的最優模型以及熵值模型的100條預測結果,可以發現,組合模型的預測能力更強。

圖 3 不同模型個數的組合模型損失函數均值
分別對含有GARCH項、TGARCH項、EGARCH項、PGARCH項的組合模型損失函數均值,以及單模型與熵值模型的損失函數值進行比較,圖5以損失函數MAE值為參考標準,對不同類別的組合模型MAE均值進行可視化展示,可以發現,含有GARCH族的組合模型以及熵值模型優于單LSTM模型。在含有GARCH族的組合模型中,含有TGARCH項的組合模型整體最優,損失函數最小為0.3176,其次為GARCH項的組合模型較優,損失函數為0.3189,說明未來蘋果價格受非對稱波動的影響最大,其次受波動聚集、波動持續的影響較大。
根據上述對蘋果價格預測方法的研究,LSTM與GARCH族的組合模型LSTM-GTEP預測精度較高。基于此,利用組合模型預測2021年1月1日到2021年1月30日的蘋果價格,驗證組合模型的預測能力。通過LSTM-GTEP組合模型預測30 d蘋果價格的損失函數MAE為0.2598,低于單模型LSTM預測價格的損失函數MAE的0.3296。從圖6預測結果中可以發現,LSTM-GTEP預測數值在真實值附近波動,預測趨勢與真實價格數據波動趨勢相符,這進一步驗證了基于LSTM與GARCH族的組合模型LSTM-GTEP對蘋果價格預測的有效性。

圖 4 預測結果對比

圖 5 不同類別的組合模型損失函數MAE均值

圖 6 LSTM、LSTM-GTEP預測30 d蘋果價格對比
通過GARCH族模型可以獲得價格時間序列的經濟特征信息,如波動聚集性、波動持續性、非對稱性以及杠桿效應等特性,以及LSTM模型的自身學習數據特征的特性,本文提出了一種將深度神經網絡與計量經濟模型相結合的新方法,結合兩模型優勢提高價格預測精度。實驗分析表明,(1)在17個預測模型中,加入波動聚集性、波動持續性、非對稱波動性、杠桿效應以及增強非對稱波動靈活性等特性的LSTM-GTEP組合模型預測性能最優。(2)含有非對稱波動效應的TGARCH項的組合模型整體最優,其次為含有波動聚集、波動持續效應的GARCH項的組合模型。
本文在現有價格預測基礎上,通過增添數據序列的聚集性、波動特性及非對稱性,進一步提高了價格的預測精度。由于價格數據受多種因素影響,如蘋果的種植面積、國家政策、進出口貿易、蘋果替代水果的價格變動等,眾多因素共同對蘋果價格波動產生影響,下一步的工作將增加影響因素的輸入維度,進一步提高蘋果價格的預測精度。
[1] 劉峰,王儒敬,李傳席.ARIMA模型在農產品價格預測中的應用[J].計算機工程與應用,2009,45(25):238-239,248
[2] Jadhav V, Chinnappa RB, Gaddi G. Application of ARIMA model for forecasting agricultural prices [J]. Journal of Agricultural Science and Technology, 2017,9(4):981-992
[3] Nyoni T. Modeling and forecasting inflation in Kenya: Recent insights from ARIMA and GARCH analysis [J]. Dimorian Review, 2018,5(6):16-40
[4] 劉雪,劉錦濤,李佳利,等.基于季節分解和長短期記憶的北京市雞蛋價格預測[J].農業工程學報,2020,36(9):331-340
[5] Xiong T, Li C, Bao Y. Seasonal forecasting of agricultural commodity price using a hybrid STL and ELM method: Evidence from the vegetable market in China [J]. Neurocomputing, 2018,275:2831-2844
[6] Zhang D, Zang G, Li J,. Prediction of soybean price in China using QR-RBF neural network model [J]. Computers and electronics in agriculture, 2018,154:10-17
[7] Namin SS, Namin AS. Forecasting economic and financial time series: Arima vs. LSTM [J]. Machine Learning, 2018:1-19
[8] Kurumatani K. Time series forecasting of agricultural product prices based on recurrent neural networks and its evaluation method [J]. SN Applied Sciences, 2020,2(8):1-17
[9] 劉斌,何進榮,李遠成,等.基于分布式神經網絡的蘋果價格預測方法[J].計算機應用,2020,40(2):369-374
[10] Abidoye RB, Chan AP, Abidoye FA. Predicting property price index using artificial intelligence techniques [J]. International journal of housing markets and analysis, 2019,12(6),1072-1092
[11] Airlangga G, Rachmat A, Lapihu D. Comparison of exponential smoothing and neural network method to forecast rice production in Indonesia [J].Telkomnika, 2019,17(3):1367-1375
[12] 崔文喆,李寶毅,于德勝.基于GARCH模型和BP神經網絡模型的股票價格預測實證分析[J].天津師范大學學報(自 然科學版),2019,39(5):30-34
[13] 劉雪,李亞妹,劉嬌,等.基于BP神經網絡的鮮雞蛋貨架期預測模型[J].農業機械學報,2015,46(10):328-334
[14] Chuentawat R, Loetyingyot S. Determination of artificial neural network structure with autoregressive form of arima and genetic algorithm to forecast monthly paddy prices in Thailand [J]. International Journal of Intelligent Systems and Applications, 2019,11(3):22
[15] Büyük?ahin ü?, Ertekin ?. Improving forecasting accuracy of time series data using a new ARIMA-ANN hybrid method and empirical mode decomposition [J]. Neurocomputing, 2019,361:151-163
[16] 于卓熙,秦璐,趙志文,等.基于主成分分析與廣義回歸神經網絡的股票價格預測[J].統計與決策,2018,34(18):168-171
[17] Jianwei E, Ye J, Jin H. A novel hybrid model on the prediction of time series and its application for the gold price analysis and forecasting [J]. Physica A: Statistical Mechanics and its Applications, 2019,527:121454
[18] Domingos SDO, de Oliveira JF, de Mattos Neto PS. An intelligent hybridization of ARIMA with machine learning models for time series forecasting [J]. Knowledge-Based Systems, 2019,175:72-86
[19] Wang B, Liu P, Chao Z,. Research on hybrid model of garlic short-term price forecasting based on big data [J]. CMC: Comput. Mater. Continua, 2018,57(2):283-296
[20] Shin S, Lee M, Song SK. A Prediction model for agricultural products price with LSTM network [J]. The Journal of the Korea Contents Association, 2018,18(11):416-429
[21] 賈寧,鄭純軍.基于LSTM-DA神經網絡的農產品價格指數短期預測模型[J].計算機科學,2019,46(S2):62-65,71
[22] Peng L, Liu S, Liu R,. Effective long short-term memory with differential evolution algorithm for electricity price prediction [J]. Energy, 2018,162:1301-1314
[23] Yang B, Sun S, Li J,. Traffic flow prediction using LSTM with feature enhancement [J]. Neurocomputing, 2019,332:320-327
[24] 宋剛,張云峰,包芳勛,等.基于粒子群優化LSTM的股票預測模型[J].北京航空航天大學學報,2019,45(12):2533-2542
[25] Alameer Z, Fathalla A, Li K,. Multistep-ahead forecasting of coal prices using a hybrid deep learning model [J]. Resources Policy, 2020,65:101588
[26] Niu H, Xu K, Wang W. A hybrid stock price index forecasting model based on variational mode decomposition and LSTM network [J]. Applied Intelligence, 2020,50(12):4296-4309
[27] 翟社平,楊媛媛,邱程,等.基于注意力機制Bi-LSTM算法的雙語文本情感分析[J].計算機應用與軟件,2019,36(12):251-255
Predictive Analysis of Apple Price Based on the Model Combining LSTM and GARCH family
WANG Xiao-lei1, ZHANG Yan1, LIU Ping-zeng1, WEN Fu-jiang1, REN Wan-ming2, ZHENG Yong2, WANG Gang3, YAN Bin3
1. College of Information Science and Engineering/Shandong Agricultural University, Tai'an 271018, China 2. Shandong Modern Agriculture and Rural Development Research Center, Jinan 250100, China 3.Dezhou Lingcheng District Agriculture and Rural Bureau, Dezhou 253500, China
In order to improve precision of apple price prediction. We proposed a new method combining deep neural network with econometric model to put the self-learning characteristics of LSTM model and economic characteristic mining ability of GARCH family to good use. And studied to build a combination model of long - short - term memory model (LSTM) and GARCH family model. We compared and analyzed the prediction performance of several combination models and the results showed that: (1) The combination model of LSTM and GARCH family (LSTM-GTEP) with the characteristics of volatility aggregation, volatility persistence, asymmetric volatility, leverage effect and enhancement of the flexibility of asymmetric volatility has the best prediction performance. (2) Compared with the mean loss functions of the combined models with GARCH, TGARCH, EGARCH and PGARCH, we found that the combination model of TGARCH with asymmetric wave effect is the best in general. And the second is a GARCH combination model with volatility aggregation and volatility persistence effect. And at last, we predicted apple price based on the best performance model of the combination models. And proved the effectiveness of the combination models.
Apple; price prediction; model
TP3-05
A
1000-2324(2021)06-1055-08
2021-04-26
2021-05-10
山東省農業重大應用技術創新項目(SD2019ZZ019);2019年度山東省重點研發計劃(公益類專項)項目(2019GNC106103);山東省科技特派員項目(2020KJTPY078);山東省重大科技創新工程項目(2019JZZY010713)
王曉蕾(1995-),女,碩士研究生,主研領域:農業大數據. E-mail:wangxl4015@163.com
通訊作者:Author for correspondence. E-mail:zhangyandxy@sdau.edu.cn