



摘要:針對生豬價格波動過于劇烈難以預測的問題,提出基于奇異譜分解的LSTM-ARIMA組合模型對生豬價格進行預測。以2000年1月—2021年12月的月度價格數據作為樣本,利用奇異譜分析對生豬價格數據進行分解,得到趨勢項和波動項,選用累計貢獻率達前70%的構建趨勢項,剩下的30%構造波動項。趨勢項非平穩且具有長記憶性,對其建立LSTM模型;波動項平穩,對其建立ARIMA模型,最后將兩部分預測結果重組作為生豬價格的預測值,構建LSTM-ARIMA組合預測模型。將預測值和生豬真實價格進行對比,結果表明:預測值與真實值之間的均方根誤差RMSE為2.75,平均絕對百分比誤差MAPE為10.81%,平均絕對誤差MAE為2.27,方向對稱性DS為81.81;此組合模型能很好地預測生豬價格走勢,對我國生豬價格預測具有更高地適用性與參考。
關鍵詞:生豬價格預測;奇異譜分析;組合模型;LSTM;ARIMA
中圖分類號:F323.7
文獻標識碼:A
文章編號:2095-5553 (2024) 05-0176-07
收稿日期:2022年6月12日" 修回日期:2022年8月10日*基金項目:國家自然科學基金(72363019)
第一作者:付蓮蓮,女,1981年生,江西九江人,博士,教授,碩導;研究方向為生豬價格波動與預測。E-mail:" fulianhappy@163.com
Forecasting of pig price fluctuation based on SSA and LSTM-ARIMA combination model
Fu Lianlian, Fang Qing, Yuan Dongyu, Teng Jiamin
(School of Computer and Information Engineering, Jiangxi Agricultural University, Nanchang, 330045, China)
Abstract:
Aiming at the problem that the fluctuation of pig price is too violent and difficult to predict, a LSTM-ARIMA combination model based on singular spectrum decomposition is proposed to predict pig price. Taking the monthly price data from January 2000 to December 2021 as a sample, the pig price data is decomposed by singular spectrum analysis to obtain the trend term and fluctuation term. The trend term with the cumulative contribution rate of the first 70% is selected to construct the trend term, and the remaining 30% is used to construct the fluctuation term. The trend item is non-stationary and has long memory, and the LSTM model is established. The fluctuation term is stable, and the ARIMA model is established. Finally, the prediction results of the two parts are recombined as the prediction value of pig price, and the LSTM-ARIMA combined prediction model is constructed. The results show that the RMSE between the predicted value and the real value is 2.75, MAPE is 10.81%, MAE is 2.27 and DS is 81.81. This combined model can well predict the price trend of newborn pigs, and has higher applicability and reference value for the prediction of pig prices in China.
Keywords:
forecast of pig price; singular spectrum analysis; combination model; LSTM; ARIMA
0 引言
中國是世界上最大的豬肉生產國和消費國,豬肉消費在我國肉類消費中占據了居民消費總量的60%以上。2021年以來,豬肉價格在新冠肺炎疫情和非洲豬瘟的雙重影響下,又經歷了一次“過山車”似的波動。2021年全國平均生豬價格為20.78元/kg,同比下降38.58%[1]。對生豬價格進行準確預測可以給農戶未來的生產養殖提供參考,方便生豬產業鏈上各主體及時采取措施盡可能地減少波動帶來的損失。
目前,國內外對生豬價格的預測方法較為多樣,從多元線性回歸、向量自回歸模型到ARIMA時間序列和SVM、神經網絡等機器學習模型,再到現在趨于復雜的組合模型[2]。Kurumatani[3]用遞歸的神經網絡模型對農產品價格進行了預測,精度較高,方法的優點是訓練所需的時間序列長度足夠短。劉怡然等[4]采用螢火蟲算法對長短時記憶神經網絡進行參數優化,解決了生豬價格序列在時間軸上的遲滯問題。王澤鵬等[5]將改進網絡結構的時間卷積網絡(TCN)模型方法和RFR、XGBoost、LightGBM三種機器學習模型對比,對西南地區某省的生豬價格進行預測,結果顯示TCN模型預測結果更為精確。
國內學者以BP神經網絡、LSTM和ARIMA等模型為基礎構建組合模型來進行預測[6],得出LSTM在故障時間序列預測中具有很強的適應性和更高的準確性[7, 8]。在預測時間序列數據時ARIMA模型被較多使用,已經用在新鮮蔬菜、糧食等農產品價格預測上[9-11]。對于時間序列數據上下波動過于劇烈時難以預測的問題沒有得到很好的解決[12],主要原因在于時間序列數據有波動、趨勢和不規則成分,不進行分解而直接進行預測,則會影響預測精度。引發本文的思考:是否可以將原始序列分解,再與其他模型重構組合的方法對生豬價格進行預測以此增加結果的精確性。
奇異譜分析(SSA)是一種處理非線性時間序列數據的方法,它能夠從原始時間序列中分解出趨勢、振蕩分量和噪聲等幾個獨立的、具有某種規律的子序列,然后根據子序列建立對應的模型,以此來降低模型的復雜度并提高模型的預測精確度[13-16],有學者將奇異譜分析法(SSA)與長短時記憶網絡(LSTM)組合,證實了分解后的組合模型精度較高[17]。
生豬價格受季節、周期、貨幣、外部沖擊等多種因素的影響,具有顯著的趨勢性、隨機性和周期性[18]。在趨勢、隨機和波動特征明顯的時間序列數據的預測研究上,需要運用合適的分解方法分解出價格的不同成分,對各成分進行預測,之后再整合成最終的預測結果。僅僅運用單一模型對其進行預測,對存在趨勢、隨機和周期性的生豬價格預測存在較大的局限性。鑒于此,首先進行奇異譜分析,根據累計貢獻率將生豬價格數據分解為趨勢項和波動項構造出新的時間序列,再對這兩個子序列根據序列特征分別采用合適的模型進行預測,最后,將兩部分預測結果重組,完成對生豬價格的LSTM-ARIMA預測。
1 研究方法
1.1 奇異譜分析
奇異譜分析(SSA)方法是Colebrook在1978年提出的,它基于構造在時間序列上的特定矩陣的奇異值分解(SVD),可以從一個時間序列中分解出趨勢、振蕩分量和噪聲。它具有廣泛的適用性,分析時間序列時,既不用假設參數模型,也不需要假設平穩性條件。俞肇元等[15]證明了奇異譜分析是提取不同周期分量最有效方法之一。
對于生豬價格時間序列{y1,y2,…,yT},首先選擇合適的窗口長度K,將其進行滯后排列,如式(1)所示。
3 結論
由于生豬價格具有非線性、非平穩特征,本文利用奇異譜分析的分解能力,根據特定的累計貢獻率將生豬價格數據分解成波動項與趨勢項。利用LSTM模型適合預測平滑與具有長記憶性的數據的特性對趨勢項進行建模,利用ARIMA模型適合預測平穩時間序列的數據的特性對波動項進行建模,最后將兩組模型的預測值相加得出最終預測值。
1)" 預測值與真實值對比顯示,除6月、7月和11月、12月的價格波動趨勢存在不同,其余月份均與實際趨勢一致,說明該組合模型對波動突然劇烈變大的時間序列預測可以得出較為有效的結果。
2)" 選定RMSE、MAPE、MAE和DS四個指標對模型的性能進行檢測,與真實值對比顯示,12個月的RMSE為2.75,MAPE為10.81%,MAE為2.27,組合模型的預測精度較好。
3)" 12個月的DS值為81.81,說明組合模型預測實際數據的走勢方向精度很高,基于奇異譜分析的LSTM-ARIMA模型對生豬價格的預測效果較好。
與國內大部分研究不同的是,本文并沒有直接對原始時間序列直接進行總體的預測,而是使用奇異譜分析將原序列分解,再根據子序列的特征選取合適的模型進行預測分析,得出精度更優的預測結果,驗證奇異譜分析與LSMT模型和ARIMA模型的組合在價格預測中的適用性,拓寬奇異譜分析的運用領域。但需要指出的是,采用奇異譜分析得出結果時可將累計貢獻率的分配進行調整,選擇預測結果更好的貢獻率累計來進行模型組合。數據合理分配有利于得出更好的結果。LSTM模型參數眾多,參數的選擇會直接影響模型的預測結果,因此,下一步對LSTM模型的運行機制和參數運用數學優化算法進行優化。
參 考 文 獻
[1] 楊侗瑨, 王祖力, 劉小紅, 等. 2021年中國生豬產業發展情況及2022年趨勢[J]. 中國豬業, 2022, 17(1): 19-24.
[2] 丁琳琳, 孟軍. 兩種模型對中國生豬價格預測效果的比較[J]. 統計與決策, 2012(4): 74-76.
[3] Kurumatani K. Time series forecasting of agricultural product prices based on recurrent neural networks and its evaluation method [J]. SN Applied Sciences, 2020, 2(8): 1434.
[4] 劉怡然, 王東杰, 鄧雪峰, 等. 基于長短時記憶神經網絡的生豬價格預測模型[J]. 江蘇大學學報(自然科學版), 2021, 42 (2): 190-197.
Liu Yiran, Wang Dongjie, Deng Xuefeng, et al. Prediction method of hog price based on long short term memory network model [J]. Journal of Jiangsu University (Natural Science Edition), 2021, 42(2): 190-197.
[5] 王澤鵬, 陳曉燕, 龐濤, 等. 一種基于改進時間卷積網絡的生豬價格預測方法[J]. 中國農業大學學報, 2021, 26(12): 137-144.
Wang Zepeng, Chen Xiaoyan, Pang Tao, et al. A hog price prediction method based on improved temporal convolutional network [J]. Journal of China Agricultural University, 2021, 26(12): 137-144.
[6] 王鑫, 吳際, 劉超, 等. 基于LSTM循環神經網絡的故障時間序列預測[J]. 北京航空航天大學學報, 2018, 44(4): 772-784.
Wang Xin, Wu Ji, Liu Chao, et al. Exploring LSTM based recurrent neural network for failure time series prediction [J]. Journal of Beijing University of Aeronautics and Astronautics, 2018, 44(4): 772-784.
[7] 李靜, 徐路路. 基于機器學習算法的研究熱點趨勢預測模型對比與分析——BP神經網絡、支持向量機與LSTM模型[J]. 現代情報, 2019, 39(4): 23-33.
Li Jing, Xu Lulu. Comparison and analysis of research trend prediction models based on machine learning algorithm: BP neural network, support vector machine and LSTM model [J]. Journal of Modern Information, 2019, 39(4): 23-33.
[8] 胡劍波, 羅志鵬, 李峰. “碳達峰”目標下中國碳排放強度預測——基于LSTM和ARIMA-BP模型的分析[J]. 財經科學, 2022(2): 89-101.
Hu Jianbo, Luo Zhipeng, Li Feng. Prediction of China’s carbon emission intensity under the goal of carbon peak: Analysis based on LSTM and ARIMA-BP model [J]. Finance amp; Economics, 2022(2): 89-101.
[9] 劉峰, 王儒敬, 李傳席. ARIMA模型在農產品價格預測中的應用[J]. 計算機工程與應用, 2009, 45(25): 238-239.
Liu Feng, Wang Rujing, Li Chuanxi. Application of ARIMA model in forecasting agricultural product price [J]. Computer Engineering and Applications, 2009, 45(25): 238-239.
[10] 翟靜, 曹俊. 基于時間序列ARIMA與BP神經網絡的組合預測模型[J]. 統計與決策, 2016(4): 29-32.
[11] 彭紅星, 鄭楷航, 黃國彬, 等. 基于BP、LSTM和ARIMA模型的蔬菜價格預測[J]. 中國農機化學報, 2020, 41(4): 193-199.
Peng Hongxing, Zheng Kaihang, Huang Guobin, et al. Vegetable price prediction based on BP, LSTM and ARIMA models [J]. Journal of Chinese Agricultural Mechanization, 2020, 41(4): 193-199.
[12] Jannah M, Sadik K, Afendi F M. Study of forecasting method for agricultural products using hybrid ANN-GARCH approach [J]. Journal of Physics: Conference Series, 2021, 1863(1): 12052-12056.
[13] 梁小珍, 郭戰坤, 張倩文, 等. 基于奇異譜分析的航空客運需求分析與分解集成預測模型[J]. 系統工程理論與實踐, 2020, 40(7): 1844-1855.
Liang Xiaozhen, Guo Zhankun, Zhang Qianwen, et al. An analysis and decomposition ensemble prediction model for air passenger demand based on singular spectrum analysis [J]. Systems Engineering Theory amp; Practice, 2020, 40(7): 1844-1855.
[14] 王勇, 劉瑩, 張娜. 基于奇異譜分析的旅游人數集成預測模型的研究與應用: 以中國為例[J]. 系統科學與數學, 2020, 40(9): 1628-1643.
Wang Yong, Liu Ying, Zhang Na. Research and application of integrated forecast model for number of tourists based on singular spectrum analysis: A case study of China [J]. Journal of Systems Science and Mathematical Sciences, 2020, 40(9): 1628-1643.
[15] 俞肇元, 袁林旺, 謝志仁, 等. 基于時間序列分解的海面變化預測[J]. 南京師大學報(自然科學版), 2007(1): 117-121.
Yu Zhaoyuan, Yuan Linwang, Xie Zhiren, et al. Sea level prediction based on time series model [j]. Journal of Nanjing Normal University (Natural Science Edition), 2007(1): 117-121.
[16] 肖白, 肖志峰, 姜卓, 等. 基于降噪自編碼器、奇異譜分析和長短期記憶神經網絡的空間電力負荷態勢感知[J]. 中國電機工程學報, 2021, 41(14): 4858-4867.
Xiao Bai, Xiao Zhifeng, Jiang Zhuo, et al. Spatial load situation awareness based on denoising autoencoder, singular spectrum analysis and long short-term memory neural networks [J]. Proceedings of the CSEE, 2021, 41(14): 4858-4867.
[17] 李麗敏, 張明岳, 溫宗周, 等. 基于奇異譜分析法和長短時記憶網絡組合模型的滑坡位移預測[J]. 信息與控制, 2021, 50(4): 459-469.
Li Limin, Zhang Mingyue, Wen Zongzhou, et al. Landslide displacement prediction based on singular spectrum analysis and a combined long short-term memory neural network model [J]. Information and Control, 2021, 50(4): 459-469.
[18] 付蓮蓮, 羅千峰. 生豬價格波動特征及形成機理的異質性——基于M-K檢驗和協方差分析[J]. 中國農業大學學報, 2018, 23(11): 196-205.
Fu Lianlian, Luo Qianfeng. Heterogeneity of the characteristics and formation mechanism of hog price’s volatility: Based on M-K test and covariance analysis [J]. Journal of China Agricultural University, 2018, 23(11): 196-205.
[19] 雷可為, 陳瑛. 基于BP神經網絡和ARIMA組合模型的中國入境游客量預測[J]. 旅游學刊, 2007(4): 20-25.
Lei Kewei, Chen Ying. Forecast of inbound tourists to China based on BP neural network and ARIMA combined model [J]. Tourism Tribune, 2007(4): 20-25.