999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于信號分解和深度學習的農產品價格預測

2022-03-11 03:16:46王潤周張新生王明虎
農業工程學報 2022年24期
關鍵詞:模型

王潤周,張新生,王明虎

基于信號分解和深度學習的農產品價格預測

王潤周,張新生※,王明虎

(西安建筑科技大學管理學院,西安 710055)

農產品價格的穩定對社會經濟與農業發展有重要意義,但農產品價格的波動具有非平穩、非線性、波動性大的特性,較難精確預測。該研究基于信號分解和深度學習,提出一種分解-重構-提取-關聯-輸出的農產品價格預測模型(CT-BiSeq2seq),并且加入平均氣溫、養殖成本(大豬配合飼料與尿素價格)、群眾關注度等多維度數據來提高模型的預測精度。首先,采用互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)方法把復雜的原始價格序列分解為簡單序列。其次,分析皮爾遜相關系數及分解后的子序列,把原始價格序列重構為高頻項、低頻項、殘差項。再經過時間卷積網絡(Temporal Convolutional Network,TCN)提取重構序列的數據特征。隨后,構建Biseq2seq模型,解碼器引入雙向長短期記憶網絡(Bi-directional Long Short-Term Memory,Bi-LSTM)加強序列數據間的全局關聯。最后,通過解碼器的LSTM網絡輸出預測值。以北京豐臺區批發市場的白條豬肉價格進行實證分析,該研究提出的CT-BiSeq2seq模型的預測性能顯著優于其他價格預測基準模型,在滯后天數為11 d達到最優效果。在其他數據集也有精確和穩定的預測效果,菠菜、蘋果,雞蛋的均方誤差分別為0.627 7、0.463 2、0.552 6元2/kg2,平均絕對誤差分別為0.543 1、0.442 5、0.533 9元/kg,平均絕對百分比誤差分別為3.204 7%、2.236 1%、2.231 4%。同時根據不同數據集的結果發現,價格波動大的農產品適合采用較大的滯后天數,價格波動小的農產品適合采用較小的滯后天數。該模型可以為預測農產品的價格波動提供參考。

農產品;價格預測;互補集合經驗模態分解;時間卷積網絡;雙向序列到序列模型;長短期記憶網絡

0 引 言

中國是農業大國,農產品價格的波動影響著民生以及國民經濟的穩定發展。隨著2019年非洲瘟疫蔓延、國家新環保養殖政策的頒布及2020年新冠疫情的爆發,農產品的非正常價格波動逐漸增多,如截止到2019年9月初大蒜價格已回漲至9.19元/kg,較2004年大蒜批發價格的平均值高出56.29%,出現了“菜比肉貴”的熱議;2020年初豬肉價格相比2019年中旬的價格增長54.11%[1]。非正常的農產品價格波動嚴重影響著人民的生活安定和國家經濟的穩定發展,因此建立精準的農產品價格預測模型,預防突發事件對人民生活的影響,對解決“三農”問題及農業信息化建設具有重要作用。

目前,對農產品價格的預測研究主要分為傳統計量統計方法、人工智能方法及組合模型三類預測方法,且各類方法按時間順序不斷發展。傳統計量模型方法有較扎實的理論基礎,對于不同問題有較強的可解釋性,如回歸分析、向量自回歸(Vector Autoregressive,VAR)、自回歸滑動平均(Autoregressive Moving Average,ARMA)、整合移動平均自回歸(Autoregressive Integrated Moving Average,ARIMA)、廣義自回歸條件異方差(Generalized Autoregressive Conditional Heteroscedasticity,GARCH)等模型早期被廣泛應用于價格預測[2-3],可以準確預測綠豆價格[4]、大豆期貨價格[5]等短時序的農產品價格。隨后,一些傳統計量方法結合不同農產品價格的特點進行改進,使得模型的預測能力隨著歷史數據的豐富逐漸與真實數據趨近[6-7]。以上研究豐富了傳統的價格預測研究,使傳統計量統計方法逐漸形成了系統的時間序列預測模型。然而傳統計量統計方法較難完整表示長時間序列的非平穩、非線性及多尺度特征,在處理非線性問題上有較強的局限性[8]。

機器學習、深度學習等人工智能方法的發展彌補了傳統計量統計方法的不足,可處理較長時序、非線性、非平穩的價格預測問題,常見模型有BP神經網絡(Back Propagation Neural Network)、支持向量機(Support Vector Machine,SVM)、動態神經網絡(Dynamic neural network)、時間卷積網絡(Temporal Convolutional Network,TCN)等[9-12]。相比于傳統計量統計方法,這些模型具有較高的準確率、魯棒性和泛化性,可以更加精準地預測農產品價格。但很難有一種人工智能方法可以解決所有不同預測情境下的問題[13]。一方面,在處理高維度、大數據量的預測問題時,SVM、BP神經網絡等淺層次機器學習算法存在較大局限性,會出現參數的維數災難與無效的特征表示等問題[14]。另一方面,雖然單一模型預測誤差波動較大,總體上隨著預測周期變長精度下降。但在實際預測上,并非所有的人工智能模型都優于傳統統計計量預測方法[15-16]。因此,應根據數據與任務的特點,選擇適合的預測模型。

組合模型通過結合傳統計量統計方法、智能優化算法、人工智能方法的優點,對預測問題設置先驗假設和數據處理,減少學習偏差,較大程度增強預測模型的擬合能力[17]。在研究方法上,學者們逐漸形成了分解-重構-輸出的集成模式[18-23]。首先采用小波分解、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD),奇異譜分析(Singular Spectrum Analysis,SSA)等方法,將原始數據序列分解、簡化,剔除時間序列中的噪聲。隨后通過智能搜索算法、-means聚類方法等進行參數優化與序列重構。最后使用SVM、長短期記憶網絡(Long Short-Term Memory,LSTM)等模型輸出結果。在預測性能上優于大部分單模型方法,顯著提升了預測模型的適用范圍和預測精度[24],因此本文采用組合模型進行農產品價格預測。

綜上,組合模型在價格預測上有著獨特的優勢,但仍然存在不足之處:1)基于SSA、EEMD等分解方法雖然能將復雜信號序列分解成多個簡單序列,更清晰地認識復雜信號里的運動規律和結構,但存在計算量過大、殘余輔助噪聲較大等問題;2)重構后的特征序列缺乏數據間的時間序列關系,且全局關聯度不高,預測容易出現波動;3)當前農產品價格的深度學習預測模型主要采用循環神經網絡(Recurrent Neural Network,RNN)、LSTM等網絡,其輸入步數等于輸出步數,需要經過全連接層壓縮才能輸出預測值,不能實現任意步數的預測,且壓縮過后的值相對獨立,缺乏序列之間的依賴性?;诖?,本文結合信號分解和深度學習,提出一種CT-BiSeq2seq農產品價格預測模型,首先采用互補集合經驗模態分解方法,減少分解時所需的迭代次數,降低序列的噪聲殘余;其次結合皮爾遜相關系數進行序列重構;再加入多維度數據,利用時間卷積網絡TCN提取農產品價格間的時間序列關系;最后構建BiSeq2seq網絡,編碼器引入雙向LSTM網絡,加強數據關聯,解碼器對雙向LSTM的結果進行編譯,實現任意步數的輸出。研究結果以期為多種農產品價格的預測提供參考。

1 基于CT-BiSeq2seq模型的農產品價格預測框架

農產品長期的價格時間序列數據可能蘊含復雜的物理過程或經濟規律,為更清晰地分析農產品價格的變化規律,精準地進行價格預測,本文結合信號分解和深度學習的方法,提出一種CT-BiSeq2seq價格預測模型,在提升精確性、減少數據參數的同時,實現任意步數的輸出。整體框架如圖1所示。

圖1 CT-BiSeq2seq模型框架圖

由圖1可見,CT-BiSeq2seq模型主要包括5個步驟,即分解-重構-提取-關聯-預測。

1)分解:首先對農產品長期的價格序列進行CEEMD分解。將復雜序列表示成多個簡單信號,去除干擾信息,進行定量分析。

2)重構:其次分析皮爾遜相關系數及分解后的IMF序列,重構后得到高頻項、低頻項、殘差項及原價格4組數據特征,分析4組數據之間的關系,并將其作為后續的輸入數據。

3)提?。涸僬卟捎脮r間卷積網絡TCN提取農產品價格的時間序列特征。

4)關聯:隨后提出了改進的BiSeq2seq模型,即在Seq2seq模型的編碼器中引入雙向LSTM網絡(Bi-LSTM)正反向學習序列數據的內容,掌握全局信息的關聯。

5)預測:最后在解碼器部分,采用LSTM網絡實現農產品價格的任意步預測。

2 理論方法

2.1 互補集合經驗模態分解

互補集合經驗模態分解[25](Complementary Ensemble Empirical Mode Decomposition,CEEMD)是一種處理非線性、非平穩信號數據的方法,可將復雜信號分解為多個簡單的信號。其原理是在待分解信號中加入若干組成對的、互為相反數的白噪聲信號,把復雜時間序列信號分解為有限個周期不同的本征模函數(Intrinsic Mode Function,IMF)和一個殘差信號,有效清除信號的噪聲殘余,減少分解時所需的迭代次數[26]。計算過程如下:

2.2 時間卷積網絡

時間卷積網絡(Temporal Convolutional Network,TCN)首先被提出是作為CNN網絡的擴展,用于計算機視覺檢測[27]。其不僅包含傳統CNN的優勢,如局部連接、權值共享,最重要的是包含因果卷積、擴張連接、殘差連接的結構優勢。利用TCN網絡可以挖掘數據在時間維度上的特征并提取出更高維度的關聯。

注:x為輸入的時間序列數據,y為輸出結果,為膨脹系數,為卷積核尺寸。

Note:xis the input time series data,yis the output result,is the dilation coefficient,is the size of convolution kernel.

圖2 時間卷積網絡結構圖

Fig.2 Structure diagram of time convolution network

2.3 雙向序列到序列模型(BiSeq2seq)

序列到序列模型(Sequence to Sequence,Seq2Seq)主要解決循環神經網絡(Recurrent Neural Network,RNN)輸入和輸出長度不配對的問題,多用于文本翻譯、語音生成領域,目前也有學者用于時間序列預測,如空氣質量預測[28]。Seq2seq模型雖然在時間序列問題上有較好的預測效果,但本質上是一種單向提取序列信息的網絡,整個過程容易忽略未來時刻到過去時刻方向的聯系,因此在編碼器引入雙向長短期記憶網絡,解碼器引入長短期記憶網絡來解決此問題,如圖3所示。

注:Xt為編碼器的輸入數據,Ot為編碼器的輸出結果,L為LSTM網絡,Ct,ht分別為正向LSTM網絡的記憶細胞信息與歷史信息,C?t,h?t分別為反向LSTM網絡的記憶細胞信息與歷史信息,ym為解碼器的輸出結果。

Bi-LSTM網絡保留了RNN網絡的重復鏈式結構,由兩個正反方向的LSTM網絡構成[29]。其中LSTM網絡的結構主要由遺忘門、輸入門、記憶細胞狀態、輸出門四部分構成,通過3種門結構來控制細胞狀態傳輸信息。細胞狀態更新的過程類似于傳送帶,在最上部的鏈條運行,整個過程有少量的線性交互。運作過程如圖4所示。

注:Xt為輸入結果,ht為輸出結果,ht-1為歷史信息,Ct為LSTM網絡的記憶細胞信息,ft,it為參數矩陣,為矩陣乘法,⊕為矩陣加法。

3 實例驗證

3.1 試驗環境與原始數據

本文的試驗基于Windows10 64位操作系統,處理器為AMD Ryzen 7 5800H with Radeon Graphics 3.20 GHz,NVIDIA GeForce GTX 3070開啟GPU加速內存16 GB,編程語言采用Python3.8.12。本文基礎試驗數據來自全國農產品商務信息公共服務平臺(新農村商網http://nc.mofcom.gov.cn/jghq/index)。本文以該網站北京豐臺區農產品批發市場白條豬肉為實證對象來研究其價格走勢,以該市場2016年1月1日至2022年2月28日白條豬肉的日均價格為基礎進行實證分析。由于農產品價格受多種因素影響,引入多維度的影響因素有助于提高模型的預測精度。因此本文在對白條豬肉價格進行CEEMD分解與重構后,加入對農產品價格影響較大的因素:北京市每日平均氣溫、肥料價格(大豬配合飼料)、公眾熱度(百度指數)。其中氣溫影響農產品的生長發育;肥料價格在一定程度上影響農產品的產量;公眾熱度從一定程度上反映當農產品價格變化時群眾的情緒,會影響消費者購買意向[30]。引入的3種影響因素數據分別來自于天氣網(https://www.tianqi.com)、全國重點農產品市場信息平臺(http://ncpscxx.moa.gov.cn)、百度指數(https://index.baidu.com)。本試驗對數據中的缺失值、偏差較大值進行線性插值法處理,具體根據其前后價格的均值處理。最終輸入變量的維度為7維,每個維度各得到2 252條價格數據,其價格走勢如圖5a所示,平均氣溫如圖5b所示,肥料價格如圖5c所示,公眾關注度如圖 5d所示。

由圖5a分析可得,2016年1月至2022年2月期間白條豬肉價格波動趨勢很大。整個過程呈現出非線性、非平穩的特點且無明顯的價格變化規律。另外,價格走勢圖中前半部分與后半部分的數據分布差異較大,故難以用常規的線性模型擬合。由圖5b分析可得,氣溫趨勢呈季節性變化,通常在年氣溫較低時,對應價格較高。由圖5c分析可得,肥料的價格呈不斷上漲趨勢,當豬肉價格處于2019年初至2021年出的高價階段,肥料價格也相對較高。由圖5d分析可得,群眾對豬肉價格關注度比較平穩,但因為重大事件的發生會出現較大的峰值,在一定程度影響豬肉價格,例如2019年后半年“非洲豬瘟”發生,群眾對豬肉價格的關注度大幅度增加,一定程度上推進了不理智購買行為,間接導致豬肉價格飆升。

圖5 豬肉價格、氣溫、肥料價格、關注度趨勢圖

3.2 農產品價格序列CEEMD分解及重構

首先將白條豬肉的每日價格進行CEEMD分解,得到數據的多尺度特征。設置白噪聲幅值為0.2(0-1之間,在0.2時效果最優),信號的平均累加次數為50(本試驗在取值50時,得到的IMF序列最多,小于50時分解出的子序列也有較好地效果)。將價格序列數據分解后,得到了10個IMF子序列和1個殘差項,如圖 6示。

由圖6知,每個分解后的IMF序列的振幅、頻率和周期均不相同,且每個IMF序列都有自身的波動特征。從上到下分析分解后的IMF序列可得,周期不斷增大,各序列數據由基本對稱變為不對稱,數據的平均值不斷偏離0,殘差項呈現近似線性上升的趨勢。在第7個IMF序列時,序列圖開始變得不對稱。

通過計算各IMF序列間的皮爾遜相關系數,如表1所示。當在第7個IMF序列時,皮爾遜相關系數開始變化較大,數據明顯偏離0;結合上述分析,故將IMF1~IMF6定為高頻項,IMF7~IMF10定為低頻項。

日期Date

表1 各IMF序列的皮爾遜相關系數

對原始價格序列進行重構,將高頻項IMF1~IMF6的值疊加,低頻項IMF7~IMF10的值疊加,殘差序列保持不變,得到重構后的價格序列圖如圖7所示。

由圖7分析可得,殘差項是影響白條豬肉價格的主要組成部分,反映其價格的內在長期走勢。殘差項主要由供求關系決定;高頻項與原始數據走勢相似并且其IMF序列的均值保持在0附近上下波動。高頻項對總體走勢影響小,代表常規經濟政策改革、期貨炒作、市場供需短暫失衡、國外相關市場變化等引起的短期波動。低頻項波動幅度較大,對原始數據走勢產生很大影響,代表了重大事件對白條豬肉價格的影響,經對比,其波峰、波谷與重大事件基本對應,如2019年非洲豬瘟、規范養殖政策頒布、2020年新冠疫情爆發等事件。

圖7 重構后的價格序列圖

3.3 基于CT-BiSeq2seq模型的農產品價格預測

3.3.1 數據集劃分

數據標準化的操作要在訓練集數據上進行,若包含測試集數據可能會發生數據泄露的問題,將導致預測不準。故把整個數據集劃分為訓練集、驗證集、測試集,考慮數據間的時間序列關系,本文數據集按照時間順序劃分,設定重構后的白條豬肉價格數據的前80%為訓練數據與驗證集,其余20%數據為測試數據,訓練集、驗證集、測試集所占比例分別為6∶2∶2。

由于時間序列問題預測會存在滯后性,本試驗為更好確定解碼器LSTM網絡的預測步數,設計不同滯后天數。依據前人的研究結果[22],當滯后天數在9~13 d時,LSTM模型在農產品價格預測效果較好。為保證模型有更好的擬合能力,本文擴大滯后天數范圍,分別設置滯后天數為3、5、7、9、11、13、15 d。為保證預測精度,后續試驗選擇滯后天數為11 d進行預測,并進行不同滯后天數的對比試驗將在3.4.2節給出。

3.3.2 數據預處理

3.3.3 模型結構

CT-BiSeq2seq預測模型主要包括四個部分:第一部分為CEEMD分解、重構部分,簡化序列數據信號作為輸入層;第二部分,TCN模型提取時間序列的歷史特征;第三部分為BiSeq2seq模型,采用Bi-LSTM網絡為編碼器(Encoder)加強數據間的關聯,第四部分為解碼器(Decoder),由LSTM網絡實現多步輸出。如圖8所示。

試驗設置8層網絡結構,其中第一層為輸入層,把CEEMD分解、重構后的數據轉變為三維向量。第二層為TCN層,提取重構后的數據特征,輸入與輸出數量相等。第三層為Dropout層,本試驗設置Dropout值為0.2,能夠在訓練過程中隨機忽略20%的節點連接,防止過擬合。第四層將提取的數據特征作為輸入數據。輸入數據被傳入到編碼器中的Bi-LSTM網絡,學習了預測價格與其他輸入特征間的非線性關系。第五層在編碼器后使用全局平均池化(Global Average Pooling),減少訓練參數,增加訓練速度。第六層為Repeat Vector層,將解碼器的輸出向量進行復制,形成具有時間步數的向量,防止時間序列數據的關系被分解。第七層為解碼器中的LSTM網絡,實現任意步數的輸出。第八層將編碼器輸出的維度進行壓縮,輸出具體預測值。

圖8 模型結構圖

3.3.4 超參數設置與模型訓練

采用均方誤差(Mean Square Error,MSE)作為模型正向傳播的損失函數,使用在優化預測誤差方面性能較好的Adam算法反向傳播更新權重參數與偏置[31]。同時也采用平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)作為衡量指標。其中MSE是預測值與真實值的絕對平方誤差的平均值,一般用來檢測模型的預測值和真實值之間的偏差。MAE是實際監測值與預測值之間差值的平均值,它可以反映預測值誤差的實際情況。MAPE不僅考慮預測值與真實值的偏差,還考慮了偏差與真實值之間的比例,此指標對相對誤差敏感,不會因目標變量的全局縮放而改變。MSE、MAE與MAPE的值越小,模型的預測精度越高[32]。各衡量指標計算公式如下。

表2 模型訓練的網絡維度

圖9 驗證集與測試集損失

由圖9可得,驗證集經過200個訓練周期后,MSE、MAE、MAPE分別為0.683 7元/kg2、0.554 3元/kg、2.275 6%。測試集經過200個訓練周期后,MSE、MAE、MAPE分別為0.661 1元/kg2、0.501 4元/kg、2.113 8%。驗證集與訓練集的誤差較小,且測試集誤差小于驗證集誤差,證明本模型在測試集有較好的擬合能力。CT-BiSeq2seq預測模型在驗證集上的預測結果如圖10所示,預測值與實際值擬合良好。

3.4 結果及分析

3.4.1 各模型預測對比結果

為保證測試集在不同試驗中有較為一致的結果,在模型訓練前加入隨機數種子,種子值設為1。在測試集與其他基準模型進行對比,采用驗證集的模型超參數,各評價指標、訓練批次、學習率、訓練周期等都保持一致。同時參考相關研究[22],當滯后天數在9~13 d時,LSTM網絡在預測農產品價格時性能較優,因此本試驗采用滯后天數為11 d。為驗證本模型在預測上的優勢,依次與LSTM、Seq2seq、TCN-LSTM、CEEMD-TCN-LSTM、CEEMD-TCN-Seq2seq模型的預測效果進行對比,各模型預測誤差結果如表3所示,預測結果如圖11所示。

圖10 驗證集預測結果

表3 各模型的詳細誤差對比結果

圖11 各模型對比預測結果

結合表3與圖11可得,CT-BiSeq2seq模型的預測誤差明顯低于其他模型。具體分析,LSTM網絡的預測誤差相對較大,在長期預測中主要擬合出變化趨勢,未能擬合出變化細節;Seq2seq模型在進行Encoder和Decoder過程后,預測損失明顯減小,與LSTM的預測損失相比,MSE、MAE、MAPE分別降低4.71%、11.4%、22.6%,這表明Seq2seq模型能夠較好地減小預測誤差,但在預測初期數值波動較大。CEEMD-LSTM模型在進行CEEMD數據分解后減少了數據噪聲,預測誤差持續降低,緩解了預測初期數值波動較大的問題,與LSTM網絡相比MSE、MAE、MAPE分別降低17.91%、25.73%、33.87%。CEEMD-Seq2seq經過編碼器與解碼器計算,較好地保留了數據的時間序列關系,與Seq2seq模型相比MSE、MAE、MAPE分別降低33.53%、40.03%、44.32%,但仍存在較大預測誤差。在加入TCN網絡進行特征提取后,CEEMD- TCN-LSTM模型、CEEMD-TCN-Seq2seq模型的預測誤差呈現大幅度減小。CT-BiSeq2seq模型由于TCN的特征提取能力及解碼器中Bi-LSTM網絡的雙向學習能力,減少了數據遺忘,相比于CEEMD-TCN- Seq2seq模型,MSE降低32.9%,MAE降低28.8%,MAPE降低17.7%,MSE、MAE、MAPE分別為0.657 4 元2/kg2、0.504 6元/kg、2.116 7%。在與各基準模型預測對比中取得了較優的效果。

因此,本文提出的CT-BiSeq2seq預測模型可有效降低了農產品價格序列非平穩、非線性特性帶來的預測誤差,預測值更精準。通過試驗精確預測了測試集未來14個月(2021年12月至2022年2月)的白條豬肉價格,預測趨勢圖與原數據擬合良好。

3.4.2 滯后天數試驗

預測時間序列問題通常會產生滯后性,即后幾天的預測數據會映射出其前幾天數據的特征,因此需要設置合理的滯后天數來進行預測,即用前幾天的價格數據預測后一天的價格,減少預測誤差。為驗證CT-BiSeq2seq模型滯后天數為何值時價格的預測效果達到最優,設置了不同滯后天數的預測試驗,其他參數與驗證集得到的超參數保持一致,試驗結果如表4所示。

表4 不同滯后天數的模型預測結果

由表4可得,滯后天數在9~13 d時,預測誤差范圍較小。滯后天數為11 d時,預測精度最高,MSE,MAE、MAPE值均達到最小,分別為0.657 4元2/kg2,0.504 6元/kg,2.116 7%。當滯后天數為5 d時,預測誤差開始降低,當滯后天數為11 d時,預測誤差達到最小,此后預測誤差又開始增加,但整體的預測誤差較小,說明本模型可較好用于農產品價格預測。這是由于農產品價格多遵循季節性變化規律,若直接設置季節性周期的滯后天數,滯后天數將較大,輸入數據的序列長度會變長。較長的長序列數據在模型運行過程中容易遺忘靠前的序列數據,使得預測結果貼近靠后的序列數據,輸入數據復雜度的提升并沒有帶來預測精度的提升,當滯后天數在13~15 d時損失值已經開始增大。因此拆分季節性周期的長度,縮短滯后天數可以盡可能保證模型學習數據間的規律,于是將滯后天數最大值設為15 d。但滯后天數太小時,模型容易陷入局部最優解,且不能充分學習時間序列的完整特征,當滯后天數處于3~7 d天時,損失值較大,其中3~5 d的損失值(MAE)均接近于1元/kg。最終確定最小滯后天數與最大滯后天數的中間值9~13 d為較為合適的滯后天數。

3.4.3 不同數據集檢測

為了驗證本模型在其他農產品數據集上預測的準確性,選取菠菜、蘋果、雞蛋三類常用農產品的價格數據進行預測,數據來源與3.1節相同,數據集時間范圍取2021年1月1日至2022年2月28日農產品的每日價格,同時輸入這3種數據的CEEMD價格分解數據、公眾關注度、平均氣溫、化肥價格(尿素價格)、農產品價格等7維數據,具體如圖12所示。

圖12 不同農產品輸入數據

將數據集劃分為訓練集、驗證集、測試集,各部分所占比例分別為(6∶2∶2),模型的網絡結構與3.3.4節保持一致,設置學習率分別為0.01、0.001、0.000 1,訓練批次分別為32、64、128,訓練周期為100、150、200,TCN、LSTM與Bi-LSTM的神經元個數按照高維度提取特征的思想分別設為32,64,128。選擇滯后天數11 d。最終尋得較優超參數,當設置訓練的批次大小為32,訓練周期為100,學習率為0.001時損失誤差最小。菠菜、蘋果、雞蛋3種農產品在測試集中的MSE、MAE、MAPE分別如表5所示,驗證集與測試集的預測結果如圖13所示。

表5 不同農產品的預測誤差對比結果

由表5可得,3種農產品的MSE值均不超過0.65,因此本模型在不同種類的農產品價格預測上也有較高的準確性,同時在數據量變小時,預測誤差仍然很低。根據圖13可得,3種農產品的預測值基本接近實際值。具體分析,菠菜預測誤差的MAPE值相對較大。經分析菠菜價格在2021年內的波動較大,蘋果價格與雞蛋價格波動較小,較大的價格波動導致菠菜價格的預測誤差相對較大,蘋果與雞蛋的預測誤差相對較小。

圖13 菠菜、蘋果、雞蛋價格預測結果

由于各農產品價格具有不同的波動特點,因此對滯后天數的選擇需要根據其特點進行設置。本文最后針對菠菜、蘋果、雞蛋3種農產品價格,在超參數不變的情況下,選擇不同的滯后天數進行試驗,結果如表6所示。結果發現菠菜與雞蛋在滯后天數為11 d時預測誤差達到最小,而蘋果在滯后天數為7 d時預測誤差達到最小。具體分析,針對價格波動較大的農產品,采用較大的滯后天數可以更完整的學習價格的變化規律;而對于價格波動較小的農產品,由于其價格前后趨勢變化較小,選擇較小的滯后天數就可以完成訓練。

表6 不同農產品的滯后天數試驗

4 結 論

本文結合信號分解和深度學習,按照分解-重構-提取-關聯-輸出的思想,提出了一種基于CT-BiSeq2seq模型的農產品價格預測方法,并對白條豬肉、菠菜、蘋果、雞蛋價格進行實證分析,得出以下結論。

1)本文提出的預測模型結合信號分解與深度學習的方法,經過分解-重構-提取-關聯-輸出5個步驟,對比其他組合預測模型,可較大幅度提高價格預測的準確性。其評價指標均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)的值在預測白條豬肉價格時分別可達到0.657 4元2/kg2、0.504 6元/kg、2.116 7%均維持在較小范圍。并且在其他農產品數據集上也有較好的預測精度。這為解決農產品的預測問題提供跨學科融合的思路。

2)通過互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)將復雜數據轉化為多個簡單數據,再引入平均氣溫、養殖成本、群眾關注度等數據進行多維度的訓練。CEEMD-LSTM模型的MSE、MAE、MAPE相比于LSTM網絡分別降低17.91%、25.73%、33.87%;CEEMD-Seq2seq模型的MSE、MAE、MAPE相比于Seq2seq模型分別降低33.53%、40.03%、44.32%,預測誤差減小,這證明了數據分解對降低損失誤差的有效性。其中分解的高頻項代表常規事件對整體價格走勢的影響,其對農產品價格的波動影響較小。殘差項反映農產品價格的內在長期走勢,主要由供求關系決定。低頻項代表重大事件對農產品價格走勢的影響,其對農產品價格的波動影響較大。保證殘差項(供求關系)平衡與健全重大事件預警體系對防止農產品價格波動有重大意義。

3)在農產品價格預測中滯后天數的選擇較為關鍵,由本文可得,價格波動大的農產品宜選擇較大的滯后天數,價格波動小的農產品宜選擇較小的滯后天數。

本文提出的CT-BiSeq2seq模型具有良好的預測性能和泛化能力,可以為農產品價格的預測提供參考依據。

[1] 馬宏陽,趙霞. 中國小宗農產品價格波動特征的實證分析—以大蒜為例[J]. 農業技術經濟,2021(6):33-48.

Ma Hongyang, Zhao Xia. An empirical analysis of the price fluctuation characteristics of China's small agricultural products[J]. Journal of Agrotechnical Economics, 2021(6): 33-48. (in Chinese with English abstract)

[2] Weng Y C, Wang X J, Hua J, et al. Forecasting horticultural products price using ARIMA model and neural network based on a large-scale data set collected by web crawler[J]. Ieee Transactions on Computational Social Systems, 2019, 6(3): 547-553.

[3] 張貴生,張信東. 基于微分信息的ARMAD-GARCH股價預測模型[J]. 系統工程理論與實踐,2016,36(5):1136-1145.

Zhang Guisheng, Zhang Xindong. A differential-information based ARMAD-GARCH stock price forecasting model[J]. Systems Engineering-Theory & Practice, 2016, 36(5): 1136-1145. (in Chinese with English abstract)

[4] 劉慧,李寧輝. 我國小宗農產品價格波動趨勢及其預測:以綠豆為例的分析[J]. 價格理論與實踐,2012(6):57-58.

Liu Hui, Li Ninghui. Price fluctuation trend and forecast of small agricultural products in China: Taking mung bean as an example[J]. Price: Theory & Practice, 2012(6): 57-58. (in Chinese with English abstract)

[5] 熊濤,鮑玉昆. 基于動態模型平均的大豆期貨價格預測研究[J]. 中國管理科學,2020,28(5):79-88.

Xiong Tao, Bao Yukong. Soybean future price forecasting based on dynamic model averageing[J]. Chinese Journal of Management Science, 2020, 28(5): 79-88. (in Chinese with English abstract)

[6] 賈寶疆. 中國主要農產品銷售價格預測[J]. 統計與決策,2014(20):100-102.

Jia Baojiang. Sales price forecast of main agricultural products in China[J]. Statistics & Decision, 2014(20): 100-102. (in Chinese with English abstract)

[7] 崔暢,李國偉. 我國農產品價格的結構變化特征及影響因素分析[J]. 數理統計與管理,2019,38(1):1-15.

Cui Chang, Li Guowei. Analysis of structural change characteristics and influencing factors of agricultural product prices[J]. Journal of Applied Statistics and Management, 2019, 38(1): 1-15. (in Chinese with English abstract)

[8] 唐振鵬,吳俊傳,張婷婷,等. 基于二次分解和集成學習的糧食期貨價格預測研究[J]. 系統工程理論與實踐,2021,41(11):2837-2849.

Tang Zhenpeng, Wu Junchuan, Zhang Tingting, et al. Research on grain futures price forecasting based on secondary decomposition and ensemble learning[J]. Systems Engineering-Theory & Practice, 2021, 41(11): 2837-2849. (in Chinese with English abstract)

[9] 孫少杰,吳門新,莊立偉,等. 基于CNN卷積神經網絡和BP神經網絡的冬小麥縣級產量預測[J]. 農業工程學報,2022,38(11):151-160.

Sun Shaojie, Wu Menxin, Zhuang Liwei, et al. Forecasting winter wheat yield at county level using CNN and BP neural networks[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(11): 151-160. (in Chinese with English abstract)

[10] 王瀅藝,徐勝祥,趙永存,等. 基于VNIR和機器學習算法的原狀土剖面Cu含量預測[J]. 農業工程學報,2022,38(7):336-344.

Wang Yingyi, Xu Shengxiang, Zhao Yongcun, et al. Prediction of Cu concentrations in intact soil profiles based on VNIR and machine learning algorithms[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(7): 336-344. (in Chinese with English abstract)

[11] 李哲敏,許世衛,崔利國,等. 基于動態混沌神經網絡的預測研究:以馬鈴薯時間序列價格為例[J]. 系統工程理論與實踐,2015,35(8):2083-2091.

Li Zhemin, Xu Shiwei, Cui Liguo, et al. Prediction study based on dynamic chaotic neural network Taking potato time: series prices as an example[J]. Systems Engineering-Theory & Practice, 2015, 35(8): 2083-2091. (in Chinese with English abstract)

[12] 王澤鵬,陳曉燕,龐濤,等. 一種基于改進時間卷積網絡的生豬價格預測方法[J]. 中國農業大學學報,2021,26(12):137-144.

Wang Zepeng, Chen Xiaoyan, Pang Tao, et al. A hog price prediction method based on improved temporal convolutional network[J]. Journal of China Agricultural University, 2021, 26(12): 137-144. (in Chinese with English abstract)

[13] Sterkenburg T F, Grunwald P D. The no-free-lunch theorems of supervised learning[J]. Synthese, 2021, 199(3/4): 9979-10015.

[14] Gambella C, Ghaddar B, Naoum-Sawaya J. Optimization problems for machine learning: A survey[J]. European Journal Of Operational Research, 2021, 290(3): 807-828.

[15] 劉雙印,黃建德,徐龍琴,等基于PCA-SVR-ARMA的獅頭鵝養殖禽舍氣溫組合預測模型[J]. 農業工程學報,2020,36(11):225-233.

Liu Shuangyin, Huang Jiande, Xu Longqin, et al. Combined model for prediction of air temperature in poultry house for lion-head goose breeding based on PCA-SVR-ARMA[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(11): 225-233. (in Chinese with English abstract)

[16] 徐映梅,陳堯. 季節ARIMA模型與LSTM神經網絡預測的比較[J]. 統計與決策,2021,37(2):46-50.

Xu Yingmei, Chen Yao. Comparison between seasonal ARIMA model and LSTM neural network forecast[J]. Statistics & Decision, 2021, 37(2): 46-50. (in Chinese with English abstract)

[17] 孫少龍,魏云捷,汪壽陽. 基于分解-聚類-集成學習的匯率預測方法[J]. 系統工程理論與實踐,2022,42(3):664-677.

Sun Shaolong, Wei Yunjie, Wang Shouyang. Exchange rates forecasting method with decomposition-clustering-ensemble learning approach[J]. Systems Engineering-Theory & Practice, 2022, 42(3): 664-677. (in Chinese with English abstract)

[18] 歐陽紅兵,黃亢,閆洪舉. 基于LSTM神經網絡的金融時間序列預測[J]. 中國管理科學,2020,28(4):27-35.

Ouyang Hongbin, Huang Kang, Yan Hongju. Prediction of financial time series based on LSTM neural network[J]. Chinese Journal of Management Science, 2020, 28(4): 27-35. (in Chinese with English abstract)

[19] 朱幫助,魏一鳴. 基于GMDH-PSO-LSSVM的國際碳市場價格預測[J]. 系統工程理論與實踐,2011,31(12):2264-2271.

Zhu Bangzhu, Wei Yiming. Carbon price prediction based on integration of GMDH, particle swarm optimization and least squares support vector machines[J]. Systems Engineering-Theory & Practice, 2011, 31(12): 2264-2271. (in Chinese with English abstract)

[20] 王書平,朱艷云. 基于多尺度分析的小麥價格預測研究[J]. 中國管理科學,2016,24(5):85-91.

Wang Shuping, Zhu Yanyun. Forecasting of wheat price based on multi-scale analysis[J]. Chinese Journal of Management Science, 2016, 24(5): 85-91. (in Chinese with English abstract)

[21] 王玨,齊琛,李明芳. 基于SSA-ELM的大宗商品價格預測研究[J]. 系統工程理論與實踐,2017,37(8):2004-2014.

Wang Yu, Qi Chen, Li Mingfang. Prediction of commodity prices based on SSA-ELM[J]. Systems Engineering-Theory & Practice, 2017, 37(8): 2004-2014. (in Chinese with English abstract)

[22] 方雪清,吳春胤,俞守華,等. 基于EEMD-LSTM的農產品價格短期預測模型研究[J]. 中國管理科學,2021,29(11):68-77.

Fang Xueqing, Wu Chunyin, Yu Shouhua, et al. Research on Short-term forecast model of agricultural product price based on EEMD-LSTM[J]. Chinese Journal of Management Science, 2021, 29(11): 68-77. (in Chinese with English abstract)

[23] 劉雪,劉錦濤,李佳利,等. 基于季節分解和長短期記憶的北京市雞蛋價格預測[J]. 農業工程學報,2020,36(9):331-340.

Liu Xue, Liu Jintao, Li Jiali, et al. Egg price forecasting in Beijing market using seasonal-trend decomposition procedures based on seasonal decomposition and long-short term memory[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(9): 331-340. (in Chinese with English abstract)

[24] 趙鳳展,郝帥,張宇,等. 基于變分模態分解-BA-LSSVM算法的配電網短期負荷預測[J]. 農業工程學報,2019,35(14):190-197.

Zhao Fengzhan, Hao Shuai, Zhang Yu, et al. Short-term load forecasting for distribution transformer based on VMD-BA-LSSVM algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(14): 190-197. (in Chinese with English abstract)

[25] Fu Z Y, Long J J, Chen W Q, et al. Reliability of the prediction model for landslide displacement with step-like behavior[J]. Stochastic Environmental Research And Risk Assessment, 2021, 35(11): 2335-2353.

[26] 楊靜凌,唐國強,張建文. 基于CEEMD-Elman-Adaboost組合模型的國際原油價格預測研究[J]. 重慶理工大學學報(自然科學),2021,35(3):260-267.

Yang Jingling, Tang Guoqiang, Zhang Jianwen. Research on prediction of international crude oil price based on CEEMD-Elman-Adaboost combination model[J]. Journal of Chongqing University of Technology (Natural Science), 2021, 35(3): 260-267. (in Chinese with English abstract)

[27] Zanghieri M, Benatti S, Burrello A, et al. Robust real-time embedded EMG recognition framework using temporal convolutional networks on a multicore IoT processor[J]. Ieee Transactions On Biomedical Circuits And Systems, 2020, 14(2): 244-256.

[28] Yang H S, Ding K Q, Qiu R C, et al. Remaining useful life prediction based on normalizing flow embedded Sequence-to-Sequence learning[J]. Ieee Transactions On Reliability, 2021, 70(4): 1342-1354.

[29] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436–444

[30] 馮建英,吳丹丹,王博,等. 中文在線評論文本分析對生鮮農產品電商影響研究綜述[J]. 農業機械學報,2021,52(S1):504-512.

Feng Jianying, Wu Dandan, Wang Bo, et al. Online comments analysis and its application research progress in e-commerce of fresh agricultural products[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(S1): 504-512. (in Chinese with English abstract)

[31] Bohra N, Bhatnagar V. Group level social media popularity prediction by MRGB and Adam optimization[J]. Journal of Combinatorial Optimization, 2021, 41(2): 328-347.

[32] 蘇娟,方舒,劉博,等. 基于模態組合的短期負荷預測方法[J]. 農業工程學報,2021,37(14):186-196.

Su Juan, Fang Shu, Liu Bo, et al. Short term load prediction method based on modal combination[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(14): 186-196. (in Chinese with English abstract)

Agricultural product price prediction based on signal decomposition and deep learning

Wang Runzhou, Zhang Xinsheng※, Wang Minghu

(,,710055,)

A stable price of agricultural products is of great significance to the social economy and agricultural development in recent years. But, it is difficult to accurately predict the agricultural product prices, due to the non-stationary, non-linear, and high volatility. In this study, a novel prediction model of the decomposition-reconstruction-extraction-associated-output agricultural product price (CT-BiSeq2seq) was proposed using signal decomposition and deep learning. The multi-dimensional data was added to improve the model prediction accuracy, such as the average temperature, and fertilizer cost (price of pig formula feed and urea). Firstly, the original price series were divided into simple ones using the complementary ensemble empirical mode decomposition (CEEMD). Secondly, the original price series was reconstructed into the high-frequency, low-frequency, and residual items, according to the Pearson correlation coefficients and the decomposed subsequence. Thirdly, the data features of the reconstructed sequence were extracted via a temporal convolutional network (TCN). The 7-dimensional data was input to extract the influencing factors on the price of agricultural products. The output steps were similar to the input ones. Fourthly, a Biseq2seq model was constructed with an encoder and a decoder. A bi-directional Long Short-Term Memory network (Bi-LSTM) was introduced into the encoder to strengthen the global correlation between sequence data. Finally, the LSTM network was introduced into the decoder to output the predictive value of the number of steps. Taking the pork price of the Fengtai District wholesale market in Beijing of China for empirical analysis, the prediction performance of the CT-BiSeq2seq model was remarkably better than the rest benchmark models, indicating the number of lags reached the optimal in 11 days. The mean square error (MSE), the mean absolute error (MAE), and the mean absolute percentage error (MAPE) were 0.657 4 rmb2/kg2、0.504 6 rmb/kg、2.116 7%, respectively. Furthermore, the few-day lag cannot fully reflect the overall characteristics of agricultural product prices, where there was easy access to fall into the local optimum. Once the lag days were too long, overfitting was easy to occur, leading to low prediction accuracy. An accurate and stable prediction was also achieved in other datasets. The MSEs of spinach, apple, and egg were 0.627 7 RMB2/kg2, 0.463 2 RMB2/kg2, and 0.552 6 RMB2/kg2, respectively, while the MAEs were 0.543 1 rmb/kg, 0.442 5 rmb/kg, and 0.533 9 rmb/kg, respectively, and the MAPEs were 3.204 7%, 2.236 1% and 2.231 4%, respectively. Therefore, the agricultural products with large price fluctuations were suitable for the large lag steps, whereas, the small price fluctuations were suitable for the small lag steps. A large number of lag days were completely learned from the trend in large price changes. The short lag days were used to fit the time sequence in the smaller price changes, due to the relatively stable trend of price change. Specifically, the prices of spinach and eggs fluctuated greatly in the data range, where the loss error reached the minimum over the 11 lag days, respectively. By contrast, the price of Apples fluctuated less over the 7 lag days. This model can provide a strong reference to forecast the price fluctuation of agricultural products.

agricultural price; price forecast; complementary ensemble empirical mode decomposition; temporal convolutional network; bi-directional sequence to sequence model; long-short term memory

10.11975/j.issn.1002-6819.2022.24.028

F304.2;TP301.6

A

1002-6819(2022)-24-0256-12

王潤周,張新生,王明虎. 基于信號分解和深度學習的農產品價格預測[J]. 農業工程學報,2022,38(24):256-267.doi:10.11975/j.issn.1002-6819.2022.24.028 http://www.tcsae.org

Wang Runzhou, Zhang Xinsheng, Wang Minghu. Agricultural product price prediction based on signal decomposition and deep learning[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(24): 256-267. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.24.028 http://www.tcsae.org

2022-08-26

2022-10-26

國家自然科學基金(41877527);陜西省重點產業創新鏈(群)-工業領域項目(2022ZDLGY06-04);陜西省教育廳重點科學研究計劃項目(20JT033)

王潤周,博士生,研究方向為智能信息處理與模式識別。Email:wangrunzhou@xauat.edu.cn

張新生,博士,教授,研究方向為機器學習、智能信息處理等。Email:xinsheng.zh@outlook.com

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 老司机久久99久久精品播放| 久久黄色毛片| 国产主播喷水| 91在线播放免费不卡无毒| 亚洲欧美日韩成人高清在线一区| 国产精品人莉莉成在线播放| 欧美色伊人| 中文纯内无码H| 乱码国产乱码精品精在线播放| 精品亚洲麻豆1区2区3区| 国产成人AV综合久久| 一级毛片在线播放免费观看| 亚洲天堂.com| 日韩在线成年视频人网站观看| 欧美在线国产| 亚洲国产91人成在线| av午夜福利一片免费看| 波多野结衣国产精品| 免费 国产 无码久久久| 亚洲成A人V欧美综合| 色网站在线视频| 久久免费成人| 97在线免费视频| 超清无码一区二区三区| 国产制服丝袜无码视频| 国产精品13页| 欧美笫一页| 一区二区三区国产精品视频| 久草视频中文| JIZZ亚洲国产| 欧美一级专区免费大片| 青青操视频免费观看| 国产精品一区在线麻豆| 国产丝袜无码一区二区视频| 国产精品不卡永久免费| 91精品国产麻豆国产自产在线| 久久香蕉国产线| 人人爽人人爽人人片| 51国产偷自视频区视频手机观看| 在线网站18禁| 色网站在线免费观看| 国产精品香蕉| 97人妻精品专区久久久久| 国产女同自拍视频| 日本午夜精品一本在线观看| 91无码人妻精品一区| 日韩精品专区免费无码aⅴ| 无码啪啪精品天堂浪潮av| 亚洲AV一二三区无码AV蜜桃| 亚洲毛片网站| jizz在线观看| 欧美日韩北条麻妃一区二区| 91精品免费久久久| 精品1区2区3区| 日本三区视频| 亚洲综合极品香蕉久久网| 国产91高清视频| 国产精品视频3p| 久久精品娱乐亚洲领先| 国产免费羞羞视频| 成人免费网站久久久| 99久久精品免费观看国产| 欧美一级99在线观看国产| 亚洲三级影院| 天天躁日日躁狠狠躁中文字幕| 欧美亚洲欧美| 久久特级毛片| 国产在线观看精品| 国产一级在线观看www色 | 综合色在线| 欧美a在线看| 成人午夜在线播放| 亚洲色图在线观看| 日韩A∨精品日韩精品无码| 色婷婷成人| 久久综合伊人 六十路| P尤物久久99国产综合精品| 91破解版在线亚洲| 久久一本日韩精品中文字幕屁孩| 国产天天色| 手机看片1024久久精品你懂的| 色欲色欲久久综合网|