陳佳珊 張丹
摘要:為提高農產品市場價格的可預見性,本文以農產品生產價格指數為研究對象,首先運用SARIMA擬合序列的線性部分,然后分別采用BP網絡、LSSVM提取非線性信息,從而構造組合模型SARIMA-BP與SARIMA-LSSVM。通過評價指標RMSE和MAPE的對比發現組合模型較單項模型具有更強的穩健性和更高的預測精度,其中SARIMA-LSSVM的預測效果最理想,故基于該模型預測未來5個季度的指數,并得出結論:該指數的波動范圍有減小的微弱趨勢,但總體波動較大,未來較短一段時間內該市場可能存在較大風險,國家應采取相應的應對舉措。
關鍵詞:農產品生產價格指數 組合模型 SARIMA BP網絡 LSSVM 短期預測
一、引言
農產品生產價格指數既能及時反映全國農產品生產價格水平和結構變動情況,以引導農村調整產業結構,也能幫助“國家測算農業支持水平”[1],從而“確定相關補貼政策或為補貼標準提供依據”[2]。近年來農產品價格波動幅度大,使得該市場存在不穩定因素,不利于經濟社會的正常運行。因此預測其價格指數不僅有利于生產者和銷售者對市場存在的風險及時作出反應,且有助于政府采取相關措施對市場進行宏觀調控,具有雙重重要意義。
實證分析中,本文根據季節性特征選取季節性差分自回歸滑動平均模型(SARIMA)。但時序法本質上只能捕捉線性關系,其非線性關系的捕獲能力很差,且該序列易受多種外界因素影響,故其中也包含非線性變化規律。本文針對不足之處提出基于SARIMA的組合模型:先用SARIMA提取線性信息,再通過非線性手段提取殘差中的波動信息,即實現線性與非線性的結合。最后通過評價指標選擇理想的組合模型進行預測。對于SARIMA的改進是本文的亮點之處。
二、理論基礎
(一)SARIMA模型
(二)“線性+非線性”組合預測模型
在實際中許多時序數據往往受到多因素的綜合影響,其蘊含的變化規律無法簡單地通過單一模型來全面描述。
J.M.Bates和C.WJ.Granger提出的組合預測方法突破了單項模型在預測方面的局限性。對于單一預測模型,楊黃梅認為“只能預測線性變化規律的模型往往伴隨著低預測精度;而基于經驗風險最小化原則構建的模型雖具備很強的非線性預測能力,但泛化能力差”[4]。SARIMA則屬于前者,具有優良的線性信息提取能力卻忽視數據中的波動信息。倘若只考慮BP網絡或LSSVM這些泛化能力強的非線性模型,則易出現過擬合現象。
顯然單一模型難以對數據作出合理有效的解釋。同時注意到SARIMA的“取線性,舍非線性”特征與非線性模型的“取非線性,舍線性”特征是一種互補關系,故本文基于這一關系提出“線性+非線性”組合模型:SARIMA-BP和SARIMA-LSSVM。
三、實證研究
(一)數據選取
本文引用的是農產品生產價格指數的季度數據:2003年第一季度至2018年第三季度,來源于國家統計局。
為了在訓練過程中對模型的準確性進行檢驗,本文取后10個數據作為測試集,其余則為訓練集。
(二)模型構建與評估
1.構建SARIMA模型。經季節性判定、差分處理、平穩性與白噪聲檢驗、模式識別、參數估計及檢驗等操作后,根據AIC最小值準則選出最優SARIMA:
2.構建“線性+非線性”組合模型。線性模型即為SARIMA,針對非線性數據的提取,本文選取BP網絡和LSSVM模型。以SARIMA的殘差為輸入數據,分別構建BP與LSSVM模型。
在BP模型構建過程中,設置4個輸入節點n,2個隱層節點m,1個輸出節點。在確定隱層節點數量時本文參照經驗公式
為1-10之間的常數,經多次試驗發現a=10時的效果最好。接著,以S型正切函數tansig作為隱層神經元的激勵函數,且“由于網絡的輸出歸一到[-1,1]范圍內,故選S型對數函數tansig作為輸出層神經元的激勵函數”[5]。
在LSSVM構建過程中,首先設置優化程序為網格搜索,然后選擇成本函數“交叉驗證”并初始化參數,,內核函數選RBF_內核。接著基于訓練數據在交叉驗證中優化初始化參數,然后訓練模型。
最后分別將構建的BP模型和LSSVM與SARIMA結合,即得到SARIMA-BP與SARIMA-LSSVM。
3.模型評估與選擇。本文以均方根誤差RMSE和平均絕對誤差百分率MAPE作為評價擬合預測效果的標準。RMSE側重衡量偏差,MAPE側重衡量模型穩健性。
為樣本數,為真實值,為預測值。
分別用構建的三個模型預測后10個數據,對比原數據與預測數據并計算相應RMSE與MAPE,評結果如下:
對比單項模型,組合模型的預測精度明顯提高,說明本文對SARIMA的改進有明顯效果。且無論是在RMSE還是MAPE上的評比,SARIMA-LSSVM的效果均是最好的。
(三)農產品價格指數的預測
據模型評估結果可知SARIMA-LSSVM的預測效果是最理想的,因此本章使用該模型預測未來五個季度的指數,結果如下:
四、分析與結論
(一)關于模型對比
在評估對比中可發現SARIMA在兩種評價標準之下的效果都最不理想,這是因為受多種外界因素影響的農產品生產價格指數具有較復雜的變化特點,無法充分捕捉非線性信息的SARIMA難以對其全面描述,因而導致其效果并不理想。
相較之下,基于SARIMA提出的“線性+非線性”組合模型在注重線性信息的同時也充分考慮了波動信息,故其擬合預測精度顯著提升,效果理想。且在這兩種組合模型的比較中,SARIMA-LSSVM的預測效果更勝一籌。本文初步認為,BP具有高度非線性泛化能力,LSSVM則“同時兼備逼近精度和泛化能力這兩個方面的優良性能”[6],故LSSVM在非線性回歸估計方面的綜合性能比BP要更好,因而SARIMA-LSSVM組合模型所呈現出來的效果相較之下更為貼和實際發生數據。總體而言,這兩種非線性模型都是擬合非線性回歸函數的推薦選擇。
(二)針對預測結果
根據預測結果,全國農產品生產價格指數仍延續以往的發展規律。該指數在2018年第四季度跌至谷底后又開始上升,變化規律與往年類似。縱觀總體的波動情況,前期的指數波動較小,但中后期的波動猛然增大,即生產價格變動較大,彼時該市場存在較大風險,對生產者的經濟收入有所影響,其價格指數也處于一個不穩定狀態。后面可看到指數的波動范圍有減小的微弱趨勢,但總體來看其波動還是較大。
農產品生產價格指數是反映農產品“出廠價格”的一個環比數,過低則消費者物價指數CPI隨之降低,造成通貨緊縮,過高CPI也隨之上升,可能發生嚴重的通貨膨脹。由于CPI最好保持在3%以內且適當的通貨膨脹有利于經濟增長,因此,本文認為農產品生產價格指數的最好狀態是穩定且稍微偏高。根據預測結果知該指數繼續上升的可能性大,未來一段較短時間內農產品市場可能存在較大的風險,國家需據此采取應對舉措,以最大限度防止國民經濟的失衡。
參考文獻:
[1]百度百科:https://baike.baidu.com/item/農產品生產價格指數/6003948?fr=aladdin.
[2]郝安民.國家統計局首次發布全國農產品生產價格指數——訪國家統計局農村社會經濟調查總隊長鮮祖德[J].調研世界,2003(08):3-4.
[3]徐達寧.云計算環境下資源需求預測與優化配置方法研究[D].安徽省:合肥工業大學,2014.6.
[4]楊黃梅.人才需求組合預測的建模與仿真分析[J].計算機仿真,2013,30(10):253-254.
[5]朱梅.基于BP神經網絡的等高線生成方法[J].電子元器件與信息技術,2018(06):51-56.
[6]王偉,王田苗,魏洪興.LS-SVM與多層向前網絡的非線性回歸性能比較[J].系統仿真學報;2008,20(1):258-259.
(作者單位:華南師范大學)