路亦康

摘 要:通過查找CPI,商品零售價格指數,工業生產者出廠價格指數,固定資產投資價格指數,全國主要農產品生產價格指數,工業生產者購進價格指數,場內價格指數,網上價格指數,訂單價格指數和出口價格指數等指標的歷年數據,建立了三個模型:偏最小二乘回歸模型,BP神經網模型,支持向量機非線性擬合模型(SVM),用模型進行求解,得出2019年的預測值,通過比較誤差的大小,得知SVM模型的預測具有很好的效果。
關鍵詞:CPI;神經網絡;SVM;偏最小二乘回歸
隨著中國經濟的發展,居民消費價格指數(CPI)一方面同人民群眾的生活密切相關,同時也在整個國民經濟價格體系中也具有重要的地位。它是進行經濟分析和決策、價格總水平監測和調控及國民經濟核算的重要指標。因此,運用數據挖掘技術探索市場價格指數與居民消費價格指數的關系,使其能更好的應用于宏觀經濟的發展。
1 模型建立
1.1 基于偏最小二乘回歸的擬合
用R語言的plsr函數求解,首先根據交叉驗證的PRESS結果確定自變量個數,在選擇的成分個數盡可能小的前提下,選擇使PRESS最小或幾乎不變的成分個數,結果如表1所示。
其中,CV表示不同成分個數對應的PRESS值,adjcv為調整后的PRESS值,“TRAINING:%variance explained”一欄表示成分對各變量的累積貢獻率。由回歸結果可知,在不同的主成分個數下PRESS總和相差不大,選用前4個主成分可使累積貢獻率近似達到85%,因此綜合考慮之后確定主成分的個數為4。
確定主成分個數后,用plsr函數求解模型,并用predict函數對2019年1至4月的CPI值作出預測,以計算預測值誤差,所得結果如表2所示。
1.2 基于神經網絡的擬合
BP神經網絡的學習過程是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。我們通過建立BP神經網絡模型預測得到如下結果:
1.3 基于支持向量機(SVM)的非線性模型擬合
支持向量機是一種分類。基本原理是假定其目的是把空間中的兩類點(y=1或y= -1)用超平面ωTx+b=0分開(在嚴格線性可分的情況下,存在這樣的超平面),而且希望這個超平面距離兩類點的距離最大。我們得到預測結果如下:
2 結果
三種模型的預測值及預測誤差如下表所示。
將上述結果繪制成折線圖可更直觀地對比模型的優良:
可以看出,幾種預測模型的預測效果由好到壞依次是支持向量機、BP神經網絡、偏最小二乘回歸模型。三種模型在短期預測時,效果較好,在進行長期預測時,預測誤差會顯著增加。