江蘇經貿職業技術學院 韓彥林
社會消費品零售總額是指各種經濟類型的批發和零售業、住宿和餐飲業及其他行業對城鄉居民和社會集團的消費品零售額總和。反映了一個地區消費需求能力以及零售市場的規模,也體現出一定時期內人們的物質文化生活水平,是衡量一個地區經濟發展水平的重要經濟指標,所以對社會消費品零售總額進行預測研究有重要的理論意義和現實意義。本文在現有研究的基礎上,利用遺傳算法優化支持向量回歸機中的參數,建立GA-SVR模型對江蘇省社會消費品零售總額進行預測。
遺傳算法(GA)是由Holland教授最早提出的[1],是模擬生物在自然環境中遺傳和進化過程而形成的一種自適應全局優化的搜索算法。該算法使用群體搜索技術,它通過對當前群體施加選擇、交叉、變異等一系列遺傳操作從而產生出新一代的群體并逐步使群體進化到包含或接近最優解的狀態。遺傳算法的基本操作步驟包括:編碼、初始化種群、計算適應度函數、選擇、交叉和變異[2]。
支持向量機(SVM)是Vapnik等在1995年首先提出的,它是基于統計學理論,以結構風險最小化為原則,能夠很好地解決小樣本、非線性、高維數等問題。SVM廣泛地應用于分類問題和回歸問題,用于回歸問題就是支持向量回歸機(SVR)。SVR是通過已知訓練樣本點數據構造一個回歸函數。對于非線性回歸問題是利用一個非線性映射將輸入數據映射到高維特征空間,并在這個高維空間進行線性回歸。


約束條件為:

式中,為懲罰因子,為不敏感損失函數系數,和 為松弛變量。
對上述最優化問題直接求解比較復雜,而是通過它的對偶問題進行求解,為此需引入拉格朗日函數:


將上式結果代入拉格朗日函數計算可得:

從而可得原優化問題的對偶問題為:


對上述問題進行求解[3],可求得和,進而得出和,于是支持向量機的回歸函數:


常用到的核函數有:多項式函數、Gauss徑向基核函數(RBF)。本文選取Gauss徑向基核函數。
根據相關性分析研究[4,5],確定影響江蘇省社會消費品零售總額的主要因素。將當年地區GDP、城鎮居民家庭人均收入、農村居民家庭人均收入、年末常住人口、商品零售價格指數數據作為支持向量回歸機的輸入向量,下一年度社會消費品零售總額作為輸出。本文以江蘇省1990~2012年各年度社會消費品零售總額以及影響因素數據作為研究對象(數據來自《江蘇省統計年鑒》,見表1),其中前20個數據作為訓練數據,后3個數據作為測試數據。

表1 江蘇省社會消費品零售總額相關數據
社會消費品零售總額受到多種因素的影響,影響因素往往量綱不同、數據數量級不同,需對數據進行無量綱化處理,提高預測精度。本文采用最大最小值歸一化法:

將樣本數據歸一化到[0,1]范圍內。其中,表示歸一化后的數據,表示原始數據, , 表示原始數據的最大值與最小值。
由于本文采用Gauss徑向基核函數,SVR模型中有3個參數需要確定,分別是懲罰因子 、核函數參數 ,不敏感損失函數系數。它們的取值對模型的預測精度有著很大的影響,懲罰因子 越大,“過擬合”現象就越明顯,越小,“欠擬合”現象就越明顯。為了提高預測精度,本文利用GA算法對SVR模型中的3個參數進行尋優,通過matlab軟件編程運行得到SVR模型的3個參數分別為。
利用matlab軟件通過訓練好的GA-SVR模型對江蘇省1991~2010年和2011~2013年的社會消費品零售總額進行擬合和預測,結果見圖1和表2。

圖1 1991~2013年江蘇省社會消費品零售總額擬合和預測結果

表2 2011~2013年江蘇省社會消費品零售總額預測值與實際值對比
從圖1和表2可以看出基于GA-SVR模型的預測值與實際值相當吻合,相對誤差較小,結果表明GA-SVR模型能夠有效地對江蘇省社會消費品零售總額進行預測。最后,根據2013年各個影響因素數據,利用GA-SVR模型預測出江蘇省2014年社會消費品零售總額為22637億元。
由于社會消費品零售總額受多因素影響,以及非線性等特點,本文提出GA-SVR模型進行預測。利用遺傳算法的全局搜索功能,確定SVR模型中的參數,構建SVR模型對江蘇省社會消費品零售總額進行預測。結果表明,GA-SVR模型預測精度較高,為江蘇省社會消費品零售總額預測提供了一種新的方法。
[1] 周明,孫樹棟.遺傳算法原理及應用[M].北京:國防工業出版社,1999.
[2] 楊淑瑩.模式識別與智能計算—Matlab技術實現[M].北京:電子工業出版社,2011.
[3] 鄧乃楊,田英杰.數據挖掘中的新方法—支持向量機[M].北京:科學出版社,2005.
[4] 郭慧敏,韓少將.浙江社會消費品零售總額增長因素分析[J].浙江統計,2009(8).
[5] 陳斌,張衛華.我國社會消費品零售總額的影響因素分析[J].廣西師范學院學報(哲社會科學版),2010(31).
[6] 查進道.一種改進的基于DE-SVR 的上證指數預測模型[J].統計與決策,2012(23).
[7] 唐山,張現剛.遺傳支持向量機在城市節假日電力負荷預測中的應用[J].產業與科技壇,2012(11).
[8] 趙輝,成立芹.企業人力資源結構的GA-SVM預測[J].統計與決策,2010(02).