胡俊,桂霏,楊桂元
組合模型對股票價格預測的比較研究
胡俊,桂霏,楊桂元
股票價格預測向量是投資者、分析家以及很多學者所關注研究的對象,傳統的預測模型已發展得比較成熟,而近年產生的新型統計學習理論也逐漸成為了預測的工具,比如神經網絡,支持向量機等。對三種傳統與新型模型混合的組合模型(ARIMA、GARCH、SVR)進行預測,并比較分析,得到一定的結論。
股票價格預測;ARIMA;條件異方差;支持向量回歸;組合模型
股票價格預測一直以來是投資者、分析家以及很多學者所關注研究的對象,但由于影響股市的因素太多,客觀預測——技術分析、數據分析、公司基本面判斷等盡管能判斷出一定的波動趨勢,但準確性不佳。因此,對于很多散戶投資者甚至一些機構評論分析人都是主觀加客觀來做推斷,這也進一步導致了股票市場的盲動性。
傳統的時間學列對于股市的預測有很多模型,比如線性的ARIMA,非線性的GARCH模型等,這些模型對數據要求比較嚴格,尤其是GARCH模型,對于股票數據,盡管數據量大,但由于市場隨機性太強,數據往往顯得不“真實”。20世紀50年代以來,暗箱理論的建立使統計研究理論從傳統型上發生了一些轉變,特別是計算機發展普及后,這方面的實踐也明顯增多,從而帶動了預測模型的發展。比如人工神經網絡(ANN)、灰色預測(GM)、支持向量機(SVM)等。 人工智能(Artificial Intelligence)主要是通過計算機來模擬人的某些思維過程和智能行為的一種方式,從而對新的變量與環境進行較精確的經驗判斷或預測。
近年來,人們對新型預測模型的關注度越來越多,并且常常與傳統模型結合,用組合模型來判斷,取得了一定的效果。目前,國內在這方面的組合模型主要有三種模式:第一類是把時間序列分成線性部分和非線性部分,并對線性部分進行傳統的時間序列模型進行預測,而對非線性部分用人工智能進行預測,如盛艷波(2006)用BP神經網路和ARIMA組合模型對浙江省人均GDP進行預測,有一定的預測性;第二類是通過對幾種預測(包括傳統與新型)的結果進行加權求平均處理,如張防等(2009)通過對用BPNN預測和ARIMA預測出來的銷售數據進行加權平均處理,得到比用單個方法預測的效果好;第三類是將某個傳統方法預測出來的結果作為神經網絡、支持向量機中的一個因素,再進行神經網絡、支持向量機等進行仿真預測,如高振坤等(2009)對深圳成指的收益率進行研究,其方法是用前5天的對數收益率作為輸入神經元,此外還加上用GARCH估計出來的條件變異數作為第六個輸入神經元,再進行仿真模擬,結果顯示組合預測比較好。
本文結合以上三種組合模型,運用ARIMA、GARCH、SVR(支持向量回歸機)對股票價格進行預測。
對于上面的三個模型,由于ARIMA與GARCH發展得較成熟,這里只作簡單介紹,筆者將重點闡述SVR的原理。
(一)差分自回歸移動平均模型(ARIMA)
ARIMA模型是由Box和Jenkins于20世紀70年代初提出的時間序列預測方法,其基本思想是將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列,這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。ARIMA(p,l,q)模型基本方程:

這里 d(sht)=sht-sht-1,即一階差分(d=1)。這里差分的目的是建立ARMA模型的序列必須的平穩序列。
ARIMA模型的應用分析主要包括四個步驟:模型識別,即根據時間序列的特征,確定模型類型及其階數,就是找出ARIMA模型的p,d,q值。模型估計,即用適當的參數估計方法,估計初步設定模型的參數值。模型檢驗,即在建立好模型以及確定好參數后,檢驗這些的準備性,并進一步調整。模型預測和控制,即利用所得到的模型進行預測分析,包括靜態預測、動態預測等。
(二)廣義自回歸條件異方差模型(GARCH)
GARCH是在Engle(1982)提出ARCH模型后,T.Bollerslev(1986)提出的擴展模型。GARCH模型是一個專門針對金融數據的回歸模型,除去和普通回歸模型相同之處,GARCH對誤差的方差進行了進一步的建模,特別適用于波動性的分析和預測。
GARCH(p,q)模型基本形式:

其中,vt獨立同分布,E(vt)=0,D(vt)=1在模型中為保證ht恒取正值,保證條件方差方程是一個平穩過程,對模型的兩個約束條件為:

在實際應用中,GARCH(p,q)中的q一般比較小,比ARCH(q)中的q可以小得多,事實上最常用的是GARCH(1,1)模型。GARCH(1,1)模型可以描述大量的金融時間數據,但一般是收益率序列,對于股票價格,一般很少符合ARCH效應的。應用步驟也包括建立,參數估計,檢驗,預測這幾步。
(三)支持向量機(SVM)
SVM方法是統計學習理論的一種實現方法,它也是一種前向型神經網絡 ,可以用于分類和非線性回歸。其基本思想是:基于Mercer核展開定理,通過非線性映射把特征空間映射到Hilbert空間,在Hilbert空間中用線性學習機方法解決非線性分類和回歸等問題。
本文因為只運用SVR即支持向量回歸,所以這里只介紹SVR的理論與推導。
線性ε-SVR的模型是:給定訓練集T={(x1,y1),(x2,y2),…,(xn,yn)}∈(X×Y)n然后選擇適當的參數 ε 和 C〉0,構造并求解最優化問題

得到Lagrange最優目標函數為:

本文為了與GARCH模型相比較,特地選取了具有ARCH效應的股票價格,即選取了2010年11月01日到2011年3月16日三峽水利的收盤價格作為研究對象,對3月17日到3月23日的收盤價格進行各種方法的預測。
1.對于ARIMA模型,對原序列單位根檢驗,得到為一階差分平穩,并且平穩后的自相關系數和偏自相關系數顯示都有拖尾現象,因此根據AIC和SC準則以及系數t檢驗進行模型階數確定,得到最優的模型為 ARIMA(1,1,1),即

再看殘差的Q統計量,顯示不能拒絕原殘差為白噪聲序列。對股票價格進行預測,結果見表1。
2.對于GARCH模型,同樣根據AIC和SC準則來確定模型,得到最好的階數為p=1,q=1,即:

再進行殘差序列的LM檢驗,顯示不再存在ARCH效應,所以認為模型合理。對股票價格進行預測,結果見于表1。
3.本文應用SVR時,主要是考慮到股票價格的周期波動性,因為股票交易一周為5天,所以本期的波動往往跟前面5期的波動有較大關聯。由前面5期,即

所取的訓練集為2010-11-01到2011年3月16日,預測2011-3月17日到3月23日的價格,即本文全部模型要預測的5期股票價格。預測結果如表1所示。


表1 股票預測價格
從表1可以看出,總體來說,組合模型比單一模型預測效果要精確,而對比三類組合模型的平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方誤差(MSE)、均方根誤差(RMSE),可以看到 ARIMA+SVR的預測精度最高,幾乎能準確預測出實際值來,這可以看出線性與非線性的組合有比較好的效果,而加權預測結果次之,以GARCH模型預測的結果作為某一輸入變量的SVR模型的預測效果卻并不是很好,原因可能跟單獨用SVR來仿真擬合一樣,受訓練集內的數據影響。
組合模型是近年來時間序列預測精度要求提高后提出來的一種預測方法,它是單一模型的延伸,也可以說是一種新型的預測方法。但也不能亂用,比如說,加權平均模型,當各個模型都正向偏離時,組合就不能比單一模型更加精確。再說,如果作為支持向量機、神經網絡等機器的輸入單元以及不準備,那么進行仿真實現后的數據也會不準備,而對線性預測加非線性預測這個組合模型,非線性部分,作者持有一定的懷疑,因為經過ARIMA預測出來的時間序列值與真實值的差,也就是殘差學列,其走勢波動并沒有特定的規律性,也就是說其很隨機性很強,用前5期殘差來預測本期的殘差,跟實際殘差可能相差很大,這就導致預測結果反而更不準確。
從本文的三種組合模型比較可以看出用時間序列ARMA模型擬合線性部分,用創新統計理論擬合殘差部分,再兩者相加得到預測結果可能是一種不錯的組合模型,可以對很多時間序列加以運用。至于另外兩類組合,應該再次實踐,加以證實。但不可否認,三種組合模型都比單一的模型更加準確,這也是現階段組合模型開始引人關注的一個原由。至于組合的方式以及用新的單一模型來組合,能使預測更加精確,這將是后面的一個研究方向。
[1]馬超群,蘭秋軍,陳為民.金融數據挖掘[M].北京:科學出版社,2007.
[2]謝識予,朱弘鑫.高級計量經濟學[M].上海:復旦大學出版社,2005.
[3]易丹輝.數據分析與EViews應用[M].北京:中國人民大學出版社,2008.
[4]沈巍.股票價格預測模型研究[J].財經問題研究,2009(7).
[5]Ping-Feng Pai,Chih-Sheng Lin.A hybrid ARIMA and support vector machines model in stock price forecasting[J].2005(33).
[6]任海軍,孫瑞志,劉廣利.基于AR-SVR模型的時間序列預測算法的研究[J].計算機工程與設計,2010(2).
[7]林慧君,徐榮聰.組合ARMA與SVR模型的時間序列預測[J].計算機與現代化,2009(8).
[8]盛艷波.基于AR神經網絡和ARIMA組合模型測浙江省人均國內生產總值[J].商業研究,2006(8).
[9]張防,周宗放.基于ARIMA模型和BP神經網絡的銷售組合預測研究[J].管理學家,2009(7).
F830.91
A
1673-1999(2012)04-0085-03
胡俊(1986-),男,安徽黃山人,安徽財經大學(安徽蚌埠 233000)碩士研究生;桂霏(1987-),女,安徽池州人,安徽財經大學碩士研究生。
2011-12-01