吳玉霞,溫 欣
(1.河北金融學院 河北省科技金融重點實驗室,河北 保定 071051;2.財政部財政科學研究所博士后流動站,北京 100142;3.南京財經(jīng)大學 經(jīng)濟學院,南京 210023)
基于ARIMA模型的短期股票價格預(yù)測
吳玉霞1,2,溫 欣3
(1.河北金融學院 河北省科技金融重點實驗室,河北 保定 071051;2.財政部財政科學研究所博士后流動站,北京 100142;3.南京財經(jīng)大學 經(jīng)濟學院,南京 210023)
文章選取“華泰證券”250期的股票收盤價作為時間序列實證分析數(shù)據(jù),通過建立ARIMA模型對創(chuàng)業(yè)板市場股票價格變動的規(guī)律和趨勢進行了預(yù)測。實證結(jié)果表明,該模型短期動態(tài)、靜態(tài)預(yù)測效果較好,可以為投資者和企業(yè)在進行相關(guān)決策時提供有益參考。
時間序列分析;股票價格預(yù)測;創(chuàng)業(yè)板;ARIMA模型
創(chuàng)業(yè)板股價較主板股價波動幅度更大,預(yù)測難度也更大。時間序列預(yù)測方法是比較常用的預(yù)測方法,它有一系列完善的理論基礎(chǔ),隨著人們對股市的追捧,不少學者也嘗試將時間序列預(yù)測應(yīng)用于股票的價格預(yù)測,具體的講時間序列預(yù)測股價是將股票價格或者價格指數(shù)看作變化的時間序列,通過建立合理的時間序列模型以預(yù)測未來發(fā)展變化的規(guī)律和趨勢。但目前對股票價格的預(yù)測更多地是對主板市場的研究,鮮有對創(chuàng)業(yè)板市場股票價格的預(yù)測。本文選取“華泰證券”250期的股票收盤價作為時間序列實證分析數(shù)據(jù),通過建立ARIMA模型對創(chuàng)業(yè)板市場股票價格變動的規(guī)律和趨勢進行預(yù)測。需要指出的是,股票市場的行情是千變?nèi)f化的,時間序列分析法只是利用歷史數(shù)據(jù),期望從中獲取有用信息來預(yù)測將來走勢,而并沒有考慮影響股價變動的原因,故一般只是直觀分析,僅做短時間內(nèi)的預(yù)測。
1.1 股票價格預(yù)測理論
股票價格序列預(yù)測就是利用事物發(fā)展的歷史數(shù)據(jù),綜合考慮各種影響股價的因素,采用某種科學的方法,對將來某一期或者某幾期的股票價格進行估計,已知時間序列{Y1,Y2,…, }
YT,預(yù)測YT+1,···,YT+m的股票價格,公式定義為:
其中,只進行一步預(yù)測,即僅求YT+1稱為單步預(yù)測,當預(yù)測YT+m,m>1,稱m步預(yù)測。顯然m步預(yù)測可以拆分成多個單步預(yù)測的組合,即式(1)可以寫成:

預(yù)測研究的是未來的狀態(tài)或發(fā)展趨勢,它之所以受到廣泛關(guān)注是因為人們現(xiàn)在的行為可能影響到未來的結(jié)果,將各種預(yù)測方法應(yīng)用于股票價格預(yù)測,給本文投資決策提供建議,可能會關(guān)系到以后的股票投資收益,因此股價預(yù)測是非常現(xiàn)實的預(yù)測問題。
1.2 時間序列分析法
時間序列預(yù)測方法是將股票價格或者價格指數(shù)看作變化的時間序列,通過建立合理的時間序列模型以預(yù)測未來發(fā)展變化的規(guī)律和趨勢,而時間預(yù)測方法正迎合股指的變化發(fā)展的隨機性及其時變性等特點,有較好的短期預(yù)測效果。常用的時間序列分析法有自回歸模型(AR)、移動平均模型(MA)及自回歸移動(ARMA)平均模型等。預(yù)測方法又有兩種:一種是動態(tài)預(yù)測:只能進行一期預(yù)測,在由實際值預(yù)測出第一期的值之后,將第一期預(yù)測值帶入時間序列,和歷史數(shù)據(jù)一期再進行第二期的預(yù)測,以此遞推,對于長期預(yù)測,可能會產(chǎn)生累計誤差;另一種是靜態(tài)預(yù)測:用原序列的實際值來進行預(yù)測,只有當真實數(shù)據(jù)可以獲得時才可以使用這種方法。
2.1 模型介紹
C.P.Box和G M.Jenkins[1]最早提出的自回歸求和移動平均模型(簡稱為ARIMA模型),是將非平穩(wěn)時間序列先經(jīng)過d階差分平穩(wěn)化,再對得到的平穩(wěn)時間序列利用自回歸(AR(p)process)和滑動平均過程(MA(q)process),并通過樣本自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PCF)等數(shù)據(jù)對建立的模型進行辨識,同時還提出了一整套的建模、估計、檢驗和控制方法。設(shè){} Yt為零均值的平穩(wěn)時間序列,p階自回歸q階滑動平均的ARMA(p,q)公式表述為:

可簡寫為?(B)Yt=θ(B)εt。ARIMA(p,d,q)模型中的d是差分階數(shù),金融市場上的時間序列數(shù)據(jù)一般都是非平穩(wěn)的,差分是平穩(wěn)化的途徑之一,差分后的ARIMA建模過程基本與ARMA相同。
2.2 模型的建立
在數(shù)據(jù)選取方面,隨機選取個股。華泰證券股票發(fā)行以來,股票價格沒有明顯的異常波動,選取的250期時間序列內(nèi)無重大財務(wù)、違法違規(guī)事件。之所以選250期是因為若選取數(shù)據(jù)過少則無法充分提取歷史數(shù)據(jù)中的信息,數(shù)據(jù)選取過多又會因間隔較長時的股價會對后期的預(yù)測股價影響較小造成不必要的誤差。本文最終選取華泰證券2014年3月24日至2015年3月31日間250期的股票的收盤價作為時間序列數(shù)據(jù),(數(shù)據(jù)來源于大智慧和同花順歷史股價)。剔除7個無效數(shù)據(jù),對243期股票的收盤價做ARIMA模型擬合,并進行短期預(yù)測。命名收盤價時間序列為y,對y進行ADF平穩(wěn)性檢驗,發(fā)現(xiàn)y序列非平穩(wěn)。接下來要進行平穩(wěn)化處理,對其進行差分,直至平穩(wěn)。一階差分結(jié)果如下:

表1 一階差分序列ADF檢驗
可以看出dy的ADF統(tǒng)計值的絕對值為12.03473,大于顯著性水平為0.05時的2.873339,故接受存在一個單位根的原假設(shè),并且P值很小,均說明一階差分序列是平穩(wěn)的,因此d=1。

圖1 一階差分的時序圖

圖2 一階差分自相關(guān)圖
dy的時序圖圍繞一個常數(shù)值上下波動,且波動范圍不大。自相關(guān)圖中自相關(guān)系數(shù)迅速衰減為零,也表明一階差分序列是平穩(wěn)的,不需再進行二階差分檢驗。
由圖1序列相關(guān)圖可知,P值都小于5%,數(shù)據(jù)為非白噪聲序列,存在相關(guān)性,有一定規(guī)律可循。偏自相關(guān)系數(shù)在k=1后很快趨于0,偏自相關(guān)1階截尾,可以試著擬合AR(1)模型,在k=3時在2倍標準差的置信帶邊緣,可嘗試AR(3)模型;自相關(guān)系數(shù)在k=1時顯著不為零,在k=3、6處在2倍標準差的置信帶的邊緣,是可以嘗試擬合MA(1)、MA(3)、MA(6)模型;同時可以建立ARIMA(1,1,1),ARIMA(3,1,1)模型等。由模型定階發(fā)現(xiàn),p可能等于1、3、6,q可能等于1,表2、表3分別是各模型的估計結(jié)果和預(yù)測的參數(shù)對比表。

表2 方程的P值比較
比較表2中的P值,綜合c、ar(p)、ma(q)三項的P值,發(fā)現(xiàn)模型ARIMA(3,1,1)的最小,都小于顯著性水平5%。

表3 各種模型的精度指標對比
比較各模型的檢驗統(tǒng)計量,根據(jù)AIC準則、SC小的為較優(yōu)模型,也是ARIMA(3,1,1)比較好,優(yōu)于其他三個模型。F統(tǒng)計量9.814915在四項中最大,P值也最小。綜上擬選定ARIMA(3,1,1)模型。
較優(yōu)的模型ARIMA(3,1,1)用公式表述為:

2.3 模型的診斷檢驗
在確定參數(shù)的估計值后,還需要對擬合模型的適應(yīng)性進行診斷檢驗。本文利用Eviews軟件建立殘差的自相關(guān)圖,對殘差進行純隨機性檢驗,ARIMA(3,1,1)的殘差自相關(guān)檢驗結(jié)果如圖3所示。

圖3 ARMA(3,1,1)模型殘差相關(guān)圖
殘差相關(guān)圖顯示自相關(guān)函數(shù)基本在95%的置信區(qū)域內(nèi),且P值大于0.05,殘差為白噪聲,也即殘差是純隨機性的,圖4 ARIMA(3,1,1)模型擬合圖也顯示擬合模型有效。

圖4 ARMA(3,1,1)模型擬合圖
2.4 模型的應(yīng)用
用擬合的有效模型ARIMA(3,1,1)進行短期預(yù)測。首先進行動態(tài)預(yù)測,預(yù)測圖如下:

圖5 序列動態(tài)預(yù)測圖

圖6 動態(tài)預(yù)測效果圖
預(yù)測值存放在DYF序列中,作出dy和dyf動態(tài)關(guān)系圖。如圖6,動態(tài)預(yù)測值幾乎是一條直線,說明動態(tài)預(yù)測效果不好。
再進行靜態(tài)預(yù)測,靜態(tài)預(yù)測只能進行向前一步預(yù)測,預(yù)測結(jié)果見圖8,可以看出靜態(tài)預(yù)測效果還是很理想的。

圖7 靜態(tài)預(yù)測圖

圖8 動態(tài)預(yù)測效果圖
根據(jù)存放在dyf中的預(yù)測值,利用公式反推第一期預(yù)測值,將預(yù)測值加入歷史時間序列,同樣的過程可得出第二期預(yù)測值及直到m期。由于模型的局限性,這里只給出三期真實值與預(yù)測值的比較情況,結(jié)果如表4所示。

表4 ARIMA(3,1,1)模型預(yù)測結(jié)果
從預(yù)測擬合圖可以看出,該模型的預(yù)測效果較好,絕對誤差還是比較小的,相對誤差只有0.0135,從預(yù)測結(jié)果分析不難得出以下結(jié)論:
第一,ARIMA模型作為華泰證券指數(shù)的短期預(yù)測模型是可行的,從擬合圖可以看出擬合效果較好,說明此時間序列包含了華泰證券股價指數(shù)的大部分信息,并且可以看出靜態(tài)預(yù)測效果好于動態(tài)預(yù)測。比如,華泰證券2015年3月31日的股價為30.11,之前幾期的股價以次為28.79、27、26.46、26.71,預(yù)測的結(jié)果分別為30.34、30.17、30.08,明顯股價有增長趨勢,這時可以考慮買進,以期獲利。
第二,模型倒推去計算預(yù)測值很可能產(chǎn)生累計誤差,從表4 ARIMA(3,1,1)結(jié)果圖中就可以看出,向前一期預(yù)測的誤差值是0.28,向前兩期是-0.18,向前三期絕對值大于前兩期的誤差為2.53,因為二期的預(yù)測值是由一期預(yù)測值推算的而非通過一期的真實值計算,這一特點不利于長期預(yù)測,但從相對誤差及平均相對誤差看,這三期的誤差還是很小的,預(yù)測效果還是比較理想的。
第三,時間序列本身的特性就是從歷史數(shù)據(jù)中提取有用信息,來對未來走勢進行預(yù)測,影響股價的其他因素僅以隨機項來反映,這也是時間序列模型的一個缺陷,本文不能對其他影響股價的因素進行控制,在進行數(shù)據(jù)選擇的時候,還要盡量避免受政策等影響產(chǎn)生重大波動的情況,以降低預(yù)測誤差。
股票價格預(yù)測是一個充滿挑戰(zhàn)性的問題,但時間序列預(yù)測理論一直被認為是對股價變化進行統(tǒng)計預(yù)測的有效手段。因為時間序列預(yù)測理論具有很好的短期預(yù)測效果,雖然本文僅用了一步靜態(tài)預(yù)測的方法,但理論上時間序列可實現(xiàn)動態(tài)的連續(xù)預(yù)測,本文的實證分析也表明ARIMA模型作為華泰證券指數(shù)的短期預(yù)測模型是可行的,此時間序列包含了華泰證券股價指數(shù)的大部分信息,且擬合效果較好,從而ARIMA模型的應(yīng)用對本文把握住創(chuàng)業(yè)板買賣時機及回避風險也有一定參考價值。
由于時間有限,本文只針對華泰證券部分收盤價價格指數(shù)實際數(shù)據(jù)的變化做了建模分析,并且當樣本數(shù)據(jù)發(fā)生變化時,模型的參數(shù)結(jié)構(gòu)會隨之變化,這表明模型對樣本的變化十分敏感,對股價預(yù)測的波動模式有短期穩(wěn)定性,預(yù)測的精度也因樣本變化而變化,結(jié)論可能缺乏普遍性,這就要求在利用ARIMA模型進行股價預(yù)測時,對發(fā)展比較穩(wěn)定,無因突發(fā)事件、政策出臺等外界因素產(chǎn)生較大異常波動的歷史數(shù)據(jù)效果更好。
總之,本文通過建立時間序列模型,利用歷史價格作為序列數(shù)據(jù),對未來幾期價格進行短期的預(yù)測,希望能夠幫助投資者降低投資風險和發(fā)現(xiàn)投資機會。同時可以考慮結(jié)合其他預(yù)測方法,加強對股票市場自身體制因素、國家宏觀經(jīng)濟政策、國民經(jīng)濟發(fā)展方向等各種因素的關(guān)注,常常這些不定因素對股票的長期走勢也有著重要的應(yīng)用價值。
[1]賀本嵐.股票價格預(yù)測的最優(yōu)選擇模型[J].統(tǒng)計與決策,2008,(6).
[2]曹冬.中國創(chuàng)業(yè)板市場發(fā)展的思考[J].理論前沿,2008,(1).
[3]李秀琴,梁滿發(fā).基于ARIMA模型的股票行情預(yù)測[J].長春教育學院學報,2013,(7).
[4]厲雨靜,程宗毛.時間序列模型在股票價格預(yù)測中的應(yīng)用[J].商場現(xiàn)代化,2011,(33).
[5]徐國祥.統(tǒng)計預(yù)測與決策[M].上海:上海財經(jīng)大學出版社,2008.
[6]楊陽.股票價格預(yù)測方法研究[J].經(jīng)營管理者,2011,(16).
[7]翟志榮,白艷萍.時間序列分析方法在股票市場中的應(yīng)用[J].太原師范學院學報(自然科學版),2011,(1).
(責任編輯/浩 天)
F830.91
A
1002-6487(2016)23-0083-04
吳玉霞(1971—),女,河北邢臺人,博士后,副教授,研究方向:國民經(jīng)濟統(tǒng)計分析。溫 欣(1993—),女,江蘇徐州人,碩士研究生,研究方向:金融統(tǒng)計分析。