李嘉松
(安徽大學 經濟學院,安徽 合肥 230601)
基于ARIMA模型的滬深300指數預測及誤差因素分析
李嘉松
(安徽大學 經濟學院,安徽 合肥 230601)
本文使用Eviews軟件建立ARIMA模型,對采樣一年期的滬深300日數據進行數學處理,識別出建立模型的形式并且建立ARIMA模型,通過所建立的模型對滬深300指數進行預測.通過計量經濟學方法評價預測質量,并根據實際預測結果,指出造成滬深300指數的實際值和模型預測值之間有差別的原因,為廣大投資者提供滬深300指數的預測方法來作為未來進行股票投資和金融衍生產品投資的參考.
ARIMA模型;滬深300預測;誤差;影響因素
現行股票市場為了方便個人投資者或機構投資者把握市場風向,理性安排投資規模和投資組合,編制了多種類型的股票價格指數,如上證綜指,深證成指,上證180和上證50等.滬深300指數由于其諸多特點受到廣泛關注,滬深300所選用的成分股具有很高的穩定性,一般異常股票和新股不作為成分股,且由股票的自由流通量作為確定成分股權重的標準.綜合這些特點,滬深300作為廣大投資人進行金融投資決策的重要參考指標.
股票市場具有很強的不確定性,波動性,由于大部分的金融投資決策需要依賴于準確的市場預測,所以,如果能準確掌握未來的股票指數動向,就能在投資決策的過程中占據更多的主動權.對于預測滬深300指數,ARIMA模型是目前業界采用的比較多的方式.本文通過Eviews軟件建立合適的ARIMA(p,d,q)模型,對滬深300指數的日指數進行預測.[1]
2.1 模型選擇
本文的研究使用ARIMA模型,ARIMA模型是在ARMA(自回歸移動平均模型)的擴展概念,將數據進行差分之后使得數據從非平穩數據變為平穩數據后再使用ARMA模型進行預測.當所選序列為平穩數列時,可以直接使用ARMA模型.
2.2 數據來源
本文通過選取2015年07月15日到2016年11月14日的滬深300的日數據(325個數據),數據來源為新浪財經,將這325個數據視為一個整年度的數據來處理(圖1).
2.3 數據處理
為了減小序列的波動,現在對序列進行對數變換.對變換后的數列進行自相關和偏自相關分析,根據分析結果(圖2)可以看出,對數數列的自相關分析圖為非平穩序列.為了使用ARMA模型,需要對數列進行差分.采用分析自相關分析圖來確定時滯數[2],決定對已經取對數的數列采取時滯數為(0,3)的差分,以消除其趨勢性和季節性.之后對得到的新數列數據(圖3)可以看出其觀測值都在圍繞某一值上下波動,振幅變化不劇烈,再次進行自偏相關分析,得到的結果(圖4)可以看出序列已經基本平穩,然而偏相關分析圖顯示數據,季節性依舊明顯,對該系列進行二階季節差分,發現序列的這種季節性沒有得到明顯改善,故在此只進行一階季節差分,即可以直接使用進行過一階季節差分的數據建立ARIMA模型進行預測.

圖1 滬深300日數據圖(2014.11.26-2016.02.23)

圖2 取對數后新數據的自相關分析圖

圖3 對原數列取對數并進行時滯數為3的季節差分數據圖

圖4 經過季節差分之后的數據的自相關分析圖
2.4 模型識別
在建立ARMA模型的過程中,可以通過自相關偏自相關圖分析得到ARIMA(p,d,q)中的p和q的數值.根據AC (Autocorrelation)的截尾可以確定MA(q)中的參數q的值,而根據PAC(Partial Correlation)的截尾性可以確定AR(p)的參數p的值.從圖中可以看出,AC與PAC均表現出截尾.可以根據PAC圖確定AR(p)參數p為3,另外根據AC圖確定MA(q)參數q為2.所以可以建立ARMA(3,2)的預測模型.
2.5 模型的建立
通過自相關和偏自相關分析圖,可以確定模型參數,之后使用Eviews軟件并且通過最小二乘法計算參數的估計量.以ARMA(3,2)建立模型.得到的參數估計結果如表5所示.根據輸出的結果來看,模型的DW統計量略小于2,可以認定序列基本不存在序列相關,并且inverted AR/MA roots都在單位圓內,符合模型要求.模型的AIC指標和SC指標值都相對較低,綜合調整之后的決定系數為0.72.可以認定模型的擬合程度較好.并且對該模型的殘差序列進行白噪聲檢驗,檢驗結果表面殘差序列相互獨立即為白噪聲的概率很大,故不能拒絕序列相互獨立的原假設.模型最終估計結果為:(1-0.016841B3)(1-0.177749B-0.605439B2-0.144559B3) (1-B3)Yt=(1+0.987507B3)(1-0.835345B-0.238111B2)Ut,其中Yt=log(X),X為滬深300當日收盤價;Ut為隨機干擾項;B為滯后算子.
建立了模型之后,對Yt值進行預測,假設我們要預測2015年7月15日到2016年2月23日的滬深300收盤價格,我們使用Eviews軟件完成模型的預測,采用動態預測(Dynamic).得到預測圖如圖6.把模型中預測的滬深300指數和實際的滬深300指數進行對比,可以通過該圖看出,通過模型的預測,所能得到的預測值與實際值的差別在可接受范圍內,并且從模型BP,TIC,MAPE等指標均可以看出模型預測的可信度和準確度也很好.把模型中預測的滬深300指數和實際的滬深300指數進行對比,給出整個樣本期實際指數和預測指數對比,可以看出雖然模型中數據產生偏差有時候較大,但是總體對于趨勢的預測是相對準確的.說明該模型的預測可以為投資者提供相對可靠的投資參考.
從模型預測顯示的趨勢看出,上證指數在目前階段處于一個穩定的震蕩期,雖然還沒到達2014年的支撐線指數水平,但是有比較明顯的穩中回升跡象,投資者應該保持一個審慎樂觀的態度來觀察后市動向,適時抓住入市機會.

圖6 對目標期間指數的預測(預測DATAF與實際收盤價DATA的對比)
通過預測曲線和實際滬深300指數的對比可以發現,實際值和預測之間的差額有時會產生很大的偏差,偏差的一方面原因來源于ARIMA模型本身的局限性和設定過程中由于簡化模型所產生的誤差.而另一方面就要尋求指數本身受外界因素的影響[3].
在通過ARIMA模型設定模型產生誤差中,可以理解為產生誤差的因素來自于外生的偶然性變量,眾所周知,滬深300反映了在上交所和深交所上市的權重股票的股價變動情況,而股價主要收到下列幾個方面的影響,市場前景,經濟狀況,企業發展前景,投資者心理等,但是,由于我國股市起步晚,各方面體系還不穩定.下面著重分析影響指數的非經常性因素[4].
4.1 政治性因素
由于我國政府的政策對經濟的導向能力較強,所以政府對于政策的發布取消和法律文件的修改都會對股市的未來走向產生巨大的影響,這種影響一方面來自于政令本身對于股市波動的直接作用,另一方面就是對投資者的心理影響產生的間接作用,讓投資者對未來產生利好后者利空的情緒,并且這種情緒是會相對放大的.一般有預告性的政策不會使得股市產生突然性波動,但是頒布過程有一定突然性的政策,會使得股市產生非自然的劇烈波動,個股的普遍波動,就會反映到滬深300指數上,體現為指數的不可預測的波動.
雖然說政府政策對于股市波動的影響是在世界各國普遍存在.但是在中國,政策的影響有一些特點.首先,中國政府政策對于經濟運行的影響相對其他國家都要更加強烈和有效,政府的公信力和對于經濟的控制能力是在各國政府中較為出眾的,所以有中國政府頒布的政策法規對人們的心理影響是非常大的,人們會做出超出理性范圍內的應對反映,從微觀上表現為大量的買入和賣出,宏觀上則表現為股市巨量波動.其次,中國政府的經濟首要目標是經濟的穩定發展,也就是說經濟的穩定是第一要務,所以政府政策也會配合這種目的,當股市有大漲大落的趨勢的時候,政府往往會出臺逆經濟形勢的政策使得經濟回到相對穩定的路線上.所以可以看出當故事出現劇烈波動后,往往接下來會進入一個相對穩定時期,而模型本身很難預料到這種偶然因素的影響,這也就是誤差產生的一個原因.
4.2 節假日因素
由于我國股票交易制度,周六,周日和節假日等均是休市期,本身休市并不會對股票市場產生影響,但是從實踐中來看,我國經常在周五和周一以及節假日兩端的交易日產生于總體趨勢不相符的波動.這是由于在休市期間,一旦頒布一些新政策,會讓下一個交易日產生巨大波動,人們處于自身穩健性投資的需要往往要回避這種風險,所以往往選擇在節假日前放棄持股.這種行為更多來自于人們心理的影響.所以這也是解釋實際值于預測值之間區別差別的原因之一.
4.3 指數編制技術因素
滬深300指數相比于上證綜合指數來說,對于指數內成分股有著自己獨特的選擇條件.首先剛剛上市的股票和ST股票是不會被選為成分股的,也就是說當一個股被從普通股調整為ST股之后,可能就會喪失了進入成分股的資質,被從原編制體系中剔除.在這個過程中,滬深300股指也會由于這種偶然性因素產生波動,但是相比于上面兩個因素,這個因素對于實際股指偏離預測值的貢獻要小很多,因為滬深300正是由于需要保持相對的穩定性,不受個股影響等才編制了這些規定[5],所以指數編制本身的波動是很小的.
由于滬深300指數具有非平穩性,時序性,隨機性等特點,使得其可以使用ARIMA進行預測,但是也是由于滬深300指數受人們主觀投資心理影響較大,季節性表現不明顯,所以在建立模型的過程中很難完全消除序列的非平穩性,為了簡化模型,也往往像本文一樣將P和q參數的值取相對較小.雖然簡化了模型,但是由于本文模型在選用數據過程中是直接先對原始數據取對數在直接進行季節差分,用處理過的數據再用于模型建立預測,盡可能保留了重要信息,根據擬合結果和預測指標來看,也能作為投資者投資活動中的重要參考.
〔1〕趙志峰.對建立中國股票價格指數時間序列模型的探討[J].統計與信息論壇,2003(1).
〔2〕劉冰.滬深300股指期貨期現套利中現貨選擇研究[J].時代經貿(中旬刊),2007(SC).
〔3〕白營閃.基于ARIMA模型對滬深300指數的預測分析[D].華南理工大學,2010.
〔4〕馮予,陳萍.非線性時間序列分析在股市行情預測中的應用[J].南京理工大學學報,1998(01).
〔5〕陳晶鑫.基于灰色模型和ARCH模型對股價指數的實證分析[D].東北財經大學,2007.
〔6〕Chung,Y.P.A TransaetionsDataTestofStoek Index Futures Market Effieiency and Index Arbitrage Profitability.The Journal of Finance.2007.
〔7〕李春曉.基于ARIMA模型的股票市場并購套利異常收益的研究[D].云南師范大學,2014.
〔8〕徐緒松,馬莉莉,陳彥斌.我國上海股票市場GARCH效應實證研究[J].武漢大學學報(理學版),2002(03).
〔9〕李揚.ARIMA模型對我國壽險業潛在保費的預測研究[D].湖南大學,2006.
〔10〕張數京,齊立心時間序列分析簡明教程[M].北京:清華大學出版社,2003.
F830.91
A
1673-260X(2017)01-0073-03
2016-10-03