王依婷 韋江英








摘要:利用ARMA模型對上證50的全收益股票收盤價(20170103-20180508)的數據進行分析,并預測未來5天(20180509-20180515)的上證50全收益指數收盤價數據,與實際數據相對照,模型預測誤差較小,說明ARIMA模型比較適合金融市場上的時間序列的研究和預測,為決策者和投資者提供決策指導。
關鍵詞:時間序列;ARIMA模型;股價預測;上證50
一、數據選取與方法選擇
(一)數據選取
金融時間序列是屬于時間序列數據的一種,首先,序列中的數據的取值依賴于時間的變化,具有單調性,其次,每一時刻上的數據取值具有一定的隨機性。不可能完全準確地用歷史值預測,再次,前后時刻的數值具有一定的相關性,這種相關性就是系統的動態規律性,最后,從整體上看,金融時間序列往往呈現出某種趨勢性或出現周期性變化的現象。以上特征都表明金融時間序列是比較典型的時間序列,所以可以通過金融計量學的知識根據現有數據對未來數據進行預測。
上證50全收益指數是上證50指數的衍生指數,與上證50指數的區別在于指數的計算中將樣本股分紅計入指數收益,供投資者從不同角度考量指數走勢。筆者在上海證券交易所中可以找到了中國上證50全收益指數收盤價從從2017年1月3日到2018年5月8日的322個數據作為研究樣本。
(二)方法選擇
1.ARIMA模型介紹
ARIMA是由統計學家Box和Jenkins提出的,能夠準確預測非平穩時間序列的方法,在計量經濟學中得到廣泛應。ARIMA模型的基本原理:把時間序列視為隨機過程,用一個數學模型來描述或模擬;一旦該模型可確定,就可用該時間序列的過去值和現值來預測未來值。該模型考察了時間序列的動態、持續特征,揭示了時間序列過去與現在、將來與現在的相互關系。若序列{x}能通過d次差分后變成平穩序列{y},于是可以直接建立適用于平穩序列的ARMA模型。
經過d階差分后的ARIMA(p,d,q)為本文采用的模型。其中P為AR的階數,9為MA的階數,d為差分階次,為一個白噪聲序列。ARIMA模型建模需要經過5個步驟,即序列純隨機性檢驗,序列平穩性檢驗,模型的識別與定階,模型參數估計和殘差的純隨機性檢驗。
2.純隨機性檢驗(如圖1)
P值<顯著性水平a,拒絕原假設,說明該序列存在相關性,可以用來做實驗分析。
3.平穩性檢驗
首先,從時序圖分析,明顯可以看出,該序列不平穩;初步判斷,認為該序列具有一定的隨機趨勢,再做單位跟檢驗:(如圖2)
選擇顯著性水平為5%,ADF值>該顯著性水平下的臨界值,則序列存在單位根,即序列表現為非平穩。
4.選擇ARIMA模型進行數據擬合
對于存在趨勢性的非平穩序列,可以選擇ARIMA模型和組合模型兩種方法來進行分析,考慮到該序列的隨機趨勢特征比較明顯,可以通過原始序列做差分來進行平穩化處理,所以相對來說,ARIMA模型是更簡單的選擇。
二、模型的建立與預測
(一)模型的建立
1.平穩化處理
經過多次嘗試發現,對序列做二階差分能得到比較平穩的序列,二階差分后的時序圖顯示出差分后序列在均值附近比較穩定地波動。為了進一步確定平穩性,對差分后序列做單位根檢驗,如表3:
ADF值<該顯著性水平5%下的臨界值,則序列不存在單位根,即序列表現為平穩。其次,還發現該序列的截距項與趨勢項都不顯著,說明該序列不存在截距項和趨勢項。
2.模型的識別與定階
通過觀察差分后序列的自相關圖和偏自相關圖可以發現,兩個圖都為拖尾,所以應該擬合ARMA模型,如圖4所示:
3.ARMA模型的擬合
為了最后能更好地預測原序列,采取了直接使用函數形式的參數估計方法,通過多次嘗試,發現擬合如圖5所示的模型是比較好的:
首先,t檢驗都通過;其次,單位根的絕對值都小于1;而且,擬合優度正常。(如圖6)
最后,再做殘差的純隨機性檢驗:
檢驗通過,殘差為白噪聲序列,說明信息提取比較充分,模型擬合得較好。
估計的方程如下:
Xt=0.19xt-1-0.17xt-4-0.13xt-5+0.99at-1+at
(二)模型預測
預測0509、0510、0511、0514、0515五期的值(雙休日跳過),預測圖表明,預測效果比較好。(如圖7)
預測值與上海證券交易所的真實值比較情況如下表所示,預測誤差的百分比絕對值保持在3%以下,也可以看出,預測效果較好:(如圖8)
三、結論
本文利用時間序列分析中的ARIMA模型,對上證50全收益指數收盤價這一時間序列進行模型的建立和實證分析,了解金融市場中股票價格指數的基本特征。通過建模發現ARIMA模型較好地解決了非平穩時間序列的建模問題,借助Eviews軟件可以方便地將ARIMA模型應用于金融等時間序列的研究和預測,為決策者和投資者提供決策指導。