劉松 張帥



摘 要:隨著我國(guó)資本市場(chǎng)的擴(kuò)大開(kāi)放,國(guó)外資本進(jìn)一步流入我國(guó)股市,中國(guó)股市迎來(lái)新的挑戰(zhàn)與機(jī)遇。金融市場(chǎng)股票的價(jià)格預(yù)測(cè)問(wèn)題再次成為公眾關(guān)注的熱點(diǎn)?;诖耍x取金融市場(chǎng)股票的歷史收盤價(jià)數(shù)據(jù),以Python為實(shí)現(xiàn)工具,通過(guò)建立ARIMA模型來(lái)進(jìn)行檢驗(yàn)與預(yù)測(cè),得到的股價(jià)預(yù)測(cè)值與真實(shí)值短期內(nèi)最大誤差不超過(guò)0.04。這表明以ARIMA模型對(duì)股價(jià)進(jìn)行短期預(yù)測(cè)具有很好的效果,能夠?yàn)楣墒型顿Y者提供幫助。
關(guān)鍵詞:Python;ARIMA模型;股價(jià)預(yù)測(cè)
中圖分類號(hào):F830.91? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2021)25-0076-03
引言
正如我們所知,股票市場(chǎng)是企業(yè)融資的重要渠道,也是反映一個(gè)國(guó)家經(jīng)濟(jì)狀況的“晴雨表”。股票的價(jià)格作為股票市場(chǎng)的重要信息,其價(jià)格的變化是成千上萬(wàn)投資者的共同決策結(jié)果,因此影響股價(jià)波動(dòng)的因素眾多。不同的因素會(huì)對(duì)股價(jià)造成如何的影響,影響的程度有多大,往往難以衡量。因此,我們不去探究?jī)r(jià)格變化背后原因是什么,而以過(guò)去的價(jià)格變化為依據(jù),去發(fā)現(xiàn)股價(jià)變化的規(guī)律,從而實(shí)現(xiàn)對(duì)股價(jià)的預(yù)測(cè)。當(dāng)然作為一種隨機(jī)變化過(guò)程,我們無(wú)法完全預(yù)測(cè)股價(jià)的未來(lái)走向,但這不代表股價(jià)就是完全不可預(yù)測(cè)的,股票價(jià)格的變動(dòng)過(guò)程就是一組可以看得到的時(shí)間序列數(shù)據(jù),其既反映股價(jià)的隨機(jī)變化,也包含了一定的系統(tǒng)運(yùn)行規(guī)律。ARIMA模型理論成熟,是當(dāng)前處理時(shí)間序列數(shù)據(jù)的常用預(yù)測(cè)模型,可以很好預(yù)測(cè)具有波動(dòng)性的時(shí)間序列數(shù)據(jù)的短期趨勢(shì)。因此,本文運(yùn)用ARIMA模型對(duì)西南證券的收盤價(jià)作為歷史數(shù)據(jù)進(jìn)行建模,以當(dāng)前熱門的Python作為建模工具,對(duì)未來(lái)四天的股價(jià)進(jìn)行預(yù)測(cè)。
一、選題意義與模型理論基礎(chǔ)
(一)選題意義
基于Eveiws所實(shí)現(xiàn)的股價(jià)預(yù)測(cè)方法已有相應(yīng)成熟的研究,且該方法在短期的預(yù)測(cè)精度能夠得以保證,但還有許多的不足。而Python在股價(jià)預(yù)測(cè)領(lǐng)域的應(yīng)用有待檢驗(yàn),基于這樣的背景,本文希望通過(guò)使用Python工具進(jìn)行股票價(jià)格的短期預(yù)測(cè),以對(duì)比Eviews工具做出的結(jié)果,分析使用新的研究工具是否可以給股價(jià)帶來(lái)更精確的估計(jì)。
(二)ARIMA模型理論介紹
ARIMA模型又被稱為自回歸移動(dòng)平均模型,于20世紀(jì)70年代由美國(guó)統(tǒng)計(jì)學(xué)家Jenkins和英國(guó)統(tǒng)計(jì)學(xué)家Box提出。該模型主要運(yùn)用在時(shí)間序列變量的短期預(yù)測(cè)中,因單個(gè)時(shí)間序列值具有不可測(cè)性,但整體時(shí)間序列值具有一定的規(guī)律,使用ARIMA模型將這種規(guī)律以數(shù)學(xué)形式表示。并通過(guò)對(duì)數(shù)學(xué)形式的研究,實(shí)現(xiàn)對(duì)時(shí)間序列值的短期預(yù)測(cè)。
ARIMA模型可分為三種,AR(p)模型為自回歸模型,MA(q)模型為滑動(dòng)平均模型,ARIMA(p,d,q)為自回歸滑動(dòng)平均模型。ARIMA是前兩種模型的糅合,其中AR是自回歸過(guò)程,p為自回歸的階數(shù);MA為移動(dòng)平均過(guò)程,q為移動(dòng)平均階數(shù),d為非平穩(wěn)向平穩(wěn)轉(zhuǎn)變的差分次數(shù)。
一般的ARIMA(p,q)模型形式可以表示為:
(1)式中,{?著t}是白噪音序列,p和q都是非負(fù)整數(shù),AR和MA模型都是ARIMA(p,q)的特殊情形,當(dāng)p=0時(shí),ARIMA(0,q)=MA(q);當(dāng)q=0時(shí),ARIMA(p,0)=AR(P)。
由于ARIMA模型運(yùn)用于時(shí)間序列平穩(wěn)狀態(tài),而當(dāng)時(shí)間序列處于不平穩(wěn)時(shí),需要經(jīng)過(guò)一系列的處理,使時(shí)間序列平穩(wěn)化。在含有短期趨勢(shì)平穩(wěn)的非平穩(wěn)時(shí)間序列可以通過(guò)差分使非平穩(wěn)序列成為平穩(wěn)序列。
(三)ARIMA模型建模步驟
ARIMA模型的建模可分為以下四個(gè)步驟:首先,對(duì)原序列進(jìn)行平穩(wěn)性檢驗(yàn),如果檢驗(yàn)結(jié)果為不平穩(wěn),需要通過(guò)差分變化或者其他變化,使序列滿足平穩(wěn)性條件。其次,通過(guò)計(jì)算描述序列特征的統(tǒng)計(jì)量來(lái)確定模型,并結(jié)合BIC準(zhǔn)則確定模型的階數(shù)。再次,利用最小二乘法估計(jì)模型的參數(shù),并進(jìn)行合理性檢驗(yàn)。最后,進(jìn)行診斷分析,通過(guò)生成的模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),并將實(shí)際數(shù)據(jù)與之進(jìn)行對(duì)比,進(jìn)行預(yù)測(cè)準(zhǔn)確定檢驗(yàn)。若不精確重新確定參數(shù),再次建立新的模型。
二、ARIMA模型的建立與分析
(一)數(shù)據(jù)來(lái)源
本文數(shù)據(jù)來(lái)源于Wind數(shù)據(jù)庫(kù),從Wind上選取西南證券自2019年1月2日至12月9日的股票收盤價(jià)作為原始數(shù)據(jù),數(shù)據(jù)樣本總量為229個(gè)。樣本量基本涵蓋了西南證券2019年以來(lái)的所有交易日的收盤價(jià)。
(二)數(shù)據(jù)的單位根檢驗(yàn)與平穩(wěn)化處理
通過(guò)Python可視化,對(duì)西南證券股價(jià)的原始數(shù)據(jù)處理,可以得到收盤價(jià)的時(shí)間序列圖像,通過(guò)觀察圖像我們發(fā)現(xiàn),西南證券的收盤價(jià)時(shí)間序列數(shù)據(jù)呈現(xiàn)非平穩(wěn)的特征,這對(duì)于數(shù)據(jù)的初步判斷來(lái)說(shuō)還遠(yuǎn)遠(yuǎn)不夠。因此,我們通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行單位根檢驗(yàn),對(duì)數(shù)據(jù)進(jìn)行單位根檢驗(yàn)后,得出ADF檢驗(yàn)的t統(tǒng)計(jì)量為-2.786767均小于在顯著性水平為1%、5%和10%時(shí)分別所對(duì)應(yīng)的臨界值-3.458366,-2.873866和-270.425668??梢缘贸?,原始數(shù)據(jù)的ADF檢驗(yàn)結(jié)果落于接受原假設(shè)區(qū)間內(nèi),即西南證券的收盤價(jià)時(shí)間序列數(shù)據(jù)存在單位根,數(shù)據(jù)是非平穩(wěn)的。時(shí)間序列數(shù)據(jù)的非平穩(wěn)可以通過(guò)差分法來(lái)進(jìn)行解決,因此我們對(duì)原始數(shù)據(jù)進(jìn)行一階差分,并進(jìn)行ADF檢驗(yàn)得出t統(tǒng)計(jì)量的值,在對(duì)數(shù)據(jù)進(jìn)行一階差分處理之后,此時(shí)得出的t統(tǒng)計(jì)量的值為-16.611521均大于在顯著性水平為1%、5%和10%時(shí)分別所對(duì)應(yīng)的臨界值-3.458366,-2.873866和-270.425668。也就意味著在對(duì)原始數(shù)據(jù)進(jìn)行一階差分處理之后,時(shí)間序列數(shù)據(jù)不再是非平穩(wěn)的。
(三)ARIMA模型的建立與參數(shù)估計(jì)
建立ARIMA模型的關(guān)鍵就是要通過(guò)觀察ACF、PACF圖,以及通過(guò)BIC信息準(zhǔn)則來(lái)確定ARIMA模型的最佳p值和q值。通過(guò)Python,可以得到相應(yīng)的自相關(guān)圖ACF和偏自相關(guān)圖PACF,根據(jù)ACF、PACF圖的觀察方法,暫定ARIMA模型的p、q值為1,1,即模型為ARIMA(1,1)。為保證模型的最優(yōu),僅僅通過(guò)肉眼的觀察不足以判斷ARIMA模型最優(yōu)的p、q值,還必須通過(guò)BIC信息準(zhǔn)則來(lái)做進(jìn)一步判斷,即找出BIC最小值。