程瀚哲 首都經濟貿易大學
股票是現代金融市場中最常見、最重要的金融工具。股票市場在市場經濟活動中起到了至關重要的作用。股票市場可以讓企業發行股票籌集生產資本。企業可以通過股市傳播企業信息以起到宣傳作用、能夠反映企業自身的真實運營狀況及優化經濟市場資源配置。對于投資者來說,股票市場有了更多的投資原則,擴大了投資的選擇范圍,股票市場上可以隨時進行股票交易也降低了投資者投資所需要承擔的風險。對于國家來說,股票市場一直都是市場經濟的晴雨表,此外很重要的是能使社會的閑散資金合理流動。而沒有股票市場,常規的商品交易很難像股市一樣集成全國乃至全球范圍的,因為其虛擬資本運作的形式而擺脫了地域的限制來統合整體的經濟活動[1]。
股票市場的研究和預測難度很大,因為影響股票市場的因素眾多,國家政策、企業發展、投資情緒以及普遍存在大量的隨機事件導致股票市場變幻莫測,從因素上對股市進行分析很難有準確的預測。因此時間序列模型往往是用來進行股票價格預測的普遍選項。時間序列分析是通過數據本身的變化來反應數據走向規律的一種數據分析模型,常用的模型包括自回歸AR模型、移動平均MA模型、自回歸移動平均ARMA模型、差分自回歸移動平均ARIMA模型、自回歸條件異方差ARCH模型、廣義自回歸條件異方差GARCH模型等。應用合適的模型是時間序列分析的重要步驟之一,將股票數據擬合為恰當的模型能夠給股票價格帶來有價值的預測結果。
本文所使用的數據集是來源于Kaggle平臺的公開數據集:https://www.kaggle.com/rpaguirre/tesla-stockprice。該數據集記錄了T公司從2010年6月29日到2017年3月17日每天的股票價格數據。本文選取其中的收盤價序列(Close)進行分析,計算其更具研究意義的對數收益率,并對此對數收益率序列進行時間序列建模和預測。
首先,繪制出每日收盤價序列的時序圖(見圖1)。
從收盤價序列時序圖中可以看出,數據總體呈現出上升趨勢,并且具有隨著股價增加波動幅度更大的跡象,該序列的標準差近似與其水平值成正比。因此,本文根據此特征,需對此收盤價序列進行對數變換,以調整該序列的方差至近似一致。
然后,繪制出對數收盤價序列的時序圖及其延遲100階的樣本自相關圖(見圖2)。

圖2 對數收盤價序列時序圖
經觀察,對數變換后的收盤價序列在方差一致性方面確實有了顯著的改善。此外,對數收盤價序列仍具有明顯的上升趨勢,且不具有短期相關性。因此,本文認為此序列非平穩,對于其是否為差分非平穩,還需做單位根檢驗來進行進一步的探究。

圖3:對數收盤價序列ACF圖
對上述對數收盤價序列做一階差分,記差分后的數據為對數收益率,接下來,根據對數收益率序列的樣本偏自相關函數圖和R語言中的ar函數選擇ADF檢驗時自回歸模型的階數,對數收益率序列擬合自回歸模型時AR項階數選擇為0,于是ADF檢驗就退化為DF檢驗,對數收盤價序列DF檢驗結果如下:

表1 ar函數對對數收益率序列的估計結果
由于p值大于0.05,于是在0.05的顯著性水平下不拒絕原假設,即認為對數收盤價序列單位根非平穩。
進而需要檢驗對數收益率序列是否單位根非平穩(步驟同上述DF檢驗):

表2 ar函數對對數收益率一次差分序列的估計結果
由于p值小于0.05,于是在0.05的顯著性水平下拒絕原假設,即認為對數收益率序列平穩,因此不需要對對數收盤價序列做二次差分。
綜上,對數收盤價序列非平穩。若想實現平穩,則應對此序列進行一次差分處理,形成對數收益率序列。
首先,計算對數收益率序列的描述統計量。

表3 對數收益率序列的描述統計量
由樣本均值的t檢驗結果知:對數收益率序列的總體均值并沒有顯著地不同于0;正態性檢驗的結果顯示此序列并不服從于正態分布;樣本偏度為正,說明此序列右偏。
繪制對數收益率序列的樣本自相關函數圖,結合對數收益率序列的樣本ACF圖和PACF圖,以及其總體均值不顯著的特征,初步認定此序列為白噪聲序列,接下來需進一步做Box檢驗,檢驗結果p為0.4198。
由于p值顯著大于顯著性水平0.05,所以該序列不能拒絕白噪聲的原假設。
ARCH模型是自回歸條件異方差模型,解決了傳統計量經濟學時間序列變量的第二個假設方差恒定所引起的問題,應用于波動性有關的廣泛的研究領域,可以用來預測股票的波動率,來對風險進行控制,等等。不同于大部分預測被解釋變量期望著的模型,ARCH模型能預測被解釋變量的方差,準確地模擬時間序列變量波動性的變化。ARCH模型主要解釋序列中明顯的變化是否具有規律,說明這種變化依存的是內在傳導而不是外生性結構變化,能夠提高預測精度[2]。
繪制對數收益率絕對值序列的樣本自相關圖,并對其進行白噪聲檢驗。檢驗結論為對數收益率絕對值序列存在序列自相關。白噪聲檢驗結果也表明絕對值變換后的序列為非白噪聲序列。
繪制對數收益率平方序列的樣本自相關圖,并對其進行白噪聲檢驗。
對數收益率平方序列存在序列自相關,白噪聲檢驗結果也表明平方變換后的序列為非白噪聲序列。
非線性變換后不是獨立的,說明原序列也是非獨立的,因此,對數收益率序列具有某種自相關性,而且這種自相關性會造成序列的條件異方差性。基于此觀點,需對對數收益率序列進一步做ARCH效應檢驗。
對此對數收益率序列做McLeod-Li檢驗,McLeod-Li檢驗在5%的顯著性水平下都顯著,給數據具有ARCH特征提供了強有力的證據。
對對數收益率序列做拉格朗日乘子檢驗,LM檢驗在5%的顯著性水平下都顯著,給數據具有ARCH特征提供了強有力的證據。
Bollerslve在Engle的基礎上,借助自回歸移動平均ARMA模型的建立,建立了廣義自回歸條件異方差GARCH模型。他彌補了ARCH(q)模型中階數q過大時需要過多的參數的缺陷。這是一種允許異方差中同時存在自回歸項和滑動平均項的模型,GARCH(p,q)模型。顯然,如果p=0時,GARCH(0,q)模型就是ARCH(q)模型,可以將GARCH模型看成是ARCH模型的推廣,或者將ARCH模型看作是GARCH模型的特殊情形。
由于對數收益率序列ARCH效應的存在,所以應對此序列擬合ARCH模型或GARCH模型,首先需確定模型的階數。
根據ARCH模型定階應用平方序列的樣本偏自相關函數圖和GARCH模型定階應用平方序列的樣本EACF圖所示結果,建議設定ARCH(2)模型或GARCH(1,1)模型。
對數收益率應用正態分布的新息建立ARCH(2)模型,記作m1,對m1模型進行參數估計。
此模型的各參數估計值都顯著,模型表達式為:
檢驗結果顯示:均值方程和波動率方程都充分擬合了數據,模型AIC為-4.05562,但標準化殘差并不滿足正態性假定。
對數收益率應用學生t分布的新息建立ARCH(2)模型,記作m2,對m2模型進行參數估計。
此模型的各參數估計值都顯著,模型表達式為:
檢驗結果顯示:均值方程和波動率方程都充分擬合了數據,模型AIC為-4.232647。
對數收益率應用正態分布的新息建立GARCH(1,1)模型,記作m3,對m3模型進行參數估計。
此模型的各參數估計值都顯著,模型表達式為:
檢驗結果顯示:均值方程和波動率方程都充分擬合了數據,模型AIC為-4.061315,但標準化殘差并不滿足正態性假定。
對數收益率應用正態分布的新息建立GARCH(1,1)模型,記作m4,對m4模型進行參數估計。
此模型的各參數估計值除omega外都顯著,但考慮到條件方差的長期水平不能為0,于是參數omega不予剔除。模型表達式為:
檢驗結果顯示:均值方程和波動率方程都充分擬合了數據,模型AIC為-4.254761。
匯總上述通過檢驗的模型的AIC值,并進行樣本內比較:

表4 模型AIC值匯總
m4模型的AIC值最小,因此,認為m4模型為相對最優模型。
畫出對數收益率m4模型的波動率圖像(見圖4)。

圖4 m4模型的波動率圖像
畫出對數收益率m4模型的標準化殘差時序圖(見圖5)。

圖5 m4模型的標準化殘差時序圖
由上圖可見,標準化殘差序列基本在水平線0的上下波動,且波動幅度近似一致。
畫出對數收益率的m4模型的標準化殘差樣本自相關圖(見圖6)。

圖6 m4模型的標準化殘差樣本ACF圖
畫出對數收益率m4模型的標準化殘差平方樣本自相關圖(見圖7)。

圖7 m4模型的標準化殘差平方樣本ACF圖
圖6不表明標準化殘差過程中有顯著的序列相關性,圖7不表明標準化殘差過程中有顯著的條件異方差性,因此,m4模型通過了診斷,可以用作預測。
應用m4模型對T公司的對數收益率序列進行了10期外推預測,預測結果如下:

表5 對數收益率的m4模型的預測結果
保留原對數收益率序列的后50條數據,并結合上述m4模型的預測結果,繪制出如下預測圖像(見圖8)。

圖8 對數收益率的m4模型的預測圖像