陳 成,丁皖婧
(1.中國勞動關系學院 法學院;2.中國政法大學司法文明協同創新中心,北京 100048)
證券業行政監管的法治化建設有賴于監管者采取及時、有效的執法手段,這要求監管者具備一定股價風險預測的能力。目前,國內外關于股價指數預測的研究主要集中在預測方法和模型上:有學者通過穩態分布法和多重分形游走法,分析中國股市收益分布、趨勢特點等[1,2];有學者則運GARCH模型,預估中國股票波動率,但該方法長期預估能力較弱,而采取RBF神經網絡方式,則更適合非線性系統的預估[3-6];也有學者運用灰色系統理論、支持向量機集成方法,構建起GM(1,1)模型等股市預測模型[7,8]。此外,也有基于R/S分析法和VAR模型的研究[9-11],但仍需一套更為全面的股價預測模型和方法。
綜上,VAR模型具有區別與其他模型的特點:第一,該模型理論上不依賴于傳統的其他經濟理論。但須保證模型中變量的相關性,也要準確把握滯后階數p,建立后的模型與變量間的關聯性。第二,參數有為零的可能,不含可能是當期變量的解釋變量,可設多個參數估計,事實上,無約束VAR模型與相關經濟預測具有高度的適配性。本文的創新點在于:第一,利用VAR模型,設計具體的預測方法,并導入近485個交易日的開盤價、最高價、最低價和收盤價作為樣本。第二,分析了Granger因果效應和相應的脈沖響應函數,以證明VAR模型預測具有較高可信度,從而為監管證券公司所存在的風險提供了理論支持。
向量自回歸(VAR)模型的優勢在于相關經濟指標的多樣性和操作性上,在特定的情形下也能由多元MA和

其中,Πi是n×n系數矩陣,εt是一個 (n× 1)具有零均值的白噪聲向量,并且是不相關的,Σ表示協方差矩陣。例如一個滯后2階的向量自回歸模型有如下的形式:

本文引入滯后算子,來簡化VAR模型。引入滯后算子滯后,VAR(p)模型可以寫成:

假設式(1)的Yt是協方差平穩的,然后無條件均值由下式給出:

則均值調整過后的VAR()p模型是:

在參數估計上,考慮最基本的VAR(p )模型(1),并假設VAR(p)模型是平穩的,而且對模型的參數沒有任何的限制。則VAR(p)中的每一個方程均可以寫成下面的表達式:

其中,yi表示一個在第i個方程的T×1維向量,Z表示一個T×k的矩陣,第 t行為k=np+1,πi是一個 k×1的參數向量,ei是T×1的誤差,因為每一個方程都有相同的解釋變量,所以每個方程可以各自的用普通的最小二乘估計。表示n個方程的最小二乘系數矩陣,維數為nk×1。


在原假設成立下,式(8)服從自由度為q的卡方分布,其中q=rank(R)線性限制的數量。在滯后階的選擇上,VAR(p)的滯后階的選擇往往用模型選擇的準則,一般的途徑是用 p=1,…,pmax擬合模型,然后選擇 p的值去最小化模型選擇準則。VAR(p)模型選擇準則有如下形式:



AIC準則大于零的概率漸進過高估計滯后階數,當真實滯后階小于或等于pmax時,BIC準則和HQ準則能夠在一般情況下相對公平地估計出最佳滯后階數。
給定一個元時間序列Yt,t=1,…,T,如何去預測YT+1,則是根據上文對模型分析,本文已經計算出VAR()p模型中的Π,并假設沒有決定性趨勢和外生變量的影響。則YT+1可以給出以下式子:

如果要預測更遠的值,則可對上式稍做改進,得到:

其中,當 j≤0時,YT+j|T=YT+j,則h步預測誤差可以表示為:

其中,矩陣Ψs可用下面的遞歸方程得到:

因為所有的預測誤差和期望為0,所以此預測是無偏的,預測誤差的均方誤差為:

現在考慮預測YT+h的值,當VAR(p)模型參數都已經估計出來時,那么YT+h最好的線性預測公式為:





考慮到樣本的完整性和參考價值,本文選取2015年1月5日到2016年12月27日共計485個成交日的滬深300指數的開盤價、最高價、最低價和收盤價作為樣本,并分別記為Yk、Yg、Yd、Ys。本文采用S-plus軟件,滯后階數為2,對上證指數下一期的開盤價、最高價、收盤價、最低價通過VAR模型進行擬合預測。通過S-plus軟件可以得到Yo、Yh、Yl、Yc的R2和殘差平方和等。
從圖1可以看出四個指標均是平穩序列,所以滿足VAR模型的條件,因此可以建立VAR模型。

表1 擬合優度指標
從表1可以看出,該模型的R2以及調整的R2值比較高,故擬合優度較高且非常顯著,因此可以初步判斷模型能夠對股價指數進行較好的估計。并且通過計算得到VAR模型的系數如表2所示。

表2 系數矩陣
本文以收盤價為例,對于開盤價、最高價和最低價可以由類似計算得到。

圖2給出了四個指標的殘差序列圖,這四個指標的擬合程度比較相似,如果只是做簡單的預測,則可以到此為止,但是對一個模型的評價還要從其他方面考慮,比如模型的穩定性。

圖2真實值和預測值的殘差圖
值得注意的是,表2中列出了系數矩陣,這個系數矩陣就是在上文提到的Π?,它的每一列恰好是VAR()2中對應方程的系數。用S-plus計算得到的特征根為:


本文繼續用上面的例子,通過對2015年1月5日到2016年12月27日的上證指數的開盤價、收盤見、最高價、最低價進行對下一個交易日進行預測。

表3 預測值與真實值對比
通過表3的對比可以明顯看出,模型所估計出的三日內上證指數與當天真實值的差別。這驗證了本文之前的結論,預測的步長不能太長,從該表數據顯示,1步預測的結果在準確度上是有一定保證的,但伴隨預測步長的逐漸遞進,總體預測精度呈現遞減的態勢。因此,在預測時要不斷更新基本數據,使得其預測的精度更高。在預測下一期股價指數誤差較小的情況下,投資者理論上可以將預測值作為參考,在股票市場上進行交易和操作,從而達到降低風險和增加收益的目的。在預測值和真實值相當接近的情況下,投資者在當期預測出下一期股價指數的最高價和最低價時可以采用謹慎的交易策略。即以高于最低價預測值的價格買進,以低于最高價預測值的價格賣出,只要交易價格在這一預測的區間之內,則獲得收益的幾率理論上來說將變得非常高。只要利差存在,利用該模型進行下一交易日股價指數預測就具有可操作性和降低風險的意義。
本文根據AIC、BIC以及HQ準則來對階數進行選擇,通過S-plus軟件可以得到,最佳的滯后階數為1,即此時各項系數可以通過表4來表示。

表4 滯后階數為1的估計出的系數

圖3預測走勢以及置信區間
圖3畫出了滯后項為1時的預測圖,圖中的虛線表示預測值的置信上下限,可以看出隨著預測步長的增加,預測精度越來越差,在圖中表現是置信上下限呈喇叭狀向外延伸。
一般的VAR(P)模型有很多參數,由于變量間復雜的交互和回饋效應使得模型的解釋性比較差,因此,VAR(P)的動態性質應運而生。三種常用的結構分析是:(1)格蘭杰因果檢驗;(2)脈沖響應函數;(3)預測誤差方差的分解。下面結合本文上證指數的例子來研究這三種結構分析。
VAR(p)模型的主要作用就是預測,VAR模型的結構提供了一個變量或一組變量對其他變量的預測能力。Granger最早提出了一個變量的預測能力。如果一個變量或者一組變量,發現y1有助于預測另一個變量或者另一組變量y2,然后就稱y1是y2的Granger原因,否則稱y1不是y2的格蘭杰原因。嚴格來說,如果y1不是y2的Granger原因,則對于所有的s>0基于預測的y2,t+s的MSE和基于預測的y2,t+s的MSE一樣。顯然,Granger因果檢驗并不是真正意義下的因果性,它僅僅是指預測能力。
下面是針對兩個時間序列變量來說明y2不是y1Granger因果關系,如果對于模型的系數矩陣都是上三角矩陣,則說明y2不是y1的Granger原因。也就是說VAR()p模型具有如下形式:

所以在預測y1的方程中,y2的所有滯后項的系數均為零,相似的是如果在預測y2的方程中,y1的所有滯后項的系數均為零,Granger非因果暗示p階線性限制條件用Wald統計量。如果y2不是y1的Granger原因且y1不是y2的Granger原因時,VAR模型的系數矩陣( )Π1,Π2,…,Πp是對角陣。此時就相當于進行兩次單獨的AR模型。
對于一般的情形,本文將舉例展示Granger因果關系。例如,考慮一個模型,有三個變量,令在這個模型中,如果在預測y1的方程中,所有y2的滯后階的系數都為零,則y2不是y1的Granger原因。相似的,在預測y1的方程中,所有y3的滯后階的系數都為零,則y3不是y1的Granger原因,這些簡單的線性條件都可以用上文提到的Wald統計量來檢驗。
下面用Granger因果方法來檢驗上證指數中開盤價、收盤價、最高價和最低價影響相互預測能力的大小。即對模型中的某個內生變量對于目標變量是否可以看作是外生變量,同時包括對模型中每個方程中右側所有內生變量對于目標變量是否可以看作外生變量。
根據上面的結論可以構造出R,這里用滯后階數為2的系數來計算假設檢驗統計量,在這里通過兩個例子來說明,假設收盤價對開盤價無Granger效應,則即原假設H0為:

由于R中的列數太多,本文簡記成上面的符號,在這里需要說明R是一個2×36的矩陣,R中的元素04、031、09、026表示在其當前行有4、31、9、26個0,通過公式(8)定義的Wald統計量計算其值為504.0258,P值約為0,可以說有充分的理由拒絕原假設,認為收盤價對開盤價有Granger因果關系。

表5 開盤價、最高價、最低價、收盤價對其各自的Granger因果效應
從表5中可以看出,最高價對開盤價、最高價、最低價的Granger因果檢驗的P值都很大,因此不能拒絕原假設最高價對開盤價、最高價、最低價的預測能力都太差;相反,收盤價對開盤價、最高價、最低價、收盤價的Granger因果檢驗的P值都很小,在某種程度上拒絕原假設,因此,收盤價對開盤價、最高價、最低價以及收盤價的預測能力比較強。通過Granger因果檢驗結果能夠對本文的模型做一些適當的改進,使其能更好地預測未來價格指數。
脈沖響應函數(IRF,Impulse Response Function)分析方法,其功能主要用于反映一個內生變量對由誤差項所導致的沖擊的影響。本文根據上證指數畫出了四個變量間的脈沖響應圖(見圖4)。
時期數由圖4的橫軸顯示,脈沖響應函數的大小由縱軸顯示,正負兩倍標準差偏離帶則用虛線顯示。如圖所示,開盤價對其自身一個標準差新息立即做出了響應,在第一期,存在數值大約5左右的價格響應,隨后,此類沖擊對價格的作用逐漸明顯,然后收盤價對自身的影響卻和開盤價不同,在第一期收盤價對其自身的響應在7左右,隨后響應值達到最低值6,然后又隨著時期數的增加,響應值大小不斷增加。相同的方法可以用于分析收盤價對開盤價或者開盤價對收盤價的影響。

圖4脈沖響應函數
本文通過運用VAR模型對我國股市下一交易日股價指數進行了嘗試性的預測,并對預測值和真實值做了比較。以上證指數作為預測范本,證明了VAR模型在某種程度上有著較高的可信度。進一步對某投資組合進行分析研究,用投資組合的收益率和穩定性來分析當前投資組合的好壞,為投資者提供正確的股票市場評估信息。具體而言,如果一個投資組合不僅穩定性好而且收益率比較高,那么就認為這個投資組合是一個比較好的投資組合;反之就是一個比較差的組合。鑒于這種想法,可以通過投資組合下的每個股票在固定時間段上的收益率作為一個時間序列,用VAR模型分析,得到每個股票的收益率預測以及他們之間的相互關系,進而評價該模型時用VAR來預測其穩定性和準確性,以提升證券監管機構的行政監管能力和法治化水平。