朱萬銳++唐大為


[摘要]當今許多金融問題,例如VaR計算、期權定價等,都需要首先對收益率的分布特征有比較準確的描述。之前的研究發現衡量波動性的高頻指標——已實現波動(realized volatility,RV)——可以幫助我們更好地預測收益率分布。文章探究這個結論是否適用于中國市場。
[關鍵詞]高頻指標;市場;收益分布;預測能力
[DOI]1013939/jcnkizgsc201718063
1引言
我們將異質自回歸(HAR)模型(Corsi,2009; Andersen et al,2007)與基準模型EGARCH進行比較,比較的方法是“預測似然度”。預測似然度是根據已實現收益率預測得出的概率密度,是一種衡量數據與模型吻合程度的指標。模型的預測能力越好,它的預測似然度就會越大。平均預測似然度的期限結構能夠顯示RV在長短不同的預測步數中有多大的作用。
2數據
本文選取2008年1月1日至2015年12月31日期間上證綜指5分鐘交易數據作為研究對象。中國股市的開盤時間為9∶30-11∶30和13∶00-15∶00,所以每個交易日會有48個5分鐘交易數據。對于每個5分鐘交易數據,我們計算一個5分鐘連續復利對數收益率,并乘以100進行標準化,記為rt,i(i=1,…,I),其中 I 為第t天里5分鐘收益率的個數。在中國,I通常等于48,但由于會存在一些交易日提前閉市,所以1945個交易日中一共產生了93360個5分鐘收益率。其中,2008—2012年的數據用于模型估計,2013—2015年的數據用于預測,故樣本內包含1218個交易日,樣本外包含727個。
3RV定義
RV定義為一段時間內收益率的平方和,在股價連續且沒有測量錯誤時,是波動性的一種無偏估計量(Merton,1980)。未經調整的日RV估計量如下計算:
RVt,u=r2t,i(1)
隨著日內收益率頻率的上升,RV會存在偏誤問題——即市場微觀噪音(Fang,1996; Andreou and Ghysels,2002; Oomen,2002; Bai、Russell and Tiao,2004)。為了消除有偏性和不一致性,我們采用Hansen and Lunde(2006)所建議的Bartle 權重對RV進行調整,經調整的RV如下計算:
RVt,ACq=r2t,i+2qj=1[(1-jq+1)It-ji=1(rt,irt,i+j)],其中,q=1,2,3(2)
為了跟波動性指標相匹配,日收益率應該使用每天收盤價和開盤價之間的對數差,同樣乘以100來標準化。我們將日收益率的方差設為基準,不同RV的均值與其均值做比較,選擇最接近的RV用于HAR-RV模型。經過統計性分析,日收益率的方差為2761572;當q=0,1,2,3時,RV的均值分別為2151439、2114523、20197238、2162044。可以看出,未經調整的RV確實存在很大的偏誤。當q=2時,RV2的均值與日收益率的方差最接近,所以,HAR-RV模型采用RV2。
HAR-RV模型的估計結果
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+Vt
Coefficients
ω123
-006955028251028352037673
4基準模型
我們在GARCH族中考慮了三種模型:GARCH、EGARCH和TGARCH。經回歸EGARCH模型的最大似然度最大,因此選擇EGARCH(1,1)作為基準模型。
5HAR-RV模型
Corsi(2009)提出了一個新模型——已實現波動的異質自回歸模型(HAR-RV)。在這個模型中我們可以加入日內數據,模型設定如下:
rt=σtεt,εt~NID0,1
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(3)
51收益率過程
在標準HAR-RV模型中,高頻收益率過程只由日波動率[AKσ~](d)t決定。模型假設[AKσ~](d)t=σ(d)t,其中σ(d)t是日波動率。收益率過程如下所示:
rt=σ(d)tεt,εt~NID0,1(4)
52RVt 等式
HAR-RV的波動性主要來自三方面:進行日或更高頻交易的短期交易者,每周進行倉位調整的中期投資者和投資周期高達一至數月的長期投資者。所以,RV定義如下:
ln(RVt)=ω+1ln(RVt-1)+2ln(RVt-5,5)+3ln(RVt-22,22)+υt(5)
其中RVt-1、RVt-5、RVt-22分別為衡量短期(日)、中期(周)和長期(月)的波動,其計算如下:
ln(RVt-h,h)≡1hh-1i=0n(RVt-h+i)ln(RVt-1,1)≡ln(RVt-1)(6)
53σt 和 RVt之間的關系
文獻中有兩種方法將RV與收益率方差聯系起來:一是假設日收益率的有條件方差等于日RV的有條件期望;二是假設收益率方差和RV等同。Forsberg和Bollerslev(2002)、Bollerslev et al(2009)和John et al(2011)在相似的研究中使用了第二種方法,所以在本文我們也使用第二種假設。
54HAR-RV模型估計
基于以上假設,對HAR-RV模型進行回歸,我們得到估計模型如下:
ln(RVt)=-006955+0282521ln(RVt-1)+028352ln(RVt-5,5)+037673ln(RVt-22,22)
上述模型將用于接下來的預測似然度計算。
6分布預測
61平均預測似然度
John和Thomas(2011)認為在評價預測能力時多步預測更好,本文與John和Thomas(2011)的目的相同,所以仿照其多步預測的方法來評價兩個模型預測能力。對于樣本外觀測值t=τ+kmax,…,T-k,其平均預測似然度計算如下:
Dk=1T-τ-kmax+1T-kt=τ+kmax-klnfk(rt+k[JB)|]Φt,θ),k≥1(7)
其中fk(rt+k[JB)|]Φt,θ)是向前k期預測的概率分布,T是總樣本中觀測到的交易日個數,k是向前預測的時間跨度,樣本外數據從τ到T。在我們的樣本中,T=1945,τ=1219,kmax=60。Dk越大,模型預測的準確性越好。
62向前k期預測的概率分布
我們使用以下公式計算向前k期預測的概率分布,
fk(rt+k[JB)|]Φt,θ)=∫f(rt+k[JB)|]μ,σ2t+k)p(σ2t+k[JB)|]Φt)dσ2t+k
≈1NNi=1f(rt+k[JB)|]μ,σ2(i)t+k)σ2(i)t+k~p(σ2t+k[JB)|]Φt)(8)
其中 f(rt+k[JB)|]μ,σ2(i)t+k)是基于t+k期的真實收益率,服從均值為μ,方差為σt+k2的正態分布。
63計算
首先,對于每一個模擬n次1步至60步向前預測,得到相應的標準差。對于每一個預測跨度,只保留[1279-k,1945-k]這部分,以保證所有預測都落入到這段區間。由于對每一個起點的每一個k步預測都有n次模擬,所以將t∈[1279-k,1945-k]中全部的f(rt+k[JB)|]μ,σ2(i)t+k)求取平均值,作為fk(rt+k[JB)|]Φt,θ),進而再計算fk(rt+k[JB)|]Φt,θ)的平均值,其中t∈[1279-k,1945-k]。最后,根據式(8),可以計算出Dk。
7結論
圖1圖2為R語言模擬計算出來的Dk值,橫軸表示預測步數,縱軸表示每一步所對應的平均預測似然度,分別顯示了模擬100次和1000次時,HAR-RV模型與EGARCH模型的預測能力對比。我們有以下發現。
模擬100次時,HAR模型的似然度在步數不大于30的情況下會比EGARCH大。當模擬1000次時,相同的情況發生在預測步數不大于37時:
(1)對于短期預測,HAR模型能大幅提高預測效果,然而在預測中國的長期市場時并不有效。我們認為,導致這種現象的原因在于中國市場受到很多非市場因素的影響,且這些因素會隨時間變化。HAR模型更多地依賴于歷史數據,非市場因素的變化會導致歷史數據“失效”。
(2)隨著模擬次數的增加,HAR的似然度降到EGARCH以下所需的步數會越來越大,所以我們推斷,如果能夠模擬無數次,HAR的預測能力會比本文所展現得更優秀。
(3)圖1和圖2均顯示出HAR的平均預測似然度的期限結構呈現負斜率。
圖1模擬100次圖2模擬1000次
參考文獻:
[1]John,MM,Thomas,HMDo High-frequency Measures of Volatility Improve Forecasts of Return Distributions[J].Journal of Econometrics,2011(160):69-76
[2]Amisano,G,Giacomini,RComparing Density Forecasts via Weighted Likelihood Ratio Tests[J]Journal of Business and Economic Statistics,2007,25(2):177-190
[3]Bollerslev,T,Kretschmer,U,Pigorsch,C,Tauchen,GA Discrete-time Model for Daily S&P500 Returns and Realized Variations:Jumps and Leverage EffectsJournal of Econometrics,2009,150(2):151-166