馬 薇,張淑娟(天津財經大學理工學院,天津 300222)
基于非參數分位數方法對金融風險的研究
馬 薇,張淑娟
(天津財經大學理工學院,天津 300222)
文章提出了使用非參數密度分位數方法來計算VaR模型。此方法完全由數據驅動,不需要設定新息項的分布,并同新息項服從正態分布、T分布和GED分布計算的VaR進行對比,得到了比較理想的結果,從而為金融風險研究提供了較有效的參考方法。
非參數;分位數;風險預測
近年來,我國經濟正處于結構調整和轉型升級的階段,金融市場在支持這項重任的同時還需要注意防范和化解金融風險。而VaR(Value at Risk)作為一種金融風險管理工具,已經得到了廣泛的應用。VaR方法是20世紀80年代美國金融機構提出的金融風險測度方法[1],現在已經成為金融市場的一種主流的、能夠廣泛應用的風險度量方法。估計VaR的主要方法有:歷史模擬方法、方差協方差方法、蒙特卡洛模擬方法等,利用GARCH類模型計算波動率進而估計VaR也是一種計算方法。為了解決金融時間序列的波動問題,Engle于1982年開創性的引入了ARCH模型。由于ARCH模型如果階數太大就會降低參數估計的效率,還有可能導致多重共線性的發生,Bollerslev[2]為了彌補這一點,于1986年引入GARCH(p,q)模型,可以用相對簡單的低階GARCH模型來替代一個高階ARCH模型,從而減少需要估計的參數,使得模型的估計與識別問題都變得容易一些,而又由于GARCH模型不能夠捕捉金融市場中的非對稱因子,對于這樣的局限性,后又有一些新的GARCH類模型的衍生,如EGARCH[3]、TGARCH[4,5]、GARCH-M、FI-GARCH等。由于(G)ARCH類模型受新息項分布函數的限制,后又有不設定分布函數形式的非參數GARCH模型[6-8]的產生。
在GARCH類模型的基礎上,國內外對于股市VaR估計已有較多研究[9-13],傳統的模型在運用波動率方法計算VaR時,通常假設新息項服從某一分布,具有一定的局限性,而在真實的金融市場中這一條件有時很難滿足,當不滿足時,利用參數方法計算分位數的過程就會產生一定誤差,而非參數方法由于完全由數據驅動,不受分布限制,受約束條件少,因此本文采取非參數核密度的方法來估計新息項的分布,進而得到其非參數條件分位數來計算VaR的值,通過研究對比發現,在大部分情況下非參數估計優于參數估計,所以對非參數分位數的研究具有一定的理論與應用價值。
1.1 VaR估計
VaR就是“在險價值”,它是由J.P.Morgan公司首先提出的用來計算市場風險的產物。它與傳統的度量風險手段不同,是完全基于統計分析基礎上的風險度量技術。VaR是指在金融市場正常波動下,在一定概率水平(置信度)下,某一金融資產或證券組合價值在未來特定一段時期內的可能承受的最大損失,VaR的數學表示為:
設隨機變量rt表示某一金融資產t時刻的收益率,當rt≥0時表示收益,當rt<0時表示損失,風險度量關注的隨機變量rt分布的左尾,設Frt(x)為隨機變量rt的累積分布函數,對給定的置信水平1-α,α∈(0 ,1),VaR可表示為:

或者:

令rt=ut+σtεt,VaR可以表示為:

ut=E()
rt為預期收益率;σt為當期資產收益序列的波動率,因此VaR的計算與預期收益率ut、當期波動率σt、收益率的新息項所服從的分布及所選用的置信水平有關。

本文VaR的檢驗方法采用Kupiec(1995)[14]提出的似然比率檢驗法,假定置信水平為1-α,實際考察天數為T,失敗天數為N,則失敗率記為期望概率為p*=1-α,零假設為H0:p=p*,備擇假設為H1:p≠p*,檢驗失敗率是否拒絕零假設。似然比方程為:

在原假設條件下,統計量LR服從自由度為1的χ2分布,LR越小,P值越大,失敗率越接近α,表明模型越精確,可信度越高。
1.2 非參數核密度分位數
由式(3)可知,計算VaR需要計算新息項的分位數,傳統的方法假設新息項服從某個固定的分布,通常假設服從正態分布、t分布或者GED分布,但是這樣的分布不一定適合我國現階段的股票市場,因此文中提出不受分布函數形式限制的非參數分位數方法,下面是對其簡單的介紹:
從隨機變量X的總體抽取樣本估計總體密度函數,當密度函數形式未知時,采用參數估計可能產生一定的誤差,并且這種誤差通過增加樣本量也是無法彌補的。當密度函數未知時,最簡單的方式是采用直方圖估計,但是直方圖估計是階梯函數,會使得對每個小區間中心部分精確,但是端點附近估計精度會較差,不具有光滑性,Rosenblatt(1955)和Emanuel Parzen(1962)提出非參數核密度估計不需要假設密度函數,完全由數據驅動確定密度函數,并且具有光滑性和相合性的特點,其形式[15]為:
令X1,X2,...,Xn為隨機變量X的一組獨立同分布樣本,用來估計隨機變量X的總體密度函數:

K為核函數,Epanechnikov核在理論上使得積分均方誤差最小,具有較好的性質,所以文中核函數采用Epanechnikov核,h為光滑參數帶寬,運用à錯鑒定法確定帶寬h的最優值。
通過密度函數的積分可得到分布函數,進而可計算其反函數求出非參數分位數。
非參數核分布函數為:

非參數核密度分位數為:

由于非參數分位數方法不受密度函數形式的限制,受約束條件較少,具有一定的穩健性,因此是一種可以廣泛應用的方法。
由式(3)可知,計算VaR還需要計算平均收益率及波動率,對于這個問題一般用GARCH、EGARCH、TGARCH、GARCH-M、FI-GARCH等來解決,對于常用的GARCH模型,在理論上若假定了新息項的分布,如正態分布、t分布、GED分布等,GARCH模型可以利用極大似然法求得,當新息項的分布選擇不符合實際情況時,Bollerslev、Wooldridge與Jeantheau也已經證實了即使不是正態分布,利用擬極大似然估計法計算得到的參數估計也仍然是相合的。
對于式(3)給出的VaR的計算形式,本文利用非參數分位數方法結合GARCH類模型來計算VaR,為了驗證此方法的可行性,下面利用真實的股指數據進行實證分析,并同時與假設新息項服從正態分布、t分布和GED分布計算分位數的方法進行比較,通過檢驗發現非參數方法具有較理想的效果。
2.1 數據選取及處理
本文采用的樣本為具有代表性的滬深的三個指數,樣本區間是2006年1月4日至2015年10月21日,數據涵蓋了2008年與2015年兩個大的波動時段,能較好地反應當今中國股市的特征,共計2379組數據,數據從同花順下載,運用R軟件進行分析和計算,收益率計算采用對數收益率,其公式為:pt為日收盤價。
2.2 GARCH模型參數估計
上述數據均通過平穩性檢驗——ADF檢驗,同時由ARCH效應檢驗結果知道收益率具有異方差,因此可以應用GARCH類模型。應用EGARCH和TGARCH模型做出的參數估計結果不是很理想,說明在2006年1月4日至2015年10月21日這段時間不存在顯著的杠桿效應,所以本文采用GARCH模型,并且從估計結果來看較為顯著。以下為利用R軟件計算出的新息項分別服從正態分布、t分布及GED分布的GARCH模型的參數估計及其對應的P值。
下面為滬深各指數新息項服從正態分布的GARCH模型(簡記為(N)GARCH模型)的參數估計及對應的P值:

下面為新息項服從t分布的GARCH模型(簡記為(t) GARCH模型)的參數估計及對應的P值:

下面為新息項服從GED分布的GARCH模型(簡記為(G)GARCH模型)的參數估計及對應的P值:

從上面的參數估計值及概率P值可以看出(N)GARCH與(t)GARCH和(G)GARCH波動模型中各項系數均顯著,并對新息項項進行了ARCH效應檢驗,檢驗結果通過,說明不存在異方差,所以可用此三種模型描述滬深三種指數在2006年1月4日至2015年10月21日的波動情況,進而來估計VaR的值。
2.3 VaR計算結果的檢驗:Kupiec檢驗
利用上述三種模型計算收益率的波動率之后,計算VaR還需要估計新息項的分位數,計算分位數分別應用:假設新息項服從標準正態分布、t分布、GED分布及利用非參數分位數方法,這樣結合GARCH模型可得到六種計算VaR的模型,(N)GARCH-N,(t)GARCH-t,(G)GARCH-GED,(N) GARCH-NON,(t)GARCH-NON,(G)GARCH-NON,置信水平為1-α,分別令α=0.05,α=0.025,α=0.01三種情況下,估計VaR值,并對應得到Kupiec檢驗結果:P值和失敗率。表1、表2和表3給出上述六種模型在三種置信度下的VaR的Kupiec檢驗結果:每種股指的第一行為檢驗的P值,第二行為對應的失敗率,標注*的數值為每種股指檢驗的最高P值。

表1 Kupiec檢驗:α=0.05
由表1可以看出,當α=0.05時,在三個股票指數的檢驗結果中,三種參數方法均通過檢驗,并且N-N與G-G方法要稍好于t-t方法,三種非參數方法也均通過檢驗,并且P值幾乎都在0.9以上,同時t-NON與G-NON方法較為穩定,N-NON方法對應的檢驗P值有1個最高,t-NON方法對應的檢驗P值有1個最高,G-G方法對應的檢驗P值有1個最高。

表2 Kupiec檢驗:α=0.025
由表2可以看出,當α=0.025時,在三個股票指數的檢驗結果中,G-G方法要好于N-N與G-G方法,N-N方法檢驗結果較差,P值較低,而三種非參數方法均通過檢驗,t-NON方法對應的檢驗P值有3個最高。

表3 Kupiec檢驗α=0.01
由表3可以看出,當α=0.01時,在三個股票指數對應的檢驗結果中,N-N參數方法沒有通過檢驗,所以假設新息項服從正態分布不能很好地捕捉尾部風險,而G-G方法要好一些,t-t方法是參數方法中最好的,而三種非參數方法均通過檢驗,N-NON與G-NON方法對應的檢驗P值各有1個最高,t-NON方法對應的檢驗P值有3個最高。
結合表1至表3對應的Kupiec檢驗結果可以看到,在三種參數方法中,當α=0.05時,t-t方法不是很穩定,并且對應的P值要比另兩種參數方法差一些,當α=0.025時,G-G方法檢驗結果要稍好一些,但是當α=0.01分位數比較小時,正態分布對于尾部風險捕捉不夠,對于尾部風險的捕捉,t分布要稍好些。總體分析本文選擇的三種股指在所給的區間段中,參數方法檢驗的P值一般比非參數方法的P值要小,同時對不同的數據與不同的置信度,參數方法沒有非參數方法穩定。對于不同的置信區間,采用非參數核密度分布來估計新息項分位數方法對風險的捕捉都較好,尤其當GARCH模型中假設新息項服從t分布,Kupiec檢驗的P值都較高,幾乎都在0.85以上,失敗率也與α較為接近,效果比較理想,說明非參數方法能較好地描述新息項的分布情況,因此,應用此方法來計算VaR不失為一種值得信賴的方法。
關于VaR的估計,進年來諸多學者做了大量的研究,方法也越來越成熟,本文通過對滬深主要的三種指數的研究發現,在使用GARCH模型結合參數分位教方法計算VaR時,新息項假設為正態分布或者t分布與GED分布時,很難同時捕捉不同置信水平下的風險,由于不能準確刻畫新息項的分布,因此在這樣的假設下計算VaR,結果會不太理想。而利用非參數分位數方法,對新息項的分布不做任何假設,完全由數據驅動方法計算新息項的分位數來估計VaR,通過Kupiec檢驗結果可以看到,此方法可以在不同置信水平下都表現較好,而且比較穩健,具有較高的可信度,因此在目前眾多計算VaR的方法中可以作為一種值得參考的選擇。
[1]Morgan J P.RiskMetrics-Technica Document[M].New York:[s.n.], 1996.
[2]Bollerslev T.A Conditionally Heteroskedastic Time Series Model for Speculative Prices and Rates of Return[J].The Review of Economics and Statistics,1987,69(3).
[3]Nelson D B.Conditional Heteroscedasticity in Asset Returns:A New Approach[J].Economet Rica,1990,59(2).
[4]Glosten L R,Jagannathan R,Runkle D E.On the Relation Between the Expected Value and the Volatility of the Nominal Excess Return?on Stocks.[J].The Journal of Finance,1993,48(5).
[5]Rabemananjara R,Zakoian J M.Threshold ARCH Models and Asym?met Ries in Volatility[J].Journal of Applied Econometrics 1993,8(1).
[6]Robert F E.Gonzalez-River Semiparametric ARCH Models[J].Jour?nal of Business&Economic Statistics,1991,(4).
[7]Hastie T J,Tibshirani R.Generalized Additive Models[M].London: Chapman and Hall,1990.
[8]Bǜhlmann P,McNeil A J.An Algorithm for Nonparametric GARCH Modelling[J].Computational Statistics&Data Analysis,2002,(40).
[9]Beckers B,Herwartz H,Seidel M.Risk.Forecasting in(T)GARCH Models with Uncorrelated Dependent Innovations[C].IAAE 2014 An?nual Conference London,Gro?britannien,2014,(6).
[10]鄭文通.金融風險管理的VAR方法及其應用[J].國際金融研究, 1997,(9).
[11]周愛民,陳遠.我國中小板市場在險價值量的實證研究——基于GARCH-VaR模型[J].南開大學學報:自然科學版,2013,(6).
[12]楊繼平,袁璐,張春會.基于結構轉換非參數GARCH模型的VaR估計[J].管理科學學報,2014,(2).
[13]馬薇,盧英,劉月月.大數據條件下金融風險測度的方法[J].統計與決策,2015,(9).
[14]Kupiec P.Techniques Forverifying the Accuracy of Risk Manage?ment Models[J].Journal of Derivatives,1995,3(2).
[15]Li Q,Racine J S.Nonparametric Econometrics:Theory and Practice [M].Princeton:Princeton University Press,2007.
(責任編輯/劉柳青)
F830.9
A
1002-6487(2016)24-0152-03
全國統計科學研究項目(2014LY003);天津市哲學社會科學規劃項目(TJYY10-1-310)
馬 薇(1958—),女,天津人,教授,博士生導師,研究方向:數量經濟學。
張淑娟(1982—)女,黑龍江綏化人,博士研究生,講師,研究方向:數量經濟學。