李嘉琪,何 坤
(東華大學 理學院, 上海201620)
隨著經濟的快速發展,金融改革創新不斷推進,金融市場的波動和投資風險逐漸加大,市場之間的關系也越來越復雜。構造多種資產投資組合可以有效地在金融市場上規避風險,獲得投資收益,因此金融資產間的相關結構以及波動影響也就成為了值得研究的方向。在真實的金融市場環境中,資產收益率曲線大多呈現出尖峰厚尾,尾部呈現非線性以及波動聚集等特征形態,這就使得傳統模型中的正態和線性相關等基本假設無法滿足實際的情況。
為了更好地研究相關結構關系,Sklar[1]提出了Copula函數的概念,指出了Copula函數可以連接各個邊緣分布及其聯合分布,打破了以往只能分析線性相關的局限性。即Copula函數能夠很好地用來刻畫非對稱和非線性相關結構,這與傳統模型相比有著明顯優勢。Nelson[2]對Copula函數繼續研究,總結了Copula函數族并進行了相關應用。Embrechts等[3]利用Copula函數進行了金融風險分析。在此之后Copula函數理論開始被廣泛地應用于各個金融領域的研究之中。Huang等[4]結合了Copula函數與GARCH模型的特點,計算了投資組合的風險價值(value at risk, VaR),并將其應用到研究NASDAQ和TAIEX指數之中去。Aas等[5]提出了對多元Copula函數進行降維分解的Pair Copula方法,即把多元變量的聯合分布函數轉化為基于二元條件Copula函數與各自邊緣分布函數的乘積,為多種投資組合的研究提供了理論基礎。
同時為了解決時間序列條件異方差性的問題,Engle[6]率先提出了ARCH(autoregressive condition heteroskedasticity)模型,并被廣泛應用于金融市場的分析決策中。Bollerslev[7]以ARCH模型為基礎,提出了GARCH(generalized autoregressive condition heteroskeclasticity)模型,描述了市場波動的異方差性和波動集群性。但是GARCH模型僅停留在低頻層面上,未包含日間數據的信息,而高頻的數據則可以提供更多的信息。Engle[8]后來直接將含有高頻信息的外生變量引入到GARCH模型中,構造出了GARCH-X模型,這種模型特點是簡單直觀,但是無法進行多步預測。Hansen等[9]提出了Realized GARCH(p,q)模型,以解決高頻信息的問題,通過引入測度方程,將收益率、條件波動率和已實現測度三者聯合建模,從而使投資決策和預測更為精確。
目前將Copula或Pair Copula函數與低頻GARCH類模型結合以解決具體問題的研究[10-13]已經相對成熟和完善,但是對于Realized GARCH的研究較少。例如:Solibakke[14]用Realized GARCH模型研究不同頻率的高頻數據,用半似然函數法(QML)擬合期貨合約。Watanabe[15]基于Realized GARCH模型預測了VaR和ES(expected shortfall)。黃雯等[16]用高頻數據預測滬深300的指數波動率,發現在預測效果上Realized GARCH模型相比傳統GARCH模型有很大改善。黃友珀等[17]利用Pair Copula-Realized GARCH進行了資產組合收益分位數預測的研究。本文將基于Pair Copula-Realized GARCH對股票市場相關性和波動進行分析以及數據研究。
Copula函數是由Sklar[1]在1959年提出的,他發現任意一個多維隨機變量的聯合分布函數可以被分解成一個Copula連接函數以及多個邊緣分布函數,其中邊緣分布函數服從(0,1)上的均勻分布。Copula函數的優勢在于能夠將多個隨機變量的邊緣分布連接起來,最終得到它們的聯合分布,不需要每個變量的邊緣分布相同,這與傳統方法相比具有很好的靈活性。

f(x1,x2,…,xn)=c(F1(x1),F2(x2),…,Fn(xn))·
f1(x1),f2(x2),…,fn(xn)
常用的Copula函數分為兩類: 橢圓Copula函數和阿基米德Copula函數。橢圓Copula函數主要有正態-Copula函數和t-Copula函數,兩者均有對稱的尾部相關性,因此只能適應對稱的相關結構。阿基米德Copula函數主要有Gumbel Copula、Clayton Copula和Frank Copula。Cumbel Copula函數適合描述上尾部分的相關性,Clayton Copula函數適合描述下尾部分的相關性。而對于Frank Copula函數,由于其上尾和下尾相關系數均為零,多應用于具有對稱關系的金融市場模式上。常見Copula函數的分布如表1所示。

表1 常見的Copula函數分布Table 1 The common distribution of Copula function
在研究多種投資組合收益之間的相關性時,發現中間的結構特別復雜,如果直接用多元Copula函數來構造組合結構,效果并不是很理想。因此,Aas等[5]提出了對多元Copula函數進行降維的Pair Copula分解法。
通常用來構建Pair Copula模型的兩種藤結構分別是C-Vine和D-Vine,其結構圖分別如圖1和2所示。C-Vine結構呈樹冠狀,藤樹Tj的根節點衍生出的每條邊對應一個Pair Copula函數,可以選擇與其他變量相關性最強的作為關鍵點。D-Vine結構是線性的,每個節點與其他節點相連接數最多為2,藤數Tj有(5-j)個節點和(4-j)條邊,每條邊對應一個Pair Copula函數。

圖1 C-Vine結構圖Fig.1 Structure of C-Vine

圖2 D-Vine結構圖Fig.2 Structure of D-Vine
四維結構的C-Vine和D-Vine分解表達式為
C-Vine:
f(x1,x2,x3,x4)=f1(x1)f(x2)f3(x3)f4(x4)×
c12(F1(x1),F2(x2))×c13(F1(x1),F3(x3))×
c14(F1(x1),F4(x4))×c23|1(F(x2|x1),
F(x3|x1))×c24|1(F(x2|x1),F(x4|x1))×
c34|12(F(x3|x1,x2),F(x4|x1,x2))
D-Vine:
f(x1,x2,x3,x4)=f1(x1)f2(x2)f3(x3)f4(x4)×
c12(F1(x1),F2(x2))×c23(F2(x2),F3(x3))×
c34(F3(x3),F4(x4))×c13|2(F(x1|x2),
F(x3|x2))×c24|3(F(x2|x3),F(x4|x3))×
c14|23(F(x1|x2,x3),F(x4|x2,x3))
在對Pair Copula函數作最優選擇時,通常采用赤池信息量準則(Akaike information criterion,AIC)和貝葉斯準則(Bayesian information criterion, BIC)作為擬合檢驗判別標準。AIC和BIC都引入了與模型參數個數相關的懲罰項,并且BIC的懲罰項比AIC的多考慮了樣本數量的因素。當樣本數量過多時,BIC可有效防止模型精度過高造成的模型復雜度過高。
AIC和BIC的表達式分別為:PAIC=2K-2lnL,PBIC=Kln(n)-2lnL,其中,K是模型的參數個數,L是被估計模型的似然函數的最大值,n是樣本數量。
Hansen等[9]在2011年提出了Realized GARCH(p,q)模型,其主要思想是在GARCH模型的基礎上,加入高頻數據的信息,可以得到更好的擬合效果和模型解釋能力。通過引入測度方程,把收益率、條件波動率和已實現測度三者進行聯合建模。
Realized GARCH(p,q)模型的一般表示形式為
(1)


本文在后續的研究分析中將采用Realized GARCH(1,1)的對數形式進行建模,其表達式為
(2)
此外,基于Realized GARCH模型對高頻數據進行建模時,需要計算已實現測度。 本文將采用最簡單的已實現波動率(realized variance, RV)進行定義,表達式為
式中:rt,i是日內收益率;m與采樣頻率有關。如果采樣頻率為1 min,在一天的交易時間段(9: 30-11: 30)和(13: 00-15: 00),則m=240;如果采樣頻率為5 min,則m=48。
本文選取了上證指數、深證成指、中小板指和創業板指的數據,包括日收益率和5 min高頻數據,數據時間從2014年1月1日開始到2016年12月15日結束,并使用R語言和Matlab軟件進行數據操作處理。
(1)選用Realized GARCH模型分別對每個對數收益率序列進行擬合,消除數據的自相關性和不平穩性,得到獨立的標準化殘差序列。
(2)對標準化殘差序列進行核分布估計變換,來構造新的殘差序列。同時檢驗變換之后的數據是否服從(0,1)間的均勻分布,使其滿足Pair Copula函數的基本條件。

(3)選擇藤結構模型(C-Vine和D-Vine),用極大似然法進行Pair Copula的參數估計,根據信息準則AIC/BIC,選出最優的Copula函數來描述變量間的關系,從而確定多個收益率構成的聯合分布。
將價格Pt定義為每日指數收盤價,則第t日的對數收益率為rt=ln(Pt/Pt-1)。對上證指數、深證成指、中小板指和創業板指的對數收益率序列進行描述性統計,結果如表2所示。
這4個指數的對數收益率序列峰度均大于3,偏度小于0,因此呈尖峰厚尾的形態。J-B統計量也表明這4個指數均不服從正態分布。同時,這4個指數的對數收益率頻數直方圖如圖3所示,也能很直觀地看出各指數分布非正態的性質。

表2 4種指數的描述性統計Table 2 The descriptive statistics of four indexes

(a)上證指數

(b)深證成指

(c)中小板指

(d)創業板指圖3 上證指數、深證成指、中小板指和創業板指日對數收益率頻數直方圖Fig.3 The daily log return frequency histogram of Shanghai composite index, Shenzhen component index, small and medium-size board index and second board index
為了防止出現數據偽回歸性的問題,先用ADF(Augmented Dickey-Fuller)檢驗法對4種指數對數收益率序列進行平穩性檢驗,結果如表3所示。由表3可知,數據在1%的顯著水平下呈現平穩趨勢,不存在單位根。

表3 4種指數的平穩性檢驗Table 3 Stationarity test of four indexes


表4 Realized GARCH模型的參數估計Table 4 Parameter estimation of Realized GARCH model
由表4可知,模型中每個估計參數值的P值均小于0.01,表明這些參數值都是顯著的,并且標準化殘差項和標準化殘差平方項在5%顯著水平下均通過白噪聲檢驗,說明模型可靠。同時建模后的數據也通過了ARCH L-M檢驗,說明數據不存在自相關的ARCH效應。
為了使得數據落在Copula函數自變量定義域范圍內,對模型取得的標準化殘差進行核分布估計變換。對變換后得到的新序列進行K-S檢驗,得到的P值分別是0.648、0.812、0.949、0.907,表明新序列服從(0,1)之間的均勻分布,可以對其進行Pair Copula建模。
4個指數的Kendall秩相關系數如表5所示。由表5可知:上證指數與中小板指顯著正相關,相關系數為0.611,說明當上證指數出現大幅度漲或跌的波動時,中小板指數也容易受其影響做出相應反應;深證成指則與創業板之間也有相關性,相關系數為0.565。
表54個指數的Kendall秩相關系數
Table5Kendallrankcorrelationcoefficientoffourindexes

股票上證指數深證成指中小板指創業板指上證指數1.0000.0240.6110.008深證成指0.0241.0000.0120.565中小板指0.6110.0121.0000.025創業板指0.0080.5650.0251.000
再根據AIC/BIC準則選取最優的Copula函數。同時為了分析不同的Pair Copula結構對于多個指數相依性的擬合效果,分別對C-Vine和D-Vine 結構進行比較。在這里使用R語言的CD-Vine 程序包進行計算,配對出相應的Copula函數和參數,Copula函數的參考范圍設定在Gaussian Copula、t-Copula、Clayton Copula、Gumbel Copula和Frank Copula之中,結果如表6所示。

表6 C-Vine 和D-Vine結構下的Copula 函數參數Table 6 Parameters of Copula function on C-Vine and D-Vine
由表6可知:在C-Vine結構下,兩種準則值分別為-1 519.437和-1 473.617;在D-Vine結構下,兩種準則值分別為-1 513.043和-1 471.805。由此可以說明,C-Vine的結構將更加適合于分析這4個指數之間的關系。
本文基于Pair Copula-Realized GARCH模型對股票市場進行了研究,在低頻數據的基礎上引入已實現波動測度方程,能夠提取高頻數據的信息。同時,對于多種資產結構,用Pair Copula分解法進行降維建模,可以更加精準地描述出股票市場間的關系。
研究后所得出的結論是: (1)上證指數、深證成指、中小板指和創業板指這4個有代表性的對數收益率曲線均符合金融市場上非正態,呈“尖峰厚尾”的特點,且存在一定的相關性;(2)使用Realized GARCH模型可以為高頻數據消除異方差的干擾,建模后的標準化殘差沒有ARCH效應,接受白噪聲檢驗;(3)對建模后的標準化殘差進行核分布估計變換,再對變換后的序列進行Pair Copula降維,用C-Vine和D-Vine結構分別建立指數間關系,并用AIC和BIC準則進行比較,發現C-Vine的結構比D-Vine更加適用于擬合4個指數間的相關結構。