郎詡森,何 坤
(東華大學 理學院,上海 201620)
過去數年間,國際金融市場發生了巨大的變化,金融市場逐漸呈現出豐富、多面、隨機等特點,這促使其風險評估越來越受到重視。因此在風險分析中對各類資產進行相關性分析就顯得愈加重要。比較常用的相關性分析方法有線性相關系數分析法和Granger因果分析法[1]。然而實例分析發現,這兩種方法均存在著較為明顯的缺陷。線性相關系數分析法要求分析的變量間必須存在線性關系且方差必須有限,其相關性分析的條件十分苛刻,難以實現;Granger因果分析法的相關性檢驗通常只能給出定性的結論,而不能給出定量的描述,其分析結果存在著較大的局限性。因此,研究多選用其他相關性指標來討論變量間的相關關系[2]。
Copula模型是一種更為靈活的相關性分析方法。運用Copula理論解決問題時,可以不限制邊緣分布,因此多元分布的構建能夠更為靈活。建立Copula模型可以將隨機變量的邊緣分布和變量間的相關結構分開來研究,其中,邊緣分布可由波動率模型描述,而變量間的相關結構可以通過Copula函數描述。這樣的建模方式使問題得以簡化,并且在對變量作非線性單調增變換的情況下,通常線性相關系數的值會發生變化,而由Copula函數導出的一致性和相關性度量則不會改變[3-4]。而時變Copula模型,即變量間的相關系數是隨著時間發生變化的,其更符合實際情況,對實際變量相依機構的描述也更加準確。Patton最先提出時變Copula模型,其采用類似于ARMA(1,10)的過程對二元正態Copula模型的相關系數進行描述[5]。經過多年發展,時變Copula模型得到了較為廣泛的應用和研究[6]。本文隨機選取兩只股票的收益率作為研究對象,以廣義自回歸條件異方差(GARCH)模型描述股票收益的波動性并建立邊緣分布,再分別從3種相關性測度(線性相關系數、Kendall秩相關系數和Spearman相關系數)出發,建立時變正態Copula模型。
根據Nelsen給出的定義,d維Copula函數C是指具有以下性質的函數(其本身也是一類多元分布函數):
(1)[0,1]d→[0,1];
(2)函數C對其每個變量都是單調遞增的;
(3)C(u1,…,uk-1,0,uk+1,…,ud)=0且C(1,…,1,uk,1,…,1)=uk,其中u1,u2,…,ud∈[0,1]。
對于一個具有一元邊緣分布F1(x1),F2(x2),…,Fn(xn)的聯合分布函數F(x1,x2,…,xn),存在一個Copula函數,使得F(x1,x2,…,xn)=C(F1(x1),F2(x2),…,Fn(xn))。 其中Copula函數C(u1,u2,…,un)能夠將變量的邊緣分布及其相關結構分開研究,由此來度量隨機變量之間的相關程度。這為求取隨機變量的聯合分布函數提供了一條較為簡單的途徑。
通過Copula函數導出的一致性和相關性測度指標主要有Kendall秩相關系數、Spearman相關系數、Gini系數等,其中Kendall秩相關系數和Spearman相關系數的簡要介紹如下所述。
(1) Kendall秩相關系數。當分析兩個變量之間的相關程度時,最為直接的方法是觀察兩個變量之間的變化趨勢是否一致,若一致則表明兩個變量之間是正相關的,否則是負相關的。具體而言,令(x1,y1)和(x2,y2)為隨機變量(X,Y)的兩組觀測值,若(x1-x2)(y1-y2)>0,則稱(x1,y1)與(x2,y2)是和諧的,此時稱X和Y正相關;若(x1-x2)(y1-y2)<0,則稱(x1,y1)與(x2,y2)是不和諧的,此時稱X和Y負相關。
令(X1,Y1)和(X2,Y2)為獨立同分布的隨機變量,則定義τ=P[(X1-X2)(Y1-Y2)>0]-P[(X1-X2)(Y1-Y2)<0]為Kendall秩相關系數。
(2) Spearman 相關系數。與Kendall秩相關系數一樣,Spearman相關系數也是建立在和諧與不和諧的基礎之上的。
令(X1,Y1)、(X2,Y2)、(X3,Y3)為3個獨立的隨機變量,定義ρ=3{P[(X1-X2)(Y1-Y3)>0]-P[(X1-X2)(Y1-Y3)<0]}為Spearman相關系數。
事實上,Kendall秩相關系數和Spearman相關系數都是通過對具體給定的Copula函數變量之間和諧與不和諧的概率,來刻畫兩個變量之間的相依關系,但二者之間的取值還是存在很大的區別[7]。因此,有必要分別從這兩種相關系數出發建立時變Copula模型。
對變量作單調變換,其對應的Copula函數不會發生改變,根據上述Kendall秩相關系數、Spearman相關系數的定義可知其數值也不會改變。相比線性相關系數,Kendall秩相關系數和Spearman相關系數有更為廣泛的實用性,并且作為全局變量,Kendall秩相關系數 、Spearman相關系數與很多Copula函數的參數都有著一一對應的關系,因此以其為基點建立總體參數隨時間的演化方程和時變Copula模型,能夠較為準確全面地描述變量間的相依結構[8]。
結合GARCH模型、二元正態Copula函數及其相關性測度建立二元時變正態Copula模型,具體步驟如下:
(1)確定邊緣分布。構建Copula模型的一個重要前提是選擇一個恰當的邊緣分布來描述隨機變量,波動聚類、偏斜、高峰、厚尾等特性是金融時間序列分布常具有的特征。對于一般的金融時間序列,GARCH(1,1)模型就能夠較好地刻畫隨機變量的波動特征[9]。本文分別使用Normal-GARCH、t-GARCH對兩只股票收益率的邊緣分布進行擬合,通過AIC(Akaike information criterion)準則選擇最為恰當的模型,A=-log(I)+2m,其中,A為AIC值,I為極大似然函數值,m為模型中獨立參數的個數。以t-GARCH(1,1)模型為例,模型的表達式為[11]
(1)
式中:rt為收益率;μ為收益率均值;εt為殘差序列;vt為自由度為v的標準t分布。
(2)根據上述建立的模型,得到兩只股票收益率的邊緣分布,通過對其殘差進行概率積分變換,轉化為(0,1)上的均勻分布,得到的樣本數據對用(ui,vi)表示,并且通過K-S檢驗來驗證模型的擬合程度。
(3)基于數據對(ui,vi),分別計算二元正態Copula參數θ的極大似然估計值、Kendall 秩相關系數的統計量和Spearman相關系數的統計量。
(4)根據Patton[6]的觀點,選擇一個類似于ARMA(1,10)的過程分別描述模型中相關系數θ以及Kendall秩相關系數和Spearman相關系數的時變性[5]。相關系數θ可以表示為
(2)

(3)
(4)
式中:φ-1為標準正態分布的逆函數。
對于Kendall秩相關系數 、Spearman相關系數,可以分別表示為
(5)


本文對匯通能源股票和中國人壽股票收益率的數據進行篩選處理,并以其作為研究對象,考察的數據為2014年7月7日到2017年8月31日的收益率,共747組數據。

利用軟件對兩只股票的數據進行描述性統計分析,得到的數據如表1所示。

表1 基本描述性統計量Table 1 Basically descriptive statistics
由表1可知:J-B統計量的伴隨概率均為0,說明兩只股票收益率均拒絕服從正態分布的假設;從偏度數據均小于0可以看出兩只股票收益率均是左偏的;從峰度看此序列分布具有相對較高的尖峰值。故認為,兩只股票相較于正態分布均有尖峰厚尾的特點。
利用軟件得到兩只股票的殘差序列時序圖,以匯通能源為例,其收益率殘差序列時序圖如圖1所示。

圖1 匯通能源的收益率殘差序列時序圖Fig.1 Yield graph of residual sequence of Huitong energy
從圖1可以看出,該序列在呈現了大的波動后常常伴隨著較大的波動,同時較小的波動后也伴隨著較小的波動。由此說明該序列存在波動集聚現象,可以判斷該序列很可能存在ARCH效應,有必要建立GARCH模型以描述其邊緣分布[11]。
這里分別利用Normal-GARCH、t-GARCH模型對匯通能源和中國人壽的收益率進行擬合,結果如表2所示。
通過比較AIC值可知,相比于Normal-GARCH模型,t-GARCH模型能夠更好地描述兩只股票收益率序列的波動。
根據所得的t-GARCH模型,對序列的殘差進行概率積分變換,變換后的序列記為(u,v),通過K-S 檢驗,驗證變換后的序列是否服從(0,1)上的均勻分布,以此判斷t-GARCH是否可以較好地描述各個收益率的波動[12-13]。K-S統計量與概率值如表3所示。

表2 邊緣分布參數估計Table 2 Parameters estimation of marginal distribution

表3 K-S統計量與概率值Table 3 Statistics and probability values
由表3可知,通過概率積分變換后的序列服從(0,1)上的均勻分布,這也表明t-GARCH模型能夠較好地描述選取的兩只股票的指數收益率。


表4 兩種外生變量的擬合結果Table 4 Fitting results of two types of exogenous variables


圖2 Kendall秩相關系數的時變圖Fig.2 Time-varying graph of the rank correlation coefficient of Kendall
由圖2可知,兩只股票的Kendall秩相關系數基本處于0~0.5之間,序列基本處于正相關的相依機制。綜上所述,可以分別從3種相關系數建立時變正態Copula模型,通過擬合優度檢驗可以分別得到對數似然函數值,而由A=-logI+2m,得到從不同相關系數建立的模型A值(如表5所示)。

表5 3種相關系數的A值Table 5 Value of A of the three correlation coefficients
由表5可知,以Kendall秩相關系數為中心建立的時變正態Copula模型是3種模型中最為準確的模型,其次是基于Spearman相關系數建立的時變正態模型。通過這種方式構建的時變Copula模型能夠更好地描述變量間的相依機制,但這種方式建立時變Copula模型的前提是相關系數和Copula函數的參數必須存在一一對應的關系。
本文從3種不同的相關系數出發建立了時變正態Copula模型,通過對匯通能源和中國人壽兩只股票收益率的實例分析,比較了3種模型的優劣。由于Kendall秩相關系數和Spearman相關系數是全局變量且在單調變換時取值是保持不變的,因此,以這兩種相關系數為基礎建立的時變Copula模型能夠克服以線性相關系數為基礎建立的時變Copula模型的局限性,具有一定的優越性,并且以Kendall秩相關系數為基礎建立的時變模型得到了最優的擬合結果,其次是以Spearman相關系數為基礎建立的模型。本文所建模型對股票的組合投資有一定的指導意義。