余 欣, 呂王勇, 張瓊文, 楊和柳
(四川師范大學 數學科學學院, 四川 成都 610066)
早在1959年,Sklar在回答Frechet關于多維聯合分布函數和低維邊緣分布函數之間關系的問題時引入了Copula的概念.
Copula各種性質的研究是概率論與數理統計及其應用領域十分引人注目的課題之一,一直以來都受到統計學者的青睞.Copula函數作為刻畫變量之間相依機制的工具,克服了傳統的線性相關系數研究變量非線性關系的不足.迄今為止,已經有很多相關研究結果.文獻[1]對Copula函數的含義和性質做了全面詳細的介紹,文獻[2]討論了Copula函數中參數的矩估計方法和極大似然估計方法,文獻[3]基于Copula函數研究2個變量的尾部相關,文獻[4]比較了阿基米德Copula函數的幾種參數估計方法,文獻[5-6]對隨機變量間的相依性展開研究,文獻[7]從圖像重構的角度提出廣義Copula的概念.Copula在實際中應用廣泛,文獻[8]利用Copula函數對干旱特征進行了分析,為旱作農業生態管理提供依據.本文的主要工作是討論二元Copula的構造.到目前為止,構造二元Copula主要是從變換和函數2個角度討論.從變換的角度,通過Sklar定理的反演,直接從二元聯合分布函數求得二元Copula函數;另一方面,許多學者從函數的角度出發,提出了若干構造二元Copula的方法.文獻[9]提出利用連續可導的實值函數構造生成元,文獻[10]研究了具有共同對角面函數的一類Copula的構造,文獻[11]提出了一種新的函數:g函數,并基于g函數構造Copula.基于文獻[12]給出的Copula的良好性質,文獻[13]應用加權幾何平均構造二元Copula,文獻[14-15]分別提出了基于F類函數的一類二元Copula的構造,進一步擴充Copula的種類.本文從函數的角度考慮,提出一類新的函數:G類函數,基于定義的G類函數,提出了2種構造二元Copula函數的新方法.隨著Copula理論的逐漸完善,Copula函數越來越多地被應用到金融風險管理、投資組合等研究領域,尤其是變量間相關性的度量上,但目前還沒有文獻將Copula函數應用到地區產值相關性的研究中.文獻[16]討論了四川省三次產業產值發展與經濟增長的關系.基于此,本文利用構造的Copula函數對成都市和綿陽市第一產業產值間的依存關系進行了實證研究,分析不同地區產值間的相關性.
定義 2.1[1]一個二元函數C(u,v)稱之為二元Copula,如果C(u,v):I2→I=[0,1],并且滿足:
1) 邊界條件:C(u,0)=C(0,v)=0,C(u,1)=u,C(1,v)=v;
2) 2-增性:對?0≤u1≤u2≤1有
VC([u1,u2]×[v1,v2])=C(u2,v2)-
C(u2,v1)-C(u1,v2)+C(u1,v1)≥0,
其中VC([u1,u2]×[v1,v2])稱為函數C在矩形[u1,u2]×[v1,v2]上的體積.事實上,這個體積就是C在矩形[u1,u2]×[v1,v2]上的二階差分,
定理 2.1(Sklar定理)[1]設H是一個聯合分布函數,其邊緣分布函數分別為F和G,那么一定存在一個CopulaC,使得
H(x,y)=C(F(x),G(y)),
如果F、G是連續的,則C唯一,否則C在RanF×RanG上不是唯一確定的.反之,若C是一個Copula,F和G是分布函數,則由上式所定義的H(x,y)是一個聯合分布函數,其邊緣分布函數分別是F和G.
定義 2.2[2]設φ是[0,1]→[0,∞]的連續的、嚴格單減的凸函數,滿足φ(1)=0,φ[-1]:[0,∞]→[0,1]是函數φ的廣義逆函數,其定義為
則具有C(u,v)=φ[-1](φ(u)+φ(v))形式的C稱為阿基米德Copula,其中函數φ稱為阿基米德Copula函數C的生成元.
定義 2.3稱函數g(x)為G類函數,如果它滿足:
1)g(x)是[0,1]上的遞增凹函數(g′(x)≥0,g″(x)≤0)且g(0)=0,g(1)=1;
2) 2g′(x)+xg″(x)≤0,x∈[0,1].
定義 2.4[3]設X、Y是邊緣分布分別為F(x)、G(y)的2個隨機變量,其聯合分布函數為CopulaC(u,v),定義:
若λU,λL∈(0,1],則λU和λL分別為X和Y的上尾相依系數和下尾相依系數,稱X和Y上尾相關和下尾相關,若λU,λL=0,稱X和Y上尾獨立和下尾獨立.
本文是基于G類函數來研究二元Copula函數的構造,因此對G類函數的探究是本文的一個重點.下面給出G類函數的幾個相關性質.


即h(x)在[0,1]上是遞增的凹函數,且
所以
仍是G類函數
性質 3.2G類函數的伸縮變換仍是G類函數,即設g1(x)是G類函數,對?0<α≤1,則
g2(x)=g1(αx)/g1(α)
仍是G類函數.
證明由已知可得g1(x)是G類函數,滿足G類函數的所有性質.
即g2(x)在[0,1]上是遞增的凹函數,且
g2(0)=g1(0)/g1(α)=0,
g2(1)=g1(α·1)/g1(α)=1.
因為0<α≤1,0≤αx≤1,所以
于是
則
g2(x)=g1(αx)/g1(α)
仍是G類函數.
性質 3.3G類函數的任意復合仍是G類函數.下面只針對二維情況進行說明.
設g1(x)和g2(x)是G類函數,則g(x)=g2(g1(x))仍是G類函數.
證明由已知可得g1(x)、g2(x)是G類函數,滿足G類函數的所有性質.
即g(x)在[0,1]上是遞增凹函數,且
g(0)=g2(g1(0))=0,
g(1)=g2(g1(1))=1.
因為g1(x)是G類函數,所以
又g2(x)是G類函數,所以
所以
2g′(x)+xg″(x)≤0,
則g(x)=g2(g1(x))仍是G類函數.
二元Copula的構造方法是建立在本文定義的G類函數的基礎上,G類函數的尋找是該方法的關鍵,下面給出一種G類函數的構造方法.
由定義2.3,G類函數必須滿足如下2個條件:
1)g(x)是[0,1]上的遞增凹函數(g′(x)≥0,g″(x)≤0)且g(0)=0,g(1)=1;
2) 2g′(x)+xg″(x)≤0,x∈[0,1].
下面從條件2)出發,進一步構造滿足以上條件的函數g(x).
對于條件2),2g′(x)+xg″(x)≤0,x∈[0,1],令
2y′+xy″=a(x),
a(x)≤0,x∈[0,1],
(*)
對應的齊次線性微分方程是
2y′+xy″=0,
解得齊次方程的2個特解為:y1=1/x,y2=1.故(*)式的通解為
代入(*)式得
補充條件
聯立解方程組
得
其中γ1、γ2均為常數,故g(x)的通解為
其中
γ1、γ2均為常數.
下面給出一些G類函數的具體例子和推廣.
由上知,只需找到在[0,1]上小于或等于0的函數a(x),進而由(*)式的通解可解得G類函數g(x),從而可構造相應的二元Copula函數.
1)a(x)=βxα,x∈[0,1],其中α和β為參數且α≥0,β<0.
此時a(x)≤0,滿足條件,代入上式可得
由初值條件
有
則
因為
所以

因此
2)a(x)=ωsinx,x∈[0,1],其中ω為參數且ω<0.
此時a(x)≤0,滿足條件,代入上式可得
由初值條件
g(1)=-ωsin 1+γ1+γ2=1,
有
γ1+γ2=1+ωsin 1,
則

顯然γ≥0即可.因此
事實上,凡是滿足在[0,1]上小于等于0的函數都可作為a(x),進而按照上述構造方法可以得到無數個G類函數.Copula函數是把隨機變量的邊際分布連接成聯合分布的函數,為變量之間相依結構的分析帶來了很大方便,在實際中得到了廣泛的應用,尤其Copula函數在金融領域被廣泛運用.要更好地分析金融市場,必須首先得到較為精確的Copula函數[4],對Copula構造研究尤為重要.本文基于G類函數對構造二元Copula函數展開研究,下面著重討論二元Copula函數的新的構造方法.
Copula函數在變量之間相關性分析[5]及金融風險管理[6]等方面有廣泛的應用,一直以來,構造Copula函數都是人們研究的一個重要課題.本文基于G類函數提出了2種構造二元Copula函數的新方法.
定理 5.1(二元Copula的構造) 設g(x)是G類函數,則
C(u,v)=uvg(u)+ug(v)-ug(u)g(v),
(a)
或
C(u,v)=uvg(u)+ug(v)-ug(uv)
(b)
均是二元Copula函數.稱具有這2種形式的Copula為G-Copula,其中函數g稱為G-Copula函數C的生成元.
證明下面從二元Copula函數的定義出發,分別證明(a)和(b)式所定義的函數是二元Copula函數.
先證明(a)式所定義的函數
C(u,v)=uvg(u)+ug(v)-ug(u)g(v)
是二元Copula函數.
首先,因為g(x)是G類函數,所以g(x)滿足G類函數的所有性質.
1) 邊界條件:
C(u,0)=u·0·g(u)+
ug(0)-ug(u)g(0)=0,
C(0,v)=0·v·g(0)+0·g(v)-
0·g(0)g(v)=0,
C(u,1)=ug(u)+ug(1)-ug(u)g(1)=
ug(u)+u-ug(u)=u,
C(1,v)=1·vg(1)+1·g(v)-g(1)g(v)=
v+g(v)-g(v)=v.
2) 2-增性:?u1≤u2,u1,u2,v1,v2∈I有
VC([u1,u2]×[v1,v2])=
C(u2,v2)-C(u2,v1)-C(u1,v2)+C(u1,v1)=
(v2-v1)(u2g(u2)-u1g(u1))+
(g(v2)-g(v1))+[u1(g(u1)-u1)-
(u2g(u2)-u2)].
因為g(x)在[0,1]上遞增的,對?u1≤u2,v1≤v2有
(v2-v1)(u2g(u2)-u1g(u1))≥0,
g(v2)-g(v1)≥0.
令
w=(u1g(u1)-u1)-
(u2g(u2)-u2),
h(x)=xg(x)-x,x∈[0,1],
則
w=h(u1)-h(u2),
h′(x)=g(x)+xg′(x)-1,
h″(x)=2g′(x)+xg″(x).
由條件
2g′(x)+xg″(x)≤0,x∈[0,1],
可知h″(x)≤0,則h′(x)在[0,1]上是單調遞減的,有h′(x)≤h′(0)=-1<0,所以h(x)在[0,1]上是單調遞減的.由u1≤u2有
ω=h(u1)-h(u2)≥0,
則對?u1≤u2,?v1≤v2,u1,u2,v1,v2∈I有
VC([u1,u2]×[v1,v2])≥0,
所以C(u,v)是2-增的.
綜上所述,函數
C(u,v)=uvg(u)+ug(v)-ug(u)g(v)
是二元Copula函數.這就完成了(a)式的證明.
再證明(b)式所定義的函數
C(u,v)=uvg(u)+ug(v)-ug(uv)
是二元Copula函數.
首先,因為g(x)是G類函數,所以g(c)滿足G類函數的所有性質.
1) 邊界條件:證明同(a)式的證明.
2) 2-增性:?u1≤u2,u1,u2,v1,v2∈I有
VC([u1,u2]×[v1,v2])=
C(u2,v2)-C(u2,v1)-C(u1,v2)+C(u1,v1)=
(v2-v1)(u2g(u2)-u1g(u1))+
(u2-u1)(g(v2)-g(v1))+u1(g(u1v2)-
g(u1v1))-u2(g(u2v2)-g(u2v1)).
因為g(x)在[0,1]上遞增的,對?u1≤u2,v1≤v2有
(v2-v1)(u2g(u2)-u1g(u1))≥0,
(u2-u1)(g(v2)-g(v1))≥0.
令
w=u1(g(u1v2)-g(u1v1))-
u2(g(u2v2)-g(u2v1)),
h(x)=x(g(xv2)-g(xv1)),x∈[0,1],
則
w=h(u1)-h(u2),
h′(x)=[g(xv2)+xv2g′(xv2)]-
[g(xv1)+xv1g′(xv1)].
又令
u(x,y)=g(xy)+xyg′(xy), ?x,y∈[0,1],
則
h′(x)=u(x,v2)-u(x,v1),
uy(x,y)=x(2g′(xy)+xyg″(xy)).
由條件
2g′(x)+xg″(x)≤0,x∈[0,1],
可知
2g′(xy)+xyg″(xy)≤0, ?x,y∈[0,1],
所以
uy(x,y)≤0, ?x,y∈[0,1],
即對于所有x、u(x,y)關于y是單調遞減的.由v1≤v2有
h′(x)=u(x,v2)-u(x,v1)≤0,x∈[0,1],
所以h(x)在[0,1]上是單調遞減的,有
w=h(u1)-h(u2)≥0,
則對?u1≤u2,?v1≤v2,u1,u2,v1,v2∈I有
VC([u1,u2]×[v1,v2])≥0,
所以C(u,v)是2-增的.
綜上所述,函數
C(u,v)=uvg(u)+ug(v)-ug(uv)
是二元Copula函數.這就完成了(b)式的證明.
Copula函數形式多種多樣,本文構造的2類二元Copula函數,從形式上看十分簡便,由已知的一個G類函數可以得到若干個含參數、不含參數的G類函數,從而得到不同的含參數、非參數的二元Copula函數,擴大了二元Copula函數的范圍,豐富了構造二元Copula函數的方法.
Copula函數作為各變量邊緣分布之間的連接函數,可以有效刻畫變量間的相關性.本文選取成都市和綿陽市自1985年到2015年期間第一產業產值為研究對象,建立經驗分布,并運用常用的阿基米德Copula函數及構造的G-Copula函數和經驗Copula函數進行比較,對成都市和綿陽市第一產業產值間的相關性進行分析.在運用Copula函數刻畫變量間的相關性時,選擇一個合適的Copula函數模型是Copula函數在變量間相關性研究領域中要解決的一個核心問題.首先需要建立變量的經驗分布函數.
6.1 經驗分布的建立設成都市第一產業產值的增長率為X,綿陽市第一產業產值的增長率為Y,則X、Y是隨機變量.我們選取成都市和綿陽市自1985年到2015年歷年第一產業生產總值作為樣本數據,數據來自統計年鑒,相應的增長率序列分別為{xi,i=1,2,…,30}和{yi,i=1,2,…,30}.對成都市和綿陽市的第一產業產值數據,各選取其中的8個數據作為分割點,把整個數軸分為9段,分別建立其經驗分布為
6.2 邊緣分布的建立由Sklar定理[7]知,2個隨機變量的聯合分布是由其各自的邊緣分布和對應的Copula函數作用生成,所以需要建立成都市和綿陽市第一產業產值增長率的邊緣分布[8].對成都市和綿陽市的歷年第一產業產值數據作分析,模擬出兩地區產值增長率數據的頻率直方圖,運用矩法估計各分布的未知參數,計算各分布的理論值和經驗分布值的誤差平方和,則誤差平方和最小值對應的分布為該產值的分布函數.下面首先對成都市第一產業產值增長率和綿陽市第一產業產值增長率進行分析,模擬出兩地區產值增長率數據的頻率直方圖,結果列于圖1和圖2.
由圖1和圖2可知,分別采用指數分布Exp(λ)和伽瑪分布Ga(θ,μ)去擬合成都市的第一產業產值增長率的總體密度函數,伽瑪分布Ga(θ,μ)和卡方分布χ2(n)去擬合綿陽市的第一產業產值增長率的總體密度函數.根據矩法,用樣本均值代替總體均值,樣本方差代替總體方差,估計出各分布的參數,再選擇各分布與相應產值經驗分布的誤差平方和最小值所對應的分布為X、Y的分布函數.表1給出各產值分布函數的參數估計值及誤差平方和.
由表1可知,在用指數分布和伽瑪分布擬合成都市第一產業產值增長率的分布時,指數分布與其經驗分布的誤差平方和最小,因此,選取指數分布模擬成都市第一產業產值的分布,而在用伽瑪分布和卡方分布擬合綿陽市第一產業產值增長率的分布時,卡方分布與其經驗分布的誤差平方和最小,因此,選取卡方分布模擬綿陽市第一產業產值的分布,由此建立了成都市和綿陽市第一產值增長率的邊緣分布.

圖 1 成都市第一產業產值增長率頻率直方圖

圖 2 綿陽市第一產業產值增長率頻率直方圖

地區理論分布分布參數估計值誤差平方和成都市Exp(λ)9.597 412.206 1Ga(θ,μ)(1.321 3,12.707 3)12.631 1綿陽市Ga(θ,μ)(1.202 8,10.735 2)12.122 6χ2(n)0.112 03.699 4
在建立不同地區產值增長率的邊緣分布之后,由Sklar定理知,需要選取合適的Copula函數來連接不同地區產值增長率的邊緣分布,進而分析不同地區產值的相關關系.而在建立合適的Copula函數模型之前,需要對Copula函數中的參數進行估計.以成都市和綿陽市第一產業產值為例,下面將討論Copula函數模型中參數的估計.
6.3 Copula函數模型的參數估計在眾多的Copula函數族中,阿基米德Copula[9]由于結構簡單、構造方便,且具有許多良好的性質而在金融及風險管理等領域得到廣泛應用.常用的阿基米德Copula函數有:Frank Copula和Clayton Copula,這2種Copula都能夠較好地刻畫變量間的相關關系.由于Copula的良好性質[10],對Copula的構造研究[11]顯得尤為重要.對這種新的Copula的應用將會是今后的一個研究熱點.本文采用Frank Copula、Clayton Copula函數和G-Copula函數來度量成都市和綿陽市第一產業產值之間的相關關系.表2給出了這3類Copula函數的生成元及參數取值范圍.
為了得到具體的Copula函數表達形式,需要對Frank Copula、Clayton Copula和G-Copula函數中的未知參數進行估計.由成都市和綿陽市30年的第一產業產值的增長率觀測值序列{xi,i=1,2,…,30}和{yi,i=1,2,…,30},可以得到(X,Y)的樣本

表 2 3類Copula函數
sign(x)為符號函數

對一般的二元Copula函數,兩變量間的總體Kendall秩相關系數τ和Copula函數C(u,v)之間有如下關系[12]

對特殊的Copula函數——阿基米德Copula,兩變量間的總體Kendall秩相關系數τ和阿基米德Copula生成元φ(t)之間有如下關系[12]
利用τ與φ(t)間的這種關系,使用Clayton Copula和Frank Copula可以計算出(X,Y)的總體Kendall秩相關系數分別為:
其中

6.4 Copula函數模型的比較在得到Copula函數模型中未知參數的估計值后,需要建立恰當的Copula函數模型.下面對Copula函數進行比較,并尋求最佳的Copula函數.利用成都市和綿陽市第一產業產值增長率序列的經驗分布,將增長率序列組合(xi,yi)轉化為新的序列(ui,vi),其中
ui=Fn(xi),
vi=Gn(yi),i=1,2,…,n,
n指樣本個數.通過比較Copula函數和經驗Copula函數之間的偏差平方,對成都市和綿陽市第一產業產值之間的相關性進行分析.首先,計算出第i年的經驗分布函數值Cn(ui,vi),其中,i=1,2,…,30,經驗分布Cn(u,v)的計算公式為
u,v∈[0,1].
由Copula函數值和經驗Copula函數值的偏差平方和
可得到3種Copula函數模擬值和真實值之間的歐氏距離d2,d2越小,則Copula的擬合程度越好.比較3種Copula函數模型,尋求最優的Copula函數,最后度量成都市和綿陽市第一產業產值間的尾部相關,分析不同地區產值間的相關關系.對選取的3種Copula函數進行比較,比較結果如表3.

表3 Copula模型比較結果
從表3檢驗結果可以看出,對X和Y來說,G-Copula與經驗Copula的偏差平方d2為0.011 3,是3個Copula函數中最小的,表示其擬合效果最好,說明在樣本區間內G-Copula能夠很好地度量成都市第一產業產值和綿陽市第一產業產值之間的相依關系,所以我,選擇G-Copula對成都市和綿陽市第一產業產值間的相關性進行度量.
下面用Copula理論來解釋尾部相依.根據G-Copula函數表達式,分別計算成都市和綿陽市第一產業產值間的上尾相關系數和下尾相關系數,得到成都市和綿陽市的上尾相關系數λU=0,下尾相關系數λL=0.該結論也與成都市和綿陽市第一產業產值間的散點圖中描述的上尾和下尾相關性弱的結論一致,見圖3,即成都市和綿陽市的第一產業產值間上尾和下尾都是漸進獨立的,沒有明顯的尾部

圖3 成都市和綿陽市第一產業產值增長率圖
相關性.它表明了當成都市和綿陽市其中一個地區產值大幅度增加或減少時,并不會引起另一個地區產值的大幅度增加或減少.因而可知:對于地區產值而言,當一個地區的產值增加或減少到一定幅度時,并不會引起另一個地區產值的大的波動,即通過本文定義的G類函數,找到了一種Copula函數:G-Copula,比常用的阿基米德Copula函數能更好地刻畫2個變量之間的相關關系.目前構造二元Copula主要是從函數出發,對函數的性質[14]加以研究,構造出新的Copula[15].基于本文構造的Copula,將它運用到地區產業[16]中,能夠較好地分析地區產業的相關關系,有利于實際中對產業經濟的研究分析.
Copula在刻畫變量相關性領域中有廣泛的應用.本文提出了一種新的G類函數,基于定義的G類函數,提出了一類新的G-Copula函數,建立了2種構造二元Copula函數的新方法.在構造二元Copula函數時,只需尋找恰當的G類函數,避免了直接從二元Copula函數定義出發去構造二元Copula函數,提高了效率,豐富了構造二元Copula函數的方法.這種新的二元Copula函數擴大了函數模型的選擇范圍,有利于選擇恰當的Copula函數模型來解決實際問題.本文利用構造的Copula函數對成都市第一產業產值和綿陽市第一產業產值之間的相關性進行了實證分析.對于這種新的二元Copula函數在實際中的應用將是以后的研究熱點.