閆中義, 李新民
(青島大學 數學科學學院, 山東 青島 266071)
?
Copula函數的選擇及股票市場的相關性研究
閆中義, 李新民
(青島大學 數學科學學院, 山東 青島 266071)
摘要:Copula函數能夠完整地刻畫變量間的相關關系,在股票市場中用Copula函數來描述股票之間的相關性被廣泛應用.本文從6種Copula模型入手,對基于參數自助的似然準則檢驗方法和基于參數自助的擬合優度檢驗方法進行了對比分析,研究其在模型選擇上的準確性,并將其應用到平安銀行和交通銀行兩支股票中,發現與模擬結果相一致.
關鍵詞:股票; Copula函數; 擬合優度檢驗; 似然準則; 參數自助
在金融市場中,股票的收益率關系日趨復雜,其相關性研究是研究金融市場關聯性的重要內容.利用Copula函數作為工具對股票進行相關性分析有其特有的優勢,因為Copula函數能夠將邊緣分布與聯合分布分開來研究,并且在隨機變量作單調變換后保持變量間的相關性不變.Bouye[1],Durrleman和Nikeghbali[2]等人系統地介紹了Copula在金融市場中的一些應用.
Copula是一個函數,它主要用來描述隨機變量之間的相關性.Sklar[3]于1959 年首次提出 Sklar 定理并建立Copula函數理論.根據Sklar定理,利用Copula理論建立模型的關鍵有兩步:首先要確定好邊緣分布;其次找一個能很好地描述邊緣分布的相關結構的Copula函數.目前Copula函數在實際應用中的一個主要問題是函數形式的選擇.Embrechts[4]對不同的Copula函數模型進行了比較研究,發現采用不同形式的Copula模型可能導致不同的分析結果. 因此在描述股票間的相互關系時選擇合理的Copula函數模型尤為重要.
目前主要根據以下幾種思路來選擇合理的Copula函數:(1)從金融市場相關性角度出發,通過分析常用Copula函數的特點來進行選擇;(2)根據各種信息準則,從給定的集合中選取較為合適的Copula;(3)通過Copula的擬合優度檢驗選擇最優的Copula來描述變量間的相關模式[5];(4)利用似然函數準則,提出的基于參數bootstrap的模型選擇方法[6].
對于上述方法,已有文獻對前2種方法進行了對比分析,但尚未見到對后2種方法的對比分析.本文通過對比基于參數自助的似然準則檢驗和基于參數自助的擬合優度檢驗兩種Copula函數的選擇方法進行分析和模擬研究,選出最優的Copula來描述它們之間的相關關系.平安銀行(000001.SZ)和交通銀行(601328.SS)的股票收益率具有較強的相關性,本文選擇這兩種股票的Copula函數對這兩種股票從2014年4月4日到2015年5月29日共301對交易日的原始數據進行分析研究,從而使購買者能夠根據其關聯性,優化投資決策,也希望為相關部門提高股票市場的運行效率及監管提供重要的現實參考依據.
1Copula理論
根據Sklar定理,設隨機變量(X1,X2)的聯合分布函數為
F(x1,x2)=C(F1(x1),F2(x2))
F1(x1),F2(x2)是(0,1)上的均勻分布函數.這樣是為了避免計算上的復雜,因為其它的邊緣分布的選擇在本質上不會改變結論.
聯合對數似然函數的具體形式為

式中c為Copula函數的密度函數,ui,vi,i=1,…,n為樣本值.最佳的Copula就是能使聯合對數似然函數達到最大時所對應的Copula.
Kendall’s tau 是隨機變量關于Copula的一個非參度量.它表示兩個相互獨立的向量的同向對和異向對概率做差,即如果(X1,Y1)和(X2,Y2)是獨立同分布的隨機向量,那有
Pr[(X1-X2)(Y1-Y2)<0]
Kendall’s tau同樣可以表示成Copula函數的形式
隨機變量u,v在(0,1)上均勻分布,C是它的連接分布函數.對于阿基米德Copula,Kendall’s tau 能夠寫成

2基于參數自助的似然準則檢驗方法
參數自助的方法[7]是當樣本總體的分布函數形式已知時,可以通過極大似然或Kendall’s tau 等方法來得到參數的估計值,然后重復抽樣.基于參數自助的似然準則檢驗方法的基本做法是利用已知的Copula產生隨機樣本,即“原始數據”,然后用待選的Copula去擬合,并重復抽樣,計算每次的最大似然函數值.最后,利用原始數據的似然值與擬合的似然平均值構造檢驗統計量.那么能夠提供最接近樣本值的似然函數值所對應的Copula函數就是所要找的最佳Copula函數.具體做法如下:
(1)選定一個Copula函數,產生n組隨機數,構成原始數據(U1,U2,…,Un).



3基于參數自助的擬合優度檢驗方法
Copula的擬合優度檢驗[9]的執行都是基于經驗Copula的過程:
(1)
Cn是經驗Copula
(2)
Cθn是在假設H0:C∈{Cθ}成立的條件下C的一個估計.式(1)中的θn是θ基于秩的估計.檢驗統計量為
Sn=∫[0,1]dn(u)2dCn(u)=

(3)
基于參數自助的擬合優度檢驗的近似p值可以用如下過程得到:

(3)用每一個Copula模型去計算式(3)中檢驗統計量Snj,j=1,…,m.
(4)重復如下步驟,對每個k∈{1,…,B},


(c)計算Snj,j=1,…,m的一個漸近獨立實現:

4模擬比較
下面選取6種常用的Copula模型(見表1),用R軟件進行模擬實驗來比較這兩種方法的檢驗能力.
表1不同Copula模型的τ和θ

Copula類型C(u,v)τθGumbelexp{-[(-lnu)1/θ+(-lnv)1/θ]θ}1-θ[1,?)Frank-1θlog{1+(e-θu-1)(e-θv-1)e-θ-1}1-4θ+4D1θ()θ-?,?()/0{}Clayton(u-θ+v-θ-1)-1/θθθ+2[0,?)NormalΦθ(Φ-1(u),Φ-1(v);ρ)2πarcsinθ[-1,1]Plackett[1+(θ-1)(u+v)]2(θ-1)-[1+(θ-1)(u+v)]2-4uvθ(θ-1)2(θ-1)無具體表達式(0,+?)/{1}tT2(T-1ν(u1),T-1ν(u2);ρ,ν)2πarcsinθ(-1,1)
對原始數據的樣本值,考慮4種秩相關系數,τ=0.2,τ=0.4,τ=0.6,τ=0.8,重復B=1 000次,產生樣本容量為n=300的模擬數據.為了簡單起見,把Gumbel,Frank,Clayton,Normal,Plackett,t(v=4)簡寫為G,F,C,N,P,t.原假設為“當數據來自其它的Copula函數時,待檢驗的Copula函數能夠擬合這些數據”.當p值≥0.05時,說明接受原假設,即所對應的Copula函數就是我們所要找的Copula.
從表2中可以得出,對于檢驗水平為0.05,當相關系數非常小即0.2時,兩種方法都無法識別出原始數據所來源的Copula,但當相關系數為0.6,0.8的時候,基于參數自助的似然準則檢驗方法的優勢就顯現出來了,除了Normal在0.6的時候沒識別出來外,其他Copula均能準確識別.而基于參數自助的擬合優度檢驗方法在這種情況下只能識別出Clayton來,其他Copula都無法準確識別.
表2不同Copula函數結構下兩種方法的平均p值

真Copula備選Copula似然準則方法所對的τ擬合優度檢驗所對的τ0.20.40.60.80.20.40.60.8GumbelG0.2550.5260.6720.5850.2010.4230.4460.441F0.0150000.1380.0490.0140.008C0.0300000.0150.0050.0050.005N0.0340.0130.00100.1060.0990.0490.068P0.0120.001000.0830.0450.0300.027t0.1120.0890.01900.1230.1340.0650.082FrankG0.1410.008000.1240.1220.0300.032F0.4430.6140.6770.5570.5830.7350.4760.393C0.1130000.1200.0050.0050.005N0.2140.235000.3470.4080.0720.035P0.4780.3820.02800.3990.5720.2550.129t0.1680.010000.2110.2020.0270.021ClaytonG0.0170000.0140.0050.0050.005F0.0870000.2360.0080.0050.005C0.5540.4920.3210.4510.3880.4310.3500.496N0.0840000.1200.0110.0060.006P0.1110000.1170.0060.0060.006t0.0710000.0920.0080.0070.005NormalG0.1810.1440.00600.1870.2240.1620.185F0.2090.0460.00300.3500.3710.0970.042C0.0680000.0250.0050.0050.005N0.2760.5550.4250.2990.3150.6040.6240.301P0.1830.0430.0040.0010.2500.3680.2950.164t0.1000.1340.0710.0390.3010.4880.5580.284PlackettG0.3370.009000.2290.0560.0580.066F0.6520.4840.00200.7620.5160.2560.100C0.0920000.1310.0070.0050.005N0.4510.124000.4140.2680.2050.131P0.6260.7260.7420.5710.5440.4500.4150.403t0.1180.0420.00300.3030.2230.2140.140tG0.0010.006000.0450.1710.1200.173F00000.1040.1620.0590.018C00000.0230.0060.0050.005N00.0200.0030.0010.0700.1520.4010.370P0.0010.0080.0040.0010.0380.1790.2200.259t0.1280.5280.5620.5560.1500.2900.4810.409
5實例論證
選取了平安銀行(000001.SZ)和交通銀行(601328.SS)從2014年4月4日到2015年5月29日,共301對交易日的原始數據(見圖1),對這301對交易日的收盤數據取對數收益率,然后利用經驗分布得到300對在(0,1)上的數據,構成我們的數據(見圖2).利用G,F,C,N,P,t6種Copula來擬合,經計算,這兩只股票對數收益率的相關系數τ=0.59,整體上具有較強的相關性.

圖1301對交易日的收盤數據

圖2300對(0,1)上的數據
設Ct表示第t日的收盤價,并令πt表示相應的日對數收益率,有
πt=100(lnCt-lnCt-1)
表3兩種方法的平均p值

GFCNPt似然準則00000.0210.202擬合優度0.0050.0050.0050.0050.0050.005
從表3可以看出,基于參數自助的似然準則檢驗方法表明平安銀行和交通銀行這兩支股票的關系用自由度為4的tCopula來描述非常合適.而基于參數自助擬合優度檢驗的方法無法識別.又由表2的模擬和分析結果可知,當相關系數為0.6時,基于參數自助的似然準則檢驗方法能夠很好識別除Normal外的其他Copula;而基于參數自助的擬合優度檢驗方法在這種情況下只能識別出Clayton來,其他Copula都無法準確識別.因此,平安銀行和交通銀行這兩支股票的對數收益率可用自由度為4的tCopula來描述.
所以當兩支股票相關性較強時,對Copula函數的選擇用基于參數自助的似然準則檢驗方法比較好.
6結束語
本文通過模擬比較和實例論證,對比了基于參數自助的似然準則檢驗方法和基于參數自助的擬合優度檢驗方法,發現基于參數自助的似然準則檢驗方法在數據之間相關性較強的情形下,檢驗結果很穩定并且識別率高,這樣我們就可以根據一支股票的走勢而推斷出另一支股票的走勢來,是一個非常好的Copula模型的選擇方法.用這個方法做參考,股票投資者就可以合理地搭配自己所購買的股種,進行優化投資.
參考文獻:
[1]BouyéE,DurrlemanV,NikeghbaliA,etal.Copulasforfinance:Areadingguideandsomeapplications[J].SsrnElectronicJournal, 2000.
[2]DurrlemanV,NikeghbaliA,RoncalliT.Whichcopulaistherightone?[J].SsrnElectronicJournal, 2000.
[3]SklarM.Fonctionsderépartitionàndimensionsetleursmarges[J].Publ.inst.statist.univ.paris, 1959, 8(1):229-231.
[4]EmbrechtsP,LindskogF,McneilEJ.Modellingdependencewithcopulasandapplicationstoriskmanagement[J].HandbookofHeavyTailedDistributionsinFinance, 2003,1(8):329-384.
[5]FermanianJD.Goodness-of-fittestsforcopulas[J].JournalofMultivariateAnalysis, 2005, 95(1):119-152.
[6]NikoloulopoulosAK,KarlisD.Copulamodelevaluationbasedonparametricbootstrap[J].ComputationalStatistics&DataAnalysis, 2008, 52(7):3 342-3 353.
[7] 吳建華, 王新軍, 張穎. 相關性分析中Copula函數的選擇[J]. 統計研究, 2014 , 31(10):99-107.
[8]MardiaK,KentJ,BibbyJ.Multivariateanalysis[M].London:AcademicPress, 1979.
[9]KojadinovicI,YanJ.ModelingmultivariatedistributionswithcontinuousmarginsusingthecopulaRpackage[J].JournalofStatisticalSoftware, 2010, 34(9):1 346-1 352.
(編輯:郝秀清)
The selection of Copula model and the correlation analysis in stock market
YAN Zhong-yi, LI Xin-min
(College of Mathematics, Qingdao University, Qingdao 266071, China)
Abstract:The copula function could describe the correlation between several variables, so the model selection of copulas is particularly important. In this article, we select six kinds of copulas. The method of likelihood criterion based on parametric bootstrap and the method of goodness-of-fit test based on parametric bootstrap are used to compare the accuracy of model selection. We also use the two methods to test the relationship of PingAn stock and JiaoTong stock, and find that the result is same as results of simulation.
Key words:stock; Copula; goodness of fit tests; likelihood criterion; parametric bootstrap
中圖分類號:O212
文獻標志碼:A
文章編號:1672-6197(2016)03-0042-04
作者簡介:閆中義,女,447468203@qq.com; 通信作者:李新民,男,xmli@qdu.edu.cn
基金項目:山東省自然科學基金項目(ZR2014AM019)
收稿日期:2015-07-07