999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Copula回歸模型與應用

2017-01-09 02:44:58劉新紅中國中醫科學院廣安門醫院北京0005中國人民大學統計學院北京00872北京石油化工學院數理系北京0267
統計與決策 2016年24期
關鍵詞:模型

王 靜,劉新紅,吳 萍(.中國中醫科學院廣安門醫院,北京0005;2.中國人民大學 統計學院,北京00872;.北京石油化工學院 數理系,北京0267)

Copula回歸模型與應用

王 靜1,2,劉新紅3,吳 萍1
(1.中國中醫科學院廣安門醫院,北京100053;2.中國人民大學 統計學院,北京100872;3.北京石油化工學院 數理系,北京102617)

文章探討Copula回歸模型應用于具有相關關系的指標時的優勢,通過示例分析,揭示了用Copula回歸模型與普通回歸模型對數據擬合的不同,表明了當不同指標間存在相關關系時,Copula回歸模型能更加客觀準確地反映數據背后的關系。

Copula函數;回歸模型;相關

1 Copula回歸模型

Copula是一種通過單個變量的邊緣分布構造多個變量的聯合分布的一種數學方法,1959年,Sklar提出了Copula函數,將多元隨機變量的邊緣分布和它們之間的相關結構分開研究,相關結構不受邊緣分布的限制。隨后,很多學者發現了Copula理論在研究相關性方面的價值。Copula不僅可以反映線性相關,也能描述非線性相關。而最常用的Pearson相關系數只能反映變量間的線性相關程度,無法捕捉到非線性的關系。其他常用的一些相關性系數如Kendall's τ系數、Spearman系數和Gini關聯系數等雖然能在一定程度上反映變量間的非線性相關性,但都不能全面完整地刻劃變量間的相關結構。

根據Sklar定理[1],若二維隨機向量(X,Y)的聯合分布函數為H(x,y),邊緣分布函數分別為F(x)和G(y),則存在一個Copula函數C(u,v),滿足:

如果F和G是連續的,則Copula函數C是唯一確定的。

在實際應用中,常用的二元Copula函數有橢圓Copula函數和阿基米德Copula,橢圓Copula主要包括Gaussian Copula與t Copula,而阿基米德Copula除了包括常用的Gumbel Copula,Clayton Copula,Frank Copula,還包括Joe Copula、BB1 Copula等。這里只列出Gaussian Copula、Clayton Copula、Gumbel Copula和Frank Copula的具體形式,其他Copula可參考相關文獻。

(1)Gauss Copula函數

其中Φ(·)為標準正態分布的分布函數。

(2)Clayton Copula函數

當θ→0時,隨機變量獨立;當θ→+∞時,隨機變量完全相關。Clayton Copula的密度函數也具有非對稱性,其密度分布呈“L”字型,即上尾低下尾高。

(3)Gumbel Copula函數

當θ=1時,隨機變量獨立;當θ→+∞時,隨機變量完全相關。Gumbel Copula的密度函數具有非對稱性,其密度分布呈“J”字型,即上尾高下尾低。

(4)Frank Copula函數

當θ→0時,隨機變量獨立;Frank Copula的密度函數具有對稱性,其密度分布呈“U”字型。

對于兩個存在相關關系的隨機變量X和Y,在各自回歸模型的基礎上,將這種相關關系用Copula函數刻畫,建立兩個因變量的聯合分布函數,即可建立Copula回歸模型:

其中,式(2)表示了隨機變量X的分布及回歸模型,式(3)表示了隨機變量Y的分布及回歸模型,式(4)表示了隨機變量X與Y的聯合分布。Peter X.-K.Song等[2]在2009年用Gaussian Copula對人體燒傷面積與存活率這兩個相關的結局指標進行了聯合回歸分析,論證了與分別單獨回歸分析相比,聯合回歸分析由于考慮了指標間的相關性,并且能得到一個結局指標關于另一個結局指標的條件分布,從而具有更高的估計效能和推斷效能[4]。

例1 (2018年四川達州)如圖1,二次函數y=ax2+bx+c的圖象與x軸交于點A(-1,0),與y軸的交點B在(0,2)與(0,3)之間(不包括這兩點),對稱軸為直線x=2.下列結論:①abc<0;②9a+3b+c>0;③若點點是函數圖象上的兩點,則y1

2 應用示例

2.1 數據來源及變量選擇

數據來源于某藥物療效評價試驗,樣本量為402例,因變量為西醫量表評分差值(變量名為y1)和中醫證候評分差值(變量名為y2)。自變量有藥物(drug)、醫院(cn)、年齡(age)、病程(bch)和基線評分(c0及zz0),除基線評分為連續變量外,其他均為分類變量。

2.2 建立普通回歸模型

對因變量 y1和 y2進行正態分布檢驗,Kolmogorov-Smirnov檢驗的P值分別為0.001和0.000,均不服從正態分布。它們的偏度系數分別為0.0557和0.2245,具有明顯的右偏特點,故選取逆Gumbel分布(Reverse Gumbel),這是一種極值分布,概率密度函數為:

其數學期望和方差為:μ+0.5772σ和1.6449σ2。

西醫量表評分差值(y1)的回歸模型:

全模型:

中醫證候評分差值(y2)的回歸模型:

全模型:

經過模型選擇,剔除不顯著自變量(P>0.05),最后選定模型為:

兩個回歸模型參數估計結果如表1所示,逆Gumbel分布的參數σ估計值分別為5.0542和4.7871。自變量drug在兩個模型中都不顯著,也就是說,兩種藥物在西醫量表評分和中醫證候評分改善方面,均沒有顯著差異。殘差服從正態分布,可見,選取的分布是合適的。

表1 μ1和μ2普通回歸模型參數估計結果

2.3 建立Copula回歸模型

在不考慮自變量的情況下,y1和y2的Pearson相關系數為0.6340,Kendall's τ相關系數為0.4818,表明這兩個因變量是相關的。將這種相關關系用Copula函數刻畫,建立兩個因變量的聯合分布函數,即可建立Copula回歸模型。

其中,H(y1,y2)表示(y1,y2)的聯合分布函數,F(y1)和G(y2)分別為y1和y2的邊緣分布函數,y1,y2均服從逆Gumbel分布,密度函數見式(5),分布函數易知,C(u,v)表示Copula函數。

C(u,v)有多種選擇,使用常用的Gauss Copula、Gumbel Copula、Clayton Copula和Frank Copula函數。參數估計采用極大似然法,通過R軟件的GAMLSS包和CDVINE包[3,4]實現。使用4種Copula函數的回歸模型的AIC值分別為2329.911、2376.840、2310.876和2318.165,可見,Clayton Copula回歸模型擬合效果最好。

在Clayton Copula回歸模型中,Copula函數中的參數估計值為1.3534,Kendall's τ相關系數為0.4036。 y1和y2逆Gumbel分布中的參數σ估計值分別為5.0005和5.0824,模型參數的具體估計結果見表2所示。

表2 μ1和μ2的Clayton Copula回歸模型參數估計結果

將Copula回歸模型估計結果與普通回歸模型參數估計結果比較,可以看出自變量回歸系數的點估計值相差不多,但是,中醫證候評分差值回歸模型中,自變量藥物(drug)和年齡(age)由不顯著因素變成了顯著因素,也就是說,兩種藥物在中醫證候評分改善方面有顯著性差異,這也印證了Peter X.-K.Song等在2009年得出的聯合回歸比單獨普通回歸具有更高統計推斷效能的結論。

3 討論

Copula是分析相關關系的有力工具,近十年來在金融、保險、生物和醫藥等領域得到廣泛的應用。Copula回歸模型是一種考慮了因變量之間相關關系的聯合回歸模型[5],當因變量之間存在相關關系時,聯合回歸分析比普通回歸分析具有更高的推斷效能,所以,用普通回歸模型分析時不顯著的因素,用Copula回歸模型分析時可能變成顯著因素。可見,當指標間存在相關性時,Copula回歸模型能夠揭示普通回歸模型所揭示不了的差異,能夠更充分挖掘數據背后的關系,從而更加客觀準確地揭示隱藏在數據背后的規律。

[1]Nelsen R B.An Introduction to Copulas[M].New York:Springer,2006.

[2]Song P,Li M,Yuan Y.Joint Regression Analysis of Correlated Data Us?ing Gaussian Copulas[J].Biometrics,2009,(65).

[3]Stasinopoulos M,Rigby B.Generalized Additive Models for Location Scale and Shape(GAMLSS)in R[J].Journal of Statistical Software, 2007,23(7).

[4]Brechmann E,Schepsmeier U.Modeling Dependence With C-and D-Vine Copulas:The R Package CDVINE[J].Journal of Statistical Software,2013,52(3).

[5]Kolev N,Paiva D.Copula-based Regression Models:A Survey[J].Jour?nal of Statistical Planning and Inference,2009,(139).

(責任編輯/浩 天)

O212

A

1002-6487(2016)24-0079-03

科技部重大新藥創制課題(2013ZX09303301);中國中醫科學院廣安門醫院所級科研基金課題(2011S264)

王 靜(1978—),女,河北唐山人,助理研究員,博士研究生,研究方向:數理統計。

劉新紅(1978—),女,河北保定人,博士,講師,研究方向:風險管理與非壽險定價。

(通訊作者)吳 萍(1960—),女,江西萍鄉人,碩士,研究員,研究方向:臨床試驗管理。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 免费一级毛片完整版在线看| 亚洲美女操| 好久久免费视频高清| 欧美亚洲国产日韩电影在线| 九月婷婷亚洲综合在线| 久青草免费视频| 欧美日韩一区二区三区四区在线观看| 国产成人av一区二区三区| 一级毛片中文字幕| 亚洲最猛黑人xxxx黑人猛交 | 国产精品视频观看裸模| 中文字幕欧美日韩高清| 久久窝窝国产精品午夜看片| 免费人成网站在线高清| 综合色区亚洲熟妇在线| 最新无码专区超级碰碰碰| 国产精品夜夜嗨视频免费视频| 日韩精品一区二区深田咏美| 国产在线八区| 天天躁夜夜躁狠狠躁图片| 又黄又湿又爽的视频| 久久国产乱子| 大香伊人久久| 亚洲美女久久| 亚洲日本中文字幕乱码中文 | 国产精品亚洲片在线va| 理论片一区| 无遮挡国产高潮视频免费观看 | 一级一级特黄女人精品毛片| 成人一级免费视频| 97综合久久| 国产日韩欧美视频| 热九九精品| 精品视频在线观看你懂的一区| 国产黄在线观看| 国产99视频免费精品是看6| 亚洲激情区| 中文字幕第1页在线播| 91欧美在线| 天天色综合4| 成AV人片一区二区三区久久| 99热国产在线精品99| 色网站免费在线观看| 综合久久久久久久综合网| 国产精品成人一区二区| 免费人成网站在线高清| 四虎永久免费在线| 亚洲精品爱草草视频在线| 色婷婷视频在线| 99久久精品久久久久久婷婷| 日本人又色又爽的视频| 久久国产精品波多野结衣| a级免费视频| 国产视频a| 九九热精品视频在线| 无码丝袜人妻| 国产欧美高清| 国产精品黑色丝袜的老师| 最新日本中文字幕| 欧美日在线观看| 日本一区中文字幕最新在线| 亚洲天堂视频在线播放| 午夜免费小视频| 国产精品观看视频免费完整版| 亚洲欧美人成人让影院| 91黄视频在线观看| 日韩欧美高清视频| 一区二区偷拍美女撒尿视频| 久久99国产精品成人欧美| 日韩在线网址| a亚洲视频| 欧美一级在线看| 在线亚洲精品福利网址导航| 在线欧美国产| 亚洲欧美成人在线视频| 午夜高清国产拍精品| 日韩在线永久免费播放| 91久久精品国产| 成人国产精品网站在线看| 国产自在线拍| 欧美成人精品一级在线观看| 亚洲国产亚洲综合在线尤物|