999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

含有Ⅱ型區間刪失數據的回歸模型參數估計*

2017-09-03 10:00:10山西醫科大學衛生統計教研室030001劉曉萌顧彩姣
中國衛生統計 2017年4期
關鍵詞:方法模型

山西醫科大學衛生統計教研室(030001) 梁 潔 崔 燕 劉曉萌 顧彩姣 高 倩 王 彤

含有Ⅱ型區間刪失數據的回歸模型參數估計*

山西醫科大學衛生統計教研室(030001) 梁 潔 崔 燕 劉曉萌 顧彩姣 高 倩 王 彤△

目的 比較四種方法估計含有Ⅱ型區間刪失數據的回歸模型參數最大似然估計值,探討在不同樣本量情況下四種方法估計結果的準確性和穩定性。方法 對含有Ⅱ型區間刪失的生存數據分別擬合Weibull參數回歸模型和Cox-PH半參數回歸模型,并結合EM ICM算法得到模型參數的最大似然估計值;應用組均值插補法將區間刪失數據填補為右刪失數據,進一步用傳統的Cox回歸以及建立偽觀察值的方法估計生存函數,模擬樣本量分別為50、200、500例。結果 Weibull回歸模型的參數最大似然估計值分別為β^1=0.496,β^2=-0.366;β^1=0.680,β^2=-0.586;β^1=0.620,β^2=-0.504。Cox-PH半參數回歸模型的參數最大似然估計值為β^1=0.652,β^2=-0.469;β^1=0.683,β^2=-0.538;β^1=0.629,β^

2=-0.511。填補為右刪失數據后傳統Cox回歸方法得到的參數最大似然估計值分別為β^1=0.203,β^2=-0.227;β^1=0.641,β^2=-0.514;β^1=0.545,β^2=-0.446。用Pseudo-observations得到的參數最大似然估計值分別為β^1=0.217,β^

2=-0.275;β^1=0.796,β^2=-0.601;β^1=0.561,β^2=-0.468。結論 在不同樣本量情況下,擬合Weibull參數回歸模型,Cox-PH半參數回歸模型結合EM ICM算法估計的參數最大似然估計更準確更穩定。

Ⅱ型區間刪失數據 最大似然估計 EM ICM算法 偽觀察值

在生存分析中,通常需要對事件發生時間進行觀測,進而分析評價。有些情況下,我們能夠得到準確的生存時間,但是在多數情況下,由于觀測目標的不穩定存在,或觀測結束時事件仍在發生,只能得到不完全的觀測數據。在進一步統計分析時,這些不完全的數據給分析者帶來了許多困擾,若直接刪掉會丟失信息。如何盡可能的利用不完全數據信息得到較為準確的分析結果,是生存分析的重要問題。區間刪失數據是不完全數據中的一大類,在一些臨床試驗中會廣泛地出現區間刪失數據,即事件發生在某一給定的時間區間內,而觀察者不知道確切的時間點。

根據不同的刪失機制,區間刪失可分為Ⅰ型區間刪失、Ⅱ型區間刪失、追蹤計數刪失、雙變量區間刪失以及雙邊區間刪失[1]。其中Ⅰ型區間刪失數據,也叫現況數據,指對研究對象只進行一次觀察所得到的事件發生與否的信息,常發生在橫斷面研究和非致死性腫瘤致瘤性試驗中,得到左刪失或右刪失數據[1]。而當所得觀測數據中包括至少一個區間(L,R],L,R∈(0,∞),L<R時,我們稱其為Ⅱ型區間刪失數據,其觀測時間點為相互獨立的確定時間,即(L,R]中,L,R均為確定的觀測時間點[1]。其主要發生在需要定期隨訪觀察的研究中,比如AIDS的臨床醫學研究、腫瘤發病率的縱向研究,以及臨床試驗研究。這種刪失機制是由于在實際隨訪中,部分患者未按照預先確定的觀測時間進行觀察,而是選擇在較方便的時間進行觀察;而有些患者可能會錯過一個或多個觀察后再繼續進行觀察[2]。因此不同患者的隨訪觀察時間是不同的,研究者只能得到患者在出現某個結局之前最后一次臨床觀察的時間和出現此結局之后第一次臨床觀察的時間,即Ⅱ型區間刪失數據[3]。其既不同于可以精確測得的數據,又不同于缺失數據,研究者應根據其提供的不完整的數據信息,估計出相對穩定的回歸模型參數,從而解決臨床實際問題。

本文應用Weibull參數回歸模型,Cox-PH半參數回歸模型以及經組均值插補法填補后結合傳統Cox回歸模型和建立偽觀察值的方法,估計含有Ⅱ型區間刪失數據的回歸模型參數最大似然估計值。前兩種方法結合(expectation maxim ization iterative convex m inorant,EM ICM)算法得到模型參數的最大似然估計值;組均值插補法[4]是將區間刪失數據填補為右刪失數據,進而通過擬合傳統Cox回歸模型以及建立偽觀察值的方法得到參數的最大似然估計值。

原理與方法

假設區間刪失信息與生存事件的發生相互獨立,觀測數據滿足獨立同分布,樣本{(Li,Ri],Zi,i=1,…,n},(Li,Ri]為區間刪失Ti的觀察窗,Zi是第i個觀察單位的二維協變量矩陣,Ti獨立于(Li,Ri]。Li=Ri則代表Ti是精確的時間,Li=0表示左刪失,Ri=∞表示右刪失。S(t|Zi)=P(Ti>t|Zi)為給定Zi時,在固定點t>0的Ti的條件生存函數。

1.Weibull回歸模型

求解方程得到最大似然估計值。

2.Cox-PH模型

3.EM ICM算法

為了彌補EM算法的缺陷,ICM算法將最大似然估計的問題轉化成為了線性規劃的問題[8]。認為CX為Km-1的子空間,CX={x=(x1,…,xm-1);0≤x1≤xm-1≤1}。假設C是Km-1的凹錐,φ(X)是從Km-1到K連續可微凹映像的,令x^=argmaxx∈Cφ(X)。當X^時已知的,φ(X)的最大值為下式的最大化:φ*(x|y,W)=,對應固定的y∈κm-1和正定對角矩陣:W=diag(w1,…,wm-1)。ICM算法不需要線性尋求,EM迭代算法保證了ICM算法中似然函數的提升,兩種方法反復映射,保證快速有效得到全局收斂。

4.偽觀察值填補方法基本思想

Vi為占νi相關性的工作協方差矩陣。標準的γ^的“sandw ich”方差-協方差矩陣:

求解方程,得到生存函數S(t)的一致性估計。

5.模擬研究

考慮二維協變量Xi=(Xi1,Xi2),協變量x1來自均勻分布runif(-1,1),協變量x2來自二項分布rbinom(1,0.5),設定協變量系數的真實值為β1=0.5,β2=-0.5。模擬樣本量為50,200,500刪失比例小于50%的數據集。根據不同刪失比例對Cox模型估計結果的影響,刪失率小于等于30%時,得到的模型偏倚性較小[12],故設置小樣本量(n=50)刪失率為小于30%;大樣本量(n=200,500)刪失率為30%~40%。對在不同樣本量情況下的含有Ⅱ型區間刪失的生存數據分別擬合Weibull參數回歸模型和Cox-PH半參數回歸模型,結合EM ICM算法得到模型參數的最大似然估計值,模型估計應用R軟件中的icenReg軟件包;將區間刪失數據填補為右刪失數據,進一步用傳統Cox回歸以及建立偽觀察值的方法估計生存模型,模型估計分別應用R軟件中的survival,pseudo和geepack軟件包。基于上述四種估計方法,比較協變量Xi=(Xi1,Xi2)的估計效果。

模擬結果

在不同樣本量情況下,模擬數據集的刪失比例分別為22.0%,36.0%,34.4%。四種回歸模型參數最大似然估計值如下:Weibull參數回歸模型參數的最大似然估計值分別為半參數回歸模型參數得到的最大似然估計值為;填補為右刪失數據后通過Cox回歸方法得到參數的最大似然估計值分別為填補為右刪失數據后用Pseudo-observations得到參數的最大似然估計值分別為在樣本量為50,刪失比例為22.0%時,前兩種方法估計的參數比較準確,但第二種方法得到的標準差估計量相對更小,即估計的有效性更高;在樣本量為200,刪失比例為36.0%時,前三種方法估計值的無偏性和有效性較高,第四種方法估計的準確性較差;在樣本量為500,刪失比例為34.4%時,四種方法的估計結果差異很小。經模擬發現在不同樣本量情況下,前兩種方法的估計結果比較穩定,準確性較高;同時當刪失比例在30%~40%,樣本量大的情況下,估計的結果更理想。因此對于含有Ⅱ型區間刪失生存數據的回歸模型參數估計,在不同樣本量和刪失比例條件下,Weibull參數回歸模型,Cox-PH半參數回歸模型結合EM ICM算法擬合參數最大似然估計的結果更準確和穩定。

表1 含有Ⅱ型區間刪失生存數據在不同樣本量情況下不同回歸模型參數估計結果

討 論

區間刪失數據是不完全數據中的一大類,在許多臨床試驗數據中都會存在,其中Ⅱ型區間刪失數據既不同于可以精確測得的數據,又不同于缺失數據,如何根據其提供的不完整數據信息,估計出相對穩定的回歸模型參數,從而解決臨床實際問題是生存分析中值得被廣泛關注的課題。目前,對于處理Ⅱ型區間刪失數據的方法,國內學者多采用線性回歸或樣條函數構建模型,并結合EM算法或自相合算法估計模型參數,兩種方法在處理此類數據時計算較為復雜,并且需要很多現實中難以滿足的假設。由于Cox回歸參數估計并不依賴于特定的分布,故其被廣泛用于處理右刪失數據的實際應用中,但對于區間刪失數據,在求解最大似然估計值的過程中可能得不到閉集解,因此用EM ICM算法對含有此類數據的Cox回歸進行參數估計,可得到較為理想的估計結果。

本文用四種方法對含有Ⅱ型區間刪失數據的生存數據進行模型擬合,分別為Weibull參數回歸模型、Cox-PH半參數回歸模型以及將Ⅱ型區間刪失數據填補為右刪失數據后分別用Cox回歸以及建立偽觀察值的方法。通過模擬分析,我們發現在不同樣本量情況下,前兩種方法的模型擬合結果更準確;當刪失比例在30%~40%,樣本量大的情況下,估計的結果更理想。因此對于含有Ⅱ型區間刪失生存數據的回歸模型參數估計,在不同樣本量條件下,Weibull參數回歸模型,Cox-PH半參數回歸模型結合EM ICM算法估計參數最大似然估計值的結果更加準確和穩定。由于右刪失與Ⅱ型區間刪失的刪失機制不同,在將Ⅱ型區間刪失數據轉換為右刪失數據過程中,可能導致一些信息的丟失,故后兩種方法得到的估計結果不穩定。本文模擬只探討了刪失比例小于50%的情況,沒有設定各樣本量高刪失比例與低刪失比例的具體情況,但實際中,不同樣本量的生存數據所包含的Ⅱ型區間刪失數據刪失比例各異,高刪失比例將如何影響不同模型的擬合效果,應采用何種方法處理是我們下一步要解決的問題。此外,我們只考慮了包含兩個協變量的情況,在實際情況中,協變量的個數可以是多個,那么較多協變量存在的情況下,形成了含有Ⅱ型區間刪失數據的高維數據能否用這兩種方法得到較好的模型估計,這是我們需要進一步考慮和驗證的。目前,關于Ⅱ型區間刪失數據的生存分析方法有很多,但都在探索階段,即并沒有某種方法被確定為處理此類數據的最優方案。因此在臨床實踐中,應針對不同的數據情況使用不同的模型擬合方法,并結合適當的協變量選擇方法估計出更準確的模型。

[1]Sun J.The statistical analysis of interval-censored failure time data.American:Springer,2006.

[2]梁潔,王彤,崔燕.Ⅱ型區間刪失數據的生存分析.中國衛生統計,2016,33(2):357-362.

[3]張琴,丁邦俊.區間刪失數據回歸模型的參數估計.華東師范大學,2013:1-26.

[4]Xiao X.Study of an imputation algorithm for the analysis of intervalcensored data.Journal of Statistical Computation and Simulation,2012,84(3):477-490.

[5]Pradhan B.Analysis of interval-censored data with weibull lifetime distribution.Sankhya:The Indian Journal of Statistics,2014,76-B(1):120-139.

[6]Goetghebeur E.Semi-parametric regression analysis of interval-censored data.Biometrics,2000,5(6):1139-1144.

[7]Cai T,Betensky RA.Hazard regression for interval-censored data with penalized spline.Biometrics,2003,59:570-579.

[8]Ding BJ.Regressionmodelw ith an interval-censored data covariant.Chinese Journal of Applied Probability and Statistics,2012.28(2).

[9]Ao Y,YizhengW,Kepher M,etal.Approximate nonparametricmaximum likelihood estimation for interval censoring model case II.International Journal of Statistics and Probability,2014,3(3):44-64.

[10]Graw F,Gerds TA,Schumacher M.On pseudo values for regression analysis in competing risks models.Lifetime Data Analysis,2009,15:241-255.

[11]Andersen PK,Perme MP.Pseudo-observations in survival analysis.Statistical Methods in Medical Research,2010,19(1):71-99.

[12]陳雯,陳昂,夏英華,等.樣本量及刪失率對生存分析模型有效性和偏倚性的影響.中國衛生統計,2013,30(1):5-8.

(責任編輯:郭海強)

Estimation of Regression M odel w ith the CaseⅡInterval-censored Failure Time Data

Liang Jie,Cui Yan,Liu Xiaomeng,et al(Department of Health Statistics,School of Public Health,Shanxi Medical University(030001),Taiyuan)

Objective Our study compares fourmethods to estimate themaximum likelihood estimators of regression model,which contains the typeⅡinterval censored failure data,and discusses the accuracy and stability of the results under the conditions of different sample size.M ethods The sample size was 50,200 and 500.We use the weibull regression model and Cox-PH model to fit the typeⅡinterval censored failure data.EM ICM arithmetic is used to estimate themaximum likelihood estimations of covariates.The imputations of right censored is estimated by traditional Coxmodeland pseudo-observations.Results

In the firstmethod,the estimators of parametrics based on weibullmodel were.While the estimators of parametrics based on Cox-PH model wer

CaseⅡinterval censored failure time data;Maximum likelihood estimation;EM ICM arithmetic;Pseudo observation

國家自然科學基金(81473073)

△通信作者:王彤,Email:tongwang@sxmu.edu.cn

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美成一级| AV不卡无码免费一区二区三区| 99视频精品在线观看| 久久亚洲综合伊人| 日本三级黄在线观看| 亚洲色欲色欲www在线观看| 国产精品不卡片视频免费观看| 98超碰在线观看| 国产欧美精品一区二区| 欧洲欧美人成免费全部视频 | 又大又硬又爽免费视频| 思思99思思久久最新精品| 国产欧美日韩视频怡春院| 国产精品视屏| 91青青视频| 精品国产污污免费网站| 国产亚卅精品无码| 欧美综合成人| 亚洲精品日产精品乱码不卡| 日日拍夜夜嗷嗷叫国产| 精品综合久久久久久97| 国产欧美高清| 中文字幕自拍偷拍| 996免费视频国产在线播放| 亚洲乱码视频| 成人午夜福利视频| 无码区日韩专区免费系列| 国产主播喷水| 久久精品丝袜高跟鞋| 精品久久综合1区2区3区激情| 亚洲国产精品日韩欧美一区| 97国产在线播放| 激情无码字幕综合| 久草视频福利在线观看| 亚洲最大在线观看| 在线观看国产精品日本不卡网| 国产99在线| 一级做a爰片久久毛片毛片| 欧洲av毛片| 日本免费一区视频| 国产日韩久久久久无码精品| 亚洲成aⅴ人在线观看| 欧美无专区| 四虎影院国产| 一级爱做片免费观看久久| 亚洲 欧美 偷自乱 图片| 亚洲欧美精品一中文字幕| 亚洲热线99精品视频| 国产伦精品一区二区三区视频优播 | 久久夜色精品| 欧美视频在线不卡| …亚洲 欧洲 另类 春色| 亚洲,国产,日韩,综合一区| 久久久久人妻一区精品色奶水| 日韩在线第三页| 亚洲 欧美 日韩综合一区| 亚洲国产精品无码AV| 日本人妻丰满熟妇区| 成人综合在线观看| 高清视频一区| 福利在线免费视频| 真实国产乱子伦视频| 久久中文字幕不卡一二区| 免费在线a视频| 亚洲美女AV免费一区| 一级高清毛片免费a级高清毛片| 高清色本在线www| 中美日韩在线网免费毛片视频| 91美女在线| 久久超级碰| 99尹人香蕉国产免费天天拍| 四虎综合网| 国产成人精品一区二区免费看京| 奇米精品一区二区三区在线观看| 欧美劲爆第一页| 国产欧美日韩免费| 国产亚洲成AⅤ人片在线观看| 欧美国产日韩另类| 67194亚洲无码| 综合久久五月天| 国产高潮视频在线观看| 久久伊伊香蕉综合精品|