999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

非獨立數據時穩健Poisson和Log-binom ial隨機效應模型研究*

2014-03-10 07:04:06周舒冬郜艷暉李麗霞張敏楊翌陳
中國衛生統計 2014年5期
關鍵詞:效應模型

周舒冬郜艷暉△李麗霞張 敏楊 翌陳 躍

非獨立數據時穩健Poisson和Log-binom ial隨機效應模型研究*

周舒冬1郜艷暉1△李麗霞1張 敏1楊 翌1陳 躍2

目的比較基于穩健Poisson回歸及Log-binom ial的隨機效應模型對具有層次結構的非罕見結局事件資料的參數估計結果。方法通過計算機模擬生成具有類內相關的數據集,設置了32種參數情況,分別反映實際資料中的少數類別數和中等類別數,小強度的類內聚集和中等強度的類內聚集,基線患病率分別為0.15和0.3,關聯強度PR值分別是1.5和2.0,暴露率分別為20%和50%的情況;比較各模型在模擬條件下的收斂率、參數估計結果以及參數的95%CI覆蓋率。結果Log-binomial隨機效應模型的收斂效果劣于穩健Poisson隨機效應模型;兩隨機效應模型對各參數的估計結果均和真值較為接近;在類內聚集性較小時,兩隨機效應模型95%CI覆蓋率均較好,但隨類內聚集性增大,Log-binom ial的隨機效應模型95%CI覆蓋率變動較大,且類別數增加時覆蓋率普遍較低。結論基于穩健Poisson的隨機效應模型收斂率高,參數估計結果與真實值接近,對各固定效應參數估計的95%CI的覆蓋率高且穩定,優于Log-binomial隨機效應模型。

非獨立 穩健Poisson回歸 Log-binom ial模型 隨機效應 患病率比

流行病學封閉性隊列研究和橫斷面研究中,OR值被廣泛應用于RR/PR的近似估計,但研究結局出現頻率較高(如大于10%)時,會嚴重高估暴露對結局的影響,這一問題早已引起統計學者注意,因此直接估計RR/PR的模型被提出,如Log-binomial模型和穩健Poisson回歸模型,其參數解釋更為合理[1]。但基于穩健Poisson回歸和Log-binom ial模型的相關理論和應用研究尚顯不足,因此本研究通過計算機模擬,探討穩健Poisson和Log-binomial的隨機效應模型參數估計的有效性及應用中的相關問題。

模型原理與方法

本研究以方差分量模型為基礎,探討基于穩健Poisson回歸及Log-binomial的隨機效應模型。

1.穩健Poisson隨機效應模型

設yki和Xki=(x1ki,x2ki,…,xpki)T分別為第k(k=1,2,…,K)類內第i(i=1,2,…,nk)個個體的二分類結局變量和P×1維解釋變量向量,uk為第k類的隨機效應,則構建隨機效應模型:

式中,pki=Pr(yki=1|Xki),連接函數采用log函數,βp為固定效應參數,反映固定效應xp對結局概率對數的影響,且RR(PR)=exp(βp);假定隨機效應uk來自正態分布總體,即隨機效應方差的大小反映結局變量在類內的聚集程度。

當誤差分布指定為Poisson分布時,由于Poisson分布的方差無邊界(方差等于均數),當應用到二項分布資料時,易出現過度離散問題,即高估參數的方差,導致較寬的置信區間。處理高估方差的一個經典方法是引入Huber的穩健“三明治”方差:

其中,

從而構建穩健Poisson隨機效應模型。

2.Log-binomial隨機效應模型

Log-binom ial隨機效應模型同式(1),但誤差分布指定為二項分布。應用于獨立數據時,基本的Log-binom ial模型最大似然估計時需加一個限制條件,對所有個體,令

最大似然估計的解應該在此條件限制的參數空間中。Log-binomial模型在參數估計過程中,最大似然估計的解如果落在有限制的參數空間邊界上,易出現不收斂的情形,模型中包含連續型協變量時尤甚。實際工作中經驗性地設置截距β0=-4可能效果較好[2],Deddens建議也可先對原始數據集調整擴充后再擬合Log-binomial模型,即可得到參數的近似最大似然估計(maximum-likelihood estimation,簡稱MLE)值,稱為COPY算法[3],獨立數據情況下,其收斂性和近似MLE的唯一性已有嚴格的理論證明[4]。

目前穩健Poisson和Log-binomial的隨機效應模型都可在SAS中采用Proc Glimmix過程實現,連接函數選用log連接,誤差分布分別指定為Poisson分布和二項分布,并用random語句指定截距項以擬合方差分量模型。

模擬研究

1.模擬方法及參數設置

模擬研究生成具有類內相關的數據集,按log-binomial隨機效應模型產生。數據集中包含兩個自變量X1和X2,假定X1為二分類自變量(1=暴露;0=非暴露),X2為連續型協變量;Y為二分類因變量(1=結局發生;0=結局未發生)。每個數據集共有N類,每類包括Nk個個體,因變量Y具有類內相關,類間獨立的特性。

(1)類別數N和類內個體數Nk的設置

假定每個數據集的平均樣本量為500,模擬類別數N為20和50兩種情況。類別數N=20時,類內個體數Nk由均勻分布U(0,50)隨機產生,即Nk的均數為25;類別數N=50時,類內個體數Nk由均勻分布U(0,20)隨機產生,即Nk的均數為10[5-6]。

(2)隨機效應及參數設置

假設隨機效應uk來自正態分布,均數為0,方差為0.1或0.2兩種情況,分別相當于類內相關系數在0.01和0.15之間,其大小依賴于暴露因素和協變量的效應。研究顯示這種大小在實際資料中常見。

(3)固定效應及參數設置

固定效應x1ki為二分類變量,假定來自二項分布,即x1ki~B(p);x2ki為連續變量,假定來自均勻分布,且依賴于x1ki,即x2ki/x1ki~U(-6+2x1ki,2+2x1ki)。考慮基線患病率為0.3和0.15兩種情況,暴露因素X1的PR值分別為1.5和2.0,暴露率分別為0.2和0.5,協變量X2的回歸系數分別為0.18,0.10,0.36和0.20[7]。共組成8種參數情況,如表1。

表1 模擬研究固定效應參數設置情況

(4)因變量Y的設置

兩分類結局變量Y(1/0)來自n為1的二項分布,概率Pij為

模擬過程中,如果固定效應和隨機效應各組合的結果使Pki≥1,舍棄并模擬產生新的值,直到Pki<1。

在上述各參數設置情況下,本研究共模擬2(類別數為20和50)×2(隨機效應方差0.1和0.2)×8(固定效應參數設置情況1-8)=32種情況。每種情況下,改變隨機數的種子共模擬不相關的1000個數據集。所有模擬數據集均在SAS9.2軟件中產生,并擬合穩健Poisson隨機效應模型和Log-binom ial隨機效應模型。

2.評價指標

(1)收斂率

對每種模擬情況,考察基于穩健Poisson、Log-binomial的兩類隨機效應模型的收斂情況并計算收斂率。

(2)參數估計值的均值和95%CI覆蓋率

在每種模擬情況下,根據每種模型的1000個參數估計結果,分別計算回歸系數β0,β1和β2估計值的均值及95%CI對參數真值的覆蓋率。

3.結果

(1)收斂率

表2顯示32種模擬情況下兩類隨機效應模型參數估計的收斂率(%)。32種模擬條件下穩健Poisson隨機效應模型的收斂率波動范圍為81.4%~ 100.0%,而Log-binomial隨機效應模型的收斂率波動范圍為4.7%~98.6%,波動較大。類別數為20時穩健Poisson隨機效應模型和Log-binomial隨機效應模型的最低收斂率分別為81.4%和5.9%;類別數為50時穩健Poisson隨機效應模型和Log-binomial隨機效應模型的最低收斂率分別為91.9%和4.7%。

表2 32種模擬情況下兩類隨機效應模型參數估計的收斂率(%)

(2)參數估計值的均值與95%CI覆蓋率

表3和表4顯示了2類模型在不同隨機效應方差水平、類別數及固定效應參數條件下分別進行1000次參數估計的β0、β1、β2的均值和95%CI覆蓋率。兩模型對各設定條件下的參數估計結果與真值均較為接近,受類別數或隨機效應方差的影響不大。

穩健Poisson隨機效應模型對各參數的覆蓋率均在80%以上,和Log-binomial隨機效應模型相比,95%CI覆蓋率變異較??;在隨機效應方差較?。?.1)時,穩健Poisson和Log-binomial的隨機效應模型參數估計的95%CI覆蓋率較接近,受類別數目影響較小;當隨機效應方差增大和類別數同時增大時,Log-binomial隨機效應模型估計的各參數95%CI覆蓋率降低,且變異較大。

表3 類別數為20時,兩種模型參數估計均值與真值的比較以及95%CI的覆蓋率

*:模型1和模型2分別是穩健Poisson-隨機效應和Log-binom ial-隨機效應(COPY算法)

表4 類別數為50時,兩種模型參數估計均值與真值的比較以及95%CI的覆蓋率

討 論

隊列研究或橫斷面研究資料中,穩健Poisson回歸和log-binom ial模型常用于估計RR/PR,當用于獨立數據時,Deddens[8]顯示中等樣本量情況下,穩健Poission回歸對PR估計的偏倚小于Log-binomial模型,但Log-binomial模型所估計的患病概率不會大于1,且可以使用似然比檢驗,相較Wald檢驗可能更好。但運用穩健Poisson模型幾乎很少有收斂問題,又可直接對原始數據分析,省去了數據操作的過程而更容易使用,因此學者建議[9-10],log-binomial不收斂時可首先考慮穩健Poisson回歸。

另一方面,解決非獨立數據的問題,很自然地思路是將其推廣到多水平模型,因此本研究主要探討Logbinom ial模型和穩健Poisson模型的隨機效應模型,采用計算機模擬實驗考察不同組合情況下模型參數估計的有效性和準確性。

本研究中的模擬實驗共設置了32種參數情況,分別反映實際資料中的少數類別數和中等類別數,小強度和中等強度的類內聚集,模擬結果顯示,各類參數設置情況下,兩類隨機效應模型的參數估計值與真值差別均不大,估計RR/PR有較高的準確性,且穩健Poisson隨機效應模型的覆蓋率較高。但隨著類內聚集性增大,Log-binom ial的隨機效應模型95%CI覆蓋率變動較大,且類別數增加時覆蓋率普遍較低,表明穩健Poisson隨機效應模型的穩健性較好。此外Log-binom ial隨機效應模型的收斂效果劣于穩健Poisson隨機效應模型,這與獨立數據時情況一致,在Log-binomial模型基礎上增加隨機效應后可能導致更多參數估計的不確定性。

盡管本研究不能窮盡各種可能的實際情況,但模擬條件下結果顯示,和Log-binomial隨機效應模型相比,運用穩健Poisson隨機效應模型幾乎很少有收斂問題,又可直接對原始數據分析,省去了COPY算法中數據操作過程而更容易使用;參數估計值與真值的絕對偏差均較小,對各固定效應參數估計的95%CI的覆蓋率高且穩定,故在結局頻率較高的非獨立數據中估計RR/PR時推薦使用。不過Kauermann&Carroll在實驗中發現三明治方差的估計效率較基于模型的方差估計方法的差,尤其是當數據來源于小樣本的實驗單位而且不同實驗單位間協變量不同時,主要表現為參數估計的置信區間覆蓋率較低,此時建議對置信區間進行校正[12]。

1.Str?mberg U.Prevalence odds ratio v prevalence ratio.Occup Environ Med,1994,51(2):143-144.

2.Deddens JA,Petersen MR,Lei X.Estimation of prevalence ratioswhen PROC GENMOD does not converge.Proceedings of the 28th Annual SASUsers Group International Conference,Seattle,Washington,2003:270-28.

3.Deddens JA,Petersen MR.Approaches for estimating prevalence ratios. Occup Environ Med,2008,65(7):501-506.

4.Savu A,Liu Q,Yasui Y.Estimation of relative risk and prevalence ratio.Stat Med,2010,29(22):2269-2281.

5.Yelland LN,Salter AB,Ryan P.Relative Risk Estimation in Cluster Randomized Trials:A Comparison of Generalized Estimating Equation Methods.International Jof BIOST,2011,7(1):1-26.

6.Yu B,Wang Z.Estimating relative risks for common outcome using PROC NLP.Comput Methods Programs Biomed,2008,90(2):179-186.

7.Zou GY,Donner A.Extension of themodified Poisson regressionmodel to prospective studies w ith correlated binary data.Stat Methods Med Res,2013,22(6):661-670.

8.Petersen MR,Deddens JA.A comparison of twomethods for estimating prevalence ratios.BMC Med Res Methodol,2008,8:9.

9.Lee J,Tan C S,Chia K S.A practical guide formultivariate analysis of dichotomous outcomes.Ann Acad Med Singapore,2009,38(8):714-719.

10.Spiegelman D,Hertzmark E.Easy SAS calculations for risk or prevalence ratios and differences.Am JEpidem iol,2005,162(3):199-200.

11.Goran K,Raymond JC.A note on the efficiency of sandw ich covariancematrix estimation.JAm Stat Assoc,2001,12:1387-1396.

(責任編輯:郭海強)

A Com parative Study between Robust Poisson and Log-binom ial M odel w ith Random Effects M odels to Estimate RR/PR in Non-independent Data

Zhou Shudong,Gao Yanhui,Li Lixia,et al(DepartmentofEpidemiologyandBiostatistics,SchoolofPublicHealth,Guangdong PharmaceuticalUniversity,GuangdongKeyLaboratoryofMolecularEpidemiology(510310),Guangzhou)

ObjectiveTo compare the parameter estimation results based on robust Poisson and Log-binomialmodels w ith random effects in the hierarchical and uncommon outcome datasets.MethodsThe simulation datasets were generated by computer,including 32 kinds of parameters conditions,respectively,reflecting the small and the medium number of categories,low and medium aggregation w ithin the classes,0.15 and 0.3 of the baseline prevalence,1.5 and 2.0 of the PR value,20%and 50%of the cases’exposure rate.The convergence rates,parameter estimation results and the 95%CIcoverage parameters in all the simulations were compared.ResultsThe convergence effects of Log-binom ialmodel w ith random effects were worse than the robust Poisson.The estimation results of two random effectsmodel were both closer to the true value.Two random effects models’95%CIcoveragewere good when the classes’aggregation was low,butw ith the addition in intra-class clustering,95% CI coverage of Log-binom ial random effectsmodelwas unstable,and the coverage was generally low when the number of categories increased.ConclusionThe convergence rates of robust Poisson random effectsmodel were good,the parameter estimation resultswere close to the true value,and the 95%CIcoverageswere high and stable,superior to Log-binom ial random effects model.

Non-independent;Robust Poisson regression;Log-binomialmodel;Random effects;Prevalence ratio

廣東省自然科學基金(項目號:10151022401000018)

1.廣東藥學院公共衛生學院流行病與衛生統計學系,廣東省分子流行病學重點實驗室(510600)

2.Department of Epidem iology and Community Medicine,University of Ottawa.

△通信作者:郜艷暉,E-mail:gao_yanhui@163.com

猜你喜歡
效應模型
一半模型
鈾對大型溞的急性毒性效應
懶馬效應
今日農業(2020年19期)2020-12-14 14:16:52
場景效應
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
應變效應及其應用
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
偶像效應
主站蜘蛛池模板: 国产99视频免费精品是看6| 亚洲欧美国产五月天综合| 久久精品中文字幕少妇| 久久久久久久久18禁秘| 色综合婷婷| 国产精品夜夜嗨视频免费视频| 欧美视频免费一区二区三区| 中文字幕亚洲专区第19页| 成人av专区精品无码国产 | 人妻精品久久无码区| 久久人妻xunleige无码| 精品久久久久久成人AV| 国产精品福利社| AV天堂资源福利在线观看| 最新加勒比隔壁人妻| 欧洲av毛片| 18禁影院亚洲专区| 中文字幕无码中文字幕有码在线| 亚洲天堂日韩av电影| 人妻91无码色偷偷色噜噜噜| 三上悠亚在线精品二区| 色爽网免费视频| 99re66精品视频在线观看| 区国产精品搜索视频| 91在线激情在线观看| 亚洲av片在线免费观看| 91久久偷偷做嫩草影院免费看| 青青草欧美| 国产成人一区在线播放| 永久在线播放| 免费视频在线2021入口| 国产99久久亚洲综合精品西瓜tv| 五月激情婷婷综合| 凹凸国产熟女精品视频| 特级欧美视频aaaaaa| 久久网欧美| 国产精品午夜福利麻豆| 99视频全部免费| 精品视频一区在线观看| 巨熟乳波霸若妻中文观看免费 | 99re在线观看视频| 亚洲精品男人天堂| 欧美特黄一免在线观看| 综合网天天| 亚洲床戏一区| 久久综合色视频| 日本在线免费网站| 亚洲V日韩V无码一区二区| 第一区免费在线观看| 亚洲视频四区| 成人精品亚洲| 丝袜无码一区二区三区| 中文字幕66页| 亚洲国产欧美国产综合久久 | 日韩高清一区 | 国产在线观看第二页| 久久一本日韩精品中文字幕屁孩| 国产精品午夜福利麻豆| 亚洲综合九九| 国产精品亚洲天堂| 欧美一道本| 91美女视频在线| 伊人久久大香线蕉综合影视| 日韩经典精品无码一区二区| 日韩第一页在线| 青青草一区二区免费精品| 日本黄色a视频| 无码一区中文字幕| 99这里只有精品在线| 婷婷伊人久久| 99这里只有精品在线| 日本色综合网| 国产主播在线一区| 欧美亚洲综合免费精品高清在线观看| 亚洲最新在线| 亚洲精选高清无码| 亚洲国语自产一区第二页| 黄色网站在线观看无码| 性欧美久久| 亚洲国产成人自拍| 亚洲欧美不卡中文字幕| 欧美亚洲国产一区|