999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用logistic回歸進(jìn)行直接標(biāo)準(zhǔn)化*

2018-03-05 08:59:31北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系100191李嘉琛余燦清李立明
關(guān)鍵詞:標(biāo)準(zhǔn)化方法模型

北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(100191) 李嘉琛 余燦清 呂 筠 李立明

在流行病學(xué)研究中常常要進(jìn)行不同組間率的比較,如果各比較組之間的重要協(xié)變量(如性別、年齡)分布不同,那么直接計(jì)算粗率并比較會(huì)受到混雜的影響。直接標(biāo)準(zhǔn)化是控制混雜最為常用的方法之一,該方法計(jì)算簡(jiǎn)便、容易理解,得到了廣泛的應(yīng)用。但當(dāng)需要調(diào)整的因素分層較多時(shí),會(huì)出現(xiàn)有些層人數(shù)過(guò)少的情況,此時(shí)難以精確估計(jì)層別率。此外,對(duì)于年齡這類連續(xù)型協(xié)變量,必須轉(zhuǎn)化為分類變量才能用于標(biāo)化,可能帶來(lái)殘余混雜。多重回歸分析可以同時(shí)控制多個(gè)混雜因素,利用模型的預(yù)測(cè)功能計(jì)算調(diào)整均數(shù)或率的思想很早就已出現(xiàn),由最初的一般線性模型推廣到廣義線性模型[1]。然而這些方法在實(shí)際研究中的應(yīng)用還不是很多,一個(gè)可能的原因是其計(jì)算過(guò)程并不直觀,結(jié)果不易解釋。基于模型的直接標(biāo)準(zhǔn)化可將回歸分析與加權(quán)平均的思想相結(jié)合,可以發(fā)揮兩者的優(yōu)勢(shì)。利用logistic回歸計(jì)算直接標(biāo)準(zhǔn)化率主要有兩種不同的計(jì)算方法,目前應(yīng)用還不是很廣泛,本文將對(duì)其進(jìn)行介紹,探討其特點(diǎn)和性質(zhì),比較不同方法的優(yōu)勢(shì)與不足,為研究者選擇分析方法提供參考。

計(jì)算方法

基于回歸進(jìn)行標(biāo)準(zhǔn)化的基本思想是利用回歸模型的預(yù)測(cè)來(lái)代替直接標(biāo)準(zhǔn)化法中層別率的估計(jì),再以標(biāo)準(zhǔn)人口的構(gòu)成作為權(quán)重進(jìn)行加權(quán)平均。其前提假設(shè)是回歸模型可以正確反映因變量與自變量間的關(guān)系。使用y表示二分類的結(jié)局變量,x為用于比較的分組變量,z表示混雜,則回歸模型可以表示為:logitπ=f(x,z),f(x,z)代表自變量的線性函數(shù)。在logistic模型中,概率經(jīng)過(guò)了非線性連接函數(shù)的轉(zhuǎn)換,在加權(quán)平均計(jì)算時(shí)有兩種不同的方法,分別是對(duì)層別預(yù)測(cè)率進(jìn)行加權(quán)平均和對(duì)層別預(yù)測(cè)logit進(jìn)行加權(quán)平均。

1.對(duì)預(yù)測(cè)率進(jìn)行加權(quán)平均

在各比較組按混雜因素分層后,利用回歸方程計(jì)算各層的預(yù)測(cè)結(jié)局概率,再以標(biāo)準(zhǔn)人口構(gòu)成為權(quán)重進(jìn)行加權(quán)平均:P=∑wiPi,其中wi代表第i層的權(quán)重,Pi代表第i層的預(yù)測(cè)結(jié)局概率。上述過(guò)程適用于所有要調(diào)整的變量均為分類變量的情形。有時(shí)協(xié)變量中包含連續(xù)變量,而我們又不希望將其轉(zhuǎn)化分類變量損失信息,此時(shí)可以計(jì)算邊際預(yù)測(cè)率[2]。“邊際”的含義是在用回歸方程計(jì)算預(yù)測(cè)概率時(shí),除要比較的分組變量以外,所有協(xié)變量的取值并不固定,而是使用標(biāo)準(zhǔn)人群的觀察值。某一組(x=k)的邊際預(yù)測(cè)率計(jì)算過(guò)程如下:首先要給定一個(gè)標(biāo)準(zhǔn)人群數(shù)據(jù)集,該數(shù)據(jù)集要包含每一個(gè)體的所有協(xié)變量取值。將所有人的x取值固定為k,其他協(xié)變量取值保持不變,計(jì)算每一個(gè)體的預(yù)測(cè)結(jié)局概率,求出預(yù)測(cè)率的算數(shù)平均數(shù)即為該組的標(biāo)化率:

(1)

其中n為標(biāo)準(zhǔn)人群的人數(shù),zj為第j人的協(xié)變量取值。由計(jì)算過(guò)程可以看出,邊際預(yù)測(cè)率在個(gè)體層面上預(yù)測(cè)結(jié)局概率,再以相等的權(quán)重1/n進(jìn)行加權(quán)平均,因此其含義與直接標(biāo)準(zhǔn)化一致,可以解釋為在標(biāo)準(zhǔn)人群的協(xié)變量分布下的結(jié)局事件概率。

2.對(duì)預(yù)測(cè)logit進(jìn)行加權(quán)平均

(2)

其中n為標(biāo)準(zhǔn)人群的人數(shù),zj為第j人的協(xié)變量取值。

3.標(biāo)化率的標(biāo)準(zhǔn)誤和置信區(qū)間

在不同的方法中,標(biāo)準(zhǔn)化率置信區(qū)間的估計(jì)方法也有所不同。直接標(biāo)化法和對(duì)預(yù)測(cè)概率加權(quán)平均法計(jì)算的置信區(qū)間為標(biāo)化率點(diǎn)估計(jì)值加減標(biāo)準(zhǔn)誤倍數(shù)的形式(Wald置信區(qū)間)。然而對(duì)概率而言,這種以點(diǎn)估計(jì)值為中心的對(duì)稱的置信區(qū)間往往是不合理的[5]。對(duì)logit加權(quán)平均的方法則是計(jì)算標(biāo)化logit的Wald置信區(qū)間,再轉(zhuǎn)換為概率的區(qū)間。由于logit比概率P更有可能服從正態(tài)分布,因此有研究者認(rèn)為這種方法在統(tǒng)計(jì)學(xué)上更為合適[3]。

4.軟件實(shí)現(xiàn)

當(dāng)調(diào)整的變量均為分類變量時(shí),可以直接利用統(tǒng)計(jì)軟件輸出模型的回歸系數(shù)估計(jì)值以及協(xié)方差矩陣來(lái)計(jì)算標(biāo)準(zhǔn)化率和置信區(qū)間。當(dāng)存在連續(xù)協(xié)變量時(shí),需要計(jì)算邊際預(yù)測(cè)率,Stata 11增加了“margins”命令可以便捷地實(shí)現(xiàn)這一計(jì)算[5]。SAS本身沒(méi)有對(duì)應(yīng)的過(guò)程,不過(guò)有研究者編寫(xiě)了宏,可用于計(jì)算邊際預(yù)測(cè)率,并且提供了多種置信區(qū)間的估計(jì)方法[5]。

基于回歸的標(biāo)化率與其他調(diào)整率

利用回歸模型可以計(jì)算控制混雜后的因變量預(yù)測(cè)值,這一過(guò)程也被稱為“調(diào)整”或“校正”。基于模型的調(diào)整預(yù)測(cè)值分為兩類,一類是固定分組變量和協(xié)變量取值,計(jì)算條件均數(shù)或概率,稱為條件預(yù)測(cè)值(conditional prediction),協(xié)變量通常是取樣本或某個(gè)人群的平均數(shù);另一類是固定分組變量取值,保持協(xié)變量的實(shí)際觀察值,計(jì)算個(gè)體的平均調(diào)整預(yù)測(cè)值,稱為邊際預(yù)測(cè)值(marginal prediction)[2,6-8]。在線性回歸模型中,兩者的結(jié)果一致,而在非線性模型中結(jié)果不同,一些研究對(duì)兩類方法進(jìn)行了比較[2,6-7,9]。調(diào)整與直接標(biāo)準(zhǔn)化的概念存在區(qū)別和聯(lián)系,有時(shí)會(huì)令人困惑。

兩種標(biāo)準(zhǔn)化的計(jì)算方法雖是基于同樣的回歸模型,卻會(huì)得出不相等的結(jié)果。對(duì)預(yù)測(cè)概率進(jìn)行加權(quán)平均(邊際預(yù)測(cè)率)是被許多研究者所接受的計(jì)算方法。對(duì)層別logit加權(quán)平均的方法自提出后也已被一些研究所采用[10-11],但還沒(méi)有研究者將其與邊際預(yù)測(cè)率、直接標(biāo)化率進(jìn)行比較。下面通過(guò)實(shí)例分析來(lái)說(shuō)明兩種方法的計(jì)算過(guò)程,并展示出兩種方法標(biāo)化結(jié)果的差異。

分析實(shí)例

利用中國(guó)慢性病前瞻性研究(China Kadoorie Biobank)基線調(diào)查數(shù)據(jù)[12]分析教育程度與吸煙的關(guān)系。以教育程度為自變量,分為大學(xué)及以上、大學(xué)以下兩組;吸煙為二分類結(jié)局變量,分為當(dāng)前每日吸煙與其他兩組。直接計(jì)算兩組的粗吸煙率,大學(xué)及以上者為21.0%,大學(xué)以下者為26.6%。在分析中發(fā)現(xiàn),不同教育程度人群的性別構(gòu)成不同,而性別與吸煙行為關(guān)聯(lián)較強(qiáng)。為了控制性別因素的影響,按性別分層計(jì)算吸煙率,結(jié)果見(jiàn)表1。為進(jìn)行綜合比較,合并全部樣本作為標(biāo)準(zhǔn)人群,進(jìn)行直接標(biāo)準(zhǔn)化。首先采用傳統(tǒng)的計(jì)算方法,直接估計(jì)兩組的層別吸煙率,經(jīng)加權(quán)平均計(jì)算后得出標(biāo)化率。

表1 不同教育程度人群分性別吸煙率

建立吸煙率與教育和性別的回歸方程:logitP=1.1481×edu+4.1992×gender-4.8574,其中edu代表學(xué)歷水平,取值為0和1,以大學(xué)及以上組(edu=0)為參照;gender為性別,取值為0和1,以女性為參照(gender=0)。分別用兩種基于logistic回歸的方法計(jì)算標(biāo)化率,各層權(quán)重以及層別率和層別logit的預(yù)測(cè)值見(jiàn)表2。

表2 按性別分層的權(quán)重以及層別率、層別logit

表3 不同方法計(jì)算標(biāo)化吸煙率的比較(%)

表3顯示了幾種直接標(biāo)準(zhǔn)化法的結(jié)果比較,并利用兩組的標(biāo)化率計(jì)算了關(guān)聯(lián)強(qiáng)度指標(biāo)OR值和RR值。從兩組粗率的比較可以看出,大學(xué)及以上學(xué)歷的人吸煙率低于大學(xué)以下的人。由于低學(xué)歷者中女性比例較高,而女性吸煙率遠(yuǎn)低于男性,從理論上講性別的混雜會(huì)使關(guān)聯(lián)強(qiáng)度被低估。采用任何一種方法進(jìn)行標(biāo)準(zhǔn)化后,RR值和OR值均增大,說(shuō)明這三種方法都對(duì)混雜偏倚起到了一定的控制作用。在本例中吸煙并不是一個(gè)罕見(jiàn)事件,因此OR值并不能很好地近似RR值[13]。直接標(biāo)化法與對(duì)率加權(quán)平均方法的結(jié)果基本相同,這是由于直接計(jì)算的層別率與使用logistic模型計(jì)算的層別率高度一致(表2),表明在本例中模型對(duì)數(shù)據(jù)的擬合是比較好的。

由于樣本中大學(xué)以下人數(shù)比例較大(97.7%),合并后標(biāo)準(zhǔn)人群的性別構(gòu)成十分接近大學(xué)以下人群,所以大學(xué)以下組的標(biāo)化率理應(yīng)與粗率相差不大,直接標(biāo)準(zhǔn)化和對(duì)預(yù)測(cè)率加權(quán)平均方法得到的結(jié)果都是如此。而對(duì)logit加權(quán)平均法得到的大學(xué)以下組的調(diào)整吸煙率為12.0%,這顯然不是標(biāo)準(zhǔn)人口構(gòu)成下的大學(xué)以下人群吸煙率,出現(xiàn)這種現(xiàn)象的根源就是ln(P/1-P)和P的非線性關(guān)系。在這里,12.0%和4.2%只能理解為對(duì)直接標(biāo)化率的有偏差的估計(jì)值,并沒(méi)有現(xiàn)實(shí)意義。如果錯(cuò)誤地將其理解為直接標(biāo)化率,那么當(dāng)前每日吸煙者的比例將被嚴(yán)重低估。理論分析表明,當(dāng)協(xié)變量與結(jié)局關(guān)聯(lián)較強(qiáng)時(shí),對(duì)logit加權(quán)平均法得到的調(diào)整率與直接標(biāo)化率相差較大,在本例中,混雜因素性別與吸煙率關(guān)聯(lián)極強(qiáng)(OR=67),因此兩種基于回歸的標(biāo)準(zhǔn)化方法結(jié)果有明顯的差別。

討 論

通過(guò)比較,可以總結(jié)兩種基于logistic回歸的標(biāo)準(zhǔn)化方法的特點(diǎn):邊際預(yù)測(cè)率與傳統(tǒng)的直接標(biāo)準(zhǔn)化法一致,結(jié)果容易理解,得到的置信區(qū)間以率的點(diǎn)估計(jì)值為中心;對(duì)logit進(jìn)行加權(quán)平均的方法可以得到非對(duì)稱的置信區(qū)間,利用其調(diào)整率計(jì)算出的OR值等于模型估計(jì)的OR值。其不足之處在于其結(jié)果并不等于直接標(biāo)化率,當(dāng)混雜因素與結(jié)局關(guān)聯(lián)較強(qiáng)時(shí),用這種方法估計(jì)直接標(biāo)準(zhǔn)化率會(huì)產(chǎn)生較大偏差。

基于多重回歸的標(biāo)準(zhǔn)化在調(diào)整連續(xù)變量、控制多個(gè)混雜因素時(shí)具有優(yōu)勢(shì),傳統(tǒng)的直接標(biāo)準(zhǔn)化對(duì)分層因素各水平的所有組合分別估計(jì)結(jié)局概率,相當(dāng)于考慮所有可能的交互作用,而回歸模型可以幫助我們忽略其中一些沒(méi)有意義的交互作用,得到比較精確的層別率估計(jì)值。以往有人認(rèn)為邊際預(yù)測(cè)率只能以合并樣本為標(biāo)準(zhǔn)人群,也就是只能進(jìn)行樣本內(nèi)部調(diào)整[6],然而實(shí)際上并非如此,利用回歸進(jìn)行標(biāo)準(zhǔn)化可以使用外部的標(biāo)準(zhǔn)人群,從而實(shí)現(xiàn)不同研究之間的比較。

使用回歸模型進(jìn)行標(biāo)準(zhǔn)化同樣要注意一些問(wèn)題。首先,與傳統(tǒng)的直接標(biāo)準(zhǔn)化法相同,當(dāng)各比較組的層別率間比較出現(xiàn)明顯差異甚至交叉時(shí),不宜計(jì)算一個(gè)綜合的標(biāo)化率,此時(shí)權(quán)重的選擇會(huì)成為影響最終各組標(biāo)化率比較的主要因素,是否適宜進(jìn)行標(biāo)準(zhǔn)化可以通過(guò)檢驗(yàn)?zāi)P椭械慕换ロ?xiàng)來(lái)判斷[14]。對(duì)于結(jié)果的理解要正確,標(biāo)化率不再反映實(shí)際水平,是假定在特定協(xié)變量分布人群中的預(yù)測(cè)概率。與直接標(biāo)準(zhǔn)化不同的是,利用模型進(jìn)行標(biāo)準(zhǔn)化的前提假設(shè)是回歸模型可以正確估計(jì)層別率,因此能夠較好擬合數(shù)據(jù)的回歸方程是必要的。

本文介紹了兩種基于logistic回歸的標(biāo)準(zhǔn)化方法,在一般情況下,兩者都可以用于估計(jì)直接標(biāo)準(zhǔn)化率。但是當(dāng)調(diào)整的因素與結(jié)局關(guān)聯(lián)很強(qiáng)時(shí),對(duì)logit進(jìn)行加權(quán)平均的方法會(huì)造成誤導(dǎo),計(jì)算邊際預(yù)測(cè)率是更好的選擇。由于基于回歸的調(diào)整率計(jì)算方法較多,研究者應(yīng)具體說(shuō)明所使用的方法以及選擇的標(biāo)準(zhǔn)人群,使讀者能正確理解研究結(jié)果。

[1] Lee J.Covariance adjustment of rates based on the multiple logistic regression model.J Chronic Dis,1981,34(8):415-426.

[2] Lane PW,Nelder JA.Analysis of covariance and standardization as instances of prediction.Biometrics,1982,38(3):613-621.

[3] Roalfe AK,Holder RL,Wilson S.Standardisation of rates using logistic regression:a comparison with the direct method.BMC Health Serv Res,2008,8(1):275.

[4] Flanders WD,Rhodes PH.Large sample confidence intervals for regression standardized risks,risk ratios,and risk differences.J Chronic Dis,1987,40(7):697-704.

[5] Zou GY.Assessment of risks by predicting counterfactuals.Stat Med,2009,28(30):3761-3781.

[6] Wilcosky TC,Chambless LE.A comparison of direct adjustment and regression adjustment of epidemiologic measures.J Chronic Dis,1985,38(10):849-856.

[7] Muller CJ,MacLehose RF.Estimating predicted probabilities from logistic regression:different methods correspond to different target populations.Int J Epidemiol,2014,43(3):962-970.

[8] Graubard BI,Korn EL.Predictive margins with survey data.Biometrics,1999,55(2):652-659.

[9] Chang IM,Gelman R,Pagano M.Corrected group prognostic curves and summary statistics.J Chronic Dis,1982,35(8):669-674.

[10]Ursano RJ,Kessler RC,Stein MB,et al.Suicide Attempts in the US Army During the Wars in Afghanistan and Iraq,2004 to 2009.JAMA Psychiatry,2015,72(9):153-159.

[11]Gilman SE,Bromet EJ,Cox KL,et al.Sociodemographic and career history predictors of suicide mortality in the United States Army 2004-2009.Psychol Med,2014,44(12):2579-2592.

[12]李立明,呂筠,郭彧,等.中國(guó)慢性病前瞻性研究:研究方法和調(diào)查對(duì)象的基線特征.中華流行病學(xué)雜志,2012,33(3):249-255.

[13]李鵬聲,梁融,周舒冬,等.應(yīng)用logistic回歸模型間接估計(jì)RR/PR的方法探討.中國(guó)衛(wèi)生統(tǒng)計(jì),2014,31(6):949-951.

[14]Freeman DH Jr,Holford TR.Summary rates.Biometrics,1980,36(2):195-205.

猜你喜歡
標(biāo)準(zhǔn)化方法模型
一半模型
標(biāo)準(zhǔn)化簡(jiǎn)述
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
標(biāo)準(zhǔn)化是綜合交通運(yùn)輸?shù)谋U稀庾x《交通運(yùn)輸標(biāo)準(zhǔn)化體系》
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚(yú)
論汽車維修診斷標(biāo)準(zhǔn)化(上)
主站蜘蛛池模板: 最新日本中文字幕| 国产香蕉一区二区在线网站| 3D动漫精品啪啪一区二区下载| 四虎精品黑人视频| 激情综合婷婷丁香五月尤物| 欧美一区国产| 最新国语自产精品视频在| 日韩第九页| 国产成人亚洲精品无码电影| 亚洲国产欧美自拍| 五月婷婷综合网| 一区二区三区毛片无码| 精品久久国产综合精麻豆| a免费毛片在线播放| 婷婷丁香在线观看| 日韩美女福利视频| 国产成人综合日韩精品无码不卡| 中国一级毛片免费观看| 国产丝袜啪啪| 女人18毛片水真多国产| 欧美性久久久久| 成年网址网站在线观看| 99成人在线观看| 日本久久网站| 国产精品美女自慰喷水| 美女高潮全身流白浆福利区| 国产一区二区三区在线精品专区| 国产幂在线无码精品| 亚洲欧美人成电影在线观看| 99精品影院| 国产综合日韩另类一区二区| 好吊妞欧美视频免费| 免费在线成人网| 国产成人精品亚洲日本对白优播| 国产精品午夜电影| 亚洲欧美国产高清va在线播放| 亚洲成综合人影院在院播放| 国产精品第| 91亚瑟视频| 精品久久香蕉国产线看观看gif| 亚洲福利一区二区三区| 亚洲欧美成人在线视频| 在线观看视频一区二区| 天天操天天噜| 久久伊伊香蕉综合精品| 婷婷五月在线| 尤物午夜福利视频| 亚洲精品欧美重口| 亚洲AⅤ综合在线欧美一区| 久久久精品无码一二三区| 久久狠狠色噜噜狠狠狠狠97视色| 在线a视频免费观看| 国产成人麻豆精品| 国产簧片免费在线播放| 波多野结衣一二三| 国产成人亚洲毛片| 欧美a在线看| 国产97视频在线| 欧美亚洲一区二区三区导航| 亚洲日产2021三区在线| 久久婷婷六月| 国产高潮流白浆视频| 四虎国产永久在线观看| 欧美另类一区| 亚洲成人黄色网址| 亚洲国产综合精品一区| 国产黄在线免费观看| 久操线在视频在线观看| 亚洲中文字幕在线一区播放| av一区二区无码在线| 日韩欧美国产三级| 五月丁香在线视频| 精品欧美视频| 日韩AV无码一区| 找国产毛片看| 91蜜芽尤物福利在线观看| 国产精品一区二区国产主播| 在线免费不卡视频| 国产女人在线视频| 国产在线一区视频| 青青草一区| 欧美精品二区|