999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

雙重差分模型在醫學研究中的應用*

2015-01-27 10:31:04沈敏學孫振球
中國衛生統計 2015年3期
關鍵詞:測量模型

沈敏學 胡 明△ 曾 娜,2 孫振球

·方法介紹·

雙重差分模型在醫學研究中的應用*

沈敏學1胡 明1△曾 娜1,2孫振球1

雙重差分模型(difference-in-differences,DD)由Ashenfelter和Card于1985年對一項干預研究進行評價時提出[1],其后該模型在計量經濟學領域得到廣泛應用[2-4]。DD模型提出的背景是:一項公共政策的實施無法保障干預組與對照組的隨機化,反應變量在基線水平上未必可比,因此如果只通過自身前后對照或兩組在橫斷面上的對比,難以得到政策實施效果的無偏估計。此外,大規模的人群調查難以對個體進行隨訪,因此二次抽樣也限制了統計學方法的選擇。DD模型適用于醫學研究,尤其是公共衛生研究[5-10]。本文在介紹DD模型基本原理和形式推廣的基礎上,將其與重復測量的方差分析和混合模型進行比較,并以實例說明幾種模型的適用條件與區別。

基本原理

DD的核心是模型構造雙重差分估計量(DD estimator)。設分組變量Gi∈{0,1} ,時間變量Ti∈{0,1} ,DD的基本模型可表示如下式:

Yi=β0+β1Gi+β2Ti+β3(Gi·Ti)+ei

其中,分組和時間均為啞變量,Gi·Ti是二者的交互項,ei為殘差。

值得注意的是,分組變量并不等同干預,因為在基線水平(即Ti=0時),兩組均未接受干預。當Gi=1且Ti=1,即啞變量Gi·Ti=1時才指代干預。不難得出,干預組和對照組在干預實施前后應變量的數學期望(均數)分別如下:

E[Y|G=1,T=0]=β0+β1

E[Y|G=1,T=1]=β0+β1+β2+β3

E[Y|G=0,T=0]=β0

E[Y|G=0,T=1]=β0+β2

一般線性模型須滿足Gauss-Markov假設,即殘差的均數為零且獨立于解釋變量,因而無殘差項。

雙重差分估計量是橫向和縱向比較的結合,即干預組前后差異與對照組前后差異之差,實際上是時間和分組交互項的偏回歸系數β3。在資料滿足線性回歸條件的基礎上,采用最小二乘法(OLS)即可得到β3的無偏估計[11]。

應用DD模型評估干預效果時,除應符合線性回歸的前提外,還應滿足3個假設:干預措施對對照組不產生影響;干預之外的因素對干預組和對照組影響相同;干預組和對照組中觀察單位的某些特征分布穩定,不隨時間變化[12]。

形式推廣

1.DDD模型

自然實驗中,對照組的選取可能影響效應估計的穩健性。此處以Gruber給出的例子來說明[13]:某地政府強制要求企業雇主為其20~40歲的已婚女性員工購買覆蓋生育費用的醫療保險,分析政策對該年齡段已婚女性的工資是否有影響。Gruber選取了3組對照:本地20~40歲未婚男性及40歲以上男性;非政策實施地20~40歲的已婚女性;非政策實施地20~40歲未婚男性及40歲以上男性。該例中,如果僅以非政策實施地的人群為對照,則可能因各地經濟發展狀況不同而對工資造成不等量的影響,對政策效應的估計是有偏的;如果僅以本地男性為對照,則可能存在其他宏觀因素(如國家層面的政策)對男女工資水平有不等量的影響。以T表示時間變量,G表示分組變量(政策實施),S表示性別變量,則回歸模型可表示為下式:

Yi=β0+β1Gi+β2Ti+β3(Gi·Ti)+β4Si+β5(Gi·Si)+β6(Ti·Si)+β7(Gi·Ti·Si)+ei

DDD估計量為干預組和對照組DD估計量之差,在滿足線性回歸條件的基礎上,由OLS估計的DDD統計量為各變量交互項的偏回歸系數β7,如下式:

-(E[Y|G=0,T=1,S=1]+E[Y|G=0,T=0,S=1])}

-{(E[Y|G=1,T=1,S=0]+E[Y|G=1,T=0,S=0]

+(E[Y|G=0,T=1,S=0]-E[Y|G=0,T=0,S=0])}=(β3+β7)-β3=β7

2.一般化模型

當分組和時間變量的水平數超過2時,基本DD或DDD模型可推廣為一般化模型。此外,在自然試驗中,干預組和對照組的非隨機化分配將導致觀察單位特質分布的不均衡,因此在一般化模型中,通常會考慮分組和時間之外的解釋變量。下式中,向量λT和αG分別為分組和時間啞變量的偏回歸系數,向量γ為觀察單位變量(如人口學特征)ZGT的偏回歸系數,向量β為交互項的偏回歸系數,即DD估計量。

Yi=λΤ·Τ+αG·G+β·XTG+γ·ΖTG+eι

考慮到個體觀測值可能存在非獨立性[14],一般化模型還可推廣為多水平模型,如下式。

Yi=λΤ·Τ+αG·G+β·XTG+γ·ΖTG+vgι+uigt

其中,vgt為群組水平隨機誤差,uigt為個體水平隨機誤差。

3.廣義線性模型

當應變量不服從正態分布時,則應對其進行數學變換,或采用廣義線性模型,如Probit模型、Logit模型等[15]。Ai和Norton指出,有學者誤將廣義線性模型中交互項的偏回歸系數等同于干預效果[16]。實際上,因連接函數的存在,DD估計量已演變為下式(Φ為Probit函數):

Yi=Φ(α·G+β·T+γ·G·T)

含義是:“接受了干預”的干預組和(G=1,T=1,G×T=1)“假定沒有接受干預”的干預組(G=1,T=1,G×T=0)在第2個時間點上數學期望的差值。

相關統計學方法的比較

將雙重差分模型(此處指線性模型)與醫學研究中常用的重復測量方差分析及混合模型進行比較,見表1。

實 例

此處列舉兩個例子,第一例為重復測量數據,第二例為混合橫斷面數據(二次抽樣),分別用雙重差分模型、重復測量資料的方差分析和混合模型進行估計和結果的比較。

例1 將20名高血壓病患者隨機分為兩組,對處理組予以某種治療,對照組不予處理,在治療前后分別測定血壓。以舒張壓為結局變量,試評價治療的效果(摘自研究生規劃教材《醫學統計學》第四版第12章[11])。

本例是簡單的重復測量設計資料,現用雙重差分模型和重復測量方差分析分別對其治療效果進行估計,結果見表2和表3。經Mauchly檢驗,該資料滿足“球對稱”假設,即重復測量誤差的協方差矩陣為球對稱結構,因此兩個模型的估計都是有效的。重復測量資料的方差分析顯示,分組和時間存在交互作用,處理組的降壓效果優于對照組,兩組血壓的前后差值分別為-16.0和-4.2,二者之差也剛好等于DD估計量-11.8,因此兩個模型的結論一致。二者的區別在于:重復測量方差分析中,時間和分組變量的統計學檢驗是對其主效應的檢驗(盡管當交互作用存在時,分析主效應意義不大);而在DD模型中,“分組”并不等同于“處理”,因為在基線上兩組都未接受治療,其偏回歸系數是基線時兩組舒張壓均數之差。

需注意的是,在實際研究中,干預組和對照組并不總是均衡可比的;重復測量值之間往往具有相關性,擬合線性模型可能虛增檢驗效能,增加I類錯誤的概率;隨機誤差可能與協變量有相關關系,使用最小二乘法將導致模型的錯誤估計。因此需要充分考察數據的特征和模型的使用前提,并適時采用加權最小二乘法、廣義最小二乘法等進行參數估計。

例2 研究者對西部地區12所小學4~6年級學生進行營養知識的健康教育,以學校為單位進行隨機化分組。干預實施前,從干預組和對照組中共抽取了378名學生進行營養知識測試;干預一年后,再次隨機抽取了478名學生進行測試[18]。現以測試總分為評價指標,試估計健康教育的效應。

該例沒有對樣本進行隨訪,進行了二次抽樣,因此無法使用重復測量資料的方差分析。現以雙重差分模型和混合模型分別對干預效應進行估計[19-20]。由表4可知,DD模型的雙重差分估計量為2.90,混合模型估計的交互項固定效應為4.04,高于DD模型的估計值。實際上,引入交互項后,混合模型是多水平的DD模型。由隨機效應可知,該數據具有層次結構,測試分數在學校水平上存在一定聚集性。盡管兩種方法估計所得的干預效果較接近,但由于學校水平殘差不為零,因此個體水平殘差的分布不再滿足OLS估計的前提,單水平DD模型可能導致錯誤的推論。

小 結

在醫學研究尤其是公共衛生研究中,未必總能通過隨機化分配或匹配來保證干預組和對照組的可比性。雙重差分模型通過構造雙重差分估計量來控制和消除其他協變量對干預效果的影響,且不要求個體水平的重復測量,簡單易行,是評價自然實驗的良好方法。實際應用時,應充分考慮模型協變量的選取,消除不匹配的因素,以保證效應的正確估計;應考察模型估計方法的前提條件和適用性,選取適當的參數、半參數或非參數估計;當資料存在層次結構時,應考慮誤差在不同水平上的分布以及變量之間的協方差和相關關系,并可將雙重差分模型與多水平模型結合應用;當應變量不滿足正態分布時,還應進行數學轉換,或采用廣義線性模型來擬合資料。

[1]Ashenfelter O,Card D.Using the longitudinal structure of earnings to estimate the effect of training programs.The Review of Economics and Statistics,1985,67(4):648-660.

[2]Meyer BD.Natural and quasi-experiments in economics.Journal of Business and Economic Statistics,1995,13(2):151-161.

[3]Bertrand M,Duflo E,Mullainathan S.How much should we trust differences-in-differences estimates.The Quarterly Journal of Economics,2004,119(1):249-275.

[4]Athey S,Imbens GW.Identification and inference in nonlinear difference-in-differences models.Econometrica,2006,74(2):431-497.

[5]Stuart EA,Huskamp HA,Duckworth K,et al.Using propensity scores in difference-in-differences models to estimate the effects of a policy change.Health Serv Outcomes Res Methodol,2014,114(4):166-182.

[6]Zhang X,Wu Q,Liu G,et al.The effect of the National Essential Medicines Policy on health expenditures and service delivery in Chinese township health centres:evidence from a longitudinal study.BMJ Open,2014,4(12):e006471.

[7]Morris S,Hunter RM,Ramsay AI,et al.Impact of centralising acute stroke services in English metropolitan areas on mortality and length of hospital stay:difference-in-differences analysis.BMJ,2014,349:g4757.

[8]Fillmore H,DuBard CA,Ritter GA,et al.Health care savings with the patient-centered medical home:Community Care of North Carolina′s experience.Popul Health Manag,2014,17(3):141-148.

[9]Nolan A.An extension in eligibility for free primary care and avoidable hospitalisations:a natural experiment.Soc Sci Med,2011,73(7):978-985.

[10]Alderman H,Ndiaye B,Linnemayr S,et al.Effectiveness of a community-based intervention to improve nutrition in young children in Senegal:a difference in difference analysis.Public Health Nutr,2009,12(5):667-673.

[11]孫振球,徐勇勇.醫學統計學.第4版.北京:人民衛生出版社,2014.

[12]葉芳,王燕.雙重差分模型介紹及其應用.中國衛生統計,2013,30(1):131-134.

[13]Gruber J.The incidence of mandated maternity benefits.Am Econ Rev,1994,84(3):622-641.

[14]Hansen LP,Sargent TJ.Recursive robust estimation and control without commitment.Journal of Economic Theory,2007,136(1):1-27.

[15]Karaca-Mandic P,Norton EC,Dowd B.Interaction terms in nonlinear models.Health Serv Res,2012,47(1 Pt 1):255-274.

[16]Ai C,Norton EC.Interaction terms in logit and probit models.Economics Letters,2003,80(1):123-129.

[17]Puhani PA.The treatment effect,the cross difference,and the interaction term in nonlinear “difference-in-differences” models.Economics Letters,2012,115(1):85-87.

[18]沈敏學,彭真,胡婧璇,等.中國西部地區小學生營養與食品安全教育的整群隨機試驗效果評價.中華流行病學雜志,2013,34(9):879-883.

[19]張巖波,何大衛,劉桂芬,等.重復測量數據的混合模型及其MIXED過程實現——混合線性模型及其SAS軟件實現(二).中國衛生統計,2001,18(5):272-275.

[20]高萌,張強,鄧紅,等.方差分析和混合線性模型在重復測量數據中的應用探討.現代預防醫學,2008,35(7):1221-1223.

(責任編輯:郭海強)

附錄:例題SAS程序

例1

/*例1:重復測量方差分析*/

data example1a;input t1 t2 group @@;

cards;/*每例患者一條記錄*/

130 114 1

……

134 128 2;

proc glm;class group;model t1 t2=group;repeated time 2

contrast(1)/summary;

run;

/*例1:DD模型*/

data example1b;input BP time group @@;

cards;/*每次測定一條記錄,同一患者可有多條記錄*/

130 1 1

114 2 1

……

134 1 2

128 2 2;

data example1b;set example1b;interact=time * group;

run;

proc reg;model BP=time group interact/std;

run;

例2

/*例2:混合模型*/

data example2;input school time group score @@;

cards;/*每次測定一條記錄*/

1 1 1 14

1 1 1 13

……

12 2 2 18

12 2 2 21;

data example2;set example2;interact=time * group;

run;

proc mixed;class school;model score=time group interact/s;random intercept/sub=school type=vc;

run;

/*例2:DD模型,數據格式同上*/

proc reg;model score=time group interact/std;

run;

國家自然科學基金(81402770)

1.中南大學公共衛生學院流行病與衛生統計學系(410078)

2.中南大學湘雅三醫院臨床營養科(410013)

△通信作者:胡明,E-mail:huming0129@126.com

猜你喜歡
測量模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
測量的樂趣
3D打印中的模型分割與打包
測量
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 午夜一区二区三区| 成年人视频一区二区| 四虎综合网| 亚洲精品无码AⅤ片青青在线观看| 国产日本欧美亚洲精品视| 国产人妖视频一区在线观看| 99热这里只有精品国产99| 91免费国产高清观看| 亚洲成人在线免费| 青青青视频免费一区二区| 精品亚洲欧美中文字幕在线看| 日韩精品无码不卡无码| 40岁成熟女人牲交片免费| 99久久精品免费观看国产| 高清无码一本到东京热| 精品亚洲欧美中文字幕在线看| 欧美精品在线观看视频| 国产精品19p| 亚洲精品天堂在线观看| 亚洲中文字幕手机在线第一页| 欧美日韩在线第一页| 青草视频免费在线观看| 日韩福利视频导航| 久久香蕉国产线看精品| 亚洲精品日产AⅤ| 国产欧美日韩视频一区二区三区| 精品国产欧美精品v| 毛片网站观看| 亚洲高清无码精品| 亚洲区欧美区| 欧美亚洲激情| 高清无码不卡视频| 2021国产乱人伦在线播放| 亚洲男人在线天堂| 自偷自拍三级全三级视频| www精品久久| 美女啪啪无遮挡| 亚洲欧洲日韩综合色天使| 高清不卡一区二区三区香蕉| 国产成人h在线观看网站站| 精品欧美日韩国产日漫一区不卡| 亚洲永久视频| 国产地址二永久伊甸园| 久久综合伊人77777| 亚洲中文无码h在线观看 | 伊伊人成亚洲综合人网7777| 国产无遮挡裸体免费视频| 99精品国产电影| 欧美不卡二区| 2021国产精品自产拍在线| 97色伦色在线综合视频| 五月天久久综合| 精品小视频在线观看| 免费在线视频a| 自拍偷拍一区| 精品国产一二三区| 国产区精品高清在线观看| 一本色道久久88| 亚洲一欧洲中文字幕在线| 久久国语对白| 亚洲色图欧美激情| a天堂视频在线| 91亚洲国产视频| 香蕉视频在线观看www| 免费国产高清视频| 亚洲天堂视频在线观看免费| 欧美激情成人网| 欧美一道本| 91口爆吞精国产对白第三集| 美女国产在线| 欧美三级视频在线播放| 国产综合日韩另类一区二区| 亚洲一区第一页| 91原创视频在线| 精品久久高清| 激情综合图区| 国产十八禁在线观看免费| 五月天丁香婷婷综合久久| 久青草国产高清在线视频| 一级毛片高清| 97av视频在线观看| 日韩a级片视频|