999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

缺失數據統計處理方法的研究進展*

2013-07-27 09:30:40李曉松周曉華劉玉萍
中國衛生統計 2013年1期
關鍵詞:方法模型

帥 平 李曉松 周曉華 劉玉萍

臨床試驗和流行病學調查中經常出現缺失數據〔1-2〕。一直以來,統計學家們研究的分析方法主要針對完整數據,含缺失值的數據無疑給生物醫學者在實際應用分析時帶來不少困難〔3-4〕。Croy〔5〕等的研究發現,在隨機抽取的25篇關于質量分析的文獻中,僅有3(12%)篇文章對缺失值進行了處理,采用的方法僅是均值替代、多重回歸或根據經驗取值替代。Wood〔6〕等對 2001 年發表在 BMJ、JAMA、Lancet和New England Journal of Medicine期刊上的隨機對照試驗分析后發現,缺失數據在這些試驗中普遍存在,但未得到很好的處理和分析。缺失數據的出現給數據分析和研究推論帶來困難,尤其當完全觀測數據和不完全觀測數據存在系統差異時,常規處理方法得到的結果通常不能代表整體。處理不當時可能導致方差增大,檢驗效能降低,無法得到科學合理的解釋和結論。如何有效處理缺失數據,怎樣才能充分利用數據信息,準確地反映研究群體的特征,達到預期研究目的,已成為當前統計研究中的難點和熱點問題。本文將就當前國內外缺失數據的處理方法進行一綜述。

常見的處理缺失數據的方法

20世紀70年代后期,國外學者對缺失數據問題的研究開始重視并日漸增多。Dempster,Laird&Rubin〔7〕首先提出了一種有效處理缺失數據的算法-EM算法,該算法為處理缺失數據帶來了新的革命;正是基于這一算法,Rubin〔1〕在80年代末提出了多重填補的方法;Schafer&Olsen〔8〕在1998年提出了對多變量缺失值的多重填補法;Robins、Rotnitzky & Zhao〔9〕在1994年提出了以估計缺失概率為基礎的加權法;Qin〔10〕和 Tang〔11〕等學者在 2002 年和 2003 年分別提出了兩種不同的運用似然函數的半參數方法來處理不可忽略缺失數據機制的問題。我們將這些學者提出的方法大概歸為三類,分別是:基于填補的方法,基于參數似然的方法和基于加權調整的方法。

1.基于填補的方法

填補是處理缺失數據常用的一類技術方法,其優點是:研究者可以對經過填補后的數據集采用完全數據的分析方法,而不需要采用單獨的復雜的算法;在一些情況下,填補可以減少由于無應答等造成的估計偏差,尤其是在擁有比較高質量的輔助信息時。但是,填補法也有缺點,填補過程可能很困難且不容易實現,特別是在多維復雜結構下;另外,一些簡單的填補可能歪曲數據的分布和變量間的真實關系。根據對每個缺失值的填補個數來分類,可分為單一填補和多重填補。

(1)幾種單一的填補方法

①均值填補(mean imputation)

均值填補是用樣本中有觀測值的均值代替缺失值,可分為非條件均值填補和條件均值填補。非條件均值填補是指對所有的缺失值,用所有觀測值的均值進行填補,因此所有填補值都是相同的。條件均值填補是利用輔助信息,對總體進行分層,使各層中的各單元盡可能相似,然后在每層中用該層有響應單位的均值填補該層中的缺失值。分層均值填補比非條件均值填補的填補效果好。但是均值填補通常改變了變量的變異程度,低估填補變量的方差。因此一般情況下均值填補比較適合簡單的描述性研究,不適應于較復雜的需要方差估計的分析〔12-13〕。

②演繹填補(deducive imputation)

演繹填補法是通過可以搜集到的復雜資料,依據邏輯和常規,對缺失數據進行推斷,找出填補值。用公式表示就是Zi=f(Xi),其中zi為第i個缺失數據的填補值,Xi是輔助變量,f(*)是根據缺失數據的目標變量y與輔助變量X之間的邏輯運算關系構造的函數。該方法操作簡單,在有高質量的輔助信息下,可以提供準確或近乎準確的填補值,但其效率很大程度上依賴于輔助資料是否充分。

③回歸填補(regression imputation)

回歸填補是由單元的缺失項對觀測項的回歸,用預測值代替缺失值。通常由觀測變量及缺失變量都有觀測的單元進行回歸計算。填補中還可以給填補值增加一個隨機成分,這種方法稱為隨機回歸填補。它是用回歸填補值加上一個隨機項,預測出一個缺失值的替代值,該隨機項反映所預測的值的不確定性影響。隨機回歸填補法能夠較好的利用數據提供的信息,解決因預測變量高度相關引起的共線性問題〔14〕。

④最近距離填補(nearest neighbor imputation)

最近距離填補法是利用輔助變量,定義一個測量單元間距離的函數,在缺失值臨近的回答單元中,選擇滿足所設定距離條件的輔助變量中的單元所對應的變量的回答單元作為填補值,即在填補類中按匹配變量找到與受者記錄最接近的供者記錄。用于定義賦值單位的距離函數可以有很多類型,馬氏距離就是其中一種。由于距離函數有不同類型,用最近距離函數得到的填補值具有偽隨機性,這給考察最近距離填補估計量的性質帶來了挑戰。

⑤熱卡填補(hot deck imputation)

熱卡填補中常見的有隨機熱卡填補法和序貫熱卡填補法。隨機熱卡填補是通過對變量Y的回答單元進行有放回的簡單隨機抽樣獲得填補值。這里的填補值是隨機的,避免了均值填補中方差低估的缺點。序貫熱卡填補法首先對數據分層,然后在每層中按照某種順序對單元排序,對于有數據缺失的單元,用同一層中最后一個被計算機讀取的數據進行填補。該方法存在的問題是填補值的選擇是由輔助變量決定的,用不同的變量進行排序,得到的序列不同,對某一缺失值來說可能采用的填補值也就不同。因此,應該選擇與研究變量性質高度相關的排序變量,使得排列位置相鄰的單位在研究性質上也相近〔15-16〕。

⑥冷卡填補(cold deck imputation)

冷卡填補法是相對于熱卡填補而言的,指填補值不是從當前的調查,而是從以往的調查或者其他歷史數據中獲得的。

上述單一的填補方法通常可能會扭曲目標變量的分布,使填補變量的方差被低估,還可能歪曲變量與變量間的關系,無法得到真實的效應結果〔4,15〕。另外一個問題是基于填補的數據推斷參數,無法解釋填補的不確定性。

(2)多重填補(multiple imputation,MI)

多重填補由Rubin在1978年提出〔1〕,它通過某種方法對每個缺失值都構造d個替代值(d≥2),以形成D個完整的數據集,對每個數據集均采用相同的針對完整數據集的統計方法分析,將得到的結果綜合,產生最終的統計推斷。與單一的填補方法相比,MI能反映由缺失數據帶來的不確定性,增加了估計的效率。

多重填補中最關鍵的問題是如何進行有效的填補,從理論上講缺失值可以從聯合后驗預測分布中進行抽取。但在實際中尤其是復雜問題中要做到這點并不容易,特別是在多變量數據及涉及非線性關系等情況下。近十年里,逐漸形成了兩種最常見的對多元數據進行填補的策略,分別是聯合模型法和全條件定義法。

①聯合模型法(joint modeling,JM)

JM在給定數據Y和模型參數θ下假定參數的多元密度分布為P(Y|θ),在給定一個θ的適當的先驗分布和上述假定下,利用貝葉斯理論從聯合后驗預測分布P(Ymis|Yobs)中抽取產生填補值,通常是在可忽略的缺失機制(missing at Random,MAR)下。該方法能產生對參數的有效推斷,被認為是適當的填補。JM通常需要特殊的方法來實現,數據擴張(data augmentation,DA)即是基于此策略的填補方法。

DA 最早由 Tanner& Wong〔17〕提出,分為借補步(Imputation,I步)和后驗步(Posterior,P 步)。若在第t次迭代時θ的一個抽取值為θ(t),那么

I步:抽取Y(t+1)mis,使其具有密度p(Ymis|Yobs,θ(t))

P 步:抽取 θ(t+1),使其具有密度 p(θ|Yt+1mis,Yobs)

I步中的缺失值是從給定已觀測數據和當前的參數值后的條件分布進行抽取。P步中參數的抽取可以看作是從完整數據后驗分布的一個抽取。因此,進行數據擴張將產生Ymis的后驗預測分布的一個抽取值和θ的后驗分布的一個抽取值。這一迭代過程可以產生給定Yobs下Ymis和θ的聯合后驗分布中的一個抽取。當t→∞時,迭代過程收斂到一個給定Yobs下(Ymis,θ)的聯合分布的抽取。

②全條件定義法(fully conditional specification,FCS)

JM的理論是可靠的,但缺乏對模型設定的靈活性,尤其在數據特征比較特殊時,可能還會導致結論的偏倚。有學者通過模擬研究分析發現JM在一些情況下表現不佳,認為“分別進行回歸可能比聯合模型更有意義”〔18-19〕。

FCS由Van Buuren等提出〔20〕,它在填補時不考慮被填補變量和已觀測變量的聯合分布,而是利用單個變量的條件分布建立一系列回歸模型逐一進行填補。假設X為無缺失變量集,Y=(Y1,Y2,…,Yj)為 j個帶缺失值的變量,FCS迭代地從下面形式的條件分布中進行抽取:

每一次迭代包括對所有YJ進行抽取的一個循環。具體在第t次迭代中,有:上式在抽取θj時并沒有用到yj的信息,這與DA不同。FCS通常迭代次數比較少,一般為5~10次。n次迭代全部結束后,取第n次的填補值作為最終結果,形成一個完整數據集。要得到D個數據集,需要將上面的n次迭代獨立進行D次。

FCS又稱為迭代的單變量填補(iterated univariate imputation),序列回歸(sequential regressions),鏈式方程(chained equations)等。其優勢在于將一個K維問題分解成K個一維問題,可以創建更加靈活的除常見多元模型外的其他模型形式,解決在多元密度下難以進行填補的問題,在建立不可忽略缺失機制的模型時也相對較容易〔21-22〕。FCS在很多實際應用中表現良好,模擬研究也證明能得到無偏的估計和較好的收斂性〔21-25〕。

多重填補處理缺失數據的優勢被日益重視并得到廣泛應用,許多軟件開發了相應程序。SAS中的PROC MI 和 PROC MIANALYZE〔26〕、S-Plus6.0、SOLAS〔25〕,NORM〔27〕,以及 LISREL〔25〕等均可以進行多重填補運算。R軟件中含有多個可以處理缺失數據的軟件包(package),如 norm〔28〕、cat〔29〕、mix〔30〕、pan〔31〕、mi〔32〕等。此外 R 中的 mice〔33〕則利用 FCS 的思想,即鏈式方程的方法進行多重填補。

2.基于參數似然的方法-極大似然估計法(maximum likelihood estimation,MLE)

極大似然估計法是在總體分布類型已知情況下的一種參數估計方法〔4〕。在模型假定正確的情況下,若缺失機制為隨機缺失,通過已觀測數據的邊際分布可以對未知參數進行極大似然估計,得到未知參數的準確估計值。

假設變量Y=(Yobs,Ymis),M為缺失數據的指示變量,M=1表示y缺失;M=0表示 y觀測到。Yobs和Ymis聯合分布的概率密度為 f(Y|θ)=f(Yobs,Ymis|θ)。Y和M的聯合分布可描述為Y的分布密度和給定Y和θ下M的條件分布密度的乘積,即f(Y,M|θ,φ)=f(Y|θ)f(M|Y,φ),其中 φ 為 M 的參數。

實際觀測數據的分布為 f(Yobs,M|θ,φ)= ∫f(Yobs,Ymis|θ)f(M|Yobs,Ymis,φ)dYmis。θ和 φ 的整個似然為Lfull(θ,φ|Yobs,M)∝f(Yobs,M|θ,φ)。在 MAR 下,基于數據 Yobs的θ的似然為 Lmar(θ|Yobs)∝f(Yobs|θ)。θ的推斷通常應該基于整個似然Lfull(θ,φ|Yobs,M)。但在MAR時,缺失數據的分布不依賴于缺失值Ymis,有f(M|Yobs,Ymis,φ)=f(M|Yobs,φ)對一切 Ymis。那么可以得到:

這樣在MAR時,由于產生的似然成正比,根據Lfull(θ,φ|Yobs,M)對 θ基于似然的推斷與根據 Lmar(θ|obs)對θ基于似然的推斷是一樣的。

當缺失為單調模式或似然函數較簡單時,可通過直接公式推導或因子化似然函數的方法求得極大似然值〔34〕。然而,在一些復雜情況下,尤其是當數據為任意缺失模式,似然函數沒有明顯形式的解,極大化?(θ|Yobs)變得非常困難甚至不可能,需要EM算法求解極大似然值。

EM 算法由 Dempster等在1977年提出〔35〕。EM的基本思想是將? =(θ|Y)中出現的缺失數據視為(θ,Yobs)的函數,用條件期望替換缺失數據,然后估計參數,假定新的參數是正確的,再估計缺失值,再估計參數,如此迭代直至收斂。具體由E步(expectation)和M步(maximization)組成。

E步:在給定已觀察的數據和當前參數下,求缺失數據的條件期望,然后用這些條件期望替換缺失數據。令θ(t-1)為第(t-1)次迭代時θ的估計,第t次迭代有:

M步:在當缺失數據被替換后像沒有缺失數據一樣進行極大似然估計。在M步對θ極大化Q(θ|θ(t-1)),找到一個 θ(t)滿足:

上述兩步反復進行至達到某個停止準則,如兩次迭代參數的變化很小時即到達收斂。

在許多應用中,M步沒有一個簡單的計算形式,統計學家們又提出了ECM算法、ECME算法、PX-EM算法等,以提高計算和收斂速度。Ibrahim〔36〕提出的一種采用加權方法的EM算法,可以用于很多參數回歸模型,包括廣義線性模型,非線性模型,隨機效應模型,參數和非參數生存模型等。

直接求似然,因子化似然法和EM算法都是計算極大似然估計的方法。從理論上來說,基于似然的方法比直接刪除法或單一填補等方法更有吸引力。但是,基于似然的方法仍然有一定的應用條件〔3,4,37〕。首先,需要有足夠大的樣本保證得到似然估計值是無偏的。另外,似然函數是基于完整數據某個假定的參數模型,即P(Ybos,Ymis|θ)。在實際應用中,如果模型假定錯誤,基于似然法的估計可能穩定也可能不穩定。目前有少數軟件可以提供EM算法求解極大似然值,如 NORM〔28〕,S-Plus〔38〕,R 中的 norm,mix 等。

3.基于加權調整的方法

加權調整是當出現缺失單元時,用某種方式把缺失單元的權數分解到非缺失單元(即觀測數據)身上,通過增大樣本中有觀測數據的權數,以減小由于缺失數據可能對估計量帶來的偏差。金勇進〔39〕介紹了幾種簡單的加權調整法,如Politz-Simmons調整法,加權組調整法,事后分層調整法等,但這些方法存在一定局限,有時不但不能有效減小估計量的偏差,還可能增大估計量的方差。Robins,Rotnitzky等人提出一種與極大似然有相似性質的加權估計方程(weighted estimating equations,WEE)處理MAR情況下缺失數據的方法〔40-41〕。該方法是廣義估計方程(generalized estimation equations,GEE)的擴展,在理論上被認為估計效率更高,穩健性更好,尤其是在模型假定錯誤的情況下。

在回歸模型中假設yi為結局變量,xi為協變量,均值模型可寫為 ui=ui(xi,β)=E(yi|xi,β)。當不存在缺失值時,估計方程為令該方程等于0,可得到極大似然估計,該估計是β的無偏估計。

令ri為缺失的指示變量,ri=1表示xi全部觀測到,ri=0表示xi有部分值缺失。假定在給定(yi,xi)下,ri=1 的概率為 πi,有 πi= πi(φ)=Pr(ri=1|mi;φ),mi是(yi,xi)的某種函數,φ 是 ri的參數。當缺失機制為 MAR 時,πi僅依賴于 xobs,i,即

當存在缺失值時,若僅用觀測到的數據估計βCC,估計是有偏的。假設πi能夠有效估計到,將ri替換為ri/πi,權重變為 ri/πi,加權估計方程為:

在MAR假設下,因加權的作用,公式4可以得到β的無偏估計。

公式4中僅用到了ri=1的觀測值,估計效率較低。為了提高估計效率,Robins〔42-43〕等建議加入未觀測值的信息。如果 πi被正確估計立。那么這個更有效的無偏估計方程為:

與公式4相比,該方法增加了信息,提高了對β的估計效率。根據公式5,在協變量缺失情況下,該最優函數還需要對協變量的分布 p(xmis,i|xobs,i,α)的設定,因此需要另一組類似公式5的估計方程來估計α。令γ=(β,α,φ),加權估計方程為:

其中 u1i(β)=u1i(β;yi,xobs,i,xmis,i),u2i(α)=u2i(α;xobs,ixmis,i),φ是ri的參數。令S(γWEE)=0,則可得到r的無偏估計量。

Robins等認為上述加權估計方程具有雙重穩健性(Double Robustness)。公式6中含有三個模型:目標參數模型,缺失機制的模型和在給定已觀測值下,缺失變量的條件分布模型。當缺失機制的模型假定錯誤,但給定觀測值下缺失變量的條件均值模型是正確時,用公式6仍然可得到β的有效估計;當給定觀測值下缺失變量的條件均值模型假定錯誤時,但缺失機制的模型是正確時,也能得到β的有效估計。也就是說當 πi或 P(xmis,i|xobs,i)其中任一個被正確假定時,無論另一個是否正確,對β的估計均是漸進無偏的。

Parzen等討論了當實際是logistic模型的缺失協變量被錯誤地假設為多元正態模型時,用WEE方法仍然能得到良好穩健的估計。此外,WEE方法還被用到處理不可忽略缺失數據〔44〕,含缺失應變量的重復測量數據〔45〕。Beunckens〔46〕等提出用多重填補與 WEE結合的方法處理含缺失值的縱向數據。由于WEE方法計算和程序編寫非常復雜,目前還沒有任何可以直接應用的軟件。

不可忽略的缺失數據的處理

上述處理缺失數據的方法和研究大多是基于MAR的假定,但實際應用中,不可忽略的缺失(missing not at random,MNAR)也經常存在。例如在臨床試驗中,當試驗對象脫落的原因與缺失的結局測量指標密切相關時,脫落者與非脫落者之間可能非常不同。在MNAR情況下,處理比較復雜,需要對模型有非常強的假定。目前主要處理MNAR數據常見的模型有選擇模型(selection model)〔14,47〕,組型混合模型(pattern-mixture model)〔47-48〕,共享參數模型(shared parameters model)〔47〕等。但有學者指出這些方法有的假定太強,有的模型很不穩定,假定分布的微小變動就會引起結論的很大改變〔49〕。有學者提出可以通過在研究設計階段的方法改善和技巧,將MNAR情況轉變為MAR〔4〕。還有學者建議在處理MNAR數據時,由于結果依賴于不同的模型假定,不同假定下結果可能千差萬別,還需進行敏感性分析〔13〕。

總 結

由于缺失數據的普遍存在以及絕大多數統計分析方法主要針對完整數據,缺失數據的處理給研究者和應用者都帶來了巨大的挑戰,同時也帶動了這一領域研究的發展。鑒于將缺失數據直接刪除和單一填補方法的局限與不足,目前比較流行的有三類處理方法,分別是極大似然法,多重填補和加權估計方程。ML在模型假定正確時可以提供比MI、WEE方法更高效率的估計,但要求在大樣本情況才能獲得有效地估計;MI考慮了缺失數據的不確定性,可以提供完整的數據集,方便研究者采用不同的統計模型和方法對數據進行分析,但是計算處理比較耗時,并且大多數要求數據為MAR的缺失機制;WEE的優勢在于其穩健性,但是估計效率相對于ML和MI較低,而且計算和程序編寫非常復雜,尚未有任何針對這一方法的軟件出現。三類方法各自的優缺點提示研究者需要根據數據的特征和實際的情況來選擇合適的方法。由于對MI的熱衷和廣泛應用,目前有很多MI的商業和免費軟件可以使用。針對EM算法求解極大似然估計的軟件不太多,而針對WEE方法的軟件則幾乎沒有。后兩種方法在應用軟件上的開發和研究是今后發展的方向。

1.Rubin D.Multiple imputations for nonresponse in surveys.1987,New York:John Wiley & Sons,Inc

2.Abraham W,Russell D.Missing data:a review of current methods and applications in epidemiological research.Current Opinion in Psychiatry,2004,17(4):315.

3.Graham J.Missing data analysis:making it work in the real world.Annu Rev Psychol,2009,60:549-576.

4.Schafer J,Graham J.Missing data:our view of the state of the art.Psychol Methods,2002,7(2):147-177.

5.Croy C,Novins D.Imputing missing data.J Am Acad Child Adolesc Psychiatry,2004,43(4):380.

6.Wood A,White I,Thompson S.Are missing outcome data adequately handled?A review of published randomized controlled trials in major medical journals.Clin Trials,2004,1(4):368-376.

7.Dempster A,Laird N,Rubin D.Maximum likelihood from incomplete data via the EM algorithm.Journal of the Royal Statistical Society,1977,39(1):1-38.

8.Schafer J,Olsen M.Multiple imputation for multivariate missing-data problems:a data analyst's perspective.Multivariate Behavioral Research,1998,33(4):545-571.

9.Robins J,Rotnitzky A,Zhao L.Estimation of regression coefficients when some regressors are not always observed.Journal of the American Statistical Association,1994,89(89):864-866.

10.Qin J,Leung D,Shao J.Estimation with survey data under nonignorable nonresponse or informative sampling.Journal of the American Statistical Association,2002,97(457):193-200.

11.Tang G,Little R,Raghunathan T.Analysis of multivariate missing data with nonignorable nonresponse.Biometrika,2003,94(4):747-764.

12.Allison P.Missing data.2001,Thousand Oaks,Calif.:Sage Publications.

13.Molenberghs G,Kernward M.Missing data in clinical studies,2007,:Wiley.

14.Bello A.Imputation techniques in regression analysis:Looking closely at their implementation.Computational statistics & data analysis,1995,20(1):45-570.

15.金勇進.缺失數據的插補調整.數理統計與管理,2001,20(6):47-53.

16.金勇進.調查中的數據缺失及處理(I)—缺失數據及其影響.數理統計與管理,2001,20(1):59-62.

17.Tanner M,Wong W.The Calculation of posterior distributions by data augmentation.Journal of the American Statistical Association,1987,82(398):528-540.

18.Schenker N,Taylor J.Partially parametric techniques for multiple imputations.Computational Statistics and Data Analysis,1996,22(4):425-448.

19.Belin T,Hu M,Young A,et al.Performance of a general location model with an ignorable missing-data assumption in a multivariate mental health services study.Statistics in Medicine,1999,18(22):3123-3135.

20.Buuren V,Boshuizen H,Knook D.Multiple imputation of missing blood pressure covariates in survival analysis.Statistics in Medicine,1999,18(6):681-694.

21.Buuren V,Brand J.Fully conditional specification in multivariate imputation.Journal of Statistical Computation and Simulation,2006,76(12):1049-1064.

22.Buuren V.Multiple imputation of discrete and continuous data by fully conditional specification.Statistical Methods in Medical Research,2007,16(3):219-242.

23.Brand J,Buuren S,Gelsema E,et al.A toolkit in SAS for the evaluation of multiple imputation methods.2003,57(1):36-45.

24.Raghunathan T,Lepkowski J,Hoewyk J,et al.A multivariate technique for multiply imputing missing values using a sequence of regression models.Survey Methodology,2001,27:85-96.

25.Horton N,Lipsitz S.Multiple imputation in practice:comparison of software packages for regression models with missing variables.American Statistician,2001,55:244-254.

26.Multiple Imputation for Missing Data.http://support.sas.com/rnd/app/da/new/dami.html.

27.Schafer J.Analysis of incomplete multivariate data.Monographs on statistics and applied probability.London;New York:Chapman&Hall,1997.

28.norm:Analysis of multivariate normal datasets with missing values.http://cran.r-project.org/web/packages/norm/index.html.

29.cat:Analysis of categorical-variable datasets with missing values.http://cran.r-project.org/web/packages/cat/index.html.

30.mix:Estimation multiple Imputation for Mixed Categorical and Continuous Data.http://cran.r-project.org/web/packages/mix/index.html.

31.pan:Multiple imputation for multivariate panel or clustered data.http://cran.r-project.org/web/packages/pan/index.html.

32.mi:Missing Data Imputation and Model Checking.http://cran.r-project.org/web/packages/mi/index.html.

33.mice:Multivariate Imputation by Chained Equations.http://cran.r-project.org/web/packages/mice/index.html.

34.Little R,Rubin D.Statistical analysis with missing data.1987,New York:Wiley.

35.Verbeke G,Molenberghs G.Linear mixed models for longitudinal data.2000,New York:Springer.

36.Ibrahim J.Incomplete Data in Generalized Linear Models.Journal of the American Statistical Association,1990,85(411):765-769.

37.Ibrahim J,Chen M,Lipsitz S,et al.Missing-data methods for generalized linear models:a comparative review.Journal of the American Statistical Association,2005,100(469):332-346.

38.Insightful,S-PLUS(Version 6)〔Computer software〕,2001:Seattle,WA.

39.金勇進,缺失數據的加權調整.數理統計與管理,2001,20(5):61-64.

40.Lipsitz S,Ibrahim J,Zhao L.A weighted estimating equation for missing covariate data with properties similar to maximum likelihood.Journal of the American Statistical Association,1999,94(448):1147-1160.

41.Zhao L,Lipsitz S,Lew D.Regression analysis with missing covariate data using estimating equations.Biometrics,1996,52(4):1165-1182.

42.Robins J,Rotnitzky A,Zhao L.Estimation of regression coefficients when some regressors are not always observed.Journal of the American Statistical Association,1994,89(427):846-866.

43.Robins J,Rotnitzky A,Zhao L.Analysis of semiparametric regression models for repeated outcomes in the presence of missing data.Journal of the American Statistical Association,1995,90(429):106-121.

44.Troxel A,Lipsitz S,Brennan T.Weighted estimating equations with nonignorably missing response data.Biometrics,1997,53(3):857-869.

45.Preisser J,Lohman K,Rathouz P.Performance of weighted estimating equations for longitudinal binary data with drop-outs missing at random.Statistics in medicine,2002,21(20):3035-3054.

46.Beunckens C,Sotto C,Molenberghs G.A simulation study comparing weighted estimating equations with multiple imputation based estimating equations for longitudinal binary data.Computational Statistics and Data Analysis,2008,52(3):1533-1548.

47.Daniels M,Hogan J.Missing data in longitudinal studies strategies for Bayesian modeling and sensitivity analysis.2008,Boca Raton:Chapman & Hall/CRC.

48.Little R,Wang Y.Pattern-mixture models for multivariate incomplete data with covariates.Biometrics,1996,52(1):98-111.

49.Kenward M.Selection models for repeated measurements with non-random dropout:an illustration of sensitivity.Statistics in medicine,1998,17(23):2723-2732.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美区在线播放| 欧美一道本| 国产又爽又黄无遮挡免费观看 | 亚洲天堂在线免费| 成人亚洲国产| 不卡午夜视频| 亚州AV秘 一区二区三区| 国产区在线看| 69av免费视频| 91福利片| a欧美在线| 国产资源免费观看| 女人18毛片久久| 亚洲 欧美 偷自乱 图片| 国产在线精品人成导航| 国产一线在线| 18禁不卡免费网站| 国禁国产you女视频网站| 色婷婷成人网| 亚洲欧美不卡| 114级毛片免费观看| 国产18在线| 国产主播福利在线观看| 自拍偷拍一区| 亚洲人在线| 日韩精品免费一线在线观看| 亚洲娇小与黑人巨大交| 亚洲一级色| 国产一级毛片在线| 波多野结衣久久精品| 成人av专区精品无码国产| 青青热久麻豆精品视频在线观看| 国产va在线观看免费| 久久人妻xunleige无码| 免费观看国产小粉嫩喷水| 热久久国产| 亚洲色图综合在线| 国产免费一级精品视频| 宅男噜噜噜66国产在线观看| 在线观看国产网址你懂的| 亚洲大尺码专区影院| 99re这里只有国产中文精品国产精品| 国产靠逼视频| 日韩欧美国产精品| 欧美日韩国产在线人成app| 免费99精品国产自在现线| 亚洲中久无码永久在线观看软件| 最新国语自产精品视频在| 精品福利网| 欧美午夜视频在线| 国产美女无遮挡免费视频| 国产欧美日韩一区二区视频在线| 青草视频久久| 国产夜色视频| 澳门av无码| 国产亚洲精久久久久久无码AV| 国产美女免费网站| 欧美精品在线免费| 亚洲成aⅴ人片在线影院八| 成人福利在线看| 亚洲无码视频喷水| 另类重口100页在线播放| 欧美一级高清视频在线播放| 久久激情影院| 亚洲色图欧美激情| 国产成人一区在线播放| 在线国产三级| 亚洲第一中文字幕| 国产黄在线免费观看| 国产黄色爱视频| 午夜视频www| a在线观看免费| 久久青青草原亚洲av无码| 亚洲综合中文字幕国产精品欧美 | 尤物特级无码毛片免费| 午夜少妇精品视频小电影| 香蕉久久国产精品免| 午夜影院a级片| 激情无码视频在线看| 国产精品熟女亚洲AV麻豆| 91色老久久精品偷偷蜜臀| 91成人精品视频|