閆世艷,郭中寧,何麗云,劉保延
(1.中國中醫科學院中醫臨床基礎醫學研究所 北京 100700;2.中國中醫科學院西苑醫院 北京 100091)
缺失數據是醫學研究中的常見問題,當缺失數據較多時,若不進行處理往往會導致信息損失、降低檢驗效能導致結果偏倚。在統計分析中,缺失數據的處理是非常重要的內容。處理缺失數據,首先要明確數據的缺失機制。通常將缺失數據機制劃分為三類:完全隨機缺失(Missing Completely at Random,MCAR)、隨機缺失(Missing at Random,MAR)和非隨機缺失(Not Missing at Random,NMAR)[1]。不同缺失機制的處理方法不同。對于完全隨機缺失,可以忽略缺失數據,即不對缺失數據進行處理,直接應用完整觀測到的數據進行分析。目前的統計分析軟件中,默認采用的都是這種形式,但實際情況中完全隨機缺失的情況非常少見。
大多數的缺失數據處理方法是針對隨機缺失機制的,隨機缺失數據的處理方法可以分為三大類:直接推導法、填補法和重復抽樣法。一般較為常用的是填補法(Imputation),即給每個缺失數據一些替代值,這些替代值稱為填補值。根據填補值個數,又可以分為單一填補(Single Imputation,SI)和多重填補(Multiple Imputation,MI)。目前,臨床研究中常用的單一填補方法是末次訪視觀察值向前結轉(Last Observation Carried Forward,LOCF),該方法操作簡單方便,在國內應用普遍。多重填補是對每一個缺失值用多個可能的值進行多次填補,考慮了缺失值的不確定性,與單一填補相比更為合理,被很多雜志所推薦。非隨機缺失時,缺失數據的處理會比較復雜,但也有專門的缺失值處理方法。在上述三種缺失機制下,當假定數據符合隨機缺失機制進行填補后,通常需要進行敏感性分析來驗證該假定下填補結果的可靠性和穩健性。在實際情況中,研究者往往無法驗證隨機缺失的假定是否正確。美國研究委員會(National Research Council)建議在臨床試驗中,對于假定缺失數據為隨機缺失的研究,應進行敏感性分析,并且敏感性分析應該是研究報告必須報告的內容[2]。
目前,多重填補的方法在國內外已經逐步得到廣泛的應用,有不少相關的方法學研究文獻[3-7],但研究者對其敏感性分析的問題并不了解和重視,也缺乏相關方面的報道和文獻。本課題組查詢了中國知網(CNKI)、維普等主流中文文獻數據庫,并未發現有關多重填補敏感性分析的資料和文獻,相關的英文文獻也比較少。有研究者就國內針刺臨床試驗缺失數據的報告情況及其對結果的影響進行調查分析發現,3008篇RCT報告中僅有343篇(11.4%)報告了數據缺失原因。納入報告中僅有63篇(2.1%)提及了意向性分析,且只有30篇(1.0%)報告了意向性分析結果。對報告了分類結局變量的兩臂試驗數據的二次分析結果表明108篇(30.2%)研究與原始結論不一致;92篇(85.2%)可能存在假陽性結果,16篇(14.8%)可能存在假陰性結果。該研究反映了國內臨床研究者對缺失數據的重視和認識程度較低,大多數研究未采用合理的缺失數據處理方法,更沒有研究提到缺失數據的敏感性分析[8]。因此,本研究將就多重填補的敏感性分析原理和方法進行簡要介紹,并給出相應的實際應用案例,以期為相關臨床研究者提供參考和幫助。
一般情況下,多重填補時,假定數據缺失機制為隨機缺失,且數據符合多元正態分布。按照隨機缺失的假設,可得出:

其中Y表示目標變量的值,R表示缺失與否,R=1表示缺失,R=0表示非缺失。由此可見,隨機缺失機制下,缺失數據的分布與觀察到數據的分布相同,因此可以基于觀察到數據的分布產生缺失數據的填補值Y(1),Y(2),…Y(k)。
但是,隨機缺失假定在實際情況下是無法進行驗證的,本研究須對基于隨機缺失假定下的多重填補分析結果進行敏感性分析,即在違背隨機缺失假定下進行分析,以驗證隨機缺失假定下多重填補分析結果的穩健性。該敏感性分析的基本思路為構建一個非隨機缺失模型,基于該模型產生缺失數據的填補值,然后進行多重填補,得到非隨機缺失機制下目標變量的效應估計值,然后對隨機缺失機制與非隨機缺失機制下的多重填補結果進行比較,若非隨機缺失機制下的多重填補結果與隨機缺失機制下的結果一致,則認為隨機缺失的假定是合理的。反之,則認為隨機缺失的假定不合理。
多重填補敏感性分析的過程與多重填補的完全相同,主要區別在于產生缺失數據的填補值所基于的分布不同。以下為多重填補敏感性分析的基本步驟。
第一步,產生缺失數據的填補值:與隨機缺失不同,在非隨機缺失機制下,缺失數據的分布與觀測到的數據分布不同,即

因此,非隨機缺失機制下不能基于觀測到的數據分布產生缺失數據的填補值。
本研究再分析一下縱向臨床研究中的情形。假設G表示組別,G=1為試驗組,G=0為對照組;Y表示某次訪視該目標變量的值,當Y的缺失符合隨機缺失時,則有[9-10]:

和

當Y的缺失符合非隨機缺失時,則有:

和

基于上述情形,非隨機缺失情況下,可通過以下兩種方式構造非隨機缺失的填補模型:
第一種方式:不管是試驗組還是對照組的缺失值,均基于對照組中觀察到數據的分布產生填補值,即

第二種方式:在隨機缺失假定的填補模型中加一個不為0的調整參數δ,即

調整參數δ反映的是觀測到的數據與缺失數據的總體參數的差值,一般通過與臨床研究者討論并結合專業知識確定。δ值的絕對值越大,說明缺失數據的分布與觀測到數據的分布之間的差異越大。若在極端情況下,即δ已經超過臨床實際可能發生的情況時,此時多重填補得到的分析結果仍與隨機缺失情況下的一致,則認為隨機缺失假定下進行多重填補得到的分析結果是可靠的;反之,則說明隨機缺失的假定是有問題的,在此假定下推斷的分析結果不可靠。
表1 兩組治療8周期間每周的CSBMs(次/周)描述

表1 兩組治療8周期間每周的CSBMs(次/周)描述
注:*W0為基線,W1-W8分別表示第1-8周
?

表2 基線及1-8周CSBMs的缺失模式描述和分析
第二步:對缺失數據集進行m次填補,產生m個填補好的“完整數據集”,對每個填補后的“完整數據集”分別采用合適的統計方法進行分析,得到每個“完整數據集”對應的參數估計值等指標。
第三步:根據一定的規則將m組統計分析結果進行綜合,得出最終結論。例如,設目標變量的總體參數為θ和σ2,其點估計分別是?和?,對每個填補后的數據集進行分析,得到(θ1,σ12),(θ2,)……(θm,),然后采用Rubin法則進行綜合,得到綜合后的估計值[11],并將結果與多重填補的分析結果進行比較。
在多重填補的敏感性分析中上述方法較為常用,被美國醫學會雜志(Journal of the American Medical Association,JAMA),內 科 學 年 鑒(Annals of Internal Medicine)等高影響因子雜志所推薦[12-14]。在SAS統計分析軟件中有相應的方法,可通過軟件實現。
通過一個實例對上述多重填補敏感性分析方法進行驗證。為評價電針治療嚴重性便秘的療效,某醫院進行了一項大樣本多中心隨機對照臨床試驗,將符合納入排除標準的受試者隨機分配到電針組(EA)和假電針組(SA),治療8周。主要療效指標為治療8周后的周平均完全自主排便次數(CSBMs)。現截取前199例數據為例,其中177例受試者完成全部試驗,22例受試者提前中止臨床試驗(失訪12例,因不良事件退出試驗5例,患者自動退出5例)。表1為基線和第1-8周的周平均CSBMs以及各數據的缺失情況。
第一步,判定數據的缺失模式,對表1中基線到8周的CSBMs,即W0-W8周CSBMs是否缺失進行匯總分析,得到表2,可見W0-W8周CSBMs的數據缺失符合單調缺失模式,即受試者在某個時間點缺失后,其后面的數據都是缺失的。兩組間的缺失模式經Fisher確切概率檢驗,差異無統計學意義(P=0.088)。
第二步:對缺失值進行填補,并進行分析,得到多重填補后的分析結果。假定數據缺失機制為隨機缺失,考慮到療效指標周平均CSBMs是計量資料,且符合單調缺失模式,采用參數回歸法對1-8周的CSBMs缺失值進行填補。
考慮到周平均CSBMs的特點和可能的影響因素,在填補的回歸模型中納入如下變量:基線CSBMs值、每周CSBMs值、年齡、性別、應急藥物和其他便秘輔助措施使用情況。設m=5,即共產生5個填補后的“完整”數據集。對5個填補后的“完整”數據集,采用協方差進行分析(應變量為治療8周后CSBMs相對基線的變化值,設研究中心為固定效應、基線CSBM為協變量),得到5個分析效應的估計值以及其綜合后的估計值,見表3。填補號列中的原始數據表示沒有進行缺失處理時的分析結果;填補號1-5分別表示5個填補后數據集的分析結果,綜合表示5個填補后數據集綜合的分析結果。根據表3可知,沒有進行缺失值處理時,即采用“完整數據”進行分析的結果為:EA組的治療8周后CSBMs相對基線的變化值為2.58(95%CI:2.16-3.00)次,SA組為1.21(95%CI:0.79-1.63)次;EA組與SA組間的差值為1.37次(95%CI:0.77-1.96)。多重填補后EA組的治療8周后CSBMs相對基線的變化值為2.51(95%CI:2.10-2.92)次,SA組為1.40(95%CI:1.00-1.81)次;EA組與SA組間的差值為1.10次。未填補的原始數據分析結果、5個填補數據集的分析以及綜合分析的結果均表明主要療效指標的組間差異有統計學意義(P<0.05)。

表3 填補前、后以及綜合的主要療效指標估計值及組間差值
首先,構建非隨機缺失的填補模型。為體現非隨機缺失的特點,設定基于對照組(SA組)數據的分布產生缺失數據的填補值,同時在填補值產生模型中設定調整參數δ。通過與臨床研究者討論,對于周CSBMs來說,如果便秘患者一周超過8次,顯然不符合嚴重性便秘的診斷和正常的臨床常識,故本研究將調整參數δ確定為8。產生填補值過程中的其他設置均與多重填補完全相同。然后,對缺失值共進行5次填補,對填補后的5個完整數據集采用與多重填補相同的協方差分析方法進行分析,參數設置完全相同,最后得到填補后的綜合分析結果。表4表示,基于對照組(SA組)觀測到數據的分布對缺失數據進行多重填補,并在填補模型中設定調整參數δ,δ不同時周平均CSBMs的估計值的變化情況。可以看出,主要指標周平均CSBMs差值的估計值隨著調整參數δ的增大而逐漸減小。當調整參數δ為8時,分析結果是最極端的,其中兩組主要指標周平均CSBMs差值的估計值為0.42次,95%CI為(0.05,0.79)次,差別仍有統計學意義。該結果與隨機缺失假定下的分析結果(表3)是一致的,說明進行多重填補時關于隨機缺失的假定是可靠的,多重填補分析的結果(表3)是可靠的。

表4 基于SA組數據進行填補并設定調整參數δ時,不同δ情況下的主要指標估計值及其95%CI
在臨床研究中,缺失數據是不可避免的一個重要問題。對于缺失數據,首先應該進行預防,即通過嚴謹的研究設計、嚴格的質量控制以及仔細的數據清理等各項措施盡可能的減少。對于經過上述過程,仍然存在的缺失數據,再通過合適的統計學方法進行填補和處理,以避免由于數據缺失帶來的偏倚。缺失數據處理時要考慮數據缺失機制和數據缺失模式,對于完全隨機缺失的數據,可以不加處理,直接采用完整的觀測值進行分析。但在實際臨床研究中,真正的完全隨機缺失很少見,更多的是隨機缺失和非隨機缺失。在進行缺失數據處理時,通常在隨機缺失假定下進行處理。大多數的缺失數據處理方法是在該假定下。
目前,國內的臨床研究者對缺失數據的處理并未引起足夠的重視,大多數的醫學雜志發表的臨床研究論文直接忽略掉缺失數據,直接采用完整數據進行分析;或者并未給出缺失數據是否處理以及具體的處理方法。而在進行了缺失值處理的文章中,則以末次訪視向前結轉的方法為主,這也是目前國內主流的和最為常用的缺失數據處理方法。末次訪視向前結轉屬于單次填補,與多重填補相比,該方法簡單方便,但未考慮缺失值的不確定性。
近年來,多重填補的方法應用越來越多,已經得到了較為廣泛的接受,很多高影響因子雜志均要求采用多重填補的方法進行缺失值處理[16]。由于多重填補基于隨機缺失假定,而實際情況下,隨機缺失假定無法進行驗證。因此,對其進行違背隨機缺失假定下的敏感性分析是非常必要的。但目前多重填補的敏感性分析并未得到重視,不管是中文文章還是英文文章,絕大多數在多重填補后并未進行敏感性分析,關于敏感性分析方法的介紹也非常少。本研究介紹了一種較為簡便易行的多重填補敏感性分析方法,且已經應用在本文引用實例的臨床研究中,并且該文章已發表在美國內科學年鑒雜志上。本研究所介紹的多重填補以及敏感性分析方法均通過SAS統計分析軟件實現。
本研究的實例采用了基于對照組觀測到的數據產生填補值,同時設定調整參數δ的方法來構建非隨機缺失。在實際應用時,也可以僅采用其中一種方式。在設定調整參數δ時,應由統計學人員與研究者根據臨床實際情況進行商討決定。對于多重填補的次數,本研究實例進行了5次多重填補。通常來說,對于缺失信息比例在50%左右的變量,填補5次就可以獲得很高的相對效率。但是,近年來也有學者認為填補的次數應該為20-100次[17],當填補后的分析結果趨于穩定即可。另外,為保證填補值的可靠性,在進行構建填補模型時應盡可能地納入以下三類變量:①分析中的關鍵變量;②對關鍵變量有預測性的協變量;③對缺失數據可能有預測性的協變量。因此,在設計階段也應充分考慮哪些因素可能會與重要指標的缺失有關,并在研究過程中盡可能采集全面[17]。最后,在報告缺失數據處理結果時應注意盡可能包括如下內容:①數據缺失模式和機制。②缺失數據處理方法。詳細報告多重填補的目標變量是哪些,產生填補值的具體方法,具體哪些變量被納入在填補模型中;填補數據集的個數等;③填補后的統計分析方法及結果;④敏感性分析的方法、參數設置以及結果。另外,還要強調的一點是多重填補通常針對原始變量進行填補,而不是針對衍生變量。如本實例中,本研究對W0-W8每周的CSBMs進行填補,然后再根據公式(第1周至第8周的周CSBMs總和/8)計算治療后8周的周平均CSBMs,而不是直接對治療后8周的周平均CSBMs進行填補。因為治療后8周的周平均CSBMs是基于W0-W8每周的CSBMs衍生計算出來的。