南昌大學公共衛生學院衛生統計教研室(330006) 俞慧強 鄭輝烈 李 悅 劉 勇
Meta分析是一種定量綜合文獻資料的統計學分析方法,其以同一研究的多項獨立研究的結果為研究對象,在嚴格設計的基礎上,運用適當的統計學方法對多個研究結果進行系統、客觀、定量的綜合分析。隨著循證醫學在醫學領域的迅速興起,Meta分析研究的結論在有關疾病或醫學健康問題的預防、治療和病因研究方面越來越受到重視。由于Meta分析的研究對象是已發表的文獻,即使采用最完備的文獻檢索策略,其研究結論也易受到發表偏倚的影響。所以,對于Meta分析研究,識別其納入文獻是否存在發表偏倚是一項重要的基礎工作。目前,診斷發表偏倚的常用方法有〔1-6〕:漏斗圖法、Egger回歸法、Begg 秩相關法、Macaskill回歸法、Richy法等方法,這些方法均是利用研究的效應尺度與其誤差信息之間的關系所提供的信息,對Meta分析是否存在發表偏倚做出判斷。本研究擬利用文獻的發表時間順序和效應尺度間的關系構建一種新的Meta分析發表偏倚診斷方法,并與傳統的Egger回歸法和Begg秩相關法的診斷效果進行比較。
在Meta分析中,其分析對象為同一研究的多個相互獨立的研究結果,每一個獨立研究稱為子研究。子研究的結果效應(Y)圍繞其總體效應(μY)隨機波動,且這種波動與子研究(文獻)的發表時間順序(T)無關。利用這一規律,如以Meta分析研究子研究的發表時間順序(T)為橫坐標,以研究效應(Y)為縱坐標繪制散點圖,則散點隨著發表時間順序以直線Y=μY(μY=總體效應)為中心上下隨機波動,兩者相互獨立,子研究效應量隨著發表時間順序的變化呈隨機分布,沒有趨勢性(圖1)。
基于此,我們構建一種新的診斷發表偏倚的方法,稱為發表時間順序與效應尺度回歸模型法,以下簡稱新方法。具體為:以文獻發表時間順序(T)為自變量,以子研究效應(Y)為應變量建立線性回歸模型E(Y)=A+βT,若無發表偏倚,則總體回歸系數β=0,反之若存在發表偏倚,則總體回歸系數β≠0。故新方法實際是通過對總體回歸系數β是否為零的檢驗,做出某Meta分析是否存在發表偏倚的診斷。

圖1 不存在發表偏倚時效應尺度隨著發表時間順序的分布圖
新方法診斷準確度的評價,需要大量的存在和不存在發表偏倚的Meta分析數據。本研究擬通過模擬得到研究數據。
(1)模擬數據的要求
本研究Meta分析效應量選用病例對照設計的Ln(OR)。故每個模擬的子研究數據應包含如下信息:病例組、對照組的樣本例數,本研究假定兩組例數相等均用n表示;病例組的暴露例數a;對照組的暴露例數c;發表的時間順序t。
(2)模擬數據的產生
第一步:產生包含子研究的樣本例數n和發表時間順序t的模擬數據
一般來說,隨著時間的推移,同一科學問題的研究一般會出現樣本含量逐漸增加的趨勢,故本研究分13個時段產生子研究樣本例數。假定每個時段樣本例數均服從正態分布 n~N(μK,σ2)(k=1,2,…,13),每個時段分別模擬產生 1500、1700、1900、2100、2300、2500、2300、1700、1500、1300、1100、1100、1100 個子研究,故13個時段共產生22100個子研究。并記錄每個子研究模擬產生的先后次序為該子研究的發表順序t。如此即得到了22100個子研究,每個子研究包含ni和ti(i=1,2,…,22100)信息的模擬數據。上述模擬數據的產生利用Matlab軟件的normrnd函數完成。
第二步:產生包含病例組暴露例數a與對照組暴露例數c的模擬數據
假定病例組和對照組的總體暴露率分別為πa和πc,利用第一步產生的 ni,則有 ai~ B(ni,πa)(i=1,2,…,22100),ci~ B(ni,πc)(i=1,2,…,22100)。以此參數設置分別調用Matlab軟件的Binornd函數,即得ai和ci,同時記錄其產生的次序為ti。重復上述過程22100次,即得22100個包含ai,ci,ti的子研究模擬數據。
第三步:無發表偏倚模擬數據抽樣框的產生
將第一步和第二步產生的模擬數據集按ti匹配合并得 22100 個含 ni,ai,ci,ti信息的子研究數據集,此即研究所用無發表偏倚數據抽樣框。
第四步:有發表偏倚模擬數據抽樣框的產生
對無發表偏倚數據抽樣框中的22100個子研究均進行H0:OR=1(α=0.05)的假設檢驗,依其是否拒絕H0可將22100個子研究分成兩部分。一部分為拒絕H0的子研究,即所謂陽性結果數據集,另一部分為不拒絕H0的子研究,即所謂的陰性結果數據集。由于發表偏倚產生的最主要原因就是陽性結果較陰性結果有更高的發表比例。故通過設置陽性數據集和陰性數據集不同的發表比例即可得到有發表偏倚數據集。本過程利用Matlab軟件的unifrnd函數完成。由于研究是分13個時段產生模擬數據,故陽性數據集和陰性數據集也是分13個時段設置發表比例,具體發表比例設置為:
陽性數據集:0.90,0.90,0.90,0.92,0.92,0.92,0.94,0.94,0.94,0.96,0.96,0.96,0.96
陰性數據集:0.10,0.10,0.10,0.20,0.20,0.20,0.30,0.30,0.30,0.40,0.40,0.40,0.40
第五步:抽樣產生Meta分析模擬數據
獲得無偏和有偏Meta分析模擬數據抽樣框后,利用unifrnd函數,從抽樣框中進行有返回的抽樣,獲得包含k個子研究的無發表偏倚或有發表偏倚的Meta分析模擬數據。
(3)參數設置
不同的參數設置,將得到不同的模擬數據。本研究變動參數設置見表1。

表1 研究變動參數設置
為考察模擬獲得的有發表偏倚數據抽樣框是否有效,本研究分析了13個時段樣本例數總體均數為(20,40,60,80,100,120,140,160,180,200,220,240,260)標準差等于15時,有偏和無偏模擬數據抽樣框中效應值平均數和假設檢驗P值的平均數大小,結果見表2。

表2 有偏和無偏抽樣框子研究ln(OR)值的平均值及P值均值比較
結果顯示,無偏抽樣框的子研究ln(OR)值的平均值與總體值非常接近,而有偏抽樣框的子研究ln(OR)值的平均值與總體值則相差較大;相對于無偏抽樣框,有偏抽樣框中子研究的P值的平均值更小。由此可見,本研究模擬獲得的有發表偏倚數據抽樣框是存在發表偏倚的。
由參數設置可知,樣本例數總體均數有3種設置、標準差有3種設置、子研究個數有5種設置,共得45種參數組合。病例組與暴露組5種不同的總體暴露率,對應總體 ln(OR)取值分別為 0,0.1633,0.3272,0.4922,0.6590。固定總體ln(OR),對上述45種參數組合,每種組合模擬抽樣1000次,共得45000個Meta分析模擬數據進行準確度分析,詳見表3。表中靈敏度分析用有發表偏倚模擬數據,特異度分析用無發表偏倚模擬數據(下同)。結果顯示新方法除在ln(OR)取值較小的情況下靈敏度高于傳統方法外,其余情況靈敏度、特異度均低于傳統方法。

表3 ln(OR)的不同取值條件下的靈敏度和特異度分析
由參數設置可知,總體ln(OR)有5種設置、樣本例數標準差有3種設置、子研究個數有5種設置,共得75種參數組合。固定樣本例數總體均數,對上述75種參數組合,每種組合模擬抽樣1000次,共得75000個Meta分析模擬數據進行準確度分析,詳見表4。結果顯示新方法靈敏度與傳統方法相近,特異度低于傳統方法。

表4 樣本例數總體均數不同取值條件下的靈敏度和特異度分析
由參數設置可知,總體ln(OR)有5種設置、樣本例數總體均數有3種設置、子研究個數有5種設置,共得75種參數組合。固定樣本標準差,對上述75種參數組合,每種組合模擬抽樣1000次,共得75000個Meta分析模擬數據進行準確度分析,詳見表5。結果顯示新方法靈敏度與傳統方法相近,特異度低于傳統方法。
由參數設置可知,總體ln(OR)有5種設置、樣本例數總體均數有3種設置、樣本標準差有3種設置,共得45種參數組合。固定子研究個數,對上述45種參數組合,每種組合模擬抽樣1000次,共得45000個Meta分析模擬數據進行準確度分析,詳見表6。結果顯示新方法靈敏度與傳統方法相近,特異度低于傳統方法。

表5 樣本例數標準差不同取值條件下的靈敏度和特異度分析

表6 子研究個數不同取值條件下的靈敏度和特異度分析
Meta分析是循證醫學研究中重要的數量化分析工具,發表偏倚是Meta分析最常見的偏倚之一,故發表偏倚的診斷在Meta分析中占有重要地位。常用的診斷發表偏倚的漏斗圖法、Egger法、Begg法均是以效應量與其誤差信息之間的關系判斷是否存在發表偏倚。
本研究利用發表時間順序和效應尺度間的關系構建一種新的Meta分析發表偏倚診斷方法,通過對模擬數據分析顯示,新方法具有一定的診斷發表偏倚的能力,但與傳統方法相比,新方法除在OR值較小的參數條件下靈敏度優于傳統方法外,其余參數條件下診斷準確度均低于傳統方法。
本方法首次將文獻發表時間順序參數引入發表偏倚診斷模型,分析原理與傳統方法有較大差別,這就為研究發表偏倚的診斷方法提供了一種新的研究思路。總體來看,新方法的診斷準確度相對于傳統方法沒有提高,但由于新方法與傳統方法診斷“發表偏倚”的理論基礎不同,故將兩者進行聯合診斷有可能改善目前新舊方法診斷發表偏倚靈敏度均較低的現狀。另新方法原理簡單易理解,計算較簡便,利于推廣使用。
由于本研究是利用模擬數據進行分析,故產生模擬數據的參數設置對分析結果有較大影響。由于本研究參數設置組合并不完全,如有偏數據產生過程中各時段發表比例的設置、不同的Meta分析效應量的設置均無給予過多考慮,故本研究結果只是新方法診斷價值的初步結論。如需最終評價新方法的診斷價值,還需完善參數設置組合進一步深入研究。
1.Light RJ,Pillemer DB.Summing Up:The Science of Reviewing Research.Cambridge MA:Harvard University Press,1984.
2.Egger M,Smith GD,Schneider M,et al.Bias in meta-analysis detected by a simple,graphical test.British Medical Journal,1997,315:629-634.
3.Begg CB,Mazumdar M.Operating characteristics of a rank correlation test for publication bias.Biometrics,1994,50:1088-1101.
4.Macaskill P,Walter SD,Irwig L.A comparison of methods to detect publication bias in meta-analysis.Stat Med,2001,20:641-654.
5.Richy F,Reginster JY.A simple method for detecting and adjusting meta-analyses for publication bias.The Internet Journal of Epidemiology,2006,3(2).
6.王珍,張永紅,徐巧巧.幾種發表性偏倚評估方法介紹.中國衛生統計,2009,26(5):539-541.