丁 航,劉 源,張連峰,周 琳
(鄭州大學第一附屬醫院 消化內科,河南 鄭州 450052)
IgG4相關性疾病(IgG4-related disease, IgG4-RD)是一種可累及胰腺、膽管、唾液腺、淚腺等全身多個器官的自身免疫性疾病,臨床特征為受累器官或組織彌漫性或局灶性腫大及硬化,導致阻塞或壓迫癥狀,常伴有血清IgG4水平增高,病理特征為受累組織中代表性IgG4陽性漿細胞浸潤[1]。由于人們對IgG4-RD開始認識的時間較晚,并且其臨床表現易與其他疾病如惡性腫瘤相混淆,從而導致誤診進一步選擇不恰當的治療方案。目前,國際上已推出了IgG4-RD綜合診斷標準以及病理診斷共識,一些器官特異性診斷標準如胰腺、膽管、腎臟也得到了廣泛應用,其中病理組織學仍是IgG4-RD診斷的金標準[2]。但病理檢查為有創性操作,臨床不易開展。2001年,Hamano 等[3]開創性地發現血清 IgG4水平對自身免疫性胰腺炎(AIP)有較高的診斷優勢,之后有越來越多研究聚焦于血清 IgG4水平對IgG4-RD的診斷價值。然而,不同的研究間結果存在較大的差異,有研究表明半數以上病理證實的IgG4-RD患者不會出現血清IgG4升高[4]。因此,本研究進行此診斷性Meta分析,旨在闡明血清IgG4水平對IgG4-RD的診斷價值。
1.1文獻與檢索 在美國國立醫學圖書館 PubMed 數據庫、荷蘭醫學文摘 Embase 數據庫、萬方數據庫、維普數據庫(VIP)和中國知網數據庫(CNKI)全面檢索,收集自2011年1月1日至2020年1月1日所有以探討血清IgG4對IgG4相關性疾病診斷價值為目的的英文文獻,以IgG4, Serum IgG4, serum immunoglobulin g4, IgG4-Related Disease, Autoimmune Pancreatitis, Mikulicz's disease, IgG4-RD為檢索詞進行檢索,并手工檢索綜述文獻或已納入文獻的參考文獻作為補充,全面收集相關資料。
1.2納入及排除標準 納入標準:納入文獻以評估血清IgG4對IgG4-RD診斷價值為目的;IgG4相關性疾病診斷采取IgG4-RD綜合診斷標準、IgG4-RD病理共識或器官特異性診斷標準;原始文獻中應給出或可以計算出構成四格表的數值,即真陽性(true positive, TP)、假陽性(false negative, FN)、假陰性(false positive, FP)及真陰性(true negative, TN)例數。
排除標準:重復報道的文獻(當懷疑兩個研究有重合的病例時,選取納入病例數更大的研究);文獻類型為述評、書信、會議摘要、講座等非原始研究,動物實驗研究以及會議論文等;IgG4-RD組或對照組樣本量小于10例;資料不全或無法從原始文獻中獲取四格表數據的研究。
1.3文獻篩選及資料提取 由2名研究者遵循盲法原則獨立進行文獻篩選以及對納入文獻進行數據提取,提取內容包括第一作者、發表年份、國家、樣本量、診斷標準、血清IgG4檢測方法、截斷值、以及TP、FP、TN 和 FN 等。篩選及提取過程中如研究者意見不一致,則通過協商或與第3名研究者討論解決。
1.4文獻質量評價 采用診斷準確性研究的質量評價工具QUADAS-2[5]評價納入文獻的質量及發生偏倚的可能性。該標準包含有4個域的評價:病例選擇、待評價試驗、金標準、病例流程和進展情況,從偏倚風險和適用性兩個方面進行。一共有11個條目,偏倚風險最終以“低”、“高”、“不明確”來評定。“不明確”僅指研究報道的信息不充分。
1.5統計學方法 采用Meta-Disc 1.4軟件及STATA15.0軟件中“midas”命令進行統計學分析。通過雙變量模型計算合并敏感度、合并特異度、合并診斷優勢比(DOR)、合并陽性似然比(PLR)、合并陰性似然比(NLR),繪制相關森林圖并擬合受試者工作特征曲線(summary receiver operating characteristic,SROC)并計算SROC曲線下面積(area under the curve, AUC)描述診斷準確性,AUC越接近1表示診斷性能越高,同時描繪出其95%的置信區間(confidence interval,CI)和 95%預測區間。若研究間存在異質性(I2>50%),則進一步分析異質性來源,觀察SROC曲線是否存在“肩臂”狀,并結合Spearman相關系數判斷有無閾值效應,若無閾值效應,進行亞組分析進一步探討異質性來源。采用漏斗圖及Deeks檢驗評價納入文獻的發表偏倚情況,P<0.05認為差異有統計學意義。
2.1文獻檢索結果 共有17篇文獻, 17 095例納入本次Meta分析[6-22]。其中IgG4-RD患者1 545例,對照組15 550例。文獻篩選的流程見圖1,納入文獻的基本特征見表1。

圖1 文獻篩選流程及結果

表1 納入文獻的基本特征
2.2文獻質量評價 應用QUADAS-2評分,由2名研究者分別對各研究的質量獨立進行評估,存在不一致的意見時協商統一,由于一些研究未說明僅限納入1型AIP,使得病例選擇適用性領域出現未知風險。見圖2。

圖2 應用QUADAS-2評分對納入文獻進行質量評估的情況
2.3主要指標結果及異質性檢驗 納入文獻中血清IgG4的臨界值為1.3~1.44 g/L之間,各研究合并的靈敏度0.88(95%CI:0.81-0.93),特異度為0.89(95%CI:0.83-0.93),陽性似然比為8.3( 95%CI:5.1-13.7),陰性似然比為0.13(95%CI:0.08-0.22),診斷優勢比為62(95%CI:25-153)。繪制SROC曲線,計算曲線下面積AUC為0.95(95%CI:0.92-0.96),對靈敏度和特異度進行異質性檢驗(Q檢驗),靈敏度I2=91.4%,特異度I2=97.8%,P<0.05,提示各文獻間存在顯著的異質性。
在所有納入文獻中,11篇文獻道了血清IgG4>2×正常值上限(ULN)時的診斷價值,臨界值波動在2.7~2.8 g/L之間,包含了1 326例IgG4-RD患者及13750例對照。各研究合并的靈敏度0.59(95%CI:0.47-0.7),特異度為0.96(95%CI:0.94-0.97),陽性似然比為14.3(95%CI:9.1-22.7),陰性似然比為0.42(95%CI:0.32-0.57),診斷優勢比為34(95%CI:17-69)。SROC曲線的曲線下面積AUC=0.95(95%CI:0.92-0.96),進行異質性檢驗發現靈敏度I2=93.2%,特異度I2=92.2%,P<0.05,提示文獻間異質性顯著。見圖3~4。

圖3A IgG4診斷IgG4-RD的合并敏感度及特異度

圖3B IgG4>2×ULN診斷IgG4-RD的合并敏感度及特異度

圖4A IgG4診斷IgG4-RD的SROC曲線 圖4B IgG4>2×ULN診斷IgG4-RD的SROC曲線
2.4亞組分析 各研究間異質性較顯著,觀察兩條SROC曲線發現均不存在“肩臂狀”分布,且Spearman相關系數在臨界值為1.3~1.44 g/L時為-0.368,P=0.295,當臨界值>2×ULN時Spearman相關系數=-0.582,P=0.06,提示兩組研究均不存在閾值效應。故考慮異質性由于非閾值效應引起,進行亞組分析尋找異質性來源,將納入文獻按地區、疾病類型以及樣本量大小進行亞組分析,發現不同地區、是否僅納入AIP患者以及IgG4-RD患者樣本量是否>100都可能是異質性的來源,見表2~3。

表2 IgG4臨界值為1.3~1.44 g/L時亞組分析結果
2.4發表偏倚檢測 分別對臨界值為1.3~1.44 g/L時納入的17篇文獻及臨界值為2.7~2.8 g/L時納入的11篇文獻檢驗是否存在發表偏倚,采用Deeks法進行漏斗圖不對稱檢驗,發現漏斗圖對稱,P值分別為0.532和0.38,故不存在發表偏倚,見圖5。
2.5敏感性分析 采用逐一剔除所納入的研究并重新進行合并的方法,觀察各綜合診斷效能的波動來評估結論的穩定性,結果無實質性改變,說明本研究結果穩定性好,見圖6。
IgG4相關性疾病為近年來新認識的一種自身免疫性疾病,可累及胰腺、膽管、涎腺、淚腺、腎臟、腹膜后組織等全身多個器官,臨床表現缺乏特異性,易與其他疾病相混淆。盡管IgG4-RD的診斷金標準為組織病理檢查,但由于病理檢查的有創性以及部分器官如胰腺、腹膜后活檢難度較大,從而限制了其臨床大規模應用[23]。因此,血清IgG4檢測在IgG4-RD的診斷過程中備受重視。然而,一些其他的疾病如自身免疫性疾病、惡性腫瘤、血管炎、淋巴瘤、多中心型Castleman病中也可出現IgG4升高,且部分IgG4-RD患者可能表現IgG4正常[24]。之前的研究多聚焦于IgG4對AIP與胰腺癌鑒別診斷的價值[25-26],鑒于此,本研究對血清IgG4對IgG4-RD的診斷價值進行Meta分析。
本研究共計納入了17篇相關文獻,計算得到IgG4對診斷IgG4-RD的匯總靈敏度為0.88,匯總特異度為0.89,DOR為62,SROC曲線的AUC也達到了0.95,表明血清IgG4檢測有較高的準確性及較好的鑒別診斷價值。研究表明,血清IgG4的診斷特異度隨臨界值升高而升高,由美國風濕病學會(ACR) 及歐洲風濕病聯盟(EULAR)提出的IgG4 相關性疾病分類標準建議,血清IgG4升高至2~5×ULN范圍內得6分,而升高> 5×ULN得11分,結合其他標準評分后,當總分達20且可排除其他疾病,即可診斷IgG4-RD[27]。另外,AIP的國際診斷共識(ICDC)也將IgG4臨界值>2×ULN列為1級證據[28]。我們也對臨界值為2×ULN進行了分析,結果顯示,盡管匯總特異度達到了0.96,但靈敏度同時降至0.59,AUC未出現明顯變化,而DOR降至34,這說明將臨界值提高并沒有明顯的診斷優勢。
盡管我們盡可能納入更多同質性研究,并同時避免選擇偏倚,但各個研究之間仍表現出顯著的異質性。本研究發現納入文獻之間并不存在閾值效應,因此,非閾值效應為此次分析中異質性的來源。本研究中亞組分析顯示,不同地區、是否僅納入AIP患者以及樣本量大小都可能是異質性的來源。血清IgG4對亞洲患者診斷的整體敏感度及特異度高于歐美患者,由于一些研究并未準確區分AIP的亞型,這可能是由于歐美國家在對AIP患者研究中納入較多2型AIP患者所致。與1型AIP不同,2型AIP少有血清IgG4升高,且更常見于西方國家[28],從而降低了IgG4的診斷性能。我們的結果也顯示血清IgG4對IgG4-RD患者診斷性能優于僅包含AIP的患者組,這也驗證了這一推斷。另外,不同種族之間也會出現血清IgG4水平的差異,亞洲地區IgG4-RD患者IgG4陽性率明顯高于歐美地區[29],另外有研究表明亞洲人及黑人血清基礎IgG4水平高于白人,且差異有統計學意義[30]。IgG4-RD為系統性全身疾病,診斷標準眾多,不同的診斷標準以及血清IgG4檢測手段差異也可能是異質性來源。除此之外,各個研究的對照組依據不同的研究目的而招募不同的人群,這也可能是文獻之間出現異質性的原因。
我們的研究也存在一些不足:①檢索文獻僅限于英語,會遺漏其他語種的高質量研究,在時間上我們選擇檢索2011年之后的文獻,這是由于IgG4-RD僅在10年前才被正式提出,但這可能遺漏高質量的文獻,造成選擇偏倚;②盡管使用亞組分析尋找異質性來源,但一些亞組內仍存在較高異質性,由于納入研究數目較少,未進一步尋找異質性來源。然而,由于不同診斷標準、IgG4檢測手段、對照組設置等因素,異質性難以完全避免;③一些高質量的研究中血清IgG4水平以平均值的形式報道,無法提取四格表從而被排除,這可能影響最終的結果。
總之,我們的研究證明血清IgG4在IgG4-RD的診斷中具有較高的參考價值,相對于病理檢查效率更高且更簡便。然而由于地區、樣本量以及疾病類型的影響,文獻之間存在較大的異質性,仍需更多前瞻性高質量診斷試驗進行驗證,進一步證明IgG4的應用價值。