孔夢娟 周賢 羅小慶
肝纖維化是各種慢性肝病的共同病理過程。病毒、代謝、自身免疫、遺傳和毒素可損傷肝細胞,導致肝結構紊亂、門靜脈高壓,最后肝硬化[1]。慢性肝病的預后和治療方式通常取決于肝纖維化的嚴重程度,因此肝纖維化評估至關重要。肝活檢(LB)被認為是肝纖維化評估的“金標準”,但其存在一定的局限性,是一種有創檢查方法,因而不是完全無風險的[2-3]。因此,許多研究者都在開發無創的評估方法以取代LB[4-5]。聲輻射力脈沖(ARFI)彈性成像(西門子Acuson S2000)是一種新型的超聲彈性成像方法[6]。其工作原理是運用調制的聚焦低頻聲脈沖激勵生物黏彈性組織內產生聲剪切波,采取特別的方法獲得組織內剪切波信號與其在組織內的傳播速度、組織硬度,傳播速度隨著纖維化嚴重程度而增加[7]。在過去的幾年中,一些研究證實了ARFI在評估肝硬度方面的作用[8-10]。瞬態彈性成像(Fibroscan)值評估肝硬度是依賴于通過肝臟傳播的彈性剪切波的速度來計算肝臟彈性[11-12],剪切波速度與組織的剛度直接相關[13]。近年來,一些文章研究了Fibroscan評估肝硬度方面的作用[14-16],但并未研究ARFI和Fibroscan在評估慢性丙型病毒性肝炎(hepatitis c virus,HCV)纖維化分期的診斷效能。因此,本研究的目的在于比較ARFI和Fibroscan對HCV纖維化分期的診斷效能。
1.1 資料 計算機檢索了PubMed、Embase和Cochrane圖書館。所有文獻(摘要或全文)以英語發表,檢索時限均為從建庫至2018年10月31日,包括ARFI和Fibroscan評估HCV患者的肝硬度,以LB結果作為“金標準”。此外,研究必須提供足夠的信息,構建“2×2”四個表,即提供真假陽性和真假陰性。納入標準:(1)HCV,患者種族、國籍和疾病持續時間不受限制;(2)LB的組織病理學分期作為診斷的“金標準”;(3)研究為診斷性測試,并用ARFI和Fibroscan評估肝纖維化的不同階段;(4)研究必須提供足夠的信息來構建“2×2列”四格表,即真陽性及陰性,假陽性及陰性。排除標準:(1)無法提取原始數據獲得四格表者;(2)其他類型的病毒性肝炎或合并其他類型的病毒性肝炎;(3)與肝纖維化疾病相結合,包括系統性紅斑狼瘡、風濕性疾病、腎功能衰竭、慢性阻塞性肺病、腫瘤性疾病、糖尿病、HIV等;(4)藥物性肝損傷和肝臟移植者;(5)確診的肝硬化患者。
1.2 文獻質量評價 診斷準確性研究的質量評估(QUADAS-2工具)用于評估每篇文獻的質量[17],對納入文獻嚴格按各條目要求以“是”、“否”、“不清楚”進行嚴格的評價,并規定“是”為1分,“否”和“不清楚”為0分,總分<10分的文獻排除。在已經含有該表的Review Manager 5.3軟件中對入選文獻的各條目按“是”、“否”、“不清楚”進行獨立評價,綜合評估文獻質量和適用性。
1.3 文獻數據提取 2位研究人員獨立提取數據,包括檢索文獻的質量評估。存在差異時,在協商一致的會議上得到解決,或者如果無法達成協議,則通過轉介給第3位調查員來解決。本研究從原始文章中提取了以下數據:作者姓名、出版年份、患者的原籍國、年齡、性別比例、纖維化分期(由LB診斷),每個不同纖維化階段的患者數量,以及真陽性(tp)、假陽性(fp)、假陰性(fn)和真陰性(tn)檢測率,靈敏度(Sen)、特異性(Spe)、陽性似然比(LR+)、診斷優勢比(DOR)、ROC 曲線的 AUC 以及95%CI。
1.4 統計學處理 采用Microsoft Excel 2016和Stata 13統計軟件。本研究以Sen(檢測陽性值占參考標準陽性值的比例)和Spe(檢測陰性值占參考標準陰性值的比例)作為標準測量,以DOR作為診斷準確性的全局測量。P<0.05為差異有統計學意義。
2.1 文獻檢索結果 初檢共獲得相關文獻389篇(包含636例患者信息),經逐層篩選后最終納入5篇文獻,文獻篩選流程及結果見圖1。按Metavir肝纖維化分期(F)標準(F=0期:無纖維化;F=1期:匯管區纖維化無纖維隔;F=2期:匯管區纖維化無少量間;F=3期:間隔纖維化;F=4期:肝硬化)進行分組:F1組:F=1期,共0篇;F2組:F=2期,共 5篇;F3組:F=3期,共4篇;F4組:F=4期,共5篇。

圖1 文獻檢索流程圖
2.2 納入文獻的基本特點及質量評價 納入文獻的基本特點見表1,方法學質量評價結果見表2。其中偏倚風險主要為待評價檢查方法是否遵守盲法、檢查之前是否清楚LB結果。

表1 納入文獻的基本特征

表2 納入文獻的質量評價
2.3 HCV肝纖維化各期Meta分析結果
2.3.1 F2組HCV肝纖維化的Meta分析結果及森林圖在5項研究[18-22]中使用ARFI和Fibroscan評估了的診斷準確性,Fibroscan的合并Sen、合并Spe和ROC曲線的 AUC(0.77、0.86、0.83) 均高于使用 ARFI的(0.75、0.79、0.80);Fibroscan 的 DOR(21)高于 ARFI(11),見表3及圖2-4。

表3 F2組HCV肝纖維化的Meta分析結果

圖 2 F2 組 Sen 和 Spe的森林圖(a:ARFI;b:Fibroscan)

圖 3 F2 組 DOR 的森林圖(a:ARFI;b:Fibroscan)

圖 4 F2組 ROC 曲線的 AUC 及其估計值(a:ARFI;b:Fibroscan)
2.3.2 F3組HCV肝纖維化的Meta分析結果及森林圖 在4項研究[18-20,22]中使用ARFI和Fibroscan評估了F3組的診斷準確性,Fibroscan合并 Sen(0.85)高于ARFI(0.80);Fibroscan 的 DOR(31)高于 ARFI(26),見表4及圖5-7。

表4 F3組HCV肝纖維化的Meta分析結果

圖 5 F3 組 Sen和 Spe的森林圖(a:ARFI;b:Fibroscan)

圖 6 F3 組 DOR 的森林圖(a:ARFI;b:Fibroscan)

圖 7 F3組 ROC 曲線的 AUC 及其估計值(a:ARFI;b:Fibroscan)
2.3.3 F4組HCV肝纖維化的Meta分析結果及森林圖 在5項研究中[18-22]使用ARFI和Fibroscan評估了F4組的診斷準確性,Fibroscan的合并Sen、合并Spe和ROC 曲線的 AUC(0.97、0.91、0.96)均高于 ARFI的(0.87、0.90、0.94);Fibroscan 的 DOR(341)明顯高于 ARFI(58),見表 5及圖 8-10。

表5 F4組HCV肝纖維化的Meta分析結果

圖 8 F4 組 Sen 和 Spe的森林圖(a:ARFI;b:Fibroscan)

圖 9 F4 組 DOR 的森林圖(a:ARFI;b:Fibroscan)

圖 10 F4組 ROC 曲線的 AUC 及其估計值(a:ARFI;b:Fibroscan)
本研究納入的文獻存在較高異質性,可能由非閾值效應引起。造成異質性的主要原因可能與操作者本身的經驗不同有關。AUC是評價試驗診斷效能的主要指標之一[23],AUC值越接近于1,診斷準確性越高,當AUC≤50%表明診斷試驗無意義,51%~70%可認為診斷準確率較低,71%~90%提示診斷準確率中等,>90%則表明診斷準確率較高。
近10年來,國內外發表的大多數文章僅使用單一的影像學檢查來評估HCV的肝纖維化水平,而僅有少數文章同時使用Fibroscan和ARFI來評估HCV肝纖維化水平,本研究只篩選了5篇文獻,因為文獻數量較少,所以研究還不全面。希望將來有更多的文獻可以使用Fibroscan和ARFI來研究HCV肝纖維化。
本研究顯示,在評估HCV顯著纖維化(F=2期)中,Fibroscan的合并Sen、合并Spe、DOR和ROC曲線的AUC均高于ARFI;在評估HCV晚期纖維化(F=3期)中,Fibroscan合并Sen和DOR均高于ARFI,而ARFI的合并Spe、ROC曲線的AUC高于Fibroscan;在評估HCV肝硬化(F=4期),Fibroscan的合并 Sen、合并 Spe、DOR和ROC曲線的AUC均高于ARFI。
本研究所含文獻中LB標本的大小不完全相同,ARFI或Fibroscan檢查的臨界值也不完全相同。BMI水平、肝臟炎癥程度、脂肪變程度、ALT水平、呼吸、腹水等可以影響檢查結果[25-28],這些因素可能對研究結果產生一些影響。
非侵入性診斷技術的主要目的是減少使用LB,但仍不能完全取而代之。隨著超聲彈性成像技術的不斷發展,有望進一步提高診斷肝纖維化程度的準確性和有效性,擴大各種原因引起的慢性肝病的診斷范圍,控制肝纖維化的進展。