李玉霞,田中華,應 紅,李 倩,唐運祥,李 維
重慶市急救醫療中心:1.核醫學科;2.臨床實驗診斷中心,重慶 400014;3.重慶市中醫院藥劑科,重慶 400021
肝癌是我國常見的惡性腫瘤之一,其發病率位居惡性腫瘤第三位,5年生存率僅為14.1%[1-2],嚴重威脅國民的生命和健康。在原發性肝癌(PHC)中,肝細胞癌(HCC)是最主要的組織學分型,占PHC的70%~85%[3]。
早期篩查能明顯降低肝癌的病死率[4]。我國《原發性肝癌診療規范(2017年版)》建議對肝癌高危人群至少每隔6個月進行一次篩查[3]。目前臨床常用的血清學篩查指標主要為甲胎蛋白(AFP),但其單獨應用的靈敏度和特異度并不十分理想,因此AFP被推薦與其他指標聯合檢測,以提高對PHC的診斷效能[5]。脫γ-羧基凝血酶原,又被稱為維生素K缺乏或拮抗產生的異常蛋白,是由LIEBMAN等[6]首次發現的一種異常凝血酶原(DCP),其在HCC患者血清中異常升高,與HCC的發生、發展密切相關,是靈敏且特異的HCC血清學腫瘤標志物。目前,已有許多文獻報道DCP單項檢測或聯合AFP檢測可用于診斷HCC[7-15],但這些報道或多或少存在一定差異。因此,本研究通過Meta分析綜合評價AFP和DCP單項與聯合檢測用于診斷PHC的價值,以期為臨床應用提供參考。
1.1納入標準 (1)研究對象為中國人群;(2)病理診斷(金標準)確診的PHC患者為病例組,非PHC患者為對照組;(3)研究類型:國內外公開發表的關于DCP單項或聯合AFP檢測診斷PHC的診斷試驗;(4)DCP檢測方法為化學發光或電化學發光法;(5)能從文獻中完整提取四格表數據[真陽性例數(TP)、假陽性例數(FP)、假陰性例數(FN)和真陰性例數(TN)]。
1.2排除標準 (1)研究對象同時合并其他惡性腫瘤,無法獲取單獨的肝癌數據;(2)研究對象為繼發性肝癌患者,或僅為小肝癌,或經外科治療后的肝癌,或AFP為低值或陰性的肝癌;(3)無法完整提取四格表數據;(4)動物、體外試驗;(5)綜述、病例報告、信件、會議論文、學位論文等。
1.3文獻檢索 檢索數據庫包括中國知網、萬方醫學數據庫、維普中文數據庫、PubMed、PML、Cochrane Library、Embase。檢索年限為建庫至2020年5月25日。語種限定為中文和英文。中文檢索關鍵詞(或縮寫)包括:甲胎蛋白、異常凝血酶原、脫γ-羧基凝血酶原、AFP、DCP、PIVKA-Ⅱ、原發性肝癌、肝細胞癌。英文檢索詞包括:AFP、DCP、PIVKA-Ⅱ、alpha-fetoprotein、des-γ-carboxy-pmthrombin、des-gamma-carboxy-pmthrombin、protein induced by vitamin K absence or antagonist-Ⅱ、primary hepatocellular carcinoma、hepatic cell carcinoma。
1.4資料提取 由兩位研究人員獨立按照納入和排除標準篩選文獻并進行數據提取,若遇分歧,通過討論或由第三位研究者決定。各研究信息包括文獻的第一作者、發表時間、研究對象的種族、病例組及對照組的數量、臨界值(cut-off值)、DCP的檢測方法、診斷試驗參數信息(包括TP、FP、TN、FN、靈敏度和特異度)。
1.5文獻質量評價 利用診斷性研究質量評價量表(QUADAS)進行文獻質量評價[16],分別對14個條目按“是”“否”或“不清楚”3個判斷標準逐一進行評價。由兩位研究人員獨立進行文獻質量評價,若有異議,通過討論或由第三位研究者決定。
1.6統計學處理 利用Meta-DiSc1.4軟件和Stata15.0軟件進行統計學處理,內容包括:異質性檢驗、Spearman相關分析、發表偏倚、匯總靈敏度、匯總特異度以及匯總受試者工作特征(SROC)曲線等。若存在異質性,則采用隨機效應模型對效應指標進行加權定量合并,反之則采用固定效應模型。通過Z檢驗分析AFP、DCP單項檢測以及兩者聯合檢測的曲線下面積(AUC)的差異。以P<0.05為差異有統計學意義。
2.1文獻檢索和資料提取 根據關鍵詞初步檢索出652篇中英文文獻。根據納入與排除標準最終確定納入45篇文獻,包括中文文獻40篇,英文文獻5篇。文獻篩選及納入過程見圖1。所納入的文獻中共有34篇將AFP與DCP聯合檢測作為診斷指標。納入文獻中病例組共5 762例,對照組共8 426例。納入文獻的基本特征見表1。

表1 納入文獻的基本特征

圖1 文獻篩選及納入過程
2.2納入文獻的質量評價 所有納入文獻均經過QUADAS標準評估,匯總質量評價結果如下,(1)文獻變異來源:在關于變異的兩個條目(條目1、2)的評價中,對于條目1“病例譜是否包含了各種病例及易混淆的疾病病例 ”持“是”回答的符合率為48.9%(22/45),表明納入的文獻存在疾病譜偏倚;對于條目2“是否清晰明確地描述了研究對象的納入標準”持“是”回答的符合率為95.6%(43/45),表明納入文獻的納入與排除標準的描述符合標準。(2)文獻偏倚來源:有關偏倚的9個條目(條目3~7、10~12、14)中,對于條目4“ 金標準和待評價試驗檢測的間隔時間是否足夠短,以避免出現疾病病情的變化”持“是”回答的符合率為33.3%(15/45);對于條目10“待評價試驗的結果判讀是否在不知曉金標準試驗結果的情況下進行”和條目14“ 對退出研究的病例是否進行解釋”均未持肯定回答。表明納入的文獻存在文獻偏倚。其他條目持“是”回答的符合率均>95%。(3)報告質量評估:在報告質量的3個條目(條目8、9、13)中,對條目8“待評價試驗的操作是否描述得足夠清楚且可進行重復”和條目9“金標準試驗的操作是否描述得足夠清楚且可以進行重復”持“是”回答的符合率為97.8%(44/45);而對于條目13“是否報告了難以解釋的中間試驗結果”持“否”的符合率為100%,表明納入文獻均未報道難以解釋的中間試驗結果。

續表1 納入文獻的基本特征
2.3異質性檢驗
2.3.1閾值效應 通過計算Spearman相關系數r來判斷有無閾值效應。通過Meta-DiSc1.4軟件計算可得,AFP單項檢測時,r=0.363,P=0.012;DCP單項檢測時,r=0.004,P=0.978;AFP和DCP聯合檢測時,r=0.306,P=0.078。由此可知,AFP單項檢測時,存在閾值效應(P<0.05),而DCP單項檢測與AFP和DCP聯合檢測均不存在閾值效應(P>0.05)。
2.3.2非閾值效應異質性 利用Q統計量檢驗和I2對納入研究因非閾值效應引起的異質性進行檢驗。通過Meta-DiSc1.4軟件計算可得,AFP單項檢測時,I2=86.8%,P<0.001,DCP單項檢測時,I2=87.5%,P<0.001,AFP、DCP聯合檢測時,I2=79.6%,P<0.001。由此可見,AFP、DCP無論是單項檢測,還是二者聯合檢測,Q統計量檢驗的I2均>50%,P均<0.05,由此可認為納入的研究存在異質性。進一步通過Meta回歸分析法分析非閾值效應可能的異質性來源。以病例組人數差異為例,分別以病例組人數80、100、150和200為截點進行Meta回歸分析,結果顯示每個人數截點的P均>0.05,提示病例組人數差異不是非閾值效應異質性的來源。
2.4發表偏倚 采用Stata15.0軟件對納入文獻進行Egger檢驗并繪制漏斗圖,結果顯示納入研究呈不對稱性分布,且PDCP<0.01,PAFP<0.01,PDCP+AFP<0.01,表明差異有統計學意義,提示存在發表偏倚。
2.5合并效應量 由前文可知,AFP、DCP單項檢測,AFP和DCP聯合檢測均存在異質性,故采用隨機效應模型合并效應量進行統計分析。分析結果顯示,AFP單項檢測匯總的靈敏度、特異度、診斷比值比(DOR)分別為0.67(95%CI:0.66~0.69)、0.82(95%CI:0.81~0.83)、11.58(95%CI:9.02~14.86);DCP單項檢測匯總的靈敏度、特異度、DOR為0.76(95%CI:0.75~0.77)、0.87(95%CI:0.86~0.88)、29.07(95%CI:21.86~38.64);AFP和DCP聯合檢測匯總的靈敏度、特異度、DOR為0.85(95%CI:0.84~0.86)、0.79(95%CI:0.78~0.80)、30.03(95%CI:22.09~40.82)。見表2。

表2 AFP、DCP單項和AFP聯合DCP診斷PHC的合并效應量
2.63種診斷方法診斷準確性的比較 由表2可知,AFP單項檢測的AUC和SE分別為0.82、0.01;DCP單項檢測的AUC和SE分別為0.89、0.01;AFP和DCP聯合檢測的AUC和SE分別為0.92、0.01。Z檢驗顯示AFP和DCP單項檢測的AUC間差異有統計學意義(Z=3.96,P<0.05);AFP和AFP與DCP聯合檢測的AUC間差異有統計學意義(Z=6.15,P<0.05);DCP和AFP與DCP聯合檢測的AUC間差異無統計學意義(Z=1.88,P>0.05)。
AFP長久以來是臨床應用最廣泛的診斷PHC的血清學腫瘤標志物,但其單獨應用的靈敏度和特異度并不十分理想,尤其是在某些AFP陰性的PHC患者中存在一定的漏診率[55]。DCP在PHC患者的血清中陽性率較高,有研究顯示DCP對PHC的診斷具有較高的特異度[56],很多研究顯示DCP作為單一的診斷PHC的標志物要優于AFP[8,11,44,54]。
目前認為對于存在明顯異質性的診斷性試驗,與匯總靈敏度和特異度相比,SROC和AUC是比較合理的Meta分析指標,SROC和AUC均不是單純強調靈敏度或特異度[57]。有研究表明即使是在異質性比較明顯的情況下,因異質性引起的AUC的偏差也小于6%,這說明在異質性試驗中,AUC具有較高的檢驗效能[58]。對于診斷性試驗而言,AUC越大,診斷準確性越高。當AUC<0.5時無診斷價值,AUC>0.9時診斷準確性最高[59]。本研究結果顯示,AFP、DCP單項檢測的AUC分別為0.82、0.89,表明其具有較高的診斷準確性,且Z檢驗顯示兩者間的差異有統計學意義(P<0.05),說明對于PHC的診斷,DCP單項檢測較AFP有更好的診斷準確性;而AFP和DCP聯合檢測的AUC為0.92,且Z檢驗顯示AFP和DCP聯合檢測與AFP單項檢測的AUC間差異有統計學意義(P<0.05),提示聯合檢測血清AFP和DCP能顯著提高對PHC的診斷準確性。AFP和DCP聯合檢測與DCP單項檢測的AUC經Z檢驗顯示差異無統計學意義(P>0.05),尚不足以說明AFP和DCP聯合檢測對PHC診斷的準確性優于DCP單項檢測。
當然,本研究仍然存在一定的局限性。首先,納入的所有研究均為回顧性研究,這可能增加典型病例的曝光率。其次,納入研究的對照組構成不一,有的僅為體檢健康者,有的還包括了良性肝病和/或非肝癌的其他惡性腫瘤,這也可能是引起異質性的原因之一。因此,還需進一步納入更高質量、更大樣本量的文獻來驗證本研究的結論。