芮法娟,薛 旗,劉翠紅,郭朝陽,楊紅麗,劉傳禮,徐琊蕓,任萬華,秦成勇,李 婕,
1 山東第一醫科大學附屬省立醫院 a.感染性疾病科,b.超聲診療科,濟南 250021;2 山東大學附屬省立醫院 感染性疾病科,濟南 250021
據世界衛生組織(WHO)估計,全世界每年約有2.57億人患慢性乙型肝炎(CHB),約有88.7萬人死于HBV感染引起的肝衰竭、肝硬化(LC)和肝細胞癌(HCC)[1]?;颊咭坏┻M展為包括肝衰竭和HCC在內的終末期肝病,預后極差,病死率明顯增加。因此,尋求更加準確的疾病臨床轉歸預測方法是提高終末期肝病救治率的關鍵所在。機器學習(machine learning,ML)是提高臨床決策能力的有力工具,它可以從大的、復雜的數據集中檢測出難以識別的模式,從而實現精確可靠的預測[2-3]。本文就ML在HBV相關肝病中的應用作一綜述,并展望其應用前景。
ML是人工智能的一個領域,涉及到創建自動學習系統。算法通過輸入的數據進行自動學習,在可接受的精確度范圍內預測輸出值,確定數據中的模式和趨勢,即通過自主“學習”來理解識別復雜模式,而不需要人為干預[4-5]。根據處理的數據是否需要人為標記將ML技術分為有監督學習、無監督學習和半監督學習三類[6]。有監督學習技術解決的問題分為輸入變量映射為連續輸出函數的回歸問題和輸入變量映射為離散類別的分類問題,是應用最廣泛、效果最好的方法[7]。ML的常見算法有:支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、邏輯回歸(logistic regression,LR)、樸素貝葉斯(Na?ve Bayes,NB)、決策樹(decision tree,DT)、K-近鄰(K nearest neighbor,KNN)、多層神經網絡 (multilayer perceptron,MLP)[8-9]。各個算法的主要特點見表1。
Khan等[16]采用拉曼光譜結合模式技術研究119例不同年齡、不同性別的HBV感染者的血清樣本。正常血清樣本和HBV血清樣本在某些拉曼光譜帶上的強度略有變化,峰位無變化(如625、678、748、810、820、950、1003、1018和1275 cm-1,病理標本的強度均高于正常標本,1128、1220、1250和1650 cm-1,病變樣品的強度降低)。采用SVM算法識別肉眼看不到的差異,建立識別正常、HBV血清的模型,其準確度、敏感度、特異度分別為98%、100%、95%。CHB患者治療期間HBsAg血清清除率與預后相關。一項納入2235例CHB患者的研究[12],使用多種ML算法(極端梯度提升、RF、DT、LR)確定預測HBsAg血清學清除率的模型,其曲線下面積(AUC)分別為0.891、0.829 、0.619和0.680。極端梯度提升模型的AUC最高,對HBsAg血清學習有較好的預測作用。對來自亞洲和歐洲人群的完整HBV基因組進行超深測序,并首次對HBV準種的多樣性進行了全面調查,采用ML方法建立對HBeAg狀態進行最佳分類的模型,發現nG1896A是CHB患者HBeAg狀態分類中最具預測性的突變,此研究有利于直接對患者分層制定治療策略[17]。一項對122例CHB患者的研究[18],基于RF、KNN、SVMML方法構建診斷和預測HBV感染患者炎癥水平的有效模型。結合9個基因(DLX3、ALPK1、YBX1、ZNF75A、SPP2、TTLL4、TTLL7、AGAP3和DCTN4)的表達、性別、年齡和3個臨床參數(AST、ALT和HBV DNA),RF模型是診斷CHB炎癥分級的最有力模型,預測概率達0.827±0.037。
慢性HBV感染是發展為纖維化、LC和HCC在內的晚期肝病的主要危險因素。5年內,10%~20%的慢性肝炎患者發展為LC,6%~15%的LC和慢性肝炎患者發展為HCC,其5年生存率低于5%[19]。肝纖維化程度可預測長期后果,在肝纖維化的早期階段進行臨床干預可以減緩LC的發展并降低發展為HCC的風險[8,20]。肝活檢是評估肝纖維化和LC分期的金標準,但由于它是有創性、費用昂貴、占用過多人力資源、存在取樣誤差而受到限制[19]。開發一種替代肝活檢的經濟、可重復的、無創工具已經得到廣泛認可[21]。先進的ML算法在肝纖維化和LC分期具有很大的潛力。
3.1 成像領域 影像診斷是可以全面評估整個器官的一種無創性診斷方法。實時組織彈性成像(real-time tissue elastography,RTE)是一種對肝纖維化準確評估的無創性成像技術。一項對我國乙型肝炎肝纖維化實時彈性成像的多中心研究[8],從513例接受肝活檢的受試者中獲得了11個RTE圖像特征,并建立了一個輔助性研究平臺判斷肝纖維化分期的決策支持系統。研究使用四種經典的分類器(SVM、NB、RF和KNN)來構建決策支持系統。研究結果表明,在區分HBV感染無肝纖維化時,SVM的敏感度最高(0.929 7),特異度最低(0.462 5),NB模型敏感度最低(0.796 7),特異度最高(0.825 0);區分中度纖維化與高水平纖維化時,RF模型在判斷肝臟是否出現嚴重的HBV感染以及臨床上是否需要抗病毒治療時獲得了最高的準確度(0.880 9)和特異度(0.960 0)。一項選取復旦大學中山醫院接受肝部分切除術和術前肝臟剪切波彈性成像的354例患者的研究[22],根據其灰階超聲圖像和相應的彈性圖像,采用傳統的ML和深度學習方法提取和分析了超聲圖像數據集特征,并對其進行分類。SVM算法在二分類(肝纖維化等級分為 S0/S1/S2與S3/S4兩類)準確度最高(89.9%),在三分類(肝纖維化等級分為S0/S1與S2/S3與S4三類)準確度最低(75.3%)。有研究[2]基于ML,使用常規放射組學、原始射頻(original radiofrequency,ORF)和微流量造影(contrast-enhanced micro-flow,CEMF)特征來評估顯著的肝纖維化,發現與常規放射組學相比,ORF和CEMF特征對肝纖維化階段有更好的預測能力,多參數超聲模型比單一模式下的特征表現出更好的性能(平均AUC為0.78~0.85)。
3.2 血清學標志物 對124例LC合并CHB患者和115例CHB患者的常規臨床參數(年齡、AST、ALT、凝血酶原時間、血小板計數、紅細胞分布寬度、血紅蛋白)進行研究,利用MLP建立預測HBV相關LC預測模型[23]。MLP預測模型的AUC為0.942,高于廣泛應用的LC預測工具FIB-4(0.726)、APRI(0.817);MLP分類器的最佳截止值為0.281,與FIB-4和APRI相比,準確度(89.9%)、敏感度(95.2%)和特異度(84.2%)最佳。此研究應用常規臨床參數,通過ML方法實現LC和非LC患者的區分,證實基于血清肽構建分類器是預測HBV相關LC的有用工具[23]。對上海中醫藥大學附屬曙光醫院、廈門中醫院568例HBV感染者的研究[24]表明,根據患者年齡、AST、ALT和血小板計數,構建線性判別分析、RF、梯度增強、DT ML模型,可以實現早期、晚期肝纖維化和LC的診斷,顯著提高了肝纖維化的診斷準確率。同時證明引入約登指數可平衡各組間的敏感度,進一步提高肝纖維化診斷模型的實用價值。血清代謝標志物與CHB晚期肝纖維化相關。一項基于HBV相關肝纖維化患者和正常對照者代謝組學的研究[25],使用4種代謝標志物(?;悄懰?、酪氨酸、纈氨酸、亞麻酸)構建RF ML模型,以區分慢性肝病患者和正常對照組、LC和纖維化患者、晚期纖維化和早期纖維化,其AUC分別為0.997、0.941、0.918。模型的AUC均高于APRI、FIB-4和AST/ALT比值,具有較高的敏感度和特異度[25]。
HCC已成為世界上最常見的癌癥之一,每年有50萬例確診[26-27]。超過80%的HCC發生于LC,主要與慢性HBV感染有關[15]。早期診斷HCC可大大改善預后,有更好的長期生存率和降低復發風險的手術治療[15]。
由于甲胎蛋白的敏感度和特異度較低,而且當腫瘤<2 cm時,成像技術很少能夠診斷HCC。Wang等[15]研究了80例HCC和67例LC患者的血清肽譜,以發現新的非侵入性特異性血清生物標志物。根據SVM分配的權重的平方排序,選擇了9個m/z比(分別為819、1076、1341、2551、3156、3812、4184、4465和4776)構建分類器,結果表明,多層神經網絡算法對HBV相關LC患者HCC的早期診斷的結果最優,獲得了90.0%的敏感度、79.4%的特異度和85.1%的總體準確度。甲胎蛋白的臨界值為20 ng/ml時,敏感度為62.5%,特異度為79.4 %。本研究使用多層神經網絡聯合甲胎蛋白對HBV相關LC患者HCC的早期診斷更有效,敏感度為87.5%,特異度增加到88.2%。臨床上用常規技術很難檢測到HBV相關的早期肝癌。Tao等[28]對384例HBV相關HCC和無癌HBV感染者的血液樣本進行研究,基于循環腫瘤DNA的體細胞拷貝數畸變開發基于血液的非侵入性方法,對早期HCC檢測。當考慮隊列中的所有患者時,RF算法的AUC為0.893。通過發展加權隨機森林驅動(wRF驅動)算法,可以進一步提高肝癌早期檢測的準確性。
慢加急性肝衰竭(ACLF)多見于HCV或HBV相關LC患者[29]。最初由Malinchoc建立的MELD評分常用于判斷重型肝炎的嚴重程度和預后,但在預測乙型肝炎相關肝衰竭方面不夠準確[30]。一些基于器官功能的評分系統可以提高MELD評分的預測精度,但過于復雜。HBV相關ACLF(HBV-ACLF)常伴有多器官功能障礙、急性失代償和高短期病死率的特點[31]。臨床需要更準確、更方便的方法來預測HBV-ACLF的發生。
對1047例HBV-ACLF患者的研究[30]表明,基于多元logistic回歸分析結果,建立了LR模型,將年齡、TBil、血清鈉和血漿凝血酶原時間作為3個月病死率的獨立預后因子,其預測準確度為89.4%。除LRM外,在分類回歸樹分析中,對單變量邏輯回歸分析中的10個顯著變量進行評估,確定4個潛在變量(TBil、年齡、血清鈉和國際標準化比值)是HBV-ACLF患者總生存率的顯著預測因子。分類回歸模型和LRM具有良好的預測準確性,AUC分別為0.896和0.914,明顯高于MELD評分(AUC為0.667)。Bagging算法的分集策略簡單有效,可以減少方差,避免過擬合[32]。對131例HBV-ACLF患者隨訪3個月,采用Bagging算法建立生存狀態分類模型,分析HBV-ACLF短期死亡的影響因素,研究結果證實,年齡、凝血酶原活動度、血漿凝血酶原時間、白蛋白、血尿素、血鈉、血小板、甘油三酯、血漿纖維蛋白原和中性粒細胞百分比是影響HBV-ACLF短期死亡的十大重要指標。此外,Bagging算法模型預測HBV-ACLF的3個月病死率明顯強于MELD評分,AUC分別為0.974 3、0.698 5[32]。
ML能夠準確預測人們感興趣的結果,然而系統如何產生特定輸出方面不一定完全被理解,因此被稱為“黑盒”[33-34];ML的臨床應用還存在著可信度、可解釋性、可用性等障礙。許多關于ML的前沿研究,雖然在理論上很有效果,但還沒有發展到日常臨床應用[4,33]。ML廣泛應用之前,可信度特別重要。按照組合、來源、代表性和完整性來描述數據集,優先考慮ML系統的再現性、穩健性,以及增加對ML系統輸出可信度的評估可提高ML的可信賴度[33]。
毫無疑問,ML以其智能化的分析模式在分析數據方面具有優勢。ML已經在現實世界中得到了應用,在疾病的預測、疾病的輔助診斷、疾病的預后評估、新藥研發、健康管理、醫學圖像識別等方面取得不少成果[6,35]。如果能夠實現多中心、大樣本(>500例)的數據訓練,可以建立更高精度的預測模型[32]。ML領域與乙型肝炎相關肝病有機結合,對肝病患者進行早期準確的診斷與預測,有助于CHB的臨床決策支持,并通過改進患者分層直接制訂治療策略;采用多種算法也可以讓預測的結果更加精準。
利益沖突聲明:所有作者均聲明不存在利益沖突。
作者貢獻聲明:芮法娟負責文獻檢索,資料分析,撰寫論文;薛旗、劉翠紅、郭朝陽、楊紅麗、劉傳禮、徐琊蕓參與收集數據,修改論文;任萬華、秦成勇參與論文修改;李婕負責課題設計,擬定寫作思路,指導撰寫文章并最后定稿。