袁恩雨, 宋彬
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的原發性肝腫瘤,其在全球的發病率不斷上升[1]。影像學檢查是HCC無創檢查的重要手段,由于其能提供對病灶結構和功能多參數、多維度、多模態的評估信息,因此在HCC的檢出、鑒別診斷、生物學行為預測、療效預測和預后評估等方面發揮重要作用。定性、半定量分析主要使用傳統影像征象,具有直觀、易評估的特點,而也存在觀察者間主觀差異、圖像信息利用較少的缺點。影像組學是定量分析的代表方法,通過計算感興趣區(region of interest,ROI)的高通量直方圖、形態及紋理特征,將圖像矩陣數據轉化為定量數據,更加客觀地描述ROI的影像特征,成為醫學影像領域研究的熱點。近年來,不斷有研究探索影像組學在HCC診療中的應用價值,拓展了影像學在HCC臨床實踐中的指導價值。本文主要對影像組學在HCC診斷、治療及預后評估中的研究進展進行綜述。
“影像組學”的概念在2010年由Gillies等[2]首次提出,Lambin等[3]對其概念進行了完善,并提出了影像組學研究的基本步驟,包括圖像獲取、病灶標注、特征提取與篩選、特征分析。影像組學的基本假設是基因組學和蛋白質組學等的信息可以傳遞到宏觀圖像中,通過對醫學圖像數據的定量分析,可以推斷表型、基因-蛋白生物標志物甚至預后信息。
圖像獲取指根據研究目的收集用于提取影像組學特征的圖像。在HCC相關的研究中,圖像數據多為單中心的回顧性CT或MRI數據。先前研究表明,影像組學特征對圖像采集和重建參數變化十分敏感[4,5],不同機型和不同參數采集的圖像的影像組學特征存在較大差異。因此需要在特征提取前對圖像進行預處理(如重采樣、像素歸一化)或特征提取后對特征進行預處理(特征歸一化)來減小不同來源圖像的影響。同時在特征分析時,有條件時應以不同來源的圖像分為亞組,驗證結果在不同亞組中的推廣性。
病灶標注指通過標注軟件或標注算法生成ROI的掩膜。在特征提取時,算法僅考慮掩膜內的像素值,從而計算得到ROI的影像組學特征。從標注方法上,手動標注最為簡單易行,但受到標注者主觀影響,因此不同標注者間或同一標注者的多次標注間都存在差異。目前的研究中主要通過計算多次標注ROI間的空間重合程度(如Dice相似系數、Jaccard相似系數)或多次標注ROI提取的多套影像組學特征間的一致性(如組內相關系數)來評價手動分割的重復性和穩定性[6]。另一種方法為半自動或自動標注,是指通過閾值分割、區域生長、深度卷積神經網絡等方法,實現端對端的標注,不需要或僅需要少量的人工校正。相對于人工標注,這類標注方法更快、更穩定,也因此越來越受到研究人員的關注[7,8]。
特征提取是指按照預先定義的計算機算法從圖像ROI中自動提取出大量的定量化影像特征。目前研究中使用的影像組學特征多為標準特征[9],主要分為:①直方圖特征,反映ROI像素值的分布特點;②形態特征,反映ROI的幾何形態特征;③紋理特征,同時考慮像素值和像素的空間分布,反映ROI對應的各種紋理矩陣的特征(如灰階共生矩陣特征、灰階游程矩陣特征等)。此外,在特征提取前,還可以使用各種濾波函數對圖像進行變換,增強圖像的某種特性。如高斯-拉普拉斯變換可以增強物體的邊緣信息[10],平方根變換使像素間的差異變小。由于濾波函數的應用,病例的影像組學特征向量的維度往往非常高。特征篩選是從高維影像組學特征中篩選出穩定、高區分度的特征,常用方法包括最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型、主成分分析等。
特征分析在目前研究中主要分為有監督學習的分類模型構建和無監督學習的聚類分析。在有監督學習中,特征與結局事件同時輸入分類模型,用于擬合特征與結局事件間的關系,最終評估分類模型的區分度、校準度和臨床實用性等性能[11,12]。在無監督學習中,算法通過特征值的相似性將樣本分為多個簇,通過比較簇間結局事件的發生情況及影像組學特征的表達情況,最終間接分析影像組學特征與結局間的關系。
1.HCC的診斷與鑒別診斷
肝臟局灶性病變的診斷主要依靠影像檢查。一些肝臟良性病變如血管瘤、囊腫等往往只需要隨訪,而惡性病變則需要積極的臨床干預,并且HCC與非HCC惡性病變的診療策略也不同。盡管多數病變在影像上有較為典型的表現,但部分不典型的良、惡性病變仍易與HCC混淆,加大診斷的難度。
影像組學在HCC與其他肝臟良惡性病變的鑒別診斷中有重要價值。Zhao等[13]基于平掃CT圖像上病灶區域的信息建立影像組學預測模型,用于診斷6種肝局灶性病變,包括肝血管瘤、肝囊腫、肝腺瘤、肝臟局灶性結節增生(focal nodular hyperplasia,FNH)、HCC和肝轉移癌。他們發現對于6種病變的診斷,影像組學模型的受試者操作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)均可達0.89以上,并且在鑒別良性病變與惡性病變的任務中AUC值也很高(0.899)。利用平掃影像組學模型,能有效鑒別診斷常見肝局灶性病變,從而幫助克服因對比劑過敏而產生的不良反應。
多項研究表明基于CT或MRI的影像組學模型能很好地鑒別診斷肝硬化背景下的HCC。Ding等[14]探究了增強MRI影像組學特征對鑒別診斷肝硬化背景下的HCC與FNH的效能,發現通過臨床危險因素建立的臨床預測模型在融合了影像組學特征后,診斷效能明顯提高。類似的,Nie等[15]基于增強CT圖像建立影像組學預測模型,能有效區分肝硬化背景下的HCC與FNH,并且影像組學標志物能顯著提高臨床模型的預測準確性。
影像組學模型也能夠很好地區分HCC與非HCC的惡性病變。Wang等[16]使用MRI影像組學模型鑒別診斷HCC、肝內膽管細胞癌與混合型肝細胞癌-膽管細胞癌,發現基于延遲期特征的模型在區分病變上有更好的AUC值(0.91),且使用高階影像組學特征的模型相對于僅使用低階特征的模型能提高約10%的診斷效能。Huang等[17]也發現基于T2*WI序列的影像組學特征能很好地區分HCC與肝內膽管細胞癌。
2.HCC病理特征的術前預測
HCC的多種病理特征與其預后緊密相關,是HCC風險分層的重要參考標準,而準確的風險分層是合理制定治療方案的關鍵。由于HCC的診斷不依賴于組織病理檢查,因此在術前往往難以獲得病灶的病理信息。影像組學提供了一種無創、安全、可重復的檢測方法,并且已經在多項研究中展現出對HCC病理特征的術前精準預測能力。
影像組學可用于術前識別HCC的特殊組織學亞型。在Feng等[18]的研究中,使用術前增強CT圖像建立的影像組學模型能夠在內、外部驗證集中較好地預測粗梁-團塊型肝細胞癌亞型。通過分析批量和單細胞RNA測序數據,作者發現該影像組學標志物與B細胞浸潤的體液免疫功能失調相關。Wu等[19]分別使用增強MRI動脈期、靜脈期影像組學特征以及他們的組合構建雙表型HCC的預測模型,結果表明基于靜脈期特征的模型(AUC=0.879)與動、靜脈期混合模型(AUC=0.908)的區分度顯著優于臨床預測模型(AUC=0.658)。
影像組學還可以用于預測HCC的組織病理學特征。Mao等[20]分析了297例HCC患者增強CT動脈期和靜脈期病灶的影像組學特征,發現結合了臨床特征、動脈期特征和靜脈期特征的預測模型在預測Edmondson-Steiner分級上有最高的診斷效能(AUC=0.8014),且動脈期特征的預測效能優于靜脈期特征。Meng等[21,22]發現無論CT或MRI,影像組學特征在預測HCC微血管侵犯上沒有顯著差別,并且基于臨床特征、影像特征和影像組學特征建立的預測模型,在內、外部驗證中能很好地預測微血管侵犯(AUC=0.835~0.864)。Yu等[23]探究了增強MRI圖像上HCC腫瘤內部和腫瘤周圍影像組學特征對于預測腫瘤包繞型血管的價值,結果發現瘤周1 mm區域的影像組學特征較瘤內特征有更好的預測效能,且該模型的預測結果是早期復發和無進展生存的獨立預測因子。
影像組學還可以對免疫組化標記物進行預測,實現術前分子分型,幫助更好地理解腫瘤生物學行為和優化治療方案。Wu等[24]分析了172例HCC患者的術前增強CT圖像,發現結合血清甲胎蛋白水平、Edmondson-Steiner分級和影像組學標志物的模型能很好地預測腫瘤Ki-67的表達水平。Wang等[25]基于臨床危險因素和增強MRI影像組學特征建立不同的模型預測HCC腫瘤CK-19表達情況,發現聯合動脈期和肝膽期的MRI影像組學模型預測效能優于任何單一序列模型及單純臨床模型,而同時聯合臨床危險因素能提高MRI影像組學模型的預測效能。Gu等[26]基于腫瘤延遲期MRI圖像和臨床危險因素構建影像組學模型,其預測HCC腫瘤GPC-3表達情況的AUC為0.914。
3.HCC的療效預測和預后評估
影像組學的模型預測結果還可以整合到診療方式的選擇中。Chen等[27]分析了術前平掃和動脈期CT圖像中病灶及病灶周圍區域的影像組學特征,發現腫瘤+瘤周10 mm影像組學模型對預測中期HCC患者初次肝動脈灌注化療栓塞術(transcatheter arterial chemoembolization,TACE)后的客觀緩解準確性最高,并且結合臨床、傳統影像危險因素后,該模型能進一步提高診斷準確性,在內、外部驗證集中AUC分別達到0.94和0.90。該研究結果有助于術前選擇出可能從TACE治療中獲益的患者。Jin等[28]通過分析三中心TACE患者隊列,發現基于術前增強CT圖像的影像組學模型有助于預測初次TACE后肝外播散和血管侵犯,從而幫助發現不適合TACE治療的初治患者。
早期HCC的首選治療方法是手術切除,然而術后復發仍舊是造成不良預后的重要因素,因此高復發風險的患者可能需要額外的輔助治療[29,30]。Li等[31]分析了行手術切除治療的329例HCC患者的隨訪數據,發現基于增強CT圖像的影像組學模型可以對患者的復發風險進行分層,模型預測高風險組與低風險組的復發概率差異有統計學意義。結合影像組學預測風險和術后病理腫瘤微血管侵犯情況建立的預測模型,可以進一步提高對早期復發與晚期復發的預測準確性(C-index=0.727)。Gao等[32]使用增強MRI圖像和患者早期復發情況(≤2年)訓練深度卷積神經網絡,并將網絡的全連接層輸出作為深度學習特征,與影像組學特征結合,建立融合預測模型。該模型在預測HCC早期復發的任務中AUC能達到0.840,優于單用影像組學模型(AUC=0.780)和單用深度學習模型(AUC=0.813)。
盡管影像組學在HCC診斷、治療與預后方面突顯出重要價值,但其臨床應用仍存在諸多問題。
一方面,目前的影像組學研究多關注模型的性能好壞,而忽視了對研究設計及結果分析的質量控制,導致大多數已發表的研究可能存在系統誤差,或未提供足夠的信息供讀者評價其研究的發現[33-36]。例如,目前的研究中特征提取的參數設置缺乏詳細報道,導致他人無法復現特征提取過程[37];研究多采用隨機拆分驗證,且同時缺乏樣本量計算,因此難以保證模型驗證的可靠性。系統誤差可能導致模型的性能膨脹,即虛假性的高性能。
另一方面,目前的研究缺乏對影像組學特征和影像組學模型的生物學可解釋性分析。盡管已有部分研究使用了如夏普利值等算法分析輸入影像組學特征與輸出間的數學可解釋性[38],而影像組學特征與傳統肉眼影像征象、組織病理特征與分子基因表達等的生物學可解釋性仍較差[39]。缺乏潛在的生物學可解釋性,“組學”這類黑盒模型難以廣泛應用。
其次,以犧牲生物學可解釋性換取的性能提升,缺乏多中心或前瞻性的外部驗證,難以保證模型的泛化性。在應用了濾波函數后,影像組學特征的維度可達上千,屬于高維數據。一項模擬研究表明,即使是隨機生成的影像組學特征也可以產生“重要”的預后價值[34]。因此,高維度的影像組學數據極有可能產生與結局事件的虛假相關性。多中心空間外部驗證或前瞻性時間外部驗證能夠很好地評估模型在真實環境中使用時的性能,而目前多數研究缺乏這樣的可靠性和魯棒性的驗證。
最后,隨著近年來算法的進步,以卷積神經網絡系列模型和Transformer系列模型為代表的深度學習算法在上述臨床應用中表現出相似甚至更好的性能。如Xu等[40]使用基于Swin-Transformer的深度學習模型評估肝臟病灶的肝臟成像報告和數據系統(liver imaging reporting and data system,LI-RADS)評分以及判斷病灶是否為HCC。該模型在內部驗證和外部驗證中的LI-RADS評分和HCC診斷任務中都表現出較好的性能。Gao和Wang的團隊發現預測肝癌早期復發的問題中,使用多層卷積神經網絡的深度學習方法的性能顯著優于影像組學方法,同時通過結合深度學習模型的全連接層特征和影像組學特征建立的混合模型,表現出比兩者單獨使用更好的預測性能[41]。此外,深度學習不受建模任務的限制,可以應用于病灶檢測、病灶分割和病灶配準等影像組學無法完成的任務中[42-44],也可以利用海量無標注數據進行自監督表征學習,提高下游監督學習任務的性能[45]。因此,影像組學如何與深度學習有機結合,更好為臨床個體化服務,是需要思考的問題。
在HCC的診斷、鑒別診斷、病理特征預測、療效預測及預后評估中,加入了影像組學特征的預測模型可以獲得更好的預測性能,但現有研究的局限性限制了影像組學在臨床實踐中的廣泛應用。為了推進其臨床應用,后續研究需要注意研究設計及統計分析的質量控制,提高影像組學特征和模型的生物學可解釋性,并探索成熟的影像組學模型在真實臨床診療中的價值。多中心、前瞻性的臨床驗證是最終應用前的關鍵步驟。