楊浩然,馬密密,曹新山
近年來,隨著標準化掃描協議和人工智能的不斷發展,從圖像中獲取更多定量信息以實現自動化和可重復性分析成為了一種可能,因此影像組學應運而生。影像組學是一個新興的醫工交叉研究領域,其概念最早由荷蘭學者Lambin等[1]于2012年提出,即從醫學圖像中提取高通量特征,采用計算機算法將影像學數據轉化為具有高分辨率的可挖掘數據空間的學科。
原發性肝癌是我國目前第4 位常見惡性腫瘤及第2 位腫瘤致死病因。其中肝細胞癌(hepatocellular carcinoma,HCC)占75%~85%[2]。肝癌在空間和時間上是異質性的,侵入性檢查不能提供全面信息,肝細胞癌的診斷特別是早期診斷在較大程度上依靠無創影像[3-4],新興的影像組學尤其是基于影像組學的肝細胞癌多中心研究逐步開展并取得了較大成績。
本文基于影像組學的肝細胞癌多中心研究最新進展進行綜述。
從計算機輔助診斷系統到影像組學,是一個圖像可轉換量化數據不斷增多,醫學成像數據信息整合程度不斷加深的過程。影像組學的本質是對擁有高通量特征的醫學圖像進行定量化分析[5]。由于惡性腫瘤在空間和時間上的異質性[6],穿刺活檢等有創檢查不能體現腫瘤的預后及預測治療反應等信息。目前臨床上需要精確分層,對常規影像學數據量化分析主要是惡性腫瘤。從圖像中提取影像組學特征,設置算法對數據進行分類,根據數據之間潛在的關系生成復雜的推斷,學習數據中的模式,利用學習的模式進行決策,總結出診斷性實驗模型。這個過程被定義為機器學習[7]。隨著算法的改進,深度學習作為機器學習的分支逐步應用于醫學領域[8]。卷積神經網絡(convolutional neural network,CNN)是深度算法的一種,其結構類似于生物神經系統,可以自動從數據中學習區分特征,模仿人進行決策,推進了組學模型臨床應用的進程[9]。
影像組學是圖像分析,圖像是基礎,標準化高質量影像圖像的獲取與重建是影像組學研究的先決條件[10],絕大多數影像組學研究是在單一醫療科研機構中進行,這固然可以降低因掃描機型及參數不一致等因素造成的圖像所攜帶組學特征信息誤差,卻也降低了研究的可重復性與泛化能力[11]。確定影像組學模型潛在臨床價值,開展大型多中心研究成為熱點,它是實現影像組學方法向臨床環境更快轉移的重要途徑和目標。
多中心研究指由多個單位的研究者合作,按同一個方案同時進行的研究。它的主要優點是具有更大的數據集和從不同樣本中獲得的結果具有更高的統計相關性。然而從幾個中心收集數據是復雜的,無論圖像是本地存儲還是利用分布式學習[12]存儲和分析在一個中央數據庫、掃描器模型、采集協議和重建設置的可變性在目前的臨床實踐中是不可避免的。大多數組學特征已被證明對這些因素的變化敏感[13]。將它們集中起來進行統計分析并建立的模型要么隱藏現有的相關性,要么產生錯誤發現[14]。因此不同成像方案之間不能立即進行比較,需要協調策略對各獨立數據進行整合,這類協調策略簡稱為標準化,它的實現形式可以分為兩個思路,一種旨在消除或減少在組學特征提取之前圖像之間的差異,方法是圖像標準化;另一種旨在消除或減少提取特征和提取特征后特征之間的差異,方法是修改算法或后驗處理。前者對應了圖像域協調策略,包括標準化成像,特定條件下的規范化合并,以及圖像預處理。后者對應了特征域協調策略,可分為根據可靠性選擇組學特征和去除無關因素校正方法。上述協調策略各有其優勢與不足,可根據臨床實踐單獨或聯合應用于影像組學多中心研究。
影像組學在肝細胞癌診斷和與其他肝臟疾病鑒別上顯示出了較大潛力[15]。王禹博等[16]用擴散加權成像建立的影像組學特征模型對肝細胞癌和肝血管瘤進行鑒別。Gu等[17]使用支持向量機建立MRI 組學列線圖模型識別肝細胞癌潛在標志物。上述模型實現臨床應用還需要驗證,但它們提供了一個思路,即通過MRI 影像組學多中心研究訓練一種精準診斷肝細胞癌的無創手段[18]。
術前的病理分級預測是對腫瘤治療方式進行評估選擇的有效手段。許露露等[19]、Hui 等[20]用紋理分析比較術前MRI 紋理與肝細胞癌的相關性,推測肝細胞癌的早期復發。基于影像組學評估肝癌病理特征[21],可指導臨床作出合理的治療選擇。微血管浸潤(microvascular invasion,MVI)是手術切除后復發因素之一,目前只能通過術后病理切片診斷。段亞陽等[22]、Jiang 等[23]使用機器學習和深度學習算法,建立多組結合模型預測MVI 狀態。兩組研究均驗證了瘤周特征對預測MVI 的重要影響,也提及當前MVI 組學研究的局限,為開展多中心研究拓展了思考方向。
借鑒影像組學研究臨床意義,結合多中心研究改進驗證,是開展多中心研究的重要方式。具有潛在臨床應用意義的肝細胞癌術后預測分為兩個方向,一是預測肝癌早期復發和術后生存期。李琳等[24]用支持向量機、隨機森林[25]等機器學習方法對影響患者生存和復發的因素做了分析解釋,Zhang 等[26]、Huang等[27]開發釓塞酸增強MRI組學特征模型,對肝癌術后發展進行預測。另一個是探究經導管肝動脈化療栓塞術(transcatheter arterial chemoembolization,TACE)后肝癌患者預后情況。Sun 等[28]基于術前多參數MRI 提取組學特征,建立影像組學模型提示TACE 治療的預后情況。Song 等[29]建立增強MRI 影像組學-臨床聯合模型(clinical radiomics combination,CRC)預測術后復發情況。
肝細胞癌多發生在肝硬化患者中,影像組學作為無創性肝硬化結節的良惡性鑒別方法,對HCC 的篩查、評估和治療具有重要價值。Mokrane 等[30]選擇來自27 個機構的178 個肝硬化病例,經圖像標準化處理后,對多期肝硬化結節分割提取特征,使用機器學習方法對特征進行篩選,建立模型。訓練后的組學模型經過多折交叉實驗驗證,展現了在多中心環境中的良好效能。該模型能夠適用多中心研究有一個關鍵因素是掃描采集參數雖存在不同,但在分割和門靜脈造影增強方面,在動脈期和門靜脈期之間變化中結節的某一影像組學特征是穩定的。值得注意的是,本研究模型診斷效能主要體現在一個組學特征,該特征區分良惡性病變有較高的準確率,但肝癌與其他惡性腫瘤存在重疊。后續研究可以通過引入非影像組學參數,增加模型維度。
MVI是肝細胞癌手術切除后長期生存和復發的重要指標,因此準確評估MVI在監測HCC預后中意義重大。Zhang等[31]納入了來自兩個獨立機構的637例患者。使用Z-scores方法對測試集和獨立驗證集的特征根據訓練隊列的均值和標準差進行歸一化,以消除特征之間價值尺度不一帶來的差異。在多中心試驗中,試驗者為了使用來自不同獨立機構的數據,使用了歸一化方法。對每個數據集的特征分別規格化,這樣做消除了數據集之間的特征變異性,構造的影像組學特征不會過度擬合。并用多變量Logistic回歸開發了預測MVI狀態和風險的兩個影像組學模型,得出灰度行距矩陣-長行程高灰度強調度是預測MVI 的一個重要的跨模影像組學特征。該研究使用二維ROI 提取特征,缺少三維分段的相關信息,另外沒有對HCC 的形態學特征進行評估。在未來的研究中應嘗試比較二維和三維成像數據的MVI評價模型的預測性能。
術后復查是HCC 切除術后的患者主要死因,預后分級是個體化治療的關鍵,然而目前尚無公認的HCC 風險分層方法。據Ji 等[32]了解的信息,其團隊研究是第一個使用影像組學預測早期HCC手術切除后復發的多機構研究,他們從3個獨立機構收集了470 例患者提取的3384 個工程特征,使用聚合的機器學習框架確定了一個有3 個特征的影像組學模型。與不使用影像組學的競爭模型和廣泛使用的分期系統相比,該模型結合臨床來源后準確地預測了術前或術后HCC 的復發,并可給出復發風險低、中、高的3 個風險層次,顯示了其優越的預測性能。Wang 等[33]將201 例肝癌患者納入多中心研究,從術前MRI 中提取組學特征。采用隨機森林方法構筑組學特征模型,開發了一個結合組學特征和臨床危險因素的影像組學模型。以上研究都強調了影像組學和現有變量的互補性,證明了使用多中心試驗建立影像組學模型對肝細胞癌預后預測是可行的。外科醫生可據風險高低進而選擇肝部分切除術或肝動脈化療栓塞。Meng 等[34]的回顧性研究納入了接受TACE 作為初始治療的162例不可切除的初治HCC患者的多中心數據,從動脈期和門脈期的圖像的瘤內和瘤周區域提取影像組學特征。使用最小絕對收縮和選擇算子方法(least absolute shrinkage and selection operator,LASSO)對組學特征降維,并在訓練隊列中進行特征歸一化,使用單因素多因素回歸分析確定組學特征和臨床生存因素之間的聯系,開發了CRC模型。經過一致性指數分析,驗證了影像組學特征可以作為預測接受TACE 的HCC 患者預后情況的獨立生物學指標,結合臨床模型后預測效果表現更好。Jin 等[35]針對TACE 術后肝外播散和血管侵犯的預測,引入了3 個機構256 例接受TACE 作為首選治療的患者,提取組學特征后,對所有圖像重采樣標準化體素間距,使用固定bin 值離散化,以歸一化體素強度。該研究同樣建立了CRC 模型。根據決策曲線分析,該影像組學研究可以作為臨床判斷術后風險的工具提供可靠預測。值得一提的是,上述研究均未探討深度學習方法,深度學習可以根據臨床目標自動學習圖像中的特征表示。應當在以后的研究中引入深度學習,提高多中心影像組學模型診斷效能。
最新的肝癌影像組學中多中心研究已經涉及早期診斷和鑒別診斷、評估MVI、術后預測等方面。已經囊括了影像組學研究的幾個主要方向,還具有多中心樣本建模的高魯棒性和外部驗證的強可重復性等優勢。筆者總結影像組學現有應用,思考開展多中心研究的實用性和可行性。基于MRI 的肝癌影像組學多中心研究還較少,這可能受限于MRI 在肝癌診斷中的應用少于多期增強CT檢查和不同機構MRI序列參數的不統一。本研究列舉了部分多中心研究的協調策略,諸如標準化成像、圖像規范化合并、Z-score 特征選擇等。在機器學習的訓練過程中,圖像預處理也是一種常見標準化方法,在相同尺度的特征下,機器學習具有更好的表現。經多中心訓練組內外部驗證,這些方法表現出消除不同數據集之間特征變異性的優勢。建立的多中心組學模型,與臨床因素結合后對預測效果的提升,可以看到選擇協調策略在多中心研究的潛在作用。這就為影像組學結合臨床提供了良好的條件。
開展大型多中心研究是加快影像組學方法在臨床應用的關鍵。然而,現有肝癌影像組學多中心的研究確存在一定局限性。在數據層面,部分研究存在選擇偏倚,影響整合數據的可信度。在工程層面,復雜的算法涉及工學領域,臨床醫生等獨立研究人員無法對模型校準和改進。由此可見,影像組學擴展到臨床仍有許多問題亟待解決,需要放射科醫生與多學科研究人員密切配合。未來,隨著成像標準化協議的普及,以及機器學習、多中心數據融合技術的發展,擁有高效、無創等優勢的影像組學方法將有望優化肝癌醫療決策,造福患者。
作者利益沖突聲明:全體作者均聲明無利益沖突。