孫文凱 綜述 黃 河 審校
結直腸癌是世界上最常見的惡性腫瘤之一,發病率及死亡率高[1,2]。早期診斷是提高結直腸癌生存率的關鍵。目前,結直腸癌的術前影像學評估方法包括CT、MRI和PET-CT。高分辨率影像圖像能夠反映出病變組織的生物學形態及與周圍組織的關系,但仍依賴于人眼識別這些信息,受限于影像醫師的工作經驗,傳統輔助檢查技術在早期篩查、診斷和療效評估方面并不令人滿意。區別于傳統醫學影像技術從解剖層面來提取信息,影像組學(Radiomics)是從傳統影像中定量提取病灶的異質性信息并進行間接分析的新型影像學方法,能夠獲取的信息更多。這一技術已在其他領域取得長足發展。Dong等[3]使用基于T2加權脂肪抑制(T2-FS)和彌散加權成像(diffusion weighted image, DWI)的放射線學技術來預測乳腺癌患者的前哨淋巴結(SLN)轉移, 通過聯合T2-FS和DWI,構建出的具有十個特征的模型在訓練集中得出的受試者工作特性曲線(receiver operating characteristic curve, ROC)曲線下面積(area under curve, AUC)為0.863,在驗證集中得出的AUC為0.805。在已廣泛應用CT影像的肺癌診斷方面,Wang等[4]通過使用支持向量機,對150個特征影像組學特征分析,發現大量定量放射學特征具有診斷能力,肺腫瘤惡性預測的準確性在訓練組中為86%,在測試組中為76.1%。目前,在結直腸癌領域內應用影像組學技術的研究也廣泛存在,但不同于乳腺癌、肺癌等實質臟器腫瘤,結直腸癌屬于空腔臟器腫瘤,其影像診斷易受到臟器內容物和臟器充盈狀態的干擾,影像組學的研究亦受到一定程度的影響,準確度和可重復性面臨較多的挑戰。本文對影像組學技術及其在結直腸癌診療中的應用進展進行綜述。
影像組學最早于2012年由荷蘭學者Lambin等正式提出,最初翻譯為放射組學。主要是借助計算機軟件,高通量地從CT、MRI及PET影像中提取大量高維的定量影像特征。使用統計學和(或)機器學習的方法,篩選出最有價值的影像學特征,利用這些特征集來構建模型,從而協助臨床疾病的診治。研究內容包括疾病的精準評估、腫瘤良惡性鑒別、臨床療效評估及預后預測。目前,各位學者所使用的研究方法尚無標準化的流程,但美國國家癌癥研究所已明確了影像組學組成的基本框架,包括圖像的采集和重建、圖像分割及重組、圖像特征的提取和量化、數據庫的建立及共享、個體數據的解析等五個方面。
1.1圖像的采集和分割 影像數據的采集是影像組學有效開展的重要一步。臨床醫師根據所研究的內容選擇合適的影像資料,使得所選取的薄層數據更好地反映腫瘤的異質性。CT是結直腸癌診斷中最常用的影像資料,具有空間分辨率高的影像特點,常用來評估腫瘤及周圍淋巴結的形狀、質地及組織密度。MRI檢查在盆腔軟組織成像中表現突出,可提供高對比度的功能信息和結構信息,其中DWI和動態對比增強磁共振成像(DCE-MRI)能夠反映軟組織細胞結構及微血管生成情況。對于晚期結直腸癌患者,常通過PET-CT檢查來獲取腫瘤的檢測和分期,通過對PET-CT的研究可獲得組織密度及組織代謝相關信息。
獲取高質量的影像資料后,放置影像感興趣區域(region of interest,ROI),進行圖像分割。通常對整個原發腫瘤的區域進行分析,也可以依據研究內容的不同選擇轉移病灶區域和(或)正常區域。分割法有手動、半自動、自動三種,通常由于原始數據的龐大,多采用多種方式分割(multi-segmentation),可消除分割不穩定性[5]。在人工智能的快速發展背景下,目前常用的自動的、快速的、可重復的、準確的醫學分割算法有:圖像切割法、基于容積CT 的分割法(volumetric CT based segmentation)、區域增長法(region-growing methods)、動態輪廓算法(active contours algorithms) 及半自動分割法(semiautomatic segmentations)、水平設置法等。
1.2 影像特征的提取與選擇 圖像分割完成后即可進行ROI的特征提取。能夠獲得可識別的、有意義的、可重復的特征,對于下一步建模十分重要[6]。所能提取的特征分為:形狀特征,一階直方圖特征,二階直方圖。形狀特征主要指可定性描述的參數,包括形態、大小、密度、血管生成、邊緣等。其余特征又叫紋理特征,用來定量描述病變異質性,需借助計算機軟件使用統計學方法進行提取和選擇。一階直方圖特征是與ROI內的體素強度分布相關的參數,包括均數、中位數、標準差、最大強度、最小強度、峰度和偏度等,缺點是不包含空間位置信息。二階直方圖特征描述了體素空間分布強度等級,包括灰度級長矩陣(gray level run-length matrix,GLRLM)、灰度共生矩陣(gray level co-occurrence matrix,GLCM)、鄰域灰度差分矩陣(neighborhood gray-tone differencematrix,NGTDM)和灰度級帶矩陣(gray level size zone matrix,GLSZM)。其中,灰度級指的是圖像紋理在強度水平可測量或可感知的空間變化,是一種視覺感知的圖像局部特征的綜合[7]。另外還有一些獲取于特定圖像的特征(如PET中的SUV度量),以及僅適用于多模式數據集的融合和分形特征。特征選擇的方法有:過濾式(χ2檢驗、相關系數)、包裹式(遞歸特征消除)、嵌入式(lasso回歸)等。考慮到所構建模型的全局性,特征的選擇常與患者的其他信息共同納入到組學分析研究中,因此我們可獲得的特征維度會遠大于樣本量,但這通常導致結果出現過擬合,因此需要降低維度。解決的辦法主要根據所研究內容的不同,將影像組學特征與患者信息同時降維或者單獨分析。另外,可根據特征與終點事件的相關性,消除高度相關的特征。
1.3 模型的建立與評價 建立預測/分類模型常用方法有邏輯回歸分析(logistic regression)、支持向量機(support vector machine,SVM)、自舉法(bootstrap approach)、分形分析(fractal analysis)、反向傳播法(back-propagation algorithm)、空間頻率算法(spatial-frequency measurements)、隨機森林算法(random-forest method)、自動識別算法(auto-detection algorithms)等[8,9]。不同的建模方式,有著不同的優缺點,一個優良的影像組學研究,通常需要嘗試不同的建模方法,使得模型更有效,并具有可重復性。另外,為了提高所建立模型的可信度,一般進行內部、外部驗證來評價模型效能,其中外部驗證更具有獨立性,可信度更高。用于評判模型效能的量化指標常用的有受試者工作特性曲線(receiver operating characteristic curve, ROC)、ROC 曲線下面積(area under curve, AUC)、特異性(specificity)、敏感性(sensitivity)、準確率(accuracy)、一致性指數(concordance index, C-index)等,直觀的圖像描述方法主要有綜合 Brier 評分曲線(integrated brier scores curve)、諾模圖(nomogram)和校準曲線(calibration curve)等。最后,通過多學科合作,整合影像特征數據和臨床資料,建立龐大的數據庫,以便數據的分析和共享。同時,為臨床制定個體化、精準化的治療方案提供幫助。
中國臨床腫瘤學會(CSCO)結直腸腫瘤指南(2019版)中推薦腹部/盆腔增強CT作為結腸癌診斷的常規檢查項目,盆腔平掃及增強CT作為直腸癌診斷的常規檢查。隨著影像組學的不斷發展和精準醫療理念的提出,越來越多的學者投身于結直腸癌的影像組學研究中。目前,大部分國內外學者在結直腸癌的影像組學研究中的研究方向主要集中在基因預測、腫瘤分級分期、新輔助放化療療效評估與預測等方面。
2.1 結直腸癌基因突變的預測 2016年,美國國家綜合癌癥網絡(National Comprehensive Cancer Network,NCCN)建議,對所有疑似或確診轉移性結直腸癌患者均應行KRAS/NRAS/BRAF突變檢測。這三種基因中任何一個的突變預示著患者對于西妥昔、帕尼單抗等抗表皮生長因子抗體(epidermal growth factor receptor, EGFR)靶向治療藥物產生耐藥。組織病理學是檢測基因狀態的金標準,然而,這種方法是有創的,并且所得到的組織樣本可能會受到腫瘤內異質性的影響,尤其是對于非手術治療患者,亟需無創的基因預測方法。2018年,一項多中心臨床研究在盆腹腔增強CT影像的紋理特征中經特征加權算法和支持向量機方法篩選的影像組學標簽可用于預測CRC KRAS/NRAS/BRAF 基因突變,其敏感度及特異度分別為0.754和0.833[10]。王國蓉[11]使用TexRAD軟件進行CT紋理分析,篩選出6個紋理特征構建出的SVM模型用于預測結直腸癌KRAS基因突變,在驗證集中準確度、敏感性及特異性分別為90.2%,84%和100%。這些研究表明,影像組學技術為需要分子靶向治療的結直腸癌患者提供了一種無創的基因預測方法,尤其是對于一些年老體弱及重癥患者來說,影像組學有著明顯的優勢,預示著CT影像組學在評價結直腸癌在基因突變層面具有較廣闊的應用前景。
2.2 紋理分析與腫瘤分級分期評估 結直腸癌的預后預測,主要依靠腫瘤組織學分級和TNM分期。患者治療早期能夠獲得精準的TNM分期診斷對于治療方案的選擇具有重要的參考價值,已有研究表明,基于CT影像的紋理分析可作為一種無創性輔助工具來進行術前評估組織學分級(WHO第四版)[12]。Liang等[13]構建 Logistic回歸模型,將結直腸癌患者成功分類為Ⅰ~Ⅱ期和Ⅲ~Ⅳ期(P<0.0001),并且驗證集中AUC為0.708,靈敏度為0.611,特異性為0.680。
在評估腫瘤分期方面,Liu等[14]研究表明基于表觀彌散系數 (apparent diffusion coefficient, ADC)圖的紋理分析可作為直腸癌局部浸潤深度(階段pT1-2對pT3-4)的預測指標。同時,該研究指出,偏度和熵被確定為腫瘤壁外浸潤的獨立預測因子(pT3-4期)。影像組學技術中,偏度反映在ROI內體素強度的不對稱性,熵反映了體素的空間分布強度。更高的偏度和熵代表著圖像紋理的復雜性,可反映出病變部位的異質性,因此可用來預測腫瘤局部浸潤深度。
在診斷淋巴結轉移方面,常規影像學依靠淋巴結形態的良惡性診斷往往與病理組織學診斷存在較大出入,借助影像組學技術進行淋巴結轉移預測是近年來的研究熱點。2016年,Huang等[15]通過使用回歸模型(least absolute shrinkage and selection operator,LASSSO)方法縮小回歸系數進行紋理特征篩選,采用多變量logistic分析建立了放射線圖諾模圖,結果證明該模型可以用于促進結直腸癌患者術前淋巴結轉移的個體化預測。Liu等[14]基于ADC圖的紋理分析研究表明熵可作為淋巴結轉移的獨立預測因子。因此,借助影像圖像的高維度紋理分析可以用于預測結直腸癌的淋巴結轉移情況。
結直腸癌患者常常同步發生肝臟轉移。2006年,一項大腸癌的流行病學研究表明,隨訪5年累計TNMⅠ期腫瘤肝轉移率為3.7%,Ⅱ期腫瘤為13.3%,Ⅲ期腫瘤為30.4%[16]。黃燕琪[17]使用Lasso-logistic模型行紋理特征的選擇,最終選出了44個參數構成聯合影像生物標志,并進行風險評分,結果發現結直腸癌原發病灶合并肝轉移組患者的風險評分較無肝轉移組患者的風險評分高,差異有統計學意義。不足之處在于仍需要建立多變量模型來確定獨立的預測因子。
以上研究表明,通過篩選獨立的預測因子,構建合適的影像組學模型,可用于結直腸癌術前風險評估,相比于傳統影像學分期分型,更有助于給予患者個體化的手術治療方案,更有信心進行治療方案的調整和預后預測。但是紋理特征的篩選及模型的選擇,仍需更多的多中心研究和大樣本研究支持。
2.3 新輔助放化療效果評估 CSCO結直腸腫瘤指南(2019版)中推薦結直腸癌的治療手段為外科手術治療和新輔助放化療,并強調在治療過程中必須及時評價療效和不良反應。常規增強CT及MRI為評估放化療效果的重要手段。但是,常規影像對于新輔助放化療導致的纖維化和炎性反應的判斷準確率較低,判定一致性差,主觀性強[18]。Ke等[19]基于多參數MRI影像評估直腸癌的新輔助放化療的效果,發現體素異質性分析比傳統影像具有更高的預測價值。Liu等[20]研究表明對DWI及T2加權影像進行紋理分析可用于評估局部晚期直腸癌(local advanced rectal cancer, LARC)患者對新輔助放化療的病理完全反應(pathological complete response,PCR)。2017年,Liu等[21]研究表明,基于治療前ADC映射的紋理分析可能有助于識別對新輔助放化療無反應的LARC。2018年,另一項基于ADC直方圖分析來確定LARC患者對新輔助放化療反應研究,結果顯示對于患有LARC的患者,放化療(CRT)后ADC直方圖的偏度和ADC的變化百分比可用于預測新輔助放化療的療效反應: CRT后偏度和ADC改變百分比分別與組織病理學腫瘤消退等級(TRG)呈負相關和正相關(CRT后偏度P=0.024,ADC改變百分比P=0.001)[22]。
以上研究均證明了影像組學在評估結直腸癌患者的新輔助放化療效果及預測具有重要的應用價值。
2.4 結直腸癌內鏡和病理檢查結果的分析 近年來,部分學者在構建預測模型的同時,使用深度學習技術,推動著醫學領域向著真正實現人工智能方向發展。影像組學輔助深度學習突破了傳統影像組學技術結果的普適性,具有更強的針對性,在精準診療中具有較強的臨床應用價值。但是受限于目前深度學習技術的發展及樣本量的大小,這一技術目前僅應用于內鏡圖片和病理圖片的分類和識別。應用廣泛且模型成熟度較高的深度學習技術主要為卷積神經網絡。
我國臺灣地區的一項研究開發了深度神經網絡(DNN-CAD)用來區分結直腸內鏡圖像中的息肉與腫瘤[23],結果顯示機器組診斷準確率高于人工組(機器組為91.5%,人工組中專家為84.0%,人工組中非專家為73.9%),且時間明顯短于人工組[機器組為(0.45±0.07)s,人工組中專家為(1.54±1.3)s,人工組中非專家為(1.77±1.37)s]。該研究表明,將影像組學技術應用于內鏡圖像,構建深度學習模型,可以降低內鏡診斷專家經驗之間的差別,有望成為內鏡下篩查結直腸癌的重要參考因素。
Xu等[24]使用基于深度卷積激活特征的方法,對良性和惡性的CRC病理圖像進行分類、分割和可視化處理,達到了98%和95%的組織分類準確率。未來希望影像組學輔助深度學習用來構建計算機自動輔助識別系統,能以迅速、標準化的方式處理醫學影像,可幫助病理科醫師提高診斷效率、減輕工作量。
綜上所述,借助影像組學技術,在結直腸癌臨床診斷、新輔助治療療效和預后預測、基因突變預測方面已取得初步研究結果。近年來各地致力于建立相關數據庫,如2019年四川大學華西醫院已建立“大數據集成及應用平臺”,將有力地促進該技術的發展和應用。借助于影像組學在其他系統的研究進展,未來影像組學在結直腸癌的研究方向將被拓寬,可以預見將包括不同時期淋巴結、神經及遠處器官腫瘤轉移的預測,手術治療后并發癥的預測等。