陳帥, 李響
胃癌(Gastric cancer,GC)是世界發病率第5位與死亡率第4位的惡性腫瘤;在我國,其新發病例居于第3位,死亡率居于第3位[1]。CT檢查是GC治療前首選的非侵入性影像學檢查[2],可輔助分析胃癌病灶特點、周圍浸潤狀態、淋巴結轉移及遠處轉移情況。腫瘤精準分期對治療方案選擇、病情進展及預后判斷具有重要的指導意義。國際抗癌聯盟及美國癌癥聯合會(UICC/AJCC)于2016年更新第八版TNM分期,將單一的TNM分期細分為病理分期(pTNM)、臨床分期(cTNM)和新輔助化療后分期(ypTNM),規定了CT在胃癌臨床分期中的操作流程和規范。新版的臨床T分期沿用病理分期的浸潤深度標準,但未描述各分期對應的影像標準;規定以短徑>10 mm作為淋巴結轉移的標準,卻對5 mm以下淋巴結轉移情況難以精準判斷,有報道約有55%的轉移淋巴結直徑小于5 mm[3],因此CT檢查在GC臨床分期中尚存諸多問題。隨著影像技術的進步以及對GC影像特征的深入發掘,GC臨床分期的評估已不斷完善。
人工智能(artificial intelligence,AI)同樣為GC臨床分期提供了新的研究方法。在醫療影像的背景下,人工智能是通過理解、分析醫學影像數據并得出類似人的認知[4]。機器學習(machine learning,ML)是人工智能的一個重要子領域并廣泛應用于醫學影像研究中。影像組學和深度學習(deep learning,DL)是ML在醫學影像研究中最常用的兩種方法,在乳腺[5]、前列腺[6]等多個領域有所應用。影像組學和DL能把醫學圖像轉化為定量的、客觀的可挖掘數據,并應用于疾病的診斷、腫瘤分級分期、分子分型、療效評估及預后等多方向的預測,輔助臨床診療[4,7]。
精準分期是個性化診療的基礎。本文從MSCT在胃癌臨床分期的研究著手,介紹影像特征評估和ML預測模型的研究現狀,并對當前的局限性和未來的發展進行總結,以期為臨床研究和診療提供更好的幫助。
ML是一種數據科學方法,它能夠像人類一樣完成預測分類,并根據以往的經驗數據做出學習和改進[8]。根據學習方式的不同,通常分為監督學習、無監督學習及強化學習,目前影像組學和DL中多使用監督學習。監督學習是給定輸入數據特征的情況下預測標簽,每個“特征-標簽”的對應稱為一個樣本,通過對每個樣本的學習完成將輸入特征到標簽的預測。在醫學領域中,特征就是每個患者或樣本的相關醫療數據,標簽則是疾病的診斷、腫瘤分級分期、分子分型預測、療效評估及預后預測等具體的研究內容,研究目標是通過ML建立一個模型,將醫療數據特征映射到標簽,即疾病的相關預測。
影像組學是從醫療影像提取人眼無法識別的信息并轉換為定量特征,對醫學影像特征、臨床資料和基因信息等進行相關性分析,建立疾病預測模型[7]。影像組學流程分為5個階段:圖像的采集與獲取、感興趣區域的勾畫、特征提取、數據探索性分析和模型建立。ML在后四個階段都有涉及并主要應用于數據探索性分析及模型建立。DL是ML的一種算法,它受人腦神經網絡的啟發,使用多層結構從輸入數據中提取更高級的特征,并能自動從數據中學習特征,完成復雜分類任務。DL中以卷積神經網絡(convolutional neural network,CNN)在醫學影像領域的應用較為廣泛,其基本結構由輸入層、卷積層、池化層、全連接層及輸出層組成,現代卷積神經網絡都是以CNN為基礎建立的[9]。近年來,已有研究將深度學習特征與影像組學進行融合并完成醫療預測的研究。
ML的前提是數據,無論是影像組學還是深度學習,都需要充足的數據才能保證模型的魯棒性和泛化能力。
1.影像特征評估胃癌T分期
GC準確分期是精準治療的前提和關鍵。胃壁是由黏膜、黏膜肌層、黏膜下層、固有肌層和漿膜層構成,但在增強CT上僅能顯示2-3層結構[10]。GC通常表現為胃壁局灶性增厚、伴或不伴潰瘍、息肉樣腫塊或彌漫性病變,印戒細胞癌通常表現為胃的正常褶皺消失和胃壁彌漫增厚[11]。增強CT可以根據胃壁強化情況、胃周脂肪組織及鄰近器官的侵襲情況進行T分期。
近年來,隨著多平面重建(multiplanar reformation,MPR)和虛擬胃鏡(virtual gastroscopy,VG)的應用使T分期的準確率進一步提高。Wani等[12]聯合使用MPR及VG技術對160例GC增強CT進行T分期評估,其T分期總體診斷準確率為82.5%,對早期GC診斷準確率達到93.75%,但敏感度僅為66.7%,并強調有3例早期GC病例僅在VG上被診斷。Feng等[13]使用MPR技術對462例GC增強CT進行T分期,以T1-2期作為對照,其診斷T3-4期準確率為69.9%。Shimada等[14]對GC臨床分期的準確率進行系統性回顧,增強CT對進展期GC的T分期診斷準確率為73%~91%。目前增強CT能對胃癌T分期提供一定幫助,隨著MPR和VG的應用可以進一步提高分期診斷的準確性。
2.ML預測胃癌T分期
隨著ML的興起,ML預測胃癌T分期的研究也不斷涌現。Zheng等[15]建立了一個50層的快速區域卷積神經網絡模型對進展期GC(T2、T3、T4)的T分期進行預測,該研究回顧性分析了225例GC的增強CT靜脈期圖像,并對訓練集圖像加以增強,最終該模型的ROC曲線下面積(area under curve,AUC)為0.93,對T2、T3、T4預測的準確率分別為90%、93%、95%。Sun等[16]建立DL影像組學模型以T3期作為對比區分T4a期GC,共收集572例GC三期增強圖像(回顧性428例,前瞻性144例),結果顯示使用支持向量機和人工神經網絡構建的放射組學特征在回顧性測試集和前瞻性測試集中均表現出良好的識別性能,其AUC分別為0.76~0.78和0.79~0.84,以此聯合影像特征建立的列線圖更是表現出較好的診斷效能,其AUC分別為0.87和0.90。Yardimci等[17]對114例GC增強CT進行影像組學紋理分析,建立治療前GC分期模型,對T1-2期和T3-4期進行預測,其T1-2期診斷準確率為60%,T3-4期準確率為96.6%,總體T分期準確率達90.4%。ML模型可能甄別出對疾病預測更加高效客觀的影像特征。
綜上,有關胃癌T分期的眾多研究結果表明(表1),ML預測表現出不劣于甚至優于影像特征評估的效能。

表1 T分期參考文獻
1.影像特征評估胃周淋巴結轉移及N分期
評估胃周淋巴結轉移是胃癌影像學評估中的難點,也是影響個體化治療和預后的重要因素之一。美國國立綜合癌癥網絡(national comprehensive cancer network,NCCN)和中國臨床腫瘤學會(chinese society of clinical oncology,CSCO)推薦增強CT作為評估胃周淋巴結轉移的首選檢查方法[2,23]。評估淋巴結轉移是以淋巴結的大小、形態、淋巴結中心是否壞死、淋巴結強化程度等作為參考因素[24],淋巴結大小是評估淋巴結轉移的重要參考指標,但轉移淋巴結不都是增大的,對于小淋巴結轉移診斷困難是評估淋巴結轉移準確率較低的重要原因[14]。而在影像特征中,對于轉移淋巴結大小的診斷標準也存在較大爭議[24],多數研究者以短徑≥8 mm作為淋巴結轉移的標準[25]。轉移淋巴結大小的設定標準不同,其敏感性和特異性也會有所改變。
Jiang等[26]運用MPR對108例(69例回顧性,39例前瞻性)進展期GC的CT圖像進行研究,評估胃周淋巴結轉移情況,當以長徑≥7.55 mm為淋巴結轉移標準時,在回顧性病例和前瞻性病例中的AUC分別為0.706和0.849,敏感度分別為86.8%和91.4%,特異度分別為80.1%和47.3%;當以短徑≥6.55 mm為淋巴結轉移標準時,其AUC分別為0.634和0.813,敏感度分別為80.8%和88.9%,特異度分別為72.9%和52.1%。Wada等[27]對650例T1期胃癌CT圖像的淋巴結轉移情況進行評估,共分為兩組,A組為內鏡黏膜下剝離(endoscopic submucosal dissection,ESD)術后接受CT檢查者(81例),B組為手術前或ESD術前接受CT檢查者(569例),以短徑≥8.0 mm或長徑≥10.0 mm為淋巴結轉移標準,兩組淋巴結診斷準確率分別為77.8%和84.2%,敏感度分別為0%和15.9%,特異度分別為84.0%和95.7%,陽性預測值分別為0.0%和38.2%,陰性預測值分別為91.3%和87.1%,假陽性率分別為100%和61.8%。諸多研究表明(表2),以淋巴結大小判斷淋巴結轉移情況是不可靠的。

表2 局部淋巴結轉移、N分期參考文獻
Yang等[28]以MRI定義的直腸癌壁外脈管侵犯(extramural vessel invasion,EMVI)為參照,采用MPR評估105例GC增強CT的EMVI情況。將EMVI預測淋巴結轉移與直接評估淋巴結轉移(以短徑≥10 mm為淋巴結轉移標準)進行比較,結果顯示兩者具有良好的一致性,預測效能前者優于后者,其準確率分別為78.1%和70.5%,敏感度分別為81.7%和70.0%,特異度分別為73.3%和71.1%。評估EMVI這類與淋巴結轉移相關的征象可以得到有效參考信息,為預測淋巴結轉移提供了新的研究方向。
淋巴結轉移的判斷困難也使N分期評估準確率較低。Ri等[29]通過MPR對421例增強CT圖像進行研究,評估pN2-3期胃癌的準確性(以pN0-1作為對照),當以單一可測量淋巴結短軸長度≥10 mm為轉移標準時,其診斷pN2-3期的敏感度為36.5%,特異度為95.0%,陽性預測值為84.6%,陰性預測值為66.5%,準確率為69.8%;當有2枚可測量淋巴結短軸長度≥5 mm為轉移標準時,其診斷pN2-3期的敏感度為39.2%,特異度為90.0%,陽性預測值為74.7%,陰性預測值為66.3%,準確率為68.2%;當有2枚可測量淋巴結短軸長度≥10 mm為轉移標準時,其診斷pN2-3期的敏感度為13.8%,特異度為99.2%,陽性預測值為92.6%,陰性預測值為60.4%,準確率為62.5%。與T分期相比,MPR的應用似乎沒有顯著提高N分期的準確率[12]。
2.ML預測胃周淋巴結轉移及N分期
基于胃周淋巴結轉移及N分期在影像學評估的準確率較低,有學者使用ML模型對胃周淋巴結轉移及N分期進行研究。
Gao等[30]以淋巴結增強CT圖像為研究對象,建立快速區域卷積神經網絡的DL模型預測胃周淋巴結轉移情況,回顧性納入602例單中心患者,該模型經過第一階段的初步學習和第二階段精確DL的訓練,對胃周轉移淋巴結的預測準確率達到95.4%。Jin等[31]以胃癌原發灶為研究對象,對兩個醫療中心的1699例(內部訓練集1172例,外部驗證集527例)GC術前增強CT圖像進行研究,經DL構建11個區域淋巴結轉移模型分別預測各區域淋巴結轉移情況。在外部驗證隊列中,中位AUC為0.876,中位敏感度和中位特異度分別為0.743和0.936。
ML模型對N分期的預測也極具參考價值。Jiang等[32]以GC原發灶為研究對象,對3個醫療中心的1689例門靜脈CT圖像進行研究,通過影像組學聯合臨床病理資料建立多組GC淋巴結轉移分期的列線圖,以pN0為對照,分別與pN1、pN2、pN3進行鑒別,其內部驗證集的AUC分別為0.772、0.873、0.913,外部驗證集的AUC分別為0.822、0.866、0.936。Dong等[33]以T2-T4a期胃癌原發病灶為研究對象,回顧性納入國內5個醫療中心和意大利1個醫療中心的730例胃癌CT圖像,建立深度學習影像組學列線圖(deep learning radiomic nomogram,DLRN)對淋巴結分期情況進行研究,使用一致性指數(Harrell's concordance index,C-index)評價模型的預測能力,結果顯示DLRN在主要隊列、外部驗證隊列和國際驗證隊列中的總體C-index分別為0.821、0.797、0.822。DLRN模型的表現優于臨床N分期和其他預測模型,在每個亞組(N0組與非N0組、N0-1組與N2-3b組、N0-2組與N3a-3b組、N3b組與N0-3a組)的預測中也表現良好(C-index范圍為0.791~0.893),并能檢測到81.7%不具有典型CT征象的淋巴結轉移。
多個研究均表明(表2),不同于僅對淋巴結進行影像學觀察,ML可能從高維度的影像數據中探索出更有效的特征,或聯合更多特征提高對淋巴結轉移及N分期評估的準確性。
1.影像特征評估腹膜轉移
GC遠處轉移情況的評估是決定能否手術的重要依據,當前最大的困難和挑戰在于準確評估腹膜狀況。GC細胞侵入漿膜層后,其游離癌細胞可脫落播散至腹膜。腹膜種植是GC最常見的遠處轉移部位之一[37]。診斷性腹腔鏡檢查是診斷腹膜轉移(peritoneal metastasis,PM)的金標準,但這種侵入性檢查可能會導致術后粘連和一些并發癥。目前,CT仍是大多數醫學中心診斷PM的首選方式[38-39]。CT掃描速度快,運動偽影較少并且有著較高的空間分辨率,可以通過MPR對腹膜進行多角度觀察。然而,CT軟組織對比度有限,且PM在影像上的表現多樣,判斷PM的準確性受到轉移結節大小、位置、腹水及觀察者的專業知識和經驗的影響[39]。Van’t Sant等[39]在影像學診斷PM效能的META分析中,共有20篇CT參考文獻被納入研究,其CT診斷PM的敏感度為68%,特異度為88%。因影像檢查敏感度較低,歐洲腫瘤內科學會(european society for medical oncology,ESMO)、NCCN和CSCO推薦診斷性腹腔鏡和腹腔灌洗液檢查進一步排除影像學上的隱匿性腹膜轉移(occult peritoneal metastasis,OPM)[2,23,24]。
近期有學者對CT評估OPM做了更加深入的研究。Li等[40]在胃癌臨床T分期≥2的385例入組患者中,有33例患者在腹腔鏡探查中發現共57個OPM區域,根據腹腔鏡結果與增強CT進行逐一對照,建立4分評分法并進行前瞻性驗證,以≥2分為OPM標準,其AUC為0.848,敏感度為87.5%,特異度為76.4%,兩位觀察者間的一致性為76.2%。4分法為臨床評估OPM提供了重要的量化工具,也為其他疾病引起PM的研究提供了重要參考。
2.ML預測腹膜轉移
針對PM難以在影像中準確診斷,ML對GC腹膜轉移的預測亦有較多研究。Dong等[41]以原發腫瘤及鄰近腹膜為研究對象,對4個不同醫療中心的554例GC增強CT圖像進行影像組學研究并建立列線圖,以期識別OPM。該模型在訓練集、內部驗證集及兩組外部驗證集中表現出優秀的性能及較強的泛化能力,其AUC分別為0.958、0.941、0.928、0.920。該研究證實原發腫瘤和鄰近腹膜的增強CT情況與OPM明確相關。Huang等[42]對544例GC門靜脈期CT圖像進行研究,以GC原發病灶為研究對象建立深度卷積神經網絡(deep convolutional neural network,DCNN)模型,預測術前進展期胃癌的OPM。與臨床模型相比,DCNN模型優于臨床模型,其AUC值為0.90,敏感度為0.81,特異度為0.875。Jiang等[43]以GC病灶增強CT門靜脈期的最大層面作為感興趣區,對來自3家醫療中心的1978例進展期GC進行研究,并建立DL模型預測OPM。與Laurren分型和GC分化程度相比,其建立的PMetNet深度學習模型可以更好地預測OPM,訓練集及兩組外部驗證隊列的敏感度分別為83.7%、75.4%和87.5%,特異度分別為92.8%、92.9%和98.2%,AUC分別為0.955、0.946和0.920。Liu等[44]以GC原發病灶為研究對象,對3個中心的599例進展期GC的門靜脈CT圖像進行研究,建立基于包圍框(Bounding box)的影像組學模型檢測OPM,容納原發病灶的最小矩形模型展現出了最好的效能,其內部驗證隊列和外部驗證隊列的AUC分別為0.871和0.841,敏感度分別為0.810和0.857,特異度分別為0.852和0.805。ML模型以GC原發灶或聯合腹膜作為研究對象對腹膜轉移情況進行預測,表明GC原發病灶可能包含著診斷腹膜轉移的關鍵信息。
綜上,有多個研究表明(表3),與影像特征判斷腹膜轉移相比,ML模型可能有著更好的表現。

表3 M分期參考文獻
在GC臨床分期中,影像特征評估和ML預測模型尚存以下問題:①多為回顧性和單中心研究,容易出現選擇偏倚,多中心研究及前瞻性研究較少,難以擬合疾病的真實情況,各種方法、模型的泛化能力和魯棒性有待檢驗,經過多中心、大樣本、前瞻性研究反復檢驗的方法和模型才能準確、可靠、有效地指導臨床診療;②有關胃癌的公開數據集很少,癌癥醫學圖像數據庫(the cancer imaging archive,TCIA)是腫瘤影像的開放獲取數據庫,胃癌CT圖像目前僅有1組,期待未來有更多胃癌的公開標準化信息數據供研究者們使用。
影像特征評估受限于影像技術及觀察者的經驗,主觀性較強。MPR、VG提高了T分期的準確率,但對于不同機構的觀察者,其主觀差異可能較大,期望會出現有關胃癌的影像報告和數據系統以評分量化的方式把主觀差異縮小。由于難以評價5 mm以下淋巴結轉移情況,對N分期及淋巴結轉移的準確性可能會通過聯合原發病灶的相關信息加以改善。在M分期中,OPM在CT上可能僅有細微的改變而難以診斷,評分量化法可能會對OPM的診斷有所突破,加入原發病灶的相關信息可能會成為進一步的研究方向。
由于CT掃描協議缺乏統一標準及原始圖像數據處理方式不同等多種因素,ML模型難以驗證和推廣。在未來,有待不同公司、廠家及相關從業者對CT掃描協議及圖像采集標準進行統一規范。感興趣區的分割或標注決定了模型的優劣,ML模型的建立多基于人工分割感興趣區,由于GC病灶多隨胃壁呈迂曲走行,手工分割病灶耗時且主觀性強,部分研究僅以病灶最大橫斷面作為研究對象,可能會導致部分有用信息的缺失,更多自動或半自動分割方法的開發及應用將推動GC相關研究的發展。無論DL模型或影像組學模型提取的影像定量特征缺少生物學驗證及合理的病理組織學解釋,在醫療問責機制下,模型需在臨床中謹慎應用,未來對建立的模型給予相應的解釋成為了ML發展及應用的關鍵。
影像特征評估胃癌臨床分期的優勢在于其可解釋性,基于CT的機器學習模型在胃癌臨床分期中展現出強大的預測能力。隨著對疾病征象更加深入的認識、更多影像技術的開發應用以及機器學習的快速發展,我們有理由期待,未來的胃癌臨床分期將是影像特征評估輔以機器學習模型的聯合應用,實現“人工”與“智能”相結合。醫學影像將作為影像學生物標志物,成為疾病精準診療中極為重要的一環。