中國醫院協會介入醫學中心分會
食管癌居中國惡性腫瘤發病率第六位,死亡率第四位,是我國常發、危害重大的疾病[1]。
全球每年新增食管癌患者近50%來自于中國,90%為食管鱗癌[2]。食管癌具有高浸潤性和淋巴結跳躍性轉移的特點,早期癥狀隱匿難以發現,中晚期食管梗阻、病灶浸潤和轉移嚴重影響患者生活質量及生存預后。食管癌的主要治療方法如手術、化療、放療及靶向治療等已在我國廣泛推廣,但我國患者的五年生存率僅為30.3%,是我國必須自主攻克的重大疾病[3-4]。因此,如何早期診斷及精準治療是食管癌臨床診療的重大難題,是提高五年生存率的關鍵[3]。
人工智能(artificial intelligence,AI)是研究開發用于模擬、延伸和擴展人類智能的理論、方法、技術與應用系統的交叉學科,旨在讓機器能夠像人一樣學習、推理和自我修整[5]。在2018年世界分子影像大會上,斯坦福大學Sanjiv Sam Gambhir教授從醫生角度對AI做出了解讀,稱AI是指讓計算機做人類認為智能的事情。而在更早的1956年,Dartmouth大學學者MaCarthy在一次關于“復雜信號處理”的研討會中第一次提出AI這一術語。在隨后60多年的發展過程中,不同學科背景的研究人員對AI進行了各自不同的理解,因此,AI領域共產生了三大學派:符號主義學派、連接主義學派和行為主義學派,其中,符號主義學派主張基于公理和邏輯體系實現人工智能;連接主義學派認為AI源于仿生學,主張模仿人類的神經元,用神經元連接機制實現人工智能;而行為主義學派認為AI源于控制論,其基礎是“感知—行動”的反應機制[6]。近年來,隨著計算機相關學科的跨越式發展,計算機的運算和存儲能力得到大幅度提升,連接主義學派提出的人工智能技術得到了快速發展,也得到了學術和工業界的廣泛認可,同時為醫學圖像分析和臨床應用等領域提供了強有力的技術手段。下文的AI特指連接主義學派提出的用于圖像分析的方法技術。
隨著AI技術的日臻成熟和醫學影像數字化的發展,AI在醫學領域得到了廣泛的研究應用,主要體現在疾病術前診斷、治療療效評估和預后預測等方面。在疾病診斷方面,AI自動診斷系統對糖尿病視網膜病變、腫瘤原發灶和腦腫瘤病理類型等多種疾病的診斷精度接近臨床專家水平,能夠提高診斷的準確性和效率,輔助進行臨床診斷工作[7-9]。AI輔助膠囊內鏡閱片極大地提高了工作效率和病灶的檢出率,已經廣泛應用于臨床[10]。在治療療效評估方面,多項研究工作表明,AI模型能夠良好地預測評估結直腸癌、宮頸癌等腫瘤的新輔助治療療效,輔助指導臨床治療決策[11-12]。此外,AI模型在肺癌和肝細胞癌等癌癥患者生存期等預后信息預測方面的成效也得到了驗證[13-14]。其中,基于醫學影像大數據和AI技術的影像組學在臨床精準診療的應用最為成熟[15]。綜上所述,AI技術在醫學領域已經開展了廣泛的基礎和應用研究,將有助于改善臨床診療水平,提高醫療資源配置效率,助力精準醫療。
專家組認為食管癌臨床診療的AI問題識別包括以下四個方面。
研究表明早期食管癌患者的五年生存率顯著高于中晚期患者(85% vs 20%),因此,早期診斷食管癌是改善其預后的重要途徑[16]。《美國國家綜合癌癥網絡指南(National Comprehensive Cancer Network Guideline,NCCN指 南)》[17]及《中國癌癥篩查及早診早治指南》[18]將內鏡輔以盧戈氏碘染色及靶向性活檢病理篩查作為食管癌的最佳篩查方案。其中,普通白光內鏡(white light imaging,WLI)是常用的內鏡檢查方法。然而,由于早期食管癌隱匿的特性,內鏡檢查容易導致病灶漏診[19]。其他檢查方法包括放大內鏡(magnifying endoscopy,ME)、窄帶成像(narrow band imaging,NBI)和激光共聚焦顯微內鏡(confocal laser endomicroscopy,CLE)等[20],圖1為典型的早期食管癌內鏡圖像。盡管NBI較WLI和色素內鏡可以明顯提高早期食管癌檢測率,但對操作者要求高,經驗不足的醫師敏感性明顯低于高年資醫師(53%vs 100%)。因此,開發AI輔助工具對減少經驗差異的影響具有重要意義[21]。

圖1 早期食管癌的內鏡診斷
1.病灶分級及分期
食管癌侵犯深度和是否淋巴結轉移是決定治療決策的重要標準。其中,內鏡下超聲是目前NCCN指南推薦食管癌淋巴結轉移的準確的檢測手段[17],但由于探測深度有限、存在主觀性、技術要求較高,且為入侵式檢查,尚未成為術前常規檢查在臨床中應用。而食管癌容易發生跳躍性轉移,淋巴結轉移比例高達58%~64.2%[22]。因此,在術前準確判斷食管癌淋巴結是否存在轉移對于治療決策尤為關鍵。基于液體活檢及影像組學用于診斷食管癌淋巴結轉移是目前的研究熱點之一。
2.危險分層
食管癌治療決策的首要環節是對患者進行預后預測,從而實現危險分層,指導醫師選擇相應的治療方案。目前,NCCN推薦在診療過程利用多種影像進行分期、隨訪,包括頸胸部CT增強圖像及MR增強圖像、全身PET-CT影像;利用術后病理圖像判讀進行術后分期[17]。基于影像及術后病理的解剖學腫瘤TNM分期(tumor node metastasis)是目前臨床診療的預后預測體系,但由于無法體現生物學特性、主觀性強等缺點,通常不夠準確。基因是腫瘤內分子異常的根源,影像及病理等臨床圖像是腫瘤組織及細胞的形態學表征,可以體現腫瘤異質性[23],隨著AI技術在食管癌影像、病理圖像及基因層面的廣泛應用,以上研究材料中蘊含了大量與腫瘤生物學特性的信息,如何利用AI技術量化食管癌基因數據及臨床圖像的生物特性,進而預測其預后價值是目前食管癌AI應用的關鍵問題之一。
針對特定治療方式的療效預測的臨床價值更為明確。由于70%~90%的患者就診時已發展為局部晚期,單純手術效果不佳[24],因此根治性放化療和術前新輔助放化療是目前NCCN指南推薦的主要治療方式[17]。目前大部分研究主要針對局部晚期食管癌以上兩種治療模式,利用現有臨床數據進行療效及預后預測研究,為臨床決策提供明確的指導方案。
隨著二代測序技術在腫瘤研究的廣泛應用,海量的腫瘤基因數據在此過程中得以積攢,如何從中挖掘反映腫瘤關鍵生物學特性的基因,解析量化腫瘤微環境中復雜的分子通路網絡,從而用于評價臨床療效及預測生存結局,已成為目前的研究熱點。對于食管癌,由于其常見基因突變少見及變異度大,常規分析方法往往難以發現,而AI分析可為此提供解決方案。
1.操作前準備
(1)常規禁食禁水6~8 h,中晚期食管癌患者為避免食管潴留對圖片質量的影響,建議禁食12 h,甚至更長時間。(2)預定活檢時,抗凝藥物、抗血小板藥物等必要時提前一定時間中止服用(華法林3~4 d,阿司匹林2 d,噻氯吡啶 5 d等)。(3)為避免黏液對圖片的影響,檢查前半小時,我們推薦服用蛋白酶0.5 g + 西甲硅油1 mL + 碳酸氫鈉1 g +水50 mL。(4)檢查前5 min,為抑制食管蠕動與緊張以及胃液分泌對食管的影響,最好肌注解痙藥(70歲以上慎用,青光眼、前列腺增生肥大癥禁用)。
2.數據來源
采集設備應當包括國內市場占有率超過5%的消化內鏡品牌,采集設備須確保處于設備的有效期內,數據需來自多中心內鏡中心,醫療機構層次、地域、患者特點具備多樣性,以保證AI普適性[25]。
3.采集過程
實施消化內鏡影像采集的醫師須是熟練內鏡操作并通過考核的醫師,具備500例以上的內鏡操作經驗,經過副主任級別醫師(操作經驗> 3 000 例)的培訓,且學習和預錄入例數分別不低于20例,錄入結果經3名副主任醫師評定合格后方可獨立采集數據[25]。采集過程注意事項包括:(1)操作時間不少于5 min。(2)每隔5 cm進行間隔觀察。(3)發現可疑病灶,至少攝圖9張(方便后期訓練AI建模):白光鏡下遠觀、近觀、典型邊界;電子染色下遠觀、近觀、典型邊界;盧戈氏碘染下遠觀、近觀、典型邊界;必要時進行放大,結合IPCL分型進行診斷。(4)為避免活檢后破壞表面結構,不利于白光和染色+放大對病變的判斷,從而影響AI建模,活檢必須在白光和染色+放大觀察后,且已經充分留圖后進行。病灶圖像應當使用JPEG 等標準格式的原始數據,圖像分辨率不低于512像素×512像素。
4.圖像質量評定及病灶分類
首先排除質量較差的圖像,如暈狀、模糊、無法對焦或黏液較多,明顯影響評估。圖像病灶的分類標準為:(1)腫瘤,金標準為活檢病理;(2)良性病變,標準為病理或隨訪2年不變或至少8名經驗豐富(操作經驗> 3 000例)的內鏡醫師共同確認具有明確的良性表現;(3)假陽性病灶,包括皺褶、殘渣、氣泡等。
5.標注過程
建議標注應由至少3名醫師獨立完成,并通過匯總統計病灶的檢出、分類、定位的準確性,標注團隊應至少包括標注醫師、標注組長、仲裁專家三類醫師,建議標注醫師由至少3年以上內鏡操作經驗且操作1 000例以上的醫師擔任,標注組長由至少5年以上內鏡操作經驗且操作3 000例以上的醫師擔任,仲裁專家由至少8年以上內鏡操作經驗且操作3 000例以上的醫師擔任,各批次標注任務由多位標注醫師獨立完成,并經標注組長、仲裁專家審核方可用于AI訓練。結合病灶檢出分類定位流程[25]。標記方法分兩種,包括:(1)粗標記,主要是使用矩形方框包含病灶,方框邊盡量靠近病灶邊緣;(2)精細標記,對病理對應部位的圖像手工勾畫病灶輪廓。
采用胸部及上腹部平掃及增強掃描,掃描范圍覆蓋食管癌區域淋巴結,從鎖骨上窩淋巴結到腹腔干淋巴結。患者取仰臥位,檢查前口服800~1 000 mL生理鹽水充盈胃腔,一次屏氣完成全程掃描。一般采用常規劑量,120 kV,160~280 mAs或自適應電流,矩陣512×512,重建視野> 350 mm,重建層厚≤5 mm,近年來大部分研究采用薄層(1~2 mm),標準算法重建。肘靜脈注射CT非離子型造影劑,按照1.5~2 mL/kg計算總量,流速3 mL/s,接著以同樣流速注射20~30 mL生理鹽水,優化增強效果且最大程度避免上腔靜脈及右心系統的射線硬化偽影。通常進行雙期增強,動脈期與靜脈期分別為30~40 s和 60~80 s。
食管腔常常處于閉合狀態,食管癌組學研究普遍使用動脈期圖像進行標注,原因可能為動脈期病灶明顯強化,與周圍正常組織有較大密度差異。淋巴管侵犯是食管癌不良預后的獨立影響因素[26]。有研究表明,存在淋巴管侵犯時,腫瘤靜脈期(60~80 s)強化幅度可能會增加,因為其反映了造影劑在組織間隙中的擴散[27]。因此,采用靜脈期圖像進行標注可能會獲得更有價值的預后相關特征。
圖像標注包括粗略標注與精細標注[28]。粗略標注常被用于目標檢測等對病灶邊界標注要求較低的任務。而食管位于一個不規則縱隔空間內,與周圍正常組織緊密相鄰,常常無法區分,因此,當前食管癌CT組學研究普遍采用精細標注,沿肉眼可見的食管腫瘤邊緣或食管結構進行勾勒,根據研究目的勾畫病灶最大橫斷面的感興趣區(region of interest,ROI),連續若干最大橫斷面的 ROI,或整個腫瘤的感興趣容積(volume of interest,VOI)。以ITK-SNAP軟件為例,勾畫前將圖像調整至最佳窗寬(250~350 HU)、窗位(40~60 HU),確定病灶位置及范圍;早期病變定位困難,可結合胃鏡、食管造影及PET/CT等檢查,再通過三維多角度觀察確定病灶位置。勾畫時沿腫瘤輪廓進行手動分割,避免將食管腔內氣體、液體、導管等結構納入ROI范圍內。可通過閾值法移除小于-50 HU或大于300 HU的結構。此外,動脈期圖像標注時需注意避開走行于右后方的奇靜脈,可結合靜脈期圖像辨認其輪廓。食管病變周圍的腫大淋巴結常常與腫瘤無法區分,需根據研究目的選擇是否包含周圍腫大淋巴結或盡可能避開。圖2為食管癌ROI示例。

圖2 食管癌CT精細標注示意圖
患者檢查前禁食至少4~6 h,4~6 h內禁止喝含糖飲料,不輸含葡萄糖的靜脈輸液或靜脈營養;測量身高體重;測定血糖,血糖不能高于11.1 mmol/L;注射18F-FDG前平靜休息10~15 min,靜脈注射18F-FDG的量通常為0.1~0.2 mCi/kg。因顯像儀器不同,劑量可以適當調整。
患者注射顯像劑后在安靜避光的房間休息60 min,于顯像前排空膀胱,取下身上的金屬等高密度物品。患者體位為仰臥位雙手抱頭,注射18F-FDG 60 min后開始顯像,掃描范圍一般為顱底至大腿中段,采用CT進行定位掃描,PET使用3D采集,利用CT數據進行衰減校正,一般采用低mA/s(X射線管電壓為120 kV,電流峰值為20~120 mA)。PET圖像重建采用有序子集最大期望值迭代法進行(ordered subset expectation maximisation algorithm,OSEM)重建,矩陣大小為 128×128 或者 256×256,體素大小一般為 4×4×4 或者 4×4×5 mm。
圖像標注方面,建議對CT和PET圖像同時進行ROI勾畫,ROI包括腫瘤原發灶、轉移淋巴結、遠處轉移灶,或根據研究需要的相應ROI(如特定正常等)。
MRI檢查尚未被常規應用于食管癌診療中。近來報告的兩個食管癌MR組學研究,一個采用西門子的T2-TSE-BLADE和增強StarVIBE序列對整個腫瘤進行圖像標注[29];另一個采用飛利浦的T2W-和SPAIR T2W序列對最大橫斷面腫瘤進行標注[30]。這些序列有較高的組織分辨率,可反映病變內部豐富的組織成分差異。與CT圖像標注一樣,在MRI圖像上進行標注,應盡可能包含所有可見腫瘤信號區域,沿著病灶邊緣進行勾畫,避免包括腔內氣體、液體及胸椎;根據研究目的,考慮是否包括腫瘤周圍淋巴結。
需要采集研究時間點(如接受抗腫瘤治療前3周內)完成相應活檢或手術,從而取得腫物等組織,完成福爾馬林固定、石蠟包埋、切片、染色,利用高通量全切片數字掃描儀對其進行掃描,建議放大倍數設定為40×物鏡,以0.23 μm/像素的分辨率獲得病理全切片圖像。需要病理醫師排除存在大量空泡、折痕、染色不佳及腫瘤成分<1%的病例。利用自動化算法對病理圖像進行染色標準化,提高各病理切片的顏色表征的一致性。以上所有圖像及信息保存時采用研究號匿名化處理。
病理圖像的標注極為重要,根據既往研究經驗[31-32],建議對病理圖像進行區域劃分:針對不同細胞組織分類,比如脂肪組織、背景、癌巢、壞死、淋巴細胞、平滑肌、黏液腺、正常黏膜上皮[32];針對腫瘤微環境的不同區域分類,如癌巢、癌巢壞死區域、癌內淋巴細胞浸潤區域、基質淋巴細胞浸潤區域[31]。
關鍵影像特征的提取和篩選AI模型的構建至關重要。定量影像特征包含影像組學特征和深度學習特征。Robert Gillies等在非小細胞肺癌預后研究中整理歸納了影像組學特征,主要包含一階統計量特征、形狀大小特征、紋理特征和小波分量特征,研究表明影像組學特征與患者預后及分子信息具有較好的相關性[33]。與影像組學特征相比,深度學習特征是針對某個特定的臨床診療任務由深度學習模型從感興趣區域中自動學習到的,其具有較強的特異性,往往能夠針對該任務具有較好的預測性能。通常,深度學習模型中最后的全連接層被當作深度學習特征。此外,影像組學特征是根據人為設計的數學公式從感興趣區域中計算出來的,往往具有良好的可解釋性;而深度學習特征是AI模型從感興趣區域中自動學習到的,其可解釋性較差。此外,不同成像設備、參數和重建參數對影像特征影響較大;而在不同中心間標準化成像采集平臺和參數是不實際的[34]。影像和特征的標準化,如ComBat標準化[35],可以在一定程度上校正由不同成像協議造成的影像特征差異。
高維特征通常包含了大量不相關和冗余的信息,這容易導致AI模型的過度擬合現象,即模型對未見過的數據(外部驗證集)的表現性能差。因此,特征篩選有助于提升AI模型的穩定性和泛化性。在基于醫學影像的AI研究中,最小絕對收縮選擇算子(the least absolute shrinkage and selection operator,LASSO)[36]和最大相關最小冗余(maximal relevance and minimal redundancy,MRMR)[37]是最常用的特征篩選算法。由于醫學影像樣本量較小,影像特征在單一研究入組的數據集中的分布情況和全數據集中有所偏差,因此,應融合多種特征篩選算法結果或者一種特征篩選算法在不同子樣本中的結果,以增強特征篩選結果的穩定性和有效性[8]。
建議:在食管癌AI應用研究中,圖像標準化和特征標準化可以緩解圖像采集和重建參數對影像特征的影響;在構建AI模型前,可篩選出對不同圖像采集和重建參數穩定的影像特征,以增強AI模型的泛化性能;融合多種特征篩選算法結果和單一算法在不同子樣本中篩選結果可增強篩選到關鍵特征的穩定性和有效性。
目前,醫學領域常用的AI算法主要分為傳統機器學習算法和深度學習算法。傳統機器學習算法是基于特征工程開展研究,需要根據領域內專家的經驗知識進行特征的量化設計。通常來說,傳統機器學習算法更加適用于小樣本量的研究,且訓練時間較短。常見的傳統機器學習算法包括邏輯回歸、支持向量機(support vector machine,SVM)、隨機森林(random forest)、樸素貝葉斯(naive Bayes)等。深度學習算法是基于數據驅動的,具有強大的特征學習能力,可以從數據中充分挖掘到可表征分類任務的有效特征,同時避免了傳統機器學習算法中特征設計、提取和篩選等繁瑣的過程。與傳統機器學習算法相比,深度學習算法往往需要更大的數據量、更高的計算機算力、更長的模型訓練時間。目前,深度學習算法已在諸如目標檢測、識別、跟蹤等多種場景下的計算機視覺任務中達到最先進水平(state-of-the-art)[38-40]。典型的深度學習算法包括卷積神經網絡(convolutional neural networks,CNN)、循環神經網絡(recurrent neural networks,RNN)、深度置信網絡(deep belief network,DBN)等。其中,CNN是目前醫學影像分析領域最常用的深度學習算法,在該算法中,卷積層編碼醫學圖像的局部信息;池化層抽取關鍵特征,減少特征空間大小,同時有效地減少計算量;非線性的激活層使得該模型學習輸入特征與輸出特征之間的非線性映射關系。通過卷積層、池化層和激活層的交替堆疊,CNN避免了AI模型構建過程中繁瑣的特征提取和篩選步驟,而隱式地從醫學圖像中挖掘關鍵的影像特征。
在機器學習模型訓練時,最好在訓練集中采用K折交叉驗證的方式尋找最優的模型參數以構建機器學習模型;遷移學習(transfer learning)通常被用于訓練深度學習模型,以解決醫學影像樣本量小的問題,即首先在大樣本量的數據集上訓練深度學習模型,然后在入組數據集中對預訓練模型進行微調(fine tune)。遷移學習的有效性在乳腺癌分類和淋巴結檢測工作中得到了很好的驗證[41-42]。在模型驗證時,除了內部驗證集,來自不同中心的外部驗證集也是不可或缺的。同時,一些性能指標常被用來評價模型的優劣,如準確率、曲線下面積、特異性、敏感性、陽性和陰性預測值等。
建議:在醫學影像樣本量小時,采用傳統機器學習算法或遷移學習構建AI模型;采用多中心的外部驗證集對模型的泛化性進行驗證。
1.AI在食管癌內鏡早期診斷中的應用
使用WLI及NBI內鏡高質量的靜態圖像訓練AI,由于訓練數據質量較高,其檢測食管癌的敏感性達到98%[43],準確性與專家無差異,且速度更快(22 s vs 210 min),可以顯著提高臨床工作效率[44]。在更接近臨床實際的動態內鏡視頻測試下,AI檢測腫瘤的準確性仍然優于高年資的內鏡醫師(88%vs 75%)[45]。在診斷虛擬的漏診淺表性食管癌病例中,AI模型敏感性明顯優于醫師(85.7% vs 75%),證明AI技術能降低食管癌漏診率[46]。2002年內鏡專家總結消化道早期病變的分類方法,將食管黏膜表面微血管變化(intraepillary capillary,IPCLs)作為診斷組織異型性的唯一可靠征象[47]。基于ME-NBI數據訓練的AI模型鑒別正常與異常IPCL的準確性達到93.7%[48],提示基于IPLC形態學的AI系統有利于實現食管癌早期診斷。細胞內鏡通過放大500~900倍的內鏡觀察消化道表面上皮細胞,可以在非活檢情況下實現消化道病理檢查,利用細胞內鏡圖像訓練AI模型,其鑒別診斷食管良惡性病變的準確性達到90.9%,可望輔助內鏡醫師獨立開展食管癌診斷[49]。最大規模訓練測試數據(84 424例)的上消化道內鏡AI研究,其前瞻性內部驗證的準確性為92.7%,外部驗證的準確性為91.5%~97.7%,接近專家級醫師(94.2% vs 94.5%),但是該研究中食管癌僅占27%,而其中早期食管癌的比例未知,因此該系統對早期食管癌的檢測診斷效能有待進一步分析[50]。
建議:由于同步使用AI進行內鏡檢查可能會影響醫師的判斷,比如醫師過度信賴AI的準確性導致專注度降低,建議僅在常規胃鏡檢查后使用AI作為第二閱讀者處理保留的圖像或視頻,為醫師指出額外的病灶,以降低漏診率[51-52]。如果AI由大數據訓練,并且經過前瞻性多中心數據充分驗證,檢測、診斷效能至少達到專家級內鏡醫師水平,可以考慮將其融合到內鏡實時檢查過程,以提高工作效率以及指導更有針對性的活檢。
2.AI技術在預測食管癌侵犯深度方面的應用
食管癌侵犯深度是決定治療決策的重要標準之一。對于食管癌局限于黏膜固有層或黏膜肌層(T1a)可以采用內鏡切除,侵犯黏膜下層(T1b)則往往需要接受手術治療[53]。常規內鏡診斷食管癌侵犯深度的準確性分別僅為65.3%~71.4%[54],雖然內鏡超聲對T1a分期診斷的敏感性和特異性達到85%和87%,但是主觀差異較大[55]。基于內鏡靜態圖像訓練的AI區分淺表型食管癌浸潤深度(黏膜下層上1/3、中1/3、下1/3)的準確性達到91.0%,與經驗豐富的醫師接近(89.6%),該研究提示AI可望用于判斷食管癌侵犯深度[56]。為了進一步提高AI的實用性,另有團隊使用常規及放大內鏡視頻訓練AI模型,雖然這些數據包含清晰度欠佳的非聚焦圖像,AI判斷腫瘤侵犯深度的準確性仍然優于內鏡專家(87%~89% vs 84%~85%),提示AI在預測侵犯深度方面具有重要應用前景[57]。
建議:目前單中心小樣本研究證明AI判斷食管癌深度方面具有較好的準確性,可為內鏡醫師提供參考,其泛化性和實用性有待多中心前瞻性研究進一步驗證。
CT在食管癌臨床應用更為廣泛,因此基于CT的影像預測模型的可推廣性具有一定優勢。首先在淋巴結轉移預測方面,通過傳統的Logistic回歸方法(logistic regression,LR)對術前臨床、影像及病理特征進行篩選,建立模型可預測食管癌淋巴結轉移[58-62],其AUC值為0.758~0.820。在此基礎上通過人工神經網絡方法(artificial neural network,ANN)建立模型,其診斷準確性及AUC值均明顯優于LR模型(ANN vs LR:準確性0.907 vs 0.745,P<0.001;AUC 值 0.915 vs 0.868,P<0.001)[63]。Wu等[64]基于影像組學方法預測淋巴結轉移的ROI選擇絕大部分是影像可見食管腫瘤組織,選擇術前動脈期CT腫瘤最大層面作為ROI來建立臨床影像組學模型預測食管癌淋巴結轉移,內部及外部驗證集的AUC值分別達0.874、0.851。需要指出的是,目前的食管癌淋巴結組學研究均選用術前腫瘤作為ROI來預測個體是否存在淋巴結轉移,尚未對淋巴結特征進行挖掘。腸癌及肺癌淋巴結轉移預測的研究表明[65],直接以淋巴結作為ROI建立模型,其診斷性能優于以腫瘤作為ROI的模型。然而,淋巴結ROI尚未應用于食管癌的淋巴結影像組學研究中,原因可能為淋巴結ROI的人工分割工作繁瑣。實現對單個淋巴結是否存在腫瘤轉移的個體預判,特別是診斷難度大的細小淋巴結,對術前評估尤為重要。
在療效預測方面,Jin等[66]發現整合治療前CT影像組學特征、放療劑量學參數及患者一般信息,可預測食管癌根治性放化療療效,預測準確性 達0.708,AUC值 為0.689。Xie等[67]進 一 步改進影像分析的方法,通過細化解析食管癌原發灶7個子區域的CT影像,提取其影像組學特征,通過LASSO等經典的機器學習方法,構建影像組學預后預測模型,預測3年生存率的一致性指數(coincidence dense,C指數)為0.705~0.729,并發現篩選的影像特征與腫瘤拷貝數變異(copy number alterations,CNAs)顯著相關。隨著多種人工智能方法分析在多種腫瘤表征取得顯著的效果,Hu等[68]對比了現有6種人工智能方法,用于分析161例接受新輔助放化療的局部晚期食管鱗癌患者的完全緩解率,發現ResNet50-SVM方法的預測效能最高,AUC值達0.805~0.901,明顯高于基于手工特征的影像組學模型(AUC值0.725~0.822);此外他們通過分析28例患者的RNA表達信息,發現細胞外基質及WNT信號通路基因異常與篩選的影像分數最相關,其次為TGF-β(transforming growth factorβ)和肽類激素(peptide hormone)信號通路基因等。
建議:亟待對淋巴結的影像組學特征進行細化研究,實現對淋巴結的個體化精準診斷。基于AI的CT圖像預測方法入侵性小,但其穩健性及普適性仍需要在多中心、真實世界大數據中進行驗證。
PET-CT作為同時反映腫瘤代謝與組織結構的功能影像,目前已廣泛應用于臨床。在根治性放化療這一應用場景上,早在2009年,Javeri等[69]已發現治療前腫瘤原始標準攝取值(initial standardized uptake value,iSUV)與胃食管癌的放化療近期療效和長期生存相關。2011年,Ganeshan等[70]將紋理分析技術用于治療前PET-CT,將腫瘤異質性定義為腫瘤紋理紊亂,發現腫瘤異質性與SUV最大值和SUV平均值相關;腫瘤異質性越高,分期越晚,并且可獨立預測患者生存。而在術前新輔助放化療的領域,Cao等[61]發現基于PET-CT的影像組學模型與腫瘤同期放化療后近期退縮密切相關。Kukar等[71]認為治療前后PET-CT食管腺癌SUV差值少于45%與新輔助放化療后疾病殘留有關,陽性預測值為91.7%。Beukinga進一步用機器學習方法獲得治療后PET-CT的影像組學特征,發現結合T分期及治療后PET-CT影像組學特征,可精準預測術前新輔助放化療療效。Ypsilantis等[72]引入CNN,從治療前PET-CT中自動提取關鍵特征,用于預測食管癌新輔助化療療效,預測效能優于基于手工提取影像特征的傳統機器學習算法。Xie等[73]進一步優化建模方法,在106例接受新輔助放化療 +手術患者中,基于與生存密切相關的差異表達基因,進一步從海量影像特征篩選出與上述基因關聯的關鍵特征,從而建立基因驅動的影像組學預測模型,并證實其優于未經過基因篩選的影像模型。這一方法為解決醫學圖像分析中的可解釋性難題提供了新思路。
建議:需要針對食管癌關鍵臨床問題,建立穩健、高效和高可解釋性的AI分析模型,充分挖掘及解譯PET-CT提供的功能和結構雙源信息,以指導食管癌精準治療。
由于MRI對軟組織的分辨率更高,加之MRI掃描門控技術也可避免呼吸運動造成的偽影,因此適用于食管腫瘤及縱隔淋巴結的評估。Qu等[29]分析181例食管癌患者的治療前MRI,發現基于MRI的影像組學診斷淋巴結轉移的AUC值可達到0.82。Hou等[30]對68例根治性放化療的食管鱗癌患者進行療效預測,采用兩種方法——支持向量機(SVM)和人工神經網絡(ANN)構建模型,發現SPAIR-T2W和T2W均有較高的預測準確性,前者優于后者(0.843 vs 0.719)。
建議:受限于MRI在食管癌常規診療中的應用,基于MRI的人工智能研究尚處于起步階段。MRI多參數成像能在AI研究中提供更多圖像信息,用于食管癌淋巴結轉移、放化療療效判斷及預后預測。
近年來,隨著高通量全切片數字掃描儀等可將傳統病理玻片進行批量數字化,并轉化為高分辨率的病理全切片圖像的設備的廣泛應用,數字化病理圖像得到了推廣。基于AI的醫學圖像分析技術為細化分析高清的病理全切片圖像提供了契機。目前,AI已實現了對病理全切片圖像中的腫瘤細胞及其環境中的其他細胞進行自動分割和量化分析,其在判斷乳腺癌轉移[74]、預測結直腸癌預后[32]及膠質瘤分子特征[75]等應用場景也顯示出強大的潛力,因此也逐漸成為了近年來的研究熱點。食管癌的病理學形態[76]及免疫組化特征[77]被證實與患者預后密切相關,但受限于病理醫師短缺和人工判讀的主觀性,AI技術目前在食管癌病理分析的應用極少。2021年7月31日,本研 究 以“esophageal carcinoma”、“digital pathology”和“artificial intelligence”為關鍵詞在PUBMED檢索,未見相關研究,說明了巨大的需求缺口。
建議:將AI醫學圖像分析技術應用于輔助病理醫師快速診斷食管癌淋巴結轉移、預測食管癌預后及藥物敏感性,是未來非常有前景的方向。
隨著腫瘤基礎研究的深入,AI輔助下的基因分析將進一步助益于腫瘤生物信息分析,提高生物信息分析探究腫瘤復雜的生物通路網絡的能力,為基因信息在臨床廣泛推廣應用打下堅實基礎。Mourikis等[78]利用SVM構建了穩健的分析方法,利用34個已知癌癥基因的生物學特性,明確了952個已知的驅動基因促使食管腺癌發展的輔助基因。Warnecke-Eberz等[80]從患者的治療前RNA表達情況,篩選出17個基因用于準確預測新輔助放化療療效。此外,在甄別食管病灶[79]及淋巴結的良惡性上,AI輔助的基因分析均顯示出強大的效能,例如Kan等[80]通過AI分析28例患者治療前外周血中8 094個cDNA基因的表達情況,篩選出60個基因判斷淋巴結轉移的敏感性為88%,特異性為82%。
建議:將AI技術應用于食管癌基因信息分析,可更好地量化解析復雜的分子生物通路網絡,有助于食管癌的精準診療。
雖然現階段研究表明AI在食管癌早期診斷、精準分期及預后預測等方面取得了開拓性進展,但是,由于醫學領域的特殊性和深度學習的局限性,AI在食管癌臨床應用仍面臨著重大挑戰。首先,多中心前瞻性食管癌AI研究有待開展。目前大部分研究中食管癌AI模型都是在單中心回顧性數據集合上進行構建和驗證的,由于AI模型強大的擬合能力,導致常常出現AI模型的過擬合現象,因此需要通過多中心前瞻性食管癌影像數據驗證AI模型的泛化能力。其次,由于食管癌影像數據質量參差不齊,數據規范化和標準化亟需開展。在多個醫學中心間,甚至同一個醫學中心內部,食管癌醫學影像采集設備、采集參數和重建算法等方面也存在差異,這導致了影像數據信號和質量的差異。同時,有監督的AI算法要求食管癌影像必須經過專家標注,這個過程會耗費大量的時間和精力。但目前多項食管癌AI研究沒有明確的影像標注標準,影像質量和標注標準的差異將會影響食管癌AI模型在多個醫學中心間的推廣和性能發揮。此外,亟需建立相應的倫理道德規范及政策加強對數據安全問題的監管和保護。最后,目前的AI算法,尤其是深度學習算法的復雜性較高,可解釋性較差。高可解釋性的AI算法有利于提升臨床醫生的認可度,加速AI推廣到臨床診療中。因此,亟待研究高可解釋性的AI模型算法。
1.早期診斷:計算機輔助系統
針對食管癌等消化道腫瘤早期診斷的AI系統,經過現實世界多中心數據驗證,最先邁入臨床應用階段。部分內鏡AI系統已經通過了國家藥品監督管理局創新醫療器械審批,開始產業化道路,有望實現早期食管癌的同質化診斷。
2.術前分期及分級:智能化的分級分期系統
EUS和CT、PET-CT是目前食管癌分期分級診斷的常用方法,3種手段各有優勢,互為補充,通過AI對上述方法進行整合,結合臨床信息,建立計算機輔助診斷系統,實現治療前精準分期,有助于精準分層治療。
3.療效預測:智能化的臨床決策支持系統
針對根治性放化療、新輔助放化療、免疫治療等特定治療,基于臨床常規圖像(如病理、CT、MRI、PET-CT等)建立AI智能化的臨床決策支持系統(treatment decision support system,CDDS)價值重大,在提高患者生存預后的同時,也能夠節省巨大的醫療資源。首先,對根治性放化療進行精準預測,有利于預先評估患者放化療敏感性,指導研究者更好地設計臨床試驗人群,輔助醫師進行治療方案的制定:對于放化療不敏感的患者,可能采取早期介入免疫治療、抗血管生成,抑或減瘤手術配合術后輔助綜合治療等其他策略。其次,在新輔助放化療之前,提前預判新輔助放化療療效,有助于篩選真正適合新輔助放化療患者。最后,在新輔助放化療之后及根治性手術之前,有利于及時在術前評估患者新輔助放化療后腫瘤退縮的程度,助力手術方案的制定,比如對于完全退縮的患者,可能不再接受手術,而采取“觀望(wait and see)”策略。
目前,基于AI的食管癌臨床應用仍處于研究階段,在AI逐步轉化到食管癌臨床日常診療的過程中,我們還面臨著技術和倫理等方面的挑戰。我們相信隨著AI技術的不斷發展、醫工結合的不斷深入,AI技術將更加契合食管癌臨床診療需求,輔助臨床醫生實現食管癌的精準醫療。
共識制定人員(按姓氏拼音排序):
范 麗(上海長征醫院)
房昭雄(中山大學附屬第五醫院)
何 波(昆明醫科大學第一附屬醫院)
陸 遙(中山大學)
賴人旭(中山大學附屬第五醫院)
李 東(天津醫科大學總醫院)
李 丹(中山大學附屬第五醫院)
李坤煒(中山大學附屬第五醫院)
劉再毅(廣東省人民醫院)
梁明柱(中山大學附屬第五醫院)
馬祥園(汕頭大學)
曲金榮(河南省腫瘤醫院)
單 鴻(中山大學附屬第五醫院)
宋 偉(北京協和醫院)
施 俊(上海大學)
田 捷(北航-首醫大數據精準醫療創新中心,中國科學院分子影像重點實驗室)
唐彩華(中山大學附屬第五醫院)
容鵬飛(中南大學湘雅三醫院)
張 帆(中山大學附屬第五醫院)
張亞琴(中山大學附屬第五醫院)
張帥通(北航-首醫大數據精準醫療創新中心,中國科學院分子影像重點實驗室)