陳亮輝,李 婷
食管癌是上消化道主要的惡性腫瘤之一。2018年食管癌發病率在全球惡性腫瘤中位居第七位,是所有癌癥死亡的第六大原因[1],多數患者就診時已達到癌癥中晚期[2]。早期食管癌及癌前病變在內鏡下治療可以達到90%以上的治愈率[3],改善患者的預后。然而,內鏡醫師的臨床經驗、專業水平以及病變大小等因素限制了早期食管癌內鏡下的檢出率[4-7]。人工智能(artificial intelligence,AI)與消化內鏡成像技術結合后,可以對大量內鏡圖像進行學習、訓練,分析內鏡圖像與疾病診斷之間的關聯,從而達到模仿人類認知的水平,幫助醫師完成快速、精準的診斷。Babu P等[8]的一項系統性評價表明,運用卷積神經網絡算法(convolution neural networks,CNN)的人工智能輔助診斷食管癌的合并準確率為87.2%,敏感性為87.1%,特異性為87.3%。
本文綜述近幾年人工智能在評估食管癌前病變和食管腫瘤方面的研究文獻,重點探討了AI在評估不同類型內鏡圖像上的應用,以及他們的優缺點,以期為醫生和計算機之間的協作以及這項技術在臨床實踐中的應用提供參考。
1.1 輔助識別巴雷特食管異型增生和早期食管腺癌
巴雷特食管(Barrett’s esophagus,BE)是食管腺癌最重要的危險因素之一,80%的食管腺癌發生在BE基礎上[9],所以BE的篩查和診斷非常重要。BE黏膜的癌變是一個逐步發展的過程,然而對于普通內鏡醫師來說,評估所有發展過程的病變,即區分無異型增生BE、低級別/高級別異型增生BE和早期腺癌,可能非常困難[10]。內鏡醫師對BE早期異常識別的水平存在差異,病檢取材部位陽性率低,導致漏診時有發生[11]。
此外,通過早期檢測適合內鏡下治療的BE及早期食管腺癌,患者的預后可能會從根本上得到改善。目前已經發展出很多種先進的內鏡技術,如放大內鏡、電子染色內鏡、色素內鏡、共聚焦激光顯微內鏡、容積式激光內鏡等,但大多數都是昂貴且耗時的,需要有一個很長的學習過程,一些技術只有專家和熟練的內鏡醫師才能使用[12]。因此,人工智能將為早期食管癌的檢查提供一個很好的輔助工具。
1.1.1 在白光內鏡和窄帶成像中的應用
高清晰白光內鏡(white-light endoscopy,WLE)是初步識別BE異型增生的最佳選擇[13],人工智能可以提高普通內鏡醫師對BE異型增生的診斷準確性。de Groof等[14]開發了能夠滿足臨床實時應用的深度學習輔助診斷系統,該AI 系統使用1 704例BE異型增生和非異型增生患者的高清WLE圖像進行訓練后,區分圖像為BE腫瘤和非異型增生的準確率為89%,敏感性為90%,特異性為88%,其診斷的準確率高于普通內鏡醫師,同時可標注腫瘤活檢的最佳位置,標注結果與內鏡專家有很好的一致性。因此,使用AI輔助內鏡診斷可幫助較低年資內鏡醫師識別 BE早期瘤變,并協助他們定位活檢部位。van der Sommen等[15]構建了一個通過對病變部位顏色和紋理特征進行學習的計算機輔助診斷系統,其診斷早期腫瘤病變的敏感性和特異性均為83%。Ebigbo等[16]研發了一種基于深度學習的計算機輔助診斷系統,在兩個WLE圖像數據集中測試,其診斷早期食管腺癌的敏感性/特異性分別為97%/88%和92%/100%,在窄帶成像(narrow-band imaging,NBI)數據集中的敏感性/特異性為94%/80%,該系統還顯示了病變定位能力,與內鏡專家分析結果的面積符合率達到72%。然而,以上研究存在一個相同的問題,即訓練階段和驗證階段使用的圖像數據集是相同的。
Hashimoto的研究組建立了一個AI系統,用916張BE腫瘤(高度異型增生/T1腫瘤)WLE/NBI圖像和919張正常BE圖像進行預先訓練,隨后以“異型增生”或“非異型增生”的二分類進行微調[17]。該AI系統驗證階段使用了另外458張測試圖像,其檢測出早期腫瘤的準確率為95.4%,敏感性和特異性為96.4% 和94.2%,能夠以較高的精度(平均精度為0.7533)定位異型增生區域。
de Groof等[18]前瞻性收集了40例異型增生BE和20例非異型增生BE患者的白光內鏡圖像作為訓練數據集。由內窺鏡專家對腫瘤圖像進行勾畫,將至少4個圈定區域的重疊區定義為“最佳點”。他們開發的模型通過對BE圖像顏色和紋理特征的訓練,從最佳點中提取正面特征,從非異型增生圖像中提取負面特征。該系統對腫瘤檢測的準確性可達92%,敏感性、特異性為95%和85%。
1.1.2 在容積式激光顯微內鏡中的應用
容積式激光顯微內窺鏡(volumetric laser endomicroscopy,VLE)是使用光學相干斷層掃描產生實時顯微橫截面的成像技術,它能對食管壁層深達3 mm處的病變進行識別。內鏡醫師必須對大量復雜的圖像信息進行分析,人工智能輔助則有助于對病變的快速識別。Swager等[19]使用60張VLE圖像對他們的輔助診斷系統進行交叉驗證,其檢測早期腫瘤性病變的敏感性為90%,特異性為93%。隨后,該小組又評估了采用多幀VLE圖像人工智能對早期腫瘤病變自動識別的可行性,用3 060幀VLE圖像對多幀人工智能診斷系統進行測試,與采用單幀圖像的相比,多幀圖像診斷系統有更高的曲線下面積(P<0.001),AUC中位數為0.91,圖像分析總用時為3.9 s[20]。
1.1.3 在內鏡實時診斷中的應用
早前的大多數研究都是通過使用高質量、靜態的內鏡圖像來實現的,這可能不能準確地反映臨床實踐的真實情況。Seghal等[21]收集了非異型增生和異型增生BE患者的高清內鏡視頻,使用了嵌入視頻處理器的實時圖像映射技術的軟件算法,以內鏡專家對圖像的評估構成系統的決策樹,結果模型的準確率提高到92%,靈敏度和特異度分別為97%和88%。隨后,非專家人員使用該決策樹,在訓練前后解讀了相同的視頻。在經過正式訓練后,非專家組發現異型增生的準確率明顯提高,敏感性從71%提高到83%。Ebigbo等[22]開發了一個能實現圖像快速分析和概率預測人工智能診斷系統,并依據癌癥發生的概率呈現彩色密度分布圖。該系統從實時內鏡影像中隨機提取圖像,檢測早期食管腺癌的敏感性為83.7%,特異性為100.0%,準確率為89.9%。
1.2 輔助識別早期食管鱗狀細胞癌
我國食管癌以食管鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)為主要亞型,占食管癌的90%以上,5 a總生存率<20%。因此,食管鱗癌及癌前病變的早期診斷對提高患者治療效果和預后至關重要[23]。內鏡檢查為食管癌及癌前病變篩查的常規手段,人工智能在有效提高內鏡篩查的靈敏度與診斷的準確率上能起到積極作用。
1.2.1 在白光內鏡和窄帶成像中的應用
Guo L等[24]開發了一個輔助食管癌診斷的人工智能系統,可實時對早期食管鱗癌和癌前病變進行自動識別。該系統使用6 473張癌前病變、早期食管鱗癌和非癌性病變的NBI圖像進行訓練,并使用內鏡圖像和視頻數據集進行了驗證。該系統為每個圖像生成一個概率熱圖,黃色表示癌變的可能性很高,藍色表示非癌性病變。該系統對1 480張癌變NBI圖像的敏感性為98.04%,對5 191張非癌性NBI圖像敏感性為95.03%,曲線下面積為0.989。在27個非放大視頻中,每幀的靈敏度為60.8%,每病變的靈敏度為100%。對于20個放大視頻,每幀的敏感度為96.1%,每病變的敏感度為100%。對于正常食管影像(包括33段影像),每幀特異性為99.9%,每例特異性為90.9%。在識別內窺鏡圖像和視頻數據集中的癌前病變和早期食管鱗癌上有很高的靈敏性和特異性,該系統在內窺鏡輔助診斷上有廣闊的應用前景。
日本的Ohmori研究小組開發了一個用于檢測和鑒別淺表食管鱗癌的系統[25]。訓練數據集包含非放大和放大的正常食管病變及淺表食管鱗癌圖像,驗證數據集由另外135名患者的內鏡圖像構成。該AI系統在非放大NBI圖像的敏感性、特異性和準確性分別為100%、63%和77%;在放大內鏡圖像組的敏感性、特異性、準確性分別為98%、56%和77%,診斷性能優于經驗豐富的內鏡醫師。Cai等[26]開發了一個使用深層神經網絡(deep neural network,DNN)的計算機輔助診斷系統,可在普通白光內鏡成像下定位并識別早期食管鱗癌,訓練和驗證過程采用不同的圖像數據集,結果該系統的敏感性、特異性和準確率分別為97.8%、85.4%和91.4%,正預測值和負預測值為86.4%和97.6%,優于低年資內鏡醫師,且具有實時病灶標注提示功能,幫助內鏡醫師檢測出之前忽略的病變。AI 對提高低年資內鏡醫師識別早期食管癌的能力具有較高的價值。由Horie等[27]開發的運用CNN的人工智能系統檢測食管癌的靈敏度達到98%,并能夠檢測出所有<10 mm的食管癌病變。區分淺表或晚期食管癌的準確率達到了98%,對食管鱗狀細胞癌和食管腺癌的診斷準確率分別為99%和 90%。這些結果證明了人工智能能夠快速分析大量的內窺鏡圖像,從而在將來的臨床實踐中提高對早期食管癌檢測的能力。
1.2.2 在內窺鏡系統中的應用
內窺鏡系統是一種通過活體染色對食管上皮細胞進行實時評估的放大內鏡技術。內鏡醫師可以清楚地觀察到食管黏膜上皮細胞,達到與病理診斷相似的效果[28]。但是,內窺鏡醫生若想獨立地完成實時檢測,需要具備堅實的病理學基礎,這顯然是不實用的。因此,人工智能可輔助其虛擬實現組織病理學的診斷。Kumagai等[29]應用深度學習技術探索一種用內鏡檢查取代組織活檢的人工智能,該系統對55例患者(27例ESCC和28例非腫瘤病變)中的1 520張經染色的圖像進行測試,人工智能在27例鱗狀細胞癌中正確診斷了25例,敏感性為92.6%;28個非癌性病變中有25個被診斷為非惡性,特異性為89.3%,總體準確性為90.9%。
1.3 AI在預測食管癌浸潤深度和分型中的應用
內鏡下治療比外科食管癌根治術的并發癥少,所以推薦M1或M2期食管癌為內鏡下治療的絕對適應證[23]。因此,準確地識別浸潤深度對于避免過度治療,從而提高術后生活質量是至關重要的。近年來,人們發現食管鱗狀上皮內乳頭狀毛細血管袢(Intra-epithelial papillary capillary loop,IPCL)在內窺鏡下的形態學改變與腫瘤浸潤深度相關[29]。根據日本食管學會提出的基于放大內鏡的IPCL分型法,不同的IPCL分型代表不同的病變和浸潤深度,然而分類仍然需要內鏡醫師有足夠的經驗。因此,運用AI技術輔助診斷將提供一個更有效、更客觀的解決方案。
日本Tokai等[30]評估了AI系統測量食管鱗癌浸潤深度的能力。作者收集了1 751個ESCC圖像和浸潤深度信息,以此來訓練他們開發的運用CNN的人工智能診斷系統。隨后,該診斷系統和13名內鏡專家審查了55例患者的291張測試圖像,其診斷ESCC的準確率為95.5%,預測浸潤深度的準確率為80.9%,靈敏度為84.1%。該系統對ESCC浸潤深度的診斷準確性高于內鏡專家,可作為ESCC評估的輔助工具。Everson研究小組開發了一種能夠對內鏡圖像中腫瘤或非腫瘤形態實時分類的AI系統[31]。采用CNN技術,通過使用17例患者的7 046張放大NBI圖像進行訓練,正常的IPCL被分為A型,異常者分為B1-3型,對IPCL形態的正常/異常分類準確率為93.7%,敏感性為89.3%,特異性為98%。該系統以實時方式運行,診斷預測時間在26.17 ms 到37.48 ms 之間。然而,目前所開發的模型還不能對所有的特定亞型進行分類。
人工智能技術與內鏡檢查相結合,通過算法在大量的內鏡圖像或視頻中進行訓練,可以達到專家級別的診斷水平,有效減少食管癌及癌前病變的漏診,實現快速、準確的診斷[32]。人工智能技術將會為醫療資源缺乏、水平欠佳的地區獲得頂尖醫療技術提供一個很好的途徑,并惠及當地民眾,實現優質醫療資源的共享。AI輔助診斷系統可作為醫師完成內鏡下準確診斷的重要輔助手段,同時也為未來培訓低年資內鏡醫師提供了一個有效的工具。
盡管AI在輔助腫瘤診斷領域取得了一定成果,但在向臨床實踐轉化的道路上仍面臨諸多挑戰[10,33]。首先,大多數研究通常只收集高質量的內鏡圖像構成訓練數據集,而病變部位被黏液、膽汁覆蓋的低質量圖像被排除。這種做法可能會導致模型的過度擬合[34-35],從而夸大了AI系統診斷的準確度。其次,因為大多圖像數據集是回顧性的,病變部位有比較典型的特征,而更多的非典型病變則可以用來改善AI模型的性能。人工智能模型應該通過使用完全獨立的訓練數據集和測試集進行評估,以反映系統的實際性能[36]。AI在收集使用患者數據時,應遵守倫理道德和相關法律,避免泄露患者隱私,研究人員應開發以達到患者最佳服務滿意度為中心的AI診療技術。
未來AI診斷系統能否代替內鏡醫師做出診斷,尚需在未來繼續檢驗。但可以肯定的是,AI可以協助內鏡醫師完成食管癌的診療工作,減輕醫師的臨床工作量,同時緩解醫療資源分布的不均衡。目前,已有基于人工智能的三類醫療器械獲得我國藥品監督管理局的審批,這些產品可以幫助醫生完成復雜的醫學判斷,協助其作出診斷。隨著研究的不斷深入,相信人工智能技術也將在食管癌篩查、診斷和治療等臨床實踐中得到逐步應用。