陳婷婷,楊帆,李澤陽,徐士雪,楊飛,劉香
(中國醫科大學附屬盛京醫院 1. 消化內科; 2. 普通外科,沈陽 110004)
胃腸道間質瘤 (gastrointestinal stromal tumor,GIST)起源于Cajal間質細胞,是常見的胃腸道上皮下腫瘤[1]。全球范圍內GIST每年發病率為10~15/10萬[2],最常發生于胃 (50%~60%),其次小腸 (30%~40%),很少在食管及結腸中見到[1]。GIST具有一定的惡性分化潛能,目前主要采用改良的美國國立衛生研究院 (National Institutes of Health,NIH) 標準,美軍病理研究所 (Armed Force Institute of Pathology,AFIP)標準等判斷GISTs術后復發風險。>2 cm的GIST首選治療方法是手術切除。手術風險較高患者可先進行術前新輔助治療后再手術治療;術后復發風險高患者可進行伊馬替尼靶向治療[3]。因此,GIST診斷及其惡性潛能預測對治療方案的制定具有重要意義。
目前,臨床上GIST診斷常用的方法有CT、核磁共振、正電子發射斷層顯像 (positron emission tomography,PET)、常規胃腸鏡及超聲內鏡等。這些方法在GISTs診斷及其惡性潛能的預測方面各有劣勢。CT對于較小病變診斷及評估胃腸壁內情況效能不佳;核磁共振多用于評估直腸間質瘤的大小、局部侵襲情況及病變肝臟轉移情況;當轉移證據不明確或者復雜時,可考慮完善PET/PET-CT檢查;GIST病變多位于黏膜下層,常規胃腸鏡很難獲取足夠樣本進行組織學診斷且對胃腸道壁外病變觀察較差,常需進一步完善超聲內鏡檢查。然而僅依靠超聲內鏡診斷GIST的準確率較低,且受操作者經驗影響較大。新技術的發展為GIST的早期診斷及惡性潛能預測提供了新方法。其中,深度學習技術應用前景巨大。深度學習技術是人工智能 (artificial intelligence,AI) 的重要研究方向,利用神經網絡如卷積神經網絡 (convolutional neural network,CNN) 和循環神經網絡 (recurrent neural network,RNN) 建立計算機輔助診斷模型來協助臨床醫生進行診斷。深度學習技術已在消化道疾病 (早期食管癌[4]、早期胃癌[5]及大腸腺瘤樣息肉[6]等) 診斷中發揮協助作用。深度學習技術在GIST診斷中的應用包括CT檢查、常規內鏡和超聲內鏡檢查3個方面。本文就深度學習技術在GIST診斷及惡性潛能預測中的應用進行綜述。
CT檢查為腹部病變最常用的影像學檢查方法,也是GIST評估和隨訪的首選檢查[7]。CT對于直徑≥5 cm的GIST具有良好的診斷價值,但對于直徑<5 cm的GIST診斷價值較差[8]。利用深度學習模型,可顯著提高CT在GIST診斷及鑒別診斷中的價值。2021年GU等[9]研究通過建立基于增強CT的深度學習模型,對直徑≤5 cm的GIST與非GIST上皮下腫瘤進行鑒別診斷,深度學習模型的診斷準確性高于2位低年資影像醫師,與1位高年資影像醫師接近。
CT也可為術前預測GIST危險度分級提供相關信息,其中腫瘤大小、形狀、囊變壞死、生長方式、CT強化方式及程度等均與GIST危險度分級具有不同程度的相關性,但研究[10-13]得出的結論并不完全一致。利用深度學習技術可以較好地提升CT預測GIST危險度的準確性。1項納入了148例GIST病例的回顧性研究[14]發現,基于VGG16 CNN建立的二分類深度學習算法模型不僅對GIST核分裂像計數具有良好的預測性,還能較好預測GIST惡性潛能及生物學行為。另一項納入733例GIST病例的雙中心回顧性研究[15]也發現,利用CNN開發的深度學習模型對GIST術后復發風險分級具有良好的預測作用,且預測效能優于基于CT的影像組學。為了充分利用CT影像組學與深度學習技術的優點,NING等[16]引入并評估了一種包含影像組學和CNN選擇特征在內的混合結構。受試者工作特性曲線結果顯示,其預測GIST復發風險的能力始終高于單獨利用影像組學及單獨利用CNN;此混合結構充分利用影像組學與CNN的優點,具有良好的發展前景。
由于GIST與其他胃上皮下腫瘤內鏡下表現相似,且內鏡醫師的操作技術及識別病灶的能力參差不齊,鑒別診斷相對困難。目前,已有研究將常規內鏡檢查與深度學習技術相結合應用于胃部疾病的診斷。2021年,ZHANG等[17]進行了1項利用CNN進行胃部疾病診斷的回顧性研究,共納入1 121例,包含無病變、早期胃癌及高級別上皮內瘤變、進展期胃癌、上皮下腫瘤和消化道潰瘍等情況。結果發現,利用CNN構建的深度學習模型的診斷率與經驗豐富的內鏡醫師接近,上皮下腫瘤的診斷準確率為86%,有利于GIST早期診斷。同時該診斷模型可用于輔助快速診斷胃部病變,減輕了內鏡醫師工作量。最新的1項關于探究深度學習模型診斷胃部疾病作用的研究[18]發現,在模型輔助下,初高級內鏡醫師對胃部疾病的總體診斷準確率均升高,尤其初級內鏡醫師對上皮下腫瘤診斷的準確性及敏感性顯著提高,可見深度學習技術有利于GIST與其他上皮下腫瘤的鑒別診斷。
目前,基于胃鏡的深度學習技術聚焦于快速明確胃部疾病類型,有助于早期診斷GIST。但深度學習技術應用于腸鏡 (小腸鏡和結腸鏡) 診斷小腸及結直腸GIST尚未見報道,仍須進一步探索與實踐。
超聲內鏡檢查是將超聲和內鏡聯合起來,通過病變的位置、起源、大小、形態、邊緣、內部回聲及生長方式等特點來判斷其組織學及惡性程度。由于GIST有惡性分化潛能,因此與其他上皮下腫瘤的鑒別診斷尤為重要。典型GIST為起源于固有肌層的低回聲實性腫物,超聲內鏡易將其與脂肪瘤、胃腸外器官和腫物壓迫所致改變及靜脈曲張相鑒別,但與平滑肌瘤、神經鞘瘤的鑒別仍有難度[19]。GIST通常需進行組織學及病理學檢查來確診。超聲內鏡引導下細針穿刺抽吸術 (endoscopic ultrasound-guided fine needle aspiration,EUS-FNA) /超聲內鏡引導下細針穿刺活檢術 (endoscopic ultrasound-guided fine needle biopsy,EUS-FNB) 是目前可靠的獲取組織方法,雖然可提高胃上皮下腫瘤的診斷率,但仍有缺點:(1) 依賴因素較多。1項利用EUS-FNA/B診斷上消化道上皮下病變的Meta分析提示,EUS-FNA/B對上消化道上皮下病變的病理診斷效果中等 (59.9%)[20],且不同研究[21-22]結果顯示診斷率差別較大,可能與病變大小、取樣量不足及術者經驗相關。 (2) EUS-FNA/B有可能導致出血、感染、局部轉移等并發癥[23]。深度學習技術為GIST的超聲內鏡診斷和鑒別診斷提供了幫助[24-30]。MINODA等[25]發現基于超聲內鏡圖片建立的深度學習模型鑒別診斷直徑≥20 mm的GIST與非GIST上皮下腫物的準確率為90.0%;對于直徑<20 mm的準確率為86.3%;此EUS-AI模型對于直徑≥20 mm的GISTs與非GIST上皮下腫物具有良好鑒別診斷價值。KIM等[27]研究在得出基于內鏡超聲的AI模型區分GIST與非GIST的準確率為79.2%后,進一步將非GIST區分為平滑肌瘤與神經鞘瘤,其準確率為75.5%。YANG等[26]進行1項多中心研究,利用超聲內鏡圖像建立深度學習模型鑒別診斷GIST與平滑肌瘤,發現在前瞻性測試集中通過聯合診斷,超聲內鏡醫師對132例測試者的診斷總準確率從69.7%提高到78.8%。最新納入了7項研究共2 095例患者的meta分析[24]表明,基于AI的超聲內鏡診斷GIST的靈敏度及特異度分別為0.93和0.87。更大樣本的研究也證實了深度學習模型在診斷GIST方面較超聲內鏡醫師具有明顯的優勢。HIRAI等[28]進行了1項大樣本研究,收集了12家醫院的631例上皮下腫瘤患者,利用CNN構建深度學習模型,通過識別超聲內鏡圖像來進行5種分類診斷,包括GIST、平滑肌瘤、神經鞘瘤、神經內分泌瘤和異位胰腺,其診斷準確率為86.1%,明顯高于超聲內鏡醫師。2個獨立團隊開展的相關研究[29-30]同樣發現根據超聲內鏡圖片建立的深度學習模型對于GIST與平滑肌瘤的鑒別診斷優于超聲內鏡專家。因此可以認為,深度學習技術聯合超聲內鏡檢查診斷GIST更加客觀、快速,并且可以協助內鏡醫師診斷。
研究[31-33]顯示,根據超聲內鏡特征 (包括GIST大小、生長方式、有無囊變及壞死、有無破潰等) 判斷GIST危險度分級的結果并不一致。目前,只有腫瘤大小對危險度分級的影響是確切的,超聲內鏡尚不能在術前準確預測GIST的惡性潛能。深度學習技術有望提高超聲內鏡檢查術前預測GIST危險度分級的準確性。2022年,1項納入55例GIST患者的回顧性研究[31]顯示,根據AFIP標準將患者分為極低風險30例,低風險8例,中風險6例,高風險11例,將患者超聲內鏡圖片作為訓練集,構建CNN,進行深度學習,以7 ∶3比例進行訓練及驗證深度學習模型,然后前瞻性收集了15例GIST患者進行模型驗證。最終發現利用深度學習算法,通過超聲內鏡圖片可以高精度地預測胃間質瘤的惡性潛能。
目前,關于AI利用超聲內鏡圖片預測GIST惡性潛能的研究相對較少,未來將有很大的研究空間。
目前,已有的深度學習模型對于GIST的診斷及惡性潛能預測效能較好,具有診斷效率高,大幅減少醫生工作量、縮小專家與非專家診斷能力的差距,無侵入性等優點。然而,目前的研究仍有不足之處:(1) 多數研究為單中心小樣本回顧性研究;(2) 多數研究為二分類研究;(3) 多數研究在收集圖像過程中排除了低質量圖片。這些因素可能導致模型用于臨床的診斷效能低于預期。因此,未來需進一步開展多中心大樣本、多分類且包含了高質量與低質量圖像的研究,并嘗試將研究獲得的模型前瞻性地應用于臨床真實患者,以便早期更加精準診斷GIST及術前高精度預測惡性潛能,進而實現GIST個體化精準治療。