楊焱垚 陳堅 曾于珍 邱冬妮 劉杰
摘 要 本文介紹計算機輔助診斷系統在提高腸鏡息肉和腺瘤檢出率上的作用,重點介紹微識醫療科技(上海)有限公司的腸道癌前病變檢測產品EndoScreener用于結直腸息肉檢測的2項隨機、對照臨床試驗情況,最后展望了未來人工智能在腸鏡檢查中的應用前景。
關鍵詞 計算機輔助診斷系統 腸鏡 息肉 腺瘤 結直腸癌 人工智能
中圖分類號:TP391.5; R730.49 文獻標志碼:A 文章編號:1006-1533(2020)23-0006-04
Research progress in computer-aided diagnosis system for the improvement of detection rates of the polyp and adenoma of colonoscopy
YANG Yanyao, CHEN Jian*, TSENG Yujen, QIU Dongni, LIU Jie
(Department of Gastroenterology, Huashan Hospital, Fudan University, Shanghai 200040, China)
ABSTRACT The effects of computer-aided diagnosis system on the detection rates of the polyp and adenoma of colonoscopy are reviewed in this article. EndoScreener, a kind of novel artificial intelligence product invented by Wision AI which is helpful for intestinal precancerous lesions detection, is described in detail in two randomized controlled clinical trials. The application prospects of artificial intelligence in colonoscopy are also predicted in the end.
KEy WORDS computer-aided diagnosis system; colonoscopy; polyp; adenoma; colorectal cancer; artificial intelligence
結直腸癌亦被稱為大腸癌,是發生于結腸和直腸的腫瘤的總稱,屬常見腫瘤,是世界范圍內位列發病率第三、死亡率第四的腫瘤[1]。我國2015年的統計也顯示,我國結直腸癌的發病率和死亡率在各腫瘤中分別位列第四(376.3例/10萬人)和第五(191例/10萬人)[2],較過去相比有明顯的上升趨勢。與其他常見腫瘤不同,結直腸癌有發生和發展相對緩慢、早期篩查相對容易的特點,可通過三級預防有效降低其發生風險[3]。結直腸息肉是生長在腸道內壁的異常組織,有良、惡性之分,在病理學檢查確診前統稱為息肉,而腺瘤性質的息肉則為結直腸癌的早期病變形態。腸鏡檢查能發現和觀察腸道內的異常改變,對可疑組織進行切除、病理學活檢和隨訪,從而實現結直腸癌的早期篩查和早期治療。
高質量的腸鏡檢查可提高息肉和腺瘤的檢出率,從而降低結直腸癌的發生率和死亡率[4]。一項回顧性研究顯示,約有6‰的患者在接受腸鏡檢查或治療后的4年內發生了間期癌(interval cancer,即2次腸鏡檢查間歇期內發生的結直腸癌)[5]。分析其成因,發現漏檢是間期癌發生的主要原因(約占52%)。為保證腸鏡檢查的質量,美國和歐洲的消化內鏡協會均制定了指導性的規范[4, 6],明確內鏡醫師的腺瘤檢出率不得<25%。腺瘤檢出率是一種常用的腸鏡檢查質量評價指標,其定義為一名內鏡醫師在進行以篩查為目的的腸鏡檢查中發現病理學確診的腺瘤或腺癌的平均比例。息肉檢出率是另一種常用的腸鏡檢查質量評價指標,定義是一名內鏡醫師在進行以篩查為目的的腸鏡檢查中觀察到肉眼可見息肉的平均比例。息肉檢出率的統計范圍較腺瘤檢出率廣,但腺瘤檢出率與結直腸癌的關聯更為密切,臨床上普遍以腺瘤檢出率作為腸鏡檢查質量評價的核心指標。循證醫學證據表明,腺瘤檢出率提高1%,結直腸癌發生風險就可降低3%[7]。“中國城市癌癥早診早治項目”(Cancer Screening Program in Urban China, CanSPUC)是我國首項進行腺瘤檢出率統計的大規模腫瘤篩查臨床研究,其顯示我國的腺瘤檢出率僅為11.49%[8],遠遠低于發達國家實際水平,也遠低于美、歐消化內鏡規范要求的≥25%。
在諸多影響腺瘤檢出率的因素中,內鏡的操作因素和醫師的人為因素有較大的改善空間[4, 9],充分的退鏡觀察[10]、訓練有素的內鏡操作技能[11]以及充沛的工作精力[12]都是提高腺瘤檢出率的堅實保障。此外,應用人工智能也有望提高腸鏡檢查的腺瘤檢出率[13]。
人工智能在醫學上有多種應用,根據用途可分為計算機輔助診斷、計算機輔助手術、計算機手術導航和計算機輔助決策等。其中在消化內鏡領域,人工智能主要用于開發計算機輔助診斷系統,后者還可根據用途細分為計算機輔助檢測(computer-aided detection, CADe)和計算機輔助診斷(computer-aided diagnosis, CADx)[13]。CADe可自動查找并提示內鏡圖像中的異常內容或區域,主要用于輔助白光內鏡和膠囊內鏡檢查,能依靠目標識別技術,減少內鏡醫師觀察上的疏忽和紕漏,降低息肉或其他異常組織的漏檢率。CADx則可自動判斷內鏡圖像中病灶的病理學類型,主要用于輔助放大內鏡、電子染色內鏡和共聚焦顯微內鏡檢查[14],能通過計算機識別內鏡圖像中的細節特征,預測病理學分類,達到視覺活檢(optical biopsy)的目的。除上述兩大功用外,人工智能還可用于消化內鏡檢查的質量管理。例如,我國武漢大學人民醫院消化內科開發的“內鏡精靈”能在腸鏡檢查中對退鏡速率和腸道準備進行自動評估,保證腸鏡檢查的質量[15]。
腸道息肉檢測的臨床意義重大,但其篩查也極具挑戰性。CADe發現息肉是CADx預測息肉病理學類型的基礎。一種結合了CADe和CADx的計算機輔助診斷系統需首先有一雙敏銳的“眼睛”才能開展準確的病理學預測。人工智能在消化內鏡領域的應用最早可追溯到2003年發表的一項關于CADe的探索性研究報告[16]。該研究分析了腺瘤性息肉的顏色特征,設計出一種機器學習算法來檢測腸鏡圖像中的腸道腺瘤,結果顯示檢測的特異性和敏感度分別達到97%和90%。早期的人工智能使用機器學習的方法,其思想是把人的經驗轉化為計算機可運算的范式或代碼。以息肉檢測為例,研究者需歸納息肉的腸鏡圖像特征,包括顏色、紋理、輪廓等,再轉化為可計算和量化的數學語言,封裝成程序后讓計算機去處理圖像。卷積神經網絡的出現大大推動了深度學習的發展和應用,其以監督學習為主要代表,研究者無需編寫面面俱到的描述性語言,而是將帶有人工標注的海量數據直接交于計算機,讓計算機自行提取原先由人的經驗設計出來的特征。同樣以息肉檢測為例,首先由內鏡醫師給腸鏡圖像標注標準答案,即把真陽性和真陰性的圖像挑選出來,并用矩形框或多邊形描繪出真陽性圖像中息肉的確切區域,然后將這些標注過的圖像輸入計算機,選擇適合的算法和參數,就能得到一個息肉識別模型。深度學習是一種開源工具,加之Python語言簡單易學,大大降低了人工智能應用研究的入門門檻,迄今發表的關于腸鏡檢查CADe和CADx的研究報告已逾百篇[13, 17]。
我國是互聯網大國。從2015年開始,國務院、國家發改委等連續印發了多個政策性文件,逐步將人工智能發展和應用提升到國家戰略層面,明顯利好于人工智能醫療的發展。同時,包括阿里巴巴、騰訊、華為在內的諸多互聯網企業的云計算平臺都提供一站式的人工智能開發平臺,研究者只需握有標注好的醫學數據,就可自助構建人工智能應用模型。
我國的計算機輔助診斷系統研究走在世界前列。2019年,我國四川省人民醫院內鏡中心和美國哈佛醫學院聯合發表了一篇關于使用中國內鏡影像輔助診斷提供商微識醫療科技(上海)有限公司(即Wision AI公司)的CADe系統提高腸鏡檢查中息肉和腺瘤檢出率的研究論文[18]。這項開放性、前瞻性臨床試驗共對1 058例患者進行了診斷性結腸鏡檢查,他們被隨機分為伴或不伴CADe 2組,CADe在發現息肉時會有視覺提示和聲音報警。結果顯示,該CADe系統可顯著提高腺瘤檢出率(分別為29.1%和20.3%,P<0.001)和每個患者的息肉檢出個數(分別為0.53和0.31個,P<0.001),且能發現更多的小腺瘤(分別為185和102個,P<0.001),而大腺瘤檢出個數則2組無統計學顯著差異(分別為77和58個,P=0.075)。伴CADe組的增生性息肉檢出個數也顯著更多(分別為114和52個,P<0.001)。研究表明,在腺瘤檢出率低的人群中,該CADe系統可顯著提高小腺瘤和增生性息肉的檢出個數,但2組的費用效益比還待進一步的分析。
此外,為進一步避免操作者偏倚,四川省人民醫院內鏡中心又對Wision AI公司的腸道癌前病變檢測產品EndoScreener進行了一項隨機、雙盲、對照臨床試驗[19]。2018年9月3日—2019年1月11日,該中心共招募了1 046例年齡在18 ~ 75歲間的自愿接受診斷性結腸鏡篩查的受試者。受試者的排除標準除炎癥性腸病、結直腸癌、有結直腸手術史和存在活檢禁忌的患者外,還包括既往腸鏡檢查不成功、罹患息肉病綜合征和高度疑為炎癥性腸病或結直腸癌的患者(共排除36例)。將入組患者隨機分配至使用CADe系統組(508例)或常規結腸鏡檢查組(502例)。為了摒除研究者(內鏡醫師)相關的主觀偏差和個人偏好,Wision AI公司還預先設計了一種偽人工智能系統,后者不會提示真實的癌前病變,且保證有與真人工智能系統相同的超低的誤報率,以此防止內鏡醫師能主觀判別出真、偽人工智能系統。真、偽人工智能系統組的患者也都不知道自己所處組別。4名資深內鏡醫師在對患者進行常規的白光結腸鏡檢查時,如他們宣告發現了息肉,真、偽人工智能系統都保持沉默;但如內鏡醫師的視野范圍內出現了息肉且該息肉即將移出視野范圍時內鏡醫師還未宣告發現息肉,則真人工智能系統會發出提示,而偽人工智能系統仍保持沉默。為實現偽裝,系統輸出顯示在第2個監視器上,僅負責報警的觀察者可見。該試驗的臨床試驗注冊號是ChiCTR1800017675。在人工智能醫療研究領域,全球迄今進行的隨機、對照臨床試驗僅有5項,其中此項研究是第一項,也是規模最大的一項隨機、對照臨床試驗。
根據腸鏡檢查的完成情況,對入組患者進行再次篩選,484例患者(從上述508例患者組中挑選)被分配至使用CADe系統組,478例患者(從上述502例患者組中挑選)被分配至偽人工智能系統組。結果發現,使用CADe系統組的腺瘤檢出率顯著高于偽人工智能系統組:使用CADe系統組中有165例患者(34%)被檢出有1個或多個腺瘤,而偽人工智能系統組中有132例患者(28%)被檢出有腺瘤(優勢比=1.36,95%可信限:1.03, 1.79;P=0.030)。所有結腸鏡檢查均無術后不良反應。在使用CADe系統組中有159個病灶被內鏡醫師漏檢,但將這些病灶讓未參與研究的資深內鏡醫師進行分析,檢出的敏感度和特異性依舊不高。這些易被漏檢的息肉具有以下特征:通常體積小,與周圍組織顏色相同,形狀平坦,邊界不清,部分隱匿在結腸皺褶后或位于視野邊緣。此事實也證實了CADe系統具有可在實際臨床情境下輔助內鏡醫師診斷的積極效用。此外,在結腸鏡檢查過程中,偽人工智能系統平均每次發現0.38個腺瘤、0.64個息肉,CADe系統則平均每次發現0.58個腺瘤、1.04個息肉,無論從腺瘤檢出率還是從息肉檢出率上看,EndoScreener都能顯著提高內鏡醫師的腸道癌前病變檢出率。
德國Fraunhofer IIS公司開發的KoloPol也是一種腸鏡檢查用息肉識別CADe系統,并已有一項前瞻性臨床試驗[20]評價了其診斷價值。該前瞻性臨床試驗共納入55例患者,由內鏡醫師進行常規腸鏡檢查(內鏡醫師組);同時,腸鏡檢查的視頻信息同步傳送至另一房間,在此房間使用CADe系統進行獨立判斷(CADe系統組)。結果顯示,內鏡醫師組的息肉和腺瘤檢出率分別為56.4%和30.9%,CADe系統組的息肉和腺瘤檢出率分別為50.9%和29.1%。
在人工智能正式得到日常臨床應用前,除進行前瞻性臨床試驗外,還有很長的路要走。人工智能和臨床醫學的研究者曾共同提出醫學影像領域的人工智能應用系統須滿足的4個要求[21]:①提高醫學診斷的準確度和效率;②節減時間;③可無縫融入日常醫療工作;④不會增加醫務工作者的法律負擔,也不會提高醫療成本。美國消化內鏡協會倡導將這4個要求作為消化內鏡領域CADe系統研究的參考[13, 22]。針對腸鏡下息肉識別此應用目的,從我國的國情出發,筆者認為我國的CADe系統應有如下表現:①具有與內鏡醫師相匹配的腺瘤檢出率(或其他腸鏡檢查質量管理指標值),且反饋時間不晚于內鏡醫師的判斷時間;②在不增加腸鏡檢查耗時的前提下提高息肉和腺瘤的檢出率;③在腸鏡檢查中能實時提供反饋,既不分散內鏡醫師的注意力,又不增加內鏡醫師的工作負擔;④通過國家藥品監督管理局等相關部門的認證,不會增加患者的醫療負擔。
2012年的統計數據顯示,我國消化內鏡醫師占全部注冊執業醫師的比例為1.06%[23],每百萬人口擁有消化內鏡醫師19.59人,不及日本等發達國家的1/10。消化內鏡醫師的地區分布與地區的GDP正相關。在全部消化內鏡醫師中,30.95%為專職消化內鏡醫師,69.05%為兼職消化內鏡醫師。消化內鏡醫師人數不足且地區分布不均、專業性有待加強是我國結直腸癌早診早治工作開展的“瓶頸”,而人工智能的發展和應用有望從技術層面上打破這一困境,四川省人民醫院內鏡中心等獲得的研究成果讓我們看到了美好的希望。
參考文獻
[1] Siegel RL, Miller KD, Jemal A. Cancer statistics, 2018 [J]. CA Cancer J Clin, 2018, 68(1): 7-30.
[2] Chen W, Zheng R, Baade PD, et al. Cancer statistics in China, 2015 [J]. CA Cancer J Clin, 2016, 66(2): 115-132.
[3] Brenner H, Chen C. The colorectal cancer epidemic: challenges and opportunities for primary, secondary and tertiary prevention [J]. Br J Cancer, 2018, 119(7): 785-792.
[4] Rex DK, Schoenfeld PS, Cohen J, et al. Quality indicators for colonoscopy [J]. Gastrointest Endosc, 2015, 81(1): 31-53.
[5] Robertson DJ, Lieberman DA, Winawer SJ, et al. Colorectal cancers soon after colonoscopy: a pooled multicohort analysis[J]. Gut, 2014, 63(6): 949-956.
[6] Kaminski MF, Thomas-Gibson S, Bugajski M, et al. Performance measures for lower gastrointestinal endoscopy: a European Society of Gastrointestinal Endoscopy (ESGE) quality improvement initiative [J]. Endoscopy, 2017, 49(4): 378-397.
[7] Corley DA, Jensen CD, Marks AR, et al. Adenoma detection rate and risk of colorectal cancer and death [J]. N Engl J Med, 2014, 370(14): 1298-1306.
[8] Chen H, Li N, Ren J, et al. Participation and yield of a population-based colorectal cancer screening programme in China [J]. Gut, 2019, 68(8): 1450-1457.
[9] Lieberman D, Mascarenhas R. Adenoma detection rate: in search of quality improvement, not just measurement [J]. Gastrointest Endosc, 2015, 82(4): 683-685.
[10] Barclay RL, Vicari JJ, Greenlaw RL. Effect of a timedependent colonoscopic withdrawal protocol on adenoma detection during screening colonoscopy [J]. Clin Gastroenterol Hepatol, 2008, 6(10): 1091-1098.
[11] Kaminski MF, Anderson J, Valori R, et al. Leadership training to improve adenoma detection rate in screening colonoscopy: a randomised trial [J]. Gut, 2016, 65(4): 616-624.
[12] Marcondes FO, Gourevitch RA, Schoen RE, et al. Adenoma detection rate falls at the end of the day in a large multi-site sample [J]. Dig Dis Sci, 2018, 63(4): 856-859.
[13] Byrne MF, Shahidi N, Rex DK. Will computer-aided detection and diagnosis revolutionize colonoscopy? [J]. Gastroenterology, 2017, 153(6): 1460-1464.e1.
[14] van der Sommen F, Curvers WL, Nagengast WB. Novel developments in endoscopic mucosal imaging [J]. Gastroenterology, 2018, 154(7): 1876-1886.
[15] Zhou J, Wu L, Wan X, et al. A novel artificial intelligence system for the assessment of bowel preparation (with video)[J]. Gastrointest Endosc, 2020, 91(2): 428-435.e2.
[16] Karkanis SA, Iakovidis DK, Maroulis DE, et al. Computeraided tumor detection in endoscopic video using color wavelet features [J]. IEEE Trans Inf Technol Biomed, 2003, 7(3): 141-152.
[17] Le Berre C, Sandborn WJ, Aridhi S, et al. Application of artificial intelligence to gastroenterology and hepatology [J]. Gastroenterology, 2020, 158(1): 76-94.e2.
[18] Wang P, Berzin TM, Glissen Brown JR, et al. Real-time automatic detection system increases colonoscopic polyp and adenoma detection rates: a prospective randomised controlled study [J]. Gut, 2019, 68(10): 1813-1819.
[19] Wang P, Liu X, Berzin TM, et al. Effect of a deep-learning computer-aided detection system on adenoma detection during colonoscopy (CADe-DB trial): a double-blind randomised study [J]. Lancet Gastroenterol Hepatol, 2020, 5(4): 343-351.
[20] Klare P, Sander C, Prinzen M, et al. Automated polyp detection in the colorectum: a prospective study (with videos)[J]. Gastrointest Endosc, 2019, 89(3): 576-582.e1.
[21] van Ginneken B, Schaefer-Prokop CM, Prokop M. Computeraided diagnosis: how to move from the laboratory to the clinic[J]. Radiology, 2011, 261(3): 719-732.
[22] Leggett CL, Wang KK. Computer-aided diagnosis in GI endoscopy: looking into the future? [J]. Gastrointest Endosc, 2016, 84(5): 842-844.
[23] 王洛偉, 辛磊, 林寒, 等. 中國消化內鏡技術發展現狀[J].中華消化內鏡雜志, 2015, 32(8): 501-515.