謝立平 沈海祥 應宇凡
人工智能(artificial intelligence,AI)是研究如何在機器上模擬人的認知功能,包括分析、學習及對相應問題作出類似甚至超越人類智能反應的一門學科[1]。為輔助臨床醫生更好地解決臨床問題,使臨床診療過程變得更加準確、高效,AI技術在醫學領域得到了快速發展和初步應用,主要包括輔助診斷、疾病相關風險預測[2]。目前,AI技術在乳腺癌[3]、皮膚癌[4]、腦部腫瘤[5]、前列腺癌[6]及心臟病[7-8]等疾病診治中的應用已有初步研究。作為AI技術的重要組成部分,機器學習(machine learning,ML)及深度學習(deep learning,DL)技術的開發極大地促進了其在醫學領域應用研究的發展。ML是通過算法的選擇,基于輸入的數據庫信息構建信息分類器,對數據信息進行自動化學習,分析其與目標值的相關性并建立模型,可對新輸入的數據進行相關性預測[9-10]。數據庫信息的不斷擴充可提升分類器的性能,進一步提高模型的預測效能。DL是指一種可使用多個處理層對數據進行特征學習的算法,通過建立人工神經網絡,利用輸入的數據庫信息得到訓練,從而提高數據特征的識別度[11]。DL技術尤其在圖像特征識別及分析方面具有強大的優勢。隨著AI技術在醫療健康領域的不斷發展與成熟,其在疾病預防、影像學診斷、個體化診療以及臨床決策中的應用受到越來越多的關注。本文就AI技術在泌尿系結石、腎癌、膀胱癌及前列腺癌診治中的應用作一述評,以期為廣大同行提供參考和新的啟發。
泌尿系結石是泌尿外科常見的疾病之一。隨著結石病因研究的深入以及微創碎石技術的進步,泌尿系結石的診療水平得到不斷提升。不同的碎石技術處理不同部位、不同種類的結石具有不同的結石清除率,直接影響結石患者術后復發率及二次手術率。因此,術前進行準確的預后評估并選擇合適的碎石方式十分重要。近來研究顯示,AI技術的應用有助于尿路結石的診斷和預后評估,并能輔助泌尿外科醫生及患者進行最優化的臨床決策。相關研究顯示,AI技術可用于結石種類的預測。2018年Kazemi等[12]構建了基于人工神經網絡算法的腎結石種類預測模型,該模型相關參數來自于2012—2016年單中心納入的936例腎結石患者的臨床資料,初步研究結果顯示其預測腎結石種類的準確率為97.1%。
在明確診斷的基礎上,碎石方式的選擇是影響患者預后的關鍵因素之一。2014年Kadlec等[13]基于單中心382例經內鏡碎石的腎結石患者資料開發了一項人工神經網絡模型,以用于預測腎結石患者經內鏡碎石術后結石清除率(腎-輸尿管-膀胱X線檢查顯示無可見結石或CT檢查顯示結石<4 mm)及術后二次手術率。該模型預測結石清除率的靈敏度、特異度、AUC分別為0.753、0.604和0.749,預測術后二次手術率的靈敏度、特異度、AUC分別為0.300、0.983和0.863。近年來針對輸尿管結石,Choo等[14]研發了基于DL算法的體外沖擊波碎石(extracorporeal shock wave lithotripsy,ESWL)療效的預測模型,其建模數據來源于791例輸尿管結石患者的臨床資料。初步研究結果表明,該模型對ESWL的療效預測準確率為92.3%;同時該模型也證實了結石體積、長徑及CT值是影響療效的重要因素。Seckiner等[15]的研究結果也表明,人工神經網絡可預測ESWL的結石清除率,并輔助臨床決策的制定。
腎癌是常見的泌尿系腫瘤之一。2018年全球腎癌患者約占所有腫瘤患者的2.2%,其死亡率約為1.8%[16]。隨著診療技術的發展,目前腎癌總生存率明顯提高,尤其對于早期確診患者,多數能通過手術處理獲得較好的生存預后;但是局部晚期及轉移性腎癌患者的預后仍較差[17-18]。因此,早期明確診斷是治療腎癌的關鍵。然而,對于偶然發現的腎臟小占位(≤4 cm),目前尚難以通過無創檢查明確診斷,這是臨床醫生實際工作中經常遇到的難題。近年來,利用DL算法技術對患者的臨床資料及影像學資料進行分析,以精準預測腫瘤類型及預后并輔助治療決策的制定是該領域的研究熱點。利用DL技術,研究人員試圖將腎腫瘤的影像學特征和腫瘤組織學分型、分級相關聯,從而建立精準的預測模型。
紋理分析是一種通過提取圖像紋理特征(包括灰度值等參數)從而獲得并分析其空間分布特征的圖像分析技術[19]。2015年Yan等[20]發現基于DL技術的紋理分析有助于腎臟小占位的鑒別診斷。該研究結果表明,通過紋理分析技術對腎臟的CT圖像進行分析,其鑒別腎錯構瘤、透明細胞腎癌及乳頭狀腎細胞癌的準確率為90.7%~100.0%。2018年Feng等[21]單中心研究結果顯示,基于CT圖像的紋理分析技術鑒別腎錯構瘤和腎癌的準確率、靈敏度、特異度、AUC分別為93.9%、0.878、1.000和0.955。其他研究團隊也相繼報道了類似的結果[22-23]。有文獻報道DL模型可通過對腎癌CT影像進行紋理分析來確定Fuhrman核分級,其準確率為73.0%~93.0%[24-25]。Bektas等[24]利用DL技術開發的SVM模型預測高級別腎癌的準確率、靈敏度、特異度、AUC分別為 85.1%、0.913、0.806和 0.860。
膀胱鏡檢查是膀胱癌明確診斷的主要方式。然而,膀胱原位癌(carcinoma in situ,CIS)在膀胱鏡下的表現與膀胱正常黏膜較難區分。有文獻報道,普通膀胱鏡對CIS診斷的靈敏度、特異度、準確率分別為0.777、0.827和79.3%;窄譜光成像膀胱鏡的診斷效能相對較高,其靈敏度、特異度和準確率分別為0.929、0.735和86.7%;熒光膀胱鏡可通過熒光區分病灶和正常黏膜,提高隱匿的小腫瘤和原位癌的檢出率[26-27]。為進一步提高CIS的檢出率,有學者利用AI技術對62例膀胱癌患者的MRI圖像進行紋理分析,提取出29個紋理特征應用于CIS與正常黏膜的鑒別,結果顯示診斷膀胱癌的靈敏度、特異度、AUC、準確率分別為 0.900、0.850、0.900 和 88.0%[28]。也有文獻報道,利用DL技術構建的紋理分析模型可基于MRI的彌散加權序列(DWI)圖像在術前區分高級別與低級別膀胱癌,其靈敏度、特異度、AUC、準確率分別為 0.780、0.870、0.860 和 83.0%[29]。2018 年 Eminaga等[30]報道了其開發的深度卷積神經網絡技術可輔助膀胱鏡下組織活檢,組織活檢醫生可對預測陽性區域進行靶向組織活檢,減少或避免不必要的組織活檢。尿液脫落細胞學檢查是診斷膀胱癌的重要輔助檢查之一。Sokolov等[31]發現,結合DL技術和原子力顯微鏡,對于含有5個細胞的尿液樣本,其對膀胱癌診斷的準確率為94.0%,提示尿液脫落細胞學檢查技術與膀胱鏡檢查相結合,可明顯提高膀胱癌的診斷效能。
目前也有AI技術在膀胱癌的復發及化療敏感性的預測方面研究的報道。Bartsch等[32]利用ML算法,篩選出和預后相關的主要基因,從而構建膀胱癌復發預測模型,旨在預測膀胱癌經尿道膀胱腫瘤切除術后5年復發率。在訓練組中,該模型預測膀胱癌復發的靈敏度和特異度分別為 0.800、0.900,在驗證組中為 0.710、0.670。對于肌層浸潤性膀胱癌患者,術前新輔助化療是改善其生存預后的重要治療方式之一。然而,不同患者對新輔助化療效果差異較大,而化療反應性的評估對患者治療方案的選擇十分重要。預測患者對新輔助化療的敏感性,不僅有利于合理配置醫療資源,還能減輕患者不必要的經濟負擔,提高患者的生活質量。2018年Cha等[33]從CT圖像提取相關參數,利用DL技術開發出一項計算機決策支持系統。該系統可輔助臨床醫生更準確地評估膀胱癌患者的化療反應性,優化治療方案。Wu等[34]基于膀胱癌患者的CT圖像信息,利用DL卷積神經網絡技術構建模型,探索其在預測膀胱癌化療敏感性中的應用價值。初步結果顯示該模型預測膀胱癌化療敏感性的AUC為0.790。
前列腺癌是男性人群中常見的惡性腫瘤之一,其發病率及死亡率均較高。2018年腫瘤相關統計數據顯示,全球前列腺癌的發病率約為13.5%,僅次于肺癌(14.5%),位列第二;前列腺癌相關死亡率為6.7%,位列第五[16]。然而,早期診斷、早期治療可明顯降低前列腺癌死亡率。
計算機輔助診斷系統(computer-aided diagnostic system,CAD)是醫學影像及病理圖像診斷的輔助工具,可對圖像特征進行自動分析處理,標注感興趣區域,并利用數據庫數據對感興趣區域進行診斷分析。早期有學者對CAD在乳腺癌[3]、肺癌[35]、直腸癌[36]等影像診斷中的應用進行了研究,結果顯示相對于經驗積累較少的閱片者,CAD可明顯提高其對腫瘤的診斷能力[37-38]。近來,基于前列腺MRI的圖像信息并結合AI技術,涌現出一系列應用于前列腺癌診斷的CAD。
Peng 等[39]利用前列腺多參數 MRI(mpMRI)的圖像信息,包括 T2加權、彌散加權及動態對比增強序列圖像,從中提取圖像特征信息,用于計算機輔助診斷前列腺癌。以AUC作為診斷效能的評價指標,通過線性判別分析法對表觀擴散系數(apparent diffusion coefficient,ADC)的第10百分位數、ADC平均數、T2加權序列的信號強度偏態直方圖及Tofts模型的容積轉移常數Ktrans進行單獨和聯合分析。結果顯示上述指標單獨分析時,鑒別前列腺癌與正常組織的AUC分別為0.92±0.03、0.80±0.03、0.86±0.04、0.69±0.04;而聯合 ADC 的第 10百分位數、平均ADC和T2加權偏態直方圖的AUC為0.95±0.02。
Reda等[40]首次將臨床生物標志物和DL算法結合,利用前列腺MRI中的DWI序列圖像信息和前列腺特異抗原(prostate specific antigen,PSA)開發出一種用于前列腺癌早期診斷的CAD。該系統通過對前列腺DWI圖像及相應PSA信息進行預處理,提取特征信息,建立融合上述2種信息的SNCSAE分類器,最終建立特殊算法輸出最后診斷結果。該系統的初步研究結果顯示,其診斷準確率為94.4%,靈敏度和特異度分別為0.889、1.000。
Gleason評分與前列腺癌生物學行為密切相關,也是評估前列腺癌患者預后的重要指標之一[41]。Gleason評分越高,表明前列腺癌惡性程度越高,預后越差。因此,診斷早期對患者進行準確的Gleason評分風險分組和預后評估,并據此給予相應的治療方案顯得十分重要[42]。目前在臨床實踐中,病理科醫生主要通過前列腺穿刺活檢或根治手術獲得的病理組織在顯微鏡下的特征分析得出Gleason評分。Donovan等[43]為提高Gleason評分評估的準確性,利用ML,通過圖像分析技術提取病理組織鏡下特征并結合生物標志物(AR、Ki-67等)特征,開發了前列腺癌術后臨床復發預測模型。訓練數據(n=306)的結果顯示,該模型預測前列腺癌臨床復發的一致性指數為 0.82(95%CI:0.76~0.86),HR為 6.7(95%CI:3.59~12.45),P<0.01;驗證數據(n=284)的結果顯示,一致性指數為 0.77(95%CI:0.72~0.81),HR為 5.4(95%CI:2.74~10.52),P<0.01。Boesen 等[44]發現,前列腺 mpMRI的ADC與前列腺癌Gleason評分相關。在鑒別Gleason評分6分與≥7分的前列腺癌中,腫瘤組織ADC、正常組織與腫瘤組織的ADC比值(ADCnormal/ADCtumor)的AUC分別為 0.73、0.80,在鑒別 Gleason 評分≤7(3+4)分和≥7(4+3)分的前列腺癌中,兩者的 AUC 分別為 0.72、0.90。Peng等[39]研究也得到類似的結果。Abdollahi等[45]研究結果進一步證實了ADC和Gleason評分的相關性,利用ML技術,基于前列腺MRI圖像信息建立了影像組學預測模型,該模型對Gleason評分和臨床分期預測結果的平均AUC為0.70、0.68。
1990年,德國基爾大學的Tillmann Loch教授創新性地將人工神經網絡技術運用于經直腸前列腺超聲檢查(transrectal ultrasonography,TRUS),以助于前列腺癌的早期診斷。筆者作為項目參與者,于2013年將該技術引入中國,并對該技術進行了優化和發展,將其命名為“AI前列腺超聲(artificial intelligence ultrasound of prostate,AIUSP)”。本中心的初步研究結果提示,AIUSP引導下的前列腺穿刺活檢總陽性率為46.2%,平均穿刺針數為(4.9±1.0)針,平均 Gleason評分為(6.8±0.8)分。其中首次穿刺者的穿刺陽性率為51.5%(17/33),重復穿刺者的穿刺陽性率為36.8%(7/19)[46]。在此基礎上,筆者所在團隊進一步開展了一項比較AIUSP靶向穿刺(AIUSP組)、12針系統穿刺(系統穿刺組)及mpMRI輔助12針系統穿刺(mpMRI組)的隨機對照研究,初步相關結果已于2017年歐洲泌尿外科年會上進行了匯報[47]。本研究共納入了284例前列腺穿刺患者,研究結果顯示:(1)AIUSP組前列腺癌檢出率最高,為 47.0%,系統穿刺組和mpMRI組分別為35.6%、35.7%,差異無統計學意義(P>0.05);(2)總穿刺患者中的每針陽性率,AIUSP組為22.7%,明顯高于系統穿刺組的11.3%和mpMRI組的13.4%,差異均有統計學意義(均P<0.01);(3)確診為前列腺癌的患者中,AIUSP組、系統穿刺組、mpMRI組的每針陽性率分別為48.3%、31.9%、37.6%,差異有統計學意義(P<0.01);(4)AIUSP 組每診斷 1例前列腺癌平均只需穿刺12.8針,而系統穿刺組和mpMRI組分別需要穿刺33.7、33.6針。AIUSP通過指導前列腺靶向穿刺,能以較少的穿刺針數取得較高的穿刺陽性率,并能發現既往穿刺陰性的前列腺癌,具有重要的臨床應用價值。
AI技術不僅在前列腺癌的輔助診斷上具有應用價值,對于前列腺癌臨床治療決策的制定也具有一定的指導意義。放療是前列腺癌治療的重要手段,安全、有效且治療相關并發癥較少[48]。但是因腫瘤細胞異質性的存在,不同前列腺癌患者對放療的敏感性存在差異。治療前有效篩選出放療獲益人群可減少甚至避免患者的過度治療。Abdollahi等[45]利用前列腺MRI組學信息結合ML技術開發了前列腺癌對調強適形放療技術(intensity-modulated radiation therapy,IMRT)敏感性的預測模型。該研究將病灶治療前后在MRI中ADC的改變率作為評價敏感性的指標,ADC改變率>20%表明對治療敏感。該研究共納入33例接受IMRT治療的前列腺癌患者,其中15例(45%)患者對IMRT治療敏感;基于治療后的T2組學模型對于鑒別前列腺癌患者是否對放療敏感的AUC為0.626。
臨床決策是指診斷確立后,患者及家屬在醫生的指導下,在多種治療方案中擇優選擇對患者最合適的治療方案。為了讓患者更好地參與臨床決策的制定,Auffenberg等[6]利用ML技術開發出一項治療方案預測系統。該系統的原理是通過ML等技術對納入研究的前列腺癌患者臨床信息及其選擇的治療方案進行特征提取并分類,最終形成一種特定算法。將患者臨床相關信息輸入該系統后,通過該算法,系統可依據已有數據庫信息輸出最優治療方案。該系統對前列腺癌患者治療方案選擇的預測具有較高的準確性,AUC為0.81。同時通過該系統,患者可依據自身的疾病現狀,了解之前其他類似患者治療方案的選擇及相應治療結果,更好地選擇最優治療方案并獲益。
近年來,隨著AI技術在醫療領域的蓬勃發展,疾病的診治即將進入智能醫療時代。在泌尿系結石及腫瘤的診治領域中,臨床醫生的診療經驗結合AI技術開發的輔助診斷系統、疾病相關風險及療效預測模型,不僅可以提高泌尿系疾病的診斷效能,而且在一定程度上可輔助臨床決策的制定,最終使患者獲益。然而,目前的研究結果多基于單中心研究,存在研究數據較少等缺陷,未來仍需開展大規模、多中心研究進一步證實AI技術在泌尿外科領域的應用價值。
(本文由浙江省醫學會推薦)