寧麗潔 ,胡秋根(通訊作者)
(1.廣東醫(yī)科大學,廣東 523808;2.廣東醫(yī)科大學順德婦女兒童醫(yī)院(佛山市順德區(qū)婦幼保健院)放射科,廣東 528300;3.南方醫(yī)科大學順德醫(yī)院 放射科,廣東 528300)
乳腺癌已成為全球最常見的惡性腫瘤[1],也是全球女性發(fā)病率和死亡率最高的惡性腫瘤,已嚴重危害女性的健康,在我國乳腺癌疾病發(fā)病率亦呈逐年上升趨勢[2]。乳腺癌可防可治,早期乳腺癌生存率極高,因此乳腺癌的早期診斷、早期治療,對患者的預后及生存時間有著重要影響。乳腺癌有多種影像學檢查方法,如乳腺超聲、乳腺X線攝影、乳腺磁共振等。乳腺X線攝影是目前女性乳腺癌篩查影像檢查中最常用的方法。隨著國家對乳腺癌篩查工作的大力推進以及人們對乳腺健康意識的不斷提高,越來越多女性開始關注乳腺X線攝影檢查。日常繁復的影像診斷和大量乳腺癌篩查人群,加重了影像醫(yī)生的工作負荷。因此,如何提高乳腺癌的檢出效率、準確率,減少漏診率及誤診率,是目前影像醫(yī)學領域亟待解決的問題之一。
隨著人工智能在醫(yī)學影像領域的快速發(fā)展,人工智能在乳腺X線攝影中也得到廣泛應用。基于此筆者就人工智能的發(fā)展及其在乳腺X線攝影方面的應用進行綜述。
人工智能(Artificial Intelligence,AI) 最先由 20世紀 50 年代 John McCarthy 等提出[4],是主要研究并開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學,主要包括機器學習 (Machine Learning,ML)[6]和深度學習(Deep Learning,DL)[5]。 機器學習作為人工智能的一個核心分支,主要通過訓練機器學習樣本數(shù)據(jù),并從中提取最佳特征,以對未知數(shù)據(jù)進行模型的建立。最常用的算法包括人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM) 、隨機森林(Random Forest, RF) 、K-均值算法(K-Means)等。經(jīng)典ML按照訓練方法分類,可以分為監(jiān)督學習、非監(jiān)督學習和強化學習等3類[7]。深度學習作為ML的一個子集,也是目前最流行的研究方法,可自動提取在大數(shù)據(jù)中有意義的特征[8],包括文本識別、數(shù)字圖像識別和目標識別等3個階段的圖像識別發(fā)展。卷積神經(jīng)網(wǎng)絡 (Convolutional Neural Network,CNN)作為深度學習中最成功的算法之一,其能在位于輸入信號中不同空間位置的相似特征里提取較高等級信息[9],使得CNN在處理視覺識別及語音識別等方面均獲得出巨大成功[10],尤其在視覺識別方面有較高的性能優(yōu)勢,因此CNN在圖像處理方面的成就尤為突出。
20世紀60年代,計算機輔助診斷(Cumputer-Aided Diagnosis,CAD)系統(tǒng)已開始在乳腺醫(yī)學影像領域應用,也是AI技術在乳腺X線攝影中的最早應用。CAD是一種通過使用計算機以及統(tǒng)計學等方法,對醫(yī)學影像圖像進行處理與分析,提取其特征并對可疑病變位置進行標注、對檢出的病灶進行分類的AI技術[11]。傳統(tǒng)的CAD系統(tǒng)機器學習算法使用的是監(jiān)督學習(supervised learning),即通過使用人工對目標任務的特征進行訓練,使其達到所要求的性能[12]。隨著AI技術的不斷發(fā)展以及乳腺X線檢查人數(shù)的劇增,傳統(tǒng)CAD對病灶的評估時間長、系統(tǒng)性能不穩(wěn)定、假陽性率高、敏感性較低等缺點也愈發(fā)凸顯。深度學習使用非監(jiān)督學習(Unsupervised learning),能自動提取有意義的特征,突破了手工設計特征的局限性[13]。與傳統(tǒng)CAD不同點在于,基于深度學習算法的CAD系統(tǒng)使用的方法是對模型的構建以及對影像樣本數(shù)據(jù)的訓練,從而使CAD模型具有更高的敏感度和準確率[14]。
基于深度學習算法的乳腺CAD系統(tǒng)的各種性能指標相較于傳統(tǒng)CAD均有明顯提高,使得AI技術在醫(yī)學影像方面的應用尤其是在乳腺X線攝影中的應用更加廣泛。
乳腺癌病因尚未明確,目前仍以二級預防為主。通過實施有效、便捷的影像學檢查,對乳腺癌進行篩查,以期達到早發(fā)現(xiàn)、早診斷和早治療,降低乳腺癌死亡率的目的。乳腺X線攝影是乳腺癌篩查檢查中最常用的方法。由于影像醫(yī)生工作量大,且醫(yī)師的閱片狀態(tài)受經(jīng)驗、水平等多方因素干擾,因此難以統(tǒng)一乳腺X線診斷的準確性及診斷效率。
Rodriguez 等(2019)[15]研究顯示,AI 可以減少乳腺癌篩查放射科醫(yī)師的閱片工作量,當使用5分作為閾值時(>5分為存在乳腺癌高可能性),可以將放射科醫(yī)師的閱片工作量減少約一半(-47%),同時排除了 7%的真陽性病人。Martín 等(2022)[16]評估了15 998名女性 15 999次數(shù)字乳腺X線攝影檢查(DM),結果顯示,AI在 DM 中的 AUC 為 0.93(95%CI:0.89-0.96)。對于 DM,AI的非劣效敏感度與 1位影像醫(yī)生評估 (58.4%;66/113 例;95%CI:49.2-67.1)或 2位影像醫(yī)生評估(67.3%;76/113 例;95%CI:58.2-75.2)分別比較,其降低召回率高達 2%(95%CI:-2.4--1.6)(P<0.001),與人工評估相比,AI在DM中的召回率較低。此外,研究顯示,在乳腺X線攝影的乳腺篩查中,應用AI可以減輕放射科醫(yī)生的工作量,AI可以替代放射科醫(yī)生在乳腺篩查中的評估,同時保障乳腺篩查質(zhì)量。 Larsen等(2022)[17]對乳腺X線篩查結果進行人工智能評估。該研究為多中心研究,共納入2009年至2018年的47 877名女性患者,共完成122 969次乳腺篩查。結果顯示,在不同閾值條件下,AI系統(tǒng)在乳腺癌檢測中整體性能均較穩(wěn)定,其中AI系統(tǒng)未能檢出的篩查癌比例均低于20%。另有文獻[18]報道,在乳腺癌篩查中,通過使用AI系統(tǒng),可有效降低乳腺癌篩查中間期癌的發(fā)生率。此外,基于深度學習的AI系統(tǒng)在乳腺癌篩查中[18-19],結果顯示與經(jīng)驗豐富的放射科醫(yī)師的診斷水平相當。由此可見,AI系統(tǒng)可以作為乳腺癌篩查的有效輔助診斷工具,提高放射醫(yī)師的工作效率。AI系統(tǒng)提供的診斷結論準確率可靠,可供放射醫(yī)生參考,在保障篩查質(zhì)量的同時,更讓廣大女性乳腺癌篩查人群獲益。
鈣化、腫塊、結構扭曲以及不對稱致密影是乳腺疾病的四大主要征象[20]。在乳腺X線檢查中,乳腺CAD系統(tǒng)對腫塊和鈣化的特征識別能力較敏感,但是對結構扭曲和不對稱致密影相對研究較少[21]。在乳腺X線攝影中,乳腺癌最常見的主要征象是腫塊,但是影像醫(yī)生對腫塊的判斷具有較強的主觀性。此外,由于中國女性的乳腺腺體普遍較致密,高密度腺體組織容易對部分微小病灶遮擋而顯示不清,容易造成漏診誤診等情況。基于大量訓練的乳腺CAD系統(tǒng),可以根據(jù)圖像中的信息特征識別出病灶中更細微且人眼難以識別的特征,更好地幫助影像醫(yī)師提高病灶的檢出率。因此,乳腺CAD系統(tǒng)相較于人工對腫塊的檢出及分類更加客觀且性能穩(wěn)定。張興梅等(2019)[22]研究結果顯示,基于 DL 的乳腺X線檢測系統(tǒng)對腫塊的檢出有較好的穩(wěn)定性,可以輔助影像醫(yī)師對BI-RADS3類和4類腫塊的檢出率提升10.07%(30/298)以上。同時AI有助于減少不同腺體分類對腫塊檢出的影響,尤其對于較為致密腺體腫塊的檢出,AI輔助診斷具有重要的臨床價值。
在乳腺X線攝影中,乳腺癌的早期表現(xiàn)可以是微小鈣化,它是乳腺癌的主要危險征象,甚至常常是乳腺癌唯一征象。 王小琦等(2019)[23]通過使用DL系統(tǒng)與2名低年資醫(yī)師分別對274例可疑鈣化進行對比分析,發(fā)現(xiàn)DL系統(tǒng)僅漏診1例密度較低的呈團簇狀分布的無定形鈣化,DL系統(tǒng)對于可疑鈣化的檢出率顯著高于2名低年資醫(yī)師。由于影像醫(yī)師受視覺疲勞、注意力下降等主觀因素影響,以及對于密度較低的無定形鈣化和線樣分布、直徑較小的團簇樣鈣化敏感度均較低,因而漏檢相對更多。相較而言,DL系統(tǒng)對可疑鈣化灶的檢出不受腺體類型以及鈣化形態(tài)及分布的影響,對可疑鈣化檢出的敏感度與穩(wěn)定性均較高。因此,DL系統(tǒng)可作為輔助,有效提升影像醫(yī)師對可疑鈣化的檢出率。
但是對于不同的乳腺病灶類型,AI的檢出率也有明顯的對比差異。 宋張駿等(2019)[24]研究結果顯示,基于深度學習技術的MammoWorks TM乳腺健康智能檢測系統(tǒng)對腫塊、鈣化灶、腫塊伴鈣化灶、腺體結構扭曲等的檢出也有明顯差異。其中,腫塊命中 67.7%( 136/201),鈣化灶命中 80.5% (33/41);腫塊伴鈣化命中82.3%(153/186);腺體結構扭曲命中55.0% (11/20)。對于不同腺體分類的乳腺病灶的檢出也不盡相同,脂肪型乳腺命中 65.5%(36/55);少量腺體型命中 69.1%(94/136);多量腺體型命中75.6% (68/90);致密型命中 80.8%(135/167)。 研究結果顯示,伴有鈣化灶的疾病更容易被AI檢測系統(tǒng)識別檢出。另外,乳腺腺體密度高的分組命中率高,表明AI檢測系統(tǒng)能有效輔助致密型腺體病灶的檢出,可以降低影像醫(yī)師對致密型腺體病灶的漏診率。
劉寶治和李東波(2019)[25]研究采用深度學習人工智能領域快速R-CNN算法,對腺體結構進行分型,對全病灶檢出,進而對病灶的全屬性進行分析,再參考ACR BI-RADS 5th Edition進行評估分類,自動生成結構化報告,給出影像學建議。但是由于AI對異常密度的敏感性較高,導致其分級較人工標注的分級結果偏高。盡管如此,AI對有效提高影像醫(yī)師的診斷效率仍有著重要臨床意義。
對于乳腺X線檢查而言,致密的乳腺已被認定為乳腺癌的主要危險因素,且是獨立的危險因素,患乳腺癌的風險與腺體致密程度呈正比,即女性患乳腺癌的風險隨著乳腺密度的致密程度增加而升高。在乳腺X線攝影中,致密的腺體組織容易對可疑病灶造成遮擋,致使影像科醫(yī)師對腺體致密的患者給出假陰性的判定,因而容易造成對致密腺體病灶的漏診。
深度學習算法不但能根據(jù)乳腺X線檢查顯示的乳腺密度程度進行風險預估,而且還能根據(jù)乳腺X線檢查中具有預測風險的成像特征及臨床風險因素,預測患者患乳腺癌的風險[21]。Qiu 等(2016)[26]研究顯示,使用深度學習的風險預測模型對乳腺癌進行早期預測,其準確率達到 71.4%。Mohamed等(2018)[27]對1 427名女性乳腺X線攝影圖像進行回顧性分析,利用構建的CNN模型對纖維腺體型及不均勻致密型乳腺進行自動分類,其ROC曲線下面積( Area Under Curve,AUC)值為 0.942 1。由此可見,使用預測風險模型不僅能提高篩查者警惕性,實現(xiàn)對乳腺癌早診斷早治療,同時還可避免影像醫(yī)師的主觀性,從而更好地預測患者患乳腺癌的風險。
乳腺癌在分子水平上具有高度的異質(zhì)性,不同分子分型的乳腺癌其治療方式及預后也不盡相同[28]。 馬夢偉等(2020)[29]對 200 例浸潤性乳癌,通過建立隨機森林(RF)、極端梯度提升(XGBoost)、邏輯回歸(kLR)及支持向量機(SVC)模型等4種機器學習模型,分別對不同分子分型乳腺癌的效能進行預測。結果顯示,對于判斷Luminal型與非Luminal型的乳腺癌,RF模型的AUC值最大(AUC=0.70,P<0.O5),而且在4種機器學習模型中,RF模型對不同分子分型乳腺癌的預測效能較好。因此,術前通過影像學檢查并結合人工智能,可以對乳腺癌快速、無創(chuàng)精準判斷分子分型,對臨床診斷及制定個性化的治療方案產(chǎn)生重要影響。
人工智能在乳腺X線攝影中的應用有明顯的優(yōu)勢,如可以減少乳腺癌篩查放射科醫(yī)師的閱片工作量,有效輔助致密型腺體病灶的檢出,對乳腺癌早期預測準確率較高,術前可以對乳腺癌快速、無創(chuàng)判斷分子分型等等。雖然人工智能在乳腺X線攝影方面有諸多優(yōu)勢,但是目前還存在很多挑戰(zhàn),如對于腺體結構扭曲和不對稱致密影的檢出率較低,AI分級較人工標注的分級結果偏高,判斷乳腺癌分子分型的準確率有待提高等。
目前,如腺體結構扭曲和不對稱致密影等樣本數(shù)據(jù)仍較小,且缺乏標準化。未來,AI在乳腺X線攝影中應建立標準化大數(shù)據(jù)集,同時注重其他信息(如患者既往檢查資料及病史資料)的整合,以不斷提高AI診斷性能。隨著人工智能技術不斷發(fā)展進步,今后大樣本數(shù)據(jù)質(zhì)量的不斷提高以及多模態(tài)影像數(shù)據(jù)的整合,AI技術在乳腺X線攝影方面將發(fā)揮更大作用,創(chuàng)造更高的社會價值。