哈婷婷,潘 俊,王洪光,張 濱
(北京大學首鋼醫院影像科,北京 100144)
乳腺癌是女性發病率、死亡率均最高的癌癥[1]。乳腺X線攝影是檢測乳腺疾病的重要影像學手段。近年來,以深度學習(deep learning, DL)為代表的人工智能(artificial intelligence, AI)技術發展極大提升了圖像識別的準確率[2],可有效輔助影像科醫師提升工作效率,并減少漏診[3-4]。本研究與臨床報告對比分析基于DL的乳腺X線影像檢出系統的臨床應用價值。
1.1 研究對象 回顧性分析2015年1月—2019年1月于我院接受常規乳腺X線檢查的484例女性患者,年齡36~84歲,平均(55.3±9.7)歲。納入標準:①攝片質量合格,包括完整的雙乳頭足位(cranio-caudal view,CC)和內外斜位(medio-lateral oblique,MLO)乳腺X線影像和診斷報告;②攝片前無乳腺活檢、手術、放射治療和化學治療等病史。排除標準:①攝片質量不佳或投照位缺失;②觸診或其他影像學檢查顯示陽性,但X線片中未見病灶。
1.2 影像采集 采用GE Senographe Essential數字乳腺機,陽極靶面材料為鉬,濾過材料為鉬和銠。采用全自動壓迫系統和全自動曝光系統,曝光電壓22~49 kV,曝光電流為4~500 mAs,采集方法符合中華醫學會2016年制定的技術標準[5]。
1.3 DL病變檢出系統 使用Dr.Wise乳腺X線影像輔助診斷系統(以下簡稱AI,北京深睿博聯科技有限責任公司)。以標準協議的Dicom數據作為輸入,自動檢出并分5類顯示病變,即典型良性鈣化、可疑鈣化、腫塊、非對稱和結構扭曲,本研究納入后4種作為陽性發現。
1.4 影像報告與審核 由1名低年資(不足5年乳腺X線閱片經驗)放射科醫師書寫、1名高年資(10年以上乳腺X線閱片經驗)放射科醫師審核,參考美國放射學院2013年第5版BI-RADS標準[6]和中華醫學會放射學分會《乳腺X線攝影檢查和診斷共識》[7]出具診斷報告。
1.5 驗證方案 進行AI檢測,針對 BI-RADS 3類以上病例判讀AI是否檢出相應病變;對報告為BI-RADS 1類和2類、但AI有陽性發現的病例,由3名高年資(10~30年乳腺X線閱片經驗)影像科醫師審核,并給出相應BI-RADS分類,意見不一致時,經討論得出最終結論。AI不確定是否為病變時,統一歸為BI-RADS 0類。
1.6 統計學分析 采用 Python 3.6.2統計分析軟件,評價AI對BI-RADS 3類以上病例的檢出敏感度,并分別統計不同BI-RADS分級鈣化、腫塊、非對稱和結構扭曲的敏感度,結合雙向表χ2檢驗驗證不同種類病變敏感度的差異。對于BI-RADS 1類和2類病灶,按照病變類別、ACR腺體構成分類、BI-RADS分類分別統計AI多檢出且審核結果為BI-RADS 0類、3類及以上病變,結合雙向表χ2檢驗驗證病變數量差異。P<0.05為差異有統計學意義。
2.1 AI檢出敏感度 報告顯示230例存在BI-RADS 3類及以上病灶。分別有99、73、19、33和6例存在BI-RADS 3、4a、4b、4c和5類病變。其中BI-RADS 3、4a、4b、4c和5類病灶數量分別為103、79、23、40和11個,AI檢出敏感度分別為82.52%(85/103)、97.47%(77/79)、100%(23/23)、100%(40/40)和100%(11/11),總敏感度為92.19%(236/256),見表1。根據后續活檢、手術病理結果,53例證實為惡性病變,AI全部檢出。鈣化、腫塊、非對稱和結構扭曲數量分別為74、128、48和6個,AI檢出敏感度分別為98.65%(73/74)、92.19%(118/128)、81.25%(39/48)和100%(6/6)。AI對不同BI-RADS分類、不同類型病灶的檢出敏感度差異均無統計學意義(P均>0.05),見表1,但存在一定數量漏檢(圖1~3)。
2.2 AI多檢出病灶 報告顯示254例存在BI-RADS 1類和2類病灶,其中203例AI提示陽性,經審核75例(80個病灶)確定為BI-RADS 0類,21例(23個病灶)確定為BI-RADS 3類或以上,其中1例包含2個BI-RADS 3類腫塊,1例包含BI-RADS 4a和4b類腫塊各1個。AI多檢出的BI-RADS 0類病灶數量可觀,且病灶類型分布與報告不同(P<0.05),而多檢出的BI-RADS 3類及以上病灶類型分布則與報告相符(P>0.05),見表2。AI多檢出的BI-RADS 3類及以上病灶類型和BI-RADS分布見表3和圖4~6。

表1 不同BI-RADS分類下、不同病灶類型AI檢出情況[%(個)]
注:*:表示對應的總數為0,檢出率無意義

表2 AI多檢出的病灶及同原始報告的分布對比[個(%)]

圖1 患者女,55歲,AI漏檢鈣化,報告提示團簇分布的圓形點狀鈣化,BIRADS 3類 A.左乳MLO位; B.左乳MLO位病灶區域特寫; C.左乳CC位;D.左乳CC位病灶區域特寫
2.3 ACR腺體構成分類對檢出病灶的影響 統計不同ACR腺體構成分類下的病灶數量,診斷報告中各BI-RADS類別的病灶分布、AI多檢出的BI-RADS 0類和3類及以上病灶分布與總體分布一致(P均>0.05),見表4。
3.1 AI的檢出敏感度分析 本研究中,對于230例診斷報告BI-RADS 3類及以上病灶,AI總敏感度為91.74%,尤其對于鈣化的敏感度接近100%,高于腫塊和非對稱,與文獻[4,8]報道類似,且發現AI敏感度與病灶惡性程度呈正相關,其對BI-RADS 4a類及以上病灶的敏感度高達98.47%(129/131),4b類及以上病灶敏感度為100%(58/58)。AI漏檢主要集中在BI-RADS 3類病灶,包括1個團簇分布的圓形點狀鈣化,AI檢出但判斷為典型良性鈣化;漏檢腫塊則以腺體遮蔽、直徑較小者為主。
本研究結合雙向表χ2檢驗,發現AI對不同類型及不同BI-RADS分類病灶的敏感度差異均無統計學意義,驗證了AI系統的穩定性。
3.2 AI對減少影像醫師漏診的價值 AI系統在診斷報告BI-RADS 1類和2類病變的254例中多檢出75個BI-RADS 0類和21例存在BI-RADS 3類及以上病例,分別占29.53%和8.27%,前者需要結合其他檢查進一步確診,后者則需要隨訪或穿刺活檢,提示AI可以有效減少醫師對于有臨床意義病灶的漏檢,與既往研究[9-10]結果相符,后者均系以AI作為第二閱片人,統計AI幫助影像醫師多檢出的病灶,而本研究則從新的角度驗證了AI對減少漏診的有效性。
以病灶為單位統計,本研究AI多檢出80個BI-RADS 0類,其中非對稱占比過半(41/80,51.25%),這是因為對應病例中90%以上為ACR c和d類,致密的纖維腺體結構遮擋會降低X線影像的可靠性;23個BI-RADS 3類以上病灶,其中3個鈣化均為無定形形態,指南統計顯示,該形態鈣化陽性預測值高達21%[6],且密度較低,接近于纖維腺體,有重要臨床意義,但易漏診。AI還有助于減少由于纖維腺體遮蔽導致的漏檢腫塊和非對稱。

圖2 患者女,61歲,AI漏檢腫塊,報告提示卵圓形、邊緣遮蔽、等密度,BIRADS 3類 A.左乳MLO位; B.左乳CC位病灶區域特寫; C.左乳CC位; D.左乳MLO位病灶區域特寫 圖3 患者女,39歲,AI漏檢非對稱,報告提示結構不對稱,BIRADS 3類 A.右乳CC位; B.左乳CC位

圖4 患者女,44歲,報告遺漏可疑鈣化,團簇分布的無定形鈣化,BIRADS 4b類 A.右乳CC位; B.右乳CC位病灶區域特寫; C.右乳MLO位; D.右乳MLO位病灶區域特寫 圖5 患者女,46歲,診斷報告遺漏結構不對稱,BIRADS 3類 A.右乳CC位; B.左乳CC位

表3 AI多檢出且審核確認為BI-RADS 3類以上的病灶統計[個(%)]
注:括號內為相應病灶數占該類型病灶總數的比例

表4 在不同ACR腺體構成分類下原始報告和AI多檢出病灶分布對比[個(%)]
注:括號內數字為病灶數占所在BI-RADS分類總數的比例

圖6 患者女,41歲,報告遺漏2個腫塊,第一行示形狀不規則、邊緣模糊的等密度腫塊,BI-RADS 4b類;第二行示形狀不規則、邊緣遮蔽的等密度腫塊,BI-RADS 4a類 A.左乳MLO位;B.左乳MLO位上象限病灶區域特寫;C.左乳MLO位下象限病灶區域特寫;D.左乳CC位;E.左乳CC位上象限病灶區域特寫;F.左乳CC位下象限病灶區域特寫
本研究主要局限性:為單中心研究,需多中心研究結果加以驗證;同時,經多名醫師驗證的假陰性病例僅21例,有待進一步統計分析病灶類型分布。
綜上所述,基于DL的乳腺X線影像病灶檢出系統對于BI-RADS 3類及以上病灶具有較高敏感度,并可有效減少醫師漏診。