楊磊 唐燦
1雙流區中醫醫院功能科(成都610000);2四川大學華西醫院超聲科(成都610000)
最新研究表明,乳腺癌發病率近年來在全球范圍內不斷上升,對女性健康影響較大[1-2]。如何對早期發現的乳腺腫瘤準確判斷性質,不僅關系到臨床治療方式的選擇,而且關系到患者的后期生存和生活質量。傳統超聲檢查是通過人工視覺獲取影像信息,主觀因素影響較大。醫生往往通過經驗來判斷病變的良惡性,缺乏統一、規范的共識,難以形成一致且正確的診斷結果[3]。BI-RADS分類的提出規范了乳腺超聲診斷報告,但由于“同圖異病”、“同病異圖”等特點,使得BI-RADS 分類在臨床工作中存在一定的局限性。
通過人工智能讀片,不僅能縮短檢查時間,還可以充分提高超聲醫師對疾病的診斷效率,未來將逐漸取代大多數的人工勞動和肉眼分析,對超聲醫學發展將起到極其重要的作用[4]。本研究將比較CAD 機器診斷系統和醫師讀圖對乳腺良惡性病變的診斷效果,探討CAD 機器診斷系統對乳腺癌的診斷價值以及如何應用可以輔助醫師提高乳腺癌的診斷水平。
1.1 研究對象選取2018年1月至2020年12月在我院進行乳腺穿刺活檢或手術切除的乳腺病變患者5 311 例為研究對象,共計13 277 幅超聲圖像,所有病例均有病理結果,且超聲資料齊全。一個切面只包含一個病變。納入病例乳腺病變BIRADS 分類為3、4、5 類。超聲檢查儀器型號包括PHILIPS IU22、Supersonic imagine Aixplorer V、GE LOGIQ e9、HITACHI H9 等,使用寬頻線陣探頭,頻率5.0 ~10.0 MHz。患者檢查前均簽署了知情同意書。超聲圖像排除標準:(1)同一切面包含多個病變;(2)病變直徑>5 cm,一個切面無法顯示完整病變。
1.2 BI-RADS分類標準采用美國放射學會(American College of Radiology,ACR)乳腺影像報告和數據系統(breast imaging reporting and data system,BI-RADS)標準進行BI-RADS 評估分類,將乳腺病變分為3類、4A類、4B類、4C類和5類。評估分類結果采用兩分法進行評價:BI-RADS 4A 類以下(包含BI-RADS 4A類)評估為“可能良性”;BI-RADS 4A類以上(不含BI-RADS 4A類)評估為“可能惡性”[5]。
1.3 診斷方法以病理結果為對照,比較醫師讀圖和CAD機器診斷系統對乳腺病變的良惡性判斷結果。
1.3.1 一致性檢驗兩名有5年以上乳腺超聲檢查經驗的醫師前期選取了50 例患者超聲圖像,采取盲法讀圖,完成BI-RADS 評估分類,對分類結果與病理結果進行Kappa 一致性檢驗[6]。
1.3.2 醫師讀圖兩位醫師采取盲法讀圖,對所有5 311 個乳腺病變通過形態、方位、邊緣、回聲模式、后方回聲特征、鈣化、血供及其他相關特征,參照BI-RADS 分類標準進行分類[7]。
1.3.3 人工智能診斷人工智能診斷采用德尚韻興超聲乳腺智能輔助診斷系統,輸入乳腺超聲圖像,機器自動給出良惡性概率值(概率值范圍0~1)。
1.3.4 聯合診斷根據醫師讀圖和CAD 機器診斷結果比較,對BI-RADS 分類進行優化調級,CAD 組分析為良性者,4B 類降為4A 類;CAD 組分析為惡性者,4A 類升為4B 類,其余不變。優化調級后聯合兩者綜合判斷,再與醫師讀圖和CAD 機器診斷系統診斷結果進行比較。
1.4 統計學方法所有數據錄入Excel 表建庫,采用SPSS 20.0 軟件進行統計學分析。計數資料比較采用χ2檢驗。醫師讀圖采用兩分法,CAD 機器診斷根據截斷值(cut-off 值)把乳腺病變分為良性和惡性兩類,計算敏感度、特異度、準確度、陽性預測值和陰性預測值。繪制診斷方法對乳腺良惡性病變判斷的ROC 曲線,計算曲線下面積(AUC),ROC曲線下面積比較采用Z檢驗。以P<0.05 為差異有統計學意義。
2.1 病理結果5 311 例患者中,乳腺病變良性3 214 例,乳腺病變惡性2 097 例。見表1。

表1 5 311 例乳腺病變病理類型分布Tab.1 Distribution of pathological types of 5 311 cases of breast lesions
2.2 醫師讀圖診斷兩位醫師前期對50 個病例盲法讀圖,其BI-RADS 評估分類和病理結果的一致性研究kappa 值為0.75,一致性高。5 311 例病例中,BI-RADS 分類3 類1 028 例,4A 類1 579 例,4B 類954 例,4C 類1 056 例,5 類694 例。醫師讀圖診斷結果和病理對照見表2。ROC 曲線下面積為0.837,敏感度、特異度、準確度分別為91.65%、75.67%、81.98%。陽性預測值為71.08%,陰性預測值為93.29%。ROC 曲線見圖1。

表2 醫師讀圖BI-RADS 分類和病理結果對照Tab.2 Comparison of BI-RADS classification and pathological results
2.3 CAD 機器診斷系統按照ROC 曲線計算的乳腺病變良惡性判斷的最佳截斷值為0.611,概率值<0.611 者共3 113 例,考慮為良性(圖2A-B);概率值>0.611 者共2 198 例,考慮為惡性(圖2C-D)。CAD 機器診斷與病理結果對照見表3。CAD 機器診斷系統ROC 曲線下面積為0.880,敏感度、特異度和準確度分別為87.41%、88.64%和88.16%,陽性預測值為83.39%,陰性預測值為91.52%。ROC曲線見圖3。

圖2 CAD 機器診斷系統診斷的典型病例圖像Fig.2 Images of typical cases diagnosed by CAD machine diagnostic system

圖3 CAD 機器診斷系統診斷乳腺病變的ROC 曲線Fig.3 ROC curve of breast lesions diagnosed by CAD machine diagnosis system

表3 CAD 機器診斷良惡性分類和病理結果對照Tab.3 CAD machine diagnosis of benign and malignant classification and pathological results comparison table 例
2.4 CAD 系統和醫師讀圖聯合診斷醫師診斷的BI-RADS 分類4A、4B 類的病例和CAD 機器診斷不一致共571 例,其中82 例4A 類CAD 診斷為惡性,489 例4B 類CAD 診斷為良性,見表4、圖4。經過優化調級后兩者聯合診斷,BI-RADS 分類3 類1 028 例,4A 類1 986 例,4B 類547 例,4C 類1 056例,5 類694 例,聯合診斷與病理結果對照見表5。ROC 曲線下面積為0.927,敏感度、特異度、準確度分別為96.91%、88.41%、91.56%,陽性預測值為83.15%,陰性預測值為97.98%。ROC 曲線見圖5。

表4 醫師診斷BI-RADS 分類和CAD 機器診斷不一致結果Tab.4 Results of inconsistencies between BI-RADS classification and CAD machine diagnosis

表5 CAD 系統和醫師讀圖聯合診斷BI-RADS 分類和病理結果對照Tab.5 Comparison of BI-RADS classification and pathological results of combined diagnosis by CAD system and doctor reading

圖4 BI-RADS 分類診斷和CAD 機器診斷不一致典型病例Fig.4 Typical cases of inconsistency between BI-RADS classification diagnosis and CAD machine diagnosis

圖5 CAD 機器診斷聯合BI-RADS 分類診斷乳腺病變的ROC 曲線Fig.5 The ROC curve of CAD machine diagnosis combined with BI-RADS classification to diagnose breast lesions
2.5 CAD 系統、醫師讀圖BI-RADS 分類和聯合診斷三者比較三者ROC 曲線下面積比較,差異有統計學意義(P<0.05);醫師讀圖和CAD 系統比較,特異度差異有統計學意義(P<0.05);CAD 系統和聯合診斷比較,敏感度差異有統計學意義(P<0.05);醫師診斷和聯合診斷比較,特異度、準確度差異有統計學意義(P<0.05)。
目前,BI-RADS 分類在臨床中得到了廣泛應用,使得乳腺病變的超聲描述得到進一步的統一和規范[8]。另一方面,各級醫療機構、各級醫師、醫患之間也構筑了統一的認識平臺,能夠有效指導臨床及患者選擇更好的治療方式[9]。本研究顯示,常規超聲的BI-RADS 分類判斷乳腺病變良惡性,其敏感度為91.65%,說明BI-RADS 分類對乳腺病變良惡性的判斷比較準確,敏感度較高,適合作為乳腺癌篩查。但是在實踐工作中也要重視BIRADS 分類的局限性,尤其是BI-RADS 4A、4B、4C三個亞類之間,由于一直沒有清晰客觀的分類細則,超聲醫師對圖像特征的識別主觀因素影響較大[10],導致假陽性率高。
深度學習作為一項突破性科學技術[11]在乳腺癌中的研究主要集中在影像學和病理學方面,如肺部CT、先天性ASD 篩查[12]等,其智能決策逐步受到國內外臨床醫師的青睞[13]。人工智能深度學習的模型訓練一般包括圖像預處理、感興趣區標注、圖像特征的提取、分類識別等[14]。雖然在前期的模型訓練中,需要對超聲圖像中的病變采用人工描跡的方法來對感興趣區進行標注,工作量繁重,花費大量時間,但通過大量數據訓練模型建立后,最終呈現給使用者病變自動識別和自動標注[15]。本研究中的CAD 機器診斷系統就能夠自動尋找病變,自動勾畫病變邊緣,標注病變的范圍及感興趣區,從而避免了傳統標注方式需要大量人工標注的缺陷[16]。本研究進一步顯示,該CAD 機器診斷系統能提升超聲診斷乳腺癌的特異度。乳腺病變的計算機深度學習,作為一種新興的診斷工具,能夠高通量從超聲圖像中提取和分析大量全面的、定量的圖像特征[17],有助于量化常規超聲圖像中肉眼難以區分的組織間的差異,以達到對腫瘤異質性進行全面定量評價的目的。
本研究發現兩種方法聯合使用后,能提高乳腺病變良惡性判斷的特異度和準確度,該診斷方法比單一的超聲診斷或CAD 診斷效果更好,可降低誤診率,可為臨床提供更加全面、準確的影像診斷依據。
本研究的不足主要在于:(1)計算機深度學習需要大數據訓練,所以后續還需不斷擴大樣本量,使研究結果將更加準確、客觀。(2)乳腺疾病的多模態診斷是當前研究的熱點問題,后續還可以聯合其他超聲技術如彈性成像、超聲造影等,提高乳腺疾病診斷的準確性,為臨床提供更加可靠的依據。(3)本研究沒有對醫師之間進行分層研究(有經驗組和無經驗組),也只進行了單中心的研究,在以后的研究中將逐步完善研究內容。(4)超聲圖像的質量高低影響著人工智能的閱片效果。CAD對于未被訓練的疾病,不能像人腦一樣,及時作出應變和創新。而且,現代醫學具有明顯的人文社會特質[18],如何實現倫理和實際的統一,以及如何監管和研究也是要不斷研究的課題。
綜上所述,相比較醫師讀圖診斷,CAD 機器診斷系統聯合診斷對乳腺癌的良惡性判斷效果更好,可以輔助超聲醫師提高對乳腺癌的診斷水平。