金啟成 呂江紅 許立龍 魏洪芬 湯桐芳 張傳菊 李世巖
浙江大學醫學院附屬邵逸夫醫院超聲醫學科(杭州 310016)
乳腺癌是女性最常見的惡性腫瘤[1]。超聲檢查是乳腺癌篩查的理想方式之一[2]。基于人工智能的計算機輔助診斷系統已逐步得到應用[3-11]。S-Detect 技術可自動對乳腺病灶進行識別及良惡性鑒別[2],具有顯著臨床應用價值[13-16]。然而,病灶的病理類型、最大徑、年齡、所在象限以及深度均會對S-Detect 結果產生影響[17]。因此,如何正確使用S-Detect 技術,避免影響因素對其診斷準確性的干擾,也成為需要重點關注的一個問題。超聲成像參數的理想調節是獲得準確診斷的前提。那么不同的超聲成像參數調節是否會對S-Detect 技術產生影響尚未明確。本研究將通過在不同超聲成像參數設置的條件下,利用S-Detect 技術對乳腺病灶的良惡性進行判斷,旨在分析其影響并探討可能最佳的成像參數條件。
1.1 研究對象前瞻性選取2021年10月至2022年3 月期間因乳腺結節就診于我院的患者。入選標準:(1)常規超聲檢查發現乳腺腫塊型病灶;(2)病灶大小范圍適中(能清楚分辨病灶形狀,同時最大徑小于單一切面顯示范圍,本研究中范圍為0.5 ~7.0 cm 之間)。排除標準:(1)檢查前已接受術前新輔助治療的患者;(2)檢查前已于外院進行手術或穿刺活檢者;(3)采集數據不完全者。本研究方案經過我院倫理委員會審批通過(編號:2022-0354),所有入選患者均對研究內容知情,且同意參加。最終入選133 例患者,143 個病灶。
1.2 儀器與方法
1.2.1 儀器采用三星RS80A 型彩色多普勒超聲診斷儀,L3-12A 線陣探頭,頻率3.0 ~ 12.0 MHz。采用乳腺超聲檢查預設置。
1.2.2 圖像采集所有圖像采集由3 名具有乳腺超聲檢查5 年以上經驗的超聲醫師獨立完成。患者取平臥位,雙側上臂高舉,充分暴露乳腺區域。首先使用常規超聲全面掃查雙側乳腺,發現病灶后對其位置、大小等信息進行記錄,以便同側乳腺發現多個結節時,能夠將超聲檢查與病理組織學檢查一一對應。于病灶最大徑切面采集二維圖像,采集時將根據研究設計方案對超聲成像參數分別進行調節,具體包括以下5 種情況:(1)基準圖(Basic parameter image, BPI):單個焦點,焦點位于病灶中部水平。掃查深度適中,即將目標病灶大部分置于圖像的正中部位。輝度適中,能清晰顯示圖像及周邊正常組織(圖1A)。(2)雙焦點圖(Dual focus image, DFI):兩個焦點,焦點位于病灶中部水平。其余參數調節與BPI 一致(圖1C)。(3)焦點過淺圖(Superficial focus location image, SFLI):單個焦點,焦點位于圖像最表淺處。其余參數調節與BPI 一致。因焦點深度最淺為0.4 cm,若病灶腹側面距皮膚距離≤ 0.4 cm,則放棄該組圖像的采集(圖1E)。(4)焦點過深圖(Deeper focus location image, DFLI):單個焦點,焦點位于圖像最深處。其余參數調節與BPI 一致(圖1G)。(5)掃查深度過深圖(Scanning too deep image, STDI):掃查深度過深,將病灶置于整個圖像的上三分之一水平。其余參數調節與BPI 一致(圖1I)。

圖1 同一乳腺結節在不同參數設置條件下的二維超聲圖像及其對應的S-Detect 分析圖Fig.1 Two-dimensional ultrasound images of the same breast nodule under different parameter settings and their corresponding S-Detect analysis images.
1.2.3 S-Detect 技術將采集好的圖像分別進行S-Detect 輔助診斷,應用“Target Point”標定功能,點擊病灶中央部位后,機器自動識別并勾畫病灶邊界。若自動識別與實際肉眼觀察差別較大,則稍移動目標位置,再次自動識別,直至滿意為止,若嘗試3 次均無法達到滿意效果,則啟動“Point Edit”功能,對勾畫邊界進行調整。待達到理想勾畫邊界之后,S-Detect 將自動給出“可能良性”或“可能惡性”的診斷意見。同時,系統會自動識別病灶的相關特征,包括病灶形狀、方位、內部回聲、后方特征等。此時,保存靜態圖像以備后續分析統計(圖1B、D、F、H、J)。
1.3 “金標準”獲得為了分析不同成像參數設置條件下的診斷效能,本研究采用組織病理學診斷為“金標準”,病理標本的獲得方式包括手術切除或超聲引導下穿刺活檢。對于同時存在手術切除病理及穿刺活檢病理的病灶,且患者在手術切除之前未進行新輔助化療者,以手術病理結果為準;若患者在手術切除之前已接受了新輔助化療,則以治療前穿刺活檢病理結果為準。所有作為“金標準”的病理結果,與S-Detect 超聲檢查之間的時間間隔均不超過1 個月。
對于未獲得病理結果的入選病灶,因其不影響S-Detect 給出良惡性診斷意見及超聲特征判讀,因此僅納入一致性分析研究。
1.4 統計學方法采用SPSS 26.0 軟件對獲得的數據進行統計學分析。以BPI 為對照,采用kappa檢驗及McNemar 檢驗對不同成像參數條件下的診斷一致性進行分析,并統計各個成像參數設置條件下對病灶形狀、方位、后方特征、內部回聲四個超聲特征判讀的一致性。將Kappa 值0.8 ~ 1.0 設置為一致性完美,Kappa 值0.6 ~ 0.8 為一致性良好,Kappa 值0.4 ~ 0.6 設置為一致性中等[18]。根據“金標準”繪制上述BPI 及不同成像參數條件下的受試者操作特征(receiver operating characteristic,ROC)曲線,并計算曲線下面積(area under curve,AUC),評價不同成像參數條件下的診斷效能。AUC 間的比較采用Delong 檢驗。以P< 0.05 為差異有統計學意義。
2.1 一般情況最終入選133例患者,共143個病灶,患者年齡16 ~ 76 歲,平均(44.01 ± 1.25)歲。病灶最大徑0.53 ~ 6.31 cm,平均(1.93 ± 0.88 )cm。所有入選病灶的圖像采集情況及病理結果獲取情況見表1。110 個有病理結果的結節中,良性病灶44 個,惡性病灶66 個。在診斷一致性分析中,4 種不同設置分別與BPI 比較,所有采集了相應圖像的病灶均納入統計分析。在診斷效能比較中,排除無病理結果的33 個病灶,另110 個病灶納入統計分析。
2.2 不同成像參數條件下的診斷一致性對比本研究首先針對不同成像參數條件下S-Detect 所獲得的病灶形狀、方位、后方特征、內部回聲這四個相對常用的超聲特征進行一致性分析(見表2-5)。結果顯示,在STDI 條件下,S-Detect 判斷的病灶形狀和內部回聲與BPI 的判讀一致性為各個參數條件中最低,并且存在顯著性差異。在DFLI 條件下,S-Detect 判斷方位及內部回聲與BPI 的判讀一致性為中等,但差異無統計學意義。

表2 病灶形狀在不同成像條件下與BPI 的比較Tab.2 Comparison of the lesion shape with BPI under different imaging conditions例

表3 方位在不同成像條件下與BPI 的比較Tab.3 Comparison of the lesion orientation with BPI under different imaging conditions例

表4 后方特征在不同成像條件下與BPI 的比較Tab.4 Comparison of the lesion posterior features with BPI under different imaging conditions例

表5 內部回聲在不同成像條件下與BPI 的比較Tab.5 Comparison of the lesion echo pattern with BPI under different imaging conditions
此后,再針對不同成像參數條件下S-Detect 所獲得的良惡性判斷結果進行一致性分析(表6)。同樣可以看出,在STDI 條件下,S-Detect 判斷病灶良惡性與BPI 的診斷一致性為最低,且存在顯著性差異。其余各參數條件下對良惡性判斷與BPI的一致性為完美或者良好,且差異均無統計學意義。

表6 良惡性判斷在不同成像條件下與BPI 的比較Tab.6 Comparison of the judgment of the nature (benign of malignant) of lesions under different imaging conditions with BPI 例
2.3 不同參數設置條件下診斷效能的比較本研究共納入143個病灶,獲得明確病理結果者110例,其中惡性66例,良性44例。根據在BPI、DFI、DFLI、STDI 四種參數設置條件下S-Detect 獲得的良惡性判斷結果,分別繪制ROC 曲線,其判斷乳腺病灶良惡性的AUC 依次為0.788(0.697 ~ 0.879),0.723(0.623 ~ 0.824),0.807(0.719 ~ 0.895),0.716(0.618 ~0.814),各參數設置條件分別與BPI 對比,所獲得的AUC之間差異均無統計學意義(P= 0.343、1.232、0.289,圖2)。

圖2 同一乳腺結節在基準條件、雙焦點條件、焦點過深條件、掃查深度過深條件下的診斷效能比較Fig.2 Comparison of diagnostic efficacy of the same breast nodule under BPI, DFI, DFLI, and STDI
由于部分病灶(51 個)位置過淺,病灶腹側面距皮膚距離≤ 0.4 cm,無法進行焦點過淺的參數設置,因此在SFLI 中,共采集92 個病灶,其中有病理結果的71 例,包括惡性45 例,良性26 例。繪制針對該71 例樣本的ROC 曲線,BPI 條件下S-Detect 針對乳腺病灶良惡性的AUC為0.778(0.660 ~ 0.897),SFLI 條件下的AUC 為0.748(0.625 ~ 0.872)。二者比較,差異無統計學意義(P= 0.730,圖3)。

圖3 同一乳腺結節在基準條件、焦點過淺條件下的診斷效能比較Fig.3 Comparison of diagnostic efficacy of the same breast nodule under BPI and SFLI
在臨床診斷工作中,超聲圖像質量是影響診斷準確率的重要因素[19]。既往研究顯示不同的參數條件設置會影響超聲圖像的分辨力。例如焦點位置對橫向分辨力的影響較顯著,焦點過淺會導致遠場聲束過于分散,從而降低超聲圖像的分辨力;焦點過深則指向性不明顯,同樣降低超聲圖像的分辨力[20-21]。
本研究相對于基準參數(BPI)條件,選取了雙焦點(DFI)、焦點位置過淺(SFLI)、焦點位置過深(DFLI)、掃查深度過深(STDI)4 種參數調節設置,對比研究其對S-Detect 技術判讀乳腺病灶結果的影響。結果顯示,在各個參數條件下,相比于BPI 條件而言,均具有良好及以上的診斷一致性(Kappa均 > 0.6),但STDI 條件下診斷一致性最低,且與BPI 差異有統計學意義(P< 0.05)。本研究進一步探討了病灶形狀、方位、后方表現、內部回聲這四個超聲特征在不同參數設置條件下的一致性。結果顯示,方位及后方表現在不同參數條件設置下的判讀一致性處于中等或良好水平(Kappa均 > 0.5)。在常規超聲判斷病灶良惡性的過程中,形狀及內部回聲是相對重要的兩個特征。然而,對于形狀特征而言,受到STDI 條件的影響較大(Kappa=0.489),對于其余三種參數條件設置下,其判讀的一致性處于良好水平(Kappa均 > 0.6)。對于內部回聲特征而言,DFLI 及STDI 兩個設置條件下的判讀一致性較低,均處于中等水平(Kappa值分別為0.549 和0.442),但只有STDI 與BPI 差異有統計學意義(P< 0.05),同時,其余設置的內部回聲判讀一致性處于良好水平(Kappa均 > 0.6)。通過對診斷效能的研究可以看出,相對于BPI 設置而言,其他各個參數條件下S-Detect 對乳腺病灶的診斷效能差異無統計學意義,但對于上述四項設置,STDI 的診斷效能最低,且與BPI 之間的差距最大,而DFLI 條件下的診斷效能最佳。
由此可見,雖然焦點位置過深或過淺均會降低圖像的分辨力,但相對于其他設置而言,焦點位置引起的分辨力降低對于S-Detect 的診斷及特征判讀的影響較小。同時,雖然在上述各個超聲參數設置條件下進行比較,S-Detect 對乳腺病灶良惡性判斷均有較高的診斷一致性,但是,由于STDI對于形狀特征及回聲特征的影響較大,因此其診斷效能也相對最低。
有研究[10-11,22-23]表明,日常工作中容易造成漏診及誤診的原因,常常在于對細小特征的識別及判讀,例如邊界模糊、內部回聲弱、病灶形態不規則、后方回聲衰減等,而初級醫師對上述細微特征的辨別能力及診斷經驗不足,造成漏診及誤診的幾率明顯高于高年資醫師。S-Detect 技術通過神經網絡深度學習,同樣是對乳腺病灶細微特征的辨別,其診斷能力高于初級醫師水平,與高年資醫師水平相當[24-28]。同時S-Detect 技術通過采用原始超聲射頻信號進行分析,減少了部分超聲成像參數調節對圖像信息的影響。但是,直接調節超聲波發射及接收的參數設置仍然會對圖像信息產生一定的影響,進而有可能影響到S-Detect 的判斷結果。STDI 設置時,在同等分辨率前提下病灶顯示的相對更小,對于病灶邊緣形狀的規則程度及內部細小回聲特征的辨別能力均會受到影響,從而可能造成其特征判讀的一致性降低,這也可能是其診斷效能相對最低的主要原因。
因此,在日常應用S-Detect 技術對乳腺病灶進行良惡性判斷時,應盡量采用合適的掃查深度,盡量將病灶放置在整個圖像的中央部位,且在完整顯示的前提下被足夠放大,從而避免因掃查深度過深而帶來的診斷效能影響。
本研究的局限性在于:(1)參與采集數據人員較多,雖然制定了較為嚴格的、明確的采圖規范,但是不同醫師其采集手法造成的誤差無法避免。(2)對于乳腺病灶的大小未進行分組。有文獻[13]表明,不同大小乳腺病灶的診斷準確率存在一定的差異。(3)未對乳腺病灶的具體病理類型進行分類,文獻[22]表明計算機輔助診斷系統對不同病理類型惡性病灶的敏感性不同,且差異具有統計學意義。這些不足之處都有待后續進一步展開研究。
通過對比不同超聲成像參數條件下S-Detect技術對乳腺病灶超聲特征判讀及良惡性判斷的一致性和診斷效能,本研究發現,掃查深度若調節的過深,其特征判讀的一致性將會降低,特別是對于病灶形狀及內部回聲,同時,其對乳腺病灶良惡性判斷的診斷效能也較其他成像參數條件更差,且與基準參數設置之間的差距最大。因此,在日常應用SDetect 技術對乳腺病灶進行判斷和分析時,雖然可以適當的對焦點個數、焦點位置等超聲成像參數進行調節,但應盡量避免使用過深的掃查深度。
【Author contributions】JIN Qicheng performed the experiments and wrote the article. LV Jianghong and XU Lilong conducted preliminary research. WEI Hongfen, TANG Tongfang and ZHANG Chuanju performed the experiments and took ultrasound pictures. LI Shiyan revised the article and Identified the manuscript.