雷傳芬,陳 杰,李鳳玲,楊李波,楊洪燕,練映秀,步 宏
乳腺導管原位癌(ductal carcinoma in situ, DCIS)是局限于乳腺大導管內或終末導管小葉單位(terminal ductal lobular unit, TDLU)的上皮細胞腫瘤性增生性病變,腫瘤細胞均未突破基膜,是浸潤性導管癌(invasive ductal carcinoma, IDC)的非專性前驅病變。隨著乳腺X線技術的推廣應用,乳腺DCIS的檢出量明顯增加,占乳腺癌的15%~20%[1]。單純DCIS預后較好,乳腺癌患者10年病死率為2.4%~2.9%[2-3];如果患者不及時治療,部分DCIS可進展為IDC,預后較差。手術切除是乳腺DCIS患者標準的治療方式,根據(jù)Van Nuys預后指數(shù)(Van Nuys Prognostic Index, VNPI)[4],DCIS分級與預后相關,決定患者術后是否輔助放療。
乳腺DCIS存在多種不同的命名分級方法[5-9],各方法的一致性均不理想。盡管個別深度學習法[10]開始嘗試進行乳腺DCIS分級,但需要對大樣本進行模型訓練及驗證,短期內難以實現(xiàn)。而DCIS檢出量的增加與病理診斷醫(yī)師人力不足的矛盾日益明顯。本實驗旨在分析統(tǒng)一診斷標準和借助計算機定量輔助對乳腺DCIS分級一致性的影響,尋求提高乳腺DCIS診斷一致性和準確性的措施。
1.1 材料收集2015年1月~2021年10月四川大學華西醫(yī)院病理科存檔的453例乳腺DCIS標本,每例選取一張具有代表性的HE切片。使用優(yōu)納PRECICE 600數(shù)字切片掃描儀在40×倍物鏡下掃描成全載玻片圖像(whole slide image, WSI),并轉化為TIFF格式文件。
1.2 方法本實驗經三位具有5年以上診斷經驗的病理醫(yī)師利用開源ASAP軟件分三個階段對病例進行診斷,相鄰兩個階段間隔3周以上,未向診斷醫(yī)師提供患者的臨床資料。第一階段:三位病理醫(yī)師遵循自身日常診斷標準對納入的DCIS病例進行低、中、高核級診斷。第二階段:開始前,由一名高年資乳腺專科病理醫(yī)師依據(jù)第五版WHO乳腺疾病分類[11]DCIS分級標準對三位病理醫(yī)師進行培訓并展示各級別DCIS的典型圖片(圖1~3)。隨后,三位病理醫(yī)師再次對納入病例進行診斷。第三階段:三位病理醫(yī)師在計算機定量輔助下對DCIS進行分級。首先由一名未參加上述實驗環(huán)節(jié)診斷工作的病理醫(yī)師在每一張WSI中標注5個DCIS病變區(qū)域:若腫瘤異質性大,則各種形態(tài)均需被囊括;若異質性不明顯,則隨機選取5個病變區(qū)域;若病變總數(shù)不足5個導管,則標注該WSI中所有DCIS病變。基于已標注的腫瘤區(qū)域,采用騰訊覓影·病理云識別分割標注區(qū)域內腫瘤細胞核并測量直徑。為更客觀地比較腫瘤細胞核相對正常紅細胞的大小,在相同流程制片的WSI上測量10個形態(tài)較好的紅細胞直徑,取平均值作為紅細胞直徑參考值。基于開源ASAP軟件嵌入一個展示模塊,將標注區(qū)域內細胞核直徑分布可視化展示,三位病理醫(yī)師以此作為參考,綜合進行診斷(圖4)。

圖1 低核級乳腺導管原位癌:A.腫瘤篩狀構象;B.腫瘤呈篩狀構象,腫瘤細胞較一致;C.細胞異型性小,個別見核仁 圖2 中核級乳腺導管原位癌:A.實體型構象,細胞異型性不明顯;B.細胞輕度異型,伴粉刺樣壞死;C.明顯核仁 圖3 高核級乳腺導管原位癌:A.壞死常見;B.細胞異型性明顯,伴粉刺樣壞死;C.細胞明顯異型性,可見核分裂象

圖4 三個階段診斷流程圖:第一階段:三位醫(yī)師使用ASAP讀片軟件進行常規(guī)診斷;第二階段:經培訓交流后,三位醫(yī)師使用ASAP軟件獨立進行DCIS分級;第三階段:ASAP讀片軟件嵌入計算機輔助測量腫瘤細胞核大小結果,可視化腫瘤細胞核直徑與成熟紅細胞直徑比值的分布(D腫瘤細胞核/D紅細胞核比值<1.5、1.5~2.0、2.0~2.5、>2.5),醫(yī)師以此為參考進行DCIS分級
1.3 統(tǒng)計學分析采用SPSS 26.0軟件進行統(tǒng)計學分析,采用Fleiss Kappa值評估醫(yī)師間診斷的一致性,以P<0.05為差異有統(tǒng)計學意義。Kappa值為0表明一致性極低,Kappa越接近1,提示一致性越好[12]。
2.1 臨床資料本組納入453例DCIS樣本,患者年齡20~83歲,平均48.01歲。其中穿刺樣本29例(6.40%),麥默通微創(chuàng)樣本46例(10.15%),切除樣本378例(83.44%)(表1)。

表1 453例乳腺導管原位癌患者的臨床病理資料
2.2 診斷結果第一階段診斷:三位醫(yī)師的診斷意見完全一致者180例(39.74%),三位醫(yī)師的診斷意見完全不一致者14例(3.09%)。第二階段診斷:經培訓交流后診斷,三位醫(yī)師的診斷意見完全一致者186例(41.06%),完全不一致者6例(1.32%)。第三階段診斷:經計算機定量輔助,三位醫(yī)師的診斷意見完全一致者304例(67.11%),意見完全不一致者0例(圖5)。

圖5 三位醫(yī)師分階段診斷結果:第一至第三階段診斷中,三位醫(yī)師診斷意見一致病例逐漸增多,經計算機定量輔助,三位醫(yī)師診斷意見完全一致病例達304例(67.11%),意見完全不一致的病例為0
2.3 診斷一致性分析常規(guī)診斷階段,三位醫(yī)師診
斷DCIS的一致性較低(Kappa=0.360),差異有統(tǒng)計學意義(P<0.001),中核級DCIS診斷的一致性較低(Kappa=0.181),低核級、高核級DCIS診斷一致性高于中級別(Kappa值分別為0.357、0.553)。經培訓交流后,三位醫(yī)師診斷DCIS的一致性略有提升(Kappa=0.362,P<0.001),中核級DCIS診斷的一致性升高(Kappa值由0.181提升至0.227),而低、高核級DCIS診斷一致性無明顯差異(Kappa值分別為0.348、0.531)。借助計算機定量輔助,三位醫(yī)師診斷DCIS的一致性明顯升高(Kappa=0.638,P<0.001),相對前兩階段分別提高了0.278、0.276,中核級DCIS診斷的一致性也有提升,Kappa值達0.550,較前兩個階段分別提升0.369、0.323。實驗推進過程中,三位醫(yī)師對中級別DCIS診斷的一致性逐漸提高,三個階段診斷的Kappa值分別為0.181、0.227、0.550(表2,圖6)。

表2 三位病理醫(yī)師間Kappa值分析

圖6 三位醫(yī)師各階段診斷Kappa值變化情況
乳腺DCIS分級關系到患者預后評估及決定術后是否需要輔助放療。目前雖然已有多種不同的DCIS分級方法[5-9],但由于不同級別腫瘤間缺乏特異性組織學形態(tài),且無特異性免疫標記將不同級別DCIS完全區(qū)分。病理分級主要依賴于形態(tài)學,實際操作中主觀性強,前期相關研究提示醫(yī)師間診斷的一致性較差[13-15]。本實驗主要探討非乳腺專科病理醫(yī)師對DCIS分級的一致性及可能的改進措施。結果顯示三位醫(yī)師常規(guī)診斷DCIS分級的一致性極低(Kappa=0.360)。即使經過WHO分級標準培訓,診斷一致性略有提升。相比于常規(guī)診斷,三位醫(yī)師經培訓后診斷中核級DCIS一致性的Kappa值有較為明顯改觀,但低核級和高核級DCIS診斷一致性并未得到提升,提示統(tǒng)一診斷標準對各位醫(yī)師已經形成的診斷模式有一定沖擊,但是各自對分級標準的把握度不統(tǒng)一,也很難達提高診斷DCIS的整體分級一致性。經計算機定量輔助,三位醫(yī)師診斷DCIS的一致性明顯提高。
影響診斷一致性的因素可以從兩方面探討:主觀因素是與醫(yī)師對診斷標準的把握度相關;客觀因素是診斷標準的可操作性。
經驗較豐富的醫(yī)師對診斷標準的把握度更穩(wěn)定。如Schuh等[14]召集13位病理醫(yī)師分別應用Holland、Modifified Lagios和Van Nuys三種分級方法對43例DCIS進行分級,三種分級方法的總Kappa值分別為0.27、0.34和0.37。參與該研究的13位病理醫(yī)師中包括4位病理醫(yī)師(低年資醫(yī)師)和3位乳腺病理專科醫(yī)師,上述三種分級方法低年資組醫(yī)師間的診斷一致性(Kappa值分別為0.23、0.29和0.25)低于乳腺病理專科醫(yī)師診斷的一致性(Kappa值分別為0.38、0.58和0.58)。魏兵等[15]關于導管上皮增生性病變的診斷一致性研究中,同樣是高年資組醫(yī)師的診斷一致性優(yōu)于低年資組。病理醫(yī)師經驗的積累是一個漫長的過程,DCIS診斷工作也不可能全部由乳腺專科醫(yī)師完成。本實驗第二階段,三位醫(yī)師統(tǒng)一接受WHO分級標準培訓后,中核級DCIS診斷的一致性略有提升。發(fā)現(xiàn)醫(yī)師B在第一、二階段診斷中核級DCIS的比例分別為57.84%、58.50%,明顯高于醫(yī)師A和醫(yī)師C診斷的中核級DCIS比例,甚至高于文獻報道的上限(57.6%)[16];而醫(yī)師B診斷低核級DCIS比例為9.27%、10.15%,明顯低于醫(yī)師A和醫(yī)師C診斷低核級DCIS的比例。說明雖然接受培訓,各醫(yī)師對診斷標準的把握度仍存在差異,醫(yī)師B對中核級DCIS的診斷較另兩位醫(yī)師寬松,而對低核級DCIS診斷較為嚴謹苛刻。
醫(yī)師對診斷標準把握度,也是診斷標準的可操作性的體現(xiàn)。現(xiàn)有分級標準中對核仁、核染色質以及壞死的等級劃分相對較主觀,甚至有交叉,比如核仁與壞死可以出現(xiàn)在各核級DCIS中;即使對腫瘤細胞核大小有數(shù)值量化,但在實際工作中也難以實現(xiàn)真正量化判斷,這些是醫(yī)師診斷主觀性強、一致性差的原因。簡化分級標準可以一定程度提高診斷一致性。Alghamd等[17]的一致性研究中,三位病理醫(yī)師將300例DCIS分為低、中、高核級時Kappa值為0.235,當只作低核級和非低核級兩類時Kappa值為0.575,Kappa值高于三種核級的分類。
本實驗第三階段借助計算機定量輔助分析腫瘤細胞核直徑與紅細胞核直徑比值,醫(yī)師對腫瘤細胞核有更直觀準確地評估,三位醫(yī)師診斷的一致性較高,Kappa值達0.638,低、中、高核級DCIS診斷的一致性較好,Kappa值分別為0.645、0.550和0.749,較前兩階段明顯提高。相比已報道的無計算機定量輔助的研究有較好的一致性[18]。
綜上所述,DCIS分級一致性影響因素具有多方面性。采用統(tǒng)一診斷標準對提高診斷一致性有一定幫助,醫(yī)師將診斷標準掌握內化為可以穩(wěn)定輸出的技能需要時間積累。積極尋求客觀準確的診斷標準也是有效途徑之一。本實驗觀察計算機定量輔助技術提高DCIS診斷一致性,取得良好效果,如何將更多的分級指標定量化,化主觀為客觀,成為提高DCIS分級一致性的新思路。
(本實驗由河南省腫瘤醫(yī)院張冰醫(yī)師和宜春市人民醫(yī)院張鳳醫(yī)師提供閱片支持;騰訊AI實驗室張軍老師和田寬老師在乳腺DCIS腫瘤細胞核分割上提供了技術支持;四川大學華西醫(yī)院臨床病理研究所石樂飛工程師、趙婷玉工程師和成都理工大學余正波同學開發(fā)了計算機定量輔助判讀閱片軟件,特此致謝!)