李 雪 石中月 楊志明 龐文博 金木蘭*
(1.首都醫科大學附屬北京朝陽醫院病理科,北京 100020; 2. 深思考人工智能機器人科技(北京)有限公司,北京 100085)
宮頸癌和乳腺癌是全世界婦女中最常見的兩大惡性腫瘤,全球每年新發宮頸癌患者約50萬例,死亡超過26萬例,約80%的患者集中于經濟欠發達的發展中國家[1]。據統計,全球每年宮頸癌新發病例約52萬,其中我國有近15萬,每年有2萬~3萬婦女死于宮頸癌。近年來,我國宮頸癌發病及病死率呈上升趨勢,且發病年齡出現年輕化趨勢[2]。
目前宮頸液基薄層細胞檢測(thinprep cytologic test,TCT)是宮頸癌篩查的重要手段,但宮頸細胞學閱片人員較為匱乏,難以滿足目前宮頸癌篩查的需求。國際上有關宮頸癌篩查的質量保證指南中規定,細胞技術人員每天要對玻片進行最大官方工作量限制,范圍在25至80例之間[3]。此外,受閱片人員疲勞,技能水平不足和主觀因素的影響,人工判讀結果假陰性率高達10%;癌前病變的靈敏度約65%,特異度約90%[4-5]。
隨著人工智能(artificial intelligence,AI)技術的發展和該技術在醫療影像領域的廣泛應用,人工智能可將圖像中的色彩紋理等人眼難以捕捉的信息形成特征數據呈現出來,通過結合細胞分割、細胞分類等算法,并融合病理醫師的閱片技巧,實現宮頸癌計算機輔助篩查系統,將其應用于巴氏涂片[6]、液基細胞學中,可顯著提高工作效率,減輕閱片人員工作量,對于宮頸癌早期篩查有著重大的意義。本研究比較了人工智能輔助篩查系統和常規細胞學鏡下閱片中的宮頸癌前病變檢出情況,以探討人工智能輔助篩查在宮頸液基薄層細胞學檢查中的應用價值。
選取2019年1 月至2019年8 月首都醫科大學附屬北京朝陽醫院婦科門診和體檢門診收集到的1 000例有明確診斷結果的TCT涂片進行研究。
宮頸細胞液基薄層涂片均按照美國新柏氏公司TCT檢測儀的說明采樣,用特制的宮頸刷收集宮頸外口和頸管脫落的細胞,將收集的細胞洗入盛有ThinPrep細胞保存液的小瓶中[7]。專業病理醫師采用鏡下閱片方式進行細胞學診斷,人工智能宮頸癌輔助篩查系統采用數字化宮頸涂片后智能閱片。
為驗證人工智能輔助篩查在宮頸液基薄層細胞學檢查中的價值,采用目前國際廣泛使用的TBS 2014分級系統[8]進行細胞學診斷。診斷結果具體描述為:①未見上皮內病變或惡性細胞(negative for intraepithelial lesion or malignancy, NILM);②意義不明的非典型鱗狀細胞(atypical squamous cells of undetermined significance,ASC-US);③不典型鱗狀細胞,不能排除高度上皮內病變的不典型鱗狀細胞(atypical squa-mous cells, cannot exclude HSIL,ASC-H);④低度鱗狀上皮內病變(low grade squamous intra-epithelial lesion,LSIL);⑤高度鱗狀上皮內病變(high grade squamous intraepithelial lesion,HSIL);⑥鱗狀細胞癌(squamous cell carcinoma,SCC);⑦未明確診斷意義的非典型腺癌(adenocarcinoma glandular carcinoma,AGC),其中ASC-US及以上認定為陽性涂片。
1 000例涂片分別采用病理醫師人工篩查、深思考公司研發的人工智能輔助篩查以及人工智能輔助分析基礎上病理醫師復查,并對比分析采用三種篩查方式篩查宮頸癌的結果。
人工篩查團隊由3名具有10年以上宮頸細胞學閱片經驗的病理醫師組成。在人工智能輔助篩查的基礎上,病理醫師復查閱片中判斷結果不一致的涂片,以病理醫師的復查閱片的結果為準。
醫學輔助診斷系統的評價方法一般是比較系統分析結果和醫師診斷的患者真實病情,目前通常將診斷結果分為4類: 真陰性(true negative,Tn),患者的真實情況為沒有病變,系統診斷為無病變;假陰性(false negative,Fn),患者的真實情況為有病變,系統診斷為無病變;真陽性(true positive,Tp),患者的真實情況為有病變,系統診斷為有病變;假陽性(false positive,Fp):患者的真實情況為沒有病變,系統診斷為有病變。
人工智能輔助篩查系統的性能可以通過準確率(accuracy,ACC),特異度(specificity, SPE)和靈敏度(sensibility, SEN)等[9-11]指標進行度量。SPE是衡量系統準確診斷為陰性的能力,是真陰性與陰性樣本數量的比率;SEN是衡量系統準確診斷為陽性的能力,是真陽性與陽性樣本數量的比率。
采用SPSS 14.0統計軟件對數據進行統計學分析,組間比較采用χ2檢驗,以P<0.05為差異有統計學意義。以原始病理的診斷結果為標準,評估人工智能輔助篩查技術與病理診斷的靈敏度和特異度等指標。
從表1中可以看出,病理醫師篩查結果和人工智能輔助篩查結果均接近于標準樣片,但由于病理專家對各分級樣本的評判標準不同,在一定程度上存在樣本定級的分歧;相比較而言,人工智能輔助篩查雖然對NILM有部分錯檢,但可以保證各陽性樣本的準確定級,經由病理醫師對人工智能輔助篩查的結果進行復核閱片,AI+醫師共同閱片分析可以保證病例樣本的精準分級。

表1 宮頸細胞學檢查結果對比
AI: artificial intelligence;NILM: negative for intraepithelial lesion or malignancy;ASC-US: atypical squamous cells of undetermined significance;ASC-H: atypical squamous cells, cannot exclude HSIL;LSIL: low grade squamous intraepithelial lesion;HSIL: high grade squamous intraepithelial lesion;SCC: squamous cell carcinoma;AGC: adenocarcinoma glandular carcinoma.
與病理醫師人工篩查相比,使用人工智能輔助篩查之后再由病理醫師進行復核的診斷結果差異具有統計學意義(χ2=2.009,P=0.04)。
通過對表1的數據進一步的統計和分類,根據TBS 2014分級系統細胞學診斷標準,ASC-US、ASC-H、LSIL、HSIL、AGC被認為陽性,NILM和微生物感染被認為是陰性。
同時,對假陰性和假陽性進行統計的結果顯示,人工智能輔助篩查結果中假陽性為22例,即AI診斷結果會在一定范圍內造成部分假陽性病例,詳見表2。但從表1中可知,這部分結果多數存在于ASC-US,同時,假陰性0例。

表2 宮頸細胞學診斷結果對比
AI: artificial intelligence.
此外,在病理醫師的篩查結果中,有4例涂片被認定為真陰性,但在人工智能輔助篩查的結果中認定為陽性,經復檢的病理醫生對上述4例涂片進行重新閱片并查閱人類乳頭瘤病毒(human papillomavirus,HPV)檢驗結果,發現其中3例(圖1A、B)為陽性漏診,1例為人工智能輔助閱片系統誤診,將基底層細胞誤判為陽性細胞(圖1C)。

圖1 深思考人工智能輔助篩查與人工閱片結果不一致的涂片
在人工智能輔助下,病理醫師對1 000例樣本的診斷準確率可以達到99.80%,并且靈敏度高達100%。詳見表3 。

表3 宮頸細胞學靈敏度與特異度指標
AI: artificial intelligence.
本研究中,人工篩查閱片經由3名病理醫師分別閱片300余例,共同完成1 000 例的人工篩查的閱片工作,3名病理醫師人工篩查共計耗時3.5 d,人工智能輔助篩查系統僅用20 h 內即可完成1 000例的閱片工作。詳見表4。

表4 宮頸細胞學篩查閱片時間對比
#A pathologist works 8 h per day, while AI assistance analysis system can work 24 h continuously;AI: artificial intelligence.
宮頸癌長期以來嚴重威脅婦女的生命健康,定期進行宮頸病變的篩查,及早發現和治療早期宮頸癌及癌前病變,是降低宮頸癌發病率和病死率的重要手段。幾乎100%的宮頸癌由HPV所引起,傳統的巴氏涂片假陰性率較高,這是由于取材時80%以上的細胞流失,且涂片細胞過厚、重疊,過多的黏液、血液或炎性反應細胞的混雜影響了診斷。但采用HPV DNA作為篩查靶標仍然存在特異度較低的缺陷,宮頸細胞學檢查是目前宮頸癌篩查的主要方法,降低了傳統細胞學涂片的假陰性率,有效提高了宮頸病變診斷的靈敏度。
婦女發展綱要(2011-2020)要求宮頸癌篩查覆蓋率需達到80%,基于我國女性人口總數約6.5億,30%的女性從來沒有進行過篩查的事實基礎,目前篩查率遠低于這一水平。受限于有經驗的專業病理醫師的人數不足,以及閱片效率太低,使得篩查率短期內難以進一步提升。
本研究結果表明,人工智能輔助篩查可以降低假陽性,而且不會造成假陰性的出現,幫助病理醫師減少漏診,在人工智能輔助下,病理醫師診斷準確率可以達到99.80%,并且靈敏度高達100%,說明人工智能輔助篩查是可依賴的。本研究實驗數據表明,在人工智能輔助篩查的基礎上由專業病理醫師復核的方式,宮頸癌篩查效率能夠提高4倍以上,同時,由于人工智能篩查能夠自動分割和識別液基涂片上細胞的病變區域和類型,真正實現了宮頸細胞學智能化閱片,讓診斷醫生將精力集中于診斷細胞,而不是尋找細胞,這極大地節省了醫生的精力。
本研究中發現的1例病例由人工智能輔助閱片系統誤診為陽性細胞,經病理醫生復診為基底層細胞或修復細胞,這可能是因為基底層細胞核漿比較高,被人工智能誤認為是病變細胞,這提示人工智能在正確鑒別基底層細胞和病變細胞方面仍需改進。
綜上所述,相比于傳統的病理醫師篩查方式,人工智能輔助篩查具有高靈敏度與特異度,即對于識別度較低、人眼難以區分的樣例,能夠有效地規避漏檢的風險。在宮頸細胞學輔助篩查中采用TCT、人工智能宮頸癌輔助篩查系統聯合篩查,可提高診斷準確率,提高工作效率,為治療宮頸癌提供診斷依據,值得臨床推廣。