何忠 宋薇 鄧澤 劉毓哲 鄭銳
肺癌在我國發(fā)病率及病死率都位居首位,而肺腺癌是肺癌最常見的組織學(xué)亞型[1]。早期缺乏特異的臨床癥狀是肺癌死亡率高的主要原因之一,大多數(shù)患者就醫(yī)時腫瘤已出現(xiàn)明顯增長,在我國約75%的肺癌患者在診斷時已屬晚期[2]。因此,早發(fā)現(xiàn)、早干預(yù)是提高肺癌患者生存的關(guān)鍵,肺結(jié)節(jié)為早期肺癌的影像學(xué)表現(xiàn)之一,如何有效地對肺結(jié)節(jié)進行鑒別診斷,快速明確其良惡性,是肺結(jié)節(jié)診斷治療的關(guān)鍵。近年來人工智能(artificial intelligence,AI)發(fā)展迅速,其能自動提取肺結(jié)節(jié)位置、大小、形態(tài)信息,還能進一步提供肺結(jié)節(jié)分類(實性、亞實性及鈣化等),在肺結(jié)節(jié)智能化檢測方面顯示出明顯優(yōu)勢[3-4],廣泛應(yīng)用于肺癌的早期檢測[5]及分子亞型分析等[6]。本研究使用了一種基于深度學(xué)習(xí)的人工智能肺結(jié)節(jié)輔助診斷系統(tǒng),該系統(tǒng)不但能夠?qū)Ψ谓Y(jié)節(jié)做出定性分析,還能夠自動預(yù)測早期肺腺癌的侵襲程度,國內(nèi)目前鮮有報道,本研究旨在評估人工智能輔助診斷系統(tǒng)對肺結(jié)節(jié)定性診斷的準(zhǔn)確性及預(yù)測肺腺癌浸潤程度的臨床應(yīng)用價值。
本研究連續(xù)篩選2021年1月至2022年1月在中國醫(yī)科大學(xué)附屬盛京醫(yī)院行肺部CT掃描并發(fā)現(xiàn)肺部結(jié)節(jié),且經(jīng)外科手術(shù)取得病理結(jié)果。納入標(biāo)準(zhǔn):①CT圖像顯示在肺窗下測量肺結(jié)節(jié)最大徑≤30 mm。②胸部平掃采用標(biāo)準(zhǔn)重建算法序列進行重建,層厚1.00~1.25 mm。③多發(fā)性肺結(jié)節(jié)的患者,僅納入有病理證實的結(jié)節(jié)。排除標(biāo)準(zhǔn):①胸部CT檢查之前已對病灶進行過穿刺活檢、射頻消融等侵入性診斷或治療。②檢查前因其他部位腫瘤,已經(jīng)接受過全身化療、靶向治療或胸部放療的患者。
最終納入符合標(biāo)準(zhǔn)的患者528例,其中男性122例,女性406例,平均年齡(56.25±9.91)歲。肺結(jié)節(jié)共計606個,根據(jù)肺結(jié)節(jié)病理結(jié)果分為良性組205個,惡性組401個,其中病理為肺腺癌的肺結(jié)節(jié)389個。本研究經(jīng)本院倫理委員會審核批準(zhǔn)(2020PS691K),入組患者均免除知情同意。
肺腺癌患者病理按照2015年WHO肺腺癌分類標(biāo)準(zhǔn)[7]分為:①浸潤前病變,包括非典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)及原位腺癌(adenocarcinoma in situ,AIS)。②微浸潤腺癌(microinvasive adenocarcinoma,MIA)。③浸潤性腺癌(invasive adeno-carcinoma,IAC)。
使用荷蘭Philips Ingenuity 64 CT進行掃描,掃描參數(shù):管電壓100~120kV,管電流200~280mA,掃描層厚5 mm,層間距5 mm,圖像均采用高分辨率算法重建,且重建層厚為1.00 mm,并上傳至PACS。
分別采用人工智能(AI)和醫(yī)師閱片方法判斷肺結(jié)節(jié)患者胸部CT。①醫(yī)師閱片法由2位具有10年以上閱片經(jīng)驗的放射科醫(yī)師獨立對肺結(jié)節(jié)患者胸部CT進行分析診斷,按照《肺結(jié)節(jié)診治中國專家共識(2018年版)》診斷標(biāo)準(zhǔn)[8]進行分類,并根據(jù)肺結(jié)節(jié)大小、密度、形狀與血管和支氣管的關(guān)系進行良惡性評估,人為將病變劃分為可能良性及可疑惡性,兩位放射科醫(yī)生之間的任何分歧都通過討論或咨詢第三位調(diào)查員來解決。②AI閱片法由1位呼吸科醫(yī)師使用人工智能肺結(jié)節(jié)診斷系統(tǒng)(上海點內(nèi)科技有限公司提供)進行輔助診斷。將胸部CT的DICOM圖像導(dǎo)入采用3D DenseNet模型算法的智能診斷系統(tǒng),記錄AI系統(tǒng)識別肺結(jié)節(jié)平均直徑、密度分類、結(jié)節(jié)體積、惡性概率(惡性概率≥70% 提示為惡性結(jié)節(jié),惡性概率<70% 提示為良性結(jié)節(jié))以及惡性結(jié)節(jié)浸潤程度分類(見圖1)。

圖1 人工智能肺結(jié)節(jié)分析結(jié)果圖示

本研究最終納入符合標(biāo)準(zhǔn)的肺結(jié)節(jié)606個,所有患者均經(jīng)胸腔鏡下部分肺葉或肺段切除,病理診斷結(jié)果匯總(見表1)。

表1 病理結(jié)果匯總表
人工智能診斷與病理結(jié)果的一致性檢驗結(jié)果(見表2)。病理結(jié)果為惡性肺結(jié)節(jié)組401個,人工智能診斷低危肺結(jié)節(jié)23個,高危肺結(jié)節(jié)378個;良性肺結(jié)節(jié)組205個,人工智能診斷低危肺結(jié)節(jié)144個,診斷高危肺結(jié)節(jié)61個。二者一致性檢驗的Kappa值為0.676(P<0.001),人工智能對肺結(jié)節(jié)定性診斷與病理結(jié)果的符合率良好。

表2 人工智能診斷與病理結(jié)果的一致性檢驗
人工智能輔助診斷系統(tǒng)識別惡性肺結(jié)節(jié)的效能(見圖2及表3)。根據(jù)人工智能輔助診斷系統(tǒng)預(yù)測的肺結(jié)節(jié)惡性概率和醫(yī)師閱片符合率繪制ROC曲線。人工智能組的ROC曲線下面積為0.91 (95%CI0.891~0.936),敏感度94.3%,特異度70.2%;醫(yī)師閱片組的ROC曲線下面積為0.767(95%CI0.724~0.811),敏感度80.5%,特異度63.3%。

表3 兩種閱片方法診斷惡性肺結(jié)節(jié)的臨床價值比較

圖2 人工智能與醫(yī)師組閱片診斷惡性肺結(jié)節(jié)的ROC曲線
兩組患者一般資料比較,惡性結(jié)節(jié)組患者的年齡(56.97±9.26)歲,高于良性結(jié)節(jié)組(54.87±10.71)歲,差異有統(tǒng)計學(xué)意義(P<0.05),惡性結(jié)節(jié)組女性患者(69%)比例更高,差異有統(tǒng)計學(xué)意義(P<0.05),通過分析人工智能系統(tǒng)得出的惡性概率發(fā)現(xiàn),惡性結(jié)節(jié)的惡性概率明顯高于良性結(jié)節(jié)組[83%(80%,87%)vs47%(23%,78%),P<0.001],AI量化參數(shù)比較發(fā)現(xiàn),兩組肺結(jié)節(jié)在平均直徑、體積比較差異無統(tǒng)計學(xué)意義,而惡性結(jié)節(jié)組的CT平均值和CT最大值均低于良性結(jié)節(jié)組(P<0.001)(見表4)。

表4 患者基本臨床資料和AI定量參數(shù)比較
人工智能肺結(jié)節(jié)輔助診斷系統(tǒng)在區(qū)分浸潤前病變和浸潤性病變方面具有良好的效能,病理類型為AAH/AIS的只有1個被預(yù)測為IAC,而病理類型為IAC的只有2個被預(yù)測為AAH/AIS(見表5)。根據(jù)病理結(jié)果,將肺腺癌組分成兩個亞組:非浸潤性(AAH/AIS、MIA)和浸潤性腺癌(IAC),構(gòu)建ROC曲線評估人工智能輔助診斷系統(tǒng)對病理類型二分類結(jié)果的預(yù)測價值,人工智能輔助診斷系統(tǒng)的ROC曲線下面積為0.808(95%CI0.759~0.857),敏感度71.0%,特異度89.7%(見表6,圖3)。

表5 人工智能預(yù)測肺腺癌侵襲程度的臨床價值

表6 非浸潤性和浸潤性肺腺癌組人工智能ROC曲線分析

圖3 人工智能判斷肺腺癌侵襲程度的ROC曲線
肺癌是最常見的惡性腫瘤之一,嚴(yán)重影響人們身心健康。研究顯示,我國肺癌的5年生存率僅為19.8%,與日本的32.9%相比仍有很大差距[9]。而早期發(fā)現(xiàn)并確診的肺癌患者進行治療后,5年生存率可高達70%左右[10]。由此可見,對肺癌高危人群進行早期篩查、早診斷和早治療可有效降低肺癌的死亡率。早期肺癌在CT影像學(xué)上多表現(xiàn)為肺結(jié)節(jié),肺結(jié)節(jié)的檢出率因不同的人群而有所差異[11]。據(jù)統(tǒng)計美國每年新發(fā)肺結(jié)節(jié)人數(shù)超過159萬例[12],并且隨著肺癌篩查項目的普及,偶然發(fā)現(xiàn)肺結(jié)節(jié)人數(shù)在不斷增加。關(guān)于8個大型肺癌篩查項目的薈萃分析結(jié)果顯示,單一肺結(jié)節(jié)的發(fā)病率在8%~51%,最終有1%~12%的結(jié)節(jié)發(fā)生惡變[13]。對臨床醫(yī)師和放射科醫(yī)師最主要的問題是鑒別肺結(jié)節(jié)的良惡性,并讓惡性肺結(jié)節(jié)患者及時接受有效的治療。但是,大量CT圖像的分析對放射科醫(yī)師來說也是個挑戰(zhàn),尤其是對高危人群的大規(guī)模篩查,大量閱片造成的疲勞等因素,使得肺結(jié)節(jié)的漏診幾乎不可避免。因此,如何能在大量圖像資料中準(zhǔn)確篩查出高危結(jié)節(jié)已成為臨床迫切需求。基于深度學(xué)習(xí)的人工智能憑借其準(zhǔn)確的算法模型,不僅能在短時間內(nèi)檢出肺結(jié)節(jié),而且能對其進行定性分析,預(yù)測其良惡性。避免主觀偏差,提高分析的效率和客觀性。
本研究以術(shù)后病理結(jié)果作為診斷肺結(jié)節(jié)的金標(biāo)準(zhǔn),與AI的診斷結(jié)果相比,kappa值為0.676,說明兩種方法有較好的一致性,與Gu等人[14-15]研究結(jié)果相似,證明AI能夠很好的鑒別惡性肺結(jié)節(jié)。AI診斷惡性肺結(jié)節(jié)的ROC曲線下面積為0.91 (95%CI0.891~0.936),敏感度為94.3%,均明顯高于放射科醫(yī)師閱片,表明AI具有更好的診斷效果。由于算法的不同,文獻報道AI鑒別肺結(jié)節(jié)良惡性的特異度可達34.69%~100%[16],本研究獲得AI鑒別肺結(jié)節(jié)良惡性的特異度為70.2%,略高于醫(yī)師閱片的特異度(63.3%)。特異度不高主要原因考慮:由于肺臟的血管、支氣管、肺組織等結(jié)構(gòu)復(fù)雜,肺結(jié)節(jié)的形態(tài)多樣,支氣管內(nèi)痰栓,肺內(nèi)淋巴結(jié)等均可誤診為高危肺結(jié)節(jié)[17]。
本研究進行良、惡性肺結(jié)節(jié)患者臨床資料比較發(fā)現(xiàn),兩組在年齡、女性患者比例方面差異有統(tǒng)計學(xué)意義。年齡是公認的肺癌發(fā)病的獨立危險因素,隨著年齡的增長,肺癌的發(fā)病率逐漸增高[18]。本研究納入的肺癌患者以肺腺癌為主,文獻報道女性比男性患肺腺癌的機率更大,尤其是不吸煙女性,患支氣管肺泡癌的可能性是男性的2~4倍[19]。其原因考慮可能與基因構(gòu)成、激素、環(huán)境暴露、某些病毒感染及煙草危害的性別差異等相互作用的結(jié)果[20]。AI定量分析表明良、惡性肺結(jié)節(jié)患者組間結(jié)節(jié)平均CT值、最大CT值及惡性概率值差異均有統(tǒng)計學(xué)意義,與Shi等[21]的研究結(jié)果一致。
肺腺癌是肺癌最重要的組織學(xué)亞型,早期診斷和臨床干預(yù)對患者的預(yù)后尤為重要。研究[22]報道AAH、AIS和MIA病人的5年無病生存率幾乎達到100%,顯著高于IAC患者(80%),因此正確判斷肺腺癌病理亞型對提高病人的生存率至關(guān)重要。本研究采用的基于3D DenseNet模型的AI肺結(jié)節(jié)輔助診斷系統(tǒng)可自動預(yù)測肺腺癌的侵襲程度,病理類型為AAH/AIS的極少被預(yù)測為IAC,而病理類型為IAC的很少被預(yù)測為AAH/AIS,說明AI具有良好的分類效能,可以幫助臨床醫(yī)生術(shù)前預(yù)判肺腺癌病理浸潤程度。2019年Masahiro等[23]報告了一種基于三維卷積神經(jīng)網(wǎng)絡(luò)(Three-dimensional convolutional neural network,3D-CNN)的AI肺結(jié)節(jié)檢測模型,其預(yù)測肺腺癌病理亞型的AUC值為0.712,與經(jīng)驗豐富的放射科醫(yī)師(AUC=0.714)幾乎相同,且診斷的特異度(0.667vs0.458)優(yōu)勢明顯,但其敏感度(0.758vs0.970)相對較差,而本研究的AI輔助診斷模型預(yù)測肺腺癌病理類型二分類結(jié)果的AUC值為0.808,敏感度為0.710,特異度為0.897,說明AI有較好的分類診斷準(zhǔn)確性,能很好的輔助臨床醫(yī)生預(yù)測肺腺癌的侵襲程度,但其敏感度還有一定的提升空間。
本研究的局限性:(1)本文納入的病例均為有明確病理結(jié)果的肺結(jié)節(jié),可能存在一定的選擇性偏移。(2)需進一步擴大樣本量,對AI診斷的有效性進行充分的驗證。
綜上所述,一種基于3D卷積神經(jīng)系統(tǒng)和多任務(wù)學(xué)習(xí)的人工智能系統(tǒng)可以準(zhǔn)確量化肺結(jié)節(jié)三維特征參數(shù),計算其惡性概率,且結(jié)果可信度較高,并且能自動預(yù)測早期肺腺癌浸潤程度,是影像科醫(yī)生可靠而實用的有力助手,可在臨床中廣泛應(yīng)用。