盧輝 李峰 胡慶 龐中好 陳圣杰 蔣志華 顧添一 基紅云
近幾年,肺癌在國內外的發病率及致死率逐年上升,現已躋身第一位[1],早期肺癌肺結節(pulmonary nodule)的性質及病因復雜,但隨著CT(Computed Tomography)的廣泛普及和應用,越來越多的肺結節被檢測出來[2]。肺結節分為實性結節(Solid Nodule,SN)和亞實性結節(Subsolid Nodule,SSN)[3],亞實性結節又稱磨玻璃結節(Ground Glass Nodule,GGN)。CT對肺癌早期結節病灶的篩查有重要的臨床價值,使得肺癌的死亡率明顯下降[4]。將人工智能數據計算應用到 CT 閱片,是有效、快速、準確篩查肺部結節的一條捷徑。本研究參考病理和影像學數據結果,探討AI技術對肺癌早期結節良惡性鑒別的臨床應用價值。
一、研究對象
2015年1月—2020年10月江蘇大學附屬醫院診治的因肺結節入院且病理確診為肺癌的患者中選取382例,其中包含胸部CT影像為SN的患者191例、胸部CT影像為GGN的患者191例,收集所有病理確診為惡性結節患者的胸部CT,另外,搜集術后病理診斷為良性的肺結節患者的胸部CT 156例,其中包含CT影像為SN和GGN的患者各78例,共計538例影像作為檢測集。納入標準:1)、符合《肺結節診治中國專家共識(2018年版)》相關診斷標準[5]。2)、手術切除的T1期肺癌病灶,其診斷標準為:肺部CT影像提示結節直徑≤3 cm,被肺或臟層胸膜包繞,未累及葉支氣管近端以上位置,術后病理報告確診為肺惡性腫瘤[6]。排除標準:1)、結節無手術切除病理學檢查結果;2)、患者入院前曾接受過放化療。剔除標準:術后病理提示為轉移性腫瘤[7]。
二、研究方法
1 圖像采集:設備名稱SOMATOM Definition AS CT(西門子128層螺旋CT)。患者仰臥,頭先入,以胸骨柄為定位中心,患者深吸氣并屏氣;行胸部CT掃描,掃描參數調節:電流110~130 mA,電壓120 kV,間距5 mm,層厚5 mm,矩陣512×512,螺距為1.2,范圍為從肺尖以上掃描至橫膈以下;發現病灶后給予CT重建,重建參數:矩陣不變,電壓仍120 kV,層厚1 mm,層隔5 mm,螺距不變。
2 閱片方法:分別采用AI閱片及醫師閱片判讀382例確診肺癌肺結節患者及156例良性肺結節患者胸部CT。(1)AI閱片法,由1位具有10年以上胸部讀片經驗的影像科主治以上醫師采用本研究設計的AI肺結節篩查系統進行輔助診斷。即將所有患者的CT影響資料導入三維深度卷積神經網絡(CUMedVis)算法系統(本研究提供的優化算法的肺癌智能篩查系統)中,軟件能將疑似肺結節的部位進行準確標記,并可顯示結節的直徑,CT值,性質(磨玻璃結節、實性結節等),征象(分頁征、毛刺征、血管集束征等)及惡性概率(惡性概率>70%為高危結節,惡性概率50%~70%為中危結節,惡性概率<50%為低危結節,其中惡性概率>70%的高危結節提示為惡性肺結節,其他提示為良性肺結節[8])等。(2) 本研究設計的AI肺結節篩查的優化算法:在早期肺結節的篩查上,AI的敏感度雖然與傳統的機器視覺算法相似,但AI剔除假陽性結節的能力明顯高于傳統機器算法,最具代表性的AI算法就是 CUMedVis:三維深度卷積神經網絡,可以更有效的將多樣的空間信息整合起來,并升華出更典型、更具有代表性的潛在特征。卷積神經網(convolutional neural network, CNN)就是一種深度神經網絡,并進一步模仿大腦的視覺皮層構造和視覺活動原理而開發[9-10],由于醫療大數據的不斷積累,CNN在醫療應用中的優勢越發明顯。本研究采用三維CNN的三種不同框架結構,使用這三種不同的CNN處理同一空間區域的CT 影像,并通過計算得出此空間區域包含肺結節的概率,計算所得結果定為 P1、P2、P3,采用線性組合公式 P=30%×P1+40%×P2+30%×P3,計算出最終概率P。設定一個閾值,當概率P小于設定閾值時,即判斷為假陽性。本研究的AI算法,很好的降低了相似體多及復雜多樣的肺結節在CT影像上帶來的困難。(3)醫師閱片法由3位具有10年以上肺部讀片經驗的影像科主治以上醫師,對563例肺結節患者胸部CT進行分析判斷(未使用肺結節篩查系統),按照《肺結節診治中國專家共識(2018年版)》相關診斷標準進行分類,并根據肺結節大小、密度、與血管和支氣管關系進行良惡性評估。以上4位醫師均不了解患者的任何病情。
三、統計學方法
本研究采用統計學軟件SPSS22.0和MedCalc軟件對數據進行分析。將統計的AI和醫師閱片診斷肺結節的結果進行配對卡方檢驗進行對比分析。AI檢測肺結節良惡性的效果采用敏感度、特異度、準確率來評估。AI檢測結果的可靠性采用Kappa分析評價。應用受試者工作特征(ROC)曲線分析肺結節的直徑大小對結節良惡性診斷的價值以及AI閱片與醫師閱片對結節的診斷價值。以P<0.05為差異有統計學意義。
一、AI篩查系統對SN和GGN檢出數目的比較
AI檢測出191個SN中有184個為惡性結節,檢出率96.3%;191個GGN中有182個為惡性結節,檢出率95.3%。比較AI閱片對SN和GGN兩種不同結節的良惡性的判斷差異,P=0.799,差異無統計學意義。
二、AI與醫師閱片診斷SN良惡性的比較
AI和醫師閱片診斷出的SN數量對比,P=0.022,差異有統計學意義(見表1)。同理,AI和醫師閱片診斷出的GGN數量對比,P=0.012,差異有統計學意義(見表2)。以病理結果為金標準,AI與醫師閱片對兩種肺結節檢測結果的分析(見表3、4)。

表1 AI與醫師閱片診斷SN良惡性的比較

表2 AI與醫師閱片診斷GGN良惡性的比較

表3 AI與醫師閱片分別與病理診斷SN良惡性的比較[n(%)]
由(表3)可計算出AI和醫師閱片檢測SN的敏感度、特異度、陽性預測值和準確率,同理,根據(表4)可計算出AI和醫師閱片檢測SN的敏感度、特異度、陽性預測值和準確率。現將計算結果統計在(表5)。

表4 AI與醫師閱片分別與病理診斷GGN良惡性的比較[n(%)]

表5 兩種閱片方法診斷惡性肺結節的臨床價值比較
三、AI檢測方法的可靠性評價
利用AI對<3 cm的肺結節CT片重復讀取兩次,記錄統計數值,計算出重復兩次讀取SN的Kappa值為0.928,接近1.0,提示幾乎完全一致。同理,AI重復兩次讀取GGN的Kappa值為0.925,接近1.0,提示幾乎完全一致(見表6、7)。

表6 AI兩次篩查SN的Kappa分析

表7 AI兩次篩查GGN的Kappa分析
四、將538位患者的病理診斷與每一位患者CT圖像中肺結節的直徑通過MedCalc軟件進行對比得到以下ROC曲線:如圖1。得到AUC=0.548,95%CI(0.505~0.590),P=0.076。

圖1 結節直徑大小診斷惡性肺結節的ROC曲線
將AI閱片和醫師閱片的結果同病理診斷結果進行對比分析得到:圖2。AI閱片:AUC=0.934,95%CI(0.910~0.954);醫師閱片:AUC=0.888,95%CI(0.858~0.914);Z統計值為3.082,差異有統計學意義(P<0.05)。

圖2 AI閱片與醫師閱片診斷惡性肺結節的ROC曲線
五、抽取兩名患有不同類型肺結節患者作為示例,(圖3)為一名54歲男性患者的CT影像,提示為右上肺磨玻璃結節,術后病理提示為(右上肺)腺癌(見圖5)。(圖4)為一名49歲女性患者的CT影像,提示為左下肺孤立實性結節,術后病理提示為(左肺)原位腺癌(見圖6)。這兩個病例的AI診斷和病理診斷結果一致。

圖3 患者男,54歲,右上肺磨玻璃結節

圖4 患者女,49歲,左下肺孤立實性結節

圖5 病理:(右上肺)腺癌(HE×200倍)

圖6 病理:(左肺)原位腺癌(HE×200倍)
肺癌嚴重的損害了人類的生命健康,就發病率、病死率而言,已經遠遠超過其他惡性腫瘤[11]。大多數患者因為出現癥狀就診時已經喪失了手術治療的黃金時期[12],所以惡性肺結節的早發現和及時治療對提高肺癌患者生存率[13]及改善晚期愈后至關重要。SN指肺部影像上圓形、類圓形的高密度影,其中血管及支氣管影,可以被掩蓋[14]。GGN指CT影像上圓形、類圓形的高密度影,肺間質結構可見肺內血管、支氣管、小葉間隔影等[15]。而后者又可細分為純磨玻璃結節(Pure Ground Glass Nodule,pGGN)和混合性磨玻璃結節(Mixed Ground Glass Nodule,mGGN)。SN惡性率最低,其次是pGGN,mGGN的惡性率最高[16]。肺結節的性質變化多樣,提前發現早期肺癌結節并采取預防和治療,就可以顯著增加肺癌患者的5年生存率[17]。AI簡單來講,就是通過模擬人類的思考方式來解決人類所面臨的各種實際問題[18],運用設計好的算法,在檢出肺部結節的同時,對結節的形態學特征進行分析計算,最終得出結節的惡性概率,對早期肺結節的診治有指導意義[19]。例如上圖,設計的AI診斷技術可以在病理確診之前預先判斷結節的良惡性,指導臨床治療。
基于此,本研究結合病理診斷以及CT圖像資料結果,采用回顧性研究,收集術后病理確診的肺癌患者的胸部CT資料,比較AI閱片與醫師閱片診斷肺結節良惡性的敏感度、特異性、陽性預測值、準確率的高低,并評估了AI閱片對SN和GGN兩種不同結節的判斷有無差異及AI重復閱片的可靠性。在本文結果中,AI篩查系統對SN和GGN檢出數目的比較反映了AI閱片對SN和GGN兩種不同結節的良惡性判斷差異無統計學意義(P>0.05),同時計算結果也可以看出,AI對SN和GGN的檢出率(96.3%、95.3%)略高于醫師閱片的檢出率(89.0%、93.2%);本研究設計的優化算法應用到AI,可以很好地降低CT圖像中肺結節自身的差異以及類似體復雜多樣對結果的影響,對兩種不同結節的診斷沒有明顯統計學差異,石河子大學醫學院第一附屬醫院的一項研究[20],也證明了AI系統對孤立實性結節和磨玻璃結節的檢出效果是相同的。AI閱片和醫師閱片對兩種結節良惡性的診斷具有差異,P均<0.05,具有統計學意義(表1、2),從而才能從(表3~5)中得出,AI閱片組對肺結節良惡性診斷的敏感性、特異性、陽性預測值、準確率均略高于醫師閱片組,另外通過MedCalc軟件對兩種閱片方法診斷結果進行分析(如圖2),也可以得出AI閱片的診斷能力要高于醫師診斷,這都說明AI在輔助放射科醫師診斷肺癌早期結節診斷方面是有意義的。Kappa計算結果為-1~1,但通常在0~1之間,一致性極低的Kappa值在0.0~0.20之間,一致性一般Kappa值在0.21~0.40之間,一致性中等的Kappa值在0.41~0.60之間,高度一致性的Kappa值在0.61~0.80之間,幾乎完全一致的Kappa值在0.81~1間。通過AI重復閱片(表6、7)計算出SN的Kappa值為0.928,接近1.0,GGN的Kappa值為0.921,接近1.0,提示AI對這兩種結節的二次閱片結果幾乎完全一致,說明AI檢測兩種肺結節重復檢測的可靠性極好,這就為AI閱片的廣泛應用提供了可靠性。這些都說明,可以通過優化AI的算法,提高AI在肺癌早期肺結節診斷中的敏感度和特異度,提高診斷準確率。另外,通過對肺結節的直徑大小與良惡性的關系進行分析(圖1),用ROC曲線下面積(AUC)判斷診斷的準確性,AUC=0.5~0.7表示有較低的準確性,>0.7~0.9具有一定的準確性,>0.9有較高的準確性。圖1中AUC=0.548接近0.5,這個結果表明肺結節的良惡性與結節的直徑大小沒有明顯的相關性,故本實驗不對肺結節的大小進行過多研究。
本研究同時也有相應的局限,首先樣本量不夠多,會對結果造成一定的偏差,其次,在實際的臨床工作中,醫生的水平良莠不齊,加上疲勞、人為測量差異等因素,都會對結果有一定的影響。
綜上所述,AI系統判斷肺結節良惡性雖然特異度欠佳,但總體上較影像醫師的診斷能力略有優勢,在檢測不同類別結節上沒有明顯差異。而且AI診斷肺結節較快速,基于大數據集學習所得到的算法模型可以避免主觀的偏差,雖然包含了一些假陽性結節,但明顯降低了假陰性的發生,顯著提高了臨床醫師的閱片效率。
但基于深度學習的肺結節檢測模型還處在醫療應用初級階段,AI檢測模型的特異性 、準確性均需要進一步的提高[21]。AI的發展需要大數據的支撐以及算法的不斷優化,合理的應用AI輔助診斷系統和放射科醫師閱片結合,能夠更加有效地提高閱片效率,使得更多的肺癌病人能夠得到早期及時的診治,更好的改善愈后及提高生存率。