尹 柯,巴文娟,湯 敏,劉金沙,汪 瓊,孫婷婷,謝 梅,沈 晶,林 琳,伍建林
(大連大學附屬中山醫(yī)院放射科,遼寧 大連 116000)
2011年,國際肺癌研究協(xié)會(International Association for the Study of Lung Cancer, IASLC)、美國胸科學會(American Thoracic Society, ATS)和歐洲呼吸學會(European Respiratory Society, ERS)將肺腺癌分為不典型腺瘤樣增生(atypical adenomatous hyperplasia, AAH)、原位腺癌(adenocarcinoma in situ, AIS)、微浸潤性腺癌(minimally invasive adenocarcinoma, MIA)和浸潤性腺癌(invasive adenocarcinoma, IA)[1],其中AIS、MIA和以貼壁生長為主的IA胸部CT多表現(xiàn)為純磨玻璃結(jié)節(jié)(pure ground glass nodule, pGGN)[2]。既往研究[3-7]表明,AIS、MIA與IA患者預后存在差異[8-12],因此,準確評估pGGN肺腺癌病理亞型對臨床早期正確干預十分重要。人工神經(jīng)網(wǎng)絡起源于對人類大腦思維模式的研究,屬于數(shù)據(jù)建模工具[13-14],其中的多層感知器(multilayer perceptron, MLP)可對輸入數(shù)據(jù)進行非線性分類。本研究利用MLP對pGGN分類,探討MLP預測pGGN肺腺癌浸潤程度的價值。
1.1 一般資料 收集2015年1月―2018年10月于大連大學附屬中山醫(yī)院、大連醫(yī)科大學附屬第二醫(yī)院和大連市中心醫(yī)院經(jīng)手術病理證實為肺腺癌的393例pGGN患者作為訓練集,男121例,女272例,年齡24~78歲,平均(55.8±11.1)歲;共442枚pGGN,根據(jù)病理學診斷分為浸潤前病變(pre-invasive lesions, PIL)組(共254枚pGGN,其中AAH 31枚,AIS 62枚,MIA 161枚)和IA組(188枚pGGN)。以2019年6月—8月于大連大學附屬中山醫(yī)院及大連醫(yī)科大學附屬第二醫(yī)院經(jīng)手術病理證實為肺腺癌的89例pGGN患者為測試集,男27例,女62例,年齡18~77歲,平均(54.8±11.9)歲;共100枚pGGN,其中PIL組59枚, 包括AAH 10枚、AIS 18枚、MIA 31枚,IA組41枚。納入標準:pGGN患者,術前1個月內(nèi)接受胸部CT檢查,圖像層厚1 mm,pGGN最大徑≤30 mm。排除標準:①術前接受化學治療或放射治療;②圖像存在嚴重偽影。
1.2 儀器與方法 采用Siemens SOMATOM Definition雙源CT及SOMATOM Definition AS 64層CT掃描儀,于吸氣末行胸部掃描,掃描范圍自胸廓入口至肺底。掃描參數(shù):管電壓100~140 kV,管電流200~280 mAs,層厚和層間距均為5 mm,肺窗窗寬1 200 HU,窗位-600 HU;縱隔窗窗寬350 HU,窗位-50 HU,以高分辨骨算法進行后處理,重建層厚為1 mm。
1.3 評估圖像 由2名分別具有6年及8年工作經(jīng)驗的醫(yī)師采用圖像存儲與傳輸系統(tǒng)(picture archiving and communications system, PACS)系統(tǒng)評估pGGN的CT征象,意見分歧時由1名具有30年胸部影像學診斷經(jīng)驗的主任醫(yī)師評判。評估項目包括pGGN形狀(圓形、類圓形或非圓形、非類圓形),邊緣(是否清晰)以及是否存在胸膜凹陷征、空泡征、空氣支氣管征及主要血管穿行,后者定義為肺門發(fā)出供應各肺段血管至其直達胸膜下區(qū)分叉前或各肺段血管分支在其二級分叉之前進入病灶[15],以多平面重建及最大強度投影圖像對其進行分析。測量CT定量參數(shù),包括病灶最大徑及平均CT值。
1.4 統(tǒng)計學分析 采用SPSS 20.0統(tǒng)計分析軟件。連續(xù)變量用±s表示。以獨立樣本t檢驗比較組間pGGN直徑與CT值。以受試者工作特征(receiver operating characteristic, ROC)曲線評價pGGN直徑和CT值鑒別診斷pGGN的效能,并獲得最佳截斷值。采用χ2檢驗比較組間分類變量,以差異存在統(tǒng)計學意義的指標分別建立二元Logistic回歸模型及MLP模型。通過測試集以曲線下面積(area under the curve, AUC)、準確率、敏感度及特異度評估模型的預測效能。P<0.05為差異有統(tǒng)計學意義。
2.1 CT征象 訓練集IA組pGGN直徑(15.34±5.69)mm,CT值(-577.10±98.8)HU,均高于PIL組[(8.76±3.02)mm,(-607.00±112.40)HU,P均<0.05]。以直徑10 mm、CT值-675 HU為最佳截斷值,pGGN直徑>10 mm(χ2=127.296)及CT值>-675 HU(χ2=12.408)的pGGN多為IA(P均<0.001)。PIL組與IA組pGGN形狀、邊緣、胸膜凹陷征、空泡征、主要血管穿行及空氣支氣管征差異均有統(tǒng)計學意義(P<0.05)。見表1。

表1 訓練集PIL組及IA組CT征象(枚)
2.2 建立模型及評估預測效能 回歸分析顯示pGGN直徑、CT值、主要血管穿行、胸膜凹陷征及空氣支氣管征是IA的獨立危險因素(表2);以之構(gòu)建的二元Logistic回歸模型在驗證集的AUC(圖1)、預測準確率、敏感度、特異度分別為0.799、0.820、0.683和0.915。

表2 訓練集pGGN二元Logistic回歸變量分析結(jié)果

圖1 MLP模型與二元Logistic回歸模型檢出驗證集IA的ROC曲線 AUC分別為0.869和0.799
2.3 建立MLP模型并評估預測效能 以單變量分析顯示差異具有統(tǒng)計學意義者作為因子建立的MLP模型見圖2。以AUC(0.869)、預測準確率(0.880)、敏感度(0.805)及特異度(0.932)評估MLP模型對于驗證集的預測效能,其絕對凈重新分類改善指數(shù)(net reclassification improvement, NRI)為6%,與二元Logistic回歸模型差異具有統(tǒng)計學意義(Z=3.473、P=0.001),見表3;模型驗證案例見圖3、4。

圖2 MLP模型示意圖 模型包括1個輸入層、1個隱藏層和1個輸出層,輸入層神經(jīng)元數(shù)16個,隱藏層6個,輸出層2個

圖3 患者女,42歲,右肺上葉pGGN,術后病理證實為MIA CT見右肺上葉直徑10.3 mm類圓形pGGN,CT值-694 HU,邊緣清晰,未見胸膜凹陷征、主要血管穿行及空氣支氣管征,MLP模型及二元Logistic回歸模型均判斷為PIL 圖4 患者女,26歲,右肺上葉pGGN,術后病理證實為IA CT見右肺上葉直徑9.6 mm類圓形pGGN,CT值-587 HU,邊緣清晰,未見胸膜凹陷征及主要血管穿行,可見空氣支氣管征, 二元Logistic回歸模型判斷為PIL,MLP模型判斷為IA

表3 MLP模型與二元Logistic回歸模型預測驗證集的效能比較
隨著人工智能輔助CT篩查肺癌在全球范圍內(nèi)逐漸展開,大量pGGN被檢出。既往研究[16-17]證實,根據(jù)pGGN直徑及CT特征如胸膜凹陷征和空氣支氣管征等,可分析和鑒別其惡性浸潤程度。本研究發(fā)現(xiàn),通過評估pGGN的CT特征并建立MLP模型可預測PIL和IAC,并具有較高的AUC、預測準確率、敏感度和特異度。MLP模型具有輸入層、輸出層以及輸入和輸出之間的“隱藏”層;一個或多個隱藏層構(gòu)成神經(jīng)元,神經(jīng)元之間的連接賦予相關權重,在迭代過程中不斷調(diào)整權重以訓練學習算法,使得預測誤差最小化。
本研究將AAH、AIS和MIA歸入PIL組[18-20],此類患者亞肺葉切除術后5年生存率接近100%;對IA而言,肺葉切除術與淋巴結(jié)清掃術或采樣是標準外科手術方式,術后患者5年生存率60%~88%[8-12],但術中冰凍切片往往難以準確反映腺癌的侵襲性。術前預測pGGN的浸潤性有助于制定手術規(guī)劃方式。為此有必要建立無創(chuàng)性術前預測模型,輔助放射科醫(yī)師及胸外科醫(yī)師更好地區(qū)分PIL及IA。
既往研究[16]表明,利用二元Logistic回歸分析建立診斷模型對于鑒別良惡性磨玻璃結(jié)節(jié)[(ground glass nodule, GGN),包括pGGN和混合磨玻璃結(jié)節(jié)(mix ground glass nodule, mGGN)]具有較高診斷價值,但其前期研究模型建立組數(shù)據(jù)較少,為單中心樣本,且未涉及GGN浸潤程度及由此帶來的手術方式及預后差異。本研究采用多中心較大樣本量建立二元Logistic回歸預測模型,同時以同一數(shù)據(jù)樣本建立MLP模型,后者只需輸入pGGN的放射學特征(是否具有某種CT征象)即可自動預測其分類,較前者具有更高的AUC、敏感度、特異度和預測準確率,與二元Logistic回歸模型相比NRI為6%。有學者[18]嘗試利用隨機森林統(tǒng)計工具預測GGN中的PIL及IA,本研究所獲AUC與之近似,但本研究對象是性質(zhì)更難以判斷的pGGN,而mGGN往往多提示為病理學上的IA[21]。
本研究的不足是使用放射學特征,而非直接從CT圖像中提取信息,未來將直接以成像數(shù)據(jù)集來開發(fā)用于相同目的的深度學習算法;另外,本研究未納入患者臨床信息資料,可能導致?lián)p失部分診斷效能。
總之,本研究發(fā)現(xiàn)MLP模型較二元Logistic回歸模型預測pGGN為PIL或IA的效能更佳,有望作為一種無創(chuàng)性預測工具,替代或部分替代活檢,亦可在pGGN病變早期和隨訪期間輔助臨床進行有效管理,并有助于胸外科醫(yī)師術前制定合理手術方案,具有較好的臨床應用前景。