趙帥, 孟令思, 郭君武
孤立性肺結節(solitary pulmonary nodule,SPN)指單一、邊界清晰、影像不透明、直徑≤30 mm,周圍含氣肺組織所包繞的病灶[1]。目前,臨床上SPN的診斷鑒別涉及多種良惡性病變,包括原發性肺癌以及錯構瘤[2]。快速識別并切除惡性SPN可提升非小細胞肺癌患者5年生存率至60%~80%[3],同時術前對于患者SPN良惡性的診斷有助于臨床治療決策的快速評估,優化醫療資源的配置。目前,SPN良惡性的診斷金標準仍為病理活檢,病理活檢仍存在并發感染、侵襲性且滯后性等問題[4]。 CT目前廣泛用于臨床上無侵襲性定性評估SPN[5],CT可通過直觀的視覺分辨腫瘤大小、腫瘤密度以及腫瘤邊緣[6]。然而相比較常規的CT掃描,CT靶掃描確保CT征象明顯豐富,不僅可在形態學上提供高清CT特征,同時其CT密度值更為精確,可用于CT圖像的進一步科學研究[7]。
CT對于SPN的良惡性的誤診率接近60%[8]。然而由于腫瘤異質性,腫瘤紋理的變化與腫瘤基因組學的變化具有直接相關性[9]。2012年Lambin提出影像組學(Radiomics)至今[10],Radiomics類似于圖像的“基因組學”,聯合患者多模態臨床信息構建模型無侵襲性定量評估患者疾病[11]。因此,本研究的目的在于基于CT靶掃描圖像進行影像組學特征提取聯合CT征象構建聯合模型評估SPN的良惡性。
1.研究對象
納入2018年1月-2020年7月在鄭州大學第二附屬醫院行胸部CT檢查診斷為肺結節患者。患者入組標準: ①肺內孤立性結節;②患者需經過穿刺或手術切除后明確病理類型,是否良惡性; ③CT成像確診病灶位于肺部;④結節橫向最大直徑≤30 mm;⑤CT上無明顯淋巴增大,胸腔積液征象,無肺不張;患者篩除標準:①患者于CT成像前行穿刺活檢術;②CT成像前患者已經接受化療、放療或藥物治療等腫瘤相關治療方案;③患者CT圖像質量不滿足感興趣區域分割。回顧性納入患者資料時,需跟患者溝通本組研究內容,并確保患者簽署授權書。
2.胸部CT檢查方法
采用Siemens Somatom Definition Flash螺旋CT掃描儀進行常規胸部掃描(管電壓100 kV,電流260 mAs,掃描層厚5 mm,矩陣512×512)。發現病灶后縮小掃描視野(FOV),以病灶為中心行薄層靶掃描(管電壓140 kV,電流576 mAs,掃描層厚0.6 mm,矩陣512×512,FOV為20 cm)。將掃描獲得的影像資料傳入后處理工作站(Syngo MMWP VE40A,Siemens)行多平面重建(MPR)、容積再現(VR)、表面投影顯示(SSD)、最大密度投影(MIP)和最小密度投影(MinIP)等各種重建技術。
3.圖像評價方法
每例患者由本科室從事CT影像診斷10年經驗的醫師遵循單盲原則(無臨床資料、無病理結果對照)獨立評估患者CT征象。①結節病發部位:右肺上葉、右肺下葉、左肺上葉、左肺下葉;②結節橫斷面最大直徑;③病變邊緣:是否出現分葉征;④病變內部征象:是否出現空泡征、空氣支氣管征、鈣化;⑤病變周邊:胸膜凹陷征、血管聚集征、直邊征。分葉征即結節的輪廓非圓形或橢圓形態,其表面由多個凹凸不平的弧形組成;空泡征即結節內出現直徑約為1~2 mm的點狀低HU值的透亮影,形似空泡;空氣支氣管征即病變周圍的肺組織出現透亮的支氣管影;胸膜凹陷征即患者胸膜凹向結節;血管聚集征即血管向結節聚集。
4.影像組學特征提取
由本科室具有5~10年CT診斷經驗的醫師利用ITK-SNAP 3.6.0進行感興趣區域分割(region of intest,ROI)。具體分割:首先將薄層靶掃描肺部CT圖像導入ITK-SNAP軟件中,在含有結節的每一個層面沿結節病灶邊緣勾畫ROI(避開血管、壞死以及鈣化區域),并最終合成3D ROI。其次,按照圖像標志物標準協會對影像組學特征要求標準,利用Anaconda prompt 3導入Pyradiomics包按照exmaple CT特征表提取影像組學參數共計987個影像組學特征[12,13]。
5.病理診斷
根據肺癌組織學分類標準2015版,由病理醫師進行結節良惡性評估,并診斷患者具體病理類型。
6.統計分析
采用R 4.0.3和R studio進行統計分析,采用tidyverse、caret、pROC、rms、Publish、glmnet、ModelGood、ggpubr、rmda、DescTools、mRMR程輯包。首先,按照隨機分層原則,以7:3比例將良惡性患者分為訓練組和測試組,以訓練組患者SPN良惡性為研究標簽,對影像組學特征進行取冗除雜,先采用最小冗余最大相關(min redundancymax relevance,mRMR)進行特征降維,保留30個特征;繼而采用套索模型(least absolute shrinkage and selection operator,LASSO)構建影像組學標簽(radiomics signature,Rad-score),并采用受試者曲線(receiver operating characteristic curve,ROC)評估訓練組和測試組中影像組學標簽Rad-score鑒別良惡性SPN的診斷效能。最后以訓練組患者信息納入CT征象特征與影像組學標簽Rad-score構建多元邏輯回歸模型評估患者SPN的良惡性,采用Nomogram可視化該多元邏輯回歸模型,并采用ROC評估Nomogram在訓練組和測試組鑒別患者SPN良惡性的效能,利用C-index、Hosmer-Lemeshow、DCA評估模型。P<0.05差異具有統計學意義。
1.臨床資料
本組研究共計納入82名SPN患者,其中38名患者接受手術,44名患者接受穿刺活檢。所有SPN均經病理驗證,其中惡性結節共計43例患者,良性結節39名患者。惡性結節患者中男28人,女15人;良性結節患者中男23人,女16人,惡性結節患者與良性結節患者性別無統計學差異(P=0.651,表1)。
惡性結節患者與良性結節患者年齡無統計學差異(P=0.202,表1)。然而惡性結節患者的結節病發部位與良性結節患者的結節病發部位具有統計學差異(P=0.026,表1)。CT征象結果顯示惡性結節患者的結節直徑顯著大于良性結節(P=0.031,表1);同時惡性結節患者22名出現分葉,顯著高于良性結節患者(P<0.001,表1);惡性結節22名患者結節出現毛刺,36名患者出現血管聚集,22名出現胸膜凹陷,20名出現空氣支氣管均顯著高于良性結節患者(表1),然而惡性結節患者僅3例出現鈣化現象,顯著低于良性結節患者(P=0.009,表1);兩組患者CT征象中出現空泡、以及直邊無顯著差異(P=0.172,1.000,表1)。

表1 良惡性孤立性結節患者的臨床資料以及CT征象
2.影像組學標簽構建
按照7:3的比例將惡性SPN患者和良性SPN患者分為訓練組和測試組,訓練組中59例患者,其中31例惡性,28例良性;測試組中23例患者,其中12例惡性,11例良性。以訓練組患者SPN是否惡性作為研究標簽,采用mRMR進行去冗除雜后,保留30個特征,繼而采用LASSO,取最小懲罰系數時構建的影像組學標簽Rad-score其二項式偏差最小(圖1a),此時log(λ)=0.048 (圖1b),構建Rad-score影像組學特征的權重系數如圖1c。Rad-score公式如下:Rad-score=-0.447×log_sigma_4_0_mm_3D_gldm_LowGrayLevelEmphasis-0.211×wavelet_HHH_firstorder_Mean-0.238×original_firstorder_Mean+0.219×wavelet_LHL_glszm_LargAraHighGrayLev-elEmphasis+0.334×log_sigma_2_0_mm_3D_firstorder_Kurtosis+0.367×wavelet_HHL_firstorder_Mean+0.063×wavelet_HLH_firstorder_Kurtosis-0.08×wavelet_HHH_firstorder_Median+0.018×log_sigma_2_0_mm_3D_glszm_SizeZoneNonUniformity+0.266×wavelet_HHL_glcm_Correlation+0.091

圖1 良惡性SPN鑒別影像組學標簽構建。a) 采用LASSO進行特征降維,橫坐標表示懲罰系數值,縱坐標表示隨著懲罰系數值 的改變,二項式偏差大小的改變; b) 采用LASSO進行特征降維,下方橫坐標表示log(λ)值,上方橫坐標表示log(λ)對應的特征個數,縱坐標表示每個特征的權重系數; c) 采用LASSO進行特征降維后構建Rad-score時,不同的影像組學參數的系數值。
3.影像組學標簽診斷良惡性SPN效能
基于Rad-score公式計算訓練組和測試組患者的Rad-score值,訓練組中惡性SPN患者與良性SPN患者Rad-score具有顯著性差異(P<0.000),然而測試組中惡性SPN患者與良性SPN患者Rad-score差異不顯著(P=0.079)。訓練組中Rad-score診斷效能AUC=0.89 (圖2a),95%置信區間:0.81~0.97,陽性預測率PPV為0.774,陰性預測率為0.857;測試組中Rad-score診斷效能AUC=0.72 (圖2b),95%置信區間為0.49~0.95,陽性預測率0.857,陰性預測率0.687(表2)。

表2 Rad-score、CT征象和Nomogram鑒別SPN良惡性的良惡性的診斷效能
4.CT征像聯合影像組學標簽構建聯合模型評估良惡性SPN
基于訓練組中患者CT征像進行Mann-WhitneyU檢驗篩選在良惡性SPN患者中有統計學差異的參數后, 對參數之間進行Spearman相關性分析,剔除CT征像之間相關性>0.6的參數。最終保留血管聚集、毛刺和分葉3個CT征像參數并聯合Rad-score構建鑒別良惡性SPN的多元邏輯回歸模型, 公式如下:
同時采用Nomogram可視化該模型 (圖3a)。Nomogram使用方式為通過計算患者的Rad-score代入圖中找到對應值并以Points做垂直線獲取對應Points線上的得分,并同時將患者的是否出現血管聚集,是否出現毛刺,是否出現分葉定義為0和1,0為否、1為是。代入患者以上CT征像值后均按照相同方法以Points做垂直線獲取對應Points線上的得分;最終將4個參數的Points得分相加獲得Total points上的總分,并向Risk上做垂直線獲取Risk值,即為患者是否惡性的風險值。通過比較CT征象、Rad-score和Nomogram的診斷效能,訓練組中Nomogram的AUC值高于CT征象高于Rad-score (0.96 vs 0.90 vs 0.89,表2,圖3b)。測試組中Nomogram的AUC值高于CT征象高于Rad-score (0.88 vs 0.87 vs 0.72,表2,圖3c)。

圖3 CT征象聯合Rad-score構建Nomogram以及診斷效能比較。a) 征象聯合Rad-score構建多元邏輯回歸模型,并采用Nomogram進行可視化;b) Nomogram、CT征象(CT findings)以及Radiomics在訓練組中評估SPN良惡性的診斷效能; c) Nomogram、CT征象(CT findings)以及Radiomics在驗證組中評估SPN良惡性的診斷效能。 圖4 Nomogram術前鑒別SPN良惡性的模型評估。a、b) 訓練組以及測試組Nomogram鑒別SPN良惡性的C-index圖; c) Nomogram鑒別SPN良惡性的臨床決策線分析。橫坐標示患者是惡性結節的風險值; 縱坐標代表從不同鑒別方法中評估患者是否為惡性結節的臨床收益;藍色線 (ALL) 即代表采用隨機的方案進行惡性結節評估時的臨床收益;黑色線 (None) 即代表不采用任何方案進行惡性結節評估時的臨床收益始終為0;紅線代表采用Nomogram (with Radscore)進行良惡性評估時的臨床收益; 綠線代表采用CT findings (without Radscore)時評估SPN惡性患者的臨床收益。
5.Nomogram模型擬合評估
Nomogram在訓練組和測試組中與患者實際情況擬合程度由C-index曲線表達(圖4a、b),訓練組以及測試組中Hosmer-Lemeshow分析結果為P=0.6006 vs 0.4092,即Nomogram在訓練組和測試組中評估患者是惡性SPN的模型結果與實際病理檢測標準結果無顯著差異。臨床決策線結果顯示當患者為惡性SPN的風險<0.83時,患者從Nomogram上獲取的臨床收益>CT征象。
本組研究通過對SPN患者進行CT靶掃描,采用病灶3D分割后提取影像組學參數,構建影像組學標簽Rad-score。繼而聯合Rad-score以及CT征象構建聯合模型定量評估患者是否惡性SPN的風險幾率。研究結果發現聯合CT征象以及Radiomics構建Nomogram進行SPN良惡性鑒別時具有較好的鑒別能力。此外,我們首次基于CT靶掃描圖像進行肺結節相關的影像組學研究。
患者原始圖像是基于radiomics研究的重要原始數據,影像組學創始人Lambin提出非標準化的醫學圖像本身會對影像組學的研究造成不可避免的系統誤差[11]。相比較傳統CT掃描成像CT靶掃描具有薄層掃描(≤0.635 mm)、FOV顯著縮小(200~230 mm)、肺結節邊緣更清晰等優點[14]。國內外關于SPN良惡性的影像組學研究大多基于常規CT掃描[15,16]。本組研究中則是嘗試在SPN的影像組學研究中引入CT靶掃描圖像進行Radiomics的相關研究。
我們利用CT靶掃描圖像提取海量影像組學后進行特征去冗除雜構建影像組學標簽,Rad-score用以評估SPN良惡性,通過LASSO進行特征降維構建Rad-score的計算公式獲得該公式后可對新收入的患者在未獲取病理結果前通過CT靶圖像提取該公式中的10個Radiomics特征,從而計算出Rad-score的值。研究發現基于Rad-score進行SPN良惡性評估時AUC值在訓練組中可達到0.89,測試組中可達到0.72。晏睿瀅等[15]研究中則基于CT特征構建模型納入年齡、空泡、血管聚集、空氣支氣管、胸膜牽拉、GCO成分,CT特征模型在訓練組AUC為0.860,驗證集為0.864,高于Rad-score。繼而我們納入CT特征聯合Rad-score構建聯合模型,聯合模型在訓練組AUC為0.96,測試組中AUC為0.88。同時,我們的聯合模型中也納入了血管聚集該項指標,與晏睿瀅研究結果相似。然而我們的聯合模型中同時納入了毛刺、分葉,單文莉[17]研究提出惡性征象的CT特征風險因素可能與是否分葉、是否毛刺高度相關,跟我們的研究結果相符。因此,CT征象聯合影像組學可用于嘗試提高CT評估的SPN良惡性的效能。
目前影像組學乃至人工智能的發展始終存在一個問題,即如何讓復雜的數學模型高效的應用與臨床實際工作中,因此,我們根據已有Radiomics的成熟研究選擇Nomogram對最終的聯合模型進行可視化[18]。Nomogram可在獲取患者是否血管聚集、是否毛刺、是否分葉、以及Rad-score值代入公式中獲取患者為惡性的風險值,從而協助臨床非侵襲性的評估患者SPN為惡性的可能性。
本研究尚存在許多不足之處:采用多元邏輯回歸模型,而未比較如隨機森林、SVM等分類器模型;缺乏多中心病例,目前影像組學研究中大多采用本醫院的病例,而缺乏多中心的數據,從而導致模型的推廣性無法保證。
綜上所述,本組研究基于CT靶掃描提取影像組學特征并聯合CT征象構建多元邏輯回歸模型,該模型可在獲取患者病理檢測信息前嘗試用于協助臨床無侵襲性的評估SPN的良惡性,該模型具有一定程度的參考價值,然而,如果需要在臨床上實際推廣應用起來,仍需要不斷的擴大樣本進行深入研究。