徐富陽,劉杰克,王璐,李勇,青浩渺,何長久,林禮波,周鵬
637000 四川 南充,川北醫學院 醫學影像學院(徐富陽、王璐、周鵬); 610041 成都,四川省腫瘤臨床醫學研究中心,四川省腫瘤醫院·研究所,四川省癌癥防治中心,電子科技大學附屬腫瘤醫院 影像科(徐富陽、劉杰克、王璐、李勇、青浩渺、何長久、林禮波、周鵬)
肺癌是對人類健康危害最大的惡性腫瘤之一[1]。肺腺癌是早期肺癌最常見的病理組織亞型[2]。2021 年《WHO 胸部腫瘤分類(第5 版)》將肺腺癌分為前驅腺體病變(precursor glandular lesions,PGL)[包括非典型腺瘤性增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinoma in situ,AIS)]、微浸潤性腺癌(minimally invasive adenocarcinoma,MIA)和浸潤性腺癌(invasive adenocarcinoma,IAC),這些均可在CT 圖像上表現為亞實性肺結節(包括純磨玻璃結節及部分實性結節)[3-4]。研究表明,PGL/MIA 術后5 年無病生存期(disease-free survival,DFS)接近100%,而IAC 由于生長模式不同,5 年DFS 為38%~93%[5-6]。由于不同類型肺腺癌的預后不同,對于可能為PGL/MIA 的亞實性肺結節患者,應進行定期隨診[7]。而對于懷疑為IAC 的患者,應進行早期臨床干預[6]。因此,早期預測亞實性肺結節的浸潤性(PGL/MIA vs IAC),對患者選擇個性化的治療策略有一定應用價值。
放射科醫師常通過基于胸部CT 的影像學特征預測亞實性結節的浸潤性。然而,傳統影像學特征,如分葉、毛刺、胸膜反應、直徑等定性和定量特征,其主觀性太強且幾乎完全依賴于放射科醫生的經驗診斷[8-12],導致不同研究的診斷效能有較大差異,其AUC 從0.71 到0.90 不等[11-16]。因此,僅僅依賴傳統影像學特征可能不足以對亞實性肺結節的侵襲性實現早期精準診斷,需要進一步引入高通量的影像特征,深度挖掘其中的數字化信息[17-20]。既往研究表明,影像組學在評估亞實性結節的侵襲性方面顯示出一定的應用價值[13-14,21]。然而,既往研究多基于胸部平掃CT 圖像進行分析。研究表明,腫瘤的侵襲性與血管發生、微血管浸潤密切相關[22-23],這些改變可能造成增強與平掃CT 圖像組學特征的差異。
本研究擬基于平掃及增強CT 構建影像組學模型,評估其預測亞實性結節浸潤性的診斷價值,并與傳統影像學模型進行比較。
本研究為回顧性研究,收集2019 年4 月至2020 年12 月在四川省腫瘤醫院經完整肺結節切除手術的患者。本研究經四川省腫瘤醫院倫理委員會批準。納入標準:①亞實性肺結節;②術后病理證實為肺腺癌;③術前1 個月內在同次檢查中同時行 CT 平掃和增強掃描。排除標準:①結節平均直徑 > 3 cm;②特殊類型肺腺癌:如浸潤性黏液腺癌、膠樣腺癌、胎兒型腺癌或腸型腺癌;③由于呼吸或運動偽影導致圖像質量差;④既往有惡性腫瘤或遠處轉移病史。經過篩選,本研究最終納入192名患者,共計209 例亞實性肺結節,其中男性120名、女性72 名,中位年齡53(49,60)歲。本研究按照7∶3 的比例以及CT 檢查時間順序,自2019 年4 月至2020 年6 月共148 例亞實性肺結節入組訓練集病例,其中包括61 例PGL/MIA 和87 例IAC;自2020 年6 月至2020 年12 月共61 例亞實性肺結節入組驗證集病例,其中包括25 例PGL/MIA 和36 例IAC。
根據國際癌癥研究機構于2021 年5 月出版的《WHO 胸部腫瘤分類(第5 版)》,重新評估了本研究所有納入的病理標本[3]。
①圖像采集:采用荷蘭 Philips Brilliance iCT 256 層螺旋 CT 機從肺尖到肋膈角對受檢者進行全肺掃描,掃描時患者取仰臥位,雙手上舉。掃描參數:管電壓120 kV,自動管電流調制、參考管電流200~250 mAs,螺距為0.915,機架旋轉時間為0.4 s,圖像采用迭代重建技術(iDose4,level 6,Phillips Healthcare)重建,層厚為0.625 mm,視野為350 mm × 350 mm,矩陣為512 × 512。增強掃描使用高壓注射器以 3.0 mL/s 的流率將 90 mL 的非離子型碘對比劑 (碘普羅胺,含碘 370 mg/mL) 注入肘前靜脈,監測肺動脈干層面升主動脈閾值,達到100 HU 后延遲45 s 行靜脈期掃描;②圖像分割:本研究將納入的亞實性肺結節的平掃期和靜脈期圖像以DICOM 格式導入基于人工智能的聯影智能科研平臺(United Imaging Intelligence,UII),全自動完成肺結節感興趣區(region of interest,ROI)的識別和分割。2 位分別具有6 年及11 年胸部放射診斷經驗的中級醫生已經評定了肺結節的勾畫結果,勾畫結果滿意(圖1)。因此,不對勾畫結果進行人為調整,以避免觀察者間的差異;③特征提取:利用基于Python 的PyRadiomics 軟 件 包(https://pyradiomics.readthedocs.io)計算影像組學特征,包括形態學特征、一階/直方圖特征、紋理特征,其中紋理特征又包括灰度共生矩陣(gray level cooccurrence matrix,GLCM)、灰度相關矩陣(gray level dependence matrix,GLDM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度連通區域矩陣(gray level size zone matrix,GLSZM)、局部灰度差分矩陣(neighborhood gray tone difference matrix,NGTDM)。本研究一共提取了104 個影像組學特征;④模型構建:首先對每個特征進行Z-score 標準化處理。為避免數據過度擬合,采用基于 L1 正則化的最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)選擇最顯著的預測特征,并將篩選的特征放入多因素Logistic 回歸分析,最后采用逐步回歸選擇法(stepwise regression,SR)及赤池信息量準則 (Akaike information criterion,AIC)構建最終影像組學標簽(Rad-score)。將篩選出來的特征進行線性加權,計算出每例亞實性肺結節的Rad-score。總共構建3 個影像組學模型:平掃模型(基于平掃CT 組學特征),增強模型(基于增強CT 組學特征)以及綜合模型(基于平掃及增強CT組學特征)。

圖1 不同病理類型結節的典型圖像及聯影自動分割結果。Figure 1.Representative Images and Segmentation Results of Different Histological Types of Nodules
本研究基于肺結節的定量及定性特征構建傳統影像學模型。本研究納入的定量特征為結節的平均直徑。根據Fleischner 協會指南,平均直徑=(軸位圖像上的最大長徑+其垂直徑)/2[24]。由2 名具有6 年和11 年胸部放射診斷經驗的中級醫生在平掃CT 的標準肺重建(窗位:-600 HU;窗寬:1 500 HU)的軸位圖像上測量結節的最大長徑及其垂直徑,并計算肺結節的平均直徑。利用組內相關系數(intraclass correlation efficient,ICC)評估2 名診斷醫師的測量肺結節平均直徑的一致性。ICC > 0.85 說明一致性較高。本研究納入的定性特征包括:形狀(圓形/橢圓形或不規則)、邊緣(平滑或粗糙)、分葉、毛刺、胸膜反應、空氣支氣管征、空泡征、血管類型、結節類型(純磨玻璃或部分實性)、平均直徑。血管類型包括低級別和高級別型。低級別型是指結節內未見血管穿行或者可見血管穿行但血管的形態、走形未見改變;高級別型指結節內穿行血管形態異常、走形扭曲[25]。由2 名分別具有6 年和11 年胸部放射診斷經驗的中級醫生在平掃CT 的標準肺重建的軸位及多平面重建(multi-planar reformatting,MPR)上完成所有肺結節定性特征的評估。若有爭議,則協商討論解決,如仍未達成一致,則由1 名具有26年胸部放射診斷經驗的高級醫生判定。在評估圖像前,全部放射診斷醫生均不知相應的病理組織學結果。將全部傳統影像學特征放入單因素Logistic 回歸分析中,以確定對IAC 的獨立風險預測因子,并計算其OR 及95% CI。隨后,將P < 0.05 的特征放入多因素Logistic 回歸分析,采取SR 及AIC 構建最終傳統影像學模型。
采用SPSS 軟件(25.0 版)和R 軟件(4.0.4 版)進行統計分析。采取 Kolmogorov-Smirnov 查驗計量資料是不是符合正態分布,服從正態分布以 ±s 表示,并采取獨立樣本t 檢驗比較組間差異;不服從正態分布的用M(Q1,Q3)表示,并采用Mann–Whitney U 檢驗比較組間差異。計數資料采用卡方檢驗或者Fisher 精確檢驗。利用ROC 曲線的AUC 評估影像組學模型和傳統影像學模型的診斷效能。根據約登指數確定ROC 曲線的最佳閾值,設定該數值為截斷值,大于等于該數值診斷為IAC,反之則診斷為PGL/MIA。計算該數值對應的準確性、敏感性、特異性、陽性預測值及陰性預測值,并通過精確概率法計算各自的95% CI。采用Hosmer-Lemeshow 檢驗評價模型的擬合優度,并繪制該模型的校準曲線。
211 例亞實性肺結節患者的臨床及影像學特征見表1。其中形狀、分葉、空氣支氣管征、空泡征、血管類型、結節類型、平均直徑在訓練集、驗證集中的組間差異均有統計學意義(均P < 0.05);年齡、性別、邊緣、胸膜反應在訓練集中的組間差異均有統計學意義(均P < 0.05),但在驗證集中差異無統計學意義(P = 0.224、P = 0.102、P = 0.164、P = 0.133);毛刺征在訓練集和驗證集中差異均無統計學意義(P = 0.081 和P = 0.640)。

表1 患者的臨床和影像學特征Table 1.Clinical and Demographic Characteristics of Patients
在訓練集中,平掃及增強模型提取104 個組學特征,綜合模型為平掃及增強模型的全部特征,共計208 個。3 個模型的篩選過程詳見圖2。最終篩選出綜合模型4 個特征、增強模型3 個、平掃模型3 個,用于構建相應的組學模型。

圖2 影像組學模型特征篩選流程圖Figure 2.Selection Process of Radiomic Features
①綜合模型公式:
ln(P/1-P) = 0.592 - 0.638 × CECT_Firstorder_Kurtosis - 1.222 × CT_Shape_Elongation + 2.318 ×CECT_GLSZM_ZoneEntropy - 0.636 × CT_NGTDM_Strength,其中P 為該模型預測IAC 的概率,截斷值為0.593。
②增強模型公式:
ln(P/1-P) = 0.406 - 0.583 × CECT_Firstorder_Kurtosis - 0.526 × CECT_Shape_Flatness + 2.219× CECT_GLSZM_ZoneEntropy,其中P 為該模型預測IAC 的概率,截斷值 為 0.522。
③平掃模型公式:
ln(P/1-P) = 0.113 - 1.015 × CT_Shape_Elongation - 2.851 × CT_GLSZM_SmallAreaLowGrayLevelEmphasis - 0.815 × CT_NGTDM_Strength,其中P為該模型預測IAC 的概率,截斷值為 0.588。
為了在計算前進行Z-score 標準化,各模型相應特征的平均值和標準差詳見表2。

表2 各模型特征的平均值和標準差Table 2.Means and Standard Deviations of Radiomic Features
兩名診斷醫師測量肺結節平均直徑的一致性 較 高(ICC = 0.913),遂 選 取 具 有11 年 診 斷 經驗醫師的結果做后續分析。單因素Logistic 回歸分析顯示,預測亞實性肺結節浸潤性的獨立危險因子為:形狀(OR: 4.881,95% CI: 2.404~9.913,P < 0.001);邊緣(OR: 4.416,95% CI:1.701~11.463,P = 0.002);分葉(OR: 5.600,95% CI:2.024~15.493,P = 0.001);胸 膜 反 應(OR: 4.442,95% CI: 2.044~9.655,P < 0.001);空氣支氣管征(OR: 20.308,95% CI: 2.655~155.322,P = 0.004);血管類型(OR: 7.894,95% CI: 3.233~19.270,P < 0.001);結節類型(OR: 3.209,95%CI: 1.471~6.998,P = 0.003);直徑(OR: 1.354,95% CI: 1.212~1.513,P < 0.001;表3)。根據多因素Logistic 回歸分析,基于結節的形狀、胸膜反應、結節類型及平均直徑,用于構建傳統影像學模型(表3)。公式為:ln(P/1-P) = - 4.109 + 1.337 × 形狀(不規則)+ 1.041 ×胸膜反應(有)+ 1.460 × 結節類型(部分實性)+ 0.268 ×平均直徑,其中P 為該模型預測IAC 的概率,截斷值為0.583。

表3 傳統影像學特征單因素和多因素Logistic 回歸結果Table 3.Univariate and Multivariate Logistic Regression Analysis of Conventional Radiological Features
綜合模型在訓練集和驗證集中預測亞實性肺結節浸潤性的AUC 為0.925(95% CI: 0.871~0.962)和0.927(95% CI: 0.830~0.978);增強模型為0.890(95% CI: 0.828~0.935)和0.909(95% CI: 0.807~0.967);平掃模型為0.914(95% CI: 0.856~0.954)和0.922(95% CI: 0.824~0.976);傳統影像學模型為0.864(95% CI: 0.798~0.915)和0.892(95% CI:0.786~0.957;圖3)。各模型的AUC、靈敏度、特異度和準確度如表4 所示。校準曲線顯示,無論在訓練集還是驗證集中,各模型的預測值和觀察值之間均表現出良好的一致性,Hosmer-Lemeshow 檢驗結果顯示差異均無統計學意義(均P > 0.05;圖4)。

表4 各模型的診斷效能Table 4.Diagnostic Performance of the Models in the Primary and Validation Cohorts

圖3 各模型的受試者工作特征曲線。Figure 3.Receiver Operating Characteristic Curves of the Models

圖4 各模型的校準曲線。Figure 4.Calibration Curves of the Models
本研究構建和驗證了綜合、增強、平掃及傳統影像學模型,以預測亞實性肺結節的浸潤性,并評估了各模型的診斷效能。結果顯示,在訓練集和驗證集中,綜合模型的AUC 均高于其他模型,表明基于平掃和增強CT 圖像構建的綜合模型具有良好的診斷效能,有可能在術前預測亞實性肺結節的浸潤性。
既往研究常使用結節的定量及定性特征來預測亞實性肺結節的浸潤性[25-32]。本研究多因素Logistic 回歸結果顯示,形狀(不規則)、胸膜反應(有)、結節類型(部分實性)、平均直徑為亞實性肺結節浸潤性的獨立風險預測因子。結節形狀主要與病變內的浸潤性成分相關,PGL/MIA 沒有或侵襲成分較少,多表現為圓形/橢圓形;當病變內浸潤性成分增多時,腫瘤不同部位的癌細胞分化和生長速度不同,瘤內纖維化收縮致使形狀不規則[25,29,31]。胸膜反應形成的病理基礎也是由于病灶內部纖維化、瘢痕收縮,通過肺的纖維間質牽拉游離的臟層胸膜,引起凹陷所致[33],是肺結節的惡性征象之一[34-35]。此外,本研究根據病灶是否含有實性成分將病灶分為純磨玻璃結節(pure ground glass nodule,pGGN)和混合磨玻璃結節(mixed ground glass nodule,mGGN),結果顯示,IAC中mGGN 的出現率明顯高于PGL/MIA 組(78.95%vs 47.37%,P < 0.001)。相比于結節的形狀和是否伴有胸膜反應,結節類型更能預測亞實性結節的浸潤性,其比值比為4.307(1.612~11.511)。其原因為伴隨著肺腺癌浸潤程度的增加,腫瘤細胞的數量逐漸增多,周圍肺泡間隔增厚,肺組織的含氣量減少,當增生腫瘤細胞逐漸充填肺泡腔時,在CT 上常表現為平均CT 值的增高[16,36-37]。結節類型在一定程度上反映了結節的平均CT 值,如Zhang 等[38]研究證明結節中實性成分的比例和CT 值之間具有高度相關性(R2= 0.98, P < 0.001)。然而,傳統的平均CT 值測量通常采用一維測量法,只能反映結節某個層面的情況,難以代表結節整體特征。如陳韻羽等[39]研究中結節的平均CT 值是由兩位醫師分別測量3 次取均值所獲得,其最終模型的AUC僅為0.62。這可能是由于磨玻璃結節(ground glass nodule,GGN)內包含的成分復雜,可能會有血管、支氣管、空泡等成分的干擾,導致CT 值的測量不夠準確。而結節類型在臨床工作中影像醫師更易于判斷及獲得,且在不同診斷醫師之間有較高的一致性。故本研究在傳統影像學模型中使用結節類型替代平均CT 值,并且獲得了不錯的診斷效能。結節的直徑也是判斷其浸潤性的重要標準之一[40],Kitami等[32]指出區分PGL/MIA 與IAC 的最佳直徑閾值為10 mm。然而,由于觀察者內部與觀察者間的差異,定量及定性特征在不同診斷醫師之間的可重復性較低,導致傳統影像學模型的可推廣性、泛化性較低。
既往研究多數基于平掃CT 影像組學特征預測亞實性肺結節的浸潤性,并顯示出較大價值[41-43],但基于增強CT 的組學特征是否更有優勢的研究較少。Gao 等[44]研究表明,從增強CT 提取的組學特征在預測亞實性肺結節浸潤性方面沒有顯著優勢(AUC_增強: 0.868 vs AUC_平掃: 0.890),差異無統計學意義(P = 0.190)。Fan 等[21]研究基于平掃CT 構建組學模型,用于預測亞實性肺結節的浸潤性,該模型在分別由平掃和增強圖像所構成的驗證集中表現出相近的性能(AUC_增強: 0.936 vs AUC_平掃: 0.942)。這均與本研究結果基本一致(AUC_增強: 0.890 vs AUC_平掃: 0.914)。此外,本研究顯示,增強及平掃模型中所選擇的特征完全不一致,這表明多數的影像組學特征可能容易受到造影劑的影響。類似的在Sun 等[45]研究中,平掃和增強模型中重要性排名前10 的特征中,只有1 個特征(wavelet_gldm_DependenceEntropy)是兩者共有的。因此,本研究進一步探討了基于平掃及增強CT 組學特征構建的綜合模型的診斷效能。
本研究中,綜合模型從平掃及增強CT 總計208 個特征中篩選出的4 個特征均被包含在前面兩個模型中,這說明特征選擇的可重復性較高。綜合模型中納入的增強特征包括Firstorder_Kurtosis 和GLSZM_ZoneEntropy。Firstorder_Kurtosis 是圖像ROI中信號強度分布的“峰值”度量,量化了圖像內灰度值分布的集中程度。GLSZM_ZoneEntropy 是衡量圖像灰度分布隨機性的特征參數,代表了圖像紋理的復雜性,圖像紋理越復雜,熵值越高。這兩個增強特征最終被納入綜合模型均可能與結節的異質性相關。腫瘤的異質性主要表現為腫瘤病灶內的成分差異[46],在影像學上表現為結節密度不均勻。與平掃CT 相比,增強CT 能進一步反映腫瘤內部血供及分布的特性,這在診斷肺癌、肝細胞肝癌等惡性腫瘤時有較大的診斷價值[47]。研究顯示,偏惡性的肺結節在增強CT 表現為稍高強化,可能與結節內部微血管密度及周圍毛細血管的灌注及通透性增加有關[22,44]。本研究中綜合模型AUC 略高于增強及平掃模型,表明綜合模型可能更有助于對于亞實性肺結節浸潤性的早期診斷。
本研究仍存在以下不足:①本研究作為回顧性研究,不可避免的存在選擇偏倚;②本研究為單中心研究,后續需要多中心證明綜合模型的泛化能力。
綜上,基于平掃和增強CT 圖像構建的綜合模型,在預測亞實性肺結節的浸潤性方面有一定的診斷價值,有可能在日常工作中為胸外科和放射科醫生的臨床決策提供助幫助。
作者聲明:本文全部作者對于研究和撰寫的論文出現的不端行為承擔相應責任;并承諾論文中涉及的原始圖片、數據資料等已按照有關規定保存,可接受核查。
學術不端:本文在初審、返修及出版前均通過中國知網(CNKI)科技期刊學術不端文獻檢測系統的學術不端檢測。
同行評議:經同行專家雙盲外審,達到刊發要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權:本文出版前已與全體作者簽署了論文授權書等協議。