梁演婷,林 歡,李夙蕓,劉 晨,莫梓陽,劉昱琳,劉再毅*
[1.廣東省心血管病研究所,廣東 廣州 510080;2.廣東省人民醫院(廣東省醫學科學院)放射科,廣東 廣州 510080;3.廣東省醫學影像智能分析與應用重點實驗室,廣東 廣州 510080;4.華南理工大學醫學院,廣東 廣州 510006]
腺癌是肺癌最常見病理類型[1-2]。臨床ⅠA期肺腺癌(lung adenocarcinoma,LADC)預后一般較好,患者5年生存率68%~100%[3],但仍有15%~21%患者存在隱匿性淋巴結轉移[4]。2020年國際肺癌研究協會病理委員會(International Association for the Study of Lung Cancer Pathology Committee,IASLC)提出的新版病理分級系統[5]將高級別生長方式占比≥20%的LADC定義為高級別LADC,其與較差的生存率和較高的復發率相關,且更易出現淋巴結轉移[6-7]。目前僅有少數研究[8-9]發現吸煙、結節類型、最大標準攝取值及能譜CT參數與LADC病理分級有關。本研究探討薄層CT特征聯合人工智能(artificial intelligence,AI)定量參數術前評估臨床ⅠA期高級別LADC的價值。
1.1 研究對象 回顧性分析2019年1月—2021年6月482例于廣東省人民醫院經病理確診的臨床ⅠA期浸潤性LADC患者,男214例,女268例,年齡27~86歲,平均(58.8±10.8)歲;均于術前30天內接受薄層胸部CT檢查,之后均接受亞肺葉切除術或肺葉切除術。排除標準:①CT檢查前或術前接受新輔助治療;②囊腔型肺結節或存在空腔直徑>5 mm肺結節;③圖像質量差;④病理類型為變異型LADC;⑤無法獲得2020年版IASLC病理分級。記錄患者年齡、性別、吸煙史、腫瘤家族史及術后病理結果。
1.2 儀器與方法 采用GE Lightspeed VCT/Philips Ingenuity CT/Philips iCT 256/Somatom Definition Flash CT掃描儀。囑患者仰臥,采集胸部軸位薄層CT圖,參數:管電壓120 kVp,管電流150~200 mAs,準直器寬度0.625 mm,球管旋轉時間0.6 s,FOV 35 cm×35 cm,矩陣512×512,層厚1~1.25 mm。
1.3 CT特征及AI定量參數 由分別具有3、6年胸部影像學診斷經驗的放射科醫師各1名采用盲法根據肺窗(窗寬1 500 HU,窗位-600 HU)圖像評估病變特征:①結節類型(實性/亞實性);②結節最大徑;③肺窗實性成分最大徑(mm);④實性成分占比=(肺窗實性成分最大徑/肺窗結節最大徑)×100%;⑤結節形態(分葉征、毛刺征、空泡征、空氣支氣管征、胸膜凹陷/牽拉征、血管集束征)。計算結節最大徑及實性成分最大徑的平均值。將圖像上傳至聯影智能肺結節CT影像輔助檢測軟件(uAI Discover Chest版本號:R001),記錄AI定量參數,包括平均CT值、標準差、峰度、偏度及熵。
1.4 病理學分級 2011年版病理分級[9]:G1級,以貼壁型生長為主;G2級,以腺泡或乳頭狀生長為主;G3級,以實性或微乳頭生長為主。2020年IASLC病理分級系統[5]:G1級,以貼壁型生長為主,且高級別生長方式(實性、微乳頭型或其他復雜腺體結構)占比<20%;G2級,以腺泡或乳頭狀生長為主,且高級別生長方式占比<20%;G3級,高級別生長方式占比≥20%。參照2020年IASLC病理分級系統,將G1及G2級歸為低級別組(n=366),G3級歸為高級別組(n=116)。
1.5 統計學分析 采用SPSS 22.0、R 4.2.1統計分析軟件。以±s表示符合正態分布的計量資料,組間行Studentt檢驗;以中位數(上下四分位數)表示不符合正態分布者,組間行Mann WhitneyU檢驗;以頻數表示計數資料,以χ2檢驗或Fisher精確概率法行組間比較。采用組內相關系數(intra-class correlation coefficient,ICC)或Kappa檢驗評估觀察者間測量及評價結果的一致性。對AI量化參數進行logistic回歸分析,獲得個體AI評分(AI-score)。將具有統計學差異的特征納入向前逐步多因素logistic回歸分析,分別構建主觀特征模型、AI模型及聯合模型。繪制受試者工作特征(receiver operating characteristic,ROC)曲線,計算曲線下面積(area under the curve,AUC),評價各模型評估效能,并以DeLong檢驗比較其差異。采用1 000次Bootstrap自抽樣方法繪制各模型校正曲線。P<0.05為差異有統計學意義。
低級別組LADC患者年齡小于高級別組(P<0.001);組間性別、吸煙史、淋巴結轉移、脈管浸潤、臟層胸膜侵犯及ALK突變比例差異均有統計學意義(P均<0.01),見表1。

表1 高、低級別LADC患者基本資料及病變病理特征比較
2.1 CT特征 觀察者間評價計量資料的一致性良好(ICC:0.901~0.915,P均<0.05),評價計數資料的一致性良好(Kappa:0.844~0.946,P均<0.05)。低級別組262例結節最大徑≤2 cm、104例最大徑>2 cm;高級別組74例最大徑≤2 cm、42例最大徑>2 cm。組間肺窗結節最大徑、肺窗實性成分最大徑、實性成分占比、結節類型、分葉征、毛刺征、空氣支氣管征、胸膜凹陷/牽拉征及血管集束征比例差異均有統計學意義(P均<0.05),見表2及圖1、2。

圖1 患者男,48歲,高級別LADC A.胸部軸位平掃肺窗CT圖示右肺下葉實性結節(箭)最大徑約14 mm,可見分葉征、毛刺征、胸膜牽拉征;B.病理圖(HE,×200)示肺浸潤性腺癌,腺泡狀(約60%)、實性(約35%)及微乳頭型(約5%)生長方式 圖2 患者男,46歲,低級別LADC A.胸部軸位平掃肺窗CT圖示右肺下葉亞實性結節(箭)最大徑約14 mm,可見分葉征、毛刺征、空氣支氣管征;B.病理圖(HE,×200)示肺浸潤性腺癌,腺泡狀(約70%)和貼壁樣(約30%)生長方式

表2 高、低級別LADC CT特征比較
2.2 AI-score 高級別組病變平均CT值及峰度高于低級別組(P均<0.05),而標準差、偏度及熵低于低級別組(P均<0.05),見表3。多因素logistic回歸分析結果顯示,平均CT值和峰度是評估臨床ⅠA期高級別LADC的顯著特征(P均<0.05),見表4。AI-score=-0.183+0.008×平均CT值+0.089×峰度。

表3 高、低級別LADC AI-score定量參數比較

表4 AI定量參數評估高級別LADC logistic回歸分析結果
2.3 評估模型 單因素回歸分析顯示,12個臨床及影像學主觀特征(年齡、性別、吸煙史、結節類型、肺窗結節最大徑、肺窗實性成分最大徑、實性成分占比、分葉征、毛刺征、空氣支氣管征、胸膜凹陷/牽拉征及血管集束征)和5個AI定量參數(平均CT值、標準差、峰度、偏度及熵)均為評估高級別LADC的獨立因子(P均<0.05)。多因素回歸分析顯示,主觀特征中,實性成分占比、結節類型及空氣支氣管征是評估高級別LADC的獨立因子(P均<0.05),以此構建的主觀特征模型評估高級別LADC的AUC為0.886[95%CI(0.853,0.919)],敏感度為56.02%,特異度為94.51%;AI定量參數中,平均CT值、峰度是評估高級別LADC的獨立因子(P均<0.05),以之構建的AI模型評估高級別LADC的AUC為0.885[95%CI(0.850,0.921)],敏感度為71.61%,特異度為90.71%(圖3)。將上述12個臨床主觀特征和AI-score納入多因素回歸分析,發現空氣支氣管征[OR=0.31,95%CI(0.17,0.55),P<0.001]、實性成分占比[OR=8.75,95%CI(1.46,52.54),P=0.018)]及AI-score[OR=45.12,95%CI(8.59,237.08),P<0.001)]是評估高級別LADC的獨立因子,以之構建的聯合模型評估高級別LADC的AUC為0.901[95%CI(0.871,0.932)],敏感度為71.62%,特異度為91.82%(圖3)。

圖3 不同模型評估高級別LADC的ROC曲線 圖4 不同模型評估高級別LADC的校正曲線
上述3個模型預測曲線與實際曲線的一致性均較好,其校正曲線見圖4。聯合模型評估效能優于主觀特征模型(P=0.010)及AI模型(P=0.041),后二者差異無統計學意義(P>0.05)。
聯合模型判斷實性結節、亞實性結節、小結節(肺窗結節最大徑≤2 cm)及大結節(肺窗結節最大徑>2 cm)的AUC分別為0.748[95%CI(0.666,0.831)]、0.785[95%CI(0.707,0.864)]、0.905[95%CI(0.867,0.944)]及0.878[95%CI(0.821,0.935)];其評估2011年版IASLC高級別LADC、有無高級別組織學成分、臟層胸膜侵犯及淋巴結轉移的AUC分別為0.890[95%CI(0.838,0.942)]、0.894[95%CI(0.863,0.925)]、0.838[95%CI(0.786,0.891)]及0.875[95%CI(0.836,0.915)]。
本研究結合薄層CT特征和AI定量參數評估2020年IASLC臨床ⅠA期高級別LADC,結果顯示實性成分占比及空氣支氣管征可作為評估高級別LADC的獨立因子,與SHIMOMURA等[10]的結果相符,提示實性成分占比是評估LADC淋巴結轉移、浸潤程度及預后的重要因子,實性成分越多代表侵襲性越強。空氣支氣管征代表腫瘤內殘存部分支氣管結構,可用于區分預后不同LADC的組織學亞型[11];相比低級別LADC,高級別LADC更易壓迫或破壞周圍肺實質導致支氣管截斷,其中更少出現空氣支氣管征。
研究[12-13]認為平均CT值對預測LADC侵襲性具有重要意義,但也有學者[14]持相反意見。本研究聯合模型中,以平均CT值及峰度構成的AI-score與高級別LADC顯著相關,且與結節類型、實性成分占比等主觀特征相比,AI-score的相關性更高。峰度反映結節密度分布的陡緩程度,絕對值越大,其分布形態與正態分布的差異程度越大[15]。本研究中,峰度越大提示LADC級別越高,可能因高級別LADC細胞排列較為緊密,CT多表現為實性結節,故其峰度較大。本研究聯合模型評估高級別LADC的效能優于主觀特征模型及AI模型,且用于判斷是否為2011年IASLC高級別LADC、有無高級別組織學成分、臟層胸膜侵犯及淋巴結轉移等也顯示出較好性能。
綜上,CT特征聯合AI定量參數有助于術前無創評估臨床ⅠA期高級別LADC。但本研究為單中心、回顧性研究,樣本量有限,且僅以一種AI肺結節輔助診斷軟件進行分析,未能對不同病理分級腫瘤患者進行隨訪觀察,有待進一步完善。