江長思,羅 燕,唐 雪,龔靜山
(深圳市人民醫(yī)院 暨南大學第二臨床醫(yī)學院放射科,廣東 深圳 518020)
隨著低劑量CT(low does CT, LDCT)的普及和微創(chuàng)手術、靶向治療的臨床應用,早期肺癌檢出率明顯提高,但肺癌仍是癌癥相關死亡的首要病因[1-2],早期局限性病變(IA期)術后局部復發(fā)率也較高[3]。AMIN等[4-5]發(fā)現(xiàn)肺腺癌患者肺內存在與主瘤體不相連的腫瘤細胞島,且可能經空氣于肺泡內播散;ONOZATO等[6]研究證實這些腫瘤細胞島與主瘤體在各個方位上均不相連,且與預后相關。2015年WHO通過分析關于氣腔播散(spread through air space, STAS)與肺腺癌預后相關性的隊列研究[7-8],正式提出該類腫瘤細胞島是肺腺癌侵襲的一種新模式,即STAS,可見于14.80%~56.40%肺腺癌患者[6-11],是影響肺腺癌術后預后的主要危險因素;對STAS陽性早期肺腺癌,采用全肺葉切除代替局部肺葉切除,可有效降低術后復發(fā)率,提高5年生存率。術前明確肺腺癌患者STAS狀態(tài)對選擇手術方案有重要意義,但STAS為組織病理學表現(xiàn),僅在術后才能確診。肺癌實性成分占比、有無磨玻璃成分等CT征象與STAS狀態(tài)相關[12-14],可用于術前預測STAS狀態(tài)。本研究探討基于CT機器學習建立預測肺腺癌STAS狀態(tài)模型的價值。
1.1 一般資料 收集2015年4月—2019年4月462例于深圳市人民醫(yī)院經手術病理證實的原發(fā)性肺腺癌患者,男206例,女256例,年齡20~85歲,平均(58.2±12.4)歲;其中90例STAS陽性(STAS陽性組),372例STAS陰性(STAS陰性組)。納入標準:①單發(fā)病灶,經手術完全切除;②術前3個月內接受CT檢查,且檢查前未接受任何治療;③病理資料完整,能滿足評估STAS要求。排除標準:①CT圖資料不全;②病理標本不能滿足評估STAS要求。
1.2 儀器與方法 采用Philips Brilliance 16排螺旋CT或Philips Brilliance iCT 256層螺旋CT行胸部CT平掃或增強檢查,探測器線寬16×1.50 mm,管電壓120 kV,管電流為自動調節(jié);掃描結束后行薄層圖像重建,層厚2 mm,層間距1 mm。
1.3 圖像分析 由具有2年和3年胸部影像學診斷經驗的住院醫(yī)師各1名采用盲法分析圖像,意見不一時經協(xié)商決定。于窗寬1 600 HU、窗位-600 HU圖像上評估腫瘤最大徑及最大面積(包含磨玻璃成分和實性成分),實性成分最大面積及實性成分百分比(the ratio of consolidation/tumor,C/T),結節(jié)類型、衛(wèi)星灶、位置(中央/外周)、腫瘤邊緣(分葉/毛刺)、壞死,胸膜牽拉及增厚、空洞、空泡、鈣化、空氣支氣管征、肺門淋巴結侵犯、縱隔淋巴結侵犯等25個CT征象。通過勾畫腫瘤總體或實性成分面積,在病灶最大層面圖像上設置ROI,獲得腫瘤或實性成分最大面積。C/T=腫瘤實性成分最大面積/腫瘤最大面積×100%。腫瘤完全位于肺野內、中帶為中央型腫瘤,位于肺野外1/3為外周型腫瘤。衛(wèi)星灶指原發(fā)灶周圍2 cm范圍內存在的伴隨病灶[11]。
1.4 病理學檢查 由具有6年和10年病理學診斷經驗的主治醫(yī)師及副主任醫(yī)師各1名根據(jù)WHO提出STAS的定義評估STAS狀態(tài)。WHO將STAS定義為微乳頭簇,實心巢或單個腫瘤細胞在主瘤體邊緣以外的肺泡腔中擴散;其主要形態(tài)學表現(xiàn)包括:①肺泡腔由無或偶見中央纖維血管核心的環(huán)狀微乳頭結構填充;②肺泡腔由腫瘤細胞組成的固體巢或腫瘤島填充;③肺泡腔由不連續(xù)的單個腫瘤細胞填充[5,8]。
1.5 統(tǒng)計學分析和機器學習建模 采用SPSS 22.0軟件及R軟件3.5.1版本(https://www.r-project.org/)進行統(tǒng)計學分析。符合正態(tài)分布的計量資料以±s表示,否則以中位數(shù)(上下四分位數(shù))表示,計數(shù)資料以頻數(shù)表示。采用獨立樣本t檢驗或χ2檢驗分析STAS陽性與陰性組間一般資料(吸煙史、性別及年齡)的差異;以Mann-WhitneyU檢驗及χ2檢驗分析組間CT征象差異。將差異有統(tǒng)計學意義的變量納入隨機森林(random forest, RF)算法,建立機器學習預測肺腺癌STAS狀態(tài)模型,其步驟如下:①按7:3比例將所有患者隨機分為訓練集(n=323)和驗證集(n=139);②以不同參數(shù)組合于訓練集形成多個預測模型,對每個模型進行五折交叉驗證,獲得其預測肺腺癌STAS狀態(tài)的平均AUC值;③以平均AUC值最大的模型對驗證集進行預測,計算AUC值,評價其診斷效能。P<0.05為差異有統(tǒng)計學意義。
2.1 組間一般資料比較 STAS陽性組90例,男46例,女44例,年齡27~80歲,平均(55.7±12.1)歲,其中30例有吸煙史;STAS陰性組372例,男160例,女212例,年齡20~85歲,平均(58.8±12.4)歲,其中90例有吸煙史。2組患者年齡差異有統(tǒng)計學意義(t=46.22,P=0.01),性別及吸煙史差異均無統(tǒng)計學意義(χ2=1.93、3.15,P=0.17、0.08)。
2.2 組間CT征象比較 單因素分析結果顯示組間腫瘤最大徑、腫瘤最大面積、實性成分最大面積、C/T、結節(jié)類型、胸膜增厚、胸膜牽拉、遠處轉移、縱隔淋巴結侵犯、血管集束征、分葉征及毛刺征差異均有統(tǒng)計學意義(P均<0.05),其余CT征象差異均無統(tǒng)計學意義(P均>0.05),見表1。STAS陽性組腫瘤多為最大面積較大、實性成分較多和C/T值較高的結節(jié),STAS陰性組腫瘤多為磨玻璃結節(jié),見圖1、2。

圖1 患者女,35歲,右肺上葉肺腺癌 A.軸位CT示右肺上葉磨玻璃結節(jié)(長箭); B.病理圖(HE,×100)清晰顯示腫瘤邊界(黑色虛線)以遠的肺泡腔 (短箭),為STAS陰性

圖2 患者男,27歲,右肺上葉腺癌 A.軸位CT示右肺上葉實性結節(jié)(長箭); B.病理圖(HE,×100)示腫瘤邊界(黑色虛線)以遠肺泡腔內腫瘤細胞簇(短箭),為STAS陽性
2.3 建立預測模型及預測結果 將年齡及12個與STAS相關CT征象納入RF建立機器學習預測模型,以五折交叉驗證獲得平均AUC最大(0.80)的預測模型,其敏感度及特異度分別為0.78及0.77;以之預測驗證集,其AUC值、敏感度及特異度分別為0.77、0.78及0.73,見圖3。

表1 STAS陽性與陰性肺腺癌CT征象比較

圖3 基于CT機器學習預測模型預測肺腺癌STAS狀態(tài)的ROC曲線 A.訓練集; B.驗證集
表2顯示該模型各變量的節(jié)點純度增加值,其中腫瘤最大徑的節(jié)點純度增加值最大。

表2 RF模型中13個變量的節(jié)點純度增加值
作為人工智能的重要分支,機器學習通過深度挖掘、分析大數(shù)據(jù)而建立高維、復雜數(shù)學模型,并對其進行大量擬合訓練,利用反饋機制不斷加以優(yōu)化,從而構建出最優(yōu)模型[15]。常見機器學習算法包括支持向量機(support vector machine, SVM)、RF、Logistic回歸及樸素貝葉斯等,在肺癌診斷、分類、治療及預后中具有重要作用,并已取得了較好效果[16]。既往研究[17]表明,機器學習模型預測良惡性肺結節(jié)的效能較高。本研究利用RF算法建立機器學習模型,術前預測肺腺癌STAS狀態(tài),旨在為制定個性化治療方案提供參考依據(jù)。
ONOZATO等[6]指出,STAS易發(fā)生于年輕患者和吸煙患者,而性別與STAS狀態(tài)無明顯相關。本研究中STAS陽性組患者年齡低于陰性組,性別及吸煙組間差異無統(tǒng)計學意義,原因可能在于本研究為單中心研究,樣本量較小,存在一定偏倚。
STAS與CT所示肺實性結節(jié)密切相關[10]。KIM等[12]基于胸部CT圖像建立多變量預測模型,發(fā)現(xiàn)實性成分百分比(percentage of the solid component, PSC)是預測STAS的有效影像學指標(PSC=腫瘤實性成分最大徑/腫瘤最大徑×100%),PSC的優(yōu)勢比為1.06,且PSC每增加20%,發(fā)生STAS的可能性增加3.2倍,STAS發(fā)生率隨PSC增加而增高。MARGERIE等[14]亦發(fā)現(xiàn),陽性腫瘤的總平均徑線、實性成分平均徑線、實性成分長徑及實性成分比例均明顯大于STAS陰性腫瘤,總平均徑≥20 mm、實性成分平均徑線和實性成分長徑均≥10 mm肺結節(jié)中的STAS陽性者明顯多于STAS陰性者,提示STAS發(fā)生與腫瘤大小及實性成分含量有關。本研究STAS陽性組與陰性組間腫瘤最大徑、實性成分最大面積和腫瘤最大面積等12個CT征象差異均存在統(tǒng)計學意義,以上述12個CT征象及年齡建立預測肺腺癌STAS的RF模型,其在訓練集、驗證集的AUC值、敏感度及特異度分別為0.80、0.78及077和0.77、0.78及0.73,表明基于胸部CT的機器學習模型可用于術前預測肺腺癌STAS狀態(tài);12個CT征象中,腫瘤最大徑、實性成分最大面積、腫瘤最大面積、C/T和年齡的節(jié)點純度增加值較大,表明STAS陽性現(xiàn)象多見于腫瘤面積較大、實性成分較多的肺結節(jié),與既往報道[10,12,14]相符合。
綜上所述,基于胸部CT征象的機器學習模型可有效預測肺腺癌STAS狀態(tài)。本研究的局限性:①為單中心回顧性研究,且僅納入經手術切除的原發(fā)性肺腺癌,結果可能存在一定偏倚;②STAS陽性樣本量較小,可能影響預測模型的準確性;③未對患者預后進行分析;④評估CT征象存在一定主觀性。