葉釘利,姜 雯,吳佳妮,黃志成*
(1.吉林省腫瘤醫院放射線科,吉林 長春 130021;2.深圳技術大學校醫院放射線科,廣東 深圳 518118)
肺癌是世界上最常見的惡性腫瘤,發病率和死亡率呈逐年上升趨勢[1];隨著低劑量薄層CT在肺癌篩查中的應用,早期非小細胞肺癌占比越來越高[2]。治療肺癌以手術為主要手段,術前準確區分其病理亞型有助于制定個體化手術方案,從而最大程度保留肺功能,提高手術效果[3]。肺腺癌是肺癌組織學分類中數量最多者[4],2011年肺腺癌多學科分類標準[5]將肺腺癌分為非典型腺瘤樣增生(atypical adenomatous hyperplasia, AAH)、原位癌(adenocarcinoma in situ, AIS)、微浸潤腺癌(minimally invasive adenocarcinoma, MIA)和浸潤性腺癌(invasive adenocarcinoma, IAC)。借助計算機軟件,影像組學于高通量醫學影像數據中提取大量量化影像學特征,并采用機器學習方式篩選出最有價值的紋理特征,可用于評估肺腺癌病理分型[6]。本研究探討基于CT影像組學模型預測肺腺癌病理分型的價值。
1.1 一般資料 回顧性分析2015年7月—2019年2月542例于吉林省腫瘤醫院接受手術治療的肺腺癌患者,男257例,女285例,年齡29~88歲,平均(61.2±9.9)歲。納入標準:①均于術前接受同臺CT胸部檢查;②經CT引導下穿刺活檢病理確診為肺腺癌,并明確其病理亞型;③病灶長徑1.0~5.0 cm;④圖像質量滿足診斷需求。排除標準:①病理結果為非腺癌;②無法進一步確定病理分型;③圖像有明顯偽影。
1.2 儀器與方法 采用GE Lightspeed 16排CT機,囑患者仰臥,雙臂上舉,頭先進,深吸氣后屏氣接受掃描,參數:管電壓120 kV,管電流215 mA,層厚5 mm、層間距5 mm,螺距1.375∶1,轉速27.5 mm/rot,探測器排數16排,重建矩陣512×512。
1.3 提取影像組學特征與機器學習 根據病理結果將患者分為2組,第1組包含AIS和MIA,第2組為IAC。由2名具有5年以上胸部CT診斷經驗的主治醫師采用盲法分析圖像并確定病灶邊界,以Philips_Radiomics_v94_distribution軟件沿腫瘤邊界逐層手動勾畫病灶ROI(圖1),提取病灶三維紋理特征參數;之后采用Min-Max標度算法進行歸一化處理,方程如下:
以Spearman相關分析觀察組間影像組學特征差異,排除r<0.2或P>0.05者,保留組間差異明顯者。應用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法進行降維[7],篩選最佳影像組學特征,用于構建預測模型。
按2∶1比例將數據集分為訓練集和驗證集。采用6種機器學習模型對訓練集數據進行處理,以5倍交叉驗證結果為檢測6種機器學習分類器(Perceptron Classifier、SGD Classifier、Logistic Regression、Passive Aggressive Classifier、Ridge Classifier、Linear SVC)效能的指標,以“準確率”為標準選擇最佳分類器,之后對5倍交叉驗證數據集、訓練集和驗證集進行分類,獲得模型預測肺腺癌病理亞型的ROC曲線及相應AUC、特異度(specificity)、敏感度(sensitivity)及準確率(accuracy)。
1.4 統計學分析 采用SPSS 25.0統計分析軟件。計量資料以±s表示,計數資料以頻數表示。采用χ2檢驗比較組間性別差異,以獨立樣本t檢驗比較組間年齡差異。P<0.05為差異有統計學意義。
第1組235例,男135例,女100例,年齡29~83歲,平均(60.3±9.9)歲;第2組307例,男170例,女137例,年齡31~88歲,平均(61.9±11.6)歲。2組間性別及年齡差異均無統計學意義(χ2=0.56、t=-0.19,P=0.63、0.98)。
共提取病灶1 766個三維紋理特征,其中988個組間差異明顯,最終保留10個最佳影像組學特征以構建預測模型,見表1。模型訓練結果示Perceptron分類器的準確率最高(圖2),故以之為最佳分類器。采用該分類模型對5倍交叉驗證數據集、訓練集和驗證集進行分類,獲得模型預測AIS、MIA與IAC的ROC曲線(圖3),相應AUC分別為0.94、0.95和0.95,準確率分別為0.88、0.90和0.88,特異度分別為0.81、0.82和0.87,敏感度分別為0.90、0.93和0.84,見圖4。

表1 最佳影像學特征

圖2 各分類器對5倍交叉驗證數據集分類的準確率,其中Perceptron分類器的準確率最高
CT在肺癌診治過程中具有重要作用。隨著影像組學和人工智能在醫療領域的發展,CT不僅能提供病灶的形態學征象和密度值信息,結合影像組學后,還可提供更豐富的組織學和病理學信息。多項研究[8-11]表明,影像組學在預測病灶性質、淋巴結轉移、患者預后等方面均可取得較好效果。
影像組學通過采集圖像、分割圖像、提取特征和構建模型而實現鑒別診斷,已用于鑒別良惡性肺結節、肺癌分期、肺癌病理學分型、評估肺癌基因表達及預后。研究[12]發現AIS和MIA患者5年無病生存率均為100%,預后良好,而IAC的5年生存率卻并不樂觀。腫瘤的病理亞型除與預后密切相關外,對選擇手術方式及決定是否需要輔助治療亦有影響[13]。本研究通過影像組學結合機器學習的方式探討基于胸部CT預測肺腺癌病理亞型的效能,從臨床干預的角度將可行亞肺葉切除、不需淋巴結清掃術和輔助治療且預后良好的AIS和MIA合并為一組,將需切除肺葉、淋巴結清掃或淋巴結采樣且預后效果不理想的IAC歸入另一組,篩選組間差異有統計學意義的最佳影像組學特征,實現術前區分病理亞型,以期為術前制定手術策略提供更豐富的信息。
既往研究[14-17]表明,不同病理亞型肺腺癌之間影像學表現存在差異。景瑞等[4]發現不同病理類型病變密度有所差別,浸潤前病變與浸潤性腺癌的病變密度不同。肺結節大小、密度、血管、分葉、毛刺等影像學征象有助于區分病變病理階段[16-18]。而申磊磊等[14]的研究結果顯示,不同病理亞型肺癌間病灶數量和邊緣毛刺征象存在差異,而實性成分、形狀及反映邊緣特征的分葉、支氣管充氣征等無明顯差異;推測可能由于樣本量不同或觀察者主觀因素導致不同研究結果之間存在差異。

圖3 分類模型預測各數據集病理分型的ROC曲線 A.5倍交叉驗證數據集; B.訓練集; C.驗證集

圖4 分類模型預測各數據集病理分型的效能 A.5倍交叉驗證數據集; B.訓練集; C.驗證集
多數影像組學肺腺癌病理亞型研究關注鑒別診斷AIS與MIA或MIA與IAC,較少見從臨床干預角度出發制定分組策略的鑒別診斷研究。本研究結果顯示,聯合CT影像組學與機器學習算法對5倍交叉驗證數據集、訓練集和驗證集進行分析,鑒別AIS、MIA與IAC具有較好效能,有助于為術前決策提供更多參考依據。
本研究的主要局限性:①納入病例均為術后患者,可能存在選擇性偏倚;②CT掃描參數固定,導致研究結果可能缺乏拓展性;③未分析其他臨床信息和影像學征象;④未采用神經網絡算法等深度學習算法進行分析。
綜上所述,基于CT影像組學模型能有效預測肺腺癌中的AIS和MIA與IAC,可為臨床制定治療方案提供參考依據。