楊蕾,張在先,國建林,史慧文,葛亞瓊,張傳玉*
1.青島大學附屬醫院放射科,山東 青島 266000;2.首都醫科大學附屬北京兒童醫院影像中心,北京 100045;3.通用電氣(中國)有限公司,上海 210000; *通信作者 張傳玉 zhangchuanyu0926@163.com
肺癌是我國病死率最高的惡性腫瘤[1]。近年來,肺癌的分子靶向治療成為肺癌治療的研究熱點。盡管間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)重排在非小細胞肺癌中發生率相對較低[2],但對ALK突變腫瘤靶向治療的效果優于傳統治療[3]。由于腫瘤的異質性及傳統基因檢測方法具有創性,因此迫切需要一種可重復的無創方法用于識別ALK突變患者[4-5]。影像組學通過高通量提取定量影像數據,重復量化腫瘤病灶的全面信息,并建立腫瘤圖像與基因突變狀態之間的關系,為預測ALK基因表達提供新的分析方法[6]。利用影像組學方法預測肺癌ALK突變狀態的相關報道較少。本研究擬探討術前增強CT影像組學特征模型預測肺腺癌ALK基因表達的價值。
1.1 研究對象 回顧性分析2017年4月—2019年9月青島大學附屬醫院收治的手術切除或穿刺活檢病理證實的肺腺癌。納入標準:①具有完整的臨床資料;②可獲得完整的胸部CT動態增強DICOM格式圖像;③可獲得完整的ALK突變基因檢測結果。排除標準:①圖像偽影較大,經歸一化處理后仍影響觀察;②CT檢查前接受治療或侵入性手術;③多灶性原發腫瘤。最終納入210例患者,其中ALK突變組50例,ALK野生組160例。本研究通過醫院倫理委員會審核,所有研究對象均簽署知情同意書
1.2 CT檢查 使用東芝Aquilion ONE 640 CT掃描儀或西門子Sensation Cardiac 64 CT掃描儀進行胸部CT動態增強掃描,掃描范圍從肺尖到肋膈角。掃描參數:管電壓120 kV,采用自動管電流調節技術,矩陣512×512,層厚5 mm,重建層厚1 mm,層間距1 mm,螺距1.375︰1。采用MedradStellant雙筒高壓注射器注射含碘對比劑(優維顯,含碘離子370 g/L)100 ml,注射速度3.5 ml/s。分別于對比劑注射開始后25 s、70 s采集動脈期和靜脈期CT增強圖像。
1.3 圖像分割及特征提取 分別于動脈期和靜脈期橫軸位圖像病灶最大截面所在層面,對圖像窗寬、窗位進行統一化處理(設置窗寬400 Hu、窗位40 Hu)。然后使用ITK-SNAP 3.8軟件沿病灶輪廓勾畫感興趣區(ROI),盡量避開血管、胸膜等區域。由1名具有10年工作經驗的放射診斷專業主治醫師采用盲法對勾畫的ROI進行校驗。將病灶增強CT橫軸位最大層面圖像以及勾畫的相應ROI圖像導入A.K.軟件進行特征提取。每枚病灶最大層面軸位圖像提取出396項特征,包括形態學特征、一階直方圖特征、二階直方圖特征及高階特征4大類。
1.4 特征篩選與模型建立 將患者按照7︰3隨機分為訓練集147例與驗證集63例。使用最小冗余最大相關算法(minimum redundancy maximum relevance,mRMR)在訓練集中進行特征初步篩選,消除冗余和不相關的特征,保留30項具有最大預測效能的特征。然后應用最小絕對收縮與選擇算子算法(the least absolute shrinkage and selection operator,LASSO)將剩余的組學特征進一步篩選。采用10折交叉驗證篩選出能使LASSO回歸模型的誤差達到最小的lambda(λ)值,且排除系數為0的特征。保留系數不為0的特征,并利用其與之相對應的系數計算每例患者的影像組學評分(radscore,RS)。
首先對ALK突變的臨床危險因素進行初步評價,對P<0.1的特征進行單因素Logistic分析,以確定預測ALK突變的潛在危險因素。應用多因素Logistic回歸分析篩選可預測ALK突變狀態的獨立預測因素和最佳RS。根據篩選后的訓練集特征構建諾模圖模型。
1.5 統計學方法 應用SPSS 26.0軟件及R3.2.1軟件對影像組學數據進行處理。采用驗證集數據對模型進行測試。所得受試者工作特征(ROC)曲線和曲線下面積(AUC)用于評價模型的診斷效能。模型間的診斷效能評價采用Delong檢驗。決策曲線(decision curve analysis,DCA)用于評估聯合預測模型的臨床實用性。分類變量比較采用χ2檢驗,連續變量比較采用獨立樣本t檢驗和Wilcoxon檢驗,P<0.05表示差異有統計學意義。
2.1 一般特征ALK突變組及ALK野生組肺腺癌患者年齡、吸煙史、TNM分期及轉移情況比較,差異有統計學意義(P<0.05);性別、最大直徑及部位差異無統計學意義(P>0.05),見表1。

表1 ALK突變組和ALK野生組肺腺癌患者一般特征比較
2.2 影像組學特征 應用mRMR和LASSO進行特征篩選,根據最優λ值(圖1),最終決定保留19項特征(圖2)。利用這些特征與其對應的系數,根據公式(1)計算每位患者的RS。

圖1 采用LASSO 10折交叉驗證圖。A.紅點表示不同λ所對應模型的平均偏差值,模型偏差最低點對應的橫坐標為最佳λ值;B.彩線代表特征的系數隨λ值的變化曲線,虛線對應的λ值為最佳λ值,保留此處系數不為0的19項特征

圖2 y軸表示選取最佳λ值時對應的19項系數不為0的特征名稱;x軸表示其在LASSO回歸中對應的系數,系數越大,預測價值越高



2.3 篩選預測肺腺癌ALK突變狀態的危險因素 單因素Logistic回歸分析顯示,年齡、TNM分期、吸煙史和轉移情況可能是預測ALK突變的潛在危險因素(P<0.1);而多因素Logistic回歸分析結果表明,年齡、吸煙史和RS是預測ALK突變的獨立危險因素(P<0.1),見表2。

表2 預測肺腺癌ALK突變的單因素和多因素Logistic回歸分析的陽性結果
2.4 預測模型的構建及其診斷效能 本研究建立的影像組學特征的預測模型對肺腺癌ALK突變狀態具有較高的預測效能。該模型在訓練集AUC值為0.89,敏感度和特異度分別為83%和82%;在驗證集AUC值為0.79,敏感度和特異度分別為74%和85%。另外,聯合年齡、吸煙史和RS構建的諾模圖(圖3),訓練數據集和驗證數據集的AUC分別為0.91和0.80(表3,圖4)。Delong檢驗顯示,諾模圖模型和影像組學模型之間的AUC值差異無統計學意義(P>0.05)。影像組學諾模圖的臨床應用價值,DCA顯示閾值在0.1~1較大的范圍內,影像組學諾模圖的表現優于臨床模型,見圖5。

圖3 預測ALK突變的影像組學諾模圖

圖4 CT增強組學模型和聯合模型的訓練集(A)及驗證集(B)的ROC曲線

圖5 諾模圖模型的決策曲線。藍線表示假設所有患者均有ALK突變,黑線表示假設所有患者均沒有ALK突變;決策曲線表明,當閾值概率在0.1~1之間時,使用影像組學諾模圖預測ALK突變狀態比治療所有或不治療任何患者更有益處

表3 訓練集和測試集中CT增強組學模型、聯合模型預測ALK突變的診斷效能
既往對ALK突變的影像學研究大多集中在臨床特征和常規影像特征方面,認為與ALK野生型肺癌相比,ALK突變型肺癌多發生于不吸煙的年輕女性,在CT表現上腫瘤多為實性,且易出現淋巴結轉移性病變[7-8]。本研究發現,與ALK野生型肺癌相比,ALK突變型肺癌多發生于相對年輕的不吸煙患者,更多表現為晚期肺癌(Ⅲ期和Ⅳ期),且容易出現胸內和遠處器官轉移。本研究ALK突變組與ALK野生組均為女性相對更多見,且均更多表現為外周型;另外,ALK突變組病灶大小較ALK野生組稍大。年齡、吸煙史、轉移方面與既往研究相符[7-8];但兩組間性別、最大直徑、部位無顯著差異。
影像組學是目前新興的研究熱點,通過計算機提取高通量的定量影像組學特征,以反映腫瘤的異質性,構建穩定可行的預測模型,具有更好的客觀性,且可以全面反映腫瘤信息[9]。既往研究已證實通過影像組學預測ALK突變狀態的可行性[10-12]。Yoon等[10]研究CT影像組學預測ALK基因突變的價值,發現局部定量CT特征與ALK融合基因陽性顯著相關。一項納入195例肺腺癌的單中心回顧性研究發現:一階特征模型和灰度共生矩陣特征模型有助于鑒別ALK突變狀態,在驗證集的AUC分別為0.80和0.83[11]。增加樣本量后,Song等[12]回顧性分析335例肺腺癌的平掃CT圖像,利用結合臨床、常規CT和影像組學特征的機器學習模型預測肺腺癌ALK突變,結果發現臨床和常規CT特征的加入顯著提高了影像組學模型在訓練集的預測效能(P=0.01),但在驗證集中未見顯著提高(P=0.29)。
由于腫瘤生長存在不均勻性,病灶區域和背景的灰度值差異較小時,自動分割可能無法達到手動分割的準確性。而手動分割可以確保ROI的精確度,是臨床分割的金標準。本研究采用手動分割,通過提取并篩選患者胸部增強CT圖像的組學特征,建立并驗證預測肺腺癌ALK突變的增強CT影像組學模型,探討該模型在預測肺腺癌ALK突變方面的價值。在參與模型預測的19項特征中,小波特征是最有預測意義的特征。另外,本研究還探索了影像組學特征結合一般特征的聯合模型的預測能力。經比較發現,加入一般特征的聯合模型預測能力并不顯著優于單純影像組學特征模型。
與平掃CT相比,增強CT掃描可以提供病灶的血供等更加豐富的信息,更全面地反映腫瘤的異質性;但是CT增強掃描易受對比劑本身和操作者主觀影響,其結果可能會存在一定的偏差[13]。Ma等[14]研究實性肺腺癌的影像組學特征與ALK突變的相關性,分別在患者胸部CT平掃和增強圖像中進行ROI勾畫及特征提取,然后建立平掃模型和增強模型,結果表明增強CT影像組學特征對實性肺腺癌ALK突變的預測效能優于平掃CT影像組學特征。目前對肺部影像組學的研究大多采用動脈期或靜脈期圖像中的一種進行ROI勾畫及特征提取。但由于增強CT掃描時肺癌的強化過程具有連續性,如僅用其中某一期圖像分析,將損失另一期的腫瘤病灶信息。本研究對患者胸部增強CT圖像的動脈期和靜脈期分別進行ROI勾畫及特征提取,并建立增強CT預測模型,AUC在訓練集和驗證集分別為0.89及0.79,表明基于影像組學特征建立的增強CT預測模型對于肺腺癌ALK突變狀態具有一定的預測效能。
本研究的局限性:①樣本量較少,且為單中心研究;②本研究僅包含CT影像組學特征及一般特征,未考慮傳統影像學特征、病理分型、實驗室指標等的預測價值;③本研究僅選取增強CT圖像軸位最大橫截面手動勾畫病灶,未選用CT平掃圖像及自動分割算法進行對比驗證。上述不足有待后續更深入的研究進一步完善。
總之,基于增強CT影像組學特征建立和驗證的預測模型對肺腺癌ALK基因突變具有較高的預測價值,值得進一步研究探索。