李 靖,高劍波,王 睿,方夢捷,許春苗,黎海亮*
[1.鄭州大學附屬腫瘤醫院(河南省腫瘤醫院)放射科,河南 鄭州 450008;2.鄭州大學第一附屬醫院放射科,河南 鄭州 450052;3.中國科學院自動化研究所分子影像重點實驗室,北京 100190]
胃癌發病率居全球第5位,病死率居第4位[1-2]。手術是治療胃癌的主要方法之一,而淋巴結轉移(lymph node metastasis, LNM)是影響臨床治療決策的重要因素[3]。CT是評估腫瘤N分期的首選影像學方法[4],但準確率低于70%[5]。利用影像組學可提高腫瘤分期、療效評估和預后預測準確率[6-8]。目前CT影像組學研究多基于靜脈期圖像[9-10]。本研究分析基于增強CT影像組學模型術前預測胃腺癌LNM的價值。
1.1 一般資料 回顧性收集2015年1月—2020年10月193例于鄭州大學附屬腫瘤醫院經手術病理證實的單發胃腺癌患者,男150例,女43例,年齡28~79歲,平均(58.6±10.2)歲;92例年齡<60歲,101例≥60歲。納入標準:①接受標準胃癌根治術(Ⅱ式)+淋巴結清掃術,術后病理證實為胃腺癌,并確定有無LNM;②術前未接受其他抗腫瘤治療;③術前1周接受腹部雙期增強CT掃描,胃腔充盈較好,圖像無明顯偽影;④病灶顯示清晰,最大徑≥5 mm。以計算機隨機數法將97例患者歸入訓練集,男71例,女26例,年齡28~79歲,平均(58.9±11.1)歲;以96例為驗證集,男69例,女27例,年齡30~79歲,平均(58.3±11.8)歲。
1.2 儀器與方法 采用GE Light Speed Ultra 16和64層螺旋CT儀行腹部掃描,范圍自膈頂至雙腎下極水平;參數:管電壓120 kV,管電流260 mAs,層厚5.0 mm,螺距1.375。平掃結束后采用高壓注射器經肘靜脈以3.0 ml/s流率推注非離子型對比劑優維顯(370 mgI/ml,1.5 ml/kg體質量),延遲30 s、70 s采集增強動脈期和靜脈期圖像。
1.3 圖像分析 掃描結束后自動重建層厚1.25 mm的薄層圖像。由2名具有5年腹部影像學診斷經驗的主治醫師采用雙盲法獨立閱片,意見存在分歧時提請另1名影像科副主任醫師判定;評估以下各項:①腫瘤厚度[11],即軸位CT顯示腫瘤最大層面上與腫瘤長軸垂直的最大短徑;②Borrmann分型[12],Ⅰ型為局限腫塊型,Ⅱ型為局限潰瘍型,Ⅲ型為潰瘍浸潤型,Ⅳ型為彌漫浸潤型;③腹腔淋巴結狀態,以短徑>10 mm和/或不均勻強化[4-6]者為陽性淋巴結。
1.4 提取影像組學特征及建立標簽 由上述醫師之一采用分割軟件ITK-SNAP 3.6.0(www.itksnap.org)分別于動脈期和靜脈期薄層CT圖像所示病灶最大層面沿邊緣勾畫ROI(圖1),存在漿膜受累時,將邊緣毛刺和壁外脂肪浸潤部分納入ROI; 3個月后隨機于訓練集中抽取30例,再次勾畫病灶ROI。
應用在Matlab 2017a上編寫的工具箱提取病灶基于公式的人工定義影像組學特征,采用以TensorFlow庫(https://www.tensorflow.org)為后端的Keras軟件包(https://github.com/fchollet/keras)實現深度卷積神經網絡,以深度學習方法提取影像組學特征。分別以Python 3.6平臺、Scipy軟件包(https://www.scipy.org)和Scikit-Learn軟件包(http://scikit-learn.org)對影像組學特征進行降維并建立標簽。以組內相關系數(intra-class correlation coefficient, ICC)評估觀察者內提取影像組學特征的一致性,篩選一致性高(ICC>0.75)的特征。采用Pearson相關分析(r>0.8)去除冗余的影像組學特征。應用人工神經網絡(artificial neural network, ANN)、K近鄰(K-nearest neighbor, KNN)、隨機森林(random forest, RF)和支持向量機(support vector machine, SVM)多種機器學習(machine learning, ML)方法,分別基于動脈期和靜脈期CT構建影像組學標簽,并對訓練集數據進行多重5折交叉驗證,篩選性能最佳的ML方法及其影像組學標簽。
1.5 統計學分析 采用R軟件3.5.0(http://www.rproject.org)。以ICC檢驗評估觀察者間測量腫瘤厚度的一致性,ICC<0.40為一致性差,0.40≤ICC<0.60為中等,0.60≤ICC<0.75為好,ICC≥0.75為非常好。以χ2檢驗或Fisher精確概率法比較計數資料。以±s表示符合正態分布的計量資料,以中位數(上下四分位數)表示不符合者,行t檢驗或Mann-WhitneyU檢驗。分別將單因素分析顯示差異有統計學意義的參數及其影像組學標簽納入多因素logistic回歸分析,篩選胃腺癌LNM的獨立預測因素,建立預測胃腺癌LNM的臨床模型及影像組學列線圖(圖2),并以受試者工作特征(receiver operating characteristic, ROC)曲線評估其診斷效能,計算曲線下面積(area under the curve, AUC),以DeLong檢驗比較其差異。分別針對不同年齡(<60歲及≥60歲)、性別、不同部位(賁門胃底、胃體及胃竇幽門)腫瘤患者及所有患者繪制ROC曲線,比較前3者與后者的AUC差異,驗證模型穩定性。P<0.05為差異有統計學意義。
2.1 臨床資料及CT表現 訓練集含54例LNM(+)和43例LNM(-),驗證集含58例LNM(+)和38例LNM(-)患者。觀察者間測量腫瘤厚度的一致性非常好(ICC=0.967)。訓練集及驗證集LNM(+)患者腫瘤厚度和陽性淋巴結占比均高于LNM(-)者(P均<0.05)。見表1。多因素logistic回歸分析顯示,腫瘤厚度和淋巴結狀態是LNM的獨立預測因素(P均<0.01,表2),可據此構建臨床模型。

圖1 勾畫胃腺癌病灶ROI示意圖 A、B.于腹部增強動脈期軸位CT圖上勾畫病灶ROI并以紅色填充; C、D.于腹部增強靜脈期軸位CT圖上勾畫病灶ROI并以紅色填充

圖2 基于腹部增強CT構建預測胃腺癌LNM影像組學的列線圖的流程圖

表1 LNM(-)與LNM(+)胃腺癌患者臨床資料及CT表現比較
2.2 影像組學標簽 分別基于動脈期及靜脈期CT提取136個深度學習影像組學特征和133個人工定義影像組學特征,共269個影像組學特征。經ICC檢驗及Pearson相關分析,分別保留動脈期36個、靜脈期37個影像組學特征。5折交叉驗證結果顯示,基于訓練集動脈期CT以雙曲正切激活ANN、基于靜脈期CT以徑向基函數SVM構建的影像組學標簽最佳,其交叉驗證精度分別為0.73及0.71。
2.3 影像組學模型及其效能 多因素logistic分析顯示,淋巴結狀態和靜脈期影像組學標簽是胃癌LNM的獨立預測因素(表3),以之建立的影像組學列線圖(圖3)預測訓練集和驗證集LNM的AUC分別為0.810[95%CI(0.730,0.886)]和0.778[95%CI(0.664,0.888)],臨床模型的AUC分別為0.772[95%CI(0.692,0.852)]、0.762[95%CI(0.642,0.882)],差異均無統計學意義(Z=1.11、0.27,P=0.27、0.78),見圖4。影像組學列線圖預測訓練集和驗證集患者LNM的AUC差異無統計學意義(Z=0.48,P=0.63)。以最大約登指數(0.52)對應的閾值(0.63)為最佳臨界值,影像組學列線圖針對訓練集和驗證集數據的診斷準確率、敏感度、特異度分別為0.77[95%CI(0.68,0.83)]、0.79、0.73和0.68[95%CI(0.55,0.79)]、0.71、0.63。
影像組學列線圖對年齡<60及≥60歲患者的AUC分別為0.81[95%CI(0.72,0.89)]及0.79[95%CI(0.70,0.88)],對男性及女性患者分別為0.83[95%CI(0.76,0.89)]及0.72[95%CI(0.57,0.86)],對賁門胃底、胃體及胃竇幽門腫瘤患者分別為0.78[95%CI(0.68,0.89)]、0.83[95%CI(0.72,0.94)]、0.83[95%CI(0.63,0.89)];對全部患者的AUC為0.80[95%CI(0.74,0.86)],與對前三者AUC差異均無統計學意義(Z=0.18、0.09、0.54、1.00、0.22、0.48、0.47,P均>0.05)。見圖5。
影像組學列線圖預測訓練集結果與實際結果的一致性較高(χ2=1.97,P=0.58),但對驗證集數據存在偏移(χ2=10.28,P=0.02,圖6)。

表2 多因素logistic回歸分析篩選變量用于構建預測胃腺癌LNM臨床模型

表3 多因素logistic回歸分析篩選變量用于構建預測胃腺癌LNM影像組學模型
增強靜脈期CT是醫學圖像分析最常見的數據源[7-10]。影像組學的基礎是大量高分辨率圖像,理論上輸入圖像越多,所得影像組學特征越豐富,可提高模型效能[10-11]。臨床實踐對胃癌患者常行雙期或多期增強CT掃描。本研究針對雙期增強CT進行影像組學分析,以ML方法建立術前預測胃腺癌LNM的影像組學標簽,構建基于CT表現及影像組學標簽的影像組學列線圖;多因素回歸分析顯示,僅靜脈期影像組學標簽為LNM的獨立預測因素,可能與典型胃腺癌于靜脈期顯著強化有關[12]。腫瘤厚度是胃腺癌LNM的獨立風險因素[13-14]。本研究發現腫瘤厚度和淋巴結狀態均與LNM有關,并以此構建了臨床模型,而影像組學列線圖中僅包括淋巴結狀態,未包括腫瘤厚度,推測主要原因在于淋巴結狀態在多因素分析中顯著性水平均較高,影響腫瘤厚度顯著性水平的表達,且以ML方法提取的影像組學特征穩定性高,亦可降低腫瘤厚度顯著性水平。

圖3 以淋巴結狀態和靜脈期影像組學標簽構建的預測胃腺癌LNM的影像組學列線圖

圖4 影像組學列線圖和臨床模型預測胃腺癌LNM的ROC曲線 A.訓練集; B.驗證集
胃癌的基因、腫瘤表型均具有高度時空異質性[15],導致LNM潛能不同。影像組學標簽能反映腫瘤異質性,聯合CT參數等臨床指標構建影像組學列線圖可實現結果可視化,便于臨床應用[8-10]。本研究影像組學列線圖預測驗證集LNM的AUC均高于0.75,且穩定性較高,不受性別、年齡和腫瘤部位的影響,但其與臨床模型的AUC差異無統計學意義,可能與樣本量小有關。
綜上,基于增強CT影像組學模型術前預測胃腺癌LNM的效能較佳。但影像組學列線圖在驗證集中的擬合優度欠佳,與樣本量小且訓練集和驗證集患者CT特征分布有所差異有關,有待進一步深入研究。

圖5 影像組學列線圖模型預測不同年齡(A)、性別(B)和部位(C)胃腺癌患者LNM的ROC曲線

圖6 影像組學列線圖模型在訓練集和驗證集的校正曲線