王 俊,孫 陽,張燕燕,紀婉瑩,劉 屹*
(1.中國醫科大學附屬第一醫院放射科,遼寧 沈陽 110001;2.安徽醫科大學第一附屬醫院放射科,安徽 合肥 230022)
胰腺導管腺癌(pancreatic ductal adenocarcinoma, PDAC)是胰腺最常見的惡性腫瘤,約占胰腺腫瘤的80%,為少血供腫瘤,其臨床及影像表現需與胰腺神經內分泌腫瘤(pancreatic neuroendocrine tumors, PNET)、胰腺實性假乳頭狀瘤(solid pseudopapillary tumor of the pancreas, SPTP)等相鑒別。PNET雖為富血供腫瘤,但約41%~49%增強后無明顯強化[1]。SPTP具有惡性潛能,病灶以實性成分為主且較小時,難以與PDAC和PNET鑒別。PDAC、SPTP和PNET影像學表現有所重疊,術前鑒別診斷存在一定困難[2]。基于圖像像素強度及空間分布特點,紋理分析可反映腫瘤異質性[3-4],而胰腺腫瘤相關紋理分析研究尚少[5]。本研究探討采用CT紋理特征診斷及鑒別診斷PDAC、SPTP及PNET的可行性。
1.1 一般資料 回顧性分析2014年6月1日—2017年5月31日199例于中國醫科大學附屬第一醫院經病理確診的胰腺占位病變患者,其中98例PDAC,62例SPTP,39例PNET。納入標準:①術前2個月內接受胰腺CT平掃+增強檢查;②均有術后病理結果。排除CT未能確切顯示病變者。
1.2 提取紋理特征 由1名具有5年以上腹部影像學診斷經驗的主治醫師分析CT圖像,于橫斷面圖像腫瘤最大層面沿腫瘤邊緣手動勾畫ROI,使其與腫瘤邊緣距離約2 mm(圖1)。以基于MITK平臺(www.mitk.org, 版本2015.05.1)的A.K.軟件(GE, Artificial Intelligence Kit)提取ROI紋理特征。采用其中46個紋理特征(表1),包括13個直方圖特征、14個灰度共生矩陣特征(gray-level co-occurrence matrix, GLCM)、8個灰度游程長度矩陣特征(gray-level run length, GLRL)及11個灰度區域大小矩陣特征(gray-level zone size matrix, GLZSM)[6]。
1.3 選擇特征及分類 采用基于隨機森林算法進行特征選擇[7]。首先按重要性進行特征排序,之后計算嵌套模型的特征組合的袋外錯誤率,最后消除所選擇特征組合中的冗余進行改進選擇,為進一步預測建模提取特征(圖2)。采用線性判別分析(liner discriminant analysis, LDA)、K鄰近(K nearest neighbor, K-NN)、隨機森林(random forest, RF)、自適應增強算法(Adaboost)、樸素貝葉斯(naive bayesian, NB)及神經網絡(neural network, NN)6個常見機器學習分類器,以重復10次的十折交叉驗證為標準,對所選特征進行分類。

圖1 于增強CT軸位圖像手動勾畫PDAC(A)、PNET(B)和SPTP(C)的ROI的示意圖

表1 用于鑒別PDAC、SPTP及PNET的CT紋理特征
1.4 統計學分析 采用R語言3.4.2統計分析軟件。采用單因素回歸分析單個紋理特征對于一對多的二分類分組(①PDAC vs rest;②SPTP vs rest;③PNET vs rest)的鑒別效果;采用多因素回歸分析分類器對二分類分組及三分類分組(PDAC vs PSTP vs PNET)的鑒別效果,以AUC評估分類器的鑒別能力:0.50 2.1 單因素回歸分析單個紋理特征鑒別PDAC、SPTP及PNET 表2~4所列為鑒別PDAC vs rest、SPTP vs rest、PNET vs rest的診斷效能較好及以上的紋理特征,其中最佳者分別為低密度短域補償(AUC=0.73,P<0.01)、灰度不均勻性(AUC=0.79,P<0.01)及總和均值(AUC=0.90,P<0.01)。 表2 單因素回歸分析單個紋理特征鑒別PDAC vs rest的診斷效能 表3 單因素回歸分析單個紋理特征鑒別SPTP vs rest的診斷效能 表4 單因素回歸分析單個紋理特征鑒別PNET vs rest的診斷效能 2.2 多因素回歸 分析分類器鑒別二分類分組及三分類分組(PDAC vs SPTP vs PNET) 基于隨機森林算法選擇的特征見表5。采用機器學習分類器對二分類組及三分類組所選擇特征組合進行鑒別。二分類分組方法中,鑒別PDAC vs rest及SPTP vs rest時,分類器RF的診斷效能均很好(AUC=0.88,0.86);鑒別PNET vs rest時,6種機器學習分類器的診斷效能很好或極好,最高者為Adaboost(AUC=0.94),見表6。三分類分組機器學習分類結果顯示所有分類器的分類準確度均較好,以RF的準確度最高(0.80,表7)。 表5 隨機森林算法選擇的特征組合 表6 多因素回歸分析分類器鑒別二分類組基于隨機森林算法選擇特征的診斷效能 表7 多因素回歸分析分類器鑒別三分類分組基于隨機森林算法選擇特征的診斷效能 圖2 PDAC vs rest二分類分組的特征選擇過程 A~B.特征重要性排序; C.計算嵌套模型特征組合的袋外錯誤率,可見前8個特征組合的袋外錯誤率明顯降低; D.剔除冗余特征,剔除8個特征組合中的冗余特征后,剩余者為袋外錯誤率最低的特征組合 分析紋理特征為影像組學的一部分,也是一種圖像處理方式,通過定量方式提取紋理信息而降低觀察者的主觀性,能檢測肉眼可能無法觀察到的細微差異,在腫瘤成像及各種器官系統中的應用越來越多[8]。CHOI等[9]分析CT紋理特征與PNET分化等級間的關系,發現CT紋理特征評估PNET分化等級優于傳統CT圖像特征的診斷性能。EILAGHIA等[10]定量分析CT紋理特征與PDAC的總體生存率的相關性,發現紋理特征(異質性和逆差距)有可能成為術前評估PDAC總體生存率的生物學標志物。 本研究采用單個紋理特征對鑒別胰腺腫瘤的診斷效能為較好或很好,表明紋理特征能區分不同類型胰腺腫瘤之間的細微差別。多因素分析中,極差是鑒別PDAC與其他腫瘤最重要的特征,可能由于腫瘤異質性較高,且內部易出現壞死等,使得極差能直觀地反映其異質性。大小區域不均勻性是鑒別SPTP與其他腫瘤最重要的特征,假乳頭區具有玻璃樣變性的纖維組織,瘤周細胞排列整齊,瘤細胞間質有泡沫樣組織細胞及膽固醇結晶,而實性區瘤細胞大小形態與正常細胞基本一致,大小區域不均勻性可能反映假乳頭區和實性區之間的差異。病理學檢查鑒別PNET與其他腫瘤往往亦存在一定難度,GLCM中的總和均值為其最重要的特征,可能與腫瘤間質血竇豐富且伴纖維組織增生有關[11]:血竇豐富意味著腫瘤強化更明顯,總和均值特征也更加明顯。對于所選擇的重要特征組合,采用6種相對簡單、高效及普遍的機器學習方法分類鑒別效能基本達到較好或很好,表明該特征對于鑒別胰腺腫瘤具有效能。 HAWKINS等[12]比較4種不同影像學特征選擇和分類方法預測非小細胞肺癌患者生存率的準確率;PARMAR等[13]通過比較14個特征選擇和12個分類方法的性能和穩定性預測肺癌患者的總體生存率,結果均表明隨機森林分類器與大多數特征選擇技術相結合具有較高性能,并認為分類方法是影響性能的主要因素[14]。本研究采用隨機森林特征選擇與不同分類方法組合,量化分析機器學習分類方法鑒別PDAC、SPTP及PNET的效能。胰腺腫瘤紋理分析中,隨機森林算法對于選擇變量和分類均為非常有效的無模型方法,不僅可識別對因變量具有線性影響的自變量,且可識別非線性效應,具有發現因變量和自變量間隱藏關系的能力,并可達到最佳診斷效能。 綜上所述,采用CT紋理分析可非侵入性定量鑒別PDAC、SPTP及PNET,采用機器學習可進一步提高診斷效能。本研究的主要局限性在于:①胰腺腫瘤類型較少;②樣本量較少,未建立獨立的學習集和驗證集;③未能采用相同CT設備對全部患者進行檢查。2 結果







3 討論