王 琴,黃東瓊,于冬洋,韓 雷
1. 達州市中心醫院核醫學科,四川 達州 635000;
2. 徐州醫科大學附屬淮安醫院影像科,江蘇 淮安 223001
腮腺是唾液腺腫瘤最常見的部位(80%),其中腮腺多形性腺瘤(pleomorphic adenoma,PA)是最常見的良性腫瘤,其次是沃辛瘤(Warthin tumor,WT)[1]。PA與WT的影像學特征存在諸多相似性,但在計算機體層成像(computed tomography,CT)平掃或CT增強表現上仍有所差異[2],不同的磁共振成像(magnetic resonance imaging,MRI)信號強度也可有效地鑒別兩者[3]。PA好發于中青年,而WT好發于中老年男性,性別分布也是鑒別PA與WT的重要依據[2,4]。盡管影像學表現結合臨床資料??蓞^分PA與WT,但診斷資料的部分重疊仍使兩者的鑒別診斷變得困難。
不同腫瘤由于組織分化程度的高低而表現出不同的異質性[5]。放射組學特征定量分析影像學圖像中的灰度分布、像素之間的空間關系等信息[6],以此評估腫瘤內部的異質性,進而區分具有不同異質性的腫瘤[7]。本研究利用CT平掃圖像的放射組學特征建立分類模型,探討CT放射組學特征在PA與WT鑒別診斷中的價值。
回顧并分析2013年1月—2020年11月達州市中心醫院、淮安市第二人民醫院經病理學檢查確診的28例PA與25例WT患者。PA組:均為單發,男性10例,女性18例,年齡23~75歲;WT組:單發18例,多發7例,男性23例,女性2例,年齡35~78歲。兩組患者主要因腮腺無痛性腫塊入院,均于術前接受CT平掃檢查。
采用德國Siemens公司Somatom Definition AS 64排螺旋CT機,日本Toshiba公司Aquilion 64排螺旋CT機。掃描參數:管電流200 mA,管電壓120 kV,層厚5 mm,層間距5 mm,視野240 mm×240 mm,矩陣512×512,行軸位掃描,覆蓋整個腮腺。
選取腫瘤橫斷面最大層面的CT平掃圖像(多發者取較大病灶),以DICOM格式導出并儲存,像素大小512×512,使用MicroDicom軟件(http://www.microdicom.com)轉換成BMP格式。使用MaZda ver.4.6軟件提取放射組學特征,包括直方圖分析(histogram analysis,HA)、灰度共生矩陣(gray-level co-occurrence matrix,GLCM)、灰度游程矩陣(gray-level run length matrix,GLRLM)、絕對梯度(absolute gradient,AG)和自回歸模型(autoregressive model,AR),GLCM的步長包括1~5個像素,GLCM和GLRLM均包含4個方向(0°、45°、90°和135°),共259個參數,將感興趣區(region of interest,ROI)內的圖像強度標準化為μ±3σ(μ:圖像強度的平均值;σ:標準差),1個月后使用同樣方法再次提取組學特征。ROI沿腫瘤邊緣勾畫(圖1)。
圖1 MaZda軟件勾畫腫瘤的ROI示意圖
數據分析使用SPSS 25.0軟件,特征篩選與模型建立使用R語言(4.0.3)。計量資料以±s表示,比較采用獨立樣本t檢驗(符合正態分布與方差齊性檢驗)或非參數秩和檢驗;計數資料比較采用χ2檢驗或Fisher精確概率檢驗法,P≤0.05為差異有統計學意義。使用組內相關系數(intraclass correlation coefficient,ICC)分析兩次測得的組學特征,同時選取PA組與WT組中ICC>0.75的特征[8],然后選取組間差異有統計學意義的特征參數,將參數歸一化在[0,1]之間后再通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析進一步篩選,LASSO回歸模型的最優λ值通過10折交叉驗證獲得。利用篩選的特征參數建立隨機森林(random forest,RF)、邏輯回歸(logistic regression,LR)與支持向量機(support vector machine,SVM)分類模型,驗證方式選擇10折交叉驗證,應用受試者工作特征(receiver operating characteristic,ROC)曲線評估分類模型的效能,指標包括準確度、靈敏度、特異度和曲線下面積(area under curve,AUC)。ICC分析得出重復性良好的特征參數,后續的數據分析以兩次提取的特征參數的平均值進行。
PA組、WT組兩組間年齡分布差異無統計學意義(P=0.106),兩組間性別分布差異有統計學意義(P<0.001),性別區分兩組的準確度、靈敏度、特異度和AUC分別為78.1%、92.0%、64.3%及0.781。
通過ICC分析后選出176個特征參數,其中PA與WT之間差異有統計學意義的特征參數共49個,GLCM數量最多,共39個,GLRLM、HA、AG、AR數量分別為4、3、1、2。圖2中間的黑色垂直線代表模型的最優λ值,此時模型最精確,以此模型選出的特征參數共11個(表1),各參數的系數見圖3,直方圖越長,代表系數絕對值越大。
圖2 LASSO模型篩選特征參數圖
圖3 LASSO模型選出的特征參數系數圖
表1 模型特征子集在PA與WT間的比較 M(Q1,Q2)
3種分類模型中,RF分類模型的效能最高,詳見表2,ROC曲線見圖4。
表2 3個分類模型在PA與WT間的鑒別效能
圖4 3個分類模型鑒別PA與WT的ROC曲線
本研究利用CT平掃圖像提取259個放射組學特征,篩選出11個特征參數作為特征子集建立RF、LR及SVM分類模型,均得到了良好的分類效果,其中RF分類模型的效能最佳,準確度、靈敏度、特異度及AUC分別達到83.3%、78.6%、88.0%及0.882。
PA患者以女性居多,而WT好發于中老年男性[4,9],本研究結果顯示WT組的男性比例明顯高于PA組(P<0.001),其準確度、靈敏度、特異度和AUC分別為78.1%、92.0%、64.3%及0.781,表明性別分布可為PA與WT的鑒別診斷提供依據,與既往研究[4,9]結果一致。
放射組學特征中的GLCM在腫瘤的病理學分級及腫瘤間的鑒別診斷中發揮著重要作用。Vamvakas等[10]利用多個MRI序列中的放射組學特征,建立模型對腦膠質瘤進行病理學分級,模型的最佳特征子集中GLCM參數所占比例最高。任繼亮等[11]從常規MRI序列中提取放射組學特征對眼眶淋巴瘤與炎性假瘤進行鑒別,T1加權成像與T2加權成像序列的最佳特征主要集中在GLCM與GLRLM,對比增強T1加權成像序列的最佳特征主要集中在GLCM與HA,各序列中GLCM參數在鑒別診斷中均表現出良好效能。本研究提取CT平掃圖像中的HA、GLCM、GLRLM、AG和AR這5種特征,在PA與WT間差異有統計學意義的特征中以GLCM數量最多,經過LASSO分析進一步篩選得出分類模型的特征子集,也發現GLCM的特征參數在子集中所占權重最大,結果均與既往研究[10-11]的結果相仿。
放射組學特征包括一階、二階和高階特征,從不同角度反映腫瘤內部的異質性[12],利用這些特征建立不同的分類模型對疾病進行診斷已有廣泛的研究[13-15]。Wang等[15]為了預測頭頸部鱗狀細胞癌非手術治療后局部復發,提取了CT圖像和正電子發射體層成像(positron emission tomography,PET)圖像中的放射學特征后建立了SVM、判別分析(discriminant analysis,DA)和LR預測模型,取得了良好的預測效果,最佳AUC達0.76。蔡俊輝等[16]利用CT圖像的放射組學特征建立SVM、RF及LR分類模型,預測表現為磨玻璃結節的肺腺癌的浸潤性,其中SVM分類模型的效能最佳,準確度、AUC分別為93.30%、0.94。本研究亦利用CT圖像的放射組學特征建立了RF、LR及SVM這3種模型,均取得了良好的分類效能,RF分類模型的效能最佳,且效能優于性別的分類效能,但最優模型與既往研究[16-17]并不一致,這可能與研究的數據及模型本身的算法有關。
本研究存在的不足之處:① 納入樣本量較少,仍需擴大樣本量以提高分類模型的可信度;② 僅分析了CT平掃圖像的放射組學特征,而未研究CT增強圖像的放射組學特征;③ 僅利用放射組學特征建立分類模型,未納入腫瘤形態學特征及臨床資料。
綜上所述,通過分析病灶的影像學表現與臨床資料??捎行У罔b別PA與WT,但在影像學資料不全或鑒別困難的情況下,利用CT平掃圖像的放射組學特征建立分類模型,可為PA與WT的鑒別診斷提供參考信息。