趙泓博,尹昳麗,劉暢,朱慶強,石博文,劉路路,許晴,葉靖
甲狀腺癌是最常見的內分泌惡性腫瘤之一,甲狀腺乳頭狀癌(thyroid papillary carcinoma,PTC)約占所有甲狀腺癌的90%[1]。頸淋巴結轉移是PTC患者發生遠處轉移和生存率低的危險因素[2],也是甲狀腺全切術的適應證。相反,考慮到PTC的良好預后,對小于4 cm且局限于甲狀腺內或無淋巴結轉移的單灶性腫瘤,建議僅進行同側甲狀腺葉切除術以減少手術并發癥[3-5]。然而,由于缺乏準確的鑒別征象,如何準確選擇無淋巴結轉移的患者行單側葉切除術仍是目前的難點。
影像組學是新興的影像學研究領域,通過獲取及重建圖像、分割病灶、提取和選擇紋理特征以及構建診斷模型,實現了對ROI空間數據的分析和特征提取。運用數學分析法對醫學圖像中像素的分布情況進行評價,獲取病灶的一系列量化后的參數,是一種無創性的影像生物學標志方法,在MRI及CT等多種影像手段中的臨床應用越來越廣泛,并且聯合機器學習,能夠對病變內在的空間、時間上的異質性進行定量分析[6-8]。本研究探討了基于CT增強圖像的影像組學分析方法在甲狀腺乳頭狀癌淋巴結轉移中的應用價值。
1.研究對象
回顧性分析2015年7月-2019年10月在本院確診的甲狀腺結節患者的病例資料。納入標準:①單個甲狀腺病變,經手術病理診斷為PTC;②術中行頸部淋巴結清掃術,且有詳細完整的的淋巴結病理結果;③臨床醫師對淋巴結的位置進行了詳細的描述,并在CT圖像上進行標注;④手術前均行過頸部CT增強檢查;⑤術前未經過任何相關治療;⑥CT 圖像質量滿足診斷要求及校準分析。
最終將符合要求的80例患者納入研究,共搜集173個淋巴結的CT、臨床和病理結果。其中,男31例,女49例;年齡13~77歲,平均(41±14)歲;轉移性淋巴結89個,未轉移性淋巴結84個。
2.CT檢查方法
使用GE Lightspeed VCT 64 CT掃描儀行常規甲狀腺平掃和雙期增強掃描。掃描參數:120 kV,360 mA,螺距0.984,層距及層厚均為5.0 mm。經肘前靜脈注入對比劑碘海醇(300~350 mg I/mL),劑量1.0 mL/kg,總量80~100 mL,注射流率3.0 mL/s,延遲30和60 s分別行動脈期和靜脈期掃描,采用標準算法、1.25 mm層厚對動脈期和靜脈期圖像分別進行薄層重建,并將重建圖像以DICOM格式導出。
3.圖像分析和特征提取
首先由一位具有5年頸部疾病影像診斷經驗的醫師,根據臨床醫師提供的頸部淋巴結定位,分別在動脈期和靜脈期CT圖像上逐層對頸部淋巴結進行ROI的勾畫,ROI應避免壞死、囊變及鈣化區域,且動脈期和靜脈期圖像上ROI勾畫的層數、大小和位置均保持一致(圖1~2);再由一位有10年以上頸部疾病診斷經驗的主任醫師確認ROI勾畫結果。
使用達爾文科研平臺(Darwin research platform)進行影像組學分析,每個淋巴結提取了8類共1223個紋理特征:一階紋理特征(first order statistics)19個;二維形狀特征(shape-based)10個;三維形狀特征(shape-based);灰度共生矩陣(gray level cooccurence matrix,GLCM)24個;灰度大小區域矩陣(gray level size zone matrix,GLSZM)16個;灰度長游程矩陣(gray level run length matrix,GLRLM)16個;相鄰灰度差矩陣(neighbouring gray tone difference matrix,NGTDM)5個,包括粗糙度、對比度和復雜度等;灰度優勢矩陣(gray level dependence matrix,GLDM)14個。

圖1 患者,女,42歲,甲狀腺乳頭狀癌不伴淋巴結轉移。a)動脈期圖像,氣管旁淋巴結增大(箭),病理證實無轉移;b)動脈期圖像,沿淋巴結邊緣勾畫ROI;c)靜脈期圖像,沿淋巴結邊緣勾畫ROI,層面和ROI大小與動脈期圖像相同。 圖2 患者,女,56歲,甲狀腺乳頭狀癌伴淋巴結轉移。a)頸部增強掃描動脈期圖像,顯示左側甲狀腺內不規則低密度灶,同側皮下淺表淋巴結有較明顯強化(箭),病理證實有淋巴結轉移;b)動脈期圖像,沿淋巴結邊緣勾畫ROI;c)靜脈期圖像,沿淋巴結邊緣勾畫ROI,層面和ROI大小與動脈期圖像相同。
4.預處理、特征篩選及模型建立
采用達爾文科研平臺內置的R語言算法完成特征篩選,分別對動脈期和靜脈期CT圖像進行最小、最大值歸一化預處理,對每一維度特征的線性進行拉伸。再逐步采用最優特征篩選(個數)、模型選擇及迭代篩選法進行特征篩選,得到基于雙期圖像的最優紋理特征。最后,將170個淋巴結分為2組,70%的樣本作為訓練組(120個,轉移組和未轉移組分別為62和58個),30%的樣本作為驗證組(53個,轉移組和未轉移組分別為27和26個),分別對訓練組中基于動脈期和靜脈期圖像提取的最優紋理特征采用支持向量機(support vector machine,SVM)的方法建立模型,隨后進行交叉驗證。數據驗證和模型診斷:采用訓練組數據建立模型,然后對驗證組數據進行驗證。采用ROC曲線評價模型的診斷效能,計算敏感度、特異度和符合率。
5.統計分析
使用SPSS 19.0軟件對篩選出的特征數據進行統計學分析,加載相應的程序包和函數庫進行計算。若動脈期和靜脈期兩組中有特征參數的測量數據不滿足正態分布或方差不齊,則采用秩和檢驗。以P<0.05為差異具有統計學意義。
1.特征降維及SVM模型
運用達爾文軟件內置的特征降維組件進行降維。首先,經最優特征篩選(個數),將K值設為50,從1223個特征參數中篩選出50個排名靠前的特征參數;然后,采用Lasso-logistic回歸模型進行模型選擇(圖3~4),從50個組學特征中篩選出10個最優特征;最后,進行迭代篩選,篩選出最有意義的特征參數。最終,基于動脈期圖像共篩選出6個特征,包括粗糙度(coarseness,Co)、依賴熵(dependence entropy,DE)、短游程低灰度優勢(short run low gray level emphasis,SRLGLE)、游程長度不均勻性(run length non-uniformity,RLN)、低灰度級優勢(low gray level emphasis,LGLE)和區域大小不均勻歸一化(size zone non-uniformity normalized,SZNN)6個特征;基于靜脈期圖像共篩選出5個特征,為粗糙度、RLN、小面積低灰度優勢(small area low gray level emphasis,SALGLE)、長游程高灰度優勢(long run high gray level emphasis,LRHGLE)和大依賴優勢(large dependence emphasis,LDE)。對動脈期和靜脈期篩選后的紋理特征的數據進行了統計學驗證,結果見表1。

圖3 Lasso回歸的損失曲線。α值為懲罰項系數,縱坐標為均方誤差。虛曲線分別代表交叉驗證法中每一次α的負對數的值和對應均方誤差的關系曲線。圖中實線代表交叉驗證對應虛曲線的均值,豎虛線代表在均方誤差最小時,最佳α取值對應的-log(α)值。a)動脈期,α值為-0.256;b)為靜脈期,α值為0.335。 圖4 Lasso 模型交叉驗證方法篩選特征的特征系數收斂圖。圖中每條曲線代表1223維特征中某一個特征的特征系數隨著α值變化的情況,豎虛線表示最佳α取值對應的-log(α)值。a)動脈期,得到6項特征系數非零的特征;b)靜脈期。得到5項特征系數非零的特征。

表1 兩組淋巴結在雙期增強CT圖像上特征參數的比較
分別以動脈期和靜脈期篩選后的特征參數構建動脈期和靜脈期SVM模型,并進行ROC曲線分析(圖5~6)。訓練組中動脈期和靜脈期模型的曲線下面積分別為0.903(95%CI:0.835~0.949)和0.915(95%CI:0.850~0.958),驗證組中分別為0.895(95%CI:0.778~0.964)和0.850(95%CI:0.726~0.933)。在驗證組中,動脈期模型的診斷符合率為75.47%(40/53),敏感度為88.00%,特異性為80.77%;靜脈期模型的符合率為71.69%(38/53),敏感度為80.77%,特異度為81.48%。
頸部淋巴結轉移是指導PTC患者選擇合適臨床手術的重要標準,在目前的臨床實踐中,超聲是評估甲狀腺淋巴結轉移的主要無創性檢查手段,其特異度較高(85.0%~97.4%),但敏感度較低(36.7%~61.0%)[9-10]。此外,超聲在評估甲狀腺淋巴結轉移時有一定限制,圖像質量和操作人員的經驗對診斷準確性有顯著影響[11]。CT與超聲檢查具有相似的敏感度和特異度[12]。雖然MRI檢查無輻射性,但是既昂貴又耗時。Gross等[13]的研究結果顯示,MRI對頸部淋巴結轉移的診斷敏感度很高(95%),但特異度較低(51%),特異度和敏感度極不平衡。在本研究中基于動脈期和靜脈期圖像建立的SVM模型的特異度和敏感度表現出了良好的平衡性。
影像組學最早于2012年提出,作為一種新興的影像分析方法,其目的是利用大數據分析技術,從影像數據中挖掘可量化病變的海量特征,并構建特征性影像組學標簽,以期解析影像與病理、臨床的潛在關聯,尤其是一些高階紋理特征,它們不僅反映了腫瘤組織學的異質性,甚至還在一定程度上反映出相應的遺傳學差異[14-15]。影像組學結合機器學習可對病灶的圖像信息進行定量分析,不僅規避了觀察者易對影像特征進行主觀解讀的缺點,而且進一步挖掘并整合影像圖像中肉眼難以分辨的影像特征,因而大大提升了診斷準確性。影像組學可以用于描述腫瘤表型、區分良惡性腫瘤和預測治療等方面[16]。

圖5 訓練組中SVM模型的ROC曲線。a)動脈期的ROC曲線,AUC值為0.903,95%置信區間為0.835~0.949;b)靜脈期的ROC曲線,AUC值0.915,95%置信區間為0.850 ~0.958。 圖6 驗證組中SVM模型的ROC曲線。a)動脈期的ROC曲線,AUC值為0.895,95%置信區間為0.778~0.964;b)靜脈期的ROC曲線,AUC值為0.850,95%置信區間為0.726~0.933。
目前關于PTC淋巴結轉移的影像組學研究較少見,而且大多是基于超聲圖像的紋理分析。Kim等[17]運用超聲紋理分析技術對甲狀腺微小乳頭狀癌患者淋巴結轉移進行預測,發現直方圖參數(均值、標準差、偏斜度、峰度和熵)均與淋巴結轉移無顯著相關性。Liu等[18]運用超聲影像組學模型評估PTC患者淋巴結轉移情況,認為影像組學模型是評估乳頭狀甲狀腺癌轉移風險的一種很有前途的方法,其ROC下面積為0.727,符合率為0.710,均低于本組研究結果?;贑T增強的影像組學方法評估PTC淋巴結轉移情況的國內外報道較少。本研究中使用的SVM是一類常用的分類識別模型,因為其在小樣本、非線性和高維數據中優秀的分類性能[19],尤其符合影像組學研究的數據特點。
本研究基于CT增強圖像影像組學對PTC淋巴結轉移進行評估,經預處理和特征降維,結果顯示動脈期和靜脈期圖像均紋理特征(動脈期6個、靜脈期5個)具有預測價值。其中灰度游程長度矩陣特征3個、灰度區域大小矩陣特征2個、灰度依賴矩陣特征3個、相鄰灰度差矩陣特征1個。粗糙度和游程長度不均勻性是動脈期和靜脈期均具有的特征。粗糙度的值越大表明圖像的基本組成域越大,即在較大的區域內紋理更均勻,灰度值的變化較小,結果顯示未轉移組較轉移組圖像更均勻。紋理特征的構建中,游程表示了同樣亮度且連續體素數目的多少,以及在不同方向上不同灰度游程度的多少,其中游程長度不均勻性描述圖像中游程長度的相似程度,即游程長度越相似,則游程長度不均勻性的值越小,圖像紋理粗細越均勻,數據結果同樣支持未轉移組較轉移組圖像紋理更均勻。上述結果可能與其淋巴結轉移的病理特點有關,在轉移性淋巴結中,腫瘤首先侵犯淋巴結皮質邊緣的網狀淋巴竇,然后沿淋巴竇破壞淋巴組織,淋巴結髓質結構消失,被腫瘤細胞取代,并且腫瘤細胞生長較快,得不到充足的血液供應從而出現壞死、囊變[20],導致轉移性淋巴結的圖像紋理比未轉移性淋巴結更加粗糙。
本研究中分別提取動脈期和靜脈期CT圖像的紋理特征并創建SVM模型,得出動脈期SVM模型評價PTC淋巴結轉移的符合率為(75.47%)高于靜脈期SVM模型的符合率(71.69%),表明基于動脈期SVM模型在評估PTC淋巴結轉移更具優勢。本研究動脈期和靜脈期的AUC值均高于沈莎莎等[21]基于PTC原發癌灶建立的小波紋理特征模型預測淋巴結轉移的AUC值(0.693),且其研究只采用靜脈期圖像。
本研究存在一定的局限性。首先,本研究為單中心單機型回顧性分析,有待更大樣本、多中心、多機型前瞻性研究進一步驗證模型的有效性;其次,本研究采用手動ROI勾畫,存在一定誤差,后期有待運用自動或半自動ROI勾畫進一步完善;另外,影像組學為病變的術前病理分類提供了較好的應用結果,但其醫學解釋還有待于進一步探討。
綜上所述,CT增強影像組學在評估甲狀腺乳頭狀癌患者淋巴結轉移情況方面具有較好的價值,且以動脈期影像組學特征建立的SVM模型診斷的準確性更高,為臨床選擇合適的手術方案提供了客觀依據,存在一定的參考價值。