倪云燕,陳 照,陳韻彬
1. 福建省腫瘤醫院,福建醫科大學附屬腫瘤醫院放診科,福建 福州 350000;
2. 福建省福州肺科醫院影像科,福建 福州 350000
鼻咽癌(nasopharyngeal carcinoma,NPC)是常見的頭頸部惡性腫瘤,具有顯著的種族及地域特征,其分布的區域主要為中國南方及東南亞地區。盡管NPC的局部控制率及5年總生存率已有所提高,但復發風險依然存在。相關研究[1-2]表明NPC照射野內的局部復發是其主要的復發模式,放射線抵抗可能是造成NPC局部復發的主要原因。腫瘤復發的中位時間多為首次放療結束后24~26個月[3-4],復發率占8%~10%[5-7],早期預測NPC的復發對改善NPC復發患者的預后和延長生存期至關重要。目前鼻咽鏡下取活組織進行病理學檢查是診斷NPC復發的常用方法,但放射治療后黏膜炎癥或結痂可能妨礙內鏡對復發的檢出。計算機體層成像(computed tomography,CT)檢查雖能評估病灶及鄰近組織器官的浸潤情況,但其軟組織分辨率較磁共振成像(magnetic resonance imaging,MRI)低,不能顯示鼻咽部微小病灶[8]。MRI軟組織分辨率較高,能夠更清晰地顯示細微病變及精確的病變范圍。目前MRI是NPC TNM分期最重要的影像學檢查,臨床分期意見中明確推薦使用MRI作為分期的影像學檢查方法。本文基于復發NPC患者初診、放療結束時及放療后3~6個月3個時間點的MRI圖像,建立多參數影像組學模型以期預測進展期NPC的局部復發。
回顧并分析2011年7月—2016年12月福建省腫瘤醫院經病理學檢查證實的進展期NPC患者,依據隨訪至2018年11月的臨床、病理學及影像學資料,入組研究對象共86例,將其分為復發組與無復發組。復發組35例,男性31例,女性4例,年齡34~73歲,平均年齡(50±10)歲;無復發組51例,男性35例,女性16例,年齡17~67歲,平均年齡(45±11)歲。研究對象均進行放射治療,總劑量68~70 Gy,分31~35次照射。大部分患者聯合誘導及同步化療,化療方案基于鉑類化療藥物;2例復發組患者由于自身無法耐受化療不良反應,僅進行單純放療;3例復發組及6例非復發組患者入組臨床試驗,聯合誘導化療,化療方案為順鉑+5-氟尿嘧啶+四氫葉酸+左亞葉酸鈣。
納入標準:① 臨床分期Ⅲ-Ⅳb期[國際抗癌聯盟(Union for International Cancer Control,UICC)美國癌癥聯合會(American Joint Committee on Cancer,AJCC)第7版]初診NPC患者;② 初診、放療結束時及放療后6個月均在福建省腫瘤醫院行鼻咽部MRI平掃+增強掃描;③ 復發組僅為鼻咽原發部位復發,進行鼻咽鏡組織活檢并由病理學檢查證實復發;④ 具備完整及規范的臨床診治過程。
排除標準:① 不符合納入標準任意一項者;② 初診掃描前病灶進行穿刺活檢、手術、放化療等干預措施;③ 存在影響影像觀察的明顯偽影。
采用荷蘭Philips公司的Achieva TX 3.0 T超導MRI儀。采用16通道頭頸聯合線圈,掃描范圍自顱底至胸廓入口,掃描序列包括軸位T1加權成像(T1 weighted imaging,T1WI)、T2WI-短時間反轉恢復(short time inversion recovery,STIR)、彌散加權成像(diffusion-weighted imaging,DWI)、矢狀位T1WI,以及冠狀、矢狀、軸位T1WI增強掃描序列。本研究選取了軸位T2WI-STIR及T1WI增強掃描圖像。T2WI-STIR:重復時間(repetition time,TR)為7 620 ms,回波時間(echo time,TE)為60 ms,回波鏈長度(echo chain length,ETL)為16,視野(field of view,FOV)為230 mm×260 mm,層厚/層間距=5 mm/1 mm,層數37層,掃描時間137 s。T1WI增強掃描:高壓注射器經肘靜脈注射釓噴替酸葡甲胺注射液(Gd-DTPA),劑量0.1~0.2 mmol/kg;TR為500 ms,TE為8.1 ms,ETL為5,FOV為240 mm×240 mm,層厚/層間距=5 mm/1 mm,層數37層,掃描時間為114 s。
1.3.1 圖像導出
將患者初診、放療結束時及放療后3~6個月3個時間點的T2WI-STIR及T1WI增強圖像均從影像存儲與傳輸系統(picture archiving and communication systems, PACS)導出,保存為DICOM格式,待進一步分析。
1.3.2 圖像預處理
所有圖像的處理均采用荷蘭Philips公司自主研發的Philips Radiomics Tool軟件。勾選該軟件圖像預處理選項,軟件自動完成圖像變換,其中包括圖像強度標準化及圖像灰階離散化兩個過程。
1.3.3 勾畫感興趣容積(volume of interest,VOI)和感興趣區(region of interest,ROI)
采用Philips Radiomics Tool軟件勾畫VOI,由1名住院醫師沿著腫瘤邊緣逐層手動勾畫ROI,并由1名經驗豐富的具有副主任醫師以上職稱的放射科醫師核對ROI,最終得到腫瘤的三維容積圖像(圖1)。
圖1 未復發NPC患者MRI圖像
1.3.4 圖像特征提取及降維
本研究對患者初診、放療結束時及放療后3~6個月3個時間點的T2WI-STIR及T1WI增強圖像進行了紋理特征提取。部分特征參數是基于原始圖像數據算出,如一階統計量和基于形狀特征參數,部分特征參數基于小波變換的圖像數據算出,剩余部分特征參數基于拉普拉斯變換的圖像數據算出。所有特征值先采用最大-最小值歸一化算法進行歸一標準化公式⑴。
X為未經歸一標準化的特征參數值,Xmax和Xmin分別為其最大值與最小值。
總共提取了1 227個紋理特征,隨后采用Spearman相關分析及回歸特征消除(recursive feature elimination,RFE)算法對圖像數據進行特征參數提取及降維。第一步,提取與兩組分類相關性大的特征參數。采用Spearman相關分析,分析特征參數與Label(設定復發組Label為1,無復發組Label為0)之間的相關性,篩選出相關系數大于0.2,且P<0.05的特征參數。第二步,去除冗余成分。對篩選得到的特征值通過RFE算法去除高度相關的冗余特征,最終篩選保留與Label相關性強的15個特征參數。
1.3.5 機器學習模型的建立、訓練及驗證
為避免圖像數據的過擬合,采用5折交叉驗證法訓練并驗證機器學習分類器及預測模型。將圖像數據分為5份,輪流將其中4份進行訓練,剩余的1份用于驗證,獲得模型訓練組與驗證組的混淆矩陣,5次結果的均值作為對分類器及預測模型精度的估計。繪制受試者工作特征(received operating characteristic,ROC)曲線,獲得曲線下面積(area under curve,AUC)并評估預測模型性能。
本研究的所有統計學分析均由SPSS 20.0統計軟件完成。① 符合正態分布的計量資料,平均年齡用x±s表示;② 復發組與無復發組之間的年齡差異比較,采用兩獨立樣本t檢驗;兩組臨床分期、T分期、N分期、性別及病理學類型差異比較,采用χ2檢驗或Fisher精確概率檢驗,P<0.05為差異有統計學意義;Fisher精確概率檢驗各組需要進行兩兩比較時,根據Bonferroni法調整顯著性水平(調整α=原α/比較次數),作為判斷兩兩比較的顯著性水平;③ 利用混淆矩陣驗證預測模型性能;④ 采用Python語言編寫程序對圖像數據進行分析。
進展期NPC復發組與無復發組初診的主要病理學類型為非角化型未分化癌;復發組的復發間隔時間為7~61個月,中位時間為24個月;無復發組的隨訪時間范圍為21~79個月,中位時間為52個月。復發組與無復發組性別差異有統計學意義(χ2=4.626,P<0.05);年齡、臨床分期、T分期、N分期及病理學類型兩組間差異均無統計學意義(P>0.05,表1)。
表1 NPC復發組與無復發組臨床資料
根據Bonferroni法調整顯著性水平,病理學類型調整α=0.016 7,N分期調整α=0.008 3。
2.2.1 取得線性回歸模型
提取圖像的一階統計量FirstOrder、灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度區域大小矩陣(gray level size zone matrix,GLSZM)、領域灰度差矩陣(neighboring gray tone difference matrix,NGTDM)相關的紋理特征,篩選保留15個與Label具有明顯相關性的特征參數,其中診斷效能最高的是基于放療結束時T1WI增強圖像提取的逆方差(inverse variance),其AUC為0.78,靈敏度為65%,特異度為71%(圖2)。
圖2 基于放療結束時T1WI增強圖像提取的逆方差的診斷效能圖
本研究篩選保留的15個特征參數通過Ridge Classifier分類器學習,最終得到十六元一次線性回歸模型公式⑵。
w為常數-0.621;X1~X15是歸一化之后的特征參數數值Xnormal;a~o為特征參數系數(表2);Y≥0.05表示復發,Y<0.05表示無復發。
表2 線性回歸模型中的相關數值
2.2.2 線性回歸模型預測性能評估
采用5折交叉驗證法訓練并驗證預測模型,再采用混淆矩陣評估線性回歸模型訓練組及驗證組的預測效能(圖3),得到線性回歸模型平均AUC為0.953,平均靈敏度為82.9%,平均特異度為98.0%,平均準確度為91.8%,陰性預測值0.895,陽性預測值0.967,假正類率0.020,假負類率0.171,偽發現率0.033,綜合評分0.890(圖4)。
圖3 線性回歸模型效能圖
圖4 線性回歸模型預測性能ROC曲線
NPC復發是指鼻咽原發灶及淋巴結引流區域的腫瘤經規范化治療后已完全消失,距放療結束6個月后在原發部位或相應淋巴結引流區域再次發現同類腫瘤,并經活檢或手術后病理學檢查證實[9]。本研究NPC復發組中男性的比例大于女性,進展期NPC復發中位時間為24個月,與既往研究[3-4,10]結果相符。在臨床實踐中,部分NPC患者治療后對放射線不敏感的亞群再度表現增生活躍,最終造成腫瘤復發或轉移,因此,評估量化腫瘤異質性對制訂個體化的精準治療方案十分重要。Cui等[11]和Ganeshan等[12]研究發現,紋理特征與腫瘤內部缺氧和血管生成等異質性有關。放射組學是基于影像形態、灰度、紋理分布等特征,量化分析病灶內部腫瘤細胞分布稀疏度、出血、壞死、囊變及缺氧等情況。因此,可通過影像組學評估腫瘤的異質性,進而預測NPC的局部復發。
目前采用影像組學預測NPC局部復發的研究相對較少,Li等[13]采用MRI影像組學結合機器學習模型預測放療后NPC復發能力及復發模式,結果顯示,NPC復發主要是原發灶的復發(18/20),其中人工神經網絡(artificial neural network,ANN)預測模型AUC為0.812,較其他機器學習模型具有更佳的預測能力。但是,該研究僅包括初診T2WI-精準頻率反轉恢復(spectrally adiabatic inversion recovery,SPAIR)圖像,并且樣本量較小,也未對放射組學模型進行獨立的外部驗證,具有一定的局限性。本研究選取T2WI-STIR及T1WI增強序列,同時選取初診、放療結束時及放療結束后6個月共3個時間點的MRI圖像進行分析,最終篩選提取了15個特征參數,涵蓋了GLCM、GLRLM、FirstOrder、NGTDM及GLSZM參數,其中診斷效能最高的是基于放療結束時T1WI增強圖像提取的逆方差,其AUC為0.78,靈敏度為65%,特異度為71%。逆方差表征了圖像像素的均勻程度,放療結束時病灶處纖維組織成熟度、血管形成情況、放療后水腫及炎性滲出等病理組織成分多種多樣,導致MRI信號變得更為復雜,圖像像素的均勻程度也相應發生了較大的改變。而基于特征參數建立線性回歸模型,其AUC值得到大幅度提升,達到0.953,平均靈敏度為82.9%,平均特異度為98.0%,平均準確度為91.8%。由此可見,基于多參數MRI圖像的預測模型包含了病灶橫向和縱向更多的信息,并可將圖像的特征參數進行整合,因而對進展期NPC局部復發具有良好的預測效能。
Liu等[14]研究顯示T1WI增強序列紋理特征對放化療效果的預測價值高于T2WI平掃及DWI圖像,可能是由于放療后復發灶血供豐富,動態增強后對比劑達峰時間短,灌注速度快,可以產生陡峭的動態增強上升曲線[15],從而能夠動態地呈現病灶內血液供應的變化情況,反映病灶內部是否存在充足血供、囊變、壞死等具體情況,因而相較其他非增強序列可以獲得更多的病灶內異質性信息。Wang等[16]研究顯示基于T1WI增強圖像紋理特征構建的模型預測性能較好(AUC為0.715),而整合其他序列的特征參數后構建的模型能夠提高預測性能(AUC為0.822),兩者之間的差異有統計學意義(P<0.05)。
本研究仍存在一定的局限性,在基于3個時間點的圖像信息所提取的15個特征參數中,放療結束時提取的特征參數占多數(60.0%,9/15),其原因可能是放療結束時病灶同時存在放療后損傷、炎癥與腫瘤內部異質性,該時間點病灶內部信息更為豐富,因此提取到的特征參數所占比例也較多。然而,該時間點病灶內部存在的異質性未經病理學檢查證實,所以其預測局部復發的價值是否高于其他時間點有待進一步驗證。
本研究基于MRI圖像結合機器學習算法預測進展期NPC患者的局部復發,所構建的模型具有良好的預測性能,對臨床診治及患者預后預測具有較大的參考價值。