王欣,梁劉可,蘇曉紅,李欣儀,劉露,金觀橋*
鼻咽癌是一種頭頸部的惡性腫瘤,起源于鼻咽黏膜上皮細胞,在我國南部和東南亞國家多發[1]。2020年癌癥統計顯示,全球鼻咽癌新增病例133 354人,死亡人數為80 008 人[2]。由于解剖位置的隱蔽及癥狀不明顯,約70%~80%的患者就診時已是局部晚期[3]。目前,早期鼻咽癌的治療主要通過放療或同步放化療(concurrent chemoradiotherapy,CCRT),局部晚期鼻咽癌主要治療方案是CCRT或誘導化療聯合CCRT4]。隨著調強放療技術改進及化療方案的不斷優化,鼻咽癌的預后較前不斷改善,但在CCRT后仍有約10%~20%的鼻咽癌患者出現局部復發[5]、約30%~40%的患者出現遠處轉移[6],這是導致鼻咽癌治療失敗的主要原因。因此預測患者對CCRT 的反應,在治療前對治療方案進行調整,可以避免不必要的治療和毒副作用。
影像組學被廣泛應用于預測鼻咽癌[7-8]、直腸癌[9]、肺癌[10]的CCRT反應等研究。Liu等[7]、Bulens等[9]的研究均表明MRI影像組學在預測鼻咽癌、直腸癌對CCRT的反應具有較高的準確率,因此MRI影像組學有望成為一種預測指標。鼻咽癌的成像方法具有多樣化,主要有CT、PET/CT、MRI,目前鼻咽癌的MRI 影像組學研究最熱,主要原因是鼻咽癌是一種位于鼻咽部的軟組織腫物,而MRI相比前兩者具有更好的軟組織分辨率,能更好地反映解剖與腫瘤的異質性。前人研究表明MRI 在預測鼻咽癌療效[11-12]、預后[13]、放化療后不良反應[14]、診斷[15]等各方面均有重要價值。但是,當前鼻咽癌的影像組學研究主要是采用傳統的單模態的方法,因此很難取得理想的預測性能。融合模型是將多個影像序列或醫學信息進行融合處理而建立的,能更全面反應腫瘤信息,進一步提高了預測準確性。大量研究表明,融合模型在預測療效[16]、轉移與復發[17]、疾病診斷[18]、預測組織學分型[19]、區分良惡性結節[20]等方面發揮重要作用。
目前利用融合模型來預測鼻咽癌療效的模型不多,且在新輔助化療[11-12,21]中比較多見,而融合模型預測鼻咽癌CCRT 療效的文章在國內外尚未見報道。因此,本研究旨在探究MRI的多序列模型融合(multiple sequence model fusion,MSMF)影像組學模型預測局部晚期鼻咽癌患者對CCRT的治療反應的價值。
本研究為回顧性研究,該研究方案已獲得廣西醫科大學附屬腫瘤醫院倫理委員會的批準,免除受試者知情同意,批準文號:LW2022002。回顧性分析廣西醫科大學附屬腫瘤醫院2015 年1 月至2019 年12 月的局部晚期鼻咽癌患者臨床資料。納入標準為:(1)經病理活檢確診非角化型鼻咽癌;(2)初診局部晚期(Ⅲ、Ⅳ期;分期采用第八版國際抗癌聯盟/美國癌癥聯合委員會分期手冊)鼻咽癌患者;(3)有完整的CCRT 前、后MRI 圖像[包括3 個序列,分別為T1WI、T2WI、對比增強T1 加權成像(contrast enhanced T1 weighted imaging,CE-T1WI)],MRI掃描分別在治療前1 周內、治療后2 周內完成檢查,且圖像質量好;(4)有完善的臨床信息(包括白細胞、血紅蛋白、血小板等);(5)所有患者均接受CCRT 的治療方案;(6) CCRT 治療前腫瘤體積可測量。排除標準:(1)合并其他癌癥(如乳腺癌、肝癌);(2)本次治療前有過放化療史、手術切除史的患者。
所有患者的治療方案均符合中國臨床腫瘤協會鼻咽癌診療指南。同步化療采用鉑類(順鉑100 mg/m2或洛鉑30 mg/m2)單藥同步化療,每3 周1 次,行1~3 個周期。調強放療采用6MV線性加速器,總劑量70.4~72.6 Gy,每次2.0~2.2 Gy,共照射30~33 次,每天1次,每周5次,連續6~7周。在CCRT前給予誘導化療,方案為TPF (多西他賽60 mg/m2,順鉑60 mg/m2,5-FU 600 mg/m2)、TP (多西他賽75 mg/m2,順鉑60 mg/m2)或GP(吉西他濱1000 mg/m2,順鉑80 mg/m2)方案。本研究使用的藥劑包括:順鉑注射液(江蘇豪森藥業股份有限公司,中國);洛鉑注射液(海南長沙國際制藥有限公司,中國);多西他賽注射液[賽諾菲安萬特(杭州)有限公司];吉西他濱(江蘇豪森藥業股份有限公司,中國);5-FU (上海旭東海普藥業有限公司,中國)。
兩位具有10年診斷經驗的放射科醫生(主治醫師、主任醫師)根據實體腫瘤標準(response evaluation criteria in solid tumors,RECIST 1.1[22])對CCRT后的MRI圖像進行治療反應評估,分為完全緩解(complete response,CR)、部分緩解(partial response,PR)、疾病進展(progressive disease,PD)、疾病穩定(stable disease,SD)。我們定義CR為完全反應組,PR、SD、PD為非完全反應組。意見不一致時,協商達成一致結果。圖1為鼻咽癌治療前后MRI圖像。
圖1 鼻咽癌治療前、后MRI圖像。1A、1B:男,36 歲,治療前(1A)與治療后(1B)的MRI圖像對比,治療后腫瘤消退,療效評估為完全緩解;1C、1D:男,46 歲,治療前(1C)與治療后(1D)的MRI圖像對比,治療后腫瘤不完全消退,療效評估為部分緩解。Fig. 1 MRI images of nasopharyngeal carcinoma before and after treatment. 1A, 1B:The MRI images of patient a, male, 36 years old, before treatment (1A) and after treatment(1B)were compared.After treatment,the tumor subsided and the efficacy was evaluated as complete response;1C,1D:The MRI images of patient b,male, 46 years old, before treatment (1C) and after treatment (1D) were compared. The tumor was not completely regressed after treatment, and the efficacy was evaluated as partial remission.
使用磁共振成像設備(MAGNETOM AVANTO 1.5 T,西門子,德國或者DISCOVERY MR750 3.0 T,GE,美國)及自帶頭頸組合線圈進行圖像掃描,掃描范圍從鎖骨至鞍上池上緣。掃描結束后從影像歸檔和通訊系統采集CCRT 前T1WI、T2WI、CE-T1WI 三個序列MRI 圖像,并以DICOM格式導出。1.5 T MRI掃描參數如下:T1WI:TR/TE 957 ms/19 ms,矩陣256×256;CE-T1WI:TR/TE 885 ms/19 ms,矩陣 256×256;T2WI_FS:TR/TE 6760 ms/91 ms,矩陣768×696;三種序列其余參數一致:層厚5 mm,層間距1 mm,FOV 374 mm×240 mm。3.0 T MRI掃描參數如下:T1WI:TR/TE 610 ms/12 ms;CE-T1WI:TR/TE 4748 ms/65 ms;T2WI_FS:TR/TE 682 ms/10 ms;三種序列其余參數一致:矩陣512×512,層厚5 mm,層間距1 mm,FOV=374 mm×240 mm。增強掃描前患者靜脈注射對比劑釓特酸葡胺[釓特酸葡胺注射液,國藥準字H20153167,15 mL (5.654 g,以釓特酸葡胺計),江蘇恒瑞醫藥股份有限公司,中國,劑量:0.2 mL/kg]。
由兩位具有10 年診斷經驗的放射科醫師使用ITK-SNAP軟件(版本號:3.8.0 http://www.itksnap.org)逐層勾畫治療前T1WI、T2WI、CE-T1WI三個序列的鼻咽癌腫瘤原發灶并審查,從而獲得三維容積感興趣區域(region of interest,ROI),并且兩名放射科醫生對患者臨床信息不知情,對于有歧義的區域通過討論解決。研究流程如圖2所示。
圖2 工作流程圖。T1WI:T1加權成像;T2WI:T2加權成像;CE-T1WI:對比增強T1 加權成像;ROI:感興趣區域;MCMR:最大相關最小冗余;SVM:支持向量機;MSMF:多序列模型融合。Fig. 2 Workflow chart. T1WI: T1-weighted imaging; T2WI: T2-weighted imaging; CE-T1WI: Contrast-enhanced T1-weighted imaging; ROI: Region of interest; MCMR: maximum correlation and minimum redundancy. SVM:support vector machine;MSMF:multi-sequence model fusion.
使用Matlab 2018a軟件進行特征提取,分別提取T1WI、T2WI、CE-T1WI三個序列的圖像特征。為了增強提取的放射組學特征的魯棒性和可復制性,本研究采用小波帶通濾波、各向同性重采樣、灰度離散等方法獲取各種放射組學特征。首先,在小波域下設置了5個不同的帶通子帶系數,小波相關帶通子帶系數分別定義為0.5、0.67、1.0、1.5、2.0,從而可以在不同的小波尺度下提供更多的成像特征。然后,對不同序列的MRI影像進行圖像采樣標準化[23]處理,在各向同性重采樣中,通過三次插值對ROI進行重新采樣,以獲得不同尺寸下的適當分辨率,尺寸分別設置為0.9、1、1.2、1.5 和2。最后,采用灰度離散化法獲得噪聲抑制特性,灰度級分別設置為8、16、32和64。
將數據按3∶1的比例隨機分為訓練集和驗證集。隨后對特征進行選擇,首先采用獨立樣本t檢驗方法進行特征的初步篩選,選擇具有統計學意義的特征(P<0.05)。最后,使用R 軟件通過最大相關最小冗余算法進行特征二次選擇,得到療效相關的最小冗余的影像組學特征。
首先,將篩選出的特征通過支持向量機(support vector machine,SVM)建立了臨床模型及分別基于T1WI、T2WI、CE-T1WI序列的影像組學模型等4個預測模型。相比其他類器,SVM 對于線性不可分的情況能更好地進行分類,通過線性非映射算法降低空間數據維度,將其轉化為高維度空間特征。
然后,本研究還將T1WI、T2WI、CE-T1WI輸出的模型加權融合建立MSMF模型。該模型基于各個序列建模的AUC值進行權重分配,見公式(1)。
wi表示第i個模型分配的權重,AUCi表示第i個模型的AUC,∑KL AUCk表示三個模型AUC的總和。加權融合是對單個序列模型進行線性加權并將分類結果整合[24]。最后,本研究嘗試將影像組學與臨床信息結合建模,以此得到多模態特征預測模型,將基于上述分類性能最優的MSMF模型生成輸出值作為影像組學評分(Rad-score),采用Logistic 回歸將Rad-score 和臨床信息融合進行建模建立了臨床-MSMF模型[13]。
使用MedCalc 軟件(20.106 版本,德國)繪制ROC曲線。使用SPSS 23.0 軟件(IBM SPSS Statistics 23.0,美國)進行統計學分析,分類資料用卡方檢驗進行分析,計量資料符合正態分布、非正態分布分別用t檢驗、曼-恵特尼U檢驗進行分析,雙側P值<0.05 認為差異有統計學意義。使用Matlab 2018a(9.4.0 版本)進行特征提取,使用R 軟件(4.1.2 版本,http://www.r-project.org)進行特征選擇、建模及Delong檢驗分析。
共收集154 名符合標準的鼻咽癌患者資料。按腫瘤反應評估分為完全反應組(n=83)、非完全反應組(n=71)。兩組的臨床信息在WHO 病理分型的差異有統計學意義(P<0.05),在性別、年齡、臨床分期、白細胞、血紅蛋白、淋巴細胞、單核細胞、乳酸脫氫酶、血小板、白蛋白、乙肝表面抗原定性、同期化療方案的差異均無統計學意義(表1)。
表1 完全反應組與非完全反應組的臨床特征差異Tab.1 Difference of clinical characteristics between complete response group and incomplete response group
從三個序列各提取9766 個特征,包括一階特征(n=12)、形狀特征(n=4)、灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征(n=9)、灰度大小區域矩陣(gray level size zone matrix,GLSZM)特征(n=13)、灰度游程矩陣(gray level run length matrix,GLRLM)特征(n=13)、鄰域灰度差矩陣(neighbouring gray tone difference matrix,NGTDM)特征(n=5)、小波特征。隨后,將特征通過t檢驗篩選,獲得T1WI、T2WI、CE-T1WI的特征分別為4505、3810、5481個。最后,使用R軟件二次選擇得到40個的高度相關的非冗余特征,最后將篩選出的非冗余特征用于后續的建模。
本研究在訓練集和驗證集通過SVM 及Logistic回歸分別建立了六個預測模型,各模型的ROC 曲線、AUC 值、敏感度、特異度、95%置信區間、P值如圖3、表2所示。
表2 訓練集和驗證集模型的ROC曲線Tab.2 ROC curves of training set and validation set models
圖3 訓練集(3A)和驗證集(3B)ROC 曲線。Cli、T1、T2、T1C、mix、cli_rad模型分別代表臨床、T1WI、T2WI、CE-T1WI、MSMF、臨床-MSMF 預測模型;AUC代表曲線下面積。Fig. 3 The ROC curves of the training set (3A) and the validation set(3B) respectively. Cli, T1, T2, T1C, mix and cli_rad models represent clinical, T1WI, T2WI, CE-T1WI, MSMF and clinical-MSMF predictive models,respectively;AUC represents the area under the curve.
在訓練集中,各模型的AUC 值均大于0.8,P值均小于0.05,各模型均顯示出優越的預測能力,其中MSMF 模型的預測CCRT 療效的能力最好(AUC=0.985)。在 驗 證 集 中,結 果 為 在CE-T1WI、T2WI、MSMF、臨床-MSMF、T1WI、臨床預測模型中,除T1WI、臨床預測模型的P值大于0.05,其余模型的P值均小于0.05,AUC 分別為0.842、0.711、0.896、0.867、0.633、0.542,結果表明基于T1WI、臨床信息建立的模型不能有效預測療效,其余模型均具有優良的預測能力,其中MSMF 放射組學模型的預測療效能力最好,臨床-MSMF模型次之。
最后,采用Delong 檢驗分析對驗證集中的模型進行兩兩比較(圖4),該圖是根據Delong 檢驗得出的檢驗統計量(Z值或D值)繪制的熱圖,可以看出臨床、T1WI模型分別與CE-T1WI、MSMF、臨床-MSMF預測模型及T2WI 與MSMF 模型兩兩比較的P值均<0.05,組間AUC值存在顯著差異,說明CE-T1WI、MSMF、臨床-MSMF預測模型在區分完全反應組與非完全反應組的能力明顯優于臨床、T1WI、T2WI 模型;其余組間差異對比的P值大于0.05,差異不具有統計學意義,說明其余兩兩對比的模型在預測療效方面的能力相當(如CE-T1WI vs. MSMF, MSMF vs.臨床-MSMF)。
圖4 Delong 檢驗的熱圖。圖中數值代表Delong 檢驗統計量(Z 值與D值),*代表兩組AUC 差異具有統計學意義。Cli、T1、T2、T1C、mix、cli&rad分別代表臨床、T1WI、T2WI、CE-T1WI、MSMF、臨床-MSMF預測模型。Fig 4 Heatmap of Delong's test. The values in the figure represent the Delong test statistic (Z value and D value), and the * represents that the difference in AUC between the two groups is statistically significant. Cli,T1, T2, T1C, mix and cli&rad_models represent clinical, T1WI, T2WI,CE-T1WI,MSMF and clinical-MSMF predictive models,respectively.
本研究建立了多個影像組學模型來預測局部晚期鼻咽癌對CCRT的反應,包括臨床模型、影像組學模型、臨床-影像組學模型,其中多序列融合模型(MSMF模型)具有優越的預測性能,該模型由T1WI、T2WI、CE-T1WI的模型融合建立,在訓練集和驗證集AUC值分別高達為0.985、0.896。目前基于影像組學預測局部晚期鼻咽癌療效的研究多采用單一影像序列進行建模,而不同的影像序列能從不同角度提供更多的有利信息。本研究首次使用多序列MRI后融合模型對局部晚期鼻咽癌的療效反應進行預測,且與傳統的單一序列影像組學模型相比預測效果更佳。本研究為進一步優化影像組學模型的預測性能提供了一種新方法,既能在治療前通過結合各種醫療信息更準確地預測CCRT療效,為臨床決策提供更好的參考依據,又能避免過度醫療和減少醫療費用;此外,本研究預測模型還能減少臨床上評估療效的主觀性,在預測療效方面具有客觀性、便捷性、準確性的特點。
影像組學是一種非侵入性、定量提取圖像特征的方法,可以全面地反映腫瘤的形狀、空間、異質性。國內外研究[12,23,25]表明影像組學具有預測鼻咽癌療效的重要價值。目前用影像組學預測鼻咽癌新輔助化療療效的研究眾多[11,26],而影像組學預測鼻咽癌CCRT療效的研究報道少見,因此本研究探究了MRI影像組學預測CCRT療效的價值。
本研究結果發現,在驗證集中臨床模型和影像組學模型的AUC值分別為0.542、0.633~0.896,表明了不同的模型預測準確性有差別,并且影像組學模型的預測效果均高于臨床模型。Liu等[7]研究也表明在預測鼻咽癌CCRT 的能力上CE-T1WI 模型優于T2WI模型,AUC 分別為0.952、0.904,說明CE-T1WI 序列在鼻咽癌影像組學的研究中具備較好的應用價值,但該研究AUC 值高于本研究,可能原因是研究方法不同,該研究采用了機器學習,使用了K-最近鄰、十折交叉驗證等算法,因此本研究算法還有待進一步改進。Zhao 等[11]研究結果也與本研究一致,結果表明影像組學模型、臨床結合影像組學模型準確性優于臨床模型。可能原因是影像組學能反映腫瘤內部的異質性[27],而臨床特征不具有特異性。由此可見,影像組學可作為一種早期預測鼻咽癌療效的有效指標,有助于早期干預以改善患者預后。
目前許多預測模型正朝著多模態融合[28]形式發展,融合能將多個醫學圖像或信息結合,使數據得到信息上的最大的利用及互補。研究表明了融合模型在惡性腫瘤[9,29-30]中預測CCRT 療效有重要價值,但是目前融合模型預測鼻咽癌CCRT的研究尚未見報道。
本研究將不同序列模型按AUC進行權重分配,然后通過線性加權融合得到MSMF模型,在驗證集的AUC為0.896;而單一序列T1WI、T2WI、CE-T1WI 模型在驗證集的AUC 分別為0.633、0.711、0.842,比較發現MSMF 模型的AUC 值與單一序列模型相比得到較大提升,不僅說明本研究的融合方式具有可行性,還證明了MSMF模型具有比傳統單一影像學模型更好的預測能力。既往研究也表明融合模型的優越性,Wang等[26]研究MRI紋理特征預測NPC誘導化療反應,分別建立了單獨CE-T1W模型和CE-T1WI、T2WI-FS、T2WI融合模型,AUC分別為0.715、0.822,敏感度分別為0.940、0.980,特異度分別為0.500、0.529,結果也表明融合模型預測能力比單一模型更好,說明采用融合模型能將不同序列影像的信息進行互補,進而提高模型的預測性能。同時,本研究也根據MSMF模型生成影像組學評分,并與臨床信息進行多模態融合建模,結果表明相比于單一臨床模型,臨床-影像組學融合模型(臨床-MSMF 模型)預測效果顯著提高。先前研究[12]基于MRI 放射組學諾模圖預測誘導化療的療效,結果表明結合臨床與放射組學模型比單獨的臨床模型預測能力好,AUC 分別為0.79、0.62,但本研究的臨床-MSMF模型的AUC較MSMF 模型的稍低,可能原因是本研究樣本數量少,且臨床分期只有Ⅲ、Ⅳ期,且患者的有效臨床信息較少,所以導致臨床-影像組學模型預測能力降低。
由此可見傳統影像組學模型僅通過單一序列特征或者信息來預測療效,不能全面反應腫瘤的信息,而本研究中MSMF 模型發揮各個模型的優勢,不僅整合了T1WI、CE-T1WI、T2WI反映的腫瘤的形態、解剖特征信息,還整合了CE-T1WI、T2WI反映的腫瘤的血供、含水量的情況,而腫瘤的血供、含水量往往與腫瘤的復發轉移等生物學行為密切相關[31]。綜上所述,融合模型在療效預測方面潛力巨大,在未來隨著分子標志物的發展,有望將影像、臨床、基因、蛋白等多種信息相融合進一步提高預測能力。
本研究存在一些不足,第一,本研究未進行多中心研究,模型不具有普遍適用性,可能隨著設備、醫院的不同預測能力不穩定;第二,本研究只選取了CCRT 前有可以測量腫瘤體積和Ⅲ、Ⅳ期的局部晚期的鼻咽癌患者,存在選擇偏倚;第三,樣本數量偏少,這可能導致我們的研究沒能發現統計分析中存在的顯著性差異,后續研究可增大樣本量;第四,由于鼻咽癌侵犯的范圍廣,顱底結構復雜,無法自動分割,所有ROI 通過手動分割,因此導致分割圖像具有主觀性;最后,訓練集中臨床-MSMF 存在過擬合的現象。
綜上所述,本研究驗證了MSMF 影像組學模型在預測CCRT療效方面的重要價值,但仍存在不足,后續將加大樣本量,進行多中心研究,并且探究新算法提高預測準確率及穩定性。
作者利益沖突聲明:全體作者聲明均無利益沖突。