李戟玭,張文凱,莊樂怡,孫亦華,何東,王祥
作者單位:1.蘭州大學第二臨床醫學院,蘭州 730000;2.蘭州大學第二醫院消化科,蘭州 730030
局部晚期直腸癌(locally advanced rectal cancer,LARC)被定義為T3或T4、伴或不伴淋巴結轉移、但無遠處轉移的腫瘤(T3~T4和/或N+,M0)[1-2]。目前LARC的主要治療方式是新輔助放化療(neoadjuvant chemoradiotherapy,nCRT)聯合全直腸系膜切除術(total mesorectal excision,TME)[1-4],新輔助治療有助于LARC患者實現腫瘤降期、提高保肛率、降低局部復發率,從而提高其生存率[5-6]。新輔助治療后直腸癌患者可出現不同治療反應,部分患者可出現疾病緩解,而小部分患者可能出現疾病進展[7]。LARC患者在接受nCRT后5~12周行手術治療,然后經組織病理檢查提示腫瘤完全消退被定義為病理完全緩解[8-10]。約有10%~30%直腸癌患者在接受新輔助治療后可實現完全緩解,新輔助治療后完全緩解組的患者與非完全緩解組的患者相比,局部復發率降低,生存率及預后有所改善[11-12]。有研究表明新輔助治療后達到完全緩解的患者不進行根治性手術治療,而采用嚴格的隨訪和觀察策略(watch-and-wait)是可行的,其局部無復發率、無病生存率及總體生存率與手術組相比無明顯差異[11,13-16]。由此可見,在新輔助治療后手術治療前,準確評估LARC的腫瘤反應,尤其是準確識別完全緩解有助于為患者制訂侵入性較小的個性化治療方案;并且提前預測治療效果有助于及早調整和優化治療[11]。
盆腔MRI 能清楚地顯示直腸壁各層組織及直腸周圍脂肪間隙,并且通過三維重建能將各個斷面的成像整合為一體[17]。高場強MRI 的優點是采集圖像速度快,空間分辨率和信噪比高,因此使用高場強MRI 能夠改善直腸壁的可見性[18]。基于對直腸成像的優勢,MRI 被推薦為評估直腸癌新輔助治療療效的首選檢查方法[16,19-20]。
擴散加權成像(diffusion-weighted imaging, DWI)作為一種功能MRI,以水分子在細胞內外的自由擴散為基礎,能夠反映組織內部的微環境[21]。表觀擴散系數(apparent diffusion coefficient, ADC)是評估水分子在組織內擴散的定量參數,即DWI 的定量參數,其與組織細胞密度呈負相關[22]。目前大部分研究通過測量治療前ADC 值(pretreatment ADC, pre-ADC)、治療后ADC值(posttreatment ADC, post-ADC)及治療前后ADC變化率[ΔADC=(post-ADC-pre-ADC)/pre-ADC]評估直腸癌新輔助治療后的腫瘤反應,然而ADC值在評估直腸癌新輔助治療后完全緩解的診斷價值存在爭議[23]。本文通過系統評價的方法,全面檢索已發表的文獻,評價基于ADC 診斷LARC 新輔助治療后完全緩解的臨床價值。
本研究的納入標準:(1)研究類型:國內外公開發表的關于ADC 評估LARC 新輔助治療療效的診斷性研究;(2)研究對象:明確診斷為非黏液型直腸癌的患者,患者年齡、種族不限;(3)診斷標準:ADC為待評價試驗,術后組織病理檢查為金標準;(4)測量的結局指標:合并的敏感度(sensitivity, SEN)、特異度(specificity,SPE)、陽性似然比(positive likelihood ratio, PLR)、陰性似然比(negative likelihood ratio, NLR)、診斷比值比(diagnosis odds ratios, DOR)、分層綜合受試者工作特征(hierarchical summary receiver-operating characteristic curve, HSROC)曲線下面積(area under the curve, AUC)。排除標準:(1)未報告完全緩解的研究;(2)參照診斷方法不是術后組織病理檢查結果;(3)研究數據不完整不能提取診斷數據信息:真陽性(true positive, TP)、假陽性(false positive, FP)、假陰性(false negative, FN)、真陰性(true negative, TN);(4)研究計劃書、社論等文獻類型;(5)重復的研究;(6)無法獲取全文的研究。
計算機全面檢索數據庫,包括中國知網(CNKI)、萬方數據庫(Wanfang Database)、中國生物醫學文獻數據庫(CBM)、維普數據庫、PubMed、Embase、The Cochrane Library,收集DWI診斷直腸癌新輔助治療后完全緩解的相關文獻,檢索時間均由建庫至2022 年1 月。采用自由詞檢索與主題詞檢索相結合的方法,所有檢索式均通過預檢后確定。英文檢索詞包括:“rectal cancer”“diffusion magnetic resonance imaging” “apparent diffusion coefficient”“sensitivity”和“specificity”,中文檢索詞包括:“直腸癌”“直腸腫瘤”“擴散磁共振成像”“敏感度”和“特異度”。同時對納入文章的參考文獻進行手動檢索。
將檢索的文獻導入Endnote X8,首先查找并剔除重復文獻,然后由2名研究者根據納入及排除標準獨立篩選文獻,閱讀文獻題目及摘要進行初篩,再閱讀全文篩選最終納入的文獻。如遇分歧,則討論解決。對于缺乏資料的文獻,盡量與原作者取得聯系予以補充。
采用Office Excel 2019設計資料提取表,資料提取的主要內容包括:(1)納入研究信息:第一作者、國家、發表年份、研究類型(前瞻性/回顧性研究);(2)病例特征:研究對象的年齡、數量、性別、MRI與新輔助治療的時間間隔、MRI與手術治療時間間隔;(3)診斷方法特征:ADC 類型、磁場強度、是否對病理結果盲法;(4)診斷數據信息:TP、FP、FN、TN。
由2 名研究者采用診斷準確性研究的質量評價工具修訂版(Quality Assessment of Diagnostic Accuracy Studies-2, QUADAS-2)對納入研究進行偏倚風險評價[24],并交叉核對,意見不一致時通過討論解決,討論未果則由第3名研究人員協助判斷。主要評價內容包括4個領域:病例的選擇、待評價試驗、金標準、病例流程和時間。所有組成部分在偏倚風險方面都會被評估,前3部分也會在臨床適用性方面被評估。每一條標準以“是”(低度偏倚或適用性好)、“否”(高度偏倚或適用性差)和“不清楚”(缺乏相關信息或偏倚情況不確定)評價。
首先對納入研究進行閾值效應檢驗,采用Spearman相關系數判斷閾值效應,若P<0.05存在閾值效應,若P>0.05則不存在閾值效應。排除閾值效應后進行Cochran-Q檢驗并且計算I2值,若Cochran-Q檢驗的P<0.05或I2>50%,表明研究間的異質性由非閾值效應所致的可能性較大,分析異質性來源,按照可能產生異質性的因素進行Meta 回歸分析。使用Stata 15.0軟件合并效應量,本研究采用雙變量混合效應模型,基于“midas”命令計算合并的SEN、SPE、PLR、NLR、DOR,并繪制HSROC曲線,計算AUC。根據AUC值評價診斷方法的價值,當AUC為0.7~0.9時表示診斷方法準確性中等,當AUC>0.9時表示其診斷準確性較高。最后使用Stata 15.0 繪制Deek's 漏斗圖(Deek's funnel plot asymmetry test)檢測是否存在發表偏倚。
計算機檢索共獲得文獻1496 篇,導入Endnote X8 軟件篩除重復文獻442 篇,通過閱讀剩余1054 篇文獻的題目和摘要后獲得可能相關文獻77 篇,進一步閱讀全文最終納入34 個診斷試驗[22,25-57]。文獻篩選流程及結果見圖1。
圖1 文獻篩選流程圖。Fig.1 Flow diagram of the literature selection for the meta-analysis.
2.2.1 納入文獻基本特征
納入文獻基本特征見表1,共納入34篇文獻,共納入LARC 患者1914 例,其中達到完全緩解的患者有758例。納入文獻中有5篇中文文獻,29篇英文文獻;18篇回顧性研究,16篇前瞻性研究。納入文獻的ADC類型主要包括pre-ADC、post-ADC 及ΔADC。納入文獻中有7篇文獻未提及對病理結果是否進行盲法,但所有納入研究均以術后組織病理結果為金標準。2篇研究未報告新輔助治療后的MRI與治療結束間隔時間,7篇研究未報告治療后的MRI與外科手術具體間隔時間。
表1 納入文獻基本特征Tab.1 Characteristics of included studies
2.2.2 納入文獻質量學評價
納入文獻質量學評價結果見圖2。偏倚風險評價方面,納入文獻中共有2 篇被評價為高偏倚風險,其余為低風險或不清楚風險。臨床適用性方面,所有研究在病例選擇、待評價診斷試驗及金標準領域均不存在臨床不適用性。
圖2 納入文獻質量學評價結果。Fig.2 The methodological quality of included studies.
2.3.1 新輔助治療前ADC值定量分析結果
共有23篇文獻對完全緩解組及非完全緩解組的新輔助治療前ADC值進行了比較(圖3A),完全緩解組的pre-ADC 平 均值是0.931×10-3mm2/s,非 完全緩解組的平均值是0.995×10-3mm2/s。進行Meta 分析得出完全緩解組與非完全緩解組pre-ADC 值相差-0.06×10-3mm2/s(95%CI:-0.10×10-3mm2/s~-0.02×10-3mm2/s,P<0.001)。
2.3.2 新輔助治療后ADC值定量分析結果
共納入25 篇文獻、26 組數據比較了完全緩解組及非完全緩解組post-ADC 值的差異(圖3B),完全緩解組的post-ADC 平均值是1.434×10-3mm2/s,非完全緩解組的post-ADC 平均值是1.266×10-3mm2/s。進行Meta 分析得出完全緩解組與非完全緩解組post-ADC 值相差0.17×10-3mm2/s(95%CI:0.12×10-3mm2/s~0.23×10-3mm2/s,P<0.001)。
2.3.3 新輔助治療前后ΔADC定量分析結果
共納入17篇文獻對完全緩解組及非完全緩解組治療前后ΔADC進行了比較(圖3C),完全緩解組ΔADC平均值是56.07%,非完全緩解組ΔADC 平均值是28.62%,兩組之間的差異是23.55%(95%CI:17.25%~29.84%,P<0.001)。
圖3 完全緩解組與非完全緩解組pre-ADC(3A)、post-ADC(3B)、ΔADC(3C)比較結果。Fig. 3 Forest plot regarding difference in pre-ADC (3A), post-ADC (3B) and ΔADC (3C) values between patients with complete response and those with incomplete response.
2.4.1 治療前ADC值的診斷價值
有15 篇文獻對pre-ADC 的診斷價值進行了研究。Spearman 相關系數為0.141,P=0.616,故研究間不存在閾值效應;Meta 分析顯示I2=89%,P<0.001,考慮納入研究間存在非閾值效應導致的異質性。對納入文獻進行合并效應量,結果如圖4A 所示,pre-ADC 診斷完全緩解的SEN合并是0.76(95%CI:0.62~0.86),SPE合并是0.68(95%CI:0.60~0.75),PLR合并是2.4(95%CI:1.8~3.0),NLR合并是0.35(95%CI:0.22~0.57),DOR合并是6.70(95%CI:3.49~12.83)。繪制Deek's 漏斗圖(圖5A)得出斜率系數P=0.35,提示不存在發表偏倚。擬合HSROC 曲線,AUC=0.77(95%CI:0.73~0.80)(圖6)。
圖4 pre-ADC(4A)、post-ADC(4B)、ΔADC(4C)診斷完全緩解的敏感度(左)及特異度森林圖(右)。Fig.4 Forest plot of sensitivity and specificity of pre-ADC(4A),post-ADC(4B)and ΔADC(4C).
圖5 pre-ADC(5A)、post-ADC(5B)、ΔADC(5C)的Deek's漏斗圖。 圖6 不同類型ADC診斷完全緩解的HSROC曲線。Fig. 5 Publication bias of pre-ADC (5A), post-ADC (5B), ΔADC (5C) using Deek's test funnel plot. Fig. 6 Summary hierarchical summary receiver operating characteristic for different ADC.
2.4.2 治療后ADC的診斷價值
通過21 篇文獻、23 組數據分析post-ADC 的診斷價值,Spearman 相關系數為0.216,P=0.322,得出研究間不存在閾值效應;Meta 分析I2=93%,P<0.001,提示研究間存在非閾值效應導致的異質性。合并效應量結果顯示(圖4B)post-ADC 診斷完全緩解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分 別 為0.82(95%CI:0.72~0.88)、0.77(95%CI:0.71~0.82)、3.5(95%CI:2.8~4.5)、0.24(95%CI:0.16~0.37)、14.59(95%CI:8.25~25.80)。繪制Deek's 漏斗圖(圖5B)提示不存在發表偏倚(P=0.13)。繪制HSROC 曲線(圖6),得出AUC=0.86(95%CI:0.82~0.88)。
2.4.3 ΔADC值的診斷價值
有18 篇文獻研究了ΔADC 的診斷價值,Spearman相關系數為0.411,P=0.090,故不存在閾值效應;Meta 分析I2=85%,P=0.001,考慮研究間存在非閾值效應的異質性。合并效應量(圖4C)結果顯示ΔADC診斷完全緩解的SEN合并、SPE合并、PLR合并、NLR合并和DOR合并分別為0.83(95%CI:0.77~0.87)、0.75(95%CI:0.67~0.81)、3.3(95%CI:2.5~4.3)、0.23(95%CI:0.17~0.30)、14.37(95%CI:9.32~22.15)。繪制Deek's 漏斗圖(圖5C)顯示傾斜系數P=0.05,提示存在發表偏倚的可能性小。繪制HSROC 曲線(圖6),得出AUC=0.86(95%CI:0.83~0.89)。
2.4.4 Meta回歸分析結果
根據納入文獻的研究類型、磁場強度類型、再評估MRI 與新輔助治療時間間隔、再評估MRI 與手術時間間隔、病理結果的盲法對納入文獻進行Meta 回歸分析,發現再評估MRI與手術時間間隔可能造成治療后ADC 研究間的異質性(P<0.05),其他變量P值均大于0.05,不考慮為研究間異質性來源。
本研究使用Meta 分析的方法,系統評價了ADC對LARC新輔助治療后完全緩解的診斷價值。首先對pre-ADC 值、post-ADC 值及ΔADC 值定量分析的研究進行Meta 分析,得出完全緩解組的pre-ADC 平均值顯著低于非完全緩解組(-0.06×10-3mm2/s),post-ADC 及ΔADC 高于非完全緩解組(差值分別為0.17×10-3mm2/s、28.62%)。然后對診斷價值進行了Meta分析,得出新輔助治療前ADC值的診斷價值最低,治療后ADC值及ΔADC的診斷價值相當,三者的AUC分別是:pre-ADC為0.77、post-ADC為0.86、ΔADC為0.86。
DWI 通過細胞內外水分子的隨機布朗運動反映組織內部的微環境。水分子在生物組織中的擴散速率取決于多種因素,包括組織溫度、組織細胞密度、細胞外組織情況、細胞膜的完整性和液體的黏度[58]。研究顯示使用DWI 評估LARC nCRT 后是否達完全緩解的準確性優于常規MRI[59-60]。ADC 是評估水分子在組織內擴散的定量參數,ADC 值與組織細胞密度呈負相關[22],腫瘤細胞限制水分子的擴散,隨著腫瘤生長,腫瘤細胞密度增大,并且細胞外組織結構被破壞,導致ADC 值下降[61]。本研究對新輔助治療前后ADC 及ΔADC 的定量分析研究進行Meta 分析,結果顯示完全緩解組的pre-ADC平均值明顯低于非完全緩解組(差值為-0.06×10-3mm2/s),這與許多研究的結果一致[22,32,34],考慮可能是因為在非完全緩解組中存在較多腫瘤壞死組織。組織壞死導致組織灌注差,氧氣濃度低以及組織微環境呈酸中毒,從而使腫瘤抵抗放化療,導致新輔助治療效果差[62],因此在新輔助治療前進行MRI 檢查并測定腫瘤的ADC 值有助于明確腫瘤特征,預測腫瘤對新輔助治療的反應,從而確定初始治療方案,盡早予以個體化治療。另外,本研究結果顯示完全緩解組的post-ADC 平均值及ΔADC 顯著高于非完全緩解組,可見新輔助治療后完全緩解組的ADC值增加程度大于非完全緩解組,放化療可誘導腫瘤細胞凋亡和壞死、腫瘤結構完全性喪失,并伴有不同程度的纖維化和炎癥;此外血管內皮生長因子大量釋放,使血管通透性增加,導致原發病灶局部水腫,因此新輔助治療后ADC 值增加[22,32]。ADC 值增加程度越大說明新輔助治療療效越好,實現完全緩解的可能性越大。在診斷價值方面,新輔助治療前ADC值的診斷價值最低,治療后ADC值及ΔADC的診斷價值相當,三者的AUC 分別是:pre-ADC 為0.77、post-ADC為0.86、ΔADC為0.86。但是Amodeo等[63]研究表明post-ADC 的診斷準確性較ΔADC 值低,原因可能是post-ADC 不能準確區分殘留的腫瘤細胞和治療后的纖維化。同樣,Delli Pizzi 等[32]及Chen 等[64]研究表明ΔADC 相比于pre-ADC、post-ADC 可作為診斷完全緩解的可靠指標。ΔADC 是根據pre-ADC 和post-ADC得出,同時考慮了pre-ADC 和post-ADC 的變化程度。綜上,在臨床實踐中可使用治療前ADC值預測腫瘤對新輔助治療的反應,而在評估新輔助治療后腫瘤是否達到完全緩解時推薦使用ΔADC。
本研究對可能導致異質性的因素進行Meta回歸分析,發現MRI與手術間隔時間可能為研究間異質性來源。新輔助治療后MRI 評價腫瘤反應的最佳時機取決于新輔助治療后的手術時機,新輔助治療對腫瘤的殺傷效應隨時間推移而增加[20]。Probst 等[65]研究表明新輔助治療結束至手術間隔時間大于8 周可提高完全緩解率;而另有研究表明延遲手術并未使患者獲益[66-69]。目前國內指南推薦新輔助治療結束5~7周后行手術治療[70],但關于最佳MRI檢查時機仍缺乏共識,有待進一步研究。
本研究對ADC 診斷LARC 新輔助治療后完全緩解的相關文獻進行了全面檢索,納入文獻較全面,納入研究對象均為LARC 并行nCRT 的患者,本文首先排除研究間的閾值效應,然后計算合并診斷指標,研究結果更加可靠。但本研究存在以下局限性:(1)本文納入的少數研究質量不高,這可能影響整體研究結論的可靠性;(2)本文從研究類型、磁場強度、不同間隔時間以及結果盲法方面進行了研究間異質性分析,但是尚有其他一些因素也可導致研究間異質性,如檢查前是否進行腸道準備、MRI 掃描層厚、檢查結果判讀者的經驗差異等。
綜上所述,本研究得出新輔助治療前ADC值有助于預測腫瘤治療反應,而新輔助治療后ADC值及治療前后ADC變化率的診斷準確性更高。
作者利益沖突聲明:全體作者均聲明無利益沖突。