徐琦德,崔旻,王海昆,姚萍
(新疆醫科大學第一附屬醫院 消化病一科,新疆 烏魯木齊 830011)
胃食管反流病(gastroesophageal reflux disease,GERD)指:因食管下段結構異常或功能退化,導致胃或十二指腸內容物反流至食管所引起的疾病[1]。燒心和反流是該病的典型癥狀[2]。GERD 的治療分為藥物抑酸治療和手術治療。手術治療又包括腹腔鏡下治療和內鏡下治療。抑酸治療主要以口服質子泵抑制劑(proton pump inhibitor,PPI)為主。但部分患者抑酸治療效果欠佳[3],并且長期服用PPI 會影響營養物質的吸收,增加社區獲得性肺炎和小腸菌群過度繁殖的風險[4]。腹腔鏡下治療主要以腹腔鏡下胃底折疊術為主,但其創傷較大,且存在較多的不良反應,如:腹脹綜合征、吞咽困難、腹瀉和反復反流等[5],臨床上已逐漸減少使用。因此,內鏡下治療成為了研究重點。內鏡下治療方式主要包括:射頻消融術(radiofrequency ablation,RF)、經口無切口胃底折疊術(transoral incisionless fundoplication,TIF)和抗反流黏膜切除術(anti-reflux mucosectomy,ARMS)。RF 的原理是:應用相關設備,在食管下括約肌(lower esophageal sphinter,LES)或賁門處釋放電流,造成局部肌肉組織纖維化、攣縮,通過LES的壓力增加及胃食管交界處(esophagogastric junction,EGJ)順應性的減弱,來起到抗反流的作用。TIF 的原理是:通過將胃底翻折并固定,使His角更加銳利,并形成一個抗反流瓣膜,以加強食管抗反流屏障。ARMS 的原理是:切除部分賁門或EGJ 的黏膜組織,通過手術部位瘢痕組織的不斷增生、攣縮,來達到抗反流的作用。3種內鏡下治療方式在臨床上都處于探索階段,但哪種方式最好仍存在爭議。本文擬通過網狀Meta分析的方法,比較RF、TIF和ARMS的臨床療效,以期為臨床治療GERD 提供可靠的循證醫學依據。
1.1.1 檢索者 由第二作者和第三作者分別按照關鍵詞進行獨立文獻檢索。
1.1.2 資料庫 中文數據庫包括:中國知網(CNKI)、中國生物醫學文獻數據庫(CBM)、維普(VIP)和萬方數據(Wanfang data);英文數據庫包括:Cochrane圖書館、PubMed、Embase和Medline。
1.1.3 檢索詞 中文檢索詞:射頻消融術、經口無切口胃底折疊術、抗反流黏膜切除術、胃食管反流病和隨機等;英文檢索詞:gastroesophageal reflux、transoral incisionless fundoplication、radiofrequency ablation、anti-reflux mucosectomy、randomized 和randomized controlled trials等。
1.1.4 檢索時間 自建庫至2021年12月1日。
1.2.1 納入標準 ①研究類型:為隨機對照試驗(randomized controlled trial,RCT),不限制語言;②研究對象:臨床確診為GERD的成年患者,且符合里昂共識[6]或反流性食管炎診斷標準[7],無人種、年齡、性別、工作和病程等限制;③干預措施:對照組為單純PPI 治療或假手術(Sham)治療;實驗組為RF、TIF 和ARMS 中的任意1 種內鏡下治療方案;④結局指標:停止服藥人數、pH <4.2的酸反流時間、食管下段壓力和健康相關生活質量(health-related quality of life,HRQL)評分等指標,且數據完整。
1.2.2 排除標準 ①重復發表的文獻;②病例報道、會議記錄、動物性研究、綜述及Meta 分析;③簡單的描述性文獻、結果不明確的文獻、數據不完整的文獻、使用其他治療方法的文獻和兒科相關文獻;④實驗設計不符合研究要求的文獻[4]。
將各數據庫檢索題錄導入EndNote X9 軟件,根據排除標準進行文獻篩選。建立新的文件庫并下載全文。由兩位研究人員獨立進行評估及篩選,當有沖突時,邀請另一名參與者討論,根據預先確定的表格提取數據。提取內容包括:第一作者、發表年份、病例數、治療措施、隨訪時間及結局指標。研究人員交叉核對和審查數據。
依據5.1 版Cochrane 系統評價手冊給出的質量評價表格,完成對納入文獻方法學上的質量評價[8]。評價項目包括:①是否隨機;②是否隱藏分配;③是否采用盲法;④結局數據是否完整;⑤是否選擇性報告;⑥是否有脫落病歷;⑦是否有其他偏倚。每個項目分為3 個風險等級:高風險、低風險和不確定性風險。根據納入文獻中對上述7 個方面的描述,研究者對納入文獻進行解讀和評價。5 個及以上項目評價為低風險,則判定納入的文獻為高質量文獻。
①主要觀察指標:停止服藥人數;②次要觀察指標:pH <4.2 的酸反流時間、食管下段壓力及HRQL評分。
運用RevMan 5.4軟件對納入的文獻進行風險偏倚評價。運用Stata 19.0 軟件對數據進行匯總分析,針對各指標繪制網絡關系圖,依據發表偏倚繪制比較-校正漏斗圖進行檢驗,同時針對閉合環狀數據,進行非一致性檢驗判定結果的可靠性。使用ADDIS 16.6軟件,應用貝葉斯法(采用4條鏈進行仿真分析,初始值為2.5,迭代步長為10,迭代次數調整為20 000次,模擬迭代次數為50 000 次),對收集的數據結果進行評估和處理分析,完成網狀Meta 分析及概率排序。二分類資料采用比值比(odds ratio,O)作為統計量,連續性資料用均數差(mean difference,MD)作為統計量。用P<0.05及95%可信區間(confidence interval,CI)作為差異標準,若O值的95%CI不包括1,或者MD值的95%CI不包括0,則認為差異具有統計學意義。CochraneQ檢驗進行異質性分析,I2<50%表示異質性較低,反之異質性較高。潛在尺度縮減因子(potential scale reduced factor,PSRF)反映了收斂性。如果PSRF 接近1 或等于1,則表明收斂效率較好[9-10],模型所得的結果可信度較高。
首次檢索文獻共2 550 篇,完成多次篩選后,最終納入16 項RCT[9-24],總計950 例患者。見圖1和表1。

表1 納入研究的基本特征Table 1 Basic characteristics of the included studies

圖1 文獻篩選流程圖Fig.1 Flow chart of studies selection
在16 篇RCT 中,11 篇文獻為高質量文獻,其他5篇文獻為低質量文獻。3篇研究[9-11]為RF對比Sham,3 篇研究[12-14]為RF 對比PPI,5 篇研究[15-19]為ARMS對比PPI,5篇研究[20-24]為TIF對比PPI或Sham(3篇[20,23-24]為雙臂研究,2 篇[21-22]為三臂研究)。7篇[9,11-12,15,18,20,23]使用雙盲,其他研究未具體說明。所有研究的數據完整,無選擇性報告及其他偏倚情況。質量評價見圖2。

圖2 納入研究的風險偏倚圖Fig.2 Plot of risk bias for included studies
各治療方法直接Meta分析結果見表2。

表2 各治療方式間直接比較的Meta分析Table 2 Meta-analysis of direct comparison among treatment methods
2.3.1 停止服藥人數 共存在RF 對比PPI、RF 對比Sham、TIF對比PPI及ARMS對比PPI的4種直接比較類型。TIF優于PPI的治療效果,但P>0.05,提示:差異無統計意義,且I2=83.2%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。RF優于PPI的治療效果(P=0.009),且I2=0.0%,提示:異質性較低。RF 優于Sham 的治療效果(P=0.001),且I2=0.0%,提示:異質性較低。ARMS優于PPI的治療效果(P=0.035),且I2=0.0%,提示:異質性較低。
2.3.2 pH <4.2 的酸反流時間 共存在RF 對比PPI、RF 對比Sham、TIF 對比PPI、TIF 對比Sham 及ARMS 對比PPI 的5 種直接比較類型。ARMS 優于PPI的治療效果(P=0.030),但I2=85.9%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。RF弱于PPI 的治療效果,但P=0.060,提示:差異無統計學意義,I2=0.0%,提示:異質性較低。RF 優于Sham 的治療效果(P=0.001),且I2=0.0%,提示:異質性較低。TIF弱于PPI的治療效果,但P=0.320,提示:差異無統計學意義,I2=0.0%,提示:異質性較低。TIF 優于Sham 的治療效果(P=0.001),且I2=0.0%,提示:異質性較低。
2.3.3 食管下段壓力 共存在RF 對比PPI、RF 對比Sham、TIF 對比PPI、TIF 對比Sham 及ARMS 對比PPI 的5種直接比較類型。RF 優于Sham 的治療效果,但P>0.05,提示差異無統計意義,且I2=87.8%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。ARMS 優于PPI 的治療效果,但P>0.05,提示:差異無統計意義,納入文獻1 篇,異質性無法求得。RF 優于PPI 的治療效果(P=0.040),且I2=0.0%,提示:異質性較低。TIF 優于PPI 的治療效果(P=0.010),且I2=42.5%,提示:異質性較低。TIF優于Sham的治療效果(P=0.020),且I2=0.0%,提示:異質性較低。
2.3.4 HRQL 評分共存在RF對比PPI、RF 對比Sham、TIF 對比PPI、TIF 對比Sham 及ARMS 對比PPI的5 種直接比較類型。TIF 優于PPI 的治療效果(P=0.045),但I2=69.4%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。TIF 優于Sham的治療效果(P=0.001),但I2=78.3%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。ARMS優于PPI 的治療效果(P=0.001),但I2=60.2%,表明存在明顯異質性,通過逐個剔除單個研究進行敏感性分析,結果未發生明顯改變,提示:結果穩定性較強。RF 優于PPI 的治療效果(P=0.020),但納入文獻1篇,異質性無法求得。RF優于Sham的治療效果(P=0.011),且I2=0.6%,提示:異質性較低。
2.4.1 網絡證據關系 文章共涉及5 種干預措施。停止服藥方面,共納入8 篇文獻。pH <4.2 的酸反流時間方面,共納入9篇文獻,存在由PPI、RF、Sham及TIF 組成的閉合環。食管下段壓力方面,共納入7篇文獻,存在由PPI、RF、Sham 及TIF 組成的閉合環。HRQL評分方面,共納入10篇文獻,存在由PPI、RF、Sham 及TIF 組成的閉合環。各個結局的網絡關系圖中,對于每組比較,連接線段的寬度與納入文獻的數量成正比并指示直接比較,節點的大小與樣本量的大小成正比。見圖3。

圖3 網狀Meta分析網絡證據圖Fig.3 Mesh Meta-analysis network evidence map
2.4.2 一致性檢驗 針對4 種研究指標收集數據,進行一致性及非一致性模型分析,分別得出隨機效應標準差。在兩種模型下,該指標結果大致一致且PSRF=1,表示數據擬合較好,故采用一致性模型分析。見表3。

表3 納入文獻的一致性檢驗Table 3 Consistency detection of included studies
2.4.3 非一致性檢驗 對各個結局指標中的各個閉合環進行非一致性檢驗。在pH <4.2的酸反流時間方面,對PPI-RF-Sham-TIF 閉合環進行非一致性檢驗,結果顯示:95%CI 為0.00~4.15,包含0,提示數據不存在非一致性且結果穩定可靠。在食管下段壓力方面,對PPI-RF-Sham-TIF 閉合環進行非一致性檢驗,結果顯示:95%CI 為0.00~4.92,包含0,提示數據不存在非一致性且結果穩定可靠。在HRQL評分方面,對PPI-RF-Sham-TIF 閉合環進行非一致性檢驗,結果顯示:95%CI 為0.00~14.20,包含0,提示數據不存在非一致性且結果穩定可靠。見圖4。

圖4 非一致性檢驗證據圖Fig.4 Evidence diagram of non conformance inspection
2.4.4 納入研究各指標網狀Meta 分析結果①在停止服藥人數方面,TIF與RF比較,差異無統計學意義(95%CI跨過1),余均顯示:差異有統計學意義;②在pH <4.2的酸反流時間方面,TIF與RF、RF與PPI 比較,差異均無統計學意義(95%CI 跨過0),余均顯示:差異有統計學意義;③在食管下段壓力方面,TIF 與ARMS、TIF 與RF、ARMS 與PPI 比較,差異均無統計學意義(95%CI跨過0),余均顯示:差異有統計學意義;④在HRQL評分方面,TIF與RF、RF與PPI 比較,差異均無統計學意義(95%CI 跨過0),余均顯示:差異有統計學意義。見表4。

表4 網狀Meta分析結果Table 4 Network Meta-analysis results
2.4.5 納入研究各結果指標的網狀Meta 分析排序結果 ①在停止服藥人數方面,其臨床療效順序依次為ARMS、RF 和TIF,秩序概率分別為1.00、0.95 和0.46,表明:在3 種內鏡下治療方法中,ARMS 最有可能使患者停止服藥;②在pH <4.2 的酸反流時間方面,其臨床療效順序依次為ARMS、RF 和TIF,秩序概率分別為1.00、0.33 和0.15,表明:在3 種內鏡下治療方法中,ARMS 對減少酸反流時間最有效;③在控制食管下段壓力方面,其臨床療效順序依次為ARMS、TIF 和RF,秩序概率分別為0.98、0.94 和0.80,表明:在3 種內鏡下治療方法中,ARMS 對增加食管下段壓力最有效;④在HRQL 評分方面,其臨床療效順序依次為ARMS、TIF 和RF,秩序概率分別為0.98、0.94 和0.80,表明:在3 種內鏡下治療方法中,ARMS對減少HRQL評分最有效。見表5和見圖5。

圖5 不同結局指標的概率排序Fig.5 Probability ranking of different outcome indicators

表5 概率最佳排序(Rank 1結果)Table 5 Probability best ranking(Rank 1 results)
針對4 個結局指標所納入的文獻繪制比較-校正漏斗圖。漏斗圖中相同顏色點,代表相同的直接比較研究。若漏斗圖發現明顯不對稱,表明發表偏倚或小樣本效應較大。①在停止服藥人數方面,漏斗圖分布較對稱,提示:存在的發表偏倚或者小樣本效應較小;②在pH <4.2 的酸反流時間方面,漏斗圖較為對稱,但PPI 治療與ARMS 治療的研究分布較遠,提示:可能存在發表偏倚或者小樣本效應,而其他研究存在較小的發表偏倚或者小樣本效應;③在控制食管下段壓力方面,漏斗圖較為對稱,但PPI 治療與TIF 治療的研究分布較遠,提示:可能存在發表偏倚或者小樣本效應,而其他的研究存在較小的發表偏倚或者小樣本效應;④在HRQL評分方面,漏斗圖分布較為對稱,但PPI 治療與TIF 治療的研究分布較遠,提示:可能存在發表偏倚或者小樣本效應,而其他的研究存在較小的發表偏倚或者小樣本效應。見圖6。

圖6 各手術方式發表偏倚分析Fig.6 Analysis of publication bias of various surgical methods
GERD 是消化系統的常見疾病。抗反流屏障和(或)食管防御功能低下是引起GERD 患者燒心、反酸等不適癥狀及黏膜組織損傷的主要病因[25]。治療原則主要包括:減少胃酸分泌、加強抗反流屏障和預防食管外癥狀(如慢性咳嗽和非心源性胸痛等)。雖然PPI 被推薦作為GERD 的一線藥物,但仍有某種程度的局限性,如:總有效率低和停藥后易復發等。因此,GERD的內鏡下治療逐漸在臨床中得到重視。
3.2.1 ARMS 目前,臨床上有多種內鏡下治療方式。本研究針對常用的3 種內鏡下治療GERD 的方法,從4 個方面進行了綜合分析,結果發現:ARMS效果最優。ARMS的原理是:通過部分或完全切除食管下段或賁門處的黏膜組織,在相對狹窄的食管末端中形成瘢痕,以此起到抑制反流的作用[26]。但是其缺點也隨之顯現,例如:一項納入10 例患者的研究[27]中,術中患者均無嚴重并發癥(出血或穿孔)發生,在后期隨訪中,24 h 食管pH 檢測項目也均提示pH <4.2 的時間較前縮短,但是仍有2 例患者術后出現吞咽困難,需反復行球囊擴張以解除狹窄,這無疑給患者帶來了痛苦。另一方面,由于操作空間較小,ARMS 對操作者的技術要求相對較高,培訓周期也較長。
3.2.2 TIF 在控制食管下段壓力及改善HRQL評分方面,TIF 為第2 位。其原理為:將EGJ 處折疊,使His 角的角度更加銳利,同時形成抗反流瓣,從而達到抑制反流的目的[28]。一項納入66 名患者的研究[29]中,TIF 組在HRQL 評分和食管下段壓力增加方面,均優于PPI 組,且在第6 和12 個月時對TIF 組進行隨訪,分別有66.0%和39.0%的患者完全停止使用PPI,但遠端食管酸暴露沒有明顯改善,分別只有44.0%和29.0%的患者實現了pH 正常化。有研究[30]表明,TIF手術發生重大不良事件較少,安全性也較高。
3.2.3 RF 在停止服藥人數和控制酸反流時間方面,RF 為第2 位。其原理是:通過點陣式的電流釋放,造成食管下段的神經肌肉組織凝固壞死,通過后期纖維增生達到抗反流的作用[31]。RF 技術成熟,且對操作者技術要求相對較低,其治療總體安全性較高,并發癥也多為一過性輕微癥狀(如胸痛和咳嗽等),無需特殊干預。一項納入2 468 名患者的Meta分析[32]表明,該手術安全性、耐受性及有效性均較高。
除上述3種治療方法外,內鏡下硬化劑注射術經過多次迭代,也顯示出較好的療效。目前,主要的注射劑為Durasphere材料,其本質是碳涂層的石墨微球混懸液。一項納入12例患者的研究[33]顯示,6例患者完成內鏡下硬化劑注射后,PPI 用量減少50.0%,相關評分也均有改善。但是該操作有誤傷臨近器官的風險,目前仍不被積極推廣。
MUSE手術原理是:在影像系統輔助下,吻合系統將胃上部釘合至食管下段,通過加強瓣閥,加銳His 角,從而起到抗反流的作用[34]。一項納入65 例GERD 患者的研究[35]中,所有患者使用MUSE 手術治療,有48 例患者PPI 藥物減量50.0%以上,HRQL 評分也較前改善,在之后的隨訪中統計,可停用PPI藥物的患者合計有42 例,剩余的23 例患者中,藥物劑量減半的合計有13例。
本研究廣泛檢索了相關文獻,并對數據完成了綜合分析。研究結果對臨床醫師選擇何種內鏡手術方式治療GERD時,有一定的參考價值。但尚存在一些不足:①納入的相關文獻較少,且個別文獻納入病例數較少,一致性檢驗及偏倚分析均提示僅存在較小的差異及偏倚;②納入文獻的語言類型只包括少數國家,可能存在地區及人種限制,語言類型不夠全面;③納入文獻的隨訪時間較短,尚需要補充長期隨訪實驗數據,來論證長期治療效果;④某些研究中沒有提及分配隱瞞、偏倚風險和隨訪結果,最終會影響研究結果的真實性。
綜上所述,在選擇內鏡下手術治療GERD時,為提高臨床總有效率,應首選ARMS。但本研究存在一定的局限,為確保研究結果的可靠性,仍需今后納入更嚴格的大樣本、多中心和雙盲RCT來佐證。