田琨宇,戴儉宇,宋芷琪,周柳新
(1.遼寧中醫藥大學,遼寧沈陽 110847;2.遼寧中醫藥大學針灸推拿學院,遼寧沈陽 110847)
強直性脊柱炎(ankylosing spondylitis,AS)是一種侵犯中軸關節并使其受累的自身免疫性疾病,以骶髂關節和脊柱附著點的慢性炎癥為主要癥狀。隨著病情的發展,將加重脊柱強直程度并出現纖維化組織[1],進而導致不同程度的骨骼、肌肉、眼、肺等病變[2]。AS的發病率為0.09%~0.3%,男性發病率偏高,且大約80%的患者會在30歲之前出現首發癥狀[3]。目前西醫治療雖在控制AS炎癥方面療效顯著,但其不良反應較大,且不能緩解關節損傷的進展[4],因此探尋可靠的補充替代療法是極為重要的。
針灸療法具有療效顯著、適應癥廣等優點,在治療AS方面有著豐富的經驗。隨著循證醫學的高速發展,目前國內外對于針灸治療AS已開展了大量的臨床隨機對照試驗(randomized controlled trial,RCT),但療效證據參差不齊,一定程度上影響了研究者的決策。基于以上現狀,本研究使用系統評價再次評價,對當前針灸治療AS系統評價的方法學與證據質量進行評價,從而提供更高質量的證據,以達到優化臨床治療計劃的目的。
1.1.1 納入標準(1)研究類型:針灸治療AS的RCT的系統評價,文獻語種限定為中文或英文。(2)研究對象:被明確診斷為AS的患者,診斷標準參照在1984年修訂的美國紐約AS分類標準[5]。患者性別、年齡、病程、國籍不予限制。(3)干預措施:治療組選取針灸治療或針灸聯合常規治療方法,包括針刺、艾灸、針刀、溫針、蜂針、穴位埋線等針灸療法;對照組選擇的治療方法均為非針灸療法,如使用中藥、西藥或中成藥的藥物療法、安慰療法、康復治療等。(4)主要結局指標:有效率、BATH強直性脊柱炎病情活動指標(BASDAI)、BATH強直性脊柱炎功能指數(BASFI)、視覺模擬評分法(VAS)。
1.1.2 排除標準(1)文獻發表重復;(2)系統評價納入半隨機對照試驗;(3)系統評價中無Meta分析的結果;(4)對照組干預措施包括針灸療法的文獻;(5)系統評價的計劃書。
計算機檢索中國知網(CNKI)、萬方(WanFang Data)、維普(VIP)、中國生物醫學文獻數據庫(CBM)、PubMed、Embase、Cochrane Library、Web of Science自建庫至2021年5月1日關于針灸治療AS的系統評價,并在遼寧中醫藥大學圖書館進行手動檢索文獻。中文檢索詞包括強直性脊柱炎、針灸、灸、針刺、艾灸、溫針、針刀、蜂針、穴位埋線、Meta分析、系統評價等;英文檢索詞包括"ankylosing spondylitis"、"Acupuncture"、"Moxibustion"、"Acupuncturemoxibustion"、"Acupuncture therapy"、"Warm acupuncture"、"Needle warming moxibustion"、"Needle knife"、"Bee-sting therapy"、"Acupoint catgut embedding"、"Meta-analysis"、"Systematic review"等。根據不同數據庫的檢索特點,均使用主題詞與自由詞結合的模式進行檢索,以確保搜索的完整性。中英文檢索策略相近,分別以CNKI與PubMed為例,PubMed檢索策略詳見圖1,CNKI檢索策略如下:TI=(“強直性脊柱炎”)AND SU=(“針灸”+“灸”+“針刺”+“艾灸”+“電針”+“溫針”+“耳針”+“腹針”+“針刀”+“蜂針”+“穴位埋線”+“穴位注射”+“穴位敷貼”)AND SU=(“Meta分析”+“系統評價”+“系統綜述”+“薈萃分析”)。

圖1 PubMed檢索策略
首先進行去重處理,將檢索出的文獻導入Note-Express文獻檢索與管理系統進行操作,得到的文獻由兩名研究員獨立閱讀其篇名、關鍵詞、摘要,并剔除無關文獻。其次,將獲得的文獻下載并通讀全文,按納排標準進行操作,以完成初次篩選。各自初篩完成后,兩名研究員進行納入結果比對,若遇意見分歧將交由第三名研究者進行判定與裁決,以確定最終納入文獻。兩名研究員獨立按納排標準提取納入文獻數據,內容包括標題、作者姓名、發表年份、干預措施、納入文獻量及樣本量、方法學質量評價工具、結局指標等,完成后進行交互核驗,若有爭議將交由第三名研究者仲裁。
1.4.1 方法學質量評價 研究人員根據AMSTAR2量表[6,7]的16個條目評價納入文獻的方法學質量。通過納入文獻符合條目標準程度的高低,將每項條目評價為“是”、“部分是”、“否”。利用關鍵條目2、4、7、9、11、13、15與其余非關鍵條目進行方法學質量評價,將結果分為“高”、“中”、“低”、“極低”四個質量檔次,具體判定方法如下:非關鍵條目不符合數≤1,且無不符合關鍵條目,則評價為“高”;非關鍵條目不符合數>1,且無不符合關鍵條目,則評價為“中”;關鍵條目不符合數=1,則評價為“低”;關鍵條目不符合數>1,則評價為“極低”。
1.4.2 證據質量評價 研究人員運用GRADE系統[8]評價結局指標的證據質量及可靠程度,其質量的高低取決于納入研究的局限性、不一致性、不直接性、不精確性、發表偏倚共5項降級因素。通過嚴格判定,將降級情況導入GRADEpro軟件進行分級,最終將證據質量分為高(不降級)、中(降1級)、低(降2級)和極低(降3級)四類。
初次檢索共得到文獻99篇,依納入排出標準進行篩選,最終獲得7篇[9-15]符合標準的文獻。文獻篩選流程見圖2。

圖2 文獻篩選流程圖
本研究納入的7篇文獻中,中文文獻5篇[9-13],英文文獻2篇[14,15],2篇[9,10]為學位論文,其余為期刊論文,發表時間為2014年~2020年。7篇系統評價中,每項研究所納入的文獻量為8~26篇,總樣本量為7567例;在干預措施方面,治療組采取針灸療法、針灸療法聯合藥物作為干預措施,對照組的干預措施為非針灸療法的藥物治療;在方法學質量評價方面,1篇文獻[10]采用Cochrane偏倚風險評估和改良Jadad評價量表進行評價;4篇文獻[9,12,14,15]采用Cochrane偏倚風險評估;1篇文獻[11]采用改良Jadad評價量表進行評價;1篇文獻[13]采用Jadad評價量表進行評價。納入文獻基本特征詳見表1。

表1 納入文獻的基本特征
運用AMSTAR2量表進行方法學質量評價,結果顯示:7篇納入文獻均未在系統評價實施前制定研究方案;僅1篇[9]提供了排除文獻清單,判定為低質量;其余納入文獻至少存在兩個關鍵條目不符合標準,故判定為極低質量。方法學質量評價詳見表2。

表2 納入文獻的AMSTAR2量表評價結果
運用GRADE系統對納入的7篇文獻的主要結局指標進行證據質量分級評價,共得到22個結局指標。其中,3個結局指標被評價為中等質量,11個為低質量結局指標,8個為極低質量結局指標,無高質量結局指標。證據質量分級情況詳見表3。

表3 納入文獻的GRADE證據質量分級表
2.4.1 有效率6篇文獻[10-15]對有效率進行系統評價,研究結果治療組均優于對照組,差異均具有統計學意義。(1)針藥聯合VS西藥:1篇文獻[10]按照此干預措施將研究分為三個亞組:針刺聯合西藥VS西藥[OR=4.61,95%CI(2.36,9.03),P<0.00001];針刺聯合中 藥VS西 藥[OR=4.35,95%CI(2.71,6.97),P<0.00001];針刺聯合中藥與西藥VS西藥[OR=3.63,95%CI(1.91,6.90),P<0.0001],證據等級分別為低、中、低。(2)針刀聯合西藥VS西藥:2篇文獻[11,12]研究結果為[OR=3.12,95%CI(1.85,5.28),P<0.001;MD=7.08,95%CI(3.34,15.00),P<0.00001],證據等級分別為低、低。(3)艾灸聯合西藥VS西藥:2篇文獻[13,14]研究結果為[RR=1.19,95%CI(1.07,1.32),P<0.05;OR=4.21,95%CI(2.91,6.10),P<0.001],證據等級分別為極低、低。(4)艾灸VS西藥:3篇文獻[13-15]研究結果為[RR=1.29,95%Cl(1.08,1.54),P<0.05;OR=2.43,95%CI(1.62,3.65),P<0.001;RR=1.14,95%CI(1.07,1.21),P<0.0001],證據等級分別為低、中、低。
2.4.2 BASDAI 4篇文 獻[9,11,12,15]對BASDAI進行 系統評價。(1)針灸療法VS西藥:1篇文獻[9]研究結果治療組優于對照組,差異具有統計學意義[MD=-1.83,95%CI(-2.88,-0.78),P=0.0006],證據等級為極低。(2)針灸療法聯合西藥VS西藥:1篇文獻[9]研究結果治療組優于對照組,差異具有統計學意義[MD=-2.18,95%CI(-2.63,-1.73),P<0.00001],證據等級為低。(3)針刀聯合西藥VS西藥:1篇文獻[11]研究結果治療組不優于對照組,差異無統計學意義[WMD=-0.81,95%CI(-2.03,0.42),P=0.200],證據等級為極低;1篇文獻[12]研究結果治療組優于對照組,差異具有統計學意義[MD=-0.93,95%CI(-1.28,-0.57),P<0.00001],證據等級為極低。(4)艾灸VS西藥:1篇文獻[12]研究結果治療組不優于對照組,差異無統計學意義[MD=0.12,95%CI(-0.53,0.76),P=0.72],證據等級為極低。
2.4.3 BASFI 4篇文獻[9,11-13]對BASFI進行系統評價。(1)針灸療法VS西藥:1篇文獻[9]研究結果治療組不優于對照組,差異無統計學意義[MD=-0.47,95%CI(-1.35,0.42),P=0.30],證據等級為極低。(2)針灸療法聯合西藥VS西藥:1篇文獻[9]研究結果治療組不優于對照組,差異無統計學意義[MD=-0.64,95%CI(-1.57,0.30),P=0.18],證據等級為極低。(3)針刀聯合西藥VS西藥:1篇文獻[11]研究結果治療組優于對照組,差異具有統計學意義[WMD=-0.15,95%CI(-1.68,-0.62),P<0.001],證據等級為低。1篇文獻[12]研究結果治療組優于對照組,差異具有統計學意義[MD=-0.92,95%CI(-1.27,-0.56),P<0.0001],證據等級為極低。(4)艾灸聯合西藥VS西藥:1篇文獻[13]治療組不優于對照組,差異無統計學意義[MD=-0.76,95%CI(-1.91,-0.39,P>0.05],證據質量為極低。
2.4.4 VAS評分2篇文獻[12,15]采用VAS評分進行系統評價,研究結果治療組均優于對照組,差異均具有統計學意義。(1)針刀聯合西藥VS西藥:1篇文獻[12]研 究 結 果 為[MD=-1.55,95%CI(-1.97,-1.13),P<0.0001],證據等級為低。(2)艾灸VS西藥:1篇文獻[15]研 究 結 果 為[MD=-0.82,95%CI(-1.08,-0.56,P<0.00001],證據等級為中。
系統評價作為循證醫學中獲得高質量證據的來源,其對臨床決策起到了重要的意義[16]。但是,系統評價并非完全可靠[17,18],究其本因多來源于納入文獻的質量與研究者的評價不一,導致系統評價的結果參差不齊,進而影響了臨床決策。系統評價再評價[19,20]為臨床提供了高質量證據,全面地收集同一疾病有關診斷、病因、治療、轉歸、預后等方面的系統評價,進一步對數據進行整合并再次進行評價,從而增強臨床的實用性。
AS屬于中醫“腎痹”范疇,中醫認為AS的發病與足少陰腎經、足太陽膀胱經、督脈相關,由風、寒、濕、熱、痰、瘀阻滯經絡而導致[21],故施祛風散寒、除濕清熱、化痰祛瘀、溫通經絡之法治療。本病目前沒有根治的方法,即便是手術也僅僅是改善功能[21]。從目前的臨床文獻來看,中醫治療AS獨具優勢,以針灸療法療效最為突出,大大提高了臨床治療有效率[23],主要體現在臨床有效率、VAS等結局指標的改善方面。但由于納入的系統評價質量不一,方法學質量與證據質量不理想,仍需要更高質量的RCT進行療效驗證。
本研究應用AMSTAR2方法學質量評價工具對進行評價,結果顯示,僅1篇[9]為低質量,其余文獻均為極低質量。所有研究均未提前注冊或公開發表前期研究方案,僅1篇[9]提供了排除文獻清單,4篇文獻[11-14]并未采用全面的檢索策略,4篇文獻[10-13]未報告潛在的利益沖突來源,以上4點可能會影響系統評價納入篩選的嚴謹性與規范性;所有研究均未說明納入研究的類型,從而影響納入標準的合理性;2篇文獻[11,13]未考慮納入研究的偏倚風險對系統評價結果的潛在影響,4篇文獻[10-13]未考慮納入研究的偏倚風險,3篇文獻[10,12,14]未對發表偏倚進行充分調查,以上3點提示針灸治療AS的系統評價對于偏倚風險的重視程度不高,影響系統評價的客觀性。
本研究運用GRADE系統進行證據質量分級,研究結果表明:在22個主要結局指標中,大部分證據質量評價為低級與極低級,僅少部分為中級,且無高級結局指標,本現象提示其真實效應與系統評價結果存在較大出入。導致本研究結局指標證據質量降級的主要因素體現在隱蔽分組、盲法、完整報告結果數據方面,出現較為嚴重的偏倚風險,使研究具有局限性;次要因素為研究的不一致性、不精確性與發表偏倚,納入研究樣本量較少、異質性較大等方面對研究結果的真實可靠性影響較大。
本研究僅納入中文或英文相關文獻,具有語言限制,這可能會造成檢索不全面,出現選擇性偏倚。研究人員嚴格按照AMSTAR2量表條目與GRADE系統對方法學質量與證據質量進行評價,在評價時可能存在主觀性,造成偏倚的出現。
因此,筆者建議研究者在研究開展前,需提前制定好系統評價的研究方案,嚴格按照AMSTAR2量表與GRADE系統指南規范研究方案的設計與注冊等方面,為臨床工作者、患者提供更有利的、更準確的決策。