劉敏 周俊 邱現良 劉東穎 陳秋*
1.成都市龍泉驛區中醫醫院,四川 成都 610100
2.成都中醫藥大學附屬醫院,四川 成都 610075
太極(Tai Chi,TC)是中國傳統運動的重要功法之一,其內容豐富且簡便易學,開展不受時間、空間限制,習練時強調精、氣、神融為一體,結合吐納以達到形神共養、防病治病的目的,現已成為最流行的鍛煉形式之一[1]。近年來國內外關于TC防治骨質疏松癥(osteoporosis,OP)的臨床研究日漸增多[2-6],然而其臨床有效性仍未明確。系統評價/Meta分析作為高質量的臨床證據來源[7],可進一步綜合試驗數據得出可靠結論,為臨床決策提供重要參考[8]。但TC防治OP相關的系統評價結論不一[15-27],系統評價本身的方法學質量尚待評估,只有高質量的循證醫學證據才能證實或證偽,低質量證據反而會得出誤導性結論[9]。因此,本研究采用AMSTAR-2量表、PRISMA得分和GRADE系統對TC防治OP的系統評價進行再評價,以期為循證醫學指南的制定及進一步研究有所啟示。
僅納入TC防治OP的系統評價/Meta分析,試驗組進行太極鍛煉,對照組可無鍛煉、步行或除太極以外其他鍛煉形式,至少有一項與骨密度(bone mineral density,BMD)相關的結局指標。排除比較不同傳統運動療效的研究、重復發表的研究、病例報告、會議摘要、專著和無法獲取全文的文獻。
計算機檢索PubMed、Web of science、EMbase、The Cochrane Library、PROSPERO、CNKI、CBM、WanFang和VIP數據庫,搜集TC防治OP的系統評價/Meta分析,檢索時限為建庫至2020年02月,檢索語言限制為中英文,并對參考文獻、相關綜述、指南、論文及未發表的報告進行瀏覽,以獲得補充文獻。檢索采取主題詞和自由詞相結合的方式,檢索范圍設定為全文,英文檢索詞包括Tai Chi、Taiji、bone*density、bone*turnover*markers、meta-analysis、systematic review,中文檢索詞包括太極、骨質疏松、骨量減少、骨密度等,文獻類型為Meta分析、系統評價、薈萃分析、元分析。具體檢索策略以PubMed為例,詳見圖1。

圖1 PubMed檢索策略圖
文獻篩選和資料提取由2名研究員獨立進行并交叉核對,有不一致時討論解決,必要時咨詢上級專家協助判斷。根據事先制定的納入標準,獨立閱讀文題和摘要進行初篩,余下文獻通過仔細閱讀全文后確定是否納入。采用預先設計的表格提取詳細數據,主要包括合格文獻的基本信息、干預及對照措施細節、方法學的關鍵要素以及定量或定性分析的結果,如文獻信息不全,將盡量與作者聯系以獲得缺失信息。
文獻質量評價和證據質量分級均由2名研究員獨立完成,意見不一致時通過請示專家后明確。采用最新修訂和更新的AMSTAR-2量表[10]進行方法學質量評價,一共16個條目,其中7條為關鍵條目,根據條目的符合程度進行“信心”分級;運用《PRISMA清單》[11]進行報告質量評價,條目規范且正確報告計1分,部分報告計0.5分,未報告或錯誤計0分,總分≤27分。采用GRADE系統分析納入研究的證據質量[12],主要通過考察研究局限性、不精確性、不一致性、間接性和發表偏倚[13],將結局指標的證據質量分為高、中、低或極低4個等級[14]。
根據預先制定的檢索策略,初檢出146篇原始文獻,經過逐層篩選最終納入13篇合格文獻,其中7篇英文文獻,6篇中文文獻,文獻篩選流程見圖2。6篇文獻[15-16,18-19,23-24]報告了太極練習的不良事件,包括偶發的肌肉酸痛、腰背部疼痛、扭傷等,無嚴重不良事件發生。納入文獻的信息總結見表1。

表1 納入研究基本特征

圖2 文獻篩選流程及結果
運用AMSTAR-2量表對納入文獻總體質量進行“信心”分級,1篇質量為“中”[22],1篇質量為“低”[18],其余文獻質量均為“極低”等級。在關鍵條目中:①絕大部分研究均未說明系統評價研究方案是否在實施前就已確定,無法判斷系統評價制作過程中與計劃書不一致的情況;②4篇文獻[22,24,26-27]使用Cochrane偏倚風險評估工具對單個研究的偏倚風險進行評估,其余文獻均未能正確全面地評估納入研究的偏倚風險;3篇[16-17,19]文獻選擇了不恰當的效應模型合并研究結果,4篇文獻[17,19,26-27]納入研究具有高度異質性,而作者未對異質性予以調整和分析異質性來源;8篇文獻[15-17,19,21,24,26-27]納入的研究高低質量不同,且大部分文獻納入了非隨機干預性研究,但系統評價/Meta分析并未針對不同研究設計的偏倚風險及同一研究設計類型偏倚風險的大小進行解釋和討論。在非關鍵條目中,所有系統評價/Meta分析均未解釋選擇納入研究設計類型的原因。除1篇文獻[24]外,均未查找和報告納入研究的資金來源信息。大多數文獻由兩人獨立完成文獻篩選和數據提取,均詳細描述了納入研究的基本特征,且聲明系統評價/Meta分析沒有利益沖突,見圖3。

圖3 AMSTAR-2評分結果
本次研究納入的13篇文獻PRISMA得分為12~24分不等,主要扣分原因有:①所有納入文獻摘要均未提供系統綜述的注冊號;②在目的部分未完整地以“PlCOS”為導向提出需要解決的清晰明確的研究問題;③除1篇文獻[22]提供了方案注冊號、1篇文獻[18]說明提前制定研究計劃,其它研究均未提供方案和注冊信息;④1篇文獻[18]說明檢索詞的完整列表可根據需要提供,其余文獻均只提供部分檢索詞,未舉例說明至少一個數據庫的全部電子檢索策略;⑤4篇文獻[18-19,22,24]詳細闡述了文獻篩選和資料提取的方法,并說明是否由兩人獨立完成,如何解決分歧以及任何聯系作者獲得缺失資料的過程,其余研究未描述或描述不充分;⑥在方法部分未報告評估單個研究的偏倚數據如何用于隨后的結果合并,也未詳細描述如何評估研究間可能存在的偏倚(如發表偏倚和選擇性報告偏倚);⑦在解釋數據合并結果時,6篇文獻[15-18,20-21]未對研究間可能存在的偏倚進行描述;⑧討論部分對研究層面和結局層面的局限性(如偏倚的風險),以及系統綜述的局限性(如檢索不全面、報告偏倚等)報告不充分。
因Wayne(2007)、Chow(2018)的研究只有定性分析結果而無法進行證據質量評估,故排除。選取余下11篇文獻中應用Meta合并分析的結局指標共44個,運用GRADE系統對每個結局指標進行證據質量評價,結果見表2。其中中等質量證據8個、低等質量證據22個、極低質量證據14個,無證據質量顯示為高級。中級質量的結局指標如下:2篇研究報道了腰椎BMD,一項研究[20]結果顯示在絕經后婦女中TC組與無治療組的腰椎BMD無顯著差異(WMD=0.02,95%CI:-0.00~0.05,P=0.09);而另一項研究[24]結果表明在骨量減少和骨質疏松癥人群中,TC可有效增加腰椎BMD(SMD=0.16,95%CI: 0.01~0.30,P=0.03)。一項研究[18]顯示與無治療組相比,TC對圍絕經期和絕經后婦女脊柱BMD值的變化有統計學意義(WMD=0.03,95%CI: 0.01~0.06,P=0.008)。一項研究的綜合結果表明[19],TC組和對照組在提高BMC和降低ALP方面無顯著差異(SMD=0.07,95%CI:-0.16~0.30,P=0.56;SMD= -0.05,95%CI: - 0.30~0.19,P=0.67),而在BAP上具有顯著獲益(SMD=0.59,95%CI: 0.28~0.9,P=0.000 2)。方法學質量較高的一項研究[22]提示TC對BMD值有正向影響,治療效果高于常規治療(WMD=0.05,95%CI: 0.03~0.07,P<0.000 01),而另一項研究[24]也提示太極訓練能增加股骨頸BMD,且優于無太極訓練(SMD=0.18,95%CI: 0 ~0.36,P=0.05)。

表2 納入研究證據質量評價結果(基于GRADE分級標準)
本研究分別采用AMSTAR-2量表和PRISMA得分評價納入文獻的方法學質量及報告質量,結果顯示納入的13篇文獻總體質量偏低。待改進的方面有:①為降低系統評價/Meta分析制作過程中的偏倚風險,系統評價作者需提前制定研究計劃,并將研究計劃以注冊或發表的形式公布[28];②應使用合理工具對納入研究進行偏倚風險評估,最好選用正規、已開發的評價工具,對太極運動防治骨質疏松癥的RCT的偏倚風險評估,推薦使用Cochrane偏倚風險評估工具[29];③太極運動防治骨質疏松癥的RCT是在不同的患者群和各種臨床環境中進行的,因此存在潛在異質性的風險,需選用合適的效應量和統計分析模型進行數據合并,并對存在的異質性予以矯正并分析異質性來源;④當納入不同偏倚風險的研究時,系統評價作者應通過亞組分析、敏感性分析等調查偏倚風險對總的合并效應量的影響;⑤在討論和解釋結果時,系統評價作者需充分考慮納入研究的偏倚風險、異質性、發表偏倚等對研究結果的可能影響并予以合理解釋。在文獻報告方面應注意對PICOS的充分描述、系統全面的文獻檢索、至少舉例說明一個數據庫的全部電子檢索策略、詳細描述文獻篩選、數據提取及質量評價的過程、納入研究的資金支持、對單個研究存在的偏倚、發表偏倚和選擇性報告偏倚的評估方法以及如何進行隨后的數據合并,最后對系統評價的結果、偏倚的潛在影響、局限性等進行充分的解釋和討論。
采用GRADE系統對納入研究的結局指標進行證據質量評價,結果顯示大多數結局指標為低或極低質量等級,表明其真實療效可能與估計療效有很大差別,進一步的研究很可能改變評估結果。降級最多的原因為研究局限性,主要體現在系統評價納入的RCT大都有設計和方法的缺陷,如對隨機化、隱蔽分組以及盲法的實施報告不充分或缺失,未來有關TC的臨床研究應進一步提高其方法學質量。其次合并結局指標的異質性較大也是導致降級的主要因素,6篇文獻具有高度異質性(I2>80%),直接導致證據質量降低兩級,可能源于納入的原始文獻差異性較大,需進一步明確納入和排除標準,并進行適當的亞組分析以解決。同時,結局指標還存在不精確性和發表偏倚的問題,納入研究多數為小樣本陽性結果研究,不符合最優信息樣本量,部分研究未對發表偏倚情況進行分析,存在一定的發表偏倚風險。僅有8個結局指標為中級質量,主要體現在BMD值,表明TC在提高BMD值方面優于對照組,結果具有統計學意義,但因其樣本量小且方法學質量較低,結果的可靠性有限。
本研究的局限性在于因語言的限制而未納入日韓與其他非英語系國家的文獻,可能存在一定程度的發表偏倚。此外,因關注的主要結局指標為BMD,忽略了TC對改善平衡能力、降低跌倒風險以及增加肌肉骨骼力量等方面的潛在益處,需開展進一步的研究以明確。
綜上所述,TC防治OP的系統評價研究結論的證據質量較低,臨床醫生和決策者應結合具體情況使用這些證據,未來有必要進行大樣本、高質量、長時間的研究進一步評估其有效性。TC防治OP的系統評價/Meta分析的方法學和報告質量仍需進一步提高,希望系統評價/Meta分析制作者嚴格按照AMSTAR-2質量評價工具和PRISMA聲明的條目進行研究,以提供更高質量的循證醫學證據。
利益沖突聲明:本文不涉及任何利益沖突。