周奇,王玲,楊楠,玉炫,張靜怡,馬艷芳,王健健,張先卓,石秀娥,陳耀龍,楊克虎
1.蘭州大學第一臨床醫學院,甘肅蘭州市 730000;2.蘭州大學基礎醫學院循證醫學中心,甘肅蘭州市 730000;3.世界衛生組織指南實施與知識轉化合作中心,甘肅蘭州市 730000;4.GRADE 中國中心,甘肅蘭州市 730000;5.甘肅省循證醫學與臨床轉化重點實驗室,甘肅蘭州市 730000;6.蘭州大學公共衛生學院,甘肅蘭州市 730000;7.甘肅省康復中心醫院,甘肅蘭州市 730000;8.甘肅省循證康復醫學研究中心,甘肅蘭州市 730000
證據質量能夠衡量研究結果和結論正確預測真實情況的程度,推薦強度則反映對干預措施是否利大于弊的把握程度[1]。指南研究與評價工具(Appraisal of Guidelines for Research and Evaluation Ⅱ,AGREE Ⅱ)[2]和RIGHT[3]均對證據質量和推薦強度有明確的要求和規定,并強調報告推薦強度和該推薦關聯證據的質量。采用證據和推薦意見分級系統不僅有助于指南制訂者嚴格評價和選擇高質量證據,提高指南的可靠性,也有助于臨床醫生在短時間內了解不同干預措施可能產生的利弊,提高指南的應用性。
近年來,隨著循證理念的廣泛傳播[4‐5]和國內指南數量的快速增長[6],指南所采用的證據質量和推薦強度分級系統得到包括康復醫生在內的各類人群的關注。其中,GRADE 是目前應用最為廣泛的分級系統,已被包括世界衛生組織(World Health Organization,WHO)、Cochrane 協作網、英國國家衛生與臨床優化研究所(National Institute for Health and Care Excel‐lence,NICE)、UpToDate 和中華醫學會在內的100 多個組織采用[7]。本文對康復臨床實踐指南GRADE 評價結果進行分析,以期進一步理解和使用GRADE 系統,提高康復臨床實踐指南的可靠性和應用性。
計算機檢索PubMed、EMBASE、中國生物醫學文獻數據庫(China Biology Medicine disc,CBM)、中國知網(CNKI)和萬方數據庫以及醫脈通、NICE、美國國立指南文庫、蘇格蘭校際指南協作網(The Scottish Intercollegiate Guidelines Network,SIGN)、WHO、國際指南協作網等指南相關網站,搜索國內外已發布的采用GRADE 分級的康復臨床實踐指南,檢索時限均從建庫至2020年1月11日。
中文檢索詞:康復、復健、恢復、功能、物理療法、運動療法、殘疾、作業治療、心理治療、“語言療法”、“言語治療”、“運動療法”、“音樂療法”、“娛樂療法”、“舞蹈療法”、“動物輔助療法”、水療、“電刺激療法”、“體外沖擊波療法”、輔助技術、指南、共識、建議。
英文檢索詞:rehabilitation、recovery、function‐ing、physiotherapy、kinesitherapy、disability、occupa‐tional therapy、psychological therapy、language thera‐py、speech therapy、exercise therapy、music therapy、recreation therapy、dance therapy、animal assisted ther‐apy、hydrotherapy、electric stimulation therapy、extra‐corporeal shockwave therapy、assistive technology、guideline、consensus、recommendations。
納入標準:①符合《國際功能、殘疾和健康分類》(International Classification of Functioning,Disabil‐ity and Health,ICF)概念模式[8];②以臨床指南類型發表;③明確采用GRADE 分級系統;④以期刊論文形式發表;⑤發表語言為英文或中文。
排除標準:①舊版本指南;②指南計劃書;③無可辨識的推薦意見。
由2 名研究員獨立對檢索到的文獻進行篩選和數據提取并交叉核對,如遇分歧則與第三方協商解決。篩選文獻時首先通過閱讀文題和摘要,排除明顯不相關的文獻,保留確定納入文獻,對不能準確判斷的文獻進一步閱讀全文,以確定最終是否納入。信息提取包括證據質量和推薦強度分級系統以及GRADE 評價的推薦意見的推薦強度和證據質量分級結果。
采用Microsoft Excel 2016 軟件進行資料整理,匯總分析指南GRADE 分級系統的使用率和GRADE 證據質量和推薦強度的百分比,采用SPSS 19.0 軟件對證據質量和推薦強度的分級結果進行χ2檢驗。顯著性水平α=0.05。
根據預先制定的檢索策略共獲得相關文獻7364篇,通過閱讀題目、摘要、全文等逐層篩選,納入康復臨床實踐指南83 篇,排除未應用分級系統的指南37 篇(44.6%),排除采用其他證據質量和推薦意見分級系統42 篇(50.6%),包括荷蘭衛生保健發展研究院(Dutch Institute for Healthcare Improvement,CBO)分級系統、SIGN、牛津大學循證醫學中心(Oxford Centre for Evidence‐based Medicine,OCEBM)分級系統、澳大利亞國家健康與醫學研究理事會(National Health and Medical Research Council,NHMRC)分級系統、美國預防醫學工作組(United States Preventive Services Task Force,USPSFT)分級系統、1986 年David Sackett 分 級系統,以及指南工作組自身制訂的分級系統等。最終納入應用GRADE分級系統的指南4篇(4.8%)。文獻篩選流程及結果見圖1。

圖1 文獻篩選流程圖
GRADE 分級系統將證據質量分為“高”“中”“低”“極低”四個等級,推薦意見分為“強”和“弱”兩級[1]。見表1和表2。
4篇采用GRADE分級系統的指南中,中文1篇[9],英文3 篇[10‐12]。4 篇指南共包含44 條推薦意見,其中39條(88.6%)具有明確的證據質量,另5條推薦意見的推薦強度或證據質量不確定。在引用的證據中,高質量證據4 條(9.1%),中等質量證據12 條(27.3%),低質量證據15 條(34.1%),極低質量證據8 條(18.2%)。在推薦意見中,強推薦14 條(31.8%),弱推薦25 條(56.8%)。見表3。
對于推薦意見所對應的證據質量,強推薦的證據中,28.6%(4/14)為高質量證據,21.4%(3/14)為中等質量證據,35.7%(5/14)為低質量證據,占比最高;在弱推薦的證據中,高質量證據為0,36.0%(9/25)為中質量證據,40.0%(10/25)為低質量證據,占比最高。見表3。
強推薦支持證據的質量高于弱推薦(χ2=8.218,P=0.042)。
在納入的83 篇康復臨床實踐指南中,僅約5%采用該系統,一方面是因為部分指南制訂者仍未對證據質量和推薦意見分級系統給予足夠的重視,另一方面是因指南選用的其他分級系統種類較多,除了各個協會/學會制訂或改編的分級系統外,還有較多指南采用工作組自身制訂的分級系統。自1979年加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)首次對研究證據進行系統分級以來[13],經過不斷地探索與發展,產生了至少50 種分級系統[14],但是讓專家、患者、臨床醫生和政策制訂者逐一了解不同的分級系統既費時費力又不切實際。GRADE 方法相較其他分級系統,有以下幾個重要特點[15]:①明確界定證據質量和推薦強度及其區別;②明確指出對證據質量的評估是對報告了重要臨床結局指標的證據體的評估,而非對一個系統評價或臨床試驗的評估;③對不同級別證據的升級與降級有明確、統一的標準;④明確承認偏好與價值觀在推薦中的作用。采用GRADE 分級系統既是WHO 指南制訂的基本要求[16‐17],也是國內外指南的總體趨勢,未來康復臨床實踐指南采用GRADE 系統的比例還需進一步提升。
對采用GRADE 系統的康復臨床實踐指南分級結果分析顯示,低和極低質量證據占比超過50%,康復臨床實踐指南的制訂需要系統篩選和納入更多高質量證據支持。推薦意見中,弱推薦的比例高于強推薦,與更低的證據質量呈顯著相關,反映出證據質量會影響推薦強度。但應注意證據質量和推薦強度本質上是相互獨立的,GRADE 在確定推薦強度時,證據質量只是一個影響因素,還應考慮資源利用、利弊平衡以及患者價值觀和偏好等其他因素[18],證據質量和推薦強度并非一一對應[19‐21],康復臨床實踐指南推薦意見中也存在部分中等質量證據給出弱推薦,極低質量的證據給出強推薦。
基于對現有康復臨床實踐指南GRADE 分級的現況分析,結合指南方法學的要求,對康復臨床實踐指南的證據和推薦分級提出如下建議。①開展康復研究提供高質量證據。康復發展仍存在證據缺乏,需要進行康復研究能力建設,擴大獲得康復的有力證據,促進健康體系中康復模塊的建立健全[22],響應“康復2030”行動呼吁[23]。②基于系統評價對證據進行分級[24‐25]。一方面,原美國醫學研究所(Institute of Medi‐cine,IOM)對指南新的定義和要求明確指出,指南的推薦意見必須基于對當前研究證據的系統評價[26]。另一方面,GRADE 是針對系統評價每個結局對應研究證據(即結局的證據體),根據各個因素(5 個降級因素包括偏倚風險、間接性、異質性、不精確性和發表偏倚;3 個升級因素包括大效應量、劑量效應關系和負偏倚)進行質量評價[15]。③指南方法學家應參與指南制訂,可以直接負責指南證據質量評價與分級,也可指導推薦意見形成和確定推薦強度,有助于改善指南的方法學質量[27‐28]。④指南全文撰寫應按照相應的報告規范(如RIGHT 聲明[3])進行,描述證據質量分級的方法、推薦意見的強度以及支持該推薦的證據質量。
本研究首次對目前康復臨床實踐指南的GRADE分級現狀進行描述和分析,并就如何改善康復臨床實踐指南證據和推薦分級提出針對性建議。但本研究仍然存在一定的局限性:①使用GRADE 系統的康復臨床實踐指南比例較低,研究總體樣本較少;②指南各指南制訂者對GRADE 方法掌握參差不齊,分級的內部一致性和外部準確性可能存在問題;③部分指南推薦意見的推薦強度或證據質量分級不確定,可能會對分析結果產生一定影響。

表1 GRADE證據質量的描述

表2 GRADE推薦強度的描述

表3 指南推薦意見GRADE分級結果比較[n(%)]
康復臨床實踐指南對GRADE 分級系統的應用仍待提高,建議康復臨床實踐指南制訂者進一步掌握指南和GRADE 方法學,更有效地改善康復臨床實踐指南的可靠性和應用性。