GRADE證據(jù)質(zhì)量評級及其在循證實踐中的重要性

2021-09-03 01:21:44AnilKumarMeghanaTaggarsi翻譯王瑞張崇凡夏君

中國醫(yī)院院長 2021年14期

文/Anil Kumar Meghana Taggarsi 翻譯/王瑞張崇凡夏君

GRADE 方法是批判性評價對照研究和為系統(tǒng)評價提供建議的主流工具之一。

循證實踐是現(xiàn)代醫(yī)學(xué)實踐中不可或缺的一部分，忽視證據(jù)和證據(jù)質(zhì)量的現(xiàn)代醫(yī)療是無法想象的1。然而，循證醫(yī)學(xué)并不像人們認(rèn)為的那樣完美。在當(dāng)代研究中，學(xué)者們總是會對證據(jù)質(zhì)量提出質(zhì)疑。《柳葉刀》雜志總編理查德·霍頓（Richard Horton）曾在《柳葉刀》上發(fā)文指出，由于納入研究樣本量較小、研究差異無統(tǒng)計學(xué)意義、分析方法不恰當(dāng)、利益沖突明顯、或?qū)α餍汹厔莸拿牡纫蛩兀?0%的科學(xué)文獻(xiàn)可能存在錯誤或造假2。

循證醫(yī)學(xué)的不恰當(dāng)應(yīng)用會對患者帶來負(fù)面影響，不利于實現(xiàn)循證醫(yī)學(xué)促進(jìn)社會健康的理念3。英國國家健康與臨床優(yōu)選研究所（National Institute for Clinical Excellence）指出，用于制定指南和推薦意見的文獻(xiàn)中，約有62%的研究是不可靠的，且無法確定這些研究與患者之間的相關(guān)性4。

最近，英國《衛(wèi)報》的一則報道引起了全世界對證據(jù)質(zhì)量和篡改證據(jù)的關(guān)注。報道稱，影響力排名最高的兩本國際醫(yī)學(xué)期刊《新英格蘭醫(yī)學(xué)雜志》和《柳葉刀》分別撤回了一篇有關(guān)新冠肺炎疫情的文章。柳葉刀撤回的文章為A multinational registry analysis of hydroxychloroquine on COVID 19。受該研究影響，擔(dān)心羥氯喹會增加死亡率，使用羥氯喹治療新冠肺炎的臨床試驗在全球范圍內(nèi)被叫停，包括世界衛(wèi)生組織和世界各國當(dāng)時正在進(jìn)行的隨機(jī)對照試驗5。后來的詳細(xì)審查結(jié)果表明，該研究的數(shù)據(jù)來源和分析存在不一性。這項存在缺陷的試驗會導(dǎo)致患者在這場全球疫情中面臨風(fēng)險，未來的試驗可能會對受影響的患者數(shù)量進(jìn)行說明。良好的研究質(zhì)量是為醫(yī)學(xué)實踐提供證據(jù)的關(guān)鍵，因此，應(yīng)努力確保產(chǎn)出最高質(zhì)量的證據(jù)。

循證實踐是現(xiàn)代醫(yī)學(xué)實踐中不可或缺的一部分，忽視證據(jù)和證據(jù)質(zhì)量的現(xiàn)代醫(yī)療是無法想象的1。然而，循證醫(yī)學(xué)并不像人們認(rèn)為的那樣完美。

推薦意見分級評估、制定和評價工作組（Grading of Recommendations Assessment, Development and Evaluation Working Group，GRADE）將證據(jù)質(zhì)量定義為，報告的效應(yīng)值真實可靠，以及其為具體推薦意見提供支持的可信度6。GRADE方法是批判性評價對照研究和為系統(tǒng)評價提供建議的主流工具之一。對系統(tǒng)評價和指南進(jìn)行批判性評價是一項復(fù)雜的工作，需要熟練掌握GRADE工具或其他重要評價工具的相關(guān)知識7。

如何確保證據(jù)質(zhì)量及其在指南和推薦意見制定中的應(yīng)用

證據(jù)質(zhì)量取決于研究的方法學(xué)和報告質(zhì)量8。高質(zhì)量的研究需要有嚴(yán)密的研究設(shè)計，并高度重視研究結(jié)局的可信度。基于診斷、預(yù)后、篩查和治療的相關(guān)研究，牛津大學(xué)循證醫(yī)學(xué)中心推出了證據(jù)金字塔，金字塔頂端為系統(tǒng)評價，其后依次為隨機(jī)對照試驗、隊列研究、病例對照、病例系列和專家意見9。因此，在可行的情況下，應(yīng)該使用實施良好的系統(tǒng)評價、薈萃分析和隨機(jī)對照試驗指導(dǎo)臨床決策。

證據(jù)質(zhì)量評級要素

方法學(xué)質(zhì)量決定研究的整體質(zhì)量，研究的整體質(zhì)量決定證據(jù)質(zhì)量。GRADE方法提出了8個影響證據(jù)質(zhì)量的要素，其中包括5個降級因素和3個升級因素。降級因素分別為偏倚風(fēng)險、不一致性、不精確性、間接性和發(fā)表偏倚。研究設(shè)計是決定證據(jù)質(zhì)量的關(guān)鍵10。

未進(jìn)行分配隱藏、未施盲、失訪偏倚大、未遵守意向性分析的原則、對結(jié)局進(jìn)行選擇性或傾向《英國醫(yī)學(xué)雜志》中文版2021年2月第24卷第2期循證醫(yī)學(xué)性報告等偏倚風(fēng)險因素會降低療效估計值的可信度。這些偏倚導(dǎo)致研究存在局限性，對證據(jù)質(zhì)量產(chǎn)生不利影響。不同的研究人群、干預(yù)措施和結(jié)局會導(dǎo)致異質(zhì)性或多變性，進(jìn)而造成研究結(jié)果的不一致性。如果研究人員無法對異質(zhì)性作出合理解釋，則須對證據(jù)質(zhì)量進(jìn)行降級。

如果針對某一問題存在兩項有效的干預(yù)措施，相較于直接對比兩項干預(yù)措施的研究而言，將每一項干預(yù)措施分別與安慰劑組對比的研究則顯然為間接證據(jù)，證據(jù)質(zhì)量因間接性而被降級。如果研究的樣本量非常小，變量極少，導(dǎo)致置信區(qū)間很大，就會出現(xiàn)不精確的問題。制藥行業(yè)贊助的臨床試驗可能會受到商業(yè)利益的影響。行業(yè)贊助的試驗，尤其是小型研究或與新療法相關(guān)的隨機(jī)對照試驗，可能會在方法學(xué)、結(jié)果報告和發(fā)表方面存在偏倚。這類研究經(jīng)常會刻意隱瞞不良結(jié)果，這可能會導(dǎo)致嚴(yán)重的問題，尤其是在新療法或藥物獲批上市時，沒有考慮到贊助商可能未公開該藥物或療法的所有潛在獲益或風(fēng)險。因此，在高水平同行評議期刊上發(fā)表這類行業(yè)贊助的試驗可能會引發(fā)偏倚，影響效應(yīng)估計值的可信度，從而導(dǎo)致證據(jù)質(zhì)量被降級11－12。這種局限性會影響證據(jù)的主體質(zhì)量，局限性越大，證據(jù)質(zhì)量越低6。此外，數(shù)據(jù)不準(zhǔn)確或太少以及較高的報告偏倚也會降低證據(jù)質(zhì)量13。

升級因素包括大效應(yīng)量、可能存在的混雜因素調(diào)整和劑量－反應(yīng)關(guān)系6。當(dāng)效應(yīng)在所有受試者中趨于一致或效應(yīng)完全不同于過往相關(guān)試驗結(jié)果時，可以因為效應(yīng)意義重大而對證據(jù)質(zhì)量進(jìn)行升級。值得注意的是，如果結(jié)局具有主觀性，研究者因觀察到的大效應(yīng)量，而考慮對證據(jù)質(zhì)量進(jìn)行升級時則需要保持警惕，尤其是在未對結(jié)局評估者實施盲法和分配隱藏的情況下10。劑量－反應(yīng)關(guān)系可以反映出重要的因果關(guān)系，會增加我們對研究結(jié)果的信心，從而提高證據(jù)質(zhì)量。如果觀察性研究中所有可能存在的偏倚都會導(dǎo)致真實療效被低估，則可以對證據(jù)質(zhì)量進(jìn)行升級。

證據(jù)質(zhì)量級別

證據(jù)質(zhì)量不僅取決于研究設(shè)計、質(zhì)量、一致性和直接性，還會受到研究局限性、結(jié)果的不一致性、偏倚風(fēng)險和證據(jù)不確定性的影響。GRADE方法對這些因素進(jìn)行了分析，并將證據(jù)質(zhì)量分為高、中、低和極低四個等級。

若進(jìn)一步的研究不可能改變效應(yīng)估計值，則為高質(zhì)量證據(jù)；若仍有進(jìn)一步的研究空間，且后續(xù)研究可能會改變效應(yīng)估計值，則為中等質(zhì)量證據(jù)；若后續(xù)研究會改變效應(yīng)估計值，則為低質(zhì)量證據(jù)；若無法確定任何效應(yīng)估計值，則為極低質(zhì)量證據(jù)。在撰寫推薦意見和制定指南時，應(yīng)對證據(jù)質(zhì)量進(jìn)行分級。證據(jù)質(zhì)量級別會影響醫(yī)護(hù)人員向患者提供循證實踐時的選擇10。

影響推薦意見的其他因素

高質(zhì)量證據(jù)不一定產(chǎn)生強(qiáng)推薦。除證據(jù)質(zhì)量外，推薦意見的撰寫和指南制定還需要考慮其他因素，例如干預(yù)的利與弊、患者的價值觀念和偏好以及成本問題7。因此，總體證據(jù)質(zhì)量指的是對回答醫(yī)療保健問題、決定或制定推薦意見和指南有重要意義的所有證據(jù)質(zhì)量的總和。

流程圖描述了制定指南或推薦意見之前，使用GRADE框架來評估證據(jù)的簡單易懂的方法（圖1）。

圖1 描述推薦意見分級的評估、制定和評價方法的流程圖

結(jié)論

每一個臨床醫(yī)生都應(yīng)該具備理解、評價和判斷證據(jù)質(zhì)量的能力。從研究或證據(jù)素材、方法和報告方面對證據(jù)質(zhì)量進(jìn)行批判性評價的工具有很多。對證據(jù)質(zhì)量進(jìn)行充分評價是很困難的。對證據(jù)的構(gòu)成要素進(jìn)行考察是評價證據(jù)質(zhì)量的最合理方法，而不是盲目地將證據(jù)分為高質(zhì)量或低質(zhì)量。掌握批判性評價的本領(lǐng)需要保有謹(jǐn)慎的態(tài)度、接受培訓(xùn)和不斷實踐。近年來，在對Cochrane新發(fā)表的系統(tǒng)評價進(jìn)行評估時，GRADE方法已成為不可或缺的一部分。GRADE是清晰、詳細(xì)、有效的證據(jù)質(zhì)量評級方法，為推薦意見的撰寫提供了支持，確保了證據(jù)呈現(xiàn)和指南制定的透明性。