葉志康,楊輝
循證醫學理念于20世紀80年代起源于加拿大McMaster大學,其主要創始人David Sackett教授及其學生Gordon Guyatt教授的一系列文章發表于JAMA,對循證醫學做出定義和描述,并最終匯編成書Users' Guides to the Medical Literature,該書在國內已經被翻譯成中文[1-4]。循證醫學不僅是指證據的產生(如開展臨床研究、系統評價和Meta分析及制定臨床指南等),也包含知識證據使用轉化,其目的是提供更有效的醫療服務和產品,增強衛生監護系統[5]。盡管循證醫學領域的專家已經做了相當大的努力促進臨床醫生基于證據來指導臨床決策,但醫學知識證據和臨床實踐行為之間仍然存在著一條鴻溝,大量的醫學研究證據不能被轉化運用于臨床實踐[6]。鑒于中國大多數臨床工作者仍然難以接觸并仔細閱讀這本書,尤其是基層醫生,故而本研究在Gordon Guyatt教授授權和指導下嘗試以更精簡的篇幅、更易懂的語言、結合案例對循證醫學進行方法學的說明,旨在幫助臨床工作者學會如何批判性閱讀、評價已發表的醫學文獻,并且運用這些文獻證據指導臨床實踐。本文分別從“臨床實踐指南的制定”“臨床實踐指南的制定過程中存在的問題”“臨床醫生如何運用臨床指南”3個部分進行分析,為更多研究者制訂指南,并在臨床中應用指南做出臨床決策提供參考。
第一部分主要向臨床專家介紹臨床實踐指南的定義和標準制定流程,以及基本的指南制定理念,為臨床工作者閱讀和運用臨床實踐指南夯實基礎。單純地依據指南發布協會、期刊及指南質量評價量表來評價指南質量并不全面、客觀,只有了解臨床實踐指南制定的核心過程和理念,才能更好地從內容上評價一個指南的優劣,進而將指南運用于自己的臨床實踐。希望臨床工作者在閱讀完這一方法學章節后,可以掌握臨床指南的核心內涵,遴選出實用且高質量的臨床指南。另外,對于希望主持制定臨床指南的中國專家,這一章節可以作為指南制定過程中基本且容易理解的“入門”讀物。
2011年,美國醫學研究院(Institute of Medicine,IOM)將臨床實踐指南的定義更新為包含了一至多條用于完善并優化患者監護條件的推薦意見的表述文本,而推薦意見的形成是基于系統評價總結的證據,以及不同干預措施的利弊平衡和相應的資源經濟學評估。臨床實踐指南的定義非常重要,其英文原文定義為:CPGs are statements that include recommendations intended to optimize patient care.These statements are informed by a systematic review of evidence and an assessment of the benefits and costs of alternative care options[7]。這是目前全球公認的臨床實踐指南定義,該定義精煉地概括了指南的內核。
IOM要求高質量、高可信度的臨床實踐指南必須符合以下6條要求:
(1)總結當下所有證據的系統評價;(2)由多學科臨床指南專家和患者代表組成的指南專家組制定;(3)合理考慮患者人群分類、患者意愿和價值觀;(4)指南制定過程清晰、具體且透明,盡可能減少指南制定過程中的偏倚和利益沖突;(5)指南提供證據級別和推薦意見強度,且為推薦意見提供清晰且符合邏輯的解釋;(6)新的、重要的證據出現且有可能改變現有推薦意見的時候,需要重新考慮或修改指南。
隨著臨床實踐指南方法學的發展,指南制定標準和流程也相應出現。目前國際上普遍接受和使用的指南制定標準有兩個:一個是世界衛生組織(World Health Organization,WHO)在2014年更新并出版的指南制定手冊(第2版)[8],另外一個是國際指南協作組織(Guideline International Network,GIN)和加拿大McMaster大學共同研發、制定的指南制定列表[9]。這兩個指南制定標準都可以免費下載,并且被翻譯成多種語言版本,包括中文版本。
上述兩個指南的制定標準相似,核心內容和要求一致。故本文將WHO和GIN-McMaster指南制定標準簡化匯總成更為簡潔、容易理解和操作的9個步驟。
規劃指南要充分考慮指南的必要性、目標人群、制定時限、授權協會或組織和資源。
?指南必要性:開始制定指南之前,指南指導委員會需要首先考慮一個核心問題:是否有必要制定或更新指南。制定一個臨床指南需要花費大量的人力、物力和財力,明確指南的意義尤為重要。
?指南目標人群:需在指南制定早期明確定義指南的目標人群(使用人群),目標人群是指使用指南的人群,而不是接受治療推薦或診斷措施的人群。政策制定者、衛生部門管理者、臨床醫生、護士、藥師及其他衛生專業人員都可以是指南的使用人群。指南使用人群決定了指南制定的角度,即可以從患者的角度制定指南,也可以從醫保的角度制定指南。例如國際指南組織(Making GRADE the Irresistible Choice,MAGIC)和BMJ合作的快速臨床實踐指南,都是從患者角度制定指南,故較少考慮推薦措施的經濟學效益[10];而臨床醫生和其他一線醫護人員更多從患者臨床結局考慮,而較少考慮社會醫療資源和費用問題;政策制定者和衛生部門管理者更多從整個衛生醫療資源系統方面考慮,其試圖以有限的醫療資源獲取最大化的醫療監護,故其非常重視干預措施的經濟學分析。
?指南制定時限:規劃指南需要考慮指南制定的時限,指南制定時長可以從幾個月到幾年不等,指南制定時限直接決定單位時間內投入的人力、物力和財力。WHO和各國疾病預防控制組織在面對全球或本國的急性傳染病疫情時,通常會在幾個月內快速完成傳染病指南/共識的制定,以應對快速傳播的疾病。McMaster大學Gordon Guyatt教授和葉志康博士團隊在2020年1月份開始規劃制定一部新型冠狀病毒感染(COVID-19)藥物治療指南,以幫助中國醫生治療COVID-19,這部指南及附屬的系統評價于2020年5月正式發表[11-14]。對于常規疾病的診療指南,各個學科協會一般多年更新1次,從指南開始啟動到發表常可達2年甚至更久。
?指南授權協會或組織:啟動指南制定工作前,需要確認授權或批準指南發布的協會或組織。指南推薦意見是由數量有限的臨床專家和患者代表制定的,如果能夠由協會或組織審核并授權,會極大地增加指南的權威性。協會或組織有自身的管理機構,在批準或授權指南發布之前會充分、審慎地審核和考慮推薦意見的合理性,以及指南制定過程的規范性。為了能夠最終得到協會或組織的授權,建議邀請協會或組織的代表專家加入指南專家組或指南指導委員會,并參與指南制定全過程,適當地接受協會或組織專家的意見,這對于最終取得協會或組織授權非常有幫助。
?資源:指南制定需要有充足的資源保證,包括人力、物力和財力。臨床指南基于系統評價總結的證據制定,所以如果是在進行系統評價研究的基礎上開發指南,則要投入大量的人力和時間。在指南的制定過程中,除了收集證據需要資金以外,開展線下會議形成推薦意見也需要大量資金,比如機票、車票、會議場地和食宿等,當然目前越來越多的指南制定者開始采用線上會議的方式,這樣既高效又經濟。除此之外,還有指南及附屬系統評價、經濟學評價的出版費用,國外期刊收取的指南出版費要遠高于一般臨床研究的出版費。最后,指南制定可能需要聘請指南方法學家參與,并應支付其相應的勞動報酬。
?組建指南指導委員會:在開始組建指南專家組之前,建議先組建包含指南臨床主席和方法學主席在內的指南指導委員會,人數一般在5名左右。指南指導小組成員必須準備好為指南制定工作分配大量時間,因此不滿足此條件的專家需要排除在外。
指南指導委員會的職責包括:
(1)為指南制定提供管理、監督及資源;(2)確定指南范圍并按照PICO(population,intervention,comparison,and outcomes of clinics)格式草擬指南臨床問題;(3)確定指南專家組成員,包括系統評價團隊;(4)撰寫指南計劃書;(5)監督證據收集和綜合,草擬指南證據概要表;(6)收集并審核專家組的利益沖突表,并做出相應處理;(7)草擬指南的患者價值觀和偏好;(8)組織指南專家組會議以形成推薦意見;(9)基于指南專家組會議達成的共識撰寫指南初稿。
?組建指導專家組:指南推薦意見由指南專家組集體討論后決定,一般指南專家組成員為25名左右,包括熟悉該領域的多學科專家及指南受眾(患者代表或者患者監護人)。指南專家組成員數量可以根據實際情況增減,指南專家組一般設臨床主席和方法學主席各1名。
指南專家組的職責包括:
(1)審閱指南指導委員會草擬的指南范圍和具體臨床問題,并提出補充意見;(2)在掌握各種指南所采用的證據分級和推薦意見強度分級系統的基礎上,對指南重要臨床結局進行打分,審核指南證據概要表并提出意見;(3)客觀且充分地參與指南會議討論并形成推薦意見,需要綜合考慮推薦治療措施的利弊平衡、患者價值觀、患者意愿和偏好、經濟學分析、可行性、公平性、可接受性等因素;(4)審核并修改指南正文文本。
高質量的隨機對照試驗和系統評價一般會在注冊平臺注冊以避免重復性工作,如美國臨床試驗數據庫(clinicaltrials.gov)和國際前瞻性系統評價登記冊(PROSPERO)平臺。蘭州大學GRADE中心牽頭建立了全球第一個指南注冊平臺[15],這個平臺在國內用得比較多,國際上暫未普及。
指南注冊平臺國際上使用較少的原因主要包括:
(1)與系統評價和隨機對照試驗相比,臨床實踐指南有其獨特性,每個國家的協會都會基于學科發展常規在協會所屬期刊發布臨床實踐指南,如美國、歐洲、加拿大和中國各自發表的高血壓指南[16-19]。(2)不同于系統評價,指南推薦意見與本國的經濟發展水平和文化氛圍密切相關。以高血壓為例,面對同樣的證據,美國高血壓指南更追求強化降壓,建議收縮壓低于130 mm Hg(1 mm Hg=0.133 kPa)[16],而中國、歐洲和加拿大的血壓目標值更高一些[17-19]。(3)系統評價更多的是客觀地總結臨床證據,隨機對照試驗更多的是展示其臨床結果和數據,但是臨床實踐指南的制定帶有更強的主觀性,故同樣的臨床研究,其證據級別有可能會不一樣,推薦意見強度和方向也可能不一樣。
與系統評價和臨床研究一樣,指南制定也可以撰寫指南計劃書。指南計劃書可以提供清晰、深入和全面的規劃,有助于指南制定者按照規劃要求制定高質量的臨床指南,有助于指南指導委員會提前計算指南工作量和需要的資源。
指南制定過程講究透明和公平,利益沖突的聲明和管理對制定公平、可靠的指南至關重要,指南專家組所有成員必須如實填寫利益沖突聲明表。利益沖突分為經濟利益沖突和學術(非經濟)利益沖突。存在經濟利益沖突的個人絕對不能夠參與推薦意見的形成,但可以適當允許學術利益沖突的存在。
?經濟利益沖突:指南制定專家持有醫藥公司的股票或專利、接受醫藥公司兼職聘用的報酬或者演講酬金,而這些經濟利益很有可能導致指南出現偏倚,降低指南可信度。
如參與指南制定的一位專家是某藥廠的顧問,或者從藥廠接受了研究資金或講課酬勞,且該藥廠與指南涉及的藥物或醫療器械存在直接關聯,則認為該專家具有很強的經濟利益沖突,是不被允許參與推薦意見形成的。
?學術利益沖突:研究者對某一學術觀點持有某種程度的偏好和堅持,學術利益沖突通常和自己之前的研究課題、教育背景、所在研究機構相關[20-21]。
如某研究者曾經發表過一篇研究表明A干預措施優于B干預措施,且該指南涉及干預措施A和B的推薦意見,那么該研究者對這一條推薦意見存在潛在的學術利益沖突,其有可能會執著于“A優于B”這個觀點,進而影響指南推薦意見的形成。學術利益沖突并不能完全避免,因為指南專家組成員都是熟悉該領域的專家,不可避免地會納入一些開展過這個領域研究的專家。
對于上述舉例,仍然可以允許該研究者成為指南制定組專家成員,但不允許其在這一條推薦意見上發表看法或參與投票?;诖耍改蠈<医M每一位成員都需要仔細、如實地填寫利益沖突聲明表,指南指導委員會需要透明、客觀地評估是否存在利益沖突及其可能產生的結果,并管理所有重大的利益沖突。指南文本應該如實、細致地公開指南所有的利益沖突,并且報告解決該利益沖突的措施和辦法。
?形成指南PICO問題:確定指南具體臨床問題后,需要將指南臨床問題轉化成PICO格式,以便于系統地檢索證據。
如將臨床問題“對于感染耐甲氧西林金黃色葡萄球菌的成年患者,應該選擇哪種抗生素?”轉化成PICO格式:P為感染耐甲氧西林金黃色葡萄球菌的成年患者,I為萬古霉素,C為利奈唑胺、替考拉寧,O為死亡率、感染治愈率及嚴重藥物不良反應。
在開始規劃指南時,需要確定該指南擬解決臨床問題的數量,每一個臨床問題至少對應一個系統評價,指南臨床問題越多,所需要的時間、人力和資金就越多。
?選擇臨床結局:比較不同的治療或診斷技術常涉及多個臨床結局,包括對患者有利的結局,也包括對患者有害的結局。有的結局非常重要,如死亡率;有的結局重要性一般,如輕度的藥物不良反應。所以選擇臨床上對患者重要的臨床結局并進行打分非常有必要。
GRADE系統將臨床結局按1~9分打分:7~9分是對患者至關重要的結局,4~6分是重要的結局,1~3分是一般結局[22]。以朝陽醫院藥劑科牽頭制定的胃腸道出血預防用藥的BMJ快速臨床指南為例,該指南選擇死亡、臨床明顯胃腸道出血、肺炎、艱難梭菌感染為主要結局,并且總結了這4個臨床結局的證據概要表,對于一般胃腸道出血并沒有考慮[23]。
指南推薦意見的形成需要基于系統評價總結的最佳、最全面的證據。所以系統評價成了整個指南最堅實的基礎,如果指南的系統評價是未更新的、有偏倚的、低質量的,那指南推薦意見的可信度將會降低。所以接下來的問題是指南的系統評價從何而來。
?檢索并評估系統評價:更方便且高效的方法是直接檢索并評價現有的系統評價和Meta分析?;谥改螾ICO問題檢索PubMed、EmBase和Cochrane數據庫,納入所有符合臨床問題PICO的系統評價,如果檢索出的系統評價較多,可以只考慮3年內或5年內發表的系統評價。
建議采用 ROBIS[24]或 AMSTAR 2[25]質量評價工具判斷系統評價的質量,選定高質量的系統評價后,專家組通常需要對其進行更新。如選定的系統評價是2021年7月發表的,其檢索時間截至2021年1月,那么指南專家組需要從2021年1月開始檢索,納入新出現的臨床研究。更新系統評價通常比制定新系統評價花費更少且更加節省時間。
?制定系統評價:如果沒有合適的已發表的系統評價,指南專家組需要組織人力制定系統評價,這一步驟更為耗時、耗力。
?證據概要表:系統評價的篇幅較長,可能超過10頁,將系統評價結果總結成簡潔且明了的證據概要表呈現給臨床指南專家組是最方便、高效的方法。目前被廣泛接受的證據概要表是GRADE證據概要表。
GRADE系統是按照單個臨床結局來總結臨床證據,將證據質量分為4級:高、中、低和極低。將隨機對照試驗初始定義為高質量證據,觀察性研究初始定義為低質量證據,并且從5個維度來進一步評價證據質量,即研究偏倚、間接性、不精確性、不一致性和發表偏倚,任何一個維度有明顯偏倚和缺陷都可以將證據質量降1級甚至2級,因此隨機對照試驗的質量也可以降級為中、低,甚至是極低質量[26-31]。本研究組會在接下來的系列文章中進一步闡述GRADE系統。
指南專家組審核、確認最終的證據概要表后,可以開始舉辦指南專家組全體會議,討論形成推薦意見。GRADE系統將推薦意見分為強和弱兩級,推薦意見的形成由以下4個主要因素決定,分別為:證據質量(對證據效應評估準確度的信心)、利弊平衡、患者偏好和價值觀、經濟資源[32]。除此之外,公平性、可接受性、可實施性、文化氛圍等因素也需要被考慮。
?證據質量:證據質量是確定推薦意見強度的關鍵因素,證據質量越高,形成強推薦的可能性越高,但這不意味著高質量證據一定會形成強推薦[32]。如:高質量證據證明新開發治療藥物A療效和安全性優于現有治療藥物,但是藥物A價格昂貴,超出了發展中國家的醫保承受范圍,則有可能得出在發展中國家弱推薦使用藥物A的結論。
?利弊平衡:任何治療或診斷措施對患者都有收益和弊端,當該治療或診斷措施對患者的收益明顯多于弊端時,推薦意見強度更有可能成為強推薦;當該治療或診斷措施對患者的收益和弊端相當時,推薦意見強度更有可能成為弱推薦。如:高質量的證據表明新開發藥物B療效明顯優于現有治療藥物,但同時高質量證據也表明該藥物B有明顯的不良反應,利弊平衡,則仍有可能弱推薦藥物B。
?患者價值觀和偏好:患者價值觀和偏好與推薦意見強度密切相關?;颊邇r值觀和偏好定義比較廣泛,包括患者的角度、治療理念、治療預期和生命健康目標,也包括患者權衡不同治療或診斷措施所帶來的收益、弊端、經濟負擔的過程[33]?;颊邇r值觀和偏好可以用定量數據表示,也可以用定性數據表示。
指南專家組獲得患者價值觀和偏好有4種方式:
(1)已發表的關于該指南治療領域患者價值觀和偏好的系統評價,這種方式最為簡便、高效;(2)如果沒有已發表的系統評價,指南專家組可以開展制定關于該指南治療領域患者價值觀和偏好的系統評價,前提是有已發表的患者價值觀和偏好的臨床研究,鈉-葡萄糖協同轉運蛋白2(SGLT-2)抑制劑和胰高血糖素樣肽-1(GLP-1)受體激動劑臨床應用指南的制定就是采用了這種方法[34-35];(3)如果既沒有相關系統評價也沒有臨床研究,指南專家組可以設計問卷,調查患者關于該領域的價值觀和偏好,這一方法最為費時;(4)指南專家組成員基于醫療經驗從患者角度填寫問卷,從而得到患者價值觀和偏好的數據,胃腸道出血預防用藥的BMJ快速臨床指南就是采用這一方法制定[23]。
?經濟資源:由于醫療資源整體有限,故應追求以有限醫療資源獲得最大化的患者臨床收益。因此指南推薦意見也涉及衛生經濟學范疇,衛生經濟學家可以被邀請加入指南專家組。必要時可以開展經濟學評價并將其作為推薦意見形成的證據基礎。
?推薦意見形成過程:通過召開指南專家組會議形成推薦意見,達成推薦意見的方式有多種。
達成推薦意見的方式包括:
(1)所有指南專家組成員通過充分公開討論達成一致的推薦意見;(2)采用匿名的投票方法,這種方法可以降低指南專家組中某一位或幾位權威專家對其他專家造成的影響和壓力;(3)非匿名的投票方法。
這幾種方法沒有明顯的優劣,可以根據具體情況自由選擇,也可以兩種方法結合使用,如先充分討論達成共識,如果無法達成共識,再采用投票的方法。
指南制定過程是知識產生的過程,而指南傳播和實施是知識轉換的過程,指南制定最終的目標是將臨床證據轉化到臨床實踐中。
?指南格式:指南格式與指南被接受度密切相關,很多指南都已經將推薦意見集中寫在指南正文醒目位置,大寫、加粗、加框顯示。BMJ快速臨床指南系列創新性地將證據和推薦意見用彩色流程圖顯示[23],這一經驗可供中國指南和期刊借鑒。
?指南發布、發表和傳播:指南指導委員會在指南發布或發表后應該盡可能地在相關學術會議、報紙和醫療網站推廣該指南。指南應該盡可能地爭取發表于高水平的專業期刊。
?指南實施:建議指南制定者在規劃指南時考慮指南實施的計劃。指南推薦意見形成過程必須要考慮指南實施潛在的障礙和有利因素,考慮到指南的可實施性和可操作性。針對指南實施潛在的障礙或不利因素,指南文本應該提供相應的解決辦法。同時可以嘗試將指南推薦意見嵌入醫院決策系統或手機應用程序(APP)。
臨床實踐指南是指包含一至多條用于完善優化患者監護的推薦意見的表述文本,而推薦意見的形成是基于系統評價全面總結的證據、不同干預措施的利弊平衡及相應的資源經濟學評估[36]。臨床實踐指南的制定過程標準嚴格,其對醫生臨床實踐具有非常重要的指導意義,一般由各國相應學會組織制定并以學會的名義發布,有較高的公信力,政府部門一般并不參與其中。本文以2022年11月發布的中國高血壓臨床實踐指南為例,從指南制定方法學角度反思、闡述中國臨床指南制定領域存在的5個重要不足和忽略之處,包括學術利益沖突處理不當、忽略絕對效應量、不采用GRADE證據概要表、忽略患者意愿和價值觀及沒有充分考慮醫療資源花費情況(衛生經濟學)。本部分不對該指南的臨床內容做出評價。
指南利益沖突分為經濟利益沖突和學術利益沖突,美國醫學研究所將利益沖突描述為“可以影響個體人員以開放性思維去探討一個科學問題的能力的一種經濟或學術關系”[36]。經濟利益沖突更多是指持有相關醫藥公司的股票或專利、接受相關醫藥公司兼職聘用的報酬、演講酬金或研究資助等。經濟利益沖突更容易被臨床專家和指南方法學專家理解和注意,不容易被指南制定者忽略。相比之下,學術利益沖突更為隱蔽,常不被臨床專家所了解,學術利益沖突是指個體專家的學術研究活動導致其可能持有某一特定看法觀點,這種觀點過度地影響其對某一具體推薦意見的判斷,這種學術活動包括個體專家發表的臨床研究、系統評價、指南或書籍等[37]。
以中國高血壓臨床實踐指南為例,該指南主要作者2021年以通信作者身份在新英格蘭醫學雜志發表一篇隨機對照試驗(STEP研究),研究結果表明在60~80歲高血壓患者中,與常規降壓(130~150 mm Hg)相比,強化降壓(110~130 mm Hg)可以顯著降低心血管事件[38]。這種情況下,該作者在降壓目標值和高血壓診斷標準的推薦意見上存在明顯的學術利益沖突,正確合理的做法是至少應該請該作者在降壓目標值和高血壓診斷標準的推薦意見上采取回避的態度,不對推薦意見發表意見或者投票。
研究表明美國胸科醫師協會發布的第九版抗栓指南有431條推薦意見,其中63條(15%)推薦意見至少有1名指南專家組成員報告學術利益沖突[39]。相比之下,該高血壓臨床實踐指南專家組包括眾多中國一流的心血管專家,應該會存在相當數量的學術利益沖突,但是該指南正文聲明所有作者聲明無利益沖突。因此學術利益沖突的報告和處理是今后需要非常重視的一個方面。
該高血壓臨床實踐指南將降壓目標值下調到<130 mm Hg,指南正文解釋是強化降壓可以將心血管事件相對風險降低20%~30%。心血管事件相對風險降低20%~30%表面上看起來效應量很大,效果顯著,但這僅僅是相對效應量,那心血管事件絕對風險降低多少呢?本部分以STEP研究為例,列出強化降壓所帶來的心血管事件的相對風險獲益和絕對風險獲益(表1)[38]。通過風險比(HR)可以估算出強化降壓確實可以將卒中和急性冠脈綜合征的發生風險相對降低30%,但是絕對風險都僅降低0.6%,心血管死亡率僅降低0.2%,這些不算顯著的心血管事件獲益是否能夠支持推薦強化降壓呢?畢竟強化降壓導致更高的藥物劑量、更多的藥物不良反應及更多的醫療資源花費。這就涉及患者意愿和價值觀及醫療資源花費等問題。

表1 強化降壓與常規標準降壓對心血管事件影響Table 1 Effect of intensive and standard blood pressure lowering on cardiovascular events
GRADE已經成為全球使用最為廣泛的臨床實踐指南證據和推薦意見強度分級系統[31],中國已經從McMaster大學國際GRADE中心引進了3個GRADE中心,這3個中心對中國臨床實踐指南的發展起到了巨大的推動作用,目前中國臨床指南也主要采用GRADE系統。GRADE系統的一個重要組成部分就是GRADE證據概要表,證據概要表按照臨床結局進行證據匯總和分級,只展示對患者重要的臨床結局證據,包含納入研究數量和研究人群樣本量,相對效應量、基線風險和絕對效應量、證據分級及證據降級升級因素,最為簡潔地向臨床醫生展示臨床干預措施的效應量大小、利弊和證據可信度。該高血壓臨床實踐指南并沒有提供或展示任何一個GRADE證據概要表,而是文字描述一部分臨床結局的證據,且幾乎都是只展示相對效應量,沒有絕對效應量和相對應的證據級別。
推薦意見形成需要考慮患者意愿和價值觀[32]。強化降壓意味著更高的藥物劑量、更多潛在的藥物不良反應,以及更多的醫藥花費,那患者是否依然愿意接受強化降壓呢?這取決于患者接受強化降壓的意愿及對強化降壓的看法,即患者認為至少應該達到某種程度的臨床獲益才愿意接受強化降壓,這就涉及方法學上的一個概念——最小臨床意義差值(minimum clinically important difference)。
目前常缺乏對最小臨床意義差值的研究,為了快速得出患者對某一治療措施期望的最小臨床意義差值,指南制定方法學專家可以設計患者意愿和價值觀問卷,由指南專家組成員基于和患者溝通的經驗,站在患者角度完成該問卷。比如2022年發表的PCSK9抑制藥和依折麥布BMJ快速臨床實踐指南,指南專家組成員通過完成問卷得出死亡率的最小臨床意義差值為0.8%,非致命性卒中的最小臨床意義差值為1%,非致命性心肌梗死的最小臨床意義差值為1.2%[40]。再比如急性大卒中機械取栓合并靜脈阿替普酶的臨床實踐指南通過問卷調查得出卒中后自主行動、死亡率和癥狀性顱內出血的最小臨床意義差值分別為1.0%、0.8%和 1.0%[39]。
除了最小臨床意義差值,患者意愿和價值觀也體現在臨床結局重要性評判方面。前面提到GRADE證據概要表需要包含所有對患者重要的臨床結局,那如何判斷哪些結局是對患者重要的呢?在問卷設計時可以納入所有可能的臨床結局,指南專家組成員站在患者的角度,選擇患者認為重要的臨床結局,并相應打分。GRADE系統將臨床結局重要性按1~9分打分,7~9分表示對患者至關重要的結局,4~6分表示重要的結局,1~3分表示一般結局[22]。中國高血壓臨床實踐指南缺乏相應的患者意愿和價值觀信息,沒有展示患者重要結局的最小臨床意義差值。
推薦意見的第四個考慮因素是醫療資源花費。全球目前只有美國高血壓指南推薦將降壓目標值下調為<130 mm Hg[41],歐洲高血壓指南依然推薦將降壓目標值穩定在130~139 mm Hg[42]。各國降壓目標值和高血壓診斷標準必然與各國的經濟發展情況和醫療資源相互聯系。中國作為中等收入國家,將高血壓標準從≥140/90 mm Hg下調為≥130/80 mm Hg,可導致增加至少3億名高血壓患者,將會沉重增加醫保負擔。當然強化降壓確實可以預防一定數量的心血管事件發生,該指南在修改高血壓診斷標準和降低降壓目標值之前,應該開展嚴格的經濟學評價研究高血壓診斷標準下調和強化降壓帶來的衛生經濟學效益,而且經濟學評價必須是基于中國的臨床醫療資源數據和社會成本數據。很顯然該指南并沒有相應的經濟學評價支撐,盡管該指南有衛生經濟學家參與。
臨床實踐指南對臨床醫生開展臨床實踐具有重要的指導意義,嚴格按照國際指南制定標準制定中國臨床實踐指南非常重要。在中國指南方法學家和中國GRADE中心的參與和推動下,中國臨床指南的質量有了顯著的提高,但也存在一些重要的不足和誤區。本文以發布的中國高血壓臨床實踐指南為例,列出中國臨床實踐指南制定需要著重提高的5個方面:重視學術利益沖突并積極處理規避;注重絕對效應量而不只關注相對效應量;建議采用GRADE證據概要表總結臨床證據;重視患者意愿和價值觀,并將其作為推薦意見形成的一個重要因素;考慮醫療資源花費和衛生經濟學效益。
針對某一臨床問題,有可能檢索到多個臨床指南,有時甚至各指南的推薦意見都不一致,這個時候就需要臨床醫生能夠有能力評價指南推薦意見的可信度。建議從以下6個方面快速判斷推薦意見的可信度。本部分不是評價指南的報告規范,而是關注推薦意見的內核,判斷推薦意見的質量和可適用性。
高質量、可信度高的推薦意見會清晰地表述推薦的治療措施、相對比的治療措施、臨床結局及推薦意見適用的人群。
可從以下方面評價推薦意見是否明確:
(1)推薦干預措施是否清晰、可操作:比如推薦藥物A治療某疾病,最好能夠明確給藥劑量、頻次和給藥途徑等,推薦意見能否在自己所在的醫療單位得到應用。(2)對照組是否明確:推薦干預治療措施常對應著對比治療措施,每一個PICO問題也包含著干預(intervention)和對照(comparison)。(3)基于哪些結局做出的推薦意見:推薦意見的形成需要考慮推薦治療措施所帶來的利弊平衡,推薦意見形成是否考慮所有相關的患者重要臨床結局,會產生哪些有益的臨床結局,哪些不利于患者的臨床結局。治療措施常具有治療益處,也可能存在與之伴隨的不良反應。比如抗凝藥物可以預防卒中的發生,但也有引起臨床大出血的風險。
當指南的推薦意見有較大的差異時,不能以指南發表期刊、指南發表組織或者其他因素簡單判斷哪個指南的推薦意見更有可信度。需要仔細查看推薦意見基于的證據、利弊平衡等因素。高質量的指南會在每條推薦意見下面闡述形成該推薦意見的理由,包括證據質量、利弊平衡、資源花費和患者意愿價值觀等因素。指南證據的收集形式常是系統評價和Meta分析,高質量的指南推薦意見會基于全面且最新的臨床證據。
不同國家和地區有不同的文化習慣和價值觀,往往治療選擇也會有一定的差異,甚至同一個地區不同患者對臨床結局的優先側重也不一樣。高質量國際指南會專門描述該指南所持有的患者意愿和價值觀,因此臨床醫生在閱讀國外指南時需要考慮不同國家和地區之間患者意愿和價值觀的差異,在臨床實踐中更多地鼓勵患者參與臨床決策,充分考慮患者的意愿。
高質量臨床指南的推薦意見會同時提供相對應的證據分級和推薦意見強度,這樣有利于臨床醫生判斷該推薦意見基于證據的可信度及推薦意見的強度。不同指南可能采用不同的證據和推薦意見強度分級系統,臨床指南一般會在方法部分寫出該指南所采用的分級系統,并解釋不同級別對應的含義。加拿大家庭醫生期刊發表的慢性疼痛指南采用GRADE分級[43],GRADE將證據分為高、中、低和極低4個等級,依次表明證據可信度的下降;將推薦意見強度分為強和弱兩級[31]。
標準的臨床實踐指南會在每一條推薦意見下面闡述形成該推薦意見的理由(rationale),解釋如何在綜合考慮證據質量、利弊平衡、患者意愿和價值觀和資源花費等因素后形成該推薦意見。臨床醫生可以清晰地看到該條推薦意見形成的背后邏輯,自行判斷是否合理,以及可以更加深刻理解并運用該推薦意見到臨床實踐中。
高質量臨床實踐指南應該明確列出所有相關的利益沖突及解決利益沖突的措施,指南存在嚴重利益沖突且無有效應對措施會嚴重影響指南可信度。臨床醫生在判斷推薦意見可信度時,需要查看臨床指南是否存在嚴重利益沖突。
綜上,本文一方面采用簡潔、通俗、易懂的語言概述了臨床實踐指南的定義、標準制定流程及存在的問題,有助于臨床工作者對臨床指南制定有一個基本且全面的了解;另一方面介紹了臨床醫生如何評價推薦意見,如何運用臨床指南推薦意見。臨床醫生不僅需要查閱相關臨床指南解決臨床問題,更要評價推薦意見的可信度,分析推薦意見基于的證據,更加清晰地掌握推薦意見形成的內在邏輯,這對于臨床醫生靈活運用推薦意見指導臨床實踐非常有幫助。臨床醫生應該基于臨床實踐指南善于和患者共同討論、制定臨床治療方案,共同決策。受限于國內醫療實際情況,臨床醫生往往面對大量患者,以至于不能和患者充分溝通討論。充分地與患者溝通,將指南推薦意見及臨床證據簡單、明了地告知患者,讓患者或患者家屬充分參與到治療中,可以提到患者醫療滿意度和依從性。
作者貢獻:葉志康負責欄目構思與策劃、資料收集、文章撰寫與修訂;楊輝對文章提供指導和支持。
本文無利益沖突。