孫 靜
(天津市天津醫院《中華骨科雜志》編輯部 天津 300211)
證據是循證醫學的核心,循證醫學倡導證據具有動態性(即最新的證據為最佳)以及指導性(即原始證據經過專業團隊的科學加工后方可成為證據)。因此證據的質量是循證醫學關注的重點問題。然而現實情況中研究的證據質量良莠不一,證據分級及推薦強度標準不一,這些問題都導致了早期對證據的濫用、誤用,以及對于臨床的誤導[1-2]。
從評價的內容角度看,質量評價工具分2種。一種是研究報告質量工具,通常指報告規范和指南,即作者在設計實驗前有效遵循指導性文件,可以減少實驗設計中的偏倚和分析誤差,如Prisma聲明、STROBE聲明等,這些質量規范指南多用于指導科研寫作的整體流程,規范報告格式[3-6]。另一種是研究方法學質量評價工具,通常是通過一些量表對研究設計進行評價,質量越高,研究的可重復性越好,其結果也越可靠。2種工具相輔相成,報告質量高的稿件方法學不一定優越,報告質量低的稿件有可能具有較高的方法學質量。2種工具都可以用于系統綜述和Meta分析的質量評價,前者多用于整體質量的把控,后者可以用于對納入原始文獻的質量評估。
在系統綜述和Meta分析的稿件審查中,納入原始文獻的質量評價方法和結果出現錯誤的幾率很高,最常見的錯誤就是作者沒有正確地使用評價工具。
質量評價工具并非一體適用,而是針對不同研究類型的方法學特點應采用不同的評價工具。如對于隨機對照研究(RCT),常用的工具有Cochrane風險偏倚評估工具、Jadad量表等,對應RCT的方法學特點,評價工具通常會對隨機方法、分配隱藏、盲法執行及意向性分析等方面進行評估[7];對于非隨機對照研究(non-RCT),主要的評價工具是MINORS條目和Reisch評價工具[8];而對于觀察性研究,質量評價工具一般采用NOS量表、CASP清單等。在稿件審查中,筆者發現作者經常會混淆不同的評價工具,主要原因一是作者對研究類型的理解不準確,二是對評價工具的用途不了解。比如:認為非隨機對照研究就等同于觀察性研究,因此采用觀察性研究的量表進行評估,實際上非隨機對照研究通常是前瞻性研究;NOS量表有2個表格分別針對隊列研究和病例對照研究,作者往往會將表格混用[9-11];有的稿件通篇無論哪種類型的研究,通用Cochrane風險偏倚評估工具。這些錯誤在稿件中十分常見,編輯需要細心甄別,發現錯誤應當要求作者選擇正確工具重新進行評估。
在這類文章的審查中,筆者發現很多文章在方法部分描述了對于納入研究的質量評價方法,但在結果部分卻未描述質量評價結果,或者只是簡單地一句帶過,對于這類情況,編輯應當要求作者補充質量評價的結果。有些作者即使對評價結果進行了描述,但描述過于籠統,缺少具體數據,編輯應當要求作者根據評價工具的內容對質量評估結果進行客觀描述,并且對評價的結果進行總結,如量表計算獲得的總分或者高風險/低風險文獻的數量,應明確納入研究的風險程度,還應附表格列出所有原始研究的質量評價各項結果和總評分。
目前已有的評價工具較多,主要有單個評價條目、清單和量表3種類型。一些評價工具采用分值對研究質量進行量化,如MINORS評價工具,一共包含12個指標,每一條可得0~2分(0分表示未報道; 1分表示報道了但信息不充分;2分表示報道了且提供了充分的信息),如果無對照組的研究適用于前 8條,最高分為16分,包含對照組的研究適用所有條目,最高分為24分[12]。一些評價工具的條目以問題形式出現,回答的方式是“低風險”“高風險”“不清楚”,如Cochrane風險偏倚評估工具,其評估內容包括對隨機序列的生成、分配隱藏、盲法、結局數據完整性、其他偏倚。
在稿件審查中,常常發現的錯誤是工具選擇正確但使用錯誤,如漏項未評估、項目重復評估、多余項目評估(如無對照組的研究采用MINORS評價工具,應采用前8條評估,作者卻評估所有項目)、分值計算錯誤(如每條應最高2分,作者卻打分3分),以及對指標理解有誤等[12]。指標理解有誤最為常見,現舉例如下:Cochrane風險偏倚評估工具中的第1條,研究中的隨機序列生成是否恰當?對于這一指標,很多作者認為研究中提及隨機或簡單描述隨機方法即為低風險,而實際上隨機序列的產生方式有多種,其中有一些是真正的隨機方法(低風險),如隨機數字表、扔硬幣、擲骰子等,而一些是半隨機或非隨機方法(高風險),如通過入院日期、住院或門診編號產生序列等方式。這類錯誤產生的原因也不同:一部分作者是因為疏忽或對指標內容理解不夠深入而導致評估錯誤;一部分是作者為了追求陽性結果而自主提高納入文獻的質量。但無論是哪種情況都會造成質量評價結果的不準確。
作為循證醫學最重要的評價方法,系統綜述和Meta分析采用定量方法,對已發表的多個文獻進行匯總分析,被認為是目前最具有循證證據的研究。系統綜述和Meta分析對原有結果進行再分析,只有從高質量的獨立研究中才能獲得高質量的綜合結論,如果原始研究質量低,又沒有正確地進行評價,最終結果就會存在偏倚,甚至可能得出不正確的結論而誤導臨床實踐[13]。因此作為醫學編輯,應當準確地了解這些評價工具對應的研究類型,并且掌握其使用方法,以便在編輯過程中甄別錯誤,及時修正。