廖世英,劉健
?
隨機對照試驗的質量評價方法及其在針灸臨床文獻中的應用分析
廖世英1,劉健2
(1.天津中醫藥大學,天津 300193;2.天津中醫藥大學第一附屬醫院,天津市針灸學重點實驗室,國家中醫藥管理局腦病針刺療法重點研究室,國家中醫藥管理局針刺量效關系三級實驗室,天津 300193)
針灸療法;質量評價;隨機對照試驗;綜述
隨機對照試驗(RCT)被認為是評價醫學干預措施有效性和安全性的“金標準”。將RCT應用于中醫藥(包括針灸)的臨床療效評價具有重要意義。由于目前各RCTs的質量參差不齊,影響了其證據強度,因此需要對RCTs進行質量評價,但目前尚無統一的標準可用于RCTs的質量評價。現筆者將臨床隨機對照試驗的質量評價方法做一概述,并分析其在針灸臨床文獻中的應用情況及存在問題。
1.1.1 CONSORT聲明
20世紀90年代中期,為改進RCT報告質量, CONSORT聲明(Consolidated Standards of Reporting Trials,隨機對照試驗報告的統一標準)[1]發表,并于1999年做了修訂。修訂版清單條目分為題目、摘要、引言、方法、結果和評論共6個部分,共22項條目,并配以流程圖來描述受試者參與RCT的過程[2]。聲明現已得到國際上著名的14個組織機構和120余家醫學期刊的認可,并簽約使用,作為RCT報告的作者、審稿人和編者撰寫、評價和發表的重要指南[3]。CONSORT聲明向我們展示了理想的試驗報告格式,但評價項目較多,因此評閱結果分值較低,評閱時間長,難度較大。
1.1.2 Cochrane系統評價手冊推薦的方法
Cochrane系統評價使用Cochrane手冊推薦的方法對納入的臨床試驗進行質量評價。Cochrane協作網于2007年推出了Cochrane手冊5.0版,其推薦采用由Cochrane協作網的方法學家、編輯和系統評價員共同制定的新的“偏倚風險評估”工具對隨機對照試驗的質量進行評價,對老版本進行了一些改進,包括6個方面,①隨機分配方法;②分配方案隱藏;③對研究對象、治療方案實施者、研究結果測量者采用盲法;④結果數據的完整性;⑤選擇性報告研究結果;⑥其他偏倚來源。評價結果不僅采用文字和表格描述,還要求采用圖示,更形象、直觀反映偏倚情況。此評估工具對每一條的判斷均有明確標準,減少了評估者主觀因素的影響,保證評估結果有更好的可靠性[4]。
1.1.3 Jadad量表
該量表[5]是Jadad等人1996年為評價臨床疼痛治療試驗質量制定的一個量表。Jadad量表對臨床試驗質量的內部有效性進行了評價,包括隨機、雙盲、隨訪和失訪三個方面,共計5分。由于這三項并不包含有疼痛研究中特定內容,因此也可以應用于評價其他臨床試驗研究,已成為評價臨床試驗的重要工具。該量表簡單明了,沒有盲目地將所有教科書中認為重要的項目全部納入,直接評價試驗效應估計中與偏倚有直接關系的試驗因素,但難以對一篇文獻質量形成一個總體印象。
1.1.4 Delphi清單及其發展量表
Verhagen[6]等人于1998年采用Delphi法制定了Delphi清單。其包括內部有效性、外部有效性和統計分析三個方面,共8個項目。Delphi清單是專門用于評價臨床試驗文獻質量的工具,制作過程規范,并且代表了部分專家的意見,信度和效度較高。
還有幾種量表是以Delphi清單為基礎發展而成,如MAL量表[7]、Van Tulder量表[8]和PEDro量表[9]。MAL量表和Van Tulder量表最初應用于Cochrane協作網中有關背痛的研究,由于量表的信度和效度較高,現已經擴展至較多領域應用。PEDro量表在PEDro數據庫(The Physiotherapy Evidence Database)中應用廣泛,信度較好[10]。
1.1.5 Chalmers量表
Chalmers量表[11]是Chalmers于1981年制定,最初用于評估阿司匹林在冠心病中的應用,包括試驗設計、統計分析和結果3個部分,計100分。該量表的制定沒有采用專家小組方法而是依據經驗選擇評價項目和給予評分,故本身就可能存在選擇性偏倚。該量表可以從整體上了解試驗的質量,但完成一個試驗的評價時間較長。
1.1.6 臨床試驗文獻質量評價量表
我國研究人員在臨床文獻質量評價的量表制作方面也進行了有益的探索。周登遠等[12]采用Delphi法,制定了臨床試驗文獻質量評價量表,共19個項目,總計100分,包括引言、材料與方法、結果、討論及其它4部分。該量表更注重試驗的內部有效性,有詳細的評分標準以及量表的說明,比較符合中文文獻結構和撰寫臨床習慣。
還有一些量表應用于某些專門領域。例如應用于骨科的Bhandari Scale[13],口腔科的Nguyen Scale[14],臨床放射檢查的Arrive量表[15]和Andrew Modilied 量表[16],藥物研究領域的Cho and Bero量表[17],公共衛生的Balas量表[18],Downs and Black量表[19],護理專業的Sindhu量表[20];還有適用于術后腸外營養試驗的Detsky量表[21],疼痛心理試驗的Yates量表[22],髕骨疼痛試驗的Bizzini量表[23],酒精性肝炎試驗的Imperiale量表[24],適用于疼痛評價的Oxford Pain Validity量表[25]。由于這些量表的應用范圍比較局限,因此對它們的研究也相對較少。
目前,中醫臨床文獻評價方法基本上還處于借鑒循證醫學和臨床流行病學方法的初步階段,采用的方法都是國際上比較通行的臨床文獻質量評價方法,還未形成能反應其自身特色的評價體系[26]。由于針灸療法的特殊性,近年來,針灸研究者嘗試制定了專門用于針灸臨床研究的質量評價標準。
1.3.1 《循證針灸臨床實踐指南》文獻質量評價標準
2007年《循證針灸臨床實踐指南》得到中國針灸學會授權,擬通過中國針灸學會向全國范圍內發布。臨床文獻的質量評價是該指南的一個重要的方面。指南組遵循循證醫學的原則和方法,結合針灸學科特點,制定文獻質量評價標準及相應量表,通過反復專家咨詢和論證,最后形成評價標準[27]。該標準的特點是文獻評價內容不但包括隨機對照試驗,還包括非隨機同期對照試驗和病例敘述性研究,使得后者的質量也獲得了較為合理的評判標準。隨機對照試驗的質量評價標準參考了Jadad標準,將文獻質量分為A、B、C三級;非隨機同期對照試驗和病例敘述性研究均有詳細可行的質量評價量表,文獻質量分為高質量和低質量。
1.3.2 STRICTA標準
為了規范針灸臨床試驗報告,一群有經驗的針灸醫師、研究者和醫學期刊編輯在C0NSORT基礎上起草了一份有關針刺臨床干預措施報告的國際標準——Standards for Reporting Interventions in Controlled Trials of Acupuncture(STRICTA),于2002年發表[28],全文可從http://www.stricta.info/網址免費下載,國際上已有多家期刊采納該標準,我國的《中國循證醫學雜志》要求使用該標準作為針刺試驗的報告規范。該標準要求針灸臨床試驗在針刺理論依據、針刺措施的細節、治療方案、輔助干預措施、針灸師的資歷、對照干預措施等方面做出詳細報告。STRICTA標準是專為有對照組的臨床針灸試驗報告干預措施而設,其關注點在如何報告針灸干預措施,并非像CONSORT聲明那樣包括了對臨床試驗報告從題目、摘要、前言、方法、結果、結論到討論的全部內容。所以,STRICTA聲稱“需要與CONSORT”聯合使用,作為CONSORT清單中干預措施報告要求的擴展部分[29]。近年來,STRICTA與其他質量評價方法(例如CONSORT聲明)結合應用于針灸臨床試驗的質量評價逐年增多,越來越受到重視。
為了解目前針灸臨床隨機對照試驗常用的質量評價方法,筆者在CNKI數據庫檢索了2003年以來發表的評價針灸隨機對照試驗質量的文獻和相關系統評價/meta分析,對其使用的質量評價方法進行統計。共檢索出59篇有關針灸治療的系統評價/meta分析和21篇有關針灸隨機對照試驗質量評價的文獻。其試驗質量評價方法的使用情況詳見表1。
在有關針灸治療的系統評價/meta分析中,對于納入臨床試驗的質量評價,大多使用了Cochrane系統評價手冊推薦方法和Jadad計分;而在有關評價針灸隨機對照試驗質量的文獻中,大多使用作者自擬標準和Cochrane系統評價手冊推薦方法,還有部分文獻使用了STRICTA標準與CONSORT聲明結合評價針灸臨床試驗的質量,而Jadad計分的使用并不普遍。
目前,醫學文獻的質量評價方法繁多,各有特點, 涉及領域較廣。但是由于針灸學科特點和文獻特點,如果將國外的質量評價方法生硬地運用于中醫臨床試驗,必然會存在一些問題。中醫學者[26]認為,雖然隨機對照試驗被公認為是評價療效的“金標準”,但是對于中醫這個具有鮮明個體化診療特色的醫學模式,應用群體化的隨機對照試驗很難反映出中醫辨證論治的特點,并不能真正反映中醫的臨床療效。有研究者[30]對針灸臨床文獻進行了調查,發現目前的針灸臨床文獻臨床隨機對照試驗雖呈逐漸增多趨勢,但觀察或敘述性研究以及專家經驗,仍然是中醫臨床實踐記錄不可或缺的重要方式。對這部分內容,不能簡單地因其被循證醫學列為低級別證據而將其放棄,應對其發掘整理,從中醫角度確立其證據價值。在此方面,《循證針灸臨床實踐指南》文獻質量評價已做了有益的探索,但專家經驗類文獻未包括在內。

表1 針灸臨床試驗質量評價方法統計結果 [n(%)]
根據側重點不同,質量評價包括對報告質量的評價和試驗質量(內部有效性)的評價。在對針灸臨床文獻進行質量評價時,有時應根據需要結合使用。例如CONSORT聲明側重于對試驗報告質量的評價,一些量表和清單則側重于對試驗質量的評價。而STRICTA標準更側重于針灸臨床試驗的干預措施的報告,并非試驗的內部有效性。《循證針灸臨床實踐指南》文獻質量評價更側重于試驗的內部有效性,并非試驗的報告質量,可以與STRICTA標準結合使用,避免了CONSORT聲明評閱難度大的缺陷。
臨床試驗質量的高低反映了針灸臨床研究的整體水平。結合針灸的特殊性,形成一套成熟的既能被國際認可,又能充分反映中醫針灸自身特點的臨床試驗質量評價方法,是國內針灸界急需完成的一項重要工作。《循證針灸臨床實踐指南》文獻質量評價已為此進行了嘗試,但是該標準并未得到廣泛應用,其信度和效度未得到檢驗,因此尚需在實踐中不斷檢驗和完善。
[1] Begg CB, Cho MK, Eastwood S,. Improving the quality of reporting of randomized controlled trials: the CONSORT statement[J]. JAMA, 1996,276(8):637-639.
[2] Cobos-Carbo A. Randomized clinical trials (CONSORT)[J]. Medicina Clinica, 2005,125(1):21-27.
[3] Verhagen AP, de Vet HC, de Bie RA,. The Delphi list:a criteria list for quality assessment of randomized clinical trials for conducting systematic reviews developed by Delphi consensus[J]. Clin Epidemiol, 1998,51(12):1235-124l.
[4] 李靜,李幼平.不斷完善與發展的Cochrane系統評價[J].中國循證醫學雜志,2008,8(9):742-743.
[5] Jadad AR, Moore RA, Carroll D,. Assessing the quality of reports of randomized clinical trials: is blinding necessary?[J]. Control Clin Trials, 1996,17(1):1-12.
[6] Verhagen AP, Henica CW, Robert A,. A criteria list for quality assessment of randomized clinical trials for conducting systematic reviews developed by Delphi consensus[J]. J Clin Epidemiol, 1998, 51:1035-1241.
[7] Van Tulder MW, Assendelft WJ, Koes BW,. Method guidelines for sys-tematic reviews in the Cochrane Collaboration Back Review Group for Spinal Disorders[J]. Spine, 1997,22(20):2323-2330.
[8] Van Tulder M, Furlan A, Bombardier C,. Updated method guidelines for systematic reviews in the cochrane collaboration back review group[J]. Spine, 2003,28(12):1290-1299.
[9] Sherdngton C, Herbert RD, Maher CG,. PEDro. A database of randomized trials and systematic reviews in physiotherapy[J]. Man Ther, 2000,5(4):223-226.
[10] Maher CG, Sherrington C, Herbert RD,. Reliability of the PEDro scale for rating quality of randomized controlled trials[J]. Phys Ther, 2003,83(8):713–721.
[11] Chalmers TC, Smith H Jr, Blackburn B. A method for assessing the quality of a randomized control trial. Control Clin Trials, 1981,2(1): 31-49.
[12] 周登遠.臨床試驗質量評價量表的制作及應用[D].2005年天津醫科大學碩士畢業論文.
[13] Bhandari M, Richards RR, Sprague S,. The quality of reporting of randomized trials in The Journal of Bone and Joint Surgery from 1988 through 2000[J]. J Bone Joint Surg Am, 2002,84(3):388-396.
[14] Nguyen QV, Bezemer PD, Habets L,. A systematic review of the relationship between overjet size and traumatic dental injuries[J]. Eur J Orthod, 1999,21(5):5O3-515.
[15] Arrive L, Renard R, Carrat F,, A scale of methodological quality for clinical studies of radiologic examinations[J]. Radiology, 2000, 217(1):69-74.
[16] Andrew E, Eide H, Fuglemd P,. Publications on clinical trials with X-ray contrast media: differences in quality between journals and decades[J]. Eur J Radiol, 1990,10(2):92-97.
[17] Cho MK, Bero LA. Instruments for assessing the quality of drug studies published in the medical literature[J]. JAMA, 1994,272(2): 101-104.
[18] Balas EA, Austin SM, Ewigman BG,. Methods of randomized controlled clinical trials in health services research[J]. Med Care, 1995,33(7):687-699.
[19] Downs SH, Black N. The feasibility of creating a checklist for the
assessment of the methodological quality both of randomised and non-randomised studies of health care interventions[J]. J Epidemiol Community Health, 1998,52(6):377-384.
[20] Sindhu F, Carpenter L, Seers K. Development of a tool to rate the quality assessment of randomized controlled trials using a Delphi technique[J]. J Adv Nurs, 1997,25(6):1262-1268
[21] Detsky AS, Naylor CD, O’Rourke K,. Incorporating variations in the quality of individual randomized trials into meta-analysis[J]. J Clin Epidemiol, 1992,45(3):255-265.
[22] Yates SL, Morley S, Eccleston C,. A scale for rating the quality of psychological trials for pain[J]. Pain, 2OO5,117(3):3l4-325.
[23] Bizzini M, Childs JD, Piva SR,. Systematic review of the quality of randomized controlled trials for patellofemoral pain syndrome[J]. Orthop Sports Phys Ther, 2OO3,33(1):4-2O.
[24] Imperiale TF, McCuUough AJ. Do conicosteroids reduce mortality from alcoholic hepatitis? A meta-analysis of the randomized trials[J]. Ann Intern Med, 1990,113(4):299-307.
[25] Smith LA, Oldman AD, McQuay HJ,. Teasing apart quality and validity in systematic reviews: an example from acupuncture trials in chronic neck and back pain[J]. Pain, 2000,86(1-2):119-132.
[26] 李敬華,王家良,崔蒙.中醫臨床文獻質量評價研究現狀及方法分析[J].中國中醫藥信息雜志,2008,15(6):95-98.
[27] 劉志順,彭唯娜,毛湄,等.《循證針灸臨床實踐指南》文獻質量評價標準[J].中國針灸,2009,29(1):81-83.
[28] 劉雪梅,張嗚明,劉慧林.利用CONSORT和STRICTA提高針刺對照試驗報告的質量[J].中國針灸,2003,23(12):699-700.
[29] 費宇彤,劉建平.針刺臨床試驗中有關治療措施的報告——STRICTA標準介紹及評價[J].中醫雜志,2007,48(11):983-985.
[30] 李瑛.建國以來針灸治療面癱臨床研究文獻的方法學評價[D].成都中醫藥大學2001年碩士畢業論文
2010-11-07
1005-0957(2011)07-0500-04
R249
A
10.3969/j.issn.1005-0957.2011.07.500
廖世英(1985 - ),女,2004級7年制學生
劉健(1974 - ),女,副主任醫師,E-mail:yooken@sina.com