崔曉芳,張建華
1.山西醫學期刊社,山西030001;2.山西醫科大學第一醫院
循證醫學是醫學發展的重要里程碑之一,其核心思想是將個人經驗、可獲得的最佳證據、病人的實際情況與意愿結合,獲得最佳決策方案。這一思想使臨床醫學實踐的決策過程從“基于經驗”走向“基于證據”,尋找和生產“最佳臨床證據”也成為醫務工作者的追求,并推動循證醫學不斷發展[1]。隨著循證醫學的發展,整合現有的研究成果,以提供更多高質量的證據促進最佳臨床決策的形式得到越來越多的研究者的青睞。系統綜述和Meta分析被認為是客觀評價和合成針對某一特定問題研究證據的最佳手段,通常也被作為最高級別的證據[2-3]。且這種方法得到了廣泛的應用,尤其在醫學研究方面。
以“系統評價”或“Meta分析”,文獻分類限定為“醫藥衛生科技”在中國知網進行檢索,獲得239 712條結果,對檢索結果的發表時間進行分析發現,國內此類文獻量逐年增長,尤其在2014年該類文獻增加迅速,年發文量為6 077篇,較上一年增幅為50.06%,此后該類文獻發文量一直處于較高水平,2020年發文量為6 879篇。但仔細閱讀文獻發現,文獻報告質量參差不齊。2009年,系統綜述和薈萃分析優先報告的條目(preferred reporting items for systematic reviews and Meta-analysis,PRISMA)在《英國醫學雜志》《臨床流行病學雜志》《公共科學圖書館醫學雜志》等同步發表。該聲明較以往制定的《隨機對照試驗薈萃分析報告質量》(quality of reporting of Meta-analysis,QUOROM)更加全面。該聲明對系統綜述和薈萃分析類文章報告的27個條目及流程圖進行了介紹,并詳細解釋和說明了相關條目。同年,David等[4]發表了中文版的PRISMA聲明。本研究以護理類期刊為例,檢索近兩年護理類期刊發表的系統評價和Meta分析文獻,并仔細閱讀全文,嚴格按照PRISMA聲明對該類文獻中存在的問題進行分析,以期提高文獻的報告質量。
聲明中指出應明確報告是系統評價還是Meta分析,還是兩者兼有。但查閱文獻發現,大多數文獻的標題僅采用Meta分析或者系統評價,僅有少部分文獻的標題中Meta分析和系統評價均包含。但仔細閱讀文獻發現,僅列出Meta分析或者僅列出系統評價的文獻中,很多文獻既包括Meta分析也包括系統評價,即標題中應將系統評價和Meta分析均列出。提醒作者在投稿時或者編輯在編輯加工時,應根據文獻的具體內容采用合適的標題。
目前醫學文獻中大多采用四段式摘要,包括目的、方法、結果和結論。但目前中文期刊的摘要大多簡單,報告內容較少,且有大多文獻只報告陽性結果,省略陰性結果。本次隨機查閱的十余種護理期刊發表的Meta分析或系統評價的文章中,大多只報告了陽性結果。此外,聲明中提到的納入研究的標準、局限性等內容在大多文獻的摘要中未報告。
聲明中指出前言應介紹已知的研究理論基礎、并以PICOS為導向提出所需要解決的清晰明確的研究問題。有學者指出,Meta分析主要適用于隨機化對照試驗(RCT)的綜合,但發表的文獻中觀察性研究結果的 Meta分析幾乎占已發表 Meta分析的一半[3]。查閱護理期刊中發表的系統評價或Meta分析的文章中,觀察性研究結果的系統評價或Meta分析的文章數量較多。此外,還有很多Meta分析的開展意義不大,例如:綜合護理干預[5]、舒適護理[6]、康復護理[7]等干預涉及的具體措施較多,故Meta分析臨床意義不大,似乎違背了Meta分析的初衷。建議審稿專家遇到此類選題的稿件時,應在初審時拒稿或者與作者溝通研究的意義。
1.4.1 注冊
國際上知名的期刊(如BMJ)要求第一時間將系統綜述/Meta分析注冊作為論文發表的先決條件[8]。但一項對2018年我國護理期刊刊載的系統評價類文中的報告質量分析顯示,259篇文章中均未發現文獻報告方案注冊情況[9]。
1.4.2 納入與排除標準
納入與排除標準包括疾病的診斷標準、研究對象的基本特征、暴露因素或干預措施、合并疾病等,僅限于隨機化對照試驗研究類型還是觀察性研究也可納入,僅選用已發表的研究還是包括未發表的灰色文獻;對文章語種的限定以及觀察時間和結局指標等[10]。檢索護理期刊中發表的系統評價或Meta分析的文章中,均報告了納入和排除標準。但仔細閱讀發現,部分文獻的排除標準設置不合理,如文獻[6]中的排除標準中直接將灰色文獻(未發表的文獻)排除,而文獻[11]的排除標準中直接將研究數據無法合并的文獻進行排除,這顯然是不恰當的,且勢必會影響結果的準確性。而文獻[12]中關于納入標準僅介紹了研究對象與干預措施,隨后在另一部分有報告了結局指標,未按照研究特征(PICO)和報告特征進行描述,報告不規范,且在讀者檢索和閱讀時容易產生疑問。此外,值得一提的是,偶有文獻在納入標準和排除標準的描述中的邏輯關系不清,如文獻[13]中誤將納入標準的PICO表述與排除標準并列,即文獻報告時設置序號的邏輯關系模糊。
1.4.3 檢索策略
1.4.3.1 文獻檢索使用的關鍵詞不準確
現有的系統評價/Meta分析中,使用到的檢索詞有的是MeSH 表上的主題詞,有的是自由詞。但如果檢索詞設置不規范或者不準確,極有可能導致相關研究的漏檢,從而導致發生抽樣偏倚[14-15]。因此,編輯在審查或編輯加工系統評價/Meta 分析類文章時,應仔細斟酌研究者選取的關鍵詞、檢索詞,如有疑問,例如認為某些檢索詞代表性差,極有可能造成漏檢或誤檢,編輯應與作者進行溝通,必要時應讓作者重新標引并重新檢索[16]。如文獻[11]中設置的關于腦癱的英文關鍵詞只檢索了“cerebral palsy”,而腦癱在英文中的表達還可能是“brain paralysis”“cerebral paralysis”等,而中文檢索時,延續性護理還可能被為“延伸護理”,而該文獻并未對延伸護理進行檢索。文獻[12]中,老年人的英文僅檢索了“old people”“olders”,而對“elderly”“aged”均未進行檢索。
1.4.3.2 檢索數據庫不全
系統評價應無偏倚地、全面納入所有相關研究,選擇合理的檢索途徑并制定全面的檢索策略對提高文獻查全率和查準率十分重要。Meta 分析對文獻的查全率要求較高,理論上要求應獲得所有已發表和未發表的所有形式的信息,包括各種語言的期刊論文、會議論文、學位論文、書籍以及正在研究中但未發表的資料[16]。檢索的外文數據應至少包括the Cochrane Library、PubMed、EMbase[17]。但檢索發現,部分文章中并未對3個外文數據庫進行全面檢索。例如:文獻[18-20]中,檢索的外文數據庫中不包括the Cochrane Library,甚至有個別文獻[11]只檢索了1個外文數據庫,這會造成文獻檢索不全,最終影響整合結果的準確性。此外,除數據庫檢索到的文獻,會議文獻以及灰色文獻也是系統評價納入研究的重要來源,同時還要將指南、納入研究的參考文獻進行進一步檢索[21]。但本次檢索發現,研究中報告納入灰色文獻的文章很少,大多系統評價或Meta分析類文獻未納入灰色文獻。此外,聲明中提到應至少說明一個資料庫的檢索方法,包括所有檢索策略的使用。但在護理期刊2020年發表的百余篇系統評價的文章中,僅有少部分文獻提供了具體的檢索方法,這會影響后期研究者對該主題進行進一步研究。
1.4.4 質量控制
質量控制要求在文獻檢索、確定文獻納入/排除、質量評價、資料提取、數據錄入等過程中都要有2人獨立進行, 如出現分歧, 則要進行討論并由第3人裁定[10]。在本次檢索與文獻閱讀過程中發現,所有文章均報告了文獻質量評價中的質量控制,且均說明分歧解決的辦法。此部分報告質量較好。
1.5.1 文獻質量評價
系統評價或Meta分析結果的可靠性與納入研究的質量密切相關,只有從高質量的研究中才可能獲得高質量的整合結果[10]。質量評價是判斷研究結果真實性的前提,有無質量評價以及采用何種質量評價標準對于判斷研究結果的真實性和可靠性十分重要。沒有質量評價的系統評價或Meta分析的質量較低,還有可能誤導臨床實踐。要防止評價過程中可能出現的偏倚以及由此導致的錯誤結論,就要嚴格評價納入研究的質量,這樣才可能得出較為客觀的結論,為臨床決策提供有益的指導[22]。本次檢索發現,護理期刊中所有Meta分析或系統評價中均報告了質量評價方法及結果,但部分文獻未列圖表,僅進行了簡單的文字描述。
1.5.2 研究選擇
聲明中指出應給出排除文獻的原因,最好提供流程圖。在查閱文獻過程中發現,大多文獻都做到了這一點,但仍有部分文獻存在流程圖不規范,未說明文獻排除的原因等。有研究者對2018年我國護理期刊刊載的系統評價類文中的報告質量分析發現,259篇文章中僅138篇報告了篩選流程圖[9]。而本次檢索發現,仍有部分文獻中未提供文獻篩選流程圖[12],還存在提供的文獻檢索流程圖不規范的情況。如文獻[23]中,文獻檢索流程圖中的數據存在錯誤;還有文獻[13]中的流程圖呈現不夠規范。一般文獻篩選流程圖從上到下包括文獻獲取、文獻篩選、文獻排除及文獻納入步驟,作者應提高科學研究的嚴謹性,同時編輯應嚴格把關,指導作者規范表達,杜絕此類錯誤的發生。
1.5.3 結果綜合
聲明中明確提出,如果進行Meta分析,就要明確說明異質性檢驗的方法。異質性檢驗是系統評價/Meta分析類文獻中非常關鍵的一環。一般情況下,異質性檢驗P>0.10說明各研究的異質性較小,一致性可接受, 可選用固定效應模型進行結果整合。但如果P<0.10,說明存在的異質性大, 研究者進行結果的整合應慎重。若合并資料有臨床意義,可選用隨機效應模型進行結果整合;但如果異質性嚴重,不建議進行Meta分析,而應尋找異質性的來源,異質性主要包括臨床異質性、統計學異質性和方法學異質性[10]。本次檢索發現,所有Meta分析類文章均進行了異質性檢驗,且大多文獻呈現了Meta整合的結果及森林圖,但也存在結果綜合部分僅給了Meta分析的結果,未呈現森林圖的情況。
1.5.4 研究偏倚
由于系統評價/Meta分析屬于文獻的二次研究, 在文獻查找和選擇過程中, 如果處理不當會導致結果與真實情況不符。發表偏倚是指陽性的研究結果較陰性的研究結果被報告和發表的可能性更大,一般情況下,陽性結果在審查時通過的概率更高,被引用的概率可能更大[10],這也是導致發表偏倚大的一個原因。目前,漏斗圖法、Egger 回歸法和 Begg 秩相關法發表偏倚等測量發表偏倚的方法較常用,但每個方法的適用范圍不同,在實際應用中應予以注意[16]。例如:文獻[11]的結果中描述到"本次Meta分析僅納入19篇文獻,研究數量較少,故未采用漏斗圖對發表偏倚進行量化檢驗",還有文獻[12]雖然納入了10篇以上的研究,但在結果部分并未進行發表偏倚分析且未說明原因;但也有研究[13]針對每項指標納入的研究均采用漏斗圖進行發表偏倚分析,但由于每項指標納入的研究較少,采用漏斗圖分析分析顯然不恰當。提示編輯在審查系統評價/Meta分析類文章時,應注意審查該研究是否進行了發表偏倚分析,以及選用的發表偏倚的分析方法是否恰當。如果未進行發表偏倚或分析方法不合適,則應與作者溝通,建議其選擇恰當的方法分析發表偏倚;若發表偏倚較大,最好與作者商量,建議其進一步完善檢索策略,繼續查找相關文獻[16,24]。此外,發表偏倚的根本解決途徑為:在醫學倫理委員會或其他機構批準研究之際就將所有的隨機對照試驗進行登記, 且一些國際組織已經建立了此類登記系統。2006年,我國循證醫學中心發起了成立 “中國臨床試驗注冊和發表協作(Chinese Clinical Trial Registration and Publishing Collaboration,ChiCTRPC) ”, 這種管理新模式的創建和應用會進一步提高我國臨床研究的透明度和質量、提高醫學研究的公信度[10]。
1.6.1 證據總結
系統評價或Meta分析在進行結論推導時應注重科學性。但目前很多系統評價或Meta分析的研究者在結論推導時僅根據森林圖的總效應值給出結論,并未充分考慮到原始研究的數量、質量、樣本量等因素,檢索策略、是否納入了全部的相關研究以及原始研究的質量這些因素都會直接影響結論的科學性,而僅根據合成結果進行結論推導,則有可能得到與真實情況相悖的推導結果。因此,研究者在結論推導時應充分考慮以上因素,客觀、嚴謹地陳述研究結果并做出合理的推論。文獻[11]的結果中描述到“延續護理與常規康復相比,改善腦癱患兒的日常生活能力效果最好”,而研究中使用“最”“第一”這種字眼時應慎之又慎。文獻[13]中僅納入了8篇英文文獻,但在結論中指出研究結果可以作為證據支持,以利于該技術的應用和推廣。顯然,這些結論的描述不夠恰當、準確。此類問題希望在作者撰寫論文時引起重視,編輯在編輯編輯加工時也要避免犯類似錯誤。
1.6.2 局限性
聲明中指出討論部分應報告研究層面和結局層面的局限性,如偏倚的風險以及系統綜述的局限性,如檢索不全面、報告偏倚等。本次檢索發現,大多數文獻報告了該研究的局限性,但也有存在未報告的情況。如文獻[12]中未對研究的局限性進行闡述。
1.6.3 利益沖突
系統評價應排除相關利益的沖突,保證系統評價結果的準確性。且目前越來越多的醫學研究涉及醫藥企業的參與,潛在的利益沖突問題不可避免[25]。本次檢索發現,部分文獻有基金支持項目,但未發現有文獻聲明是否存在利益沖突,而會影響證據使用者在使用該系統評價或Meta分析時考慮潛在的利益沖突[26]。
①重視文獻的查全率,同時注意文獻的查重率和查準率;多途徑、多渠道地收集相關研究,除了各種權威數據庫外,還要注意檢索臨床試驗注冊等級系統、納入研究的參考文獻等,此外,還要注意收集尚未發表的灰色文獻,盡可能減少偏倚[10];②在進行結果闡釋時綜合分析原始研究的數量、質量、樣本量的大小、原始研究樣本的基線特征等因素對于結果的影響,謹慎報告結果,尤其是陽性結果;③加強多學科團隊合作,系統評價過程除了需要專業的醫學知識以外,還涉及多個環節,建議在進行此類研究中,有循證方面的專家參與指導整個研究過程進行質量控制[26];④在進行此類研究報告時,嚴格按照PRISMA聲明的27個條目進行報告。
①對于系統評價及Meta 分析方面的來稿,逐一比對PRISMA聲明的27個條目,規范報告,提高報告質量。②逐一審查PRISMA聲明的27個條目后,送外審專家進行同行評價,建議此類稿件專門送審給循證醫學或者統計學方面的專家,如有需要,還需加送醫學檢索專家檢查檢索策略的敏感度和特異度[27]。③審稿專家謹慎看待此類來稿。有研究者指出, Meta分析主要適用于隨機化對照試驗結果的綜合[4], 但也有研究者提出可納入觀察性研究的文獻[28],但該文獻發表后,即有學者提出反對意見。吳洋[27]也指出,目前Cochrane中尚未加入觀察性研究,也未得到學者的廣泛認可,但對于觀察性研究的系統評價/meta分析應慎重。但目前觀察性研究結果的系統評價和Meta分析也開展了很多,但觀察性研究很難證明排除了一切偏倚,不可能完全去查混雜效應,因此可能產生統計學假象[3]。建議審稿專家仔細思考來稿的科學性及研究的意義。
目前,系統綜述和Meta分析類文獻在專家評審時通過率較高,且大多期刊將其作為論著發表,故受研究者青睞,導致該類文獻發文量逐年增高。但仔細分析發現,雖然每年發文量很高,但很少被應用于臨床決策的制定中,且目前有部分文獻因收集證據不全或者采用的統計方法有誤,如果被應用指導臨床實踐,可能會造成不良后果,這也提示研究者及審稿專家應謹慎看待此類文獻,辨證看待,避免誤用和濫用。