徐克菲,羅保平,周 用
湖北省中醫院,湖北 武漢430074
肺癌是全球癌癥相關死亡的主要原因,每年約有140 萬人死于肺癌[1],而在中國,肺癌的發病率在過去20年間顯著增加,大約有60萬名患者死于肺癌[2],據世界衛生組織估計,2025年肺癌死亡人數可能更高。據估計,約85% 的肺癌是非小細胞肺癌(non-small cell lung cancer,NSCLC),多數NSCLC 患者確診時已屬晚期,失去了手術治療的機會,以全身化療為主的綜合性治療是晚期NSCLC 患者最主要的治療手段,含鉑類的聯合化療是NSCLC 標準一線治療方案,取得了較好療效[3]。但毒副反應明顯,特別是免疫力下降,嚴重影響患者的生存質量。祖國醫學認為,惡性腫瘤患者處于正氣虛弱、邪氣內侵的狀態,單一的全身化療會加劇耗傷正氣、降低免疫功能,因此扶助正氣、補益氣血是腫瘤化療輔助治療的重要舉措[4]。參芪扶正注射液是以現代科學技術提取分離黨參和黃芪的有效成分精制而成的中藥注射液,具有補氣扶正功效[5]。參芪扶正注射液聯合化療治療NSCLC 的臨床試驗廣泛開展,隨著循證醫學概念在中醫藥領域的普及,其相關系統評價/Meta 分析研究也相應增多,已有系統評價/Meta 分析研究顯示,在常規化療基礎上聯合參芪扶正注射液,在提高臨床療效、改善患者生活質量、降低毒副反應等方面優于單純化療組,且不良反應發生率低。
系統評價/Meta 分析的數量在逐漸增多,但高質量的系統評價/Meta 分析才能為證據使用者提供可信度高的決策信息[6],進而有效指導臨床實踐,而低質量的文獻則降低了證據的運用價值,甚至誤導臨床決策,導致不合理用藥。因此,采取切實有效的評價方法,綜合評價參芪扶正注射液聯合化療治療非小細胞肺癌系統評價/Meta 分析的文獻質量,是中醫腫瘤學臨床工作者科學選擇循證醫學證據從而指導臨床決策的重要環節。
本研究從發表年份、設計類型、AMSTAR 方法學質量評分、PRISMA 報告質量評分、同質性程度和發表偏倚風險等6 個維度[7]多元評價參芪扶正注射液聯合化療治療NSCLC 系統評價/Meta 分析的文獻質量。雷達圖可發現并突出顯示系統評價/Meta 文獻質量中優勢或缺陷的特定領域來促進決策,較表格或文本形式呈現評價數據更直觀[8],可為臨床工作者決策提供清晰直觀、綜合評價的循證參考。
1.1 研究對象所有病例均為經病理學和(或)細胞學檢查證實為NSCLC,患者病程、性別、年齡、種族等不限。
1.2 干預措施試驗組采用參芪扶正注射液聯合化療治療;對照組采用單純化療方法。
1.3 結局指標按照1979 年世界衛生組織抗腫瘤藥物客觀療效評價標準(WHO 標準)[9]或1994 年實體瘤療效評價標準(RECIST 標準)評價臨床客觀療效,RECIST 標準與WHO 標準對CR 的定義相同,而RECIST 標準以腫瘤最大直徑之和減少30%以上定為PR(球形病灶體積縮小65%),相當于WHO標準的雙徑乘積減少50%,故此兩者在評價腫瘤治療的有效率方面有較高相關性,兩種方法在腫瘤化療療效的評價方面有較好的一致性,因此采用以上兩種任意標準的研究均納入;采用KPS 評分[10]評價生活質量;毒副作用按照WHO 化療藥物毒副作用分度標準[9]評價。
1.4 研究類型國內外發表的有關參芪扶正注射液聯合化療治療NSCLC的系統評價/Meta分析。
1.5 排除標準非中、英文文獻;原文不規范的文獻;重復檢出或發表的文獻。
1.6 文獻檢索計算機檢索PubMed、Embase、The Cochrane Library、SinoMed、WanFang Data、CNKI 和VIP 等數據庫,搜集有關參芪扶正注射液聯合化療治療NSCLC的系統評價/Meta分析,檢索時限為建庫至2019 年5 月21 日。外文數據庫檢索詞:Shenqi Fuzhenginjection,Shenqifuzheng,lung cancer,lung neoplasm,lung carcinoma,NSCLC,Non-Small-Cell Lung Carcinoma,chemotherapy,systematic reviews,metaanalysis;中文數據庫檢索詞:參芪扶正注射液、肺癌、肺腫瘤、非小細胞肺癌、化療、Meta 分析、系統評價、系統綜述、薈萃分析;根據不同數據庫的特征進行主題詞聯合自由詞的綜合檢索。
1.7 數據提取使用Note Express 文獻管理軟件進行查重,由2 位評價員根據篩選標準獨立進行數據提取,在文獻篩選和資料提取整個過程始終保持獨立,納入符合要求的系統評價/Meta 分析,提取的數據交由第三方核對,如遇分歧,與第三方討論后決定。通過Microsoft Excel 2010構建《參芪扶正注射液聯合化療治療NSCLC 系統評價/Meta 分析的文獻質量評價信息采集表》,根據信息采集表提取數據,提取及評價分析后的條目及內容包括發表年份和作者姓名、設計類型、同質性程度、發表偏倚、AMSTAR 量表評分、PRISMA 量表評分,以及出版物來源、納入研究數量、納入患者總數、試驗組和對照組的干預措施、偏倚風險評估使用的工具類型、結局指標等。
1.8 質量評價 參考PANESAR等[7]對干預措施型Meta 分析文獻質量的評價方法及應用實例,從發表年份、設計類型、AMSTAR 方法學質量評分、PRISMA 報告質量評分、同質性程度、發表偏倚風險等6個維度對納入文獻進行多元評價。
1.9 統計分析發表年份、研究設計的類型、同質性程度、發表偏倚風險評價等4 個維度采用定性分析,方法學質量和報告質量2 個維度采用定量分析,合成結果繪制成雷達圖。
1.9.1 發表年份 循證醫學要求系統評價/Meta分析須涵蓋研究節點以前的研究文獻,以保證研究結果的時效性,而且要不斷更新,以最新的研究成果指導臨床實踐,因此將最近年份定為最高秩數,秩數隨發表年份降低而依次遞減。
1.9.2 研究設計類型 根據原始文獻納入臨床試驗實際采用的隨機方法判定,將隨機對照試驗定為高質量,半隨機對照為低質量,正確并完整報告隨機方法的臨床試驗判定為RCT 并且判定為高質量,未完整報告隨機化實現方法或未正確采用隨機化方法的臨床試驗判定為QRCT,判定為低質量,混合為中等質量。
1.9.3 系統評價/Meta 分析的同質性程度 依據異質性有無及其大小,P≥0.05,I2≤50%的文獻同質性程度高,反之則同質性程度低,所納入的指標半數及以上若同質性高則采用固定效應模型分析,判為高質量,所納入的指標若半數以下同質性低則采用隨機效應模型,為低質量。
1.9.4 發表偏倚采用方法判定 發表偏倚的文獻且同時運用漏斗圖法(定性檢測)和線性回歸法(Egger 法或者Beeg 法)的文獻判定為高質量,采用其中一種方法則為中等質量,未采用或未正確采用相應方法檢測發表偏倚的文獻判為低質量。
1.9.5 方法學質量 采用AMSTAR(A measurement tool to assess systematic reviews,系統評價/Meta 分析方法學質量評價工具)清單(2007 年發布)對文獻進行評分,每一條目根據文獻是否報告判定,AMSTAR 量表評為“符合”“部分符合”及“不符合”,分別記為“1 分”“0.5 分”“0 分”,共11項條目,總分11分。
1.9.6 報告質量評價 采用PRISMA(preferred reporting items for systematic reviews and meta-analysis,系統綜述和薈萃分析優先報告的條目:PRISMA聲明;RCT:randomized control trial,隨機對照試驗;QRCT:quasi-randomized control trial,半隨機對照試驗)清單(2009 年發布)對納入文獻進行評分,PRISMA 量表評為“符合”“部分符合”及“不符合”,分別記為“1分”“0.5 分”“0 分”,共27項條目,總分27分。
每篇文獻計算總分,質量評價及計分均由兩位評價員分別獨立評價并交叉核對,有爭議處引入第三位評價者共同討論決定。之后將各個維度評價的結果轉換為排位秩數并納入雷達圖坐標中,秩數轉換按照醫學統計學中等級資料的處理原則進行[11],其最高級別秩數為文獻總數,從大到小排序,取所有秩數平均分為秩數均值,運用Microsoft Word 2010 繪制雷達圖展示多元評價的最終結果。
2.1 文獻篩選流程及結果從選定的中英文數據庫中按照檢索策略進行文獻篩選,初步得到相關文獻288 篇,其中中文271 篇,英文7 篇;最終納入10 篇系統評價/Meta 分析文獻,其中中文8 篇,英文2篇。見圖1。

圖1 文獻篩選流程及結果
2.2 納入研究的基本特征本研究納入的研究發表在2010—2019年,納入原始研究總數最少11個,最多43 個,對照組干預措施為含鉑的化療一線用藥方案,兩組研究中所有患者都接受了全身化療,患者均未接受手術和放療,兩組之間的唯一區別是他們是否接受過SFI 輔助治療。結局指標較為統一,包含客觀療效、生活質量、不良反應等方面,有5篇報道了免疫功能評價指標。有7篇采用Cochrane 協作網的RCT 偏倚風險評價工具,4篇采用Jadad量表。納入研究基本特征見表1。

表1 納入研究的基本特征
2.2.1 臨床療效 采用世界衛生組織抗腫瘤藥物客觀療效評價標準(WHO 標準)或實體瘤療效評價標準(RECIST標準)。
2.2.2 生活質量 采用KPS評分量表。
2.2.3 不良反應 采用WHO 化療藥物毒副作用分度標準,包括白細胞下降、血紅蛋白下降、血小板下降、消化道不良反應、靜脈炎、肝腎功能損害等。
2.2.4 免疫功能 包括總T淋巴細胞(CD3+)、輔助T淋巴細胞(CD4+)、抑制/細胞毒T淋巴細胞(CD8+)、CD4+/CD8+比值和自然殺傷(NK)細胞水平等。
2.2.5 化療方案及SFI 順鉑聯合長春瑞濱(NP),順鉑或卡鉑聯合吉西他濱(GP),順鉑或卡鉑聯合紫杉醇(TP)或多西他賽(DP),順鉑或卡鉑聯合培美曲塞(PP),順鉑或卡鉑聯合伊立替康(IP),DC順鉑聯合多烯紫杉醇(DC),卡鉑聯合長春瑞濱(NC),卡鉑聯合紫杉醇(TC),順鉑聯合足葉乙苷(EP)。
2.2.6 ROB 工具及Jadad 量表 采用Cochrane協作網的RCT 偏倚風險評價工具(5.1.0 版本);Jadad量表均為改良版的Jada量表。
2.3 納入研究的多元評價
2.3.1 發表年份 最早的發表年份為2010 年,最新為2019 年,2015 年和2016 年分別為3 篇,2010年、2013年、2018年、2019年各1篇。
2.3.2 研究類型 Meta 分析在非試驗研究中的應用具有較大的爭議性,因為非試驗研究的結果容易受到眾多混雜因素的影響,從而導致偏倚。隨機對照試驗能夠最大程度避免臨床試驗設計、實施中可能出現的各種偏倚,平衡混雜因素,因此被認為是評價干預措施的金標準。本研究納入的10 篇系統評價/Meta 分析,均納入了隨機對照試驗和半隨機對照試驗,所納入的10 篇文獻除了DONG J 的研究提出同時納入RCT 和QRCT,其余9篇文獻雖然均在原文中明確提出納入RCT,但實際上根據納入原始文獻的質量評估,含有未明確報告隨機化實施方法的臨床試驗,所以判定為QRCT。因此,納入的10 篇系統評價/Meta 分析文獻均存在一定的偏倚風險,對結論的支持力度隨之降低。
2.3.3 AMSTAR評分 偏倚是影響系統評價/Meta分析質量的重要因素,而AMSTAR清單精煉了11個條目對系統評價/Meta分析控制偏倚的情況進行評判,AMSTAR量表得分0~4分為低質量,5~8分為中等質量,9~11分為高質量。AMSTAR評分的分值在2~9 分之間,平均6.90 分,最高分是DEDONG C[19]的研究,最低分是劉鈞[16]的研究,扣分條目集中在4個方面:是否提供了前期設計方案、出版物的狀態(即灰色文獻)是否被用作納入標準、是否提供納入和排除研究文獻清單、是否說明相關利益沖突。見表2。
2.3.4 PRISMA 評分 系統綜述/Meta 分析的數量急劇增加,然而報告質量需要進一步提高,PRISMA 聲明的目的在于幫助作者改進系統綜述/Meta 分析的撰寫和報告,主要針對的是隨機對照試驗的系統綜述,PRISMA 量表得分≤15 分為有相對嚴重的信息缺陷,15~21分為報告有一定缺陷,21~27分為報告相對完全。本研究結果顯示,納入的10 篇系統評價/Meta 分析評分為12~23 分,平均19.90 分,最高分是DONG J[12]、盛蕾[13]、DEDONG C[19]的研究,最低分是劉鈞[16]的研究,扣分條目集中在6 個方面:結構式摘要、方案和注冊、納入標準、檢索策略、證據強度總結、資金支持。見表2。
2.3.5 同質性程度 Meta 分析要對同質性研究進行合并,但是納入同一個Meta 分析的所有研究都存在或大或小的差異,所以要將這種異質性控制在一定范圍內,只有在臨床和方法學上都具有一定同質性的基礎上,方可進入研究間的統計學異質性檢驗和下一步的定量合并分析,從而產生了異質性定量化的檢驗方法。本研究納入的8 篇文獻被評為同質性高,2 篇被評為同質性低,依據的是數據定量合成過程中,納入指標的異質性檢驗的P值和I2值,總體而言,同質性程度較高。見表2。
2.3.6 發表偏倚風險 4 篇文獻采用了漏斗圖定性和線性回歸法定量檢測發表偏倚,因而被評為高質量;5 篇文獻采用了漏斗圖法定性檢測發表偏倚,因而被評為中等質量;1 篇文獻未進行發表偏倚的檢測而被評為低質量。見表2。

表2 納入研究的多元評價秩數
2.4 雷達圖多元評價在雷達圖上,輻條代表維度,環代表數據點,環與輻條的交叉點是數據點在各個所在維度上的數據大小。雷達圖法的主要特點是直觀,它將評價對象的各項指標狀況用二維圖形表示,從圖中可以同時看出評價對象的整體情況和局部情況;本研究將雷達圖法引入到系統綜述/Meta 分析整體質量的綜合評價中,同時定性與定量分析相結合,結合直觀可視化的圖形,使評價更具說服力和表現力。
雷達圖直觀地反映本研究納入的10 篇系統綜述/Meta分析在6個指標上的相對優劣勢,反映出方法學質量和報告學質量高低的相對程度,提示需要改進和提高的主要方面。本研究結果顯示,納入文獻在同質性程度方面表現最佳,有9 個研究在此維度匯集到頂點;其次在發表偏倚方面表現良好,有5 個研究在此維度匯集到頂點,4 個研究達到中點;在文獻類型方面表現欠佳,納入的10 篇文獻在此維度均匯集到中點;發表年份維度提示從2010—2019 年間文獻報道的數量呈現先上升后下降的趨勢;在AMSTAR 方法學質量評分和PRISMA 報告質量評分方面,納入文獻在此兩個維度上得分波動較大,提示方法學質量和報告質量參差不齊,有較大提升空間。結果顯示,DEDONG C[19]的綜合得分最高(秩數平均分8.83 分),各個維度得分均較高,雷達圖覆蓋面積最大,且條目之間差異較小,提示文獻質量最佳;其次為張勝男[20]、盛蕾[20]、DONG J[12]等的研究,文獻質量最低的是劉鈞[16]的研究(秩數平均分3.83 分),面積最小。10項研究雷達圖見圖2—3。

圖2 納入10項研究匯總的雷達圖

圖3 納入10項研究比較的雷達圖
循證醫學強調制訂健康相關的決策需要可靠證據的支持[22],系統評價/Meta 分析是高質量證據的重要組成部分,為醫療衛生機構和臨床醫生的決策提供重要參考。隨著醫學臨床研究深入而廣泛的開展,中醫藥領域的系統評價/Meta 分析也逐漸受到研究者的重視,但如果工作人員掌握系統評價的方法不夠全面,會產生存在包含各種偏倚的研究結論,這可能會導致不正確的推薦意見,從而誤導臨床決策。因此了解評價系統評價/Meta 分析文獻質量的方法,對已有的系統評價/Meta 分析的文獻質量進行綜合分析評價,有利于更好地使用系統評價信息,選擇真正高質量、更加嚴謹的證據來指導臨床決策[23-24]。
本研究對參芪扶正注射液聯合化療治療NSCLC 系統評價/Meta 分析的文獻進行再評價,共納入10篇相關文獻。結果顯示,10篇文獻的秩數平均分為6.62 分,說明文獻質量普遍不高,納入各個研究均在不同程度、不同特定領域存在缺陷。
研究類型方面,納入的10 篇文獻均納入了RCT 和QRCT 研究,因此得分均為5 分,隨機化實現方法不明確的臨床試驗也納入綜合定量Meta 分析,可能會導致夸大臨床療效,在一定程度上降低了研究質量,降低了證據支持的力度,隨著參芪扶正注射液在NSCLC 領域臨床試驗的廣泛開展,已有大量相關臨床試驗可作為系統評價/Meta 分析的原始材料,可進一步嚴格選定納入文獻實際上的研究類型,而不能僅憑“隨機”二字就認為是RCT,從而納入定量分析,可以考慮將明確報告隨機化實施方法的臨床試驗作為RCT 納入,更新系統評價/Meta分析。
在AMSTAR 方法學質量和PRISMA 報告質量方面存在以下問題:缺乏前期研究方案、全面文獻檢索工作欠充分、尚未說明利益沖突和研究文獻清單。納入10 篇文獻均無注冊前期研究方案,建議未來研究者可考慮在系統評價/Meta 分析的工作開始之前,預先通過國際預注冊數據庫(international prospective register of systematic reviews,PROSPERO)[16]或在Cochrane 協作網[25]注冊相應的研究方案或計劃書,使研究過程更為公開透明;僅盛蕾[13]和郭震浪[14]將發表情況(如灰色文獻)考慮在納入標準中,AMSTAR 要求實施廣泛全面的文獻檢索,包括納入灰色文獻等,以減少偏倚,而未實現全面、系統的檢索,直接影響meta 分析的質量[26],未來研究者應當注重灰色文獻的價值,如果Meta 分析排除灰色文獻,就會夸大陽性研究結果,導致決策失誤,因此建議把灰色文獻納入Meta 分析[27];本研究納入的系統評價/Meta 分析中納入的研究都出現在參考文獻中,但排除文獻均未出現在發表的論文中,可考慮將排除文獻的清單上傳到特定網站供讀者獲取,使得證據使用者很容易判斷選擇文獻的質量。
本研究的局限性包括只檢索了中英文數據庫,存在一定的發表偏倚;提取資料由2 名研究人員獨立進行,但仍可能存在主觀因素帶來的漏檢,影響評價結果的全面性和真實性;納入的文獻中研究人群有局限性,缺乏可能影響研究結果的詳細信息,如人種、地域、文化因素等。
綜上所述,參芪扶正注射液聯合化療治療NSCLC 系統評價/Meta 分析的方法學質量和報告質量有較大的進步空間,未來研究者可更加嚴格限定納入標準,提高納入研究的質量,嚴格按照AMSTAR 清單和PRISMA 清單所要求的具體條目進行系統評價/Meta 分析,研究者要加強循證醫學知識、流行病學知識、外文檢索能力等科研素養[28],以提供更高質量的循證醫學證據。本研究運用雷達圖從6 個維度將文獻質量評價的數值進行可視化分析,從較為全面的角度綜合評估了10篇文獻的循證質量,便于中醫腫瘤學臨床工作者選擇合適的循證參考。