龐穩泰,王虎城,楊豐文,金鑫瑤,李 楠,王可儀,鄭文科
(天津中醫藥大學循證醫學中心,天津 301617)
心力衰竭是由于心臟結構或功能的異常導致心室收縮和/或舒張功能發生障礙的一組復雜綜合癥狀,主要臨床癥狀為呼吸困難、活動耐量受限、液體潴留,為各種心臟疾病的嚴重和終末階段[1-2]。據心力衰竭發生的時間、速度,分為慢性心力衰竭和急性心力衰竭,而多數急性心力衰竭患者經住院治療后癥狀部分緩解,轉入慢性心力衰竭[3]。2018年公布的中國心血管病報告中指出目前中國內地罹患心力衰竭的患者已達450萬人,居心血管疾病的第4位[4],已成為國內醫療領域不容忽視的問題。
目前治療慢性心力衰竭的藥物以β受體阻滯劑、血管緊張素轉換酶抑制劑(ACEI)、血管緊張素II受體拮抗劑(ARB)、醛固酮受體抑制劑等藥物為主[5],能夠有效改善患者癥狀,降低再住院率和病死率,但也存在不良反應、多重用藥依從性及經濟學等問題[6]。中醫藥在穩定病情、改善心功能、提高生存質量等方面具有優勢,被廣泛地應用于慢性心力衰竭的治療[7]。
芪藶強心膠囊是目前臨床廣泛使用的中成藥。主要由附子、黃芪、人參、丹參、葶藶子、澤瀉、紅花、陳皮、玉竹、香加皮、桂枝等11味中藥組成,具有益氣溫陽、活血通絡、利水消腫之功效,可用于心力衰竭陽氣虛乏、絡瘀水停證的治療[8],并有高質量的臨床試驗評價了其臨床價值[9]。
目前已有較多數量的芪藶強心膠囊治療慢性心力衰竭相關隨機對照試驗發表,基于發表文獻的系統評價亦有十余篇。為提高對已發表系統評價證據應用的正確性,需展開系統評價的再評價[10]。本文從系統評價的方法學質量和證據級別兩個方面對芪藶強心膠囊治療慢性心力衰竭的系統評價進行綜合分析評估,以期為臨床指南制定提供參考信息。
1.1 納入標準 1)研究類型:基于隨機對照試驗的系統評價或Meta分析。2)研究對象:符合公認標準診斷的慢性心力衰竭患者,年齡、性別、人種均不限。3)干預措施:系統評價/Meta分析納入隨機對照試驗的干預措施為芪藶強心膠囊(無論單用或聯用)。4)結局指標:對納入系統評價/Meta分析的結局指標不作限制。
1.2 排除標準 1)非隨機對照試驗的系統評價。2)試驗組的干預措施中除芪藶強心膠囊外包含其他中藥。3)數據不全且無法獲取得文獻。4)系統評價方案。5)僅有摘要的會議論文。6)重復發表的文獻。
1.3 檢索策略 計算機檢索中文全文期刊數據庫(CNKI)、萬方數據庫(WanFang Data)、中國生物醫學文獻數據庫 (SinoMed)、PubMed、The Cochrane Library和Embase數據庫,收集有關芪藶強心膠囊治療慢性心力衰竭隨機對照試驗的系統評價。檢索時限為建庫至2019年4月。檢索式以CNKI為例:SU=“芪藶強心”and(SU=“心力衰竭”or SU=“心力衰竭”or SU=“心功能不全”or SU=“陣發性呼吸困難”or SU=“喘證”)and (SU=“系統評價”or SU=“系統綜述”or SU=“meta 分析”or SU=“薈萃分析”)。
1.4 文獻篩選與資料 提取2名研究者分別獨立進行文獻篩選和資料提取,首先閱讀文獻題目和摘要,排除明顯不符合納入標準的研究,根據標題和摘要不能確定的,下載全文并進行判斷。最后進行交叉核對,如有分歧討論解決。
采用預先制定的資料提取表提取資料,提取內容包括:1)納入文獻的基本信息,包括作者、發表年份、納入文獻數、總體樣本量。2)試驗組與對照組的干預措施。3)納入文獻所使用的質量評價工具。4)結局指標。
1.5 質量評價
1.5.1 方法學質量評價 以AMSTAR2量表[11]對納入文獻的方法學質量進行評價,根據“無或僅1個非關鍵條目不符合,為高質量”“超過1個非關鍵條目不符合,為中質量”“1個關鍵條目不符合并且伴或不伴非關鍵條目不符合,為低質量”“超過1個關鍵條目不符合,為極低質量”的標準將納入的研究評為高、中、低、極低4個質量等級[12-13]。該評價過程由兩名研究者分別獨立進行,后進行交叉核對,如有分歧通過討論解決或通過第3方裁定。
1.5.2 證據質量評價 以GRADE[14]對納入文獻的結局指標進行評價,以結局指標為證據個體,根據偏倚風險、不一致性、間接性、不精確性、發表偏倚5個因素對各系統評價的結局指標進行評估[15]。該評價過程由2名研究者分別獨立進行,后進行交叉核對,如有分歧通過討論解決或通過第3方裁定。
2.1 文獻檢索及篩選情況 通過計算機檢索共得到文獻68篇,剔除重復后得到文獻34篇。通過閱讀文獻題目及摘要對文獻進行初篩得到24篇文獻。閱讀全文進行復篩,最終有15篇系統評價納入研究。文獻篩選流程見圖1。

圖1 文獻篩選流程圖Fig.1 Flow diagram of the articles selection process
2.2 文獻基本特征 納入的15篇文獻均為發表于中文期刊,發表年份最早為2010年,最近為2018年。有13篇為芪藶強心膠囊治療慢性心力衰竭的評價,有2篇分別明確了疾病亞型。納入隨機對照試驗數最多為79個,最少為7個。樣本量最大為7 119例,最小為403例。有13篇的干預措施為芪藶強心膠囊與常規治療聯用對照常規治療,有1篇為芪藶強心膠囊聯合曲美他嗪與常規治療聯用對照曲美他嗪與常規治療聯用,有1篇為芪藶強心膠囊單用或聯合常規治療對照安慰劑或常規治療。隨時對照試驗方法學質量評價工具方面,有13篇運用了Cochrane協作網推薦的“偏倚風險評估”工具,有2篇運用了Jadad量表。納入文獻基本特征詳見表1。
2.3 質量評價
2.3.1 方法學質量評價 以AMSTAR2量表對納入文獻的方法學質量進行評價,15篇文獻中有0篇高質量,0篇中質量,3篇低質量,12篇極低質量。見表2。關鍵條目中有3個條目存在明顯問題,分別為條目 2(0%“是”)、條目 4(6%“是”、87%“部分是”)、條目7(47%“是”、47%“部分是”)。非關鍵條目中有6個條目存在明顯問題,分別為條目3(0%“是”)、條目 8(0%是,87%“部分是”)、條目 10(0%“是”)、條目 12(0%“是”)、條目 14(40%“是”)、條目 16(33%“是”)。

表1 納入研究的基本特征Tab.1 Basic characteristics of inclusion studies

表2 AMSTAR 2評價結果Tab.2 Evaluation results of AMSTAR 2
2.3.2 結局指標及GRADE分級 將15篇文獻的12種結局指標按照GRADE進行證據級別評價,共計證據個體64個,其中高等質量1個,中等質量9個,低等質量25個,極低等質量29個。因偏倚風險而發生的降級為52次,因不一致性而發生的降級為32次,因間接性而發生的降級為0次,因不精確性而發生的降級為18次,因發表偏倚而發生的降級為48次,現將各結局指標評價及質量評價情況列舉在下。
1)腦利鈉肽(BNP):10 篇文獻[16,18,20-24,26-27,29]將BNP作為結局指標進行評價,10篇文獻均報告芪藶強心膠囊在治療慢性心力衰竭時對降低血漿BNP濃度有較好療效。其中1篇[22]為中質量,1篇[24]為低質量,8 篇[16,18,20-21,23,26-27,29]為極低質量。
2)左室射血分數(LVEF):11 篇文獻[16,17,20-27,30]將LVEF作為結局指標進行評價,11篇文獻均報告芪藶強心膠囊在治療慢性心力衰竭時對改善LVEF有較好療效。其中 1 篇[22]為中質量,6 篇[17,20,23-25,30]為低質量,4 篇[16,21,26-27]為極低質量。
3)左心室舒張末期內徑(LVEDD):6篇文獻[16,20,23,25,27-28]將 LVEDD 作為結局指標進行評價,6篇均報告芪藶強心膠囊對LVEDD的改善有較好療效。其中 1 篇[25]為中質量,2 篇[23,38]為低質量,3 篇[16,20,27]為極低質量。
4)6 min 步行距離(6MWD):10 篇文獻[16-18,21,24,26-27,30]將6MWD作為結局指標進行評價,10篇文獻均報告服用芪藶強心膠囊后患者步行距離優于對照組。其中 1 篇[23]為中質量,5 篇[16-17,26-27,30]為低質量,4 篇[18,21-22,24]為極低質量。
5)明尼蘇達生活質量調查表(MHFLQ):4篇文獻[16,22-23,27]將 MHFLQ 作為結局指標進行評價,4 篇文獻均報告試驗組服用芪藶強心膠囊后MHFLQ評分降低。其中1篇[22]為高質量,1篇[23]為低質量,2 篇[16,27]為極低質量。
6)臨床有效率:6 篇文獻[17,19,23,26-28]將臨床有效率作為結局指標進行評價,6篇文獻均報告試驗組的臨床有效率高于對照組,其中1篇[17]為中質量,4 篇[19,23,26-27]為低質量,1 篇[28]為極低質量。
7)二尖瓣血流最大流速E峰與A峰比值(E/A值):2篇文獻[17-18]將E/A值作為結局指標進行評價,均報告試驗組療效優于對照組,2篇均為極低質量。
8)氨基末端腦鈉肽前體(NT-proBNP):8篇文獻[17-20,22,24,26-27]將 NT-proBNP 作為結局指標進行評價,均報告試驗組療效優于對照組,其中1篇[22]為中質量,1 篇[17]為低質量,6 篇[18-20,24,26-27]為極低質量。
9)NYHA 心功能分級:6 篇文獻[18,21-22,24,29-30]將NYHA心功能分級作為結局指標進行評價,均報告試驗組療效優于對照組,其中2篇[22,24]為中質量,4 篇[18,21,29-30]為低質量。
10)再住院率:1篇文獻[20]將再住院率作為結局指標進行評價,由于其納入的隨機對照試驗當中只有1個研究報告了再住院率,未進行Meta分析,僅報告試驗組再住院率低于對照組,所以無法進行GRADE分級。
11)病死率:1篇文獻[20]將病死率作為結局指標進行評價,由于其納入的隨機對照試驗當中只有1個研究報告了病死率,未進行Meta分析,僅報告試驗組病死率低于對照組,所以無法進行GRADE分級
12)不良反應:10 篇文獻[16,17,19-22,24,27-28,30]將不良反應作為結局指標進行評價,其中1篇[16]報道試驗組(芪藶強心膠囊聯用常規治療)不良事件發生率低于對照組(常規治療),但并未具體描述。3 篇[17,22,28]報告未發現不良事件。6 篇[19-21,24,27,30]報告了具體的不良事件為:低血鉀、低血壓、頭昏、惡心、咽炎、皮疹、腹脹、腹部灼熱、上腹部不適、心動過緩、電解質紊亂、干咳。
本研究納入15篇系統評價,根據AMSTAR2量表對其方法學質量進行評價,全部系統評價均為低質量或極低質量,即這些系統評價可能不會/不可能提供準確而全面的總結。主要存在以下問題:1)對前期研究方案的重視不足,納入的15篇系統評價均未在制作系統評價前制定并公開前期研究方案。從而增大了系統評價過程中出現偏倚的風險,也降低了研究的透明度。2)15篇系統評價均未對研究類型的選擇依據作出解釋,降低了其科學性與嚴謹性。3)對報告系統評價所納研究的基金資助信息重視度不足,未考慮基金資助對隨機對照試驗結果的影響。4)忽視了單個研究偏倚風險對Meta分析結果的影響,影響了Meta分析結果的可信度。5)未報告潛在的利益沖突,影響了對系統評價偏倚的判斷。
根據GRADE系統對結局指標進行評價,15篇系統評價,共有64個證據個體,其中有1個高等質量(占整體數量的1.6%),9個中等質量(14%),25個低等質量(39%),29個極低等質量(45.3%),按照GRADE系統中提供的評價標準[31],有84.3%的結局具有較強的不確定性,可信度不高。導致此結果的原因主要在于偏倚風險和發表偏倚(分別導致降級52次和48次)。其納入的臨床試驗質量不高,在隨機、盲法、分配隱藏等方面存在問題是造成在偏倚風險方面降級的主要原因,因此在進行系統評價時應注重對納入隨機對照試驗質量的嚴格評價,并在解釋結果時充分考慮隨機對照試驗質量對結果造成的影響。
本研究發現自2013年—2015年有12篇芪藶強心膠囊治療慢性心力衰竭的系統評價發表,除2篇系統評價以不同的亞型為目標疾病外,其余各篇系統評價的干預措施及目標疾病無明顯差異,亦未在文中強調其研究的必要性及差異性。分析其原因在于各系統評價在進行前均未進行注冊,該信息的缺失導致作者在進行系統評價時未察覺到相同的研究正在進行,從而造成了重復研究。
建議今后的系統評價員在進行系統評價時應注意以下4點:1)提供前期研究方案,可通過在二次研究的注冊平臺(如國際注冊平臺PROSPERO)上進行注冊,或在公開刊物上發表前期方案。2)重視對納入研究類型選擇理由的說明。3)同時應在文中描述系統評價納入研究的資金來源,以及系統評價的資金來源與其中潛在的利益沖突,以便讀者判斷其是否會對系統評價產生偏倚。4)對納入隨機對照試驗的質量進行嚴格評價,在納入偏倚風險較大的研究時分析單個研究的偏倚風險對Meta分析結果的影響。
綜上所述,本研究共納入15篇芪藶強心膠囊治療慢性心力衰竭的系統評價,根據AMSTAR2量表對其方法學質量進行評價,全部系統評價均為低質量或極低質量,根據GRADE系統對結局指標進行評價,有84.3%的結果具有較強的不確定性,可信度不高。建議臨床醫生在參考芪藶強心膠囊治療慢性心力衰竭的系統評價進行臨床決策時,謹慎結合臨床具體情況并參考權威指南進行判斷。同時呼吁進行高質量、符合報告規范的系統評價,以為芪藶強心膠囊治療慢性心力衰竭提供更有價值的證據,使之能夠更好地作用于臨床。