連 代,夏 宇,魏 艷,陳英耀
復旦大學公共衛生學院,國家衛生健康委員會衛生技術評估重點實驗室(復旦大學),上海,200032
癌癥是威脅人們健康的主要因素之一[1]。數據顯示,我國2022年中國癌癥新發482余萬例,死亡321余萬例[2];2010年-2030年癌癥疾病負擔預測值高達33280億美元[3]。為提高癌癥患者的生存率,降低癌癥患者的疾病負擔,我國開展了大量癌癥篩查項目,為居民提供診斷、治療等服務。為了有效分配有限的衛生資源,我國研究者開展了針對癌癥篩查的衛生經濟學評價,以此來比較不同篩查技術、篩查頻率、篩查人群的經濟成本和綜合收益,進而形成決策所需的優選方案, 提高衛生系統資源利用的總體效率[4]。
當前關于我國衛生經濟學評價文獻質量的研究較少,主要關注各類藥物經濟學研究的文獻質量。馮莎等依照《中國藥物經濟學評價指南》評價了2009-2013年間國內發表的藥物經濟學評價文獻質量[5];Ma等用CHEERS量表探索了2014年前在英文期刊發表的我國藥物經濟學評價文獻質量[6];高海亮等使用中華中醫藥學會的《藥物經濟學評價報告質量評估指南》評價了2017年1月-2018年5月發表的藥物經濟學研究[7];徐藹琳等采用兒童藥物經濟學評價問卷分析了2009年1月-2018年12月間發表的中文兒童藥物經濟學研究質量[8];Yan等用CHEERS量表評價了發表于2001年-2021年的中英文中醫藥經濟學研究[9]?,F有的文獻質量評價集中在藥物經濟學評價方面,且研究使用的評價工具并非國際通用標準,評價出版物的時間范圍較短或未覆蓋近年文獻[10]。而篩查對腫瘤的早診早治具有不可估量的意義,高質量衛生經濟學評價能夠為篩查相關的資源分配決策提供支撐[11],然而針對數量一直在增長的我國癌癥篩查類衛生經濟學研究,尚未有研究探索該主題衛生經濟學評價的文獻質量,也未研究探索文獻質量的影響因素。
本研究旨在使用CHEERS量表評價我國癌癥篩查類衛生經濟學評價的文獻質量,并探究質量得分的影響因素,為規范相關衛生經濟學研究提供借鑒和參考。
基于PubMed、Embase、中國知網、萬方數據庫等數據庫進行文獻檢索。檢索時限為2000年1月1日-2021年2月28日。檢索關鍵詞包括“成本效果分析”“成本效益分析”“成本效用分析”“經濟學評價”“癌癥”“篩查”等。檢索所得題錄導入EndNote X9.3.3進行去重和篩選。兩位研究者依照下列排除標準背對背完成篩選:①研究對象是動物;②非原始研究;③研究類型非經濟學評價;④研究人群非中國人群;⑤沒有對照措施(包括空白對照)的研究;⑥干預措施非癌癥篩查的研究。如遇分歧,與第三位研究者共同討論決定。最終共檢索到658篇文獻,經過篩查后納入78篇文獻。隨后提取納入研究的基本信息,包括語言、發表年份、經濟學評價類型、第一作者單位、是否使用決策模型等。具體排除納入過程見圖1。

圖1 PRISMA 流程
1.2.1 質量評價。CHEERS量表是由國際藥物經濟學與結果研究協會良好文獻質量工作組(Health Economic Evaluation Publication Guidelines Good Reporting Practices Task Force)開發的指南性文件,是目前衛生經濟學質量評價最常用的評價工具之一[12]。為了保證質量評價的準確性,選取兩位接受過衛生經濟學系統訓練,有相關論文發表經歷的博士生背對背開展質量評價。事先對兩位評價者進行培訓,促使其了解CHEERS報告的條目含義,形成統一、規范的評判標準。隨后兩人背對背使用24個條目的CHEERS量表對納入文獻進行評價。根據文獻滿足條目的情況進行賦值:完全滿足條目要求為1(是);部分滿足條目要求為0.5(部分);不滿足條目要求為0(否);條目不適用的情況為NA(not applicable)。如遇分歧,與第三位在衛生經濟學領域具有豐富研究經驗的研究者共同討論決定。
1.2.2 數據處理。對提取到的基本信息進行描述性分析。為了排除不適用的選項影響文獻間質量的可比性,將每篇文獻質量評分的結果使用如下公式進行標化:

本研究使用廣義線性回歸模型來確定影響文獻質量標化得分的因素,分析文章語言、發表年份、第一作者單位、經濟學評價類型等特征與文獻質量標化得分間的關系,顯著性水平α=0.05,使用R 4.1.1進行統計分析。
隨著時間變化,經濟學評價的發文量呈現逐年增長的趨勢。其中, 48篇(61.5%)文獻基于Markov、決策樹等分析模型模擬人群隊列來獲得研究結果,30篇(38.5%)文獻基于單個實證研究開展;開展最多的研究類型為成本效果分析(53.8%),其次是以健康效用值為效果指標的成本效用分析(35.9%)。見表1。

表1 納入文獻特征
所有納入文獻的平均標化質量得分為0.57(s=0.13),單篇文獻得分最小值為0.33,最大值為0.83,CHEERS量表各條目的具體得分情況見表2。觀察到得分較低的條目(標化得分小于0.5)包括研究視角(條目6)、貼現率(條目9)、效果的測量(條目11)、貨幣及價格日期和換算(條目14)、分析方法(條目17)、不確定性描述(條目20)、異質性描述(條目21)、利益沖突(條目24)。

表2 CHEERS量表的條目得分情況

表3 納入文獻特征的多因素分析
參考Spiegel等人的分類標準,經過討論,本研究選取文章總質量得分將文章進行分類,0.75分以上為高文獻質量,0.5分-0.75分為中等文獻質量,0-0.5分為低文獻質量[13]。本文納入的文獻有7篇為高文獻質量研究,45篇中等文獻質量研究,26篇為低文獻質量研究。由此可見我國相關研究的質量還有待提升。
通過廣義線性回歸分析,確定報告評估質量的預測因素。文章語言、第一作者單位、評價類型對質量得分產生了顯著影響,使用英語發表的文獻得分較高(β=0.080,P=0.002);來自醫院的研究者發表的經濟學評價文獻的文獻質量偏低(β=-0.072,P=0.004);在經濟學評價類型方面,相較于成本效果分析(β=-0.104,P<0.001)和成本效益分析(β=-0.116,P=0.014),使用成本效用分析法的研究有更高的質量。見表4。
本研究梳理了國內癌癥篩查主題的衛生經濟學評價研究。研究納入文獻平均得分為0.57,范圍為0.33-0.83,也即當前我國癌癥篩查類經濟學評價研究只能滿足約一半的CHEERS量表要求,這表明現有研究的透明度和可解讀性不足。納入文獻中高質量文獻占比僅為8.9%,低質量文獻占比(33.3%)遠高于高質量文獻,這也提示國內癌癥篩查類衛生經濟學評價文獻質量有待提升。與其他亞洲背景下使用CHEERS量表的質量評價研究結果相比,Ma等的研究平均得分為0.77,Karekar等的研究平均得分為 0.74,國內癌癥篩查類經濟學評價研究得分相對較低,同時高質量文獻占比也較低(Ma等的研究為68.8%)[6, 14]。需要注意的是,在Ma的研究中,量表中應為“不適用(NA)”的條目被賦分為1,在Karekar的研究中,條目滿足程度僅被評為“是”(1)或“否”(0),而在本研究中,NA的條目從總分中剔除,因此前人研究存在高估文獻質量評分的可能性[6, 14]。
針對CHEERS條目得分較低可能的原因,本文提出如下改進建議供研究者參考。首先,研究者應主動報告研究采用的視角,如社會視角、衛生系統視角、患者視角、醫保支付方視角等,以提高針對性[15-16]。其次,作者應詳細報告數據外推、人口異質性和不確定性分析的方法,以及偏態、缺失或刪減數據的處理方式,并對開展的敏感性分析加以說明;只有報告以上所有的分析方法,讀者才能判斷方法的適當性和結果的可靠性。第三,基于單一研究和反應模型的經濟學評估都應該采用敏感性分析反映所有輸入參數的不確定性影響。第四,研究者也應考慮亞組間基線特征的差異,其在基線特征上的異質性可能會導致患者從干預措施中的獲益不同,從而使得衛生經濟學結果存在偏倚。最后,研究人員應主動報告利益沖突情況。與其他質量評估研究相比[13, 17],本研究納入的文獻很少聲明(26.9%)其利益沖突。90.7%的中文文章不符合該標準,這可能是由于國內期刊沒有做相關要求,但CHEERS要求作者主動報告利益沖突以避免對文獻質量的質疑?,F有研究表明,作者在經濟方面的利益沖突很可能影響研究結果的客觀性[18-21]。
研究確定了經濟學評價類型、第一作者單位、文章語言等三個顯著影響文獻質量得分的因素。與大學等研究機構的第一作者相比,來自醫院的作者發表的文章質量相對偏低。類似的德國研究也表明,由檢驗實驗室人員發表的經濟學研究質量較低[22]。這可能因為醫院研究者接受的衛生經濟學培訓更少,大部分醫院研究者受到的教育以臨床醫學為主,對于經濟學領域知識的了解可能存在欠缺。例如,干預措施的時間范圍和成本是經濟學評價的重要構成[23-24],但對于醫院臨床背景的研究人員而言,掌握選擇時間范圍和調整估算單位成本的方法存在一定挑戰,相較于大學、研究院等專業的衛生經濟學研究機構研究者,對衛生經濟學的理解、模型方法的應用能力存在差異[25]。因此,建議在醫院進行有關衛生經濟報告指南的培訓,讓有志于開展衛生經濟學評價的醫院研究者了解其原理,規范掌握相關的方法學。同時鼓勵醫院研究者和研究機構之間加強合作,共同提高文章的文獻質量。
成本效用分析的文獻質量明顯優于成本效果分析和成本效益分析。由于成本效用分析對每獲得一個質量調整生命年(quality-adjusted life year,QALY)的成本都進行報告,使得將標準化的干預效果與對照措施進行比較成為可能[26],成本效用分析由此獲得眾多高水平研究者的青睞,許多權威指南也建議或提倡使用QALY作為效果單位[27-28]。同時,CHEERS清單也強調報告干預措施對預期壽命和生活質量的影響[29],QALY可以很好地滿足上述要求。這些因素都可能使得成本效用研究的質量相對較高。盡管如此,研究者也應根據研究目的和需要合理選擇經濟學評價類型。此外,效用值的研究通常是一項復雜而繁瑣的工作[30],對不從事衛生經濟或衛生服務研究的作者可能存在一定的難度,因此非上述背景的研究者可能更傾向于選擇成本效果分析或者成本效益分析。最后,本研究納入的成本效益分析和成本效果分析中利用篩查項目現場數據開展的經濟學評價占比較大,這類項目開展時可能并未針對衛生經濟評價收集所需的成本數據和效果數據,也包括可能所需的效用數據,因此研究者在項目結束后開展研究時可能出現因信息缺失而降低文獻質量的問題。
英文文獻往往具有更高的文獻質量得分,原因可能來自中文雜志對于文章字符數嚴格的限制,使得研究者精簡了報告內容導致較低的質量得分,另一個原因可能是部分高水平機構和研究者對國際交流的偏好使得他們更多在英文期刊上發表文章,這提示未來發表中文的衛生經濟學研究者應注重參考權威指南來規范研究。
為了提高我國癌癥篩查類經濟學評價文獻質量,首先應推動建立符合我國背景的類似CHEERS聲明的經濟學報告指南。發布CHEERS聲明的項目組由研究人員、政府雇員、雜志編輯構成,通過德爾菲法綜合了當前經濟學評價的各類準則,篩選出的對文獻質量最重要的條目清單,供衛生經濟學領域的研究者、編輯和審稿人參考[12]?,F階段,良好的指南在我國醫藥衛生事業發展進程中發揮著積極作用[31],我國衛生經濟領域的研究機構和期刊雜志及相關政府部門也可以推動建立符合我國國情,具有中國特色的本土化篩查技術的經濟學評價報告指南,向研究者進行宣傳和推廣,以提升中文篩查類經濟學評價的文獻質量。其次應加強衛生經濟學研究機構與癌癥篩查工作承擔主體,包括體檢機構、基層衛生機構等各類醫院和疾控部門間的合作,前者對經濟學評價規范和原理的了解與后者對疾病進展、篩查技術的認識和實踐經驗能夠使得雙方開展的經濟學評價更加準確、深入、透明,有助于產出更高價值的研究。除此之外,衛生經濟學研究機構也可以開設相關的繼續教育培訓課程供感興趣的其他部門研究者了解和學習,共同促進國內衛生經濟學評價的發展。