吳昌金,李汶檀,陶紅宇,章溪妍,辛 雨,宋若萌,王凱歌,左 玲,蔡源益,惠 文
1中國醫科大學健康管理學院,遼寧沈陽,110122;2中國醫學科學院醫藥生物技術研究所,北京,100050;3四川大學華西醫院科技部,四川成都,610041;4四川大學華西醫院呼吸與危重癥醫學科,四川成都,610041;5四川大學華西醫院門診部全程管理中心,四川成都,610041
肺癌是全球死亡率最高的癌癥[1]。非小細胞肺癌(non-small cell lung cancer,NSCLC)是最常見的病理分型,約占全部肺癌的85%[2]。由于NSCLC早期癥狀不明顯,50%-70%的患者在確診時已為晚期肺癌,采用傳統化療方案的總生存期(overall survival, OS)不足1年,治療效果不佳[3]。隨著腫瘤免疫治療的深入研究和臨床應用,與傳統放化療相比,免疫藥物治療顯著地延長了患者的無進展生存期(progression-free survival, PFS)和OS,同時能降低治療相關不良反應的發生風險,成為國內外晚期NSCLC一線治療方案[4]。然而,免疫藥物的創新程度高、臨床急需以及藥物可替代性弱等因素,導致免疫藥物價格昂貴,支出預算占比高。因此,醫療服務購買方、醫療機構和醫生等決策者在實際選擇免疫藥物時不僅需要考慮藥物本身的安全性和有效性,同時需兼顧經濟性。
藥物經濟學研究采用一系列評價方法比較和分析不同方案的經濟成本和健康產出,以期用較低的成本實現醫療保健收益的最大化[5]。近些年,隨著腫瘤免疫藥物的臨床療效不斷被證實,相關藥物納入醫保報銷目錄以及藥品采購目錄的決策需求增加,藥物經濟學研究也隨之增加。然而,藥物經濟學研究在研究角度、模型、參數來源途徑和敏感性分析等方面的選擇和設置,均會影響結果的真實性和可靠性。據研究,國內60%以上的藥物經濟學研究質量欠佳,難以直接指導決策[6-7]。既往研究納入的免疫藥物數量有限,最多僅納入4種,未能展現NSCLC免疫治療的藥物經濟學研究全貌。同時,由于伊匹木單抗、卡瑞利珠單抗、西米普利單抗和信迪利單抗等新興免疫藥物的涌現,亟需更新現有系統評價證據。并且,既往研究在開展質量評價時,往往采用報告質量評價工具,而非方法學質量評價工具,造成質量評價結果存在一定偏倚[8-11]。鑒于此,本研究在更全面、系統檢索國內外免疫藥物一線治療NSCLC的藥物經濟學研究的基礎上,使用方法學質量評價工具,對比和總結國內外現有研究的主要特征和方法學局限性,為我國研究人員開展相關藥物經濟學研究以及決策者利用相關研究證據提供參考。
檢索PubMed、Embase、Cochrane、Health Technology Assessment Database、National Health Service Economic Evaluation Database等英文數據庫,以及中國生物醫學文獻服務系統、中國知網、萬方和維普等中文數據庫,檢索時限為建庫至2022年8月24日。采用主題詞和自由詞結合的方式進行檢索,檢索詞包括非小細胞肺癌、免疫治療、免疫藥物、免疫檢查點抑制劑、成本-效果分析、成本-效用分析、衛生經濟評價、藥物經濟學等。
文獻納入標準:研究對象為NSCLC首次治療患者;干預措施或對照措施包含一線免疫藥物治療;主要結局指標包含成本、質量調整生命年(quality-adjusted life years,QALYs)、增量成本效果比(incremental cost-effectiveness ratio,ICER);研究設計為成本-效果分析和成本-效用分析。
文獻排除標準:研究設計僅為成本-效益分析、成本分析或預算影響分析;重復發表文獻、無全文或未公開發表文獻;摘要、個案報告、綜述、評論、學位論文等文獻;非中、英文文獻。
依據納入和排除標準分別進行題目和摘要、全文篩選。提取納入研究的基本情況和藥物經濟學評價內容(研究角度、成本分類、貼現率等)。以上過程均由4名研究者分成兩組背靠背獨立進行,若遇分歧則通過協商或由第三方判斷后達成一致。
由4名研究者分成兩組獨立使用衛生經濟學研究質量評價量表(quality of health economic studies, QHES)進行質量評價[12],若遇分歧則通過協商或由第三方判斷后達成一致。QHES量表根據文獻的目的、方法、結果、討論、資金來源等方面逐一判斷,完全符合標準判斷為“是”,否則為“否”,根據每個條目所占的相對比例賦值為百分制得到最終分數。根據分值將研究質量劃分為4個等級:極低質量(0-24分)、低質量(25-49分)、中等質量(50-74分)和高質量(75-100分)[13]。
初檢相關文獻1206篇,經逐層篩選后,最終納入61篇文獻,其中10篇中文文獻和51篇英文文獻。文獻檢索及篩選結果見圖1,納入的文獻見表1。

表1 納入研究及參考文獻

圖1 文獻檢索及篩選結果
納入文獻的發表時間為2017-2022年,且呈現逐年遞增趨勢。從治療方案的選擇上看,31篇(50.8%)文獻為免疫藥物單用方案對比化療方案,28篇(45.9%)文獻為免疫藥物聯合化療方案對比化療方案。從免疫藥物的納入情況上看,帕博利珠單抗的研究最多(n=32,52.5%),其次是阿替利珠單抗(n=12,19.7%)和納武利尤單抗(n=11,18.0%)。所有納入文獻均進行了成本-效用分析,其中1篇(10%)中文文獻和23篇(45.1%)英文文獻同時進行了成本-效果分析。成本-效果分析均采用生命年(life years, LY)作為臨床結局指標。見表2。

表2 納入文獻部分內容情況(篇,%)
從研究的國別來看,中文文獻全部基于中國單一視角。英文文獻以美國(n=26,50.9%)視角最多,其次是中國(n=14, 27.4%)視角。最常用的評價角度是衛生體系角度(n=24,39.3%)和醫療保障支付方角度(n=24,39.3%),其次是醫療機構角度(n=7,11.5%),全社會角度(n=4,6.6%)和患者角度(n=1,1.6%)。80%的中文文獻采用衛生體系角度。
98.4%的研究測算了直接醫療成本,主要涉及藥品費、藥品管理費、疾病管理費、不良反應處置費和臨終關懷費等。在基于全社會視角的4篇(6.6%)文獻中,僅1篇(25%)文獻計算了直接非醫療成本(含交通費、食宿費等)和間接成本(因疾病造成的勞動時間和生產率損失等)。
所有研究均使用模型進行了長期模擬。馬爾科夫(Markov)模型是最常用的模型(n=39,63.9%),其中6篇(9.8%)文獻同時使用決策樹和Markov模型。20篇(32.8%)文獻使用了分區生存(partitioned survival, PS)模型,2篇(3.3%)文獻采用了微觀模擬模型。
最常用的健康狀態為三狀態,即疾病無進展期,疾病進展期和死亡。54篇(88.5%)文獻使用了經典三狀態建立模型,其中中文文獻全部使用三狀態模型。5篇(8.2%)文獻在三狀態的基礎上進行了細化,其中4篇(6.6%)文獻將PFS狀態細化為穩定狀態、因毒副反應暫停一線治療而接受二線治療狀態;2篇(3.3%)文獻增加了健康終末期的最佳支持治療狀態。
42篇(68.9%)文獻報告了模型模擬的研究時限,其中18篇(29.5%)為20年,16篇(26.2%)為10年,19篇(31.1%)文獻未明確具體研究時限。在循環周期的設定上,41篇(67.2%)文獻使用3周作為模型的循環周期。
2.5.1 效果參數來源。納入研究均為基于模型的藥物經濟學評價,療效數據均來自于已發表的大型臨床隨機對照試驗(randomized controlled trials, RCTs),主要結局指標為PFS和OS。除此之外,6篇(9.8%)文獻在RCTs的基礎上,利用了既有數據庫等真實世界數據(real world data, RWD)對臨近死亡階段的療效數據進行了補充,2篇(3.3%)研究使用數據庫對長期效果進行驗證。
2.5.2 參數模擬。在使用臨床試驗的生存曲線重建患者個體療效數據時,54篇(88.5%)文獻清晰報告了擬合生存曲線的參數分布,其中42篇(68.9%)報告了最佳參數擬合的判斷方法,常用的方法依次為赤池信息準則(n=42,68.9%)、貝葉斯信息準則(n=26,42.6%)和視覺判斷(n=23,37.7%)。其中,19篇(31.1%)同時使用以上3種方法,12篇(19.6%)使用以上兩種方法判斷最佳擬合的參數分布。
2.5.3 健康效用值來源。46篇(75.4%)文獻的健康效用值來源于已發表的藥物經濟學評價或橫斷面研究,15篇(24.6%)來源于臨床試驗。此外,由于腫瘤藥物的副作用,3級以上的不良反應會影響效用值,26篇(42.6%)文獻報告了不良反應的負效用值,且均來自于已發表的文獻,其中以引用NSCLC效用值的國際多中心研究結果最多(n=20,76.9%)。
20篇(32.8%)文獻同時進行了敏感性分析和情境分析。57篇(93.4%)進行了確定型和概率敏感性分析,3篇(4.9%)未進行概率敏感性分析。在使用確定型敏感性分析的文獻中,以單因素分析為主(n=60,98.4%)。概率敏感性分析以蒙特卡洛模擬為主(n=58,95.1%)。
使用QHES工具進行研究質量評價,最高95分,最低45分,平均74.3分。其中,中文文獻得分范圍為45-82分,平均60.1分;英文文獻得分范圍為53-95分,平均77.0分。75-100分高質量研究共有28篇(45.9%),其中中文文獻1篇,英文文獻27篇。其余33篇文獻(54.1%)均為中低質量。從各條目得分情況來看,所有納入研究在研究目的、不確定性分析、增量分析、結果測量和研究結論等條目中均獲得高分,而在研究角度及選擇原因、模型假設及驗證和偏倚大小及方向等條目中得分較低,分別僅有1篇(1.6%),3篇(4.9%)和1篇(1.6%)文獻獲得高分。與英文文獻相比,中文文獻在模型結構及方法條目中普遍得分較低,僅1篇(1.6%)獲得高分。研究質量評價結果見圖2。
研究角度是藥物經濟學評價方法的基本要點之一。《中國藥物經濟學評價指南導讀2022》推薦采用全社會角度和衛生體系角度進行評價,從社會福利的觀點出發,最理想的藥物經濟學評價角度是全社會角度[14]。英國國家健康與臨床卓越研究所、加拿大藥品和衛生技術評估機構等機構推薦采用醫療保障支付方和全社會兩個角度進行評價[15]。然而,在本研究納入的文獻中,僅1篇采用了兩種研究角度進行分析。此外,成本的確認范圍需要和選擇的研究角度一致。本研究發現,4篇從社會角度開展的藥物經濟學研究中,僅1篇分析了全社會角度下的直接非醫療成本和間接成本,其余均只計算了直接醫療成本。直接非醫療成本是指患者因尋求醫療服務而直接消耗的醫療資源以外的資源,例如營養費、交通食宿費等[14]。盡管與直接醫療費用相比,直接非醫療成本可能在疾病經濟負擔中占比相對較小,但是由于新興的免疫、靶向等腫瘤治療手段延長了患者的預期壽命,患者需要增加周期性隨訪治療。因此,患者及家屬將負擔頻繁治療活動相關的大量直接非醫療成本[16-17]。此外,間接成本是指疾病、傷殘或死亡造成的患者及其家庭的勞動時間及生產力的損失[14]。據研究,生產力損失帶來的成本可能會超過直接醫療成本[18-19]。通過納入間接成本,可以更加全面地分析非小細胞肺癌對患者家屬和整個社會帶來的影響。因此,研究角度與成本界定的不一致,勢必導致研究結果的真實性不足。
藥物經濟學評價推薦使用QALYs作為效果指標,該指標需要結合患者生存時間和健康效用值來確定。本研究納入的NSCLC免疫藥物經濟學研究文獻的療效數據雖然均來自于RCTs或既有數據庫,但仍為基于二次文獻數據的藥物經濟學研究,與基于個體水平數據的藥物經濟學研究在納排標準、數據分析方法、疾病研究的選擇、成本的評估范圍、時間范圍偏差等方面具有顯著差別[20]。一般而言,基于個體水平數據的藥物經濟學臨床療效數據可以通過RCTs或者真實世界研究兩種方式獲得。真實世界研究通過收集患者日常診療環境下的數據,可以有效彌補RCTs納排標準嚴格、隨訪周期短等局限性,同時能夠避免模擬RCTs生存曲線獲得長期療效數據時帶來的潛在不確定性,成為未來基于個體水平數據的藥物經濟學研究的主要數據來源[21]。效用值反映了患者對健康結果的偏好程度。本研究納入文獻的效用值主要為直接引用Nafees等人的研究結果,該研究采用健康效用值直接測量法中的時間權衡法,調查了中國、英國和澳大利亞等國轉移性NSCLC患者一線化療后的健康效用值,便于不同國家間效用值的比較[22]。然而,由于每個國家只納入約75例自愿參加研究的患者,樣本代表性較差且具有選擇偏倚。因此,該研究結果運用至單一國家角度的藥物經濟學研究時應該謹慎。2018年,我國學者報告了基于232例NSCLC本土人群的健康效用值[23],建議在進行中國角度的藥物經濟學研究時,對以上兩項健康效用值結果進行敏感性分析,減少研究結果的偏差。
在納入的文獻中,NSCLC免疫藥物經濟學研究的長期模擬主要采用Markov模型和PS模型兩種模型,其中Markov模型的使用率高于PS模型。Markov模型能夠反映疾病的發生發展過程,不良反應等多個狀態,但需要設定不同狀態的轉移概率,而這種概率實際上會隨著時間發生變化,在實際估計模型時,若使用固定概率會對結果和結論產生偏差[24]。相較于Markov模型,PS模型不需要轉移概率因而計算更簡便,但是過分依賴生存曲線,導致在預測時可能產生誤差,因為PFS和OS曲線實際上并不是相互獨立的[25]。研究中,對于選擇Markov模型還是PS模型除了需要考慮不同模型對結果的影響外,還需要考慮模型與研究疾病的適配度,療效數據的成熟度等方面因素。PS模型相較于Markov模型更能夠解釋臨床試驗的常用終點指標(例如OS、PFS),然而當需要考慮疾病復發、轉移等更為復雜的情況或數據完整度不高時,選擇Markov模型更為恰當,但同時需要考慮是否能得到合理的轉移概率數據[26]。
模型結構由研究目的和干預方案共同決定。過于簡單的模型可能失去建模的有效性,因為損失了現實必須考慮的因素,而復雜的模型又會因構建過程繁瑣、理解分析困難等導致難以獲取相關參數或者科學性較弱而難以開展相應研究[27]。本研究發現5項研究在經典三狀態(無進展生存期、疾病進展期和死亡)的基礎上增加了停止治療、進展方案治療等狀態。盡管這些研究結合研究目的和實際疾病進展情況對經典模型結構進行了優化,但是文中僅對增加的狀態進行了簡單描述,證據使用者難以判斷模型是否正確。構建模型時應組織相關領域專家和研究者對模型的表面效度、內部效度、外部效度、交叉效度和預測效度進行相關驗證,確保模型特別是不同于某領域經典模型的可靠性[28]。
本研究尚存在一定的局限。①QHES工具條目的評價以“是”“否”為評價結果,并且研究者尚未提供對每一條目權威的解讀,評價者在使用時會帶有一定的主觀性。雖然本研究在開展質量評價之前對評價者進行了統一培訓,但仍難以避免評價者由于對各條目理解的差異而導致評價結果的偏差。②本研究只納入了公開發表的期刊文獻,其他諸如加拿大藥品和衛生技術評估機構等部門發表的藥物經濟學研究報告并未納入,使結果具有一定的偏倚。今后,可進一步開展對藥物經濟學研究報告的方法學質量評價以彌補該局限性。③本研究未納入其他語言的研究,研究結果可能存在一定偏倚。
綜上所述,NSCLC免疫藥物的經濟學評價是藥物經濟學應用的重要領域之一,在我國醫保藥品目錄管理、醫院藥品采購及成本管理以及臨床合理用藥等方面發揮了積極的決策支持作用。然而,從全球現有的NSCLC免疫藥物經濟學方法學質量來看,總體上仍有較大的提升空間。本研究建議今后研究可主要從以下3個方面加以改進。第一,目前對于NSCLC長期療效數據獲得的主流方法是模擬RCTs的生存曲線,盡管在模擬過程中使用了相應的方法驗證模擬后數據的可靠性,但使用RWD研究結果進一步驗證模擬的長期療效能夠增加結果的可靠性。第二,模型的穩定性是基于模型的藥物經濟學評價的重要方法學之一。在使用該領域非經典評價模型時應該對模型進行相應驗證。第三,保持研究角度與成本分類的一致性。根據不同的決策需求,藥物經濟學評價的目的不同,研究角度亦不相同。無論采用何種角度,均應該保證研究角度與成本分類一致。