李夢楠 伍紅艷 茍琴 蔡一凡 肖熠 張?zhí)脷J 宋沈超 黃艷 謝卓君 林梟



中圖分類號 R956 文獻標志碼 A 文章編號 1001-0408(2020)11-1358-07
DOI 10.6039/j.issn.1001-0408.2020.11.13
摘 要 目的:了解藥物經(jīng)濟學評價中采用映射法獲取健康效用值的研究現(xiàn)狀,為藥物經(jīng)濟學評價中映射研究的開展提供參考。方法:以“映射法”“健康效用值”“成本-效用”“效用積分體系”“Mapping”“Health utility value”“Cost-utility”“Utivity point system”“Value set”為中英文關鍵詞檢索中國知網(wǎng)、萬方數(shù)據(jù)庫、PubMed、Medline、Ebsco、Ovid、Wiley數(shù)據(jù)庫中自建庫起至2018年12月31日發(fā)表的有關映射法獲取健康效用值的實證類期刊文獻,采用文獻計量法對納入文獻的基本信息、模型的構建與檢驗、最佳模型的類型等內(nèi)容進行統(tǒng)計分析。結果:納入研究的124篇文獻均發(fā)表在英文期刊;在映射模型的構建與檢驗中,應用頻次最多的計量經(jīng)濟學方法、性能評價指標和模型檢驗方法分別是普通最小二乘法(OLS)、平均絕對誤差(MAE)和殘差正態(tài)性檢驗,應用頻次分別為97次(31.60%)、89次(24.93%)和62次(21.09%);明確最佳映射模型的有117篇,其中,直接映射效果最佳的有101篇(86.32%),非效用量表中大多采用的是特異性量表(92篇,77.97%),少數(shù)文獻采用了普適性量表(26篇,22.03%),而效用量表采用最多的則是3水平歐洲5維健康量表(79篇,66.95%)。結論:國內(nèi)采用映射法獲取健康效用值的實證類研究還有待發(fā)展。國外學者成功開發(fā)的一系列映射模型不僅為采用非效用量表進行成本-效用分析提供了可行性,也為我國在今后的映射法實證研究中選用相應的計量經(jīng)濟學方法、評價指標及映射方式等提供了更多的思路。
關鍵詞 映射法;健康效用值;成本-效用;量表;藥物經(jīng)濟學評價;文獻計量研究
ABSTRACT? ?OBJECTIVE:To know about the research status of health utility value obtained by mapping method in pharmacoeconomic evaluation, and to provide reference for bibliometric study in pharmacoeconomic evaluation. METHODS: Using “Mapping method”“Health utility value”“Cost-utility”“Utility point system” as Chinese and English keywords, retrieved from CNKI, Wanfang database, PubMed, Medline, Ebsco, Ovid and Wiley database, empirical journal documents published from the inception to Dec. 31st, 2018 about using mapping method to obtain health utility value were collected. The bibliometrics was used to statistically analyze basic information of included literature, the construction and test of the model, the type of the best model and so on. RESULTS: The 124 included documents were all published in English journal. In the construction and testing of the mapping model, the most frequently used econometric methods, performance evaluation indicators and model testing methods were ordinary least squares (OLS), mean absolute error (MAE) and residual normality test, application frequency of which were 97 times (31.60%), 89 times (24.93%) and 62 times (21.09%). There are 117 articles that define the best mapping model, of which 101 articles (86.32%) have the best direct mapping effect. Most of the non-utility measurement scales adopted specific scales (92 articles, 77.97%), and a few literatures adopted the universal scale (26 articles, 22.03%). The most utility measurement scales were 3-level European 5-dimensional health scale (79 articles,66.95%). CONCLUSIONS:The domestic empirical researches that use the mapping method to obtain health utility values need to be developed yet. A series of mapping models successfully developed by foreign scholars not only provide the feasibility of using non-utility measurement scales for cost-utility analysis, but also provide more ideas for China to choose the corresponding econometric methods, evaluation indicators and mapping methods in the empirical research of the mapping method in the future.
KEYWORDS? ?Mapping method; Health-utility value; Cost-utility; Scale; Pharmacoeconomic evaluation; Bibliometric study
成本-效用分析(CUA)作為藥物經(jīng)濟學評價中的重要方法,其計算的關鍵在于生命質(zhì)量權重,即健康效用值的測量,而生命質(zhì)量量表則是測量健康效用值最常用的工具[1]。根據(jù)是否建立效用積分體系可將生命質(zhì)量量表分為效用量表和非效用量表。目前,效用量表多為普適性量表,然而在針對特定疾病和人群的測量中,普適性效用量表的靈敏度較低,因此在實際測量時,臨床專家及研究學者大多會采用特異性非效用量表,而此時若想進行衛(wèi)生經(jīng)濟學評價,便可通過映射法來實現(xiàn)[2]。
映射法是利用計量模型,以非效用量表的某一類指數(shù)為自變量、效用量表的某一類指數(shù)為因變量建立回歸方程,并對回歸方程進行擬合度檢驗,最后利用該方程預測健康效用值的方法[2]。在具體應用中,映射法又可分為直接映射和間接映射,直接映射是運用映射模型建立非效用量表和效用量表健康效用值之間的關系,直接預測健康效用值;而間接映射是一種基于維度水平的映射,其模型擬合結果為效用量表維度的所處水平,進而使用蒙特卡洛法、期望效用值法、最大可能概率法間接推測健康效用值[3]。在國外,英國國家衛(wèi)生與臨床優(yōu)化研究所(NICE) 早在2008年出版的《衛(wèi)生評價技術方法指南》[4]中就對映射法進行了特別推薦,而我國在2011年出版的《中國藥物經(jīng)濟學評價指南(2011版)》[5]中也正式將映射法列為獲取健康效用值的方法之一。因此,為了解國內(nèi)外目前在藥物經(jīng)濟學評價中采用映射法獲取健康效用值的研究現(xiàn)狀,本研究采用文獻計量學方法,對國內(nèi)外使用映射法獲取健康效用值的文獻進行統(tǒng)計、分析,以期為今后藥物經(jīng)濟學評價中映射研究的開展提供參考與借鑒。
1 資料與方法
檢索中國知網(wǎng)、萬方數(shù)據(jù)庫、PubMed、Medline、Ebsco、Ovid、Wiley數(shù)據(jù)庫自建庫以來至2018年12月31日發(fā)表的使用映射法獲取健康效用值的實證類期刊文獻。分別以“映射法”“健康效用值”“成本-效用”“效用積分體系”“Mapping”“Health utility value”“Cost-utility”“Utivity point system”“Value set”為中英文檢索詞進行檢索,排除綜述、摘要以及與主題無關、重復發(fā)表或信息不全的文獻。建立Excel表,對納入文獻的基本信息(發(fā)表年份及期刊、作者信息及資助情況、樣本選擇及研究對象類型)、映射模型的構建與檢驗(模型的映射方式、計量經(jīng)濟學方法、性能評價指標、檢驗方法)、最佳映射模型的函數(shù)式類型、不同類型的非效用量表與效用量表構建的最佳模型情況等進行統(tǒng)計分析。
2 結果
2.1 基本信息分析
2.1.1 文獻發(fā)表年份及期刊分布 初檢共獲得相關文獻290篇,經(jīng)過篩選,最終納入124篇文獻。文獻最早發(fā)表于2003年,2014年是發(fā)表文獻最多的年份(共19篇),年平均發(fā)文量為7.75篇,在數(shù)量分布上總體呈現(xiàn)上升的趨勢。124篇文獻均發(fā)表在英文期刊,共刊載于30種期刊,其中Value in Health收錄的發(fā)文篇數(shù)排第1位(34篇,27.42%),詳見表1。
2.1.2 作者信息及資助情況 124篇文獻共有作者633人,篇均作者為5.10人,其中獨著文獻有1篇(0.81%),作者數(shù)為2~5人、5人以上的文獻分別有76篇(61.29%)、47篇(37.90%)。第一作者主要來自于高校,有99篇(79.84%)。89篇(71.77%)文獻標明了經(jīng)費資助情況,其中最多的是政府資助(45篇,36.29%)。
2.1.3 樣本選擇及研究對象的類型 124篇文獻中樣本量最小的為48例,最大的為108 610例,平均為4 702例[標準差(SD)=12 789]。樣本包括門診患者、住院患者、社區(qū)居民等多種人群,其中以單人群樣本開展研究的有44篇(44.35%)。樣本抽樣方法包括整群抽樣、配額抽樣、分層抽樣等,采用最多的是以年齡、性別為特征開展的配額抽樣(25篇,20.16%)。
文獻中以患病人群、一般人群為主進行的研究分別有110篇(88.71%)、14篇(11.29%);在患病人群中,對單類疾病、兩類及以上疾病進行研究的分別有103篇(83.06%)、7篇(5.65%)。
2.2 模型的構建、檢驗與函數(shù)式分析
2.2.1 模型的構建 在映射模型的構建中,選用最多的映射方式是由1種非效用量表映射到1種效用量表,共有94篇(75.81%);而其余30篇(24.19%)為選出針對特定疾病映射效果更佳的量表,采用了在多種量表間構建映射模型的方式。例如Khan I等[6]在非小細胞肺癌患者中構建了歐洲癌癥研究與治療組織生命質(zhì)量核心問卷(QLQ-C30)映射到3水平歐洲5維健康量表(EQ-5D-3L)和5水平歐洲5維健康量表(EQ-5D-5L)的映射模型以選出最佳模型;Wu EQ等[7]在前列腺癌患者中構建了前列腺癌治療功能評價(FACT-P)和QLQ-C30映射到EQ-5D-3L的映射模型以選出最佳模型;Peak J等[8]在鴉片依賴者中構建了例行評估的臨床結果(CORE-OM)、利茲依賴問卷(LDQ)和治療結局評價量表(TOP)映射到EQ-5D-5L和成年人可行能力生命質(zhì)量量表(ICECAP-A)的映射模型以選出最佳模型。
文獻中選用1種、多種(具體為2~8種)計量經(jīng)濟學方法進行研究的分別有40篇(32.26%)、84篇(67.74%)。124篇文獻共選用了32種計量經(jīng)濟學方法,應用頻次為307次,其中應用最多的是普通最小二乘法(OLS),共應用97次(31.60%),詳見表2。
2.2.2 模型的檢驗 在映射模型的檢驗中,使用1種和多種(具體為2~6種)性能評價指標的分別有9篇(7.26%)和115篇(92.74%),而使用1種和多種(具體為2~6種)模型檢驗方法則分別有31篇(25.00%)和93篇(75.00%)。124篇文獻共選用了23種性能評價指標和33種模型檢驗方法,應用頻次分別為357次和294次,其中應用最多的是平均絕對誤差(MAE)和殘差正態(tài)性檢驗,分別為89次(24.93%)和62次(21.09%),詳見表3。
2.2.3 模型的映射函數(shù)式 124篇文獻中有4篇(3.23%)顯示映射效果不好,不建議采用;有3篇(2.42%)未選出最佳映射模型;其余117篇(94.35%)均明確了最佳的映射模型。根據(jù)最佳映射模型所選用的因變量和自變量的不同,可將映射函數(shù)式分為8種類型,其中,直接映射(類型1~4)效果最佳的有101篇(86.32%),間接映射(類型5~8)效果最佳的則有16篇(13.68%);其中,以類型2映射效果最佳的文獻最多,為55篇(47.01%),詳見表4。
2.3 不同類型的非效用量表與效用量表構建的最佳映射模型分析
2.3.1 特異性非效用量表與效用量表構建最佳映射模型 117篇文獻中選用特異性非效用量表與效用量表構建映射模型,最終選出最佳模型的共103篇(88.03%),其中在映射函數(shù)式中加入?yún)f(xié)變量的有30篇(25.64%)。研究的疾病包括癌癥、關節(jié)炎、皮膚病等多個病種,其中特異性非效用量表應用最多的是QLQ-C30(16篇,13.68%)。研究的特定人群包括兒童和老年人,其中針對兒童采用的特異性非效用量表包括兒童生命質(zhì)量量表(PedsQL)、青少年體質(zhì)量評價量表(WAItE)、10項兒童生命質(zhì)量量表(KIDSCREEN-10)等,共5篇(4.27%)。而在效用量表中應用最多的是EQ-5D-3L,共61篇(49.19%)。特異性非效用量表與效用量表構建最佳映射模型的情況統(tǒng)計詳見表5。
2.3.2 普適性非效用量表與效用量表構建最佳映射模型 117篇文獻中,選用普適性非效用量表與效用量表構建映射模型,最終選出最佳模型的共14篇(11.97%),其中在映射函數(shù)式中加入?yún)f(xié)變量的有2篇(1.71%)。研究對象包括成年人、16歲以上居民、糖尿病患者等。選用的普適性非效用量表包括12項健康調(diào)查簡表(SF-12)、36條目健康調(diào)查簡表(SF-36)、12項一般健康問卷(GHQ-12)、諾丁漢健康量表(NHP)和EQ-5D-5L,其中應用最多的是SF-12,共9篇(7.69%)。而效用量表應用最多的則是EQ-5D-3L,共12篇(10.26%)。普適性非效用量表與效用量表構建最佳映射模型的情況統(tǒng)計詳見表6。
3 討論
在藥物經(jīng)濟學評價中,采用映射法獲取健康效用值的實證研究在近6年得到較為明顯的發(fā)展,但國內(nèi)目前僅有1篇碩士論文是關于針對肺癌患者使用肺癌治療功能評價(FACT-L)映射到EQ-5D-3L的實證研究[9],可見國內(nèi)采用映射法獲取健康效用值的實證類研究還有待發(fā)展。發(fā)表相關文獻的期刊以Value in Health、Quality of Life Research、Health and Quality of Life Outcomes這類關注生命質(zhì)量、衛(wèi)生經(jīng)濟的期刊為主,開展相關研究的多為高校師生,政府是此類研究的主要資助機構。樣本的抽樣方法主要為配額抽樣,這使研究可以更多地包含研究對象的不同特征。此外,多數(shù)文獻有提到樣本量小是研究的一個局限,這不僅會使研究產(chǎn)生極值,從而引起預測的效用范圍比觀測到的效用范圍窄,還會降低研究結果在外部數(shù)據(jù)集中的有效性[10-12]。因此,在后續(xù)的研究中建議擴大樣本量,進行內(nèi)外部數(shù)據(jù)集的驗證,以提高模型的性能,使研究更具有代表性。
在映射法的實證研究中最重要的3個方面就是選擇適宜的計量經(jīng)濟學方法、評價指標和函數(shù)類型。本研究通過對納入研究的文獻進行模型構建與檢驗分析后發(fā)現(xiàn),在計量經(jīng)濟學方法的選擇中,雖然OLS因忽略因變量的分布問題而受到了一些學者的質(zhì)疑[13],但是因其方法相對簡單、預測效度較好,故仍然受到了更多研究者的青睞。在模型的性能評價指標中,相較于R2和Adj-R2,應用頻次更多的是MAE和RMSE,這可能是因為映射的最終目的是使預測的健康效用值盡可能接近真實觀測值。相較于R2和Adj-R2只能表示模型的擬合程度,MAE和RMSE作為能衡量預測效用值與觀測效用值之間偏差的指標,能更好地評價模型的性能。在明確最佳映射模型的函數(shù)式選擇中,86.32%的文獻選擇了直接映射的函數(shù)式類型,這可能是因為直接映射的計算更加簡單,所需的數(shù)據(jù)比間接映射少。而在自變量中,50.43%的文獻選擇了以維度為自變量,這可能是由于選用的非效用量表中維度與效用量表的相關性更高。
在最佳映射模型的分析中發(fā)現(xiàn),88.03%的文獻在特異性非效用量表與效用量表之間成功構建了映射模型,這在一定程度上可以減少一些學者擔憂的特異性非效用量表與效用量表所測量內(nèi)容重疊度不高、映射效果可能不佳的問題[14],但是,這也需要通過拓寬研究領域,從而從更廣泛的角度進行評估。在最佳映射模型中,效用量表應用最多的是EQ-5D-3L,這可能是因為其簡單明了、易于操作、應用面廣、可信度高[15]。但是也有研究表明,EQ-5D-3L可能會使健康問題嚴重的患者因映射而低估其效用值[16-17],因此,在選擇效用量表時也應根據(jù)研究對象所患疾病及嚴重程度進行衡量。此外,僅有27.35%的文獻在最佳映射模型的函數(shù)式中加入了社會人口學特征、臨床癥狀、衛(wèi)生服務量等協(xié)變量,這可能是因為目前對于是否將此類協(xié)變量添加到映射算法中尚有爭議。有研究表明,添加協(xié)變量會提高擬合度的統(tǒng)計優(yōu)勢,但將以結果的可概括性為代價,因為在其他研究中需要收集相同特征的患者樣本[18]。此外,目前的映射研究大多數(shù)都沒有進行外部樣本的驗證,而是從樣本總體中抽取一定比例的樣本作為構建集和驗證集,例如Crott R等[19]的研究就提出,在中東歐國家/地區(qū)開發(fā)的映射算法是否能在西歐國家/地區(qū)使用,還需要在外部臨床數(shù)據(jù)集中進一步驗證。因此,目前所發(fā)布的映射函數(shù)在外部人群的推廣上還存在一定的限制。
綜上所述,在無法直接度量健康效用值的情況下,映射法提供了一種有價值的方法,可用來估算效用值,進而為藥物經(jīng)濟學評價提供結果指標,但在應用的過程中也存在樣本量小、方法和指標選擇困難、推廣受限等問題。因此,在后續(xù)研究中,建議擴大樣本量、拓寬研究領域,采用多種計量方法和評價指標進行對比分析,并積極開展推廣性研究,以此來推進映射法在獲取健康效用值中的應用。總之,國外學者成功開發(fā)的一系列映射模型不僅為采用非效用量表進行成本-效用分析提供了可行性,也為我國在今后的映射法實證研究中選用相應的計量經(jīng)濟學方法、評價指標及映射方式等提供了更多的思路。
參考文獻
[ 1 ] 劉暢.基于三種通用型生命質(zhì)量量表的慢性盆腔炎人群生命質(zhì)量的比較研究[D].北京:北京中醫(yī)藥大學,2019.
[ 2 ] 孫園園,余正,李洪超.健康效用值測量中的映射法及其相關模型概述[J].中國藥房,2017,28(29):4045-4049.
[ 3 ] 劉彤,李順平,陳鋼.健康效用值測量中映射法應用的研究進展[J].中國藥物經(jīng)濟學,2018(11):121-124.
[ 4 ] EARNSHAW J,LEWIS G. NICE guide to the methods of technology appraisal pharmaceutical industry perspective[J]. Pharmacoeconomics,2008,26(9):725-727.
[ 5 ] 《中國藥物經(jīng)濟學評價指南》課題組.中國藥物經(jīng)濟學評價指南:2011版[J].中國藥物經(jīng)濟學,2011(3):6-48.
[ 6 ] KHAN I,MORRIS S,PASHAYAN N,et al. Comparing the mapping between EQ-5D-5L,EQ-5-D-3L and the EORTC-QLQ-C30 in non-small cell lung cancer patients[J]. Health Qual Life Outcomes,2016. DOI.10.1186/s12955-016-0455-1.
[ 7 ] WU EQ,MULANI P,F(xiàn)ARRELL MH,et al. Mapping FACT- P and EORTC QLQ-C30 to patient health status measured by EQ-5D in metastatic hormone-refractory prostate cancer patients[J]. Value Health,2007,10(5):408-414.
[ 8 ] PEAK J,GORANITIS I,DAY E,et al. Predicting health- related quality of life (EQ-5D-5L) and capability wellbeing(ICECAP-A)in the context of opiate dependence using routine clinical outcome measures:CORE-OM,LDQ and TOP[J]. Health Qual Life Outcomes,2018,16(1):106-116.
[ 9 ] 付希婧.映射法在健康效用值測量中的應用研究:以肺癌治療功能評價量表FACT-L為例[D].北京:北京中醫(yī)藥大學,2015.
[10] COLLADO-MATEO D,CHEN G,GARCIA-GORDILLO MA,et al. Fibromyalgia and quality of life:mapping the revised fibromyalgia impact questionnaire to the preference-based instruments[J]. Health Qual Life Outcomes,2017,15(1):114-122.
[11] MOORE A,YOUNG CA,HUGHES DA.Mapping ALSFRS-R and ALSUI to EQ-5D in patients with motor neuron disease[J]. Value Health,2018,21(11):1322-1329.
[12] ZHENG YJ,TANG K,YE L,et al. Mapping the neck disability index to SF-6D in patients with chronic neck pain[J]. Health Qual Life Outcomes,2016,14(1):21-32.
[13] 孫權,張方.健康效用值映射法轉(zhuǎn)換的研究現(xiàn)狀[J].中國藥物經(jīng)濟學,2018(12):106-120.
[14] CHUANG L,WHITEHEAD SJ. Mapping for economic evaluation[J]. Br Med Bull,2012,101(1):1-15.
[15] 伍紅艷,劉國恩,官海靜. EQ-5D健康量表效用積分體系的構建研究:基于我國西南地區(qū)的實證研究[J].中國藥房,2016,27(14):1877-1881.
[16] CHUANG L,KIND P. Converting the SF-12 into the EQ- 5D-an empirical comparison of methodologies[J]. Pharmacoeconomics,2009,27(6):491-505.
[17] KIADALIRI AA,ENGLUND M. Assessing the external validity of algorithms toestimate EQ-5D-3L from the WOMAC[J]. Health Qual Life Outcomes,2016,14(1):141-149.
[18] MORTIMER D,SEGAL L. Comparing the incomparable? A systematic review of competing techniques for converting descriptive measures of health status into QALY-weights[J]. Med Decis Making,2008,28(1):66-89.
[19] CROTT R,BRIGGS A. Mapping the QLQ-C30 quality of life cancer questionnaire to EQ-5D patient preferences[J].Eur J Health Econ,2010,11(4):427-434.
(收稿日期:2019-12-26 修回日期:2020-04-08)
(編輯:劉明偉)