第四軍醫大學衛生統計教研室(710032) 孫斯睿 趙云松 張海悅 梁 英 譚志軍 徐勇勇
【提 要】 目的 比較EQ-5D-3L量表與EQ-5D VAS映射模型及值域表,提出不同人群EQ-5D VAS映射模型的選擇策略。方法 通過對某功能社區的現場調查,獲取EQ-5D-3L量表和EQ-5D VAS的實測值,對比國內外12個映射模型和本研究建立的預測模型的相關性和絕對誤差。所有模型均為一般線性模型,數據處理采用R語言。結果 (1)歐洲及英國、芬蘭等7個國家及新西蘭之間EQ-5D VAS映射模型的相關系數均大于0.9。以芬蘭作為國外VAS映射模型的代表,芬蘭模型與中國2次調查和本研究的相關系數分別為0.969、0.939和0.976;(2)本研究和芬蘭模型的VAS預測值與實測值的擬合曲線相似,平均絕對誤差分別為17.11和16.96;(3)VAS預測值比TTO預測值平均少20分,更接近實測值。結論 2008年和2013年在第四次和第五次國家衛生服務調查建立的EQ-5D VAS映射模型,對于相對健康人群,2008年建立的N3模型誤差較小。國外模型中,芬蘭模型誤差較小。根據特定人群建立的映射模型不能外推到其他人群。
EQ-5D可視化模擬標尺評分(visual analogue scaling,VAS)是與歐洲生命質量五維健康量表(EuroQol five-dimensional questionnaire,EQ-5D)配套使用的健康狀態評分工具,即在最小值為0、最大值為100的標尺上,對評價對象整體健康狀況進行評價。100表示評價者認為最好的健康狀態,0表示評價者認為最差的健康狀態[1]。在不同的場景下,評價對象可以是居民、學生、職工和患者,評價者可以是評價對象本人、監護人、調查員和醫護人員。我國目前使用最多的是3水平的EQ-5D量表(EQ-5D-3L),并且先后在2008年和2013年在第四次和第五次國家衛生服務調查中,擬合了EQ-5D-3L與EQ-5D VAS的映射模型[2-4]。同時,一些對糖尿病、高血壓、冠心病、慢性阻塞性肺炎等疾病人群的健康效用研究中,多采用日本、英國、美國、泰國的映射模型(積分體系)作為健康效用的估計值[5]。本文擬通過某功能社區的VAS實測數據,建立EQ-5D-3L與EQ-5D VAS的映射模型,并與國內外13種EQ-5D VAS映射模型比較,提出不同人群EQ-5D VAS映射模型的選擇策略。
1.數據來源
歐洲、英國、新西蘭等國家建模數據來自EQ-5D index calculator[6],中國數據來自2008年和2013年2次國家衛生服務調查。企業建模EQ-5D-3L與EQ-5D VAS數據來自對西北地區某大型企業的在崗員工的現場調查,見表1。

表1 數據來源
2.方法
(1)映射模型
m模型:EQ-5D-3L量表5個維度:行動能力(MO),自我照顧(SC),平常活動(UA),疼痛/不適(PD)和焦慮/抑郁(AD)的主效應模型,則映射模型可表達為:
(1)
上式中,a,b,c,d,e為一般線性模型的估計參數,MO2,MO3,……,AD3為亞變量,MO2表示MO維度為2水平,MO3表示MO維度為3水平,……,余類推。當5個維度均為1水平時,即MO1=SC1=UA1=PD1=AD1=1,常數項cons=1。
N3模型:在式1基礎上,增加一個估計參數N3,見式2。
(2)
式2中,z為亞變量。z=1,表示EQ-5D-3L量表5個維度至少有一個維度為水平3。
(2)模型擬合
式1、式2的模型參數采用一般線性模型(generallinear model)估計。計算及繪圖采用R語言-R 3.4.4 (2018-03-15)。
1.EQ-5D VAS調查結果
EQ-5D VAS實測值分布(n=2193)見圖2。實測值密度函數低于普通人群的95.9,P<0.01。EQ-5D-3L量表5個維度中,行動能力無任何問題(MO1)、自我照顧無任何問題(SC1)、平常活動無任何問題(UA1)、疼痛/不適(PD1)無任何問題和焦慮/抑郁無任何問題(AD1)分別占91.6%、95.9%、91.9%、64.8%和69.0%,其中疼痛/不適(PD1)和焦慮/抑郁2個維度,低于普通人群(2013年第五次國家衛生服務調查)的87.4%和94.7%,P<0.01。

圖1 EQ-5D狀態(無任何困難)百分率比較
2.EQ-5D 模型的估計參數與相關性
歐洲及英國、芬蘭等7個國家及新西蘭、中國的2次調查和本研究建立的EQ-5D-3L量表與EQ-5D VAS映射模型的估計參數見表2。本研究VAS實測相關系數為0.55,與國外模型比較,VAS實測值與芬蘭的相關系數0.545。

表2 EQ-5D VAS映射模型的估計參數及與VAS實測值相關系數
*:與VAS實測值相關系數,**P<0.01
歐洲及英國、芬蘭等7個國家及新西蘭之間EQ-5D VAS映射模型的相關系數均大于0.9。以芬蘭作為國外VAS映射模型的代表,芬蘭模型與中國2次調查和本研究的相關系數分別為0.969、0.939和0.976,見圖2。

圖2 芬蘭模型與中國2次調查和本研究的相關圖
3.EQ-5D 模型的量效關系
依據EQ-5D-3L量表理論上能表示35=243種健康狀態。為了評價EQ-5D-3L與EQ-5D VAS的量效關系可用圖3表示。 圖3中,“11111”表示無健康問題,“21111”、“12111”、“11211”、“11121”、“11112”表示有輕度健康問題,“32211”、“22323”、“22233”、“33321” 表示有較大健康問題,“33333”表示最差健康狀態。本研究因調查的是在職人員,沒有出現圖3最后的5種情況。圖3所有模型中,本研究和芬蘭模型的VAS預測值與實測值(VAS/100)最為接近。

圖3 VEQ-5D VAS映射模型比較
4.EQ-5D 模型預測值絕對誤差
各模型預測值與實測值的絕對誤差見表3。絕對誤差較小的模型分別是芬蘭(16,93)、丹麥(16.96)和本研究(17.11)。
EQ-5D VAS映射模型獲得的預測值U(h)(U(·)為映射模型,h為健康狀態)是采用效用方法(the utility approach)建立值域表(utility-based value set,UBVS),EQ-5D-3L量表的健康狀態h可表示35=243種健康狀態,EQ-5D-5L量表的健康狀態h可表示35=3125種健康狀態[7-8]。UBVS是用介于0和1之間的基數尺度(cardinal scale)評價個體健康狀況以及與健康相關的生活質量。完全健康狀況(full health)用1表示,因慢性病或其他因素導致的生活不便、疼痛及健康損失(disabilities)導致的健康效用損失1-U(h),理論上1-U(h)介于0,1之間,1-U(h)=0為完美健康狀況(無損失),1-U(h)=0為最差健康狀況(死亡)。然而,表2中EQ-5D VAS映射模型建模或調查對象是普通人群,EQ-5D-3L量表或EQ-5D-5L量表的最差結果“33333”并不表示死亡,因此,表2中EQ-5D VAS映射模型會出現負數(圖3芬蘭和C2013),EQ-5D VAS映射模型建立的預測值域表稱為基于體驗的值域表(experience-based value set ,EBVS)。由于EBVS基于調查對象的個人體驗,不同群體建立的EBVS會有很大差異,例如2008年第四次國家衛生服務調查中,真實的EBVS有167種健康狀態,“11111”占87%,其次是“11121”和“11112”。“11111”狀態VAS=82.6, “33333”狀態 VAS=33.0。本研究因調查對象是在職員工,真實的EBVS僅有60種健康狀態,前4位健康狀態是“11111”、“11122”、“11121”和“11112”,分別占50.6%、13.0%、11.3%和8.8%,4種健康狀態占到總調查人數的83.7%。本研究的60種健康狀態中,大于等于20例的有9種(第四次國家衛生服務調查51種),占到總調查人數的89.3%,見表4。健康狀態沒有MO3(不能下床活動)、SC3(無法自己盥洗或穿衣服)和UA3(無法從事日常活動),見表2。“11111”狀態 VAS=78.1±12.3,比第四次國家衛生服務調查低4.5分。

表3 EQ-5D模型預測值與實測值絕對誤差
EBVS的誤差來自2個方面。一是調查對象對自己健康狀況的描述,二是調查對象的EQ-5D VAS評分。歐洲等7國EQ-5D VAS建模的調查對象需要經過培訓,調查對象的健康狀態描述要覆蓋無健康問題、有輕度健康問題、有較大健康問題和最差健康狀態,見圖3中4個區域。因此,雖然歐洲等7國建模的樣本量不大,如西班牙僅300人(表1),但代表性好。本研究發現VAS實測值存在較大個體差異(表4),且“11111”、“11121”等個別組峰度、偏度檢驗均有統計學意義,但無明顯“天花板效應”(圖4)。

表4 EQ-5D健康狀態及VAS峰度、偏度檢驗
*:*P<0.05

圖4 本研究EQ-5D VAS分布
最后討論時間權衡法(time trade-off,TTO)與VAS的區別。TTO是在特定的場景下生活10年,如在 “21111”狀態下生活10年,讓調查對象選擇相當于在完全健康“11111”的狀態下生活了多少年?如果答案是T年,TTO=T/10[9]。目前,丹麥、德國、日本、荷蘭、西班牙、泰國、英國、美國津巴布韋、中國等10個國家建立了EQ-5D-3L與TTO的映射模型[1,10]。德國、加拿大、中國還建立了EQ-5D-5L與TTO的映射模型[11-13]。中國EQ-5D-3L與TTO的映射模型的建模樣本1147人,主效應模型為
TTO=0.956-0.099*MO2-0.252*MO3-0.103*SC2-0.214*SC3-0.075*UA2-0.201*UA3-0.093*PD2-0.244*PD3-0.087*AD2-0.214*AD3
(3)
中國TTO和VAS研究的最大區別在于,TTO是在 96種假設場景下的概率選擇(類似方法還有標準博弈法,standard gamble ,SG)[10],VAS是基于真實場景和親身體驗的實測值[2-3]。TTO“33333”狀態表示死亡,VAS“33333”狀態表示存活者最差健康狀態。對于有輕度健康問題的受試者,VAS小于TTO。本研究實例,VAS預測值要平均比TTO預測值少20分,更接近實測值。或者說,TTO會高估評價對象的健康狀況。因此,外部數據比較時,只有在方法相同(TTO或VAS)才有可比性。對于本研究,目標人群有7萬多員工,企業建模的EQ-5D VAS值域表誤差最小,但不一定適用于其他人群。對于普通人群,VAS較TTO更容易解釋。VAS映射模型選擇,中國2008年模型和芬蘭模型的誤差最小。