劉 博 ,徐 娟 ,Georg Kemmler ,李浩飛 ,常恩雪 ,鄭萬基 ,谷 文 ,周 瀾 ,劉 瑞 ,黃衛(wèi)東 ,羅 南
(1.哈爾濱醫(yī)科大學衛(wèi)生管理學院,哈爾濱 150081;2.因斯布魯克醫(yī)科大學精神病學和心理治療系,奧地利 因斯布魯克 6020;3.新加坡國立大學蘇瑞福公共衛(wèi)生學院,新加坡 117549)
癌癥作為嚴重威脅人類健康的主要致死疾病之一,近年來新發(fā)癌癥病例數(shù)和死亡病例數(shù)不斷上升,其負擔之重亟待破解[1]。成本-效用分析(cost-utility analysis,CUA)作為衛(wèi)生技術評估(health technology assessment,HTA)常用的研究方法[2],可用于比較不同癌癥領域的干預措施,為癌癥的診治、防護及相關政策制定提供科學循證依據(jù)。健康效用(health utility)是人們對某種特定健康狀態(tài)的偏好程度,用于反映生命質量的權重,其準確測量是CUA結果可靠性的重要保證[3]。本文對癌癥患者健康效用測量方法進行介紹和評述,即直接測量法、多屬性健康效用測量量表法(multi-attribute utility instrument,MAUI)和映射法,以期為癌癥HTA領域內(nèi)健康效用測量工具選擇提供經(jīng)驗參考,繼而為優(yōu)化癌癥領域資源配置以及政策制定提供循證依據(jù)。
直接測量法是效用測量中最為基礎的方法,理論依據(jù)充分且可以直觀地測量出受訪者對于某種健康狀態(tài)的效用,包括刻度評分法(rating scale,RS)、標準博弈法(standard gamble,SG)、時間權衡法(time-trade off,TTO)、離散選擇實驗法(discrete choice experiment,DCE)、優(yōu)劣尺度法(best-worst scaling,BWS),這5種方法的理論基礎和使用方法見表1。

表1 5種直接測量法的理論基礎和使用方法
RS、SG和TTO這3種方法開發(fā)較早,早期使用較多,且在癌癥患者健康效用測量中經(jīng)常聯(lián)合使用或進行比較。RS是直接測量法中最簡便的方法,主要包括類別比例法、尺度評分法和視覺模擬法,其中視覺模擬法最為常用。RS雖然易于理解且操作簡單,但其理論基礎不強且受訪者的心理認知與感受易受到多種外界因素影響,繼而影響測量的準確性。甚至有研究者認為在RS中受訪者沒有進行風險權衡或在多個備選方案中進行選擇,因此得出的結果不是效用[4]。TTO與SG具有較強的理論基礎,均是找到受訪者相對可以接受的均衡點,其中SG是對死亡風險進行權衡,而TTO則是對生存時間進行權衡,但二者均存在實際操作復雜、成本較高以及對受試者的認知要求較高等問題。TTO的實施難度介于RS和SG之間,是三者中應用最為廣泛、研究最為深入的效用測量方法。
這3種方法在癌癥患者健康效用的測量中均有應用[5]。Kaplan等[6]在前列腺癌患者中比較了RS和TTO兩種方法,結果顯示癌癥患者對TTO的滿意度較低且具有顯著的天花板效應,內(nèi)部效度差于RS??偠灾?,這3種方法獲得的癌癥患者健康效用存在差異,SG產(chǎn)生的效用最高,TTO次之,RS產(chǎn)生的效用最低[7―8]。這可能因為SG的問題中涉及立即死亡這一選項,而受試者大多對這一風險存在厭惡心理。由Mcneil等[9]和Stiggelbout等[10]的研究可知,人們在面對風險時會采取風險規(guī)避措施,而癌癥患者病情相對較重,一般存在非常強烈的風險厭惡心理,且風險規(guī)避與藥物治療之間存在關聯(lián),接受過化療的癌癥患者會更加規(guī)避風險。故SG獲得的效用一般高于TTO所獲得的效用。
DCE和BWS具有相同的理論基礎且均是讓受試者在虛擬情境下進行選擇。DCE在20世紀末被引入健康領域用于測量患者健康效用、分析患者偏好和支付意愿以及資源配置決策和價值判斷等研究。DCE通過模擬具體情景可以幫助受試者更好地理解問題并可同時進行多屬性評估,實施簡單且響應效率較好。BWS是近年來在國際上運用越來越多的測量意愿和偏好的方法,主要包括3種類型:對象型(BWS-1)、組合型(BWS-2)和多重組合型(BWS-3),其中BWS-2主要應用于健康經(jīng)濟學領域。相比于DCE,BWS擁有更強的辨別力且更容易獲得所給選項的完整排名,并可通過較小的樣本量來準確估計偏好,擁有更高的統(tǒng)計效率[11]。目前二者已被驗證具有較好的信度和效度,但二者在癌癥領域信度和效度的驗證較少,多用于測量癌癥患者需求和治療的偏好且大多數(shù)的受訪者表示更喜歡DCE[12]。Maculaitis等[13]分別利用DCE和BWS測量乳腺癌患者的健康效用并比較了腫瘤學專家和患者對治療方法的偏好,結果表明二者測得健康效用以及腫瘤學專家和患者最看重的屬性基本一致,但大多數(shù)的受訪者表示更喜歡DCE。
MAUI由健康狀態(tài)分級系統(tǒng)和與其對應的健康效用積分體系兩部分組成,研究者利用健康狀態(tài)分級系統(tǒng)獲得受訪者目前所處的健康狀態(tài)后根據(jù)其健康效用積分體系計算出該狀態(tài)的效用。由于不同國家/地區(qū)人群所處環(huán)境、文化等因素不同致使其健康偏好也存在差異,故需要基于本國/地區(qū)人群偏好建立健康效用積分體系。MAUI是目前最為常用的癌癥患者健康效用測量方法,主要包括普適性健康效用量表和疾病特異性效用量表。
普適性健康效用量表便于理解且操作簡單,同時適用于普通人群和患病人群,常用的普適性健康效用量表信息見表2。

表2 8個普適性健康效用量表的基本信息
2.1.1 EQ-5D EQ-5D是各國各領域最常用的普適性健康效用量表,包括EQ-5D-3L(以下簡稱“3L”)和EQ-5D-5L(以下簡稱“5L”)兩個版本。EQ-5D已廣泛應用于癌癥領域且具有較好的信度、效度和反應性,對此美國、韓國和中國等多項研究都提供了有力的證據(jù)[14]。目前大多數(shù)實證研究均表明5L的測量屬性整體優(yōu)于3L。Zeng等[14]比較了3L和5L在6種常見癌癥患者中的測量特性,其中3L的天花板效應(17.8%)遠高于5L(10.1%),5L的重測信度和聚合效度也略優(yōu)于3L,二者均顯示出較好的組間效度,但5L區(qū)分能力更強。2009年,歐洲生命質量組織開發(fā)了適用于兒童及青少年的版本(EQ-5DY),EQ-5D-Y依然包括EQ-5D-Y-3L(以下簡稱“3LY”)和EQ-5D-Y-5L(以下簡稱“5LY”)兩個版本,并且已有研究對EQ-5D-Y兩版本的信度和效度進行了檢驗[15]。沈安樂等[16]在血液腫瘤兒童患者中對EQ-5D-Y進行了驗證,結果表明3LY和5LY在該人群中均具有一定的可行性以及可接受性,但5LY的區(qū)分能力更強。
2.1.2 SF-6D SF-6D包括SF-6Dv1和SF-6Dv2兩個版本。SF-6Dv1是Brazier等[17]在健康調查簡表(SF-36)的基礎上開發(fā)的基于人群偏好的測量工具,具有測量維度豐富、各維度分級精細以及擁有科學的效用值換算公式等優(yōu)點,其信度、效度和反應性已在癌癥患者中得到驗證。近期有研究表明,SF-6Dv1中部分語言表述模糊,可能導致受訪者理解存在歧義,并且個別維度的水平數(shù)量較少致使該維度的區(qū)分度不夠,故在此基礎上研究者開發(fā)了SF-6Dv2。SF-6Dv2雖開發(fā)較晚,但其有效性和可靠性在普通人群和癌癥患者中均已得到驗證[18]。同樣作為應用較多的普適性健康效用量表,EQ-5D和SF-6D經(jīng)常在同一研究中被用來比較。大多研究表明,SF-6D較EQ-5D具有更低的天花板效應和更高的敏感性,但SF-6D的地板效應高于EQ-5D[19],這一結果同樣適用于癌癥領域。Tramontano等[20]在肺癌患者中對兩個量表進行比較,結果發(fā)現(xiàn)EQ-5D的天花板效應(20.0%)遠高于SF-6D(2.3%)。兩個量表均適用于癌癥患者健康效用的測量且能夠區(qū)分不同癌癥患者的健康狀態(tài),但利用EQ-5D測得的癌癥患者健康效用一般高于SF-6D,這一結果在乳腺癌患者(EQ-5D為0.685,SF-6D為0.653)[21]和肺癌患者(EQ-5D為0.78,SF-6D為0.68)[20]等癌癥群體中均有證實。
2.1.3 其他 HUI有3個版本,即HUI1、HUI2和HUI3,目前HUI2和HUI3已經(jīng)取代了HUI1。相對于HUI2,HUI3擁有更詳細的描述系統(tǒng)和更完整的結構獨立性,但HUI2有一些HUI3沒有的額外維度,如自我照料和生育,故HUI2常用于某些特殊研究中。研究表明,HUI是一種可接受的、可靠的、有效的癌癥患者健康效用測量工具,并且可應用于兒童癌癥患者當中[22]。Shimoda等[23]、Fu等[24]、Boran等[25]在巴西、中美洲、土耳其等國家或地區(qū)的兒童癌癥患者中均證明了HUI的可行性、可靠性和有效性。
QWB是國際上第一個專門用來測量生命質量以評估質量調整生命年的普適性健康效用量表[26],該量表在癌癥領域具有良好的信度、效度和較高的敏感性,并且其有效性在兒童癌癥領域得到了驗證[27],但在國內(nèi)卻鮮有應用。
15D是一種通用的、全面的、自我管理的用來測量成人健康相關生命質量的量表,該量表是為16歲以上的成年人設計的,問卷已有14種語言版本[28],其適用性在西方國家的癌癥患者中已被證明[29]。目前該量表在我國應用較少。16D和17D是在15D的基礎上開發(fā)的:17D適用于8~11歲的兒童,16D適用于12~15歲的青少年[29],兩個版本已在兒童癌癥領域中有所應用[30]。
普適性健康效用量表雖已被驗證適用于癌癥患者,但存在現(xiàn)有條目與癌癥的關聯(lián)性較低以及靈敏度較低等問題。在實際的臨床試驗和研究中,醫(yī)護以及患者更愿意選用疾病特異性效用量表來測量癌癥患者的健康相關生命質量?!皻W洲癌癥研究與治療組織(European Organization for Research on Treatment of Cancer,EORTC)”研發(fā)的QLQ-C30和美國西北大學“結局、研究與教育中心”開發(fā)的癌癥治療功能評價系統(tǒng)(functional assessment of cancer therapy,F(xiàn)ACT)是當前世界范圍應用最廣的兩類癌癥患者健康相關生命質量測定的量表。這兩個量表總結了許多癥狀和特定癌癥領域的量表,具有很強的臨床實用性,但目前無法對癌癥患者的健康效用進行直接測量。為了有效解決此問題,癌癥多屬性效用測量聯(lián)盟在QLQ-C30和FACT的基礎上開發(fā)了基于偏好的癌癥特異性效用量表QLU-C10D[31]和FACT-8D[32]。
2.2.1 QLU-C10D 2011年,Rowen等[33]利用 Young等[34]的方法對655例多發(fā)性骨髓瘤患者的臨床試驗數(shù)據(jù)進行分析,開發(fā)出包含8個維度的生命質量測定量表EORTC-8D。在2016年,癌癥多屬性效用測量聯(lián)盟利用同樣的方法[34]對來自14個國家的2 616名癌癥患者的臨床數(shù)據(jù)匯總并進行二次分析,納入了腫瘤學家和患者的意見,保證了新開發(fā)出的QLU-C10D具有國際適用性和臨床有效性[31]。該量表與EORTC-8D在情緒功能、疲勞、惡心和腸道問題4個維度是完全相同的,身體功能維度包含相同的條目但水平不同,角色功能、社交功能和疼痛3個維度包含不同的條目,并在此基礎上增加了睡眠和食欲2個維度,可定義1 048 576個健康狀態(tài)。由于QLU-C10D在研發(fā)時樣本數(shù)量更大且具有多樣性及量表涵蓋維度更全面等優(yōu)勢,因此其權威性得到公認并被EORTC推薦使用。QLU-C10D的信度和效度已經(jīng)在癌癥人群中得到驗證[35],并且澳大利亞、加拿大、德國、法國、英國、荷蘭、西班牙、美國以及奧地利、波蘭和意大利(三國合作開發(fā))均已建立起基于本國人群的效用積分體系,此外還有多個國家正在相繼開展效用積分體系的構建工作。澳大利亞是第一個采用伴有生存時間的DCE建立QLU-C10D效用值積分體系的國家,效用取值范圍是[-0.096,1]。Bulamu等[36]對比了QLU-C10D和3L在食管癌術后患者短期生活質量的反應性和聚合效度,結果表明,雖然二者均適用,但QLU-C10D對患者的短期內(nèi)效用變化更敏感。Gamper等[37]將基于一般人群的效用積分體系構建方法應用于癌癥患者,證明其在癌癥患者中的可行性和可接受性,為QLU-C10D將來在癌癥患者中的評估研究提供了可能。
2.2.2 FACT-8D FACT-G作為FACT系列的核心量表在全球范圍內(nèi)已有72個語言版本且在中國也有著廣泛的應用。2021年,King等[32]對現(xiàn)有FACT-G進行心理測量學分析并同樣邀請了癌癥患者對條目進行評估,最終納入疼痛、疲勞、惡心、睡眠、工作、社會支持、悲傷和未來健康擔憂8個維度形成FACT-8D,每個維度包括5個水平,可定義32 768個健康狀態(tài)。澳大利亞是第一個采用伴有生存時間的DCE的方法建立FACT-8D效用值積分體系的國家[32]。Herdman等[38]評估了FACT-8D在復發(fā)性/難治性套細胞淋巴瘤中的有效性和反應性,并與5L進行了比較,結果表明二者均具有良好的聚合效度和反應性,但在組間效度的測量中FACT-8D相較于EQ-5D表現(xiàn)較差。這是首次對FACT-8D的心理測量學特性進行研究,未來還有待于在其他類型的癌癥患者中進行驗證。
映射法是通過建立非效用量表和效用量表各維度水平之間的映射關系,利用各維度水平的預測概率和效用量表的積分系統(tǒng)計算出患者的健康效用。由于應用于癌癥的疾病特異性效用量表大多是非基于偏好的設計,不能直接用于CUA。鑒于此,映射法在癌癥領域應用廣泛[39]。研究者通常將應用于癌癥的疾病特異性效用量表(如QLQ-C30、FACT等)映射到普適性健康效用量表中,再用于CUA,其中EQ-5D及SF-6D最為常見。有研究將QLQ-C30映射到EQ-5D、15D和SF-6D上,結果表明三者模型預測均較好,其中SF-6D的預測能力最佳[40]。映射法在模型的穩(wěn)健性、結果的準確性以及公式的外推性等方面存在一定爭議,英國國家衛(wèi)生與臨床優(yōu)化研究所等機構將映射法作為相對于直接測量方法和MAUI的次優(yōu)選擇,隨著QLU-C10D和FACT-8D的出現(xiàn)及相應積分體系的構建,映射法的應用在將來可能會逐漸減少。
直接測量法在癌癥領域有著廣泛的應用,其信度和效度在癌癥患者中已得到驗證。相對于RS、TTO和SG這3種方法,DCE和BWS在認知難度方面有所降低,因此這兩種測量方法在癌癥患者健康效用測量領域應用逐漸增多。但總體而言,直接測量方法依然存在操作復雜、成本較高以及對受試者的認知要求較高等問題,故較少直接用于癌癥患者健康效用的測量,多用于量表的效用積分體系的構建及方法學之間的比較研究。
MAUI是當前癌癥患者健康效用測量的首選方法。普適性健康效用量表在大多數(shù)癌癥患者健康效用測量的研究中已顯示出合理的可靠性、信度和效度,其中EQ-5D和SF-6D應用較多。由于同一工具在不同癌癥類型和階段中表現(xiàn)不同且不同工具在同一癌癥人群中的表現(xiàn)也存在差異,所以癌癥患者應結合各量表特點選擇適合的測量工具。在中國,健康效用測量與健康效用積分體系構建這一領域研究起步相對較晚,在癌癥領域的相關研究與應用也較少,目前僅有3L、5L及SF-6Dv2擁有基于中國一般人群的健康效用積分體系。
普適性效用量表的維度和水平較為簡潔,并非針對癌癥患者開發(fā),缺乏識別和區(qū)分癌癥相關癥狀的能力。例如癌癥患者更重視睡眠、疲勞、認知功能和社會支持等因素,但普適性健康效用量表并沒有涵蓋[41],因此臨床醫(yī)生和研究人員通常傾向于選擇對患者干預措施的效果更為敏感的疾病特異性效用量表[33],方便測量和收集癌癥患者的相關癥狀、副作用以及功能和生活質量等方面的信息。但目前可用于測量癌癥患者健康效用的疾病特異性量表的研發(fā)和基于本國人群效用積分體系的建立仍處于起步階段。
兒童癌癥在兒童常見死因中占據(jù)高位[42―43]。兒童癌癥雖然預后通常比成人好但副作用帶來的長期影響也較大,可能會對兒童、家庭甚至社會產(chǎn)生持續(xù)影響。若能對兒童癌癥患者的健康效用進行準確測量,可為臨床治療方式選擇提供參考。目前健康效用測量工具在兒童癌癥中已有一定的驗證和應用。Chen等[44]匯總了兒童癌癥患者、幸存者以及一般人群的健康效用測量方面的研究,結果顯示該領域較多使用HUI2和HUI3,測得的健康效用由高到低分別為一般人群、幸存者和兒童癌癥患者,其中有腦部腫瘤的兒童患者測得健康效用最低??傮w而言,可用于兒童癌癥患者的健康效用測量工具仍較少,一些研究直接使用各量表成人版本進行測量,但大多數(shù)兒童和青少年缺乏充分理解量表中條目內(nèi)容的能力,可能會導致其測量結果存在偏差,應盡量開發(fā)、完善兒童癌癥患者健康效用的測量工具。
考慮到癌癥患者中較多為重癥甚至是瀕臨死亡的患者,可能不再愿意或無法回答問卷;其次對于兒童患者而言,表達能力和理解能力有限,自填版量表對于兒童而言可能存在一定難度。基于以上兩點,癌癥領域的研究者對測量工具代理版本的開發(fā)和完善較為關注。目前已有一些測量工具的代理版本在癌癥患者中應用。Zhou等[45]利用3LY和5LY分別對兒童血液系統(tǒng)惡性腫瘤患兒和照顧者同時進行測量,結果表明二者具有良好的一致性和重測信度;Takura等[46]同樣證明了代理版本在晚期肺癌患者中具有可行性。但代理版本和自填版本在癌癥患者中測得的效用值存在一定差異,大多研究表明利用自填版量表獲得的效用低于代理版本[44,47]。
附加維度是指為提高量表測量的準確程度在原有量表的維度基礎上新增加針對某種疾病人群或某種狀況的維度[48]。這一方法在EQ-5D中已經(jīng)存在相關研究。2005年,Hoeymans等[49]首次在EQ-5D中加入認知維度,結果顯示,加入認知維度后可提高內(nèi)容效度和不同人口學特征人群的區(qū)分度。后續(xù)研究中,3L和5L的附加維度主要集中在視覺、聽覺、睡眠、疲勞、自信、認知、呼吸等方面,其中睡眠和疲勞等與癌癥患者關系密切。附加維度同樣可用于疾病特異性效用量表來填補描述系統(tǒng)中針對特定癌癥部位和新型治療方法的空白。附加維度既能保留原量表已得到驗證的維度,又能提高在特定領域的敏感性,因此可以進一步探討其在癌癥患者健康效用測量的研究中的應用。
健康效用測量作為CUA過程中至關重要的一環(huán),其測量方法受到學者們的廣泛關注。本文重點對癌癥領域健康效用測量方法進行系統(tǒng)介紹并對其在癌癥患者中的應用進行評述。盡管MAUI是當前癌癥患者健康效用測量的主要方法,但普適性健康效用量表對不同癌癥的敏感性和區(qū)分度較低,疾病特異性效用量表目前仍處于起步階段。因此,如何選擇癌癥領域HTA健康效用測量工具成為研究設計中的重要環(huán)節(jié)。我國在癌癥領域的健康效用測量相關研究開展較晚,今后的研究中應盡快研制符合我國人群語言習慣和文化背景的癌癥健康效用量表以及構建其健康效用積分體系,進而推動我國健康效用研究乃至HTA領域的進一步發(fā)展。