殷 悅,池卓源,趙明燁,唐文熙
中國藥科大學(xué)國際醫(yī)藥商學(xué)院,江蘇南京,211198
偏好測量在衛(wèi)生領(lǐng)域已愈發(fā)受重視,其可以量化供需雙方對醫(yī)療資源各屬性的重視程度,為決策者提供證據(jù)支持,使評價體系更為完善。優(yōu)劣尺度法(best-worst scaling, BWS)和離散選擇實(shí)驗(yàn)(discrete choice experiment,DCE)均為基于陳述性偏好(stated preference)的測量方法,BWS要求受訪者在選擇集中分別選出認(rèn)為最好(或影響最大)和最差(或影響最小)的一項(xiàng),DCE則為選擇更偏好的屬性水平集合,兩者均可對結(jié)果進(jìn)行數(shù)據(jù)分析得到群體的偏好。BWS在衛(wèi)生領(lǐng)域的應(yīng)用尚不成熟,學(xué)者用其測量受訪者對不同生存質(zhì)量狀態(tài)的偏好[1],Norman用其測量澳大利亞人群對肺癌篩查的偏好[2],在國內(nèi)目前僅有黃嬌嬌在對上海市居民就醫(yī)選擇行為影響因素分析時采用了BWS[3]。此外,少有學(xué)者將BWS運(yùn)用到藥品領(lǐng)域,并同時測量供需雙方的偏好,國內(nèi)也尚無學(xué)者基于實(shí)證調(diào)研來探究BWS和DCE的區(qū)別。 本研究同時從供需雙方展開,將BWS和DCE應(yīng)用到治療眩暈的中成藥臨床綜合評價各維度偏好測量中,通過問卷調(diào)研,對中成藥安全性、有效性、經(jīng)濟(jì)性、創(chuàng)新性、可及性、適宜性6個屬性的不同水平進(jìn)行偏好測量和WTP(willingness to pay)測算,并與DCE方法學(xué)做對比,同時對BWS的應(yīng)用前景進(jìn)行探究。
于2021年4-5月通過分層隨機(jī)抽樣,分別選取120名醫(yī)生和患者作為調(diào)研對象,有關(guān)數(shù)據(jù)來源于2020年《中國衛(wèi)生健康統(tǒng)計(jì)年鑒》,根據(jù)內(nèi)蒙古和河北的腦血管發(fā)病率對醫(yī)生和患者的部分人口統(tǒng)計(jì)學(xué)特征加以限制[4-5]。部分特征組合由于數(shù)量過少且實(shí)證調(diào)研中難度過高而設(shè)定為不限。醫(yī)生的選取中,東、中、西部醫(yī)院占比分別為42.5%、27.5%、30.0%,一、二、三級醫(yī)院占比分別為75.0%、15.0%、10.0%。患者的選取中,地域分布與醫(yī)生相同,男性占比60.0%;15-44歲占比15%,45-59歲占比22.5%;收入限定3000元以下共48人,3000-7500元39人,7500元以上15人,其余不限;教育程度限定初中及以下共27人,高中及以上12人,其余不限。最終共發(fā)放醫(yī)生版本問卷120份,患者版本120份,有效回收率100%。
本次調(diào)研同時采用DCE和組合型BWS(profile case,BWS-2),以治療眩暈的中成藥臨床綜合評價為例展開偏好調(diào)查,本研究主要介紹基于BWS-2的問卷調(diào)研。
1.2.1 DCE與BWS簡介。1963年Davis提出了DCE[6],1987年Louviere等開發(fā)了BWS[7],兩者均基于隨機(jī)效用理論,即效用值是由可觀測和不可觀測2部分組成,每個屬性水平所對應(yīng)的效用值決定了他們的選擇[8]。
根據(jù)選項(xiàng)集設(shè)計(jì)的不同,BWS可分為3種:對象型(object case,BWS-1)、組合型和多重組合型(multi-profile case,BWS-3)。BWS-1只涵蓋要測量的屬性,而不對其水平進(jìn)行設(shè)定,主要關(guān)注公共政策目標(biāo)、品牌等對象[9];BWS-2的選項(xiàng)集為商品或服務(wù)的屬性水平組合,通常采用正交主效應(yīng)設(shè)計(jì)(orthogonal main effects plan,OMEP)來制作問卷,未來可能會被大量用于醫(yī)療領(lǐng)域[9];BWS-3與DCE最相似,其問題設(shè)計(jì)是在DCE基礎(chǔ)上附加至少一個屬性水平組合集,受訪者從中選擇最重要和最不重要的集合,現(xiàn)常見于健康生命治療調(diào)查的研究[9]。
1.2.2 問卷設(shè)計(jì)。根據(jù)《藥品臨床綜合評價管理指南(2021年版試行)》,選取測量屬性,結(jié)合文獻(xiàn)回顧、小組討論和現(xiàn)實(shí)依據(jù),進(jìn)行屬性的細(xì)化描述和水平劃分。安全性根據(jù)不良反應(yīng)發(fā)生率分為5%(輕微)、10%(一般)和15%(嚴(yán)重)三水平;有效性根據(jù)眩暈改善情況分為80%以上(顯著改善)、50%-80%(改善)和50%以下(未改善);經(jīng)濟(jì)性依據(jù)經(jīng)過治療后眩暈影響日常生活,現(xiàn)新治療方案可改善到無眩暈每月所需額外花費(fèi)劃分為10-100元、101-200元和201-300元;適宜性劃分為適宜(用藥方便)、較適宜(用藥有一定困難但可以克服)、不適宜(用藥不方便);創(chuàng)新性劃分為有無創(chuàng)新(創(chuàng)新藥和傳統(tǒng)藥)兩水平;可獲得性根據(jù)配備率和獲取藥物是否便利劃分為三水平;可負(fù)擔(dān)性依據(jù)月治療費(fèi)用分為50-150元、151-250元和251-350元。
設(shè)計(jì)選項(xiàng)集時,人為添加block屬性,賦值三水平,對應(yīng)ABC三個版本,以減少受訪者的回答負(fù)擔(dān)[10]。正交組合后,得到3版問卷,每版有9道BWS組合題(BWS組合示例見表1)和1道邏輯糾錯題。邏輯題有明顯的最好和最差導(dǎo)向,倘若受訪者選擇錯誤,則將被視為廢卷。

表1 問卷示例
運(yùn)用Stata 16.0, 采用成對模型(paired model)對數(shù)據(jù)進(jìn)行條件logit回歸分析,即假設(shè)受訪者答題時在所有 “最好-最差”組合中選擇其認(rèn)為兩者差距最大的一個[11]。編碼時,將各選擇集分解成K(K-1)個最好最差組合(K為選項(xiàng)集中項(xiàng)目個數(shù)),示例如表2所示,代表該受訪者在第一題將屬性一選為最好,屬性二選為最差。

表2 編碼示例
使用條件logit回歸需指定一個水平作為參照項(xiàng)來避免共線性,將回歸系數(shù)(參考項(xiàng)為0)進(jìn)行排序即可得出受訪者的偏好,但條件logit回歸假設(shè)受訪者偏好同質(zhì)且隨機(jī)項(xiàng)相同且獨(dú)立分布,可能會導(dǎo)致一定的誤差[12]。
就人為控制的人口學(xué)因素,各個版本分布大致相同,與最初要求一致。醫(yī)生男性占比56%,60歲以下占比91%,有83%的人從業(yè)10年以上。所處醫(yī)院級別分布與最初假設(shè)相同,即一級醫(yī)院占比73%,二級醫(yī)院占比15%。患者版本的問卷由于調(diào)研時設(shè)置了諸多不限,導(dǎo)致特征分布與假設(shè)有些許差距。具體而言,男性占比59%,60歲以上占比60%,收入3000元以下為42%,3000-7500元為44%。
初步分析后,將影響最小的屬性(或最差的水平)定為參考變量。見表3、表4。

表3 醫(yī)生版本條件logit回歸結(jié)果

表4 患者版本條件logit回歸結(jié)果
由于問題設(shè)計(jì)的緣故,借鑒DCE的數(shù)據(jù)分析方法,對系數(shù)取絕對值進(jìn)行分析[13]。醫(yī)生以經(jīng)濟(jì)性為參考,偏好安全性>可獲得性>有效性>適宜性>可負(fù)擔(dān)性>創(chuàng)新性(均P<0.05)。患者以創(chuàng)新性為參考,偏好安全性>有效性>可獲得性>適宜性>可負(fù)擔(dān)性>經(jīng)濟(jì)性(經(jīng)濟(jì)性P=0.139,其余P<0.05)。關(guān)于各水平,除患者的“創(chuàng)新藥”水平影響不顯著外(P=0.230),其余均有顯著影響(P<0.05)。
將可負(fù)擔(dān)性看做成本屬性,對所有水平再次進(jìn)行條件logit回歸。將可負(fù)擔(dān)性各水平的平均數(shù)作為自變量,系數(shù)作為因變量,進(jìn)行線性回歸得到關(guān)于成本的系數(shù)對醫(yī)生為-0.0063,對患者為-0.0097。根據(jù)Norman的研究,將各水平的系數(shù)除以成本系數(shù)的負(fù)數(shù),即為其對應(yīng)的WTP[2],說明醫(yī)患對從安全性設(shè)定的最差水平改善到最高水平分別愿意付出464.8元和343.3元,以此類推。見表5、表6。

表5 醫(yī)生版本各水平條件logit回歸結(jié)果(可負(fù)擔(dān)性)

表6 患者版本各水平條件logit回歸結(jié)果(可負(fù)擔(dān)性)
綜合比較可得,醫(yī)生的WTP普遍高于患者。在其余水平不變的條件下,醫(yī)患均對改善藥品有效率、安全性和可獲得性WTP較高,對提升創(chuàng)新性WTP最低。
3.1.1 雙方較重視安全性和有效性,較不重視創(chuàng)新性和經(jīng)濟(jì)性。對于治療眩暈的中成藥,醫(yī)患較看重有效性和安全性,對創(chuàng)新性和經(jīng)濟(jì)性較不重視,可能因?yàn)閯?chuàng)新與否并不能和藥物的有效率和不良反應(yīng)發(fā)生率直接掛鉤。關(guān)于經(jīng)濟(jì)性,可能由于水平設(shè)置區(qū)分度不高,或目前關(guān)于藥品經(jīng)濟(jì)性的知識普及不夠,理解難度較大,從而一定程度上造成了對經(jīng)濟(jì)性的偏好較低。關(guān)于安全性和有效性,就水平而言,有效性的系數(shù)普遍高于安全性,但比較屬性時卻表明安全性更重要,可能因?yàn)檫@2個屬性的參考水平影響大不相同。回歸過程中水平的系數(shù)是基于最差水平得出的,而屬性的系數(shù)是基于創(chuàng)新性(經(jīng)濟(jì)性)得出的,綜合考慮了其余屬性的各水平。可能雙方均認(rèn)為治療眩暈的中成藥“不良反應(yīng)發(fā)生率15%(嚴(yán)重不良反應(yīng))”的影響大于“癥狀改善50%以下(治療無明顯改善)”,從而整體而言醫(yī)患更看中安全性。
3.1.2 醫(yī)生的支付意愿普遍高于患者。對比醫(yī)患的WTP可得,從設(shè)定的最差水平改善到最優(yōu)水平,醫(yī)生愿意付出的價格均高于患者,這是成本系數(shù)絕對值相對更低造成的。可能因?yàn)闃颖局嗅t(yī)生收入普遍高于患者(患者有41.67%收入3000元以下;醫(yī)生有19.17%收入5000元以下);也可能因?yàn)榛颊呷粘=佑|的藥品相較醫(yī)生更為局限,接受的藥價區(qū)間較窄;另外醫(yī)藥市場信息不對稱,患者對藥品的了解過少,從而更重視其可以獲得的藥價信息,這三者共同導(dǎo)致了就治療眩暈的中成藥而言患者比醫(yī)生更看重藥品的可負(fù)擔(dān)性。
調(diào)研的受訪者同時完成BWS和DCE版本問卷,結(jié)果表明,兩者回答難度因人而異,但所得偏好信息基本一致。關(guān)于數(shù)據(jù)分析,DCE所得系數(shù)僅能在同一屬性的不同水平間進(jìn)行比較,而BWS可以通過固定一個參考水平,基于其得到所有水平的系數(shù),進(jìn)行相互比較[14]。就屬性而言,DCE采用各屬性最高水平的系數(shù)代表整體進(jìn)行相對權(quán)重判斷,而BWS關(guān)于屬性的系數(shù)是基于參考屬性得出的,是整體間的相互比較,比DCE更全面,且結(jié)果可能不同。
然而,若沒有采用如R等軟件進(jìn)行問卷設(shè)計(jì),將有極大的編碼工作量,且對于選擇成對模型還是邊際模型進(jìn)行數(shù)據(jù)處理,仍是一個問題。關(guān)于BWS和DCE孰優(yōu)孰劣,目前的研究還沒有定論[15-16]。
目前,國際上BWS已被用于衛(wèi)生領(lǐng)域,包括對全科醫(yī)生服務(wù)偏好的調(diào)查、癌癥篩查方案的偏好調(diào)查、效用積分體系的開發(fā)等[2,17-18]。盡管我國BWS的應(yīng)用尚不成熟,但它在醫(yī)療領(lǐng)域的應(yīng)用將逐漸增多。諸如測量評價體系中各指標(biāo)的權(quán)重,幫助完善體系建設(shè);測量患者對各醫(yī)療服務(wù)的偏好,優(yōu)化資源配置;進(jìn)一步開發(fā)基于中國人群的EQ-5D等量表的效用積分體系,間接幫助藥物經(jīng)濟(jì)學(xué)評價中對人群生存質(zhì)量的評估等。
本研究還存在一定的缺陷。數(shù)據(jù)分析時,忽略了版本差異和個人特征對結(jié)果造成的影響。此外,最終人口特征分布和最初假設(shè)最多有20%的差異,一定程度上沒有代表整個患者群體。計(jì)算WTP時,用各區(qū)間的平均數(shù)代表整個區(qū)間進(jìn)行線性回歸,可能與受訪者答題時的心理假設(shè)有所差異。