孟媛, 葉鳳, 王菁, 殷曉旭
離散選擇實驗(discrete choice experiment,DCE)是在經濟學、市場營銷學和心理學基礎上發展起來的一種測量偏好的方法,已被廣泛應用于衛生領域。近年來,農村地區衛生人力資源匱乏問題備受重視,DCE越來越多地被應用到衛生人員對農村地區工作特征偏好的研究中。2012年,世界銀行、世界衛生組織和美國國際開發署聯合發布了《如何在農村和偏遠地區開展吸引和留住衛生人員的離散選擇實驗:帶有案例分析的用戶指南》[1],該指南對DCE的應用步驟進行了系統闡述,旨在為全球各國尤其是發展中國家提供參考。然而,我國在此方面相關研究數量極少[2-3],這可能是因為該指南在我國尚未得到良好普及。本文在上述指南的基礎上,結合近年國內外相關文獻中的創新性發展,對DCE用于測量農村地區衛生人員工作偏好的應用步驟進行整理,旨在為后續國內開展相關研究提供借鑒和參考。
DCE的理論基礎是經濟學中的需求理論和效用最大化理論。需求理論認為,人們對事物的需求是基于對事物內部各個屬性特定組合的需求。效用是事物對人們需求、欲望等滿足程度的一種度量。效用最大化理論認為,人們會選擇給他們帶來效用最大的屬性組合。基于隨機效用理論,假設受訪者n從j個備選方案中進行選擇,總效用可表示為Unj。根據效用最大化理論,只有滿足對于所有的j,Uni>Unj,受訪者才會選擇i。在模型中,總效應包括固定效用和隨機效用兩部分,固定效用Vni是由m個可觀測屬性(x1,x2,…,xm)所構成的函數,隨機效用εni是不可觀測屬性和個人偏好差異的函數。基于此,總效用可表示為:
Uni=Vni+εni=β0+β1x1 ni+β2x2 ni+…+βmxmni+εni
(1)
由于效用是無法直接測量的,式(1)中的系數無法直接估計得出,基于概率模型,當受訪者n在選項集中進行選擇時,其選擇方案i而不是方案j的概率可以表示為:
Pni=Pr(Uni>Unj)=Pr(εni-εnj>Vnj-Vni)
(2)
DCE于20世紀90年代初開始應用于衛生領域,并在研究中取得了突破性進展。1998年,Chomitz等[4]將DCE應用到吸引醫生到農村或偏遠地區工作激勵偏好研究中。其后,各個國家和地區也陸續開展了相關研究。尤其自21世紀初以來,各國對農村和偏遠地區衛生人力不足的情況都更為關注,相關研究也越來越多。至今,國內外已有近30篇文獻使用DCE對農村和偏遠地區衛生人員的工作偏好進行了探索。相關研究量化了衛生人員對農村和偏遠地區各工作特征的偏好程度,為各國制定激勵策略提供了強有力的理論支撐。
目前,基于DCE開展的農村地區衛生人員工作偏好研究包括三類DCE設計。第一類,選項集中的選擇方案分別代表農村和城市地區的衛生工作;第二類,DCE選項集中的選擇方案分別代表不同特征的農村地區衛生工作;第三類,地區是選項集中的一個屬性,城市和農村僅作為地區屬性的不同水平出現。
2.1.1 明確屬性和水平屬性和水平的確定是開展DCE的第一步,也是至關重要的一步。屬性和水平是構成選擇方案的基本要素,屬性反映了不同的工作特征,水平則反映了屬性的各個程度。明確屬性和水平的常用方法包括文獻回顧和定性研究。文獻回顧的內容主要包括探討農村地區衛生人員工作意愿、離職意愿影響因素的文獻,利用DCE獲取農村地區衛生人員工作偏好的文獻,以及提出吸引和留住農村地區衛生人員激勵措施的文獻。為獲得更全面的信息,還有必要對相關政策文件進行回顧。定性研究通常在文獻回顧基礎上進行,主要包括個人深入訪談、焦點小組訪談、半結構化訪談等方法,研究中通常采用兩種及以上定性研究方法。抽取定性研究受訪者時,一般采用目的抽樣的方法,受訪者主要包括醫學生、衛生人員和衛生政策制定者等。
納入屬性包括經濟屬性和非經濟屬性兩部分。經濟屬性主要包括工資、住房和績效津貼等,非經濟屬性主要包括醫療設施水平、管理層支持情況、服務期限和培訓、晉升機會等。屬性個數不宜過多或過少,過少可能無法捕捉受訪者的偏好,過多則會增加其應答負荷而無法得到精確的偏好結果。一項關于DCE的綜述顯示,理想的屬性個數應控制在4~9個[5]。現有相關研究大多設置了6~8個屬性。各屬性對應的水平個數也應適中,水平過多會干擾受訪者權衡,而重要屬性水平設置過少,則會導致受訪者過度關注該屬性而忽略其他屬性。例如工資這一屬性,如果僅設置兩個水平,受訪者很容易忽略掉其他屬性,直接選擇工資較高的方案。Bridges等[6]在ISPOR報告中指出屬性水平個數應限制在4個以內。現有研究水平個數多為2~4個。此外,研究中對屬性和水平的描述應盡可能完整且通俗易懂。具體研究中,屬性和水平的確定通常可以概括為三個步驟:第一步,通過文獻回顧確定多個可能的屬性,隨后進行定性研究,讓受訪者針對農村地區吸引和留住衛生人員的激勵策略充分發表其觀點,逐字記錄或錄音后轉錄為文字,然后使用Dedoose等定性分析軟件識別并編碼其中提及的屬性,最后綜合上述信息得到初步屬性清單[7]。第二步,要求定性研究的受訪者對已有屬性的重要性進行排名[8-11],或在其中選取4~6個他們認為最重要的屬性[12],綜合分析以減少屬性個數,留下重要性較強的屬性。第三步,通過預調查,驗證屬性和水平的可接受性、可理解性,以及屬性與研究目的的匹配程度,然后,根據預調查收集到的反饋信息對屬性和水平進行調整,形成最終的屬性集。水平的確定一般和屬性同步進行,少數研究也會在屬性明確后再為其匹配水平。此外,需要注意的是,當選項集中的選擇方案分別代表農村和城市地區衛生工作時,不同組別中屬性所包含的水平可以不同。例如Berman等[7]的研究中,住房屬性在農村地區衛生工作中包括3個水平,而城市地區衛生工作僅有“不提供住房或住房津貼”1個水平,這也進一步提高了選項集中預設的工作與現實中工作的符合程度。
2.1.2 生成選項集使用屬性和水平生成選項集是開展DCE的第二步。選項集是DCE問卷的基本單元,每個選項集包括兩個及以上接近現實情境的選擇方案,每個方案由各屬性的不同水平構成。由于針對農村地區衛生人員工作偏好的研究普遍納入多個屬性和水平,使用完全析因設計會產生大量選擇方案,相關研究應采用部分析因設計。使用部分析因設計生成選項集時,需要滿足的三個基本原則,包括正交性、水平平衡和最小重疊[6]。其中,正交性是指不同屬性的水平之間沒有相關性;水平平衡是指屬性的不同水平在問卷中出現次數相同;最小重疊是指屬性在選項集中不出現相同的水平值。析因設計中,當前最為常用的是統計效率設計,即犧牲一定的正交性以實現D-效率的最大化[11,13-14]。常用的選項集設計軟件包括SAS、Sawtooth和Ngene等。
2.1.3 問卷設計選項集生成后,還需進一步完善問卷的其他部分,最終完成問卷的總體設計。問卷的開頭需要對問卷進行介紹,說明研究主題、研究背景、選擇當前受訪者的原因等。DCE選項集的個數過少會導致證據不足,過多會增加受訪者的填寫負擔。若經上述設計仍存在較多選項集,可以將其隨機分配到不同版本問卷中。Bridges等[6]推薦的問卷版本數為2~4個、個人回答選項集個數為8~16個,針對農村地區衛生人員工作偏好的研究大多符合這一標準。正式選項集前,還可以設置熱身選項集,讓受訪者熟悉填寫方式。為檢驗調查數據的質量,還可以在問卷中設置邏輯糾錯選項集,一般設置為其中一個工作在各個屬性上都優于其他工作,如受訪者仍選擇劣勢工作,則為無效問卷。熱身選項集和檢驗數據數量的選項集均不納入最終數據分析。
此外,每個選項集結尾處,受訪者都會被問道:“你會選擇上述工作中的哪一個”。在此基礎上,為了避免高估受訪者的偏好,研究人員還會增加“都不感興趣”選項。針對在職衛生人員的調查中,為了提高調查研究的現實性,還會增加“留在當前工作”選項。“都不感興趣”和“留在當前工作”選項被稱為“退出”選項,即選擇這些選項無法為評估當前研究中參與者對各屬性的偏好提供依據。為了確保收集到足夠多的數據,針對選擇“退出”選項的受訪者,有時還會被強制要求在備選方案中選擇一個更偏好的方案[15]。對于選擇“留在當前工作”選項的受訪者,一般還需要提供當前工作的情況并簡要陳述這樣選擇的原因。除選項集外,調查問卷還需包括社會人口學特征,以便后續研究人員檢驗受訪者的樣本代表性,并可用于亞組分析,探究各亞組衛生人員對各個屬性的偏好是否存在差異。
完成DCE的整體設計后,應進行調查對象的選取和樣本量的確定,以便后續進行數據收集。農村地區衛生人員工作偏好研究的目的是在農村地區吸引和留住更多的衛生人員,因此,醫學生和衛生人員是相關研究的重點調查對象。為保證實施的便利性,現有研究多采用整群抽樣的方法抽取調查對象。不同的研究由于屬性和水平、問卷設計、亞組分析等的差異,所需的最小樣本量也存在差異。通常使用Orme等[16-17]提出的經驗法則計算主效應模型所需樣本量,其計算公式為N>500c/(t×a),其中c表示任意屬性的最大水平數,t為每一問卷選項集的數量,a指每一選項集包含的選擇方案個數。部分研究使用Louviere等[18]提出的公式進行樣本量計算,需要代入研究的選擇概率、置信度、精確度、樣本流失率和選項集個數。此外,為了滿足亞組分析的要求并提高研究結果的可信度,多數研究還會在最小樣本量的基礎上適當提高樣本數量。
DCE的數據收集通常采用紙質問卷或計算機輔助調查方法,也有少部分研究采取調查人員單獨采訪受訪者的方法。由于DCE問卷與常規問卷的閱讀和填寫方式存在較大差異,資料收集時,調查人員需對問卷填寫方式進行詳細講解,以免被調查者亂填、錯填。數據錄入一般采取雙錄入的方法。需要注意的是,Sawtooth等軟件集實驗設計、問卷生成、數據收集和統計分析于一體,使用這些軟件收集數據無需單獨進行數據錄入。此外,為了進一步提高數據的完整性和準確性,還應對收集到的原始數據進行清洗。針對缺失值和異常值,及時查找原始數據核對糾錯,并根據問卷完成度和邏輯糾錯選項集的回答情況對無效問卷進行剔除。
完成數據的收集和整理后,研究進入數據分析階段。SAS是相關研究中最為常用的數據分析軟件,分析模型則以條件logit模型和混合logit模型為主。與條件logit模型相比,混合logit模型不僅能反映偏好程度的大小,還能反映出偏好的異質性,更能滿足數據分析時對衛生人員偏好異質性的要求,其應用更為廣泛。關于農村地區衛生人員工作偏好的DCE數據分析主要包括三個方面。第一,通過模型分析獲取各屬性水平的參數值,從而估計衛生人員對農村地區不同工作特征的偏好情況,并進一步通過亞組分析,探索不同特征衛生人員對各屬性水平的偏好差異。第二,通過模擬政策分析,對單一或組合屬性水平作用下衛生人員的農村就業接受率進行預測。第三,為了使模型的參數估計更具有經濟學意義,還可以計算患者對單一或組合屬性水平的支付意愿。
DCE在農村地區衛生人員工作偏好領域的應用具有重要價值。DCE探索了衛生人員是否選擇到農村地區工作的影響因素,量化了衛生人員對不同工作特征的偏好程度,為政策制定者提出相關激勵策略提供了重要參考依據。本文通過對該領域相關研究的綜述,明確了DCE用于測量農村地區衛生人員工作偏好的應用步驟,并對各步驟中重點注意事項進行了說明,為國內學者開展相關研究提供了參考。
總體看來,當前DCE在農村地區衛生人員工作偏好領域的研究仍有改進空間。研究階段,在通過定性研究明確屬性和水平時,后續研究應重點考慮正在以及曾經在農村地區工作衛生人員的看法,因其有農村地區工作經驗,所思所想更能為激勵策略的制定提供參考。報告階段中,部分現有研究并未對設計軟件、個人回答選項集數量、是否設置不同版本問卷、樣本量確定方法、分析模型和分析軟件等進行報告,這大大降低了研究過程的透明度,削弱了研究的科學性和可信度,不利于他人借鑒和質量評估。后續研究應注重報告的規范性。此外,在我國,當前僅山東省[2]和貴州省[3]開展了相關研究。為有效改善我國農村地區衛生人員匱乏的現狀,更廣泛的DCE研究有待開展。