衛生部衛生發展研究中心(100191) 付曉光
多層模型在農村居民醫療服務利用影響因素分析中的應用
衛生部衛生發展研究中心(100191) 付曉光
目的 應用多層模型技術分析新農合監測地區農村居民醫療服務利用的影響因素。方法 運用多層分類模型方法,從個體層次和家庭層次兩個方面分析影響農村居民醫療服務利用的主要因素,關注由于家庭成員聚類引起的樣本非獨立性分析群內差異和群間差異。結果 性別、年齡等個體因素,以及家庭收入、家庭規模、醫療保障等家庭因素是影響農村居民醫療服務利用的主要因素,且家庭因素的解釋程度在25%左右。結論 農村居民醫療服務利用影響因素中個體特征影響程度更高。
新型農村合作醫療醫療服務利用多層模型
根據2008年第四次國家衛生服務調查結果,我國農村居民的兩周就診率和住院率分別達到了15.2%,和6.8%,應就診未就診比例和應住院未住院比例均較2003年第三次國家衛生服務調查時有所下降,但是仍有35%的兩周內新發病例未就診,20%的病人經醫生診斷需住院而未住院〔1〕。影響農村居民醫療服務利用因素除了政策、經濟發展與衛生資源分配等宏觀因素影響之外,還有農村居民個體特征、家庭特征等微觀層面因素,本研究將利用2010年衛生部新型農村合作醫療監測地區的入戶調查數據,分析影響我國中西部地區農村居民就醫的微觀層面因素,以期對宏觀政策的制定和調整提供支持。
本文的研究數據來源于衛生部新型農村合作醫療監測系統16個監測縣2010年的家庭調查數據。該項調查通過問卷訪談完成,抽樣設計采用分層多階抽樣,每縣的各鄉鎮按農民人均純收入排序(兼顧地理條件)分層后選取高、中、低3個鄉(鎮),每個入樣鄉鎮的所轄行政村再按農民人均純收入排序分層,抽取高、中、低3個行政村,每村按照村民花名冊隨機抽取33戶,接受入戶調查,剔除缺失數據后,本文的研究數據有效樣本為17 702個。
根據調查設計,農村居民的醫療服務利用情況由兩個變量反映:即“12個月內是否住院”和“兩周內患病是否就診(住院患者不回答此項)”,本文將其合并生成一個新變量作為因變量,即是否有過就醫行為,因其為二分類變量,故本文采用多層分類模型進行回歸分析。
以往文獻對醫療服務利用影響因素的研究,集中在人口學特征、社會經濟因素、健康狀況、時間價值、醫療保險覆蓋,家庭收入、家庭規模、家庭醫保覆蓋等因素作為自變量進行分析和評價〔2-4〕。本文基于數據情況與多層模型的需要共選取了性別、年齡、民族、婚姻狀況、受教育程度、與戶主關系、是否購買商業(人壽)保險,以及家庭人口數、上年家庭純收入、是否參加新農合、是否為救助家庭等11個自變量。

表1 研究變量及描述性統計
多層模型(multilevel model)技術的基本原理是將因變量的變異分解為同一群體內的個體差異和不同群體間的群間差異,通過分解變異來分析群內和群間因素的影響,通過對標準誤差的調節使分析結果更準確〔5〕。本文的研究數據中涉及了家庭人口數、家庭成員構成、家庭收入等聚類性質的家庭層次變量,和年齡、性別、受教育水平等家庭成員的個體層次變量,本文將運用多層分類模型中的隨機截距模型,消除個體樣本之間的非獨立性,分析群內(個體層次)影響程度和群間(家庭層次)影響程度的差異。
本文使用stata12.0建立數據庫并進行數據分析,先后使用logistic回歸模型、無條件平均模型和隨機截距模型進行比較分析。
無條件平均模型也稱空模型,即不含任何自變量的回歸分析,其方程式為:

yij代表第j個家庭第i個人的就醫行為;γ00代表總平均值或總截距,是固定參數;δ0j是代表家庭層次的隨機變量,指第j個家庭的截距到總截距的距離,是多層模型存在的標志;εij是代表個體層次的隨機變量,指第j個家庭的第i個人到第j個家庭截距的偏離。空模型結果將提供三方面信息:一是群間變異對因變量總體變異的顯著性,即是否有必要使用多層模型;二是群體特征對因變量的影響程度,即通過群間關聯度系數ρ來反映;三是反映自變量對因變量的解釋能力〔6〕。
表2中的無條件平均模型分析結果表明,群間變異系數(0.86)遠大于其標準誤,說明農村居民醫療服務利用與否一定程度上是與其家庭特征有關的,群間關聯度系數0.18意味著因變量的變異中有18%是由家庭特征解釋的。雖然家庭層次的變異較個體層次弱一些,仍有必要建立隨機截距模型,具體分析各自變量的解釋能力。
(1)模型建立
隨機截距模型假定因變量的截距隨群體而異,但各群體的回歸斜率是一樣的,因此不同群體間是缺乏互動的,其基本方程式如下:

其中,G1j是指群體特征即家庭特征,γ01是群體特征的系數;χ1ij是指個體特征,γ10是個體特征的系數,代表農村居民個體特征對其就醫行為的影響,但其作用并不因家庭特征而異〔6〕。
(2)模型適應情況
如前所述,本文選擇了11個自變量來分析農村居民醫療服務利用的影響因素。其中,性別、年齡、民族、婚姻狀況、受教育程度、與戶主關系、是否購買商業(人壽)保險反映的是農村居民個體特征的變量;家庭人口數、上年家庭純收入、是否參加新農合、是否為救助家庭反映的是農村居民家庭特征的變量。利用隨機截距模型,可以分解家庭層次特征和個體層次特征的變異對因變量的影響和解釋程度。表2列出了隨機截距模型的模型適應情況,在加入家庭層次變量后,模型中群間變異縮小,約有11%的變異來自家庭層次的變異,納入的四個家庭層次自變量對因變量的解釋比例約有25%左右,說明仍有一些家庭層次的因素未納入的模型中來解釋因變量的變異。AIC和BIC的值也有減少,說明隨機截距模型的適應情況更好。

表2 空模型及多層模型結果
(2)影響因素分析
根據隨機截距模型分析結果,在控制了其他變量的前提下,對個體和家庭層次變量的分析果有一些是與以往研究、經驗判斷的結果是十分類似的(見表4)。
從性別角度看,男性就醫的概率是女性的53%,這不僅與不同性別的就醫意愿和行為有關,也是與近年來農村地區鼓勵孕產婦住院分娩,女性的住院率高于男性有關;從不同年齡組看,與未成年人口(0~14歲)相比,勞動人口(15~64歲)就醫的概率較低、老年人口的就醫概率更高,這和勞動人口的時間價值較高,看病就醫需要花費時間,相應損失經濟效益有關;少數民族的就醫概率也高于漢族,少數民族地區地廣人稀,醫療資源有限,患病后很難到非醫療機構獲得藥品,因此自我醫療較少,到村衛生室和鄉鎮衛生院的看病比例更高;與未婚的人群相比,在婚和離婚喪偶人群就醫概率更高;家庭中的地位也對就醫有一定的影響,戶主就醫的概率是非戶主的1.63倍,這是和農村家庭結構密切相關的,一般來說戶主都是家中的領導者或是家中經濟來源的主要貢獻者,因此戶主在患病后更容易就醫治療或是更容易被其他家庭成員催促就醫治療;此外,購買了商業保險、獲得醫療救助的人群更容易去就醫。
但是,也有一些社會經濟變量出現了與經驗判斷不同的結果,如受教育程度。經驗的判斷是受教育程度較高的人群更具備預防保健意識,在身體不適時會很敏感并選擇就醫。然而,筆者認為,預防保健意識和疾病經濟負擔固然是影響醫療服務利用的重要因素,但是人們的健康水平才是決定其是否發生就醫行為的主要因素。表3列出了不同受教育水平人群兩周內患病類型的差異,受教育程度越高,兩周內患病的比重越低,兩周患病的樣本中高中及以上的人群僅占6.66%,同時受教育程度較高的人群中急性病例的比重高于慢性病例。可見,受教育程度較高的人群患病率較低,且慢性病患病率較低,因此,其就醫的概率可能要低于受教育程度較低的人群,社會經濟地位雖然影響就醫行為的發生,同時個人身體狀況(患病類型)更是就醫行為產生的重要影響因素。

表3 兩周患病類型與受教育水平
同樣的自變量納入logistic回歸模型,在不考慮群間和群內變異影響的情況下,logistic回歸模型中一些自變量的影響程度和顯著性水平發生了變化。
首先是各自變量系數和標準誤的變化。雖然是相同的自變量納入模型,但其系數和標準誤均有所變化,說明通過隨機截距模型的建立,區分研究對象群間和群內的差異,調節了自變量的系數和標準誤差,這在一定程度上提高了估計的準確性,降低了犯一類錯誤的可能性。

表4 logistic回歸模型與隨機截距模型比較
其次是一些自變量的影響程度出現了變化。如“是否參加新農合”,在logistic回歸模型中的分析結果認為,是否參加新農合對其就醫行為是有統計學差異的,參加新農合的農村居民就醫概率是未參加者的1.62倍;但是在隨機截距模型中,是否參加新農合與否對農村居民個體就醫行為的影響已沒有顯著性,這是因為隨機截距模型能夠糾正因聚類引起的樣本非獨立性,新農合作為以戶為單位參加的醫療保障制度,已基本覆蓋了全體農村居民,有效樣本中個體的參合率也達到了約99%,醫療保障制度的變異對就醫行為的變異已影響甚微。
為了避免家庭成員行為的聚類效應,本文利用多層分類模型對是否有就醫行為進行了多層分析,與無條件平均模型相比,隨機截距模型中家庭層次變異的隨機效果有所降低,且模型的解釋能力更強,AIC與BIC值均有明顯的降低,因此加入分層變量進行多層模型分析是非常有必要的;與不考慮聚類效應所作的一般logistic回歸模型相比,多層分類模型中的各自變量解釋程度發生了變化,標準誤也相應有所調整,這與納入了家庭層次變量有關,樣本非獨立性的糾正使得分析結果更為合理。因此,在分析那些樣本間關聯度很大的數據時,可以考慮引入分層模型,提高置信水平,系統地分析不同層次變量對因變量變異的影響。
此外,本文對農村居民家庭調查數據的分析結果表明,農村居民個體特征對其醫療服務利用的影響較家庭特征更強一些,而這些個體特征(如性別、年齡、民族、受教育程度等影響因素)本質上反映的是個體的健康狀況;在家庭層次特征方面,由于新農合的參合率保持較高水平、未參合人數較少,且農村居民的醫療服務需求在過去幾年中的逐步釋放,因此醫療保障對是否利用醫療服務的影響程度已經非常小。
1.衛生部統計信息中心.2008中國衛生服務調查研究:第四次家庭健康詢問調查分析報告.中國協和醫科大學出版社,第1版,2009年.
2.張耀光,張拓紅,高軍,徐玲.城市不在業者衛生服務利用及影響因素分析.中國衛生統計,2007,24(2):149 -154.
3.宋艷艷,孫振球,曾小敏.非條件logistic回歸對城市居民門診衛生服務利用與影響因素的分析.中國衛生統計,2002,19(3):159-160.
4.左延莉,胡善聯等.新型農村合作醫療試點衛生服務利用的影響因素分析.中國衛生資源,2006,9(5):223 -225.
5.楊菊華.多層模型在社會科學領域的應用.中國人口科學,2006(3):44-51.
6.郭志剛,等(譯).分層線性模型:應用與數據分析方法.社會科學文獻出版社,2007.
(責任編輯:劉壯)