【摘要】針對中國2007~2011年出院病人人均醫藥費用逐年增長的趨勢,通過添加阻尼因子,使經典的時間序列AR(n)模型的最小二乘模型變為AR(n)嶺估計模型,利用AR(n)嶺估計模型,可以較好的改善經典時間序列分析模型中矩陣的病態程度。依據不同阻尼因子取值,預測了2013年全國綜合醫院出院病人人均醫藥費用。
【關鍵詞】統計分析 出院病人人均醫藥費用 AR(n)模型 嶺估計
一、引言
近幾年來,醫院出院病人的人均醫藥費用在逐年遞增。根據《中國衛生統計年鑒2012》[1]一書披露的數據,2011年,全國綜合醫院出院病人人均醫藥費用為7027.7元(人民幣),較2007年的4973.8元,增幅達到了41.29%。根據社會經濟發展規律、醫療條件等因素可以認為,出院病人人均醫藥費用是一種隨時間而變化的統計數據。時間序列AR(n)模型在考慮統計數據在時間序列上的依存性的同時,又考慮了隨機波動的干擾性,是廣泛應用的方法之一[2-5]。故可考慮采用AR(n)模型來預測未來的全國綜合醫院出院病人人均醫藥費用。
直接采用經典AR(n)模型,模型的病態性會影響分析和預測的結果。如何有效避免AR(n)模型的病態性,是需要解決的問題。基于此,本文結合解決矩陣病態問題的經典嶺估計方法,建立起AR(n)的嶺估計模型,并以時間序列AR(3)模型為例,對中國2007~2011年出院病人人均醫藥費用進行了分析,預測了2013年全國綜合醫院出院病人人均醫藥的大概費用。
二、AR(n)的嶺估計模型
時間序列分析的特點在于[6-7]:逐次的統計數據通常是不獨立的,必須考慮到統計資料的時間順序,當逐次統計值相關時,未來數值可以由過去統計資料來預測,可以利用統計數據之間的自相關性建立相應的數學模型來描述客觀現象的動態特征。
對于AR(n)模型,有[1]:
xt=b1xt-1+b2xt-2+…+bnxt-n+at (1)
若共有x1,x2,…xN等個統計數據,則有:
Y=Xb+a (2)
式中:
X=■,b=■,Y=■,
a=■ (3)
則b的最小二乘解為:
b=(XTX)-1XTY (4)
一般地,矩陣XTX中的元素是由數值較接近的數據組成,數值彼此很接近,X的列存在復共線性,式(4)易成為病態方程組,導致b的數值解不穩定。
式(4)中,XTX的求逆運算是導致AR(n)模型產生病態的原因。一般可采用嶺估計方法來消除矩陣的病態,通過在XTX矩陣中增加一個阻尼因子α來改善矩陣的病態程度。
對XTX添加一個阻尼因子α,使其變為XTX+αI,這樣,(4)式變為:
b=(XTX+αI)-1XTY (5)
(5)式即為時間序列AR(n)的嶺估計模型。顯然,當阻尼因子α=0時,式(4)與式(5)等價。
三、全國綜合醫院出院病人人均醫藥費用分析
《中國衛生統計年鑒2012》在表4-5-4中,公布了全國綜合醫院出院病人人均醫藥費用統計數據,醫院合計的部分數據見表1,現采用一般AR(3)模型進行統計數據的時間序列分析。
表1 綜合醫院出院病人人均醫藥費用(摘自《中國衛生統計年鑒2012》表4-5-4)
從2007年至2011年,出院病人人均醫藥費這一項,2008較2007的增幅為9.85%;2009較2008的增幅為8.93%;2010較2009的增幅為9.64%;2011較2010的增幅為7.69%。取2008至2011年的平均年增幅為(9.85%+8.93%+9.64%+7.69%)/4=9.0275%,則根據2008至2011年的平均年增幅9.0275%,計算得2012年醫院合計級別的出院病人人均醫藥費為7662.1元。
現采用經典AR(3)模型,對出院病人人均醫藥費統計數據進行分析。由第二節式(3):
X=■,Y=■,則:
X■X=■,X■X的行列式值為520860476017855,為非奇異矩陣。X■X的條件數為761172.94,根據條件數大小判別矩陣是否病態的一般條件,當矩陣條件數大于1000時為嚴重病態,可知矩陣X■X嚴重病態。根據式(4)求出的b=[-2.8909,2.4954,1.2215],根據式(1)求得x1=6525.7,x2=7027.8,x3=7662.2。
現采用AR(3)嶺估計模型即式(5)對綜合醫院出院病人人均醫藥費用進行分析。
表2 AR(3)嶺估計模型計算結果
由表2知,阻尼因子的增加,極大程度的改善了矩陣X■X的病態程度。其計算結果與沒有改善之前的結果也較接近。不同的是,沒有改善的病態矩陣的求逆運算會不穩定,導致式(4)的求解結果也不穩定。改善后根據式(5)求解b的值變得更穩健。
現根據假定的2012年醫院合計級別的出院病人人均醫藥費為7662.1元,按照本文所介紹方法,依據不同阻尼因子取值,預測2013年醫院合計級別的出院病人人均醫藥費見表3。
表3 2013年醫院合計級別的出院病人人均醫藥費預測值(元)
四、結論
出院病人人均醫藥費用是一種隨時間而變化的統計數據。時間序列分析方法是一種動態數據處理方法,文章通過添加阻尼因子來改善矩陣病態程度,一定程度上改善了AR(n)模型矩陣的病態程度,所得計算結果互相之間也比較接近。根據假定的2012年醫院合計級別的出院病人人均醫藥費,依據不同阻尼因子的取值,預測得出,2013年醫院合計級別的出院病人人均醫藥費大致在8027.5~8328.6元左右。
參考文獻
[1]中華人民共和國衛生部.中國衛生統計年鑒2012[M].中國協和醫科大學出版社,2012:84-107.
[2]鄧丹,王潤華,周燕榮.時間序列分析及其在衛生事業中的應用[J].數理醫藥學雜志.2002(05):56-58.
[3]紀莉.時序資料在醫院統計中的應用[J].統計與咨詢,2013(01):61.
[4]葉孟良,李智濤,歐榮.ARIMA模型在預測重慶市醫院日住院量中的應用[J].重慶醫學,2012(13):1260-1261.
[5]何問陶,趙建群.AR(q)模型的應用研究[J].云南財經大學學報,2008,3:86-94.
[6]高鐵梅.計量經濟分析方法與建模[M].北京:清華大學出版社, 2006.
[7]王振龍等.應用時間序列分析[M].北京:科學出版社,2007.
作者簡介:唐麗珠(1975-),女,漢族,廣西桂林人,中級會計師。主要從事醫院管理會計研究。