三峽大學(xué)人民醫(yī)院信息科(443000) 覃 桓
基于多重回歸模型的住院人數(shù)預(yù)測(cè)
三峽大學(xué)人民醫(yī)院信息科(443000) 覃 桓
目的尋長(zhǎng)合適的預(yù)測(cè)方法預(yù)測(cè)住院人數(shù)。方法以上一年度的住院人數(shù)及本年平均開(kāi)放床位增加數(shù)為自變量建立多重回歸模型預(yù)測(cè)本年住院人數(shù)。結(jié)果建立的多重回歸模型具有極高的擬合程度。結(jié)論用此種模型預(yù)測(cè)住院人數(shù)在置信度一定的前提下置信區(qū)間窄,具有科學(xué)性和實(shí)用性。
多重回歸 住院人數(shù) 預(yù)測(cè)
準(zhǔn)確合理的預(yù)測(cè)醫(yī)院住院人數(shù)對(duì)醫(yī)院管理者指導(dǎo)工作、制定工作計(jì)劃、做出科學(xué)決策提供有效依據(jù);在實(shí)際工作中一方面有利于醫(yī)院管理者合理利用人力、財(cái)力、物力,減少工作中的盲目性,另一方面能更有效合理的分配各項(xiàng)資源,為病人提供更優(yōu)質(zhì)、高效的服務(wù)。
1.資料來(lái)源
資料來(lái)源為本院2000-2011年的統(tǒng)計(jì)資料,資料包含住院人數(shù)、平均開(kāi)放床位增加數(shù)(表1)。平均開(kāi)放床位增加數(shù)為本年平均開(kāi)放床位數(shù)減上年平均開(kāi)放床位數(shù)。資料通過(guò)本院HIS系統(tǒng)收集匯總,有統(tǒng)計(jì)臺(tái)帳、統(tǒng)計(jì)報(bào)表存檔,另有原始數(shù)據(jù)備份,數(shù)據(jù)真實(shí)可靠。

表1 三峽大學(xué)人民醫(yī)院2000-2011年住院人數(shù)和平均開(kāi)放床位增加數(shù)表
2.預(yù)測(cè)方法
預(yù)測(cè)方法為以上一年度的住院人數(shù)及本年度的平均開(kāi)放床位增加數(shù)為自變量,以本年度的住院人數(shù)為應(yīng)變量建立多重線性回歸方程。上一年度住院人數(shù)在完成上一年度住院人數(shù)統(tǒng)計(jì)工作后取得,本年度平均開(kāi)放床位增加數(shù)在醫(yī)院沒(méi)有增減病床計(jì)劃的情況下為零,如本年度有增減病床數(shù)計(jì)劃,則根據(jù)病床增減的時(shí)間及床位數(shù)可以準(zhǔn)確測(cè)算。以上兩個(gè)自變量均可在年初取得,預(yù)測(cè)方法切實(shí)可行。
(1)預(yù)測(cè)模型
建立多重線性回歸方程對(duì)原始資料擬合。

(2)預(yù)測(cè)方程
利用OLS估計(jì)式求得,建立回歸方程。

(3)統(tǒng)計(jì)結(jié)果分析
方差分析結(jié)果F=111.327,P<0.01,說(shuō)明該回歸方程具有統(tǒng)計(jì)學(xué)意義。
計(jì)算t統(tǒng)計(jì)量得到關(guān)于b1的t統(tǒng)計(jì)量t1=13.063,P1<0.05,b2的t統(tǒng)計(jì)量t2=2.480,P2<0.05,說(shuō)明方程引入的兩個(gè)自變量均有統(tǒng)計(jì)學(xué)意義。
復(fù)相關(guān)系數(shù)R=0.983,決定系數(shù)R2=0.965,計(jì)算結(jié)果表明此回歸方程中應(yīng)變量與各自變量之間的相關(guān)程度極高,各自變量對(duì)應(yīng)變量的解釋程度高達(dá)96.5%。
通過(guò)分析預(yù)測(cè)模型的誤差來(lái)檢驗(yàn)預(yù)測(cè)模型的可靠度是一個(gè)必要環(huán)節(jié),通過(guò)分析誤差,觀測(cè)預(yù)測(cè)結(jié)果是否需要作合適的修正,進(jìn)而將誤差控制在合理的范圍之內(nèi)以提高預(yù)測(cè)結(jié)果的準(zhǔn)確性[1-3]。首先分別將各自變量的實(shí)際數(shù)值代入建立的多重回歸模型,計(jì)算出預(yù)測(cè)的住院人數(shù)即預(yù)測(cè)值,然后計(jì)算預(yù)測(cè)值與實(shí)際值之差的絕對(duì)值即絕對(duì)誤差及絕對(duì)誤差占實(shí)際值的百分比即百分比誤差(表2)。
從表2中可以看出預(yù)測(cè)值與實(shí)際值的百分比誤差最大為12.26,最小為0.11,誤差較小,預(yù)測(cè)的效果較好。以5年為一組,2007-2011年的百分比誤差合計(jì)為18.21,2002-2006年的百分比誤差合計(jì)為20.38;以3年為一組,2009-2011年的百分比誤差合計(jì)為5.56,2006-2008年的百分比誤差合計(jì)為13.57,2003-2005年的百分比誤差合計(jì)為16.46;從以上數(shù)據(jù)可以看出相對(duì)靠后的年份預(yù)測(cè)誤差小,相對(duì)靠前的年份預(yù)測(cè)誤差大,其中相對(duì)靠后的年份預(yù)測(cè)誤差小的現(xiàn)象正是實(shí)際運(yùn)用中想要達(dá)到的目標(biāo),能提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。

表2 預(yù)測(cè)誤差分析表
2012年平均開(kāi)放床位增加數(shù)為131張。
1.點(diǎn)估計(jì)

2.區(qū)間估計(jì)

給定α=0.05,查表得自由度為n-k=8的臨界值為:

通過(guò)以上外推計(jì)算得出2012年住院人數(shù)的點(diǎn)估計(jì)值為34039人,在95%的置信度下預(yù)計(jì)2012年住院人數(shù)的變動(dòng)范圍在30292人至37786人之間。
1.預(yù)測(cè)模型考慮到對(duì)住院人數(shù)影響最大的兩個(gè)因素,第一個(gè)自變量是上一年度的住院人數(shù),利用了自回歸的特點(diǎn),第二個(gè)自變量是可以準(zhǔn)確測(cè)算的當(dāng)年平均開(kāi)放床位增加數(shù),合理選取對(duì)應(yīng)變量影響最大的自變量是實(shí)現(xiàn)預(yù)測(cè)精度高、取得預(yù)測(cè)成功的關(guān)鍵。本院2012年實(shí)際住院人數(shù)為33218人,與預(yù)測(cè)的點(diǎn)估計(jì)值34039人僅相差821人,預(yù)測(cè)值與實(shí)際值的百分比誤差僅為2.47,當(dāng)然這也與2012年無(wú)重大疫情,未出現(xiàn)反常天氣現(xiàn)象等有密切關(guān)系。
2.近3年的住院人數(shù)同比增長(zhǎng)幅度明顯高于以前年度的同比增長(zhǎng)幅度,主要是因?yàn)榻陙?lái)我國(guó)國(guó)民經(jīng)濟(jì)高速增長(zhǎng)及國(guó)家相關(guān)醫(yī)療體制改革政策的出臺(tái),這也是回歸方程b0為負(fù)的原因,因此在對(duì)住院人數(shù)進(jìn)行統(tǒng)計(jì)預(yù)測(cè)的時(shí)候還必須考慮國(guó)家相關(guān)醫(yī)療體制改革政策的變動(dòng)及國(guó)民經(jīng)濟(jì)高速增長(zhǎng)的前提條件是否發(fā)生了明顯的轉(zhuǎn)變,如上述因素發(fā)生明顯的變化,應(yīng)對(duì)預(yù)測(cè)的結(jié)果做適當(dāng)修正。
3.本預(yù)測(cè)模型不適宜做過(guò)長(zhǎng)時(shí)間的預(yù)測(cè),原始數(shù)據(jù)的跨度也不宜過(guò)長(zhǎng)如數(shù)十年的歷史資料,因住院人數(shù)受影響的因素極多,有些在數(shù)年內(nèi)不能明顯體現(xiàn)的特征,在數(shù)十年的變化中則產(chǎn)生較為顯著的影響,相對(duì)短期的資料能減少其它長(zhǎng)期因素的影響,使得預(yù)測(cè)的效果更理想[4-5]。
4.雖然統(tǒng)計(jì)預(yù)測(cè)是建立在嚴(yán)格的數(shù)學(xué)理論之上,但是現(xiàn)實(shí)世界中有很多現(xiàn)象與數(shù)學(xué)理論并非完全相符合,因此在做統(tǒng)計(jì)預(yù)測(cè)的時(shí)候不僅要利用已知的數(shù)據(jù)和方法進(jìn)行點(diǎn)值估計(jì),還要給出預(yù)測(cè)期實(shí)際值的可能范圍(上、下限值)和預(yù)測(cè)期實(shí)際值在這一范圍內(nèi)的把握程度(置信水平),即區(qū)間預(yù)測(cè)[6]。本文利用多重回歸模型預(yù)測(cè)了2012年住院人數(shù)點(diǎn)估計(jì)值和一定把握性下的區(qū)間估計(jì)值,預(yù)測(cè)結(jié)果體現(xiàn)了把握性和準(zhǔn)確性的統(tǒng)一。
5.在實(shí)際的工作中對(duì)同一個(gè)指標(biāo)可能存在多種預(yù)測(cè)方法且均存在合理的解釋,在預(yù)測(cè)時(shí)應(yīng)選擇解釋程度高的預(yù)測(cè)方法進(jìn)行預(yù)測(cè)。筆者結(jié)合醫(yī)院住院人數(shù)變動(dòng)的特征建立的多重回歸模型,達(dá)到了很好的預(yù)測(cè)效果。國(guó)內(nèi)外有學(xué)者報(bào)道采用以前年度的住院人數(shù)、門診量、手術(shù)量等數(shù)據(jù)來(lái)預(yù)測(cè)住院人數(shù),但相關(guān)系數(shù)不及本模型,同時(shí)預(yù)測(cè)的準(zhǔn)確率也會(huì)相應(yīng)較低,估計(jì)的區(qū)間也會(huì)相對(duì)較寬,本預(yù)測(cè)方法的精度較高,具有一定的實(shí)用價(jià)值。
1.Rogerson PA.Weight estimation and significance testing for three focused statistics.Statistical methods in medical research,2012,21(5):433-444.
2.Gerds TA,Scheike TH,Andersen PK.Absolute risk regression for competing risks:interpretation,link functions,and prediction.Statistics in medicine,2012,31(29):3921-3930.
3.Whitaker HJ,Hocine MN,F(xiàn)arrington CP.The methodology of self-controlled case series studies.Statisticalmethods in medical research,2009,18(1):7-26.
4.Sun Y,Teow KL,Heng BH,etal.Real-time prediction ofwaiting time in the emergency department,using quantile regression.Annals of emergency medicine,2012,60(3):299-308.
5.Crabtree BF,Ray SC,Schmidt PM,et al.The individual over time:time series applications in health care research.Journal of clinical epidem iology,1990,43(3):241-260.
6.Julious SA,Owen RJ.A comparison of methods for sample size estimation for non-inferiority studies w ith binary outcomes.Statisticalmethods in medical research,2011,20(6):595-612.
(責(zé)任編輯:郭海強(qiáng))