武漢市中心醫院醫學資訊科(430014) 耿 娟
在醫院管理中,要有效提高醫院管理水平,就要使計劃具有科學性和實踐性。用統計預測數據制定工作計劃,可避免主觀盲目性,具有較強的可操作性。門診量是醫院醫療工作的重要評價指標,科學準確地預測門診量可為醫院臨床科室設置和人員配置提供可靠依據。本文利用時間序列分析中廣泛應用的ARIMA模型對武漢市某綜合性醫院2004-2012年門診量進行擬合預測,為醫院管理者提供決策依據。
1.資料
選擇武漢市某綜合性醫院2004-2012年門診量數據作為原始數據,其中2004-2011年數據用于建立ARIMA模型,2012年數據用于模型檢驗,測試模型與2012年門診量符合程度。
2.建立模型基本原理與方法
運用SPSS17.0建立門診量資料數據庫,并用相關統計學模塊進行數據處理與分析。ARIMA模型建模過程按4個階段進行[1-2]:(1)序列平穩化:ARIMA模型的應用需要時間序列符合平穩性的要求;(2)模型的識別:主要是根據殘差序列的自相關函數(ACF)圖、偏自相關函數(PACF)圖的特征,提出幾種可能的模型作進一步分析;(3)模型參數估計和模型診斷:參數估計是對識別階段提供的粗模型參數估計并假設檢驗,用以判斷模型是否恰當,并通過模型的殘差等診斷統計量判斷模型的適合性;(4)預測應用:非季節模型為ARIMA(p,d,q),季節模型為ARIMA(p,d,q)s。如果時間序列既有季節性成分,又有非季節性成分,則需混合效應的乘積模型ARIMA(p,d,q)(p,d,q)s。
1.時間序列特征分析
繪制2004-2011年門診量的時間序列圖(見圖1),時間單位定義為年月型,起始時間為2004年1月。由圖1可以看出:(1)門診量基本上呈上升趨勢,且序列存在著明顯的季節規律,在1,2月份呈現低谷,以年為周期的變化明顯;(2)序列的方差前后波動較大,即門診量高峰與低谷的間距變化較大,提示原始序列不是一個平穩的隨機過程。據以上特點,首先對序列進行自然對數變換,然后進行一次一般差分一次季節差分,分別消除趨勢和季節因子的影響。

圖1 武漢市某綜合醫院2004-2011年門急診量各月就診人次數時序圖
2.建立ARIMA模型
根據差分變換的次數,對序列作自相關圖ACF和PACF圖(見圖2,圖3)。圖中顯示序列PACF和ACF圖均拖尾則適用ARIMA模型,初步確定模型可定為ARIMA(p,0,q)(P,D,Q)s。PACF圖在季節性時點2,14和26處的PACF值呈現一個指數衰減的形式,提示一個MA過程。由于模型中還混雜了非季節性的成分,因此ACF圖在季節性時點處的變化趨勢不夠明顯,可以運用季節性MA(1)過程,即ARIMA(0,1,1)12。根據文獻參數超過2階的情況很少可以分別取0,1,2,由低階到高階逐個實驗,然后根據模型的擬合度、殘差情況以及系數之間的相關性進行綜合判斷[3]。經篩選得出最優模型ARIMA(1,0,1)(0,1,1)12,其中AIC=-243.847,SBC=-236.154,非季節性自回歸系數AR1=0.997;非季節移動平均系數MA1=0.643;季節性移動平均系數SMA1=0.819,模型參數有統計學意義(見表1)。對殘差序列作自相關圖(見圖4),結果顯示Box-Ljung統計量均無統計學意義(P>0.05)(見表2),可以認為殘差序列是白噪聲,說明所選模型ARIMA(1,0,1)(0,1,1)12恰當,可以用來描述門診量數據的動態特征。

圖2 原序列經過一次季節差分后的自相關圖

圖3 原序列經過一次季節差分后的偏相關圖

表1 模型的參數估計

圖4 殘差序列的自相關圖
3.預測應用
利用上述所建模型ARIMA(1,0,1)(0,1,1)12對2004-2011年門診量時間序列數據進行擬合,并對2012年1月至12月的門診量進行預測,結果見圖5。從預測值可以看出門診量預測數據與實際數據基本吻合,趨勢基本相同,其預測效果較好,預測值與實際值的平均相對誤差為5.28%(見表3)。本模型2012年1、2月份、12月份預測相對誤差超過10%,其可能原因:(1)由于“節假日效應”所致:2012年1月23日為春節,如沒有重大疾病,人們一般不會去就診;2月正是春節剛過,節后發病率上升,門診量大幅增加。(2)12月是提前期的遠期預測,效果欠佳;且12月正處于醫院年度完成任務的沖刺月,醫院門診采用各種激勵政策導致實際門診量突增。

表2 完整模型的殘差ACF檢驗

圖5 門診量及ARIMA(1,0,1)(0,1,1)12模型預測值序列圖

表3 2012年門診量的ARIMA模型預測值與實際值
ARIMA模型是一種預測精確度較高的模型。它是時間序列建模中最重要和常用的手段,它針對有時間性變動的序列提出建模方法,對每一個季節周期中同時間點的序列值進行分析,提取季節趨勢;并對每個季節周期內部序列值的變化提取具有平穩性的變動成分來進行建模。ARIMA模型一般要求數據有50個以上的時間點和7~8個周期[4],本資料符合以上要求。
收集分析醫院各項業務指標,研究其變化規律并預測其變化趨勢是醫院科學管理的重要內容[5-7]。本文通過構建ARIMA(1,0,1)(0,1,1)12模型預測醫院2012年門診量,結果顯示,門診量預測值的動態趨勢與實際情況基本一致,2012年3-11月驗證數據顯示,平均相對誤差小于10%,表明利用ARIMA模型預測門診量變動水平的可行性。醫院管理者可根據每月的門診量預測值提前安排有關工作,合理配置人力、物力資源,實現醫院效益最優化。
時間序列方法在醫療衛生領域有廣闊的應用前景。它是一種考慮對象本身的歷史數據隨時間發展變化的規律,并用該變量以往的資料建立統計模型做外推的預測方法。即利用時間序列模型不需要知道影響預測變量的相關因素,可將包括未知因素的綜合效應統一蘊含在時間變量中,這是該法用于門診,住院等醫院管理相關指標預測的突出優點。已有很多衛生工作者將該法應用于醫院管理、疾病控制等領域[8-10],在前瞻性預測方面有可靠的應用價值。
參 考 文 獻
1.張文彤.SPSS統計分析教程(高級篇).北京:北京希望電子出版社,2002:250-289.
2.孟蕾,王玉明.ARIMA模型在肺結核發病預測中的應用.中國衛生統計,2010,27(5):507-509.
3.孫振球,徐勇勇.醫學統計學.北京:人民衛生出版社,2002:351-371.
4.李娜,殷菲,李曉松.時間序列分析在結核病發病預測應用中的初步探討.現代預防醫學,2010,37(8):1426-1428.
5.向前,陳平雁.預測醫院門診量的ARIMA模型構建及應用.南方醫科大學學報,2009,29(5):1076-1078.
6.賈翠平,李靜.采用自回歸滑動平均模型預測2011年門診量.中國病案,2011,12(9):52-53.
7.武紅濤.ARMA模型在醫院出院患者預測中的應用.解放軍醫院管理雜志.2009,16(1):21-23.
8.陳莉.探討ARIMA模型在細菌性痢疾發病預測中的應用.中國衛生統計,2011,28(4):417-419.
9.陳明惠,胡云,支洋英,等.應用ARIMA模型預測成都市新都區麻疹的發病趨勢.現代預防醫學,2012,39(2):267-269.
10.葉孟良,李智濤,歐榮.ARIMA模型在預測重慶市醫院日住院量中的應用.重慶醫學,2012,41(3):1260-1261.