馬春柳 劉海霞 李小升 雷海科 王 紅 李 琳 馬 喆 周 宏△
住院量是評價一個醫院醫療工作的重要指標,直接或間接地反映出一個醫院的規模、醫療質量及醫療水平〔1〕。因此,了解住院量的變化情況,對于合理安排資源,提高醫療工作效率意義重大。要了解住院量的情況,就要對其進行預測。目前預測的模型及方法主要有線性回歸模型、神經網絡模型、灰色預測模型、馬爾科夫鏈模型以及時間序列模型等〔2〕。針對住院量數據的特殊性,本文選用季節自回歸滑動平均模型(seasonal auto regressive integrated moving average model,SARIMA模型),分析2000-2011年住院量的歷史數據,探討其發生發展的規律并預測未來半年醫院住院量的情況,為醫院規劃自身發展提供科學的依據。
所有資料來源于2000-2011年某三甲腫瘤專科醫院統計月報表。
利用統計學軟件SPSS18.0進行統計分析。根據醫院住院量的數據呈周期變化的特點,利用SARIMA(p,d,q)(P,D,Q)模型對我院 2000 ~2011 年住院量數據進行擬合。其中p,d,q分別表示自回歸階數、差分階數和移動平均階數。乘積季節時間序列模型的p、q判斷較為困難,根據以往研究文獻參數中報道超過2階的情況很少,可以分別取0,1,2逐個試驗,然后根據標準化貝葉斯信息準則(normalized bayesian information criterion,BIC)、平均絕對誤差百分比(mean absolute percentage error,MAPE)判定模型的擬合情況、以及通過Ljung-Box檢驗殘差情況來綜合判斷〔3〕。先通過對數據進行非季節性差分和季節性差分后,得到一個新的平穩化的時間序列,然后采用Box-Jenkins模型識別方法進行模型識別,即根據樣本自相關、偏相關函數的截尾、拖尾性初步判斷序列所適合的模型類別。通過標準化貝葉斯信息標準以及平均絕對誤差百分比判定模型擬合情況,BIC與MAPE值越小,模型擬合的越好。通過Ljung-Box檢驗來判斷模型殘差是否為白噪聲〔4〕。最后用所篩選的模型預測醫院2012年7~12月的住院量。
圖1可見醫院各年住院量在不斷增加,而且呈現一定的季節分布趨勢。根據其特點,對其進行一次一般差分和一次季節差分后(見圖2),所有樣本點基本上都是圍繞0這一水平線上下波動,符合了時間序列的平穩化要求。

圖1 2001年1月到2012年6月醫院住院量的時間序列圖

圖2 對數據差分后的醫院住院量的時間序列圖
原始數據的序列圖發現,數據具有季節性。經篩選得最優模型為 SARIMA(1,1,1)(2,1,0)12,其中BIC值為13.59,MAPE的值為7.44(見表1),模型決定系數R2為0.94,一階非季節移動平均參數MA1=0.43,一階季節自回歸參數季節 AR1=-0.34,二階季節自回歸參數季節 AR2=-0.60,參數的估計值均有統計學意義,Box-Ljung檢驗無統計學意義(Q18=22.64,P=0.1238),可以認為殘差序列是白噪聲,說明所選模型恰當。

表1 不同時間序列模型的BIC值與MAPE值
利用所篩選的 SARIMA(1,1,1)(2,1,0)12模型預測我院2012年1~6月的住院量(見表2),將預測值與實際值比較,相對誤差最小值能達到4.94%,誤差較大的為4月份,為10.94%。總體上看,模型預測值的相對誤差很小,進一步說明了此模型具有較好的預測性。同時利用 SARIMA(1,1,1)(2,1,0)12模型預測2000-2012年的住院量,并將實際值與預測值一起繪圖(見圖3),發現2000-2011年的實際值與預測值的曲線基本吻合。

表2 2012年1到6月住院量的SARIMA模型的預測值與實際值

圖3 預測值與實際值的擬合圖
利用 SARIMA(1,1,1)(2,1,0)12模型預測醫院2012年7~12月的住院量(見表3),發現醫院的住院量有不斷上升的趨勢。

表3 2012年7月到12月醫院住院量的預測值
時間序列分析是一種重要的現代統計分析方法,廣泛應用于自然領域、社會領域、科學研究和人類思維。ARIMA模型自20世紀70年代提出,已經不斷得到完善,日益發展成熟,已在經濟、衛生、工業自動化、水文、地質、氣象、環境保護等多種領域得到廣泛應用〔5〕。與傳統的時間序列模型相比,ARIMA模型更具有廣泛的適用性。傳統模型都是假設各變量之間是一種線性關系,而實際情況,常受季節效應、隨機波動效應等影響,所以擬合出來的效果往往不佳〔6〕。而ARIMA模型能考慮這些效應,從而得到的預測結果與實際較為吻合。劉會恩比較了12種不同的預測方法,研究結果認為ARIMA模型在短期預測中擁有較高的精確度〔7〕。
ARIMA模型也具有一定的局限性,主要表現在:計算方法比較復雜;如果原始序列數據較少,擬合效果會較差;只能適用于短期內的預測,如果用于中長期預測,預測效果就不會理想〔8〕。因此,在應用前也應該考慮其適用條件,比如考慮序列的平穩性及白噪聲。如果序列不是一個平穩序列或是一個白噪聲序列及時間序列太短,則不適合應用ARAMA模型進行分析。
醫院的住院量有不斷上升的趨勢,呈現出季節波動的特征。醫院應根據變化波動的規律特點,合理調整現有床位分布結構,除腫瘤內科、乳腺科、婦瘤科等科室保持現有床位外,其他科室以“大病房”形式建立綜合病房,統一安排床位,并按照季節不同,進行相應的調整,改變病房床位歸屬永久不變的現狀。通過對住院量的預測,在一定程度上可以幫助醫院對成本進行有效的控制,充分利用現有的配置,不斷優化醫療資源的使用結構。
1.明星辰,方孝梅,王玉責,等.某三級醫院2007年住院人次預測分析.中國衛生統計,2008,25(1):68-69.
2.Martinez E Z,Silva E A,Fabbro A L.A SARIMA forecasting model to predict the number of cases of dengue in Campinas,State of S~ao Paulo,Brazil.Rev Soc Bras Med Trop,2011,44(4):436-440.
3.劉曉宏,金丕煥,陳啟明.ARIMA模型中時間序列平穩性的統計檢驗方法及應用.中國衛生統計,1998,15(3):12-14.
4.Rosychuk RJ,Klassen TP,Voaklander DC,et al.Seasonality patterns in croup presentations to emergency departments in Alberta,Canada:a time series analysis.Pediatr Emerg Care,2011,27(4):256-260.
5.朱惠敏,齊麗萍,孫莉.對我院2004年住院人次及周轉次數的預測.中國衛生統計,2005,22(2):126-127.
6.姚炯.影響住院人次的因素分析.中國衛生統計,2004,21(4):228-229.
7.劉會恩.用統計方法對我院住院人次和門診診療人次進行預測.中國醫院統計,2007,14(2):107-108.
8.薛冬梅.ARIMA模型及其在時間序列分析中的應用.吉林化工學院學報,2010,27(3):80-83.