王清青,范馨月,查筑紅,黃 冰,程永素,羅光英,曾 妮,姚 堯
(1. 貴州醫科大學附屬醫院醫院感染管理科,貴州 貴陽 550004; 2. 貴州大學數學與統計學院計算機科學系,貴州 貴陽 550025)
醫院感染(healthcare-associated infection,HAI)不僅增加住院患者死亡風險,同時延長患者住院時間和增加患者經濟負擔,已成為醫學界亟待解決的重大問題[1-2]。神經內科患者具有年齡大、發病急、基礎疾病多、病情嚴重等特點,并常伴有不同程度的意識、運動障礙,免疫功能低下,臥床時間長等特點,是醫院感染的高危人群[3-5]。因此,了解神經內科患者醫院感染發生、發展規律,并在此基礎上采取可能的預防和控制措施具有重要的現實意義[6]。醫院感染發病率的預測是將被動預防向主動預防轉化的重要環節。準確預測醫院感染發病率未來變化情況,對于醫院感染的預防與控制有著極為重要的作用[7]。自回歸滑動平均混合模型(autoregressive integrated moving average model, ARIMA)是Box-Jenkins方法中的重要時間序列預測模型,目前用于短期預測效果較為理想,被廣泛應用于醫療衛生、環境、金融等領域的預測[8]。本研究基于貴州省某三級甲等醫院2014—2018年神經內科醫院感染發病率數據,采用乘積季節性模型對該院神經內科醫院感染的發病情況進行預測,以期發現醫院感染的潛在規律,發出早期預警,從而為神經內科患者醫院感染預防關口前移提供科學依據。
1.1 資料來源 收集貴州省某三級甲等醫院2014年1月—2018年5月入住神經內科>48 h患者月度醫院感染發病率資料。
1.2 醫院感染診斷標準 參照中華人民共和國衛生部2001年發布施行的《醫院感染診斷標準(試行)》[9]。
1.3 模型構建方法 由于醫院感染具有季節性感染的特殊性,因此,采用乘積季節性模型擬合時間序列具有較好的預測效果。模型中分別代表非季節性和季節性自回歸項、差分和移動平均項系數,為季節周期。以2014—2017年神經內科月度醫院感染發病率數據作為訓練樣本,2018年1—5月數據作為模型預測驗證樣本。建模主要過程分為四步,(1)時間序列平穩化檢驗和處理:ARIMA模型要求數據符合時間序列平穩性,因此需對已有時間序列數據進行數據平穩化處理。采用差分方法使該序列滿足零均值且方差不隨時間變化,根據差分次數確定差分階數。(2)模型識別:通過繪制平穩后時間序列的自相關函數(autocorrelation function, ACF)和偏自相關函數(partial autocorrelation function, PACF)圖對目標序列進行定階。(3)參數估計與診斷檢驗:從估計的多個模型中,選擇其中最優模型進行預測。模型的篩選依據采用擬合優度統計量比較模型的優劣,采用赤池信息準則(Akaike information criterion,AIC)和貝葉斯信息準則(Bayesian information criterion,BIC)優先選擇值最小參數進行擬合優化模型,對模型的參數進行顯著性檢驗和殘差進行白噪聲檢驗。(4)模型預測:確定出最優模型,對模型進行預測,得到原序列將來感染發病率趨勢。
1.4 統計分析 應用SPSS 18.0軟件對每年及各月醫院感染發病率進行卡方檢驗,應用Matlab2017a軟件構建ARIMA(p,d,q)×(P,D,Q)s模型。
2.1 醫院感染情況 2014—2018年該院神經內科每年醫院感染發病率分別為0.67%、2.01%、1.35%、0.59%和0.34%,差異有統計學意義(χ2=82.26,P<0.001),趨勢性χ2檢驗發現醫院感染發病率存在下降趨勢(χ2=22.43,P<0.001)。見圖1、表1。

圖1 2014—2018年某院神經內科醫院感染發病率變化趨勢
Figure1Change trend in HAI incidence in department of neurology in a hospital from 2014 to 2018
2.2 時間序列平穩化 通過原始時序圖(圖1)發現,該三甲醫院2014—2018年神經內科各月醫院感染發病率呈現出一定季節性和周期性,為非平穩時間序列,需要對其進行平穩化處理。對原數據作一階差分后消除了序列的長期趨勢,發病率時序圖基本趨于平穩。見圖2。
2.3 模型識別與定階 對原序列進行一階差分后的ACF和PACF圖,見圖3。差分后通過ADF檢驗,確定ARIMA(p,d,q)×(P,D,Q)s中的d和D均為1。此時殘差序列自相關函數和偏相關函數在可信區間內,模型的計算值和實際值擬合度較高。對其進行殘差相關性檢驗,檢驗值基本落在95%的置信區間內。

表1 2014—2018年神經內科各月醫院感染發病率[%(n/N)]
注:醫院感染發病率=新發生醫院感染的患者例數/同期住院患者例數×100%;表中n表示神經內科新發生醫院感染的患者例數;N表示同期神經內科住院患者例數

圖2 2014—2018年某院神經內科醫院感染發病率數據一階差分后時序圖
Figure2Temporal graph after first order difference of data of HAI incidence in neurology department of a hospital from 2014 to 2018

圖3 一階差分后ACF和PACF圖
AIC數值越小,模型精度越好。通過實驗數據分析,自回歸部分階數和移動平均階數可以選取p=2,q=2。綜上得出的最優預測模型為ARIMA(2,1,2)×(1,1,1)4。通過計算AIC=125.68;BIC=133.16。ARIMA(2,1,2)×(1,1,1)4預測感染發病率的殘差、QQ圖檢驗、ACF和PACF見圖4。模型估計結果的殘差序列滿足隨機性檢驗。
2.4 模型診斷 對2018年1—5月神經內科各月醫院感染發病率進行預測,結果顯示,模型預測值的動態趨勢與實際情況基本一致,實際發病率均是在預測值的95%置信區間內,說明了該模型擬合效果較好,可用以對未來進行較好的跟蹤和預測。見表2,圖5。

圖4 預測模型殘差、QQ圖檢驗、ACF和PACF圖
Figure4Prediction model residuals,QQ plot,ACF and PACF
表22018年1—5月神經內科醫院感染發生率實際值與預測值比較
Table2Comparison of actual and predicted incidence of HAI in department of neurology from January to May 2018
注:差率=(|實際值-預測值|)/實際值
2.5 模型預測 用此模型對2018年6—12月神經內科醫院感染發病率進行預測,預測結果見圖5,結果顯示預測值均位于95%的置信區間內。

圖5 ARIMA模型對神經內科醫院感染發病率預測圖
醫院感染給患者和家庭,以及醫院均帶來不同程度的疾病負擔。預防和控制醫院感染,降低醫院感染發病率,是醫院感染管理的核心工作。目前,我國對醫院感染控制的監測模式多采用回顧性調查,前瞻性研究尚不多[10-11]。利用統計預測分析技術對醫院感染進行預測性數據挖掘,建立醫院感染預警模式是醫院感染管理工作今后發展的重要方向。
ARIMA 模型是時間序列分析中重要而基本的模型之一,是針對有季節性變動的時間序列提出的建模方法,綜合考慮了序列的趨勢變化、周期變化及隨機干擾,并借助模型參數進行了量化表達,具有實用性強、預測精準度高等特點[12-13],已被廣泛應用于各個學科,尤其在衛生領域前瞻性預測方面具有廣闊的應用前景[14-15]。本研究采用時間序列ARIMA(2,1,2)×(1,1,1)4模型對某三級甲等醫院神經內科2014—2018年各月醫院感染發病率數據進行分析,結果顯示,該模型的預測精度較高,能很好地擬合原始序列的趨勢性和周期性,可以用于神經內科醫院感染發病趨勢的分析和預測。使用該預測模型對2018年1—5月數據進行驗證,結果顯示,實際值與預測值重合較好,波動形勢基本一致,實際值均在預測值95%可信區間內,預測擬合效果較可靠。在此基礎上,對2018年6—12月神經內科醫院感染發病率進行預測,結果顯示2018年7月份和12月份是兩個高發月份,因此在此期間應該加強落實醫院感染控制措施,有效減少醫院感染的發生。
此外,本研究所構建的ARIMA模型與李紅等[16]構建的模型不同,說明了不同時間段、不同地域構建醫院感染發病率預測模型的必要性。另外,單次分析建立的ARIMA模型,不能作為永久不變的預測工具,只能用于短期預測。在實際工作中,應收集足夠多的時間序列數據,用新的實際值對已建立的模型進行驗證,并不斷加入新的實際值,以修正或重新擬合醫院感染發病率預測模型,更能反映實際情況。
綜上所述,醫院感染的發生受社會因素、環境因素的影響,既有趨勢變動,又有季節變動。選用相對最優的ARIMA模型對下一年的不同時間段內的醫院感染人數進行初步預測,有利于我們提前做好防范工作,從而使醫院感染的防線前移,從根本上減少醫院感染的發生,降低總體醫院感染發病率。