王清青,范馨月,查筑紅
(1.貴州醫科大學附屬醫院醫院感染管理科,貴州 貴陽 550004;2.貴州大學數學與統計學院,貴州 貴陽 550025)
近年來,醫院感染(healthcare-associated Infection,HAI)給患者和社會造成的嚴重經濟負擔已成為醫學界急需解決的重大問題。醫院感染不僅會提高患者死亡風險,還會延長患者的住院時間、降低病床周轉率,嚴重影響醫療質量[1-3]。因此,建立預測模型準確預測醫院感染發病率,提前采取相應防控措施,對降低醫院感染發病率具有重要的現實意義。醫院感染發病率常用的預測方法包括自回歸移動平均滑動模型(autoregressive integrated moving average model,ARIMA)[4-6]、灰色預測模型(gray forecast model,GM)[7-9]和神經網絡模型(neural network model,NNM)[10-13]等。ARIMA 模型和GM 模型使用解析模型對數據進行擬合預測,誤差較大。NNM 模型易陷入局部最優解,學習效率和模型精度較低。極端學習機(extreme learning machine,ELM)模型為單隱層前饋神經網絡(single-hidden layer feedforward neural networks,SLFNs),具有原理簡單、訓練速度快的特點[14],但數據的不平衡分布及其冗余信息產生的噪聲以及離群點會對ELM的泛化能力產生影響。基于此,本研究構建了一種基于小波去噪后的ELM 模型對醫院感染率進行預測分析,以期為醫院感染預防與控制提供一定的參考依據。
1.1 資料來源 選取貴州省某三甲醫院2014 年1 月-2019 年12 月收治的住院時間超過48 h的所有住院患者的月度醫院感染發病率資料。本研究經過醫院倫理委員會審核通過,患者及家屬簽署知情同意書。
1.2 醫院感染診斷標準 參照中華人民共和國衛生部發布施行的《醫院感染診斷標準》[15]。
1.3 方法
1.3.1 小波去噪后極端學習機模型 根據噪聲與信號在不同頻帶上的小波分解系數具有不同強度分布的特點,將各頻帶上的噪聲對應的小波系數去除,保留原始信號的小波分解系數,然后對處理后的系數進行小波重構,得到不含噪聲的信號。離散型的小波變換定義為

其中,m 為尺度參數,n 為平移常數,φ*為復共軛函數,φ(x)為母小波。小波去噪后的序列消除了序列的噪聲對預測結果的影響。
不同的樣本數據(Xi,Yi),其中X=[X1,X2,……XN]T∈RN,Y=[Y1,Y2,……YN]T∈Rm網絡中含有L 個隱層節點

其中,αi=(αi1,αi2,……,αiN)N為連接i 個隱層節點與輸入節點的輸入權值向量,bi為第i 個隱層結點的偏置。βi=(βi1,βi2,……,βiN)T為連接第i 個隱層結點和輸出結點的輸出權值向量,f(·)為激活函數。(1)式改寫為矩陣形式為:

其中,H 是隱層節點的輸出,β 為輸出權重,Y為期望輸出。

Y=(Y1,Y2,……,YN)T,β=(β1,β2,……,βN)T,ELM的訓練過程等價于求解線性方程(2),隱含層和輸出層之間的連接權值β 不需要迭代調整,這也是ELM 最大的特點。ELM 輸入層和隱含層的連接權值、隱含層的閾值可以隨機設定,且設定完后不用再調整,ELM 結構圖見圖1。

圖1 ELM 結構圖
1.3.2 參數選擇 ELM 模型中的參數有嵌入維數、隱含層神經元數、輸入權重αi、神經元偏置bi和輸出權值。根據預測誤差確定嵌入維數和隱含層神經元數,這里取嵌入維數為2,隱含層神經元數量3。輸入權重和神經元偏置在[-1,1]內隨機取值,輸出權重β通過求解線性方程(2)的矩陣H的Moore-Penrose廣義逆得到。以2014 年1 月-2019 年6 月醫院感染發病率數據作為訓練樣本構建小波去噪后極端學習機模型、原極端學習機模型和神經網絡模型,分別對2019 年7 月-12 月該醫院的醫院感染發病率進行預測,并對其預測效果進行比較。用較優的預測模型對2020 年1 月-12 月醫院感染發病率進行預測。
左小龍雖然在每擰下一次油門的時候都會把大帥的摩托車和自己的西風做比較,然后唏噓,但是他依然執著的向著……不知道什么地方開去。他只是在想,他熱愛自己的家園,但如果每天能做的只是發射鵝卵石,未免太過英雄氣短。但他轉念一想,每個人都有自己的報仇方式,有些人報仇為了報仇,有些人報仇為了悅己。況且這些不是仇恨,只是恨。
1.4 統計學分析 應用SPSS 18.0 軟件進行統計分析。每年醫院感染發病率之間比較采用χ2檢驗,P<0.05 表示差異有統計學意義。采用Matlab 2017a 軟件建立小波去噪后極端學習機模型,模型精度評價采用平均絕對誤差百分比(MAPE)、平均相對誤差絕對值(MRE)和均方根誤差(RSE)。

相對誤差絕對值的平均值(MRE)為:

均方根誤差(RSE)為:

2.1 醫院感染情況 該院2014-2019 年醫院感染發病率在0.54%~2.69%,各年發病率比較,差異有統計學意義(P<0.05),且存在下降趨勢(P<0.05),見圖2。

圖2 2014-2019 年某院醫院感染發病率變化趨勢
2.2 模型識別 采用小波去噪后ELM 模型、原ELM模型和NN 模型對2014 年1 月-2019 年6 月該三甲醫院醫院感染發病率進行訓練。小波去噪后ELM模型能較好地擬合2014 年1 月-2019 年6 月該三甲醫院醫院感染發病率,平均絕對誤差為0.11%,均方根誤差為0.01,對原始數據的擬合效果優于原ELM 模型和NN 模型,見圖3及表1。

表1 三種預測模型對醫院感染率擬合誤差情況

圖3 三種預測模型對醫院感染發病率的預測擬合效果

圖4 三種預測模型對醫院感染發病率的預測效果

表2 三種預測模型對醫院感染率的預測誤差
2.4 模型預測 選用小波去噪后ELM 模型對2020年1 月-12 月醫院感染發病率進行預測,預測值均在95%CI范圍內,見圖5。

圖5 小波去噪后ELM 模型對醫院感染發病率的預測情況
醫院感染作為特殊的傳染性疾病,其發生、發展與醫療活動息息相關。通過醫院感染發病率的前瞻性預測,不僅可以對當前采取的醫院感染控制措施效果進行評價,同時還對潛在的院感暴發具有一定的預警作用。因此,基于醫院感染監測數據建立準確的醫院感染預測、預報體系,使醫院管理者從整體上把握醫院感染的趨勢,從而及時調整相應的預防控制措施,已成為醫院感染管理工作的重要發展方向[16-18]。
醫院感染發病率受到季節、環境等因素的影響,數據變化情況較為復雜,如果作為時間序列進行處理難以用解析函數對其進行逼近,導致傳統的ARIMA 模型和GM(1,1)模型擬合精度較低。對NN模型而言,由于隱函數為非線性函數,其導數值也僅僅在中心值附近呈近似線性性質,中心值的差異性導致線性關系范圍的大小不同,使得NN 模型難以收斂或僅僅達到局部收斂。ELM 只有網絡的隱含層節點數需要人為設定,在訓練過程中輸入權值及神經元偏置隨機生成,具有學習和收斂速率快,擬合能力強等優點。因此,ELM 算法及其改進算法在醫療診斷[19]、疾病預測[20-22]、通信技術[23]方面都有廣泛的應用。本研究構建的小波去噪后ELM 模型,有效結合了小波函數的非線性數據處理能力和極端學習機的函數逼近能力。本研究從模型的擬合精度和預測精度進行了對比分析,結果顯示,小波去噪后ELM模型的MAPE、MRE 和RSE 分別為0.89%、0.01、0.02,均小于原極端學習機模型和神經網絡模型,具有較好的預測效果。但是,預測的結果仍存在一定誤差,可能與樣本數據較少、資料所限有關。
醫院感染的發生受諸多因素的影響,不同的醫院環境其醫院感染發病率及變化趨勢也不盡相同。因此,醫院感染發病率預測模型預測效果的優劣要結合醫院實際情況而定,需具體研究。其次,預測模型的構建基于平時的監測數據,后續研究中為進一步提高模型預測精度,需要不斷積累監測數據,對小波去噪后ELM 模型參數進行調整,從而修正或重新擬合醫院感染發病率預測模型。另外,可以考慮將醫院感染相關影響因素納入模型,以便提高結果的準確性。