范馨月 王清青



摘要:目的 ?采用SARIMA、BP神經網絡、RBF神經網絡及小波神經網絡模型對貴州省某專科醫院的精神類疾病患者數進行擬合及預測,并比較各類預測模型的預測效果。方法 ?將貴州省某專科醫院2016年1月1日~12月31日HIS系統中精神類疾病的數據作為訓練集,建立SARIMA(1,1,1)×(1,1,1)3模型、BP神經網絡、RBF神經網絡、小波神經網絡模型。分別對2017年1月1日~16日精神類疾病患者數進行預測,將2017年1月1日~16日數據作為驗證集。分別用3類誤差分析指標衡量模型的擬合效果,并比較模型預測的準確性。結果 ?RBF神經網絡模型對該醫院精神類疾病患者數的擬合效果優于BP神經網絡和小波神經網絡模型,平均絕對誤差為(1.84×10-7)%,平均相對誤差為4.92×10-6,均方根誤差為4.74×10-6。3類預測誤差平均值分別為23.70%、3.633、93.72。結論 ?4種模型均能用于醫院精神類疾病患者數的預測,但就預測效果而言,小波神經網絡模型的各項誤差指標均低于其他3種預測模型,小波神經網絡模型可作為預防和醫院管理的理論依據。
關鍵詞:SARIMA;BP神經網絡;RBF神經網絡;小波神經網絡模型;預測;精神類疾病
中圖分類號:R749 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:B ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2019.12.003
文章編號:1006-1959(2019)12-0006-04
Abstract:Objective ?To fit and predict the number of mental illness patients in a specialized hospital in Guizhou Province by SARIMA, BP neural network, RBF neural network and wavelet neural network model, and compare the prediction effects of these types of prediction models. Methods ?The data of mental illness in the HIS system from January 1 to December 31, 2016 in a specialized hospital in Guizhou Province was used as a training set to establish the SARIMA (1,1,1)×(1,1,1)3 model. BP neural network, RBF neural network, wavelet neural network model. The number of patients with mental illness was predicted from January 1st to 16th, 2017, and the data from January 1st to 16th, 2017 was used as the verification set. The three types of error analysis indicators were used to measure the fitting effect of the model, and the accuracy of the model prediction was compared. Results ?The RBF neural network model was better than BP neural network and wavelet neural network model in fitting the number of patients with psychiatric diseases. The average absolute error was (1.84×10-7)%, and the average relative error was 4.92×10-6. The square root error is 4.74×10-6. The average values of the three types of prediction errors are 23.70%, 3.633, and 93.72, respectively. Conclusion ?The four models can be used to predict the number of patients with mental illness in hospitals. However, in terms of prediction results, the error indicators of wavelet neural network model are lower than the other three prediction models. The wavelet neural network model can be used as prevention and The theoretical basis of hospital management.
Key words:SARIMA; BP neural network; RBF neural network; Wavelet neural network model;Prediction; Mental illness
隨著現代社會的飛速發展,生活節奏日益加快,現代人的精神壓力也越來越大,逐漸出現各種各樣的精神心理問題。精神衛生問題成為全球性的重大公共衛生問題,也是較為嚴重的社會問題[1]。目前全球約有4.5億人受到精神疾病的困擾,而且社會中每4個人當中就有1人有某種程度的精神問題。世界衛生組織預測,到2020年中國精神疾病的負擔將占疾病總負擔的1/4以上[2]。國內調查顯示,精神疾病的患病率在不同地區之間存在較大差異。此外,還有研究表明,癌癥和精神疾病有著密切的相關性,癌癥患者在診斷、治療、恢復、死亡等階段均可出現心理危機,其中焦慮和抑郁性障礙比例高達70%左右[3]。建立合適的預測模型,準確預測區域精神疾病的發生量,盡早采取防控措施,可有效降低精神疾病的發病率。本文基于貴州省某精神病專科醫院2016年1月~2017年1月精神病患者數據構建SARIMA模型、BP神經網絡、RBF神經網絡和小波神經網絡模型,對該院精神病患者數據進行預測,并比較4個模型的預測效果,提高監控效率。為積極開展社區防治,規范精神疾病患者管理提供科學依據。
1對象與方法
1.1研究對象 ?數據來源于貴州省某精神病專科醫院HIS系統,選擇2016年1月~2017年1月門診患者的監測數據。門診患者共166168人,其中精神類疾病患者103910人。
1.2研究內容 ?對貴州省某專科HIS系統中2016年1月~12月門診患者監測數據進行分析,在SQL Server 2012中進行數據整理與清洗。建立基于精神類疾病患者數的SARIMA模型、BP神經網絡、RBF神經網絡和小波神經網絡模型,預測2017年1月1日~16日精神類疾病患者數,通過評價指標比較預測模型的預測效果。并進一步預測2017年1月17日~31日精神類疾病患者人數。
1.3方法
1.3.1 乘積SARIMA(p,d,q)×(P,D,Q)s模型 ?傳統的ARIMA模型在醫學統計中已經得到了廣泛的應用[4,5]。乘積季節性差分自回歸滑動平均模型[SARIMA(p,d,q)×(P,D,Q)s]模型ARIMA模型之一,這里(p,d,q),(P,D,Q)s分別代表非季節性和季節性自回歸項、差分和移動平均項系數,s為季節性指數。由于精神病患者就醫具有季節性和隨機性的特殊性,用SARIMA(p,d,q)×(P,D,Q)s模型擬合時間序列可達到較好的預測效果。
1.3.2 BP神經網絡模型 ?BP神經網絡是一種多層前饋神經網絡,從模擬生物神經網絡出發,包含輸入層、輸出層、隱含層和輸出層。BP神經網絡具有并行分布處理、高度容錯能力、分布存儲及學習能力,能充分逼近復雜的非線性關系等特點[6]。加上BP神經網絡對數據無假設性條件,適合處理非線性問題。BP神經網絡利用信號傳遞前向,誤差傳遞反向的方法,通過不斷調整網絡權值和閾值,使得神經網絡預測達到較好的預測效果。
1.3.3 RBF神經網絡模型 ?徑向基函數神經網絡是一類非常重要的神經網絡,具有結構簡單、收斂速度快、逼近能力強、網絡結構易于調整的優點,其在神經網絡的應用廣泛程度僅次于BP神經網絡[7]。對于BP網絡,已經證明了三層網絡結構能夠逼近任意連續函數,而RBF神經網絡能以任意精度逼近任意非線連續函數。到目前為止,已經提出了許多種RBF網絡的訓練算法,RBF神經網絡的優良特性使其成為替代BP網絡的另一種神經網絡,越來越廣泛地應用于各個領域。
1.3.4 小波神經網絡模型 ?小波神經網絡是非平穩信號分析和處理的強有力工具。小波神經網絡具有自學習、自組織、容錯性儲存等一般神經網絡所具有的優點外,還克服了Fourier變換不能作局部分析的缺點,其強大的非線性映射能力使它在預測領域具有很大的優勢。小波神經網絡的結構和表達式與BP網絡基本一致,不同之處主要是BP網絡隱含層神經元的激勵函數取Sigmoid函數,而小波神經網絡采用滿足可允許條件的小波函數為激勵函數,小波函數一般取Morlet函數或者Mexican Hat小波函數,使得在調整權值和小波參數時,采用算法也不同。此外,還有的學者經過大量實驗證實經驗模態分解具有類似小波變換中的二進濾波器的特性[8]。
1.4數據分析 ?本研究在SQL server 2012中進行數據處理,使用Matlab 2017a進行統計分析,以2016年1月~2016年12月HIS系統中的精神類疾病患者數據作為訓練樣本建立SARIMA、BP神經網絡、RBF神經網絡和小波神經網絡擬合模型,預測2017年1日~16日醫院精神類疾病患者數,模型精度評價采用平均絕對誤差百分比(MAPE)、平均相對誤差絕對值(MRE)和均方根誤差(RSE)。
2結果
2.1醫院精神類疾病患者數分布特點 ?精神類疾病患者包括診斷為精神分裂、雙向情感障礙、自閉癥、抑郁癥、強迫癥等。2016年1月1日~2017年1月16日該專科醫院精神類疾病患者共計103910人,占該專科醫院患病人數62.50%,每天患精神類疾病患者數量及占該醫院總疾病比例資料見表1,按繪制時序圖見圖1,春季是精神類疾病的高發季節,較下半年而言,患者數量較多,幾乎是秋冬季節的兩倍。該時間序列是一個非平穩序列,并且有季節性趨勢。
2.2模型識別 ?由于原序列呈現出周期性季節波動的非平穩序列特點,因此需要建立混合效應SARIMA(p,d,q)×(P,D,Q)s。一階差分后的醫院精神類疾病患者的自相關系數(ACF)和偏自相關系數(PACF)圖見圖3。差分后通過ADF檢驗,確定ARIMA(p,d,q)×(P,D,Q)s中的 和D分別為1和1。此時殘差序列自相關函數和偏相關函數在可信區間內,AIC數值越小。通過實驗數據分析,自回歸部分階數和移動平均階數可以選取p=1,q=1,P=1,Q=1。綜上得出的最優預測模型為ARIMA(1,1,1)×(1,1,1)3。基于和SARIMA同樣的歷史數據輸入,采用BP神經網絡和RBF神經網絡模型對2016年1月1日~年12月31日該專科醫院精神類疾病患者數進行擬合,取最大神經元個數為3000個,擴展速度為3,誤差為0.00001。圖3和圖4中,三種神經網絡均能擬合該院精神類疾病患者數。其中,RBF神經網絡訓練效果最好,具體擬合誤差指標見表2。
由圖3和表2可以看出,RBF神經網絡模型和其他兩個神經網絡模型相比,能較好地擬合該專科醫院患精神類疾病發病數,平均絕對誤差為(1.84×10-7)%,平均相對誤差為4.92×10-6,均方根誤差為4.74×10-6,對原始數據的擬合效果優于BP神經網絡和小波神經網絡模型。
2.3模型診斷 ?通過SARIMA(1,1,1)×(1,1,1)3、BP神經網絡、RBF神經網絡和小波神經網絡模型,預測2017年1月1日至16日精神類疾病患者數,并和實際值計算評價指標進行對照檢驗(見表3)。由表3可見,訓練的四種預測模型均可作為精神類疾病患者數的預測,就預測效果而言,小波神經網絡模型的各項誤差指標均明顯低于SARIMA(1,1,1)×(1,1,1)3模型,BP神經網絡、RBF神經網絡和小波神經網絡模型,可作為預防和精神類疾病發作或爆發的理論依據。
3討論
隨著醫院信息化和現代醫學的發展,醫院HIS數據越來越豐富和完善,特殊疾病的患病率預測在醫院管理工作中起到舉足輕重的作用,可將被動管理轉換為主動預防。大多數精神類疾病的病因和發病機理不清楚,體征和實驗室檢查無特異性,未識別率高[9]。目前,精神類疾病導致的殘疾已成為世界性主要問題,通過運用數學建模對其進行挖掘,建立醫院特殊疾病預測預報體系,準確預測醫院精神類疾病患者數的未來變化情況,對于醫院感染的預防與控制將起到決定性的作用。
在之前的研究中,有文獻建立ARIMA模型和BP神經網絡模型進行疾病預測,本研究中以RBF神經網絡和小波神經網絡模型是對精神類疾病患者數預測建模的探索。在本研究中,采用SARIMA模型和神經網絡模型基于貴州省某專科醫院2016年1月~12月醫院精神類疾病患者數據進行訓練,然后對2017年1月1日~16日患者數作預測。SARIMA和神經網絡訓練模型均能用于具有該非平穩且具有季節性時間序列的預測,SARIMA模型對季節性有一定的要求,其參數如季節參數,自回歸階數的選取需多次實驗優化選取;三層的BP網絡結構能逼近任意連續函數,可用于非平穩非線性序列的預測;在建立RBF神經網絡模型時應注意樣本數據擬合和預測模型進行外推時的估計誤差,即殘差的平方和要盡可能小,RBF神經網絡能以任意精度逼近任意非線連續函數。但實際應用中,由于序列的變化有很多隨機性及非線性性,過多地強調對樣本集的擬合精度可能導致將不是變化趨勢的隨機因素也作為趨勢變量,進而導致外推精度變差而發生過擬合。MAPE、MRE、RSE三種指標顯示,小波神經網絡盡管擬合效果不如RBF神經網絡,但就預測效果而言,三項指標分別為10.59%、1.084、89.07,均小于BP神經網絡模型、RBF神經網絡與SARIMA模型,有較好的預測效果。但是,預測的結果仍存在一定誤差,可能與樣本數據較少,資料所限有關。醫院精神類疾病患者數影響因素眾多,比如具有隨機時變性、以及患病不主動就醫等情況,要對其做出準確的預測,必須有完備的資料。因此,在后續研究中,應在不斷積累資料的同時擴大訓練樣本,對幾種模型的參數做出相應的優化,從而不斷提高模型的預測精度,以期達到更好的預測效果。并在實驗中將患者的家庭情況,生活習性等因素考慮進來,建立患者的電子病歷,提前預測患者發病時間,做好防護措施。
參考文獻:
[1]李向青,杜敏霞,李榮.2005-2012年中國精神疾病死亡率的流行病學分析[J].現代預防醫學,2015,42(1):4-7.
[2]Desjarlais R,Eisenberg L,Good B,et al.World Mental Health[M].New York:Oxford University Press,1995.
[3]賈韻博,張陽,韓芳.癌癥相關基因與精神疾病的關聯[J].現代腫瘤學,2017,25(21):3527-3530.
[4]毛圓圓,周麗紅,劉麗,等.ARIMA模型在醫院流產數時間趨勢分析中的應用[J].中國衛生統計,2018,35(1):52-54.
[5]高雅,王伶,吳偉,等.遼寧省手足口病疫情季節性ARIMA模型預測效果評價[J].中國公共衛生,2017,33(10):1482-1484.
[6]周志華.機器學習[M].北京:清華大學出版社,2016.
[7]張怡君,左穎婷,劉近春,等.GA-BP與BP神經網絡在醫學研究中的應用與比較[J].中國衛生統計,2018,35(2):239-245.
[8]劉振球,嚴瓊,左佳鷺,等.EMD-BP神經網絡在傳染病發病趨勢和預測研究中的應用[J].中國衛生統計,2018,35(1):152-155.
[9]杜召云.精神科護理學[M].北京:人民衛生出版社,2009:41-49.
收稿日期:2019-3-29;修回日期:2019-4-8
編輯/成森