






摘" 要:2019年12月突發(fā)一起重大公共事件,新型冠狀病毒以驚人速度傳播開來。此傳染病已成為全球性公共衛(wèi)生問題,世界各國不僅要了解本地情況,還應(yīng)對其他國家的擴(kuò)散情況進(jìn)行掌握。該文選取2022年7月1日至2022年9月30日的韓國累計確診數(shù)據(jù),建立了ARIMA(0,2,2)模型,并對2022年10月1日至2022年10月5日韓國累計確診人數(shù)進(jìn)行預(yù)測。結(jié)果表明,利用該模型預(yù)測的結(jié)果與實際結(jié)果基本吻合。該文結(jié)果對此次重大公共事件的預(yù)測和防控提供理論支持。
關(guān)鍵詞:重大公共事件;時間序列分析;ARIMA模型;發(fā)展現(xiàn)狀;預(yù)測
中圖分類號:R563.1" " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號:2095-2945(2023)11-0006-04
Abstract: A major public incident broke out in December 2019, and Covid-19 virus spread at an alarming rate. This infectious disease has become a global public health problem. Countries around the world should not only understand the local situation, but also grasp the spread of other countries. In this paper, based on the cumulative confirmed data of Korea from July 1 to September 30, 2022, an ARIMA model is established, and the cumulative number of confirmed cases in Korea from October 1 to October 5, 2022 is predicted. The results show that the predicted results are basically consistent with the actual results. The results of this paper provide theoretical support for the prediction, prevention and control of this major public event.
Keywords: major public events; time series analysis; ARIMA model; development status; prediction
2019年12月,正當(dāng)中國人民喜迎新春之際,湖北省武漢市接連查出多起新型冠狀病毒感染(以下簡稱“新冠感染”)病例,該病毒具有傳染速度快且發(fā)病率高的特性。隨后,在中國對此開展防控治療時,其他各國也陸續(xù)出現(xiàn)確診案例。該傳染病迅速演變成全球范圍內(nèi)的公共衛(wèi)生問題,新型冠狀病毒感染在各國的擴(kuò)散階段不同,擴(kuò)散趨勢也有顯著不同[1]。因此,世界各國不僅要研究本國當(dāng)前情況,還要抓緊了解其他地區(qū)的情況,實現(xiàn)信息共享,對病毒傳播情況有更加全面地了解才能在預(yù)防與控制中占據(jù)上風(fēng)。
本文采用模型分析法,運(yùn)用RStudio對韓國累計確診數(shù)據(jù)進(jìn)行時間序列分析。首先根據(jù)數(shù)據(jù)繪制時序圖、自相關(guān)圖,以此判斷數(shù)據(jù)的平穩(wěn)性。由于獲取的韓國累計確診數(shù)據(jù)具有非平穩(wěn)性的特點,對非平穩(wěn)序列[2]進(jìn)行差分處理,序列平穩(wěn)后選取合適的ARIMA模型進(jìn)行擬合,并檢驗?zāi)P偷挠行裕瑱z驗通過后進(jìn)行趨勢預(yù)測、趨勢圖繪制,從而了解國外在此次重大公共衛(wèi)生事件中病毒擴(kuò)散的趨勢。我國便能及時掌握國外新冠感染發(fā)展程度,應(yīng)對將來可能出現(xiàn)的危機(jī)與挑戰(zhàn)。
1" 方法
1.1" 數(shù)據(jù)來源
韓國病例數(shù)據(jù)來源是新型冠狀病毒感染全球疫情實時播報,從中選取出2022年7月1日至2022年9月30日韓國的累計確診數(shù)據(jù)。
1.2" 研究方法
時間序列分析是將一組不同時間上的數(shù)據(jù)按照時間先后順序記錄下來,通過研究序列的統(tǒng)計規(guī)律來分析生活中的難題,也可將這些規(guī)律與信息用于預(yù)測。根據(jù)序列的統(tǒng)計特征可分為平穩(wěn)時間序列和非平穩(wěn)時間序列。在進(jìn)行時間序列分析時,簡便的ARIMA模型總是備受青睞,其也是最常見的使用方法之一。ARIMA模型簡單,只依靠內(nèi)生的變量,但需注意的是該模型依賴平穩(wěn)序列,當(dāng)序列為非平穩(wěn)時無法提取到規(guī)律,需進(jìn)行差分使其平穩(wěn)化。ARIMA模型相當(dāng)于AR模型與MA模型的組合,包括p、d、q3個參數(shù),p是構(gòu)造的模型中使用的時序數(shù)據(jù)自身的滯后數(shù),d是差分階數(shù),q是構(gòu)造的模型中使用的預(yù)測誤差的滯后數(shù),進(jìn)一步可看出該模型無須依賴其他的外生變量,當(dāng)q為0時,ARIMA模型變?yōu)锳R模型,p為0時,ARIMA模型變?yōu)镸A模型[3]。ARIMA(p,d,q)模型,結(jié)構(gòu)如下
Φ(B)?犖d xt=Θ(B)εtE(εt)=0,Var=σ2,E(εt εs)=0,s≠tE(xs εt)=0,?坌slt;t,
式中:?犖d=(1-B)d、Φ(B)=1-?準(zhǔn)1B-,…,-?準(zhǔn)pBp代表自回歸系數(shù)多項式;Θ(B)=1-θ1B-,…,-θqBq代表移動平滑系數(shù)多項式;xt代表非平穩(wěn)序列;εt代表零均值白噪聲序列。
1.3" 建模過程
1)數(shù)據(jù)平穩(wěn)化:根據(jù)時序圖觀察序列的平穩(wěn)性,當(dāng)序列呈現(xiàn)周期性變動或有劇烈波動趨勢時,為非平穩(wěn)序列。隨后用自相關(guān)圖做進(jìn)一步輔助識別,平穩(wěn)序列的自相關(guān)系數(shù)呈現(xiàn)迅速衰減趨勢,非平穩(wěn)序列中自相關(guān)系數(shù)則是逐漸降到0,在0處波動一段時間后,自相關(guān)系數(shù)又變?yōu)樨?fù)。當(dāng)序列非平穩(wěn)時做差分處理,使其平穩(wěn)化[4]。
2)白噪聲檢驗:對經(jīng)過差分后得到的平穩(wěn)序列進(jìn)行純隨機(jī)性檢驗,在各階延遲下,p值小于α(0.05),則認(rèn)為序列是非純隨機(jī)的,包含著可提取的動態(tài)規(guī)律[5]。
3)通過自相關(guān)圖和偏自相關(guān)圖找出合適模型,當(dāng)存在多個合適的模型時,由AIC準(zhǔn)則判定最合適的模型,AIC的值越小,模型擬合越好。
4)模型檢驗:模型檢驗包括2部分。第一部分是模型的顯著性檢驗,查看模型篩選的信息是否充分[6]。擬合效果越好,序列中樣本的相關(guān)信息獲取越充分,此時殘差序列項為純隨機(jī)序列;第二部分是參數(shù)的顯著性檢驗,用于檢驗?zāi)P椭忻恳粋€參數(shù)是否顯著非0,不顯著非0的參數(shù)視為不合格,可以舍棄[7]。
5)模型預(yù)測:模型通過檢驗后展開預(yù)測。
2" 對重大公共事件下韓國現(xiàn)狀分析及預(yù)測
2.1" 平穩(wěn)性檢驗
圖1是韓國累計確診序列的時序圖,從圖中可發(fā)現(xiàn)明顯的上升趨勢,呈現(xiàn)出非平穩(wěn)序列的特征,通過自相關(guān)圖進(jìn)一步輔助識別,如圖2所示。累計確診序列在很長的延遲時間里,自相關(guān)系數(shù)從正數(shù)遞減到0后,又持續(xù)是負(fù)數(shù),因此序列是非平穩(wěn)序列[1]。圖3中序列經(jīng)二階差分后一直在一個固定的范圍內(nèi)隨機(jī)波動,變得平穩(wěn)。接下來對數(shù)據(jù)進(jìn)行純隨機(jī)性檢驗,確認(rèn)該序列是否有繼續(xù)研究的價值。
2.2" 白噪聲檢驗
通過RStudio對3個觀察值序列進(jìn)行白噪聲檢驗,檢驗結(jié)果顯示,在6階、12階延遲下,p值均小于顯著性水平α(0.05),有很大把握認(rèn)為韓國累計治愈序列是非純隨機(jī)的,即為非白噪聲序列,存在研究價值。
2.3" 建立模型
圖4、圖5是差分處理后的自相關(guān)圖和偏自相關(guān)圖。由圖4、5可知,自相關(guān)系數(shù)2階截尾,偏自相關(guān)系數(shù)衰減過程非常緩慢,偏自相關(guān)系數(shù)拖尾。因此確定ARIMA(p,2,q)模型中參數(shù)p為0,q為2,因此選取ARIMA(0,2,2)為最優(yōu)模型,ARIMA(0,2,2)的AIC=2 083.9。擬合模型的口徑為
xt=εt-0.396 5εt-1-0.276 1εt-2,
Var(εt)=619 333 966。
2.4" 模型檢驗
進(jìn)行模型檢驗,結(jié)果見表1。6階延遲下模型殘差通過了檢驗,可認(rèn)為ARIMA(0,2,2)模型擬合恰當(dāng)。從表2可以看出,韓國累計確診序列中2個參數(shù)均顯著非0,ARIMA(0,2,2)模型2個系數(shù)都通過了t檢驗,擬合效果很好。
2.5" 模型預(yù)測
本文通過RStudio對韓國此次重大公共事件中的累計確診數(shù)據(jù)進(jìn)行時間序列分析,展開預(yù)測。圖6是累計確診序列的趨勢預(yù)測圖,預(yù)測了2022年10月1日后的發(fā)展趨勢,在2022年10月1日到2022年10月5日韓國的累計確診序列呈現(xiàn)平穩(wěn)上升趨勢,確診人數(shù)的增速并未放緩,在未來一段時間內(nèi)感染者人數(shù)仍會繼續(xù)上升,事態(tài)發(fā)展與防控的形勢不容樂觀。韓國此次事件的累計確診序列預(yù)測結(jié)果與實際結(jié)果見表3,兩者對比進(jìn)一步展現(xiàn)出模型預(yù)測有效程度,預(yù)測結(jié)果接近真實值,保障了預(yù)測的準(zhǔn)確性。
3" 結(jié)束語
自2019年檢測出第一個確診病例后,大部分國家迅速被籠罩在新冠感染的陰霾之下,這場傳染病奪去了無數(shù)人的生命,造成的經(jīng)濟(jì)損失也不可估量,深入研究并盡快解決此次重大公共衛(wèi)生傳染病問題成為迫切要求。本文從新冠感染全球疫情實時播報中選取2022年7月1日至2022年9月30日韓國累計確診數(shù)據(jù),建立了ARIMA(0,2,2)模型,該模型對序列進(jìn)行擬合得到了顯著的效果。最后,利用模型預(yù)測2022年10月1日到10月5日韓國累計確診人數(shù),韓國確診人數(shù)依然持續(xù)上升,事態(tài)控制效果不明顯,傳染病發(fā)展和防控形勢嚴(yán)峻。預(yù)測結(jié)果與真實值吻合,預(yù)測的韓國累計確診病例數(shù)據(jù)總體呈現(xiàn)上升趨勢,與真實數(shù)據(jù)的整體變化趨勢也大致相同,保障了預(yù)測力度,而隨時間推移,預(yù)測力度呈遞減趨勢。通過對韓國現(xiàn)階段的形勢進(jìn)行追蹤,可以掌握本次重大公共衛(wèi)生傳染病發(fā)展的情況,深入了解該傳染病的傳播特點,為我國提供有效參考,在本國實際情況基礎(chǔ)之上進(jìn)行精準(zhǔn)施策,如制定嚴(yán)格、準(zhǔn)確和及時的防控措施等,從而遏制傳染病的發(fā)展。
參考文獻(xiàn):
[1] 白云,錢箴,孫玉瑩,等.基于綜合集成預(yù)測方法的新冠肺炎疫情預(yù)測[J].系統(tǒng)工程理論與實踐,2022,42(6):1678-1693.
[2] 裴韜,王席,宋辭,等.COVID-19疫情時空分析與建模研究進(jìn)展[J].地球信息科學(xué)學(xué)報,2021,23(2):188-210.
[3] 王燕.時間序列分析——基于R[M].北京:中國人民大學(xué)出版社,2015.
[4] 徐娟年,馬冉,趙中睿,等.山東省新型冠狀病毒肺炎疫情流行趨勢初步預(yù)測[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2020,37(2):101-106.
[5] ILSU C, HO L D, KUK K Y. Effects of timely control intervention on the spread of middle east respiratory syndrome coronavirus infection[J].Osong Public Health and Research Perspectives,2017,8(6):373-376.
[6] 黃志輝,黃波,汪炯驊.人口流動對新冠肺炎傳播影響的時空分析——以美國為例[J].地理與地理信息科學(xué),2022,38(5):65-71.
[7] 萬時雨,劉玨,劉民.新型冠狀病毒基本再生數(shù)研究進(jìn)展[J].科學(xué)通報,2020,65(22):2334-2341.