李鳳英



摘要:以湖北省2020/1/22-2020/3/24新型冠狀病毒肺炎確診數據為樣本,利用 R語言構建求和自回歸移動平均預測模型ARIMA(1,1,1),以1/22日-3/17日為訓練數據, 3/18-3/24日為預測數據。運行模型發現,預測數據與真實數據擬合度高,檢驗效果顯著。初期確診病例數迅速上升,2月15日左右趨于穩定進入平穩緩慢期。將預測模型用于北京市,擬合效果良好,效果同樣顯著。充分說明ARIMA(1,1,1)模型穩健性良好,可用于新冠肺炎預測。
Abstract: Taking the confirmed data of COVID-19 in Hubei Province from 2020/1/22-2020/3/24 as samples, the summed autoregressive moving average prediction model ARIMA (1,1,1) was constructed by R language, 1/22 -3/17 Day is training data, 3/18-3/24 is prediction data. Running the model found that the prediction data and the real data have a high degree of fit, and the test effect is significant. 2/15 is about to stabilize and enter a stable and slow period. The model is used to predict the number of diagnosed people in Beijing. The fitting effect is good and the effect is also significant. It fully shows that the ARIMA (1,1,1) model has good robustness and can be used for COVID-19 prediction.
關鍵詞:新冠肺炎;求和自回歸移動平均模型;預測
Key words: COVID-19;ARIMA(1,1,1);forecast
中圖分類號:O212.96 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2020)25-0229-03
0 ?引言
新型冠狀病毒肺炎(COVID-19,以下簡稱“新冠肺炎”)是一種急性感染性肺炎,患者癥狀主要包括發熱、干咳和乏力,逐漸出現呼吸困難等癥狀。自2019年12月新冠肺炎在湖北省武漢市發現以來,截至2020年4月22日,全球新冠肺炎確診病例超過243萬,其中美國累計確診病例數已超過82萬,死亡病例超過45000例,絕大多數國家疫情仍然在持續增長,遠沒達到峰值.湖北省尤其武漢市作為新冠肺炎疫情重災區,實施有效的控制與治療措施后,取得了巨大成功,為世界應對新冠肺炎疫情提供了方向,意義非凡.因此構建模型對湖北省的累計確診數據進行研究分析,不僅對我國未來的疫情防控預測提供參考價值,也可對當前世界新冠肺炎的防控提供決策依據[1]。
1 ?理論基礎
求和自回歸移動平均模型(ARIMA, Autoregressive Integrated Moving Average model)模型被廣泛用于各方面的流感預測[2-3],如具有如下結構的模型為求和自回歸移動平均模型,簡記為ARIMA(p,d,q)模型[4-5]:
2 ?實證分析
2.1 數據來源
數據來源于湖北省和北京市衛生健康委員會,以1月22日-3月24日湖北省、北京市新冠肺炎確診病例數據為樣本,分為預測數據和訓練數據,1月22日-3月17日56天數據為訓練數據,3月18日-3月24日7天數據為預測數據。
2.2 訓練數據處理與分析
以ARIMA理論為基礎,利用R語言(R-Studio7.2環境,R版本3.6.3)語言編程,訓練數據統計分析如下:
2.2.1 平穩性檢驗
湖北省與北京市1月22日-3月17日56天新冠肺炎確診病例的時序圖如圖1所示,兩地區確診人數趨勢一致,數據有明顯的直線上升趨勢,可以看出是不平穩的。
對數據進行一階差分,差分之后的55個數據如圖2所示,可以看出數據趨勢是平穩的。
2.2.2 一階差分后的數據隨機性檢驗
利用博克斯-皮爾斯(Box-Pierce)隨機性檢驗,結果如表1所示, p-value均小于0.05,數據為非純隨機性序列。
2.2.3 一階差分后的數據自相關性檢驗
自相關性是指隨機誤差項的各期望值之間存在著相關關系,通過模型得到湖北省與北京市自相關圖(圖3和圖4),湖北省自相關圖具有一階截尾性,北京市自相關圖具有明顯的拖尾性。
2.2.4 一階差分后的數據偏自相關性檢驗
偏自相關分析也稱凈相關分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性相關性,當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。通過模型得到到湖北省與北京市偏自相關圖(圖5和圖6),湖北省偏自相關圖表現出明顯的截尾性, 北京市偏自相關圖表現出拖尾性。