劉 濤
廣東藥科大學附屬第一醫院病案統計科,510080 廣東 廣州
5歲以下兒童死亡率(under-five mortality rate,U5MR)是反映兒童健康狀況的敏感指標之一[1],同時也是衡量一個國家或地區的兒童健康水平、社會經濟發展水平、環境狀況、醫療水平、婦幼保健水平的重要綜合指標之一。根據聯合國千年宣言,從2000年到2015年的15年內,U5MR要減少三分之二,2000年我國的U5MR為35.70‰,在2015年減少至10.70‰,U5MR減少了70%,達到了聯合國千年宣言的目標。U5MR的計算公式可表示為:(同年5歲以下兒童死亡數/同年5歲以下兒童總數)×1 000‰。根據2001年到2017年共17年間廣州市的U5MR數據,建立ARIMA時間序列模型,通過建立的模型預測未來兩年廣州市的U5MR。預先掌握U5MR可能的變化狀況,為制定相關的干預措施與衛生政策提供決策依據[2]。
為保證數據的真實可靠性,所有數據均從廣州市衛生信息中心的衛生統計年鑒及各醫療機構上傳至衛生信息中心的統計報表中獲取。由于研究選用的廣州市U5MR數據在2001年之前普遍缺失或者缺乏登記導致數據不可用,且2018年數據尚未公布,故選用2001年至2017年的可靠數據作為觀察值。
使用Excel對數據進行匯總整理,通過SPSS 19.0構建ARIMA模型,并根據得到的ARIMA模型對待研究數據進行數據處理、建模、檢驗以及預測分析[3]。
建立ARIMA模型的方法如圖1所示:

圖1 建立ARIMA模型流程圖
將收集到的2001—2017年廣州市的U5MR時間序列匯總整理,繪制原序列時序圖(見圖2)。得知廣州市U5MR隨著時間的推移,呈現明顯下降趨勢,由2001年的10.51‰降低至2017年的3.03‰,屬于非平穩序列,需要進行差分平穩[4]。通過SPSS預測模型中的差分模型,原序列經二階差分后序列表現為平穩(見圖3)。由圖3可知2階序列在均值附近波動,表現平穩,因此可以確定差分d的階數等于2, ARIMA模型為(p,2,q)。

圖2 廣州市U5MR時間序列圖

圖3 經過二階差分后的廣州市U5MR序列圖
使用SPSS19.0中的分析預測模型,對圖3進行自相關分析,建立ACF圖與PACF圖,見圖4、圖5。由圖4可知ACF在一階以后快速回落至置信區間以內;由圖5可知PACF在一階之后在置信區間內緩慢變化,據此判斷ACF一階截尾,PACF拖尾。初步判斷得到(0,2,1)、(0,2,0)、(1,2,0)、(1,2,1)四種ARIMA模型。

圖4 二階差分序列自相關圖

圖5 二階差分序列偏自相關圖
對各備選ARIMA模型進行擬合效果進行評價與比較(見表1),根據比較結果得出,唯有 (1,2,0) 模型參數檢驗P小于0.05,且標準化BIC值與平穩R2均在可接受范圍內,因此研究適用ARIMA(1,2,0)模型。

表1 各個模型擬合精度比較結果
對模型進行LB-Q檢驗、對殘差序列進行S-W檢驗,得到LB-Q檢驗的P值的最大值等于0.791,最小值等于0.227,均大于顯著水平(α=0.05),說明殘差之間無相關性[5]。S-W檢驗P=0.17,大于顯著水平(α=0.1),說明殘差服從正態分布[6]。因此可以得出殘差是純隨機白噪聲序列。說明模型已提取出原時間序列中所包含的信息,ARIMA(1,2, 0)模型對該序列擬合成功。
在得出擬合的ARIMA模型后,根據2001年到2016年的時間序列,對擬合模型預測的2017年廣州市的U5MR與實際的2017年U5MR進行比較分析,結果得出2017預測值為2.72‰。同實際值3.03‰比較,模型擬合誤差在10%以內,且擬合的模型與原時間序列的走向大致相仿,原時間序列均落在擬合模型的置信區間之中,可以認為ARIMA模型(1,2,0)擬合程度較高,能夠較為準確地對廣州市未來的U5MR進行預測。根據擬合模型的預測結果,廣州市2018年的U5MR為(2.62±1.21)‰,2019年的U5MR為(2.22±2.20)‰,2020年的U5MR在(1.77±2.64)‰之間,見圖6。

圖6 2001—2017廣州市U5MR實際值與模型預測及其95%置信區間對比
從2001—2017年廣州市的U5MR觀察值中可以直接得出廣州市的U5MR總體呈現明顯下降趨勢,結合國家統計局U5MR的數據(從2001年的35.9‰下降至2017年的9.1‰),廣州市的下降趨勢幅度(平均每年0.41‰)同比全國較低(平均每年1.675‰)。這是因為廣州市的U5MR(2017年3.03‰)遠低于全國平均值(2017年9.1‰)所導致,說明廣州市在兒童疾病安全衛生工作方面領先于全國平均水平。
U5MR是衡量一個國家或地區的兒童健康狀況、社會、經濟、環境的綜合衛生指標,反映了我國未成年人90%以上的死亡情況[7],因此U5MR的準確預測結果是為科學客觀地對社會、經濟、衛生等方面進行決策的重要依據。由于U5MR受社會、經濟、文化、環境、衛生狀況等多種復雜因素影響,因此使用ARIMA模型利用觀察值隨時間的動態變化綜合替代了各方面因素的影響,對觀察值構成的時間序列進行預測[8]。該模型具有準確度較高,適合各種實際環境的優點,但同時也要求數據必須是隨時間有著趨勢變化的序列,并要求此變化趨勢在短期未來持續保持,而且需要收集至少10個以上的觀察值。本次預測分析在保證數據來源真實可靠的前提下收集了廣州市2001年到2017年共17年U5MR的數據樣本,以提供足夠的樣本量,并且觀察值均落在所求的擬合模型ARIMA(1,2,0)的置信區間之內,說明擬合效果比較好,該模型可以較為準確地廣州市U5MR的未來變化情況進行預測。