張一洋 艾仁華 俞思雅 李 帆
(福州大學(xué)環(huán)境與安全工程學(xué)院,福建 福州 350108)
自然災(zāi)害對(duì)社會(huì)發(fā)展造成嚴(yán)重影響,對(duì)自然災(zāi)害的特征、過程、損失以及其他后果等方面開展研究成為學(xué)界熱點(diǎn)。例如張瑩等[1]基于省際面板數(shù)據(jù),對(duì)影響我國(guó)自然災(zāi)害損失的若干社會(huì)經(jīng)濟(jì)因素進(jìn)行了檢驗(yàn)和估計(jì)。He Yue等[2]以新浪微博的數(shù)據(jù)界定自然災(zāi)害的范圍,并對(duì)災(zāi)區(qū)網(wǎng)絡(luò)輿情進(jìn)行研究。胡繼亮等[3]建立Probit模型,研究自然災(zāi)害頻率與損失度對(duì)于農(nóng)戶投保意愿的影響程度。
在進(jìn)行自然災(zāi)害數(shù)據(jù)統(tǒng)計(jì)的過程中,研究人員嵌入時(shí)間因素對(duì)自然災(zāi)害情況進(jìn)行分類說明。例如李媛媛[4]將新疆的自然災(zāi)害依照預(yù)警時(shí)間劃分為三類。王萍等[5]對(duì)2000—2017年中國(guó)知識(shí)資源總庫(kù)中關(guān)于災(zāi)害風(fēng)險(xiǎn)研究的中文文獻(xiàn)進(jìn)行分析,了解當(dāng)前災(zāi)害風(fēng)險(xiǎn)研究領(lǐng)域現(xiàn)狀和熱點(diǎn)。景楠等[6]用時(shí)間序列數(shù)據(jù),對(duì)新冠肺炎疫情構(gòu)建輿情模型并進(jìn)行參數(shù)估計(jì)、模型診斷和模型評(píng)價(jià)。Xu Xiaoyan等[7]應(yīng)用經(jīng)驗(yàn)?zāi)B(tài)分解和自回歸綜合移動(dòng)平均相結(jié)合的預(yù)測(cè)方法研究自然災(zāi)害后的商品需求。畢碩本等[8]基于EEMD方法對(duì)1470—1911年黃河中下游地區(qū)旱澇災(zāi)害進(jìn)行多時(shí)間尺度分析。Guo Naijing等[9]利用時(shí)間序列分析自然災(zāi)害和社會(huì)因素與災(zāi)情變化的相關(guān)性。張軍[10]建立時(shí)間序列組合模型對(duì)四川省自然災(zāi)害直接經(jīng)濟(jì)損失進(jìn)行趨勢(shì)分析和預(yù)測(cè)。肖志權(quán)[11]利用時(shí)間序列預(yù)測(cè)模型獲取受災(zāi)人群分布以及人口數(shù)量統(tǒng)計(jì)。
在對(duì)自然災(zāi)害的時(shí)間序列研究中,有部分關(guān)于自然災(zāi)害造成的經(jīng)濟(jì)損失和受災(zāi)人口的文獻(xiàn),但存在研究樣本選取時(shí)間和空間跨度較小,以及分析變量較為單一的問題。本文系統(tǒng)梳理了2014年3月至2020年5月(共75個(gè)月)全國(guó)自然災(zāi)害造成的直接經(jīng)濟(jì)損失與受災(zāi)人口數(shù)據(jù),以保證預(yù)警模型的全面和可靠。
按照時(shí)間順序排列所得的數(shù)組稱為時(shí)間序列[12]。時(shí)間序列可分為平穩(wěn)時(shí)間序列和非平穩(wěn)時(shí)間序列兩類[13]。非平穩(wěn)時(shí)間序列數(shù)據(jù)不具備趨勢(shì),當(dāng)數(shù)據(jù)存在趨勢(shì)時(shí),回歸分析可能將無(wú)關(guān)變量擬合出顯著的關(guān)聯(lián)關(guān)系,這樣的分析會(huì)得出錯(cuò)誤的結(jié)論、做出無(wú)效的預(yù)測(cè),即發(fā)生所謂的虛假回歸,給實(shí)證研究和預(yù)測(cè)工作帶來風(fēng)險(xiǎn)[14]。
本文從國(guó)家災(zāi)情網(wǎng)和國(guó)家減災(zāi)網(wǎng),收集了我國(guó)2014—2020年自然災(zāi)害導(dǎo)致的直接經(jīng)濟(jì)損失和受災(zāi)人口的數(shù)據(jù),并繪制時(shí)間趨勢(shì)圖,見圖1和圖2。

圖1 2014—2020年直接經(jīng)濟(jì)損失情況時(shí)間趨勢(shì)圖

圖2 2014—2020年受災(zāi)人口情況時(shí)間趨勢(shì)圖
從圖1和圖2可以看出,受自然災(zāi)害影響的直接經(jīng)濟(jì)損失和受災(zāi)人口沒有單調(diào)的時(shí)間趨勢(shì),且從現(xiàn)實(shí)而言自然災(zāi)害造成的直接經(jīng)濟(jì)損失和受災(zāi)人口根據(jù)每年受災(zāi)情況的不同而有所不同,一般不具有持續(xù)上升或下降的趨勢(shì),因此可以初步認(rèn)為所選數(shù)據(jù)具有平穩(wěn)時(shí)間序列的特征,但是需要進(jìn)行實(shí)際的驗(yàn)證。
為減少由于數(shù)據(jù)方面出現(xiàn)的異常值和數(shù)據(jù)量綱方面的問題,將直接經(jīng)濟(jì)損失和受災(zāi)人口原始數(shù)據(jù)標(biāo)準(zhǔn)化,使數(shù)據(jù)保持在一個(gè)量級(jí),能更好的進(jìn)行分析預(yù)測(cè),見公式(1):
Zi=(Xi-μ)/δ
(1)
式(1)中,Zi為標(biāo)準(zhǔn)化后的值,Xi為原數(shù)值,μ為均值,δ為標(biāo)準(zhǔn)差。
由上文可知,直接經(jīng)濟(jì)損失和受災(zāi)人口沒有明顯的時(shí)間趨勢(shì),故采用無(wú)時(shí)間趨勢(shì)的單位根檢驗(yàn),進(jìn)而判斷后面的序列是否平穩(wěn),結(jié)果見表1。

表1 直接經(jīng)濟(jì)損失和受災(zāi)人口單位根檢驗(yàn)結(jié)果
從表1可見,直接經(jīng)濟(jì)損失和受災(zāi)人口的檢定統(tǒng)計(jì)量分別為-4.598、-5.455,均小于各項(xiàng)檢驗(yàn)值的臨界值,即認(rèn)為可以在1%的水平上拒絕“存在單位根”的原假設(shè),所以認(rèn)為直接經(jīng)濟(jì)損失和受災(zāi)人口是平穩(wěn)的時(shí)間序列。
自回歸積分滑動(dòng)平均模型(Autoregressive Integrated Moving Average Model,ARIMA)是時(shí)間序列時(shí)域分析的方法之一[15]。ARIMA模型是在自回歸滑動(dòng)平均模型(Autoregressive Moving Average Model,ARMA)的基礎(chǔ)上先對(duì)數(shù)據(jù)進(jìn)行差分,再將差分還原得到預(yù)測(cè)數(shù)據(jù),ARMA的一般表達(dá)式見式(2)。
(2)
式(2)中,yt為觀測(cè)值,p、q分別為自回歸階數(shù)和滑動(dòng)平均階數(shù),αi和βj分別為自回歸系數(shù)和滑動(dòng)平局系數(shù),εt為白噪聲。
通過觀察自相關(guān)圖與偏相關(guān)圖,確定時(shí)間序列的ARIMA(p,d,q)模型的具體形式。其中,p值由自相關(guān)圖的階數(shù)確定,d是差分的階數(shù),q值由偏相關(guān)圖的階數(shù)確定。
2.1.1 自相關(guān)分析
首先繪制直接經(jīng)濟(jì)損失和受災(zāi)人口的自相關(guān)圖,如圖3和圖4所示。

圖3 直接經(jīng)濟(jì)損失自相關(guān)圖

圖4 受災(zāi)人口自相關(guān)圖
從圖3、圖4看,直接經(jīng)濟(jì)損失和受災(zāi)人口的自相關(guān)圖都具有二階拖尾的特征。直接經(jīng)濟(jì)損失和受災(zāi)人口一階自相關(guān)系數(shù)都超過了95%的置信區(qū)間,因此都存在一階自相關(guān)。
2.1.2 偏相關(guān)
同理繪制直接經(jīng)濟(jì)損失和受災(zāi)人口的偏相關(guān)圖,如圖5和圖6所示。

圖5 直接經(jīng)濟(jì)損失偏相關(guān)圖

圖6 受災(zāi)人口偏相關(guān)圖
從圖5、圖6看,直接經(jīng)濟(jì)損失和受災(zāi)人口具有二階截尾的特征。直接經(jīng)濟(jì)損失和受災(zāi)人口一階偏相關(guān)系數(shù)超過了95%的置信區(qū)間,因此存在一階偏相關(guān)。
綜合自相關(guān)圖和偏相關(guān)圖來看,直接經(jīng)濟(jì)損失的自相關(guān)圖具有二階拖尾特征,而偏相關(guān)圖具有二階截尾特征;受災(zāi)人口的自相關(guān)圖具有二階拖尾特征,而偏相關(guān)圖則具有二階截尾特征,理論上兩者均使用AR(2)模型,但還需要通過赤遲信息和貝葉斯信息進(jìn)行判斷。
赤遲信息準(zhǔn)則(Akaike Information Criterion,AIC)和貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC)是統(tǒng)計(jì)學(xué)中模型選擇和評(píng)價(jià)的重要工具[16]。AIC和BIC可以權(quán)衡所估計(jì)模型的復(fù)雜度和此模型擬合數(shù)據(jù)的優(yōu)良性,兩者數(shù)值越小越好。
在Stata中,ARIMA模型被看作帶有擾動(dòng)項(xiàng)的結(jié)構(gòu)模型,ARIMA模型公式中本質(zhì)上使用的是最大似然估計(jì)。
直接經(jīng)濟(jì)損失原序列通過判斷為平穩(wěn)時(shí)間序列,因此ARIMA(p,d,q)模型中d=0,且自相關(guān)圖具有二階拖尾特征而偏相關(guān)圖具二階截尾的特征,理論上使用AR(2)模型。但是仍有其他4種模型進(jìn)行選擇,分別為ARIMA(1,0,1),ARIMA(1,0,2),ARIMA(2,0,1),ARIMA(2,0,2),最終將通過對(duì)比AIC值和BIC值的大小來確定使用哪一個(gè)模型,結(jié)果見表2。

表2 直接經(jīng)濟(jì)損失AIC和BIC結(jié)果
對(duì)比AR(2),ARIMA(1,0,1),ARIMA(1,0,2),ARIMA(2,0,1),ARIMA(2,0,2)的AIC值和BIC值,ARIMA(2,0,2)的AIC值和BIC值最小,因此選擇ARIMA(2,0,2)模型。
同理,受災(zāi)人口的檢驗(yàn)結(jié)果如表3所示。

表3 受災(zāi)人口AIC和BIC結(jié)果
對(duì)比AR(2),ARIMA(1,0,1),ARIMA(1,0,2),ARIMA(2,0,1),ARIMA(2,0,2)的AIC值和BIC值,ARIMA(2,0,2)的AIC值和BIC值最小,因此選擇ARIMA(2,0,2)模型。
擬合模型后,需要檢驗(yàn)殘差序列是否為白噪聲。生成新的殘差序列,直接經(jīng)濟(jì)損失殘差序列r1和受災(zāi)人口殘差序列r2,在正常情況下生成的殘差應(yīng)為平穩(wěn)時(shí)間序列。繪制殘差圖,見圖7和圖8。

圖7 直接經(jīng)濟(jì)損失殘差圖

圖8 受災(zāi)人口殘差圖
從圖中可以直觀看出,直接經(jīng)濟(jì)損失和受災(zāi)人口的殘差序列無(wú)明顯的上升或者下降趨勢(shì),可認(rèn)為是平穩(wěn)時(shí)間序列。為確定最終結(jié)果,還需對(duì)殘差進(jìn)行單位根檢驗(yàn),結(jié)果見表4。

表4 殘差單位根檢驗(yàn)結(jié)果
根據(jù)表4結(jié)果可知,直接經(jīng)濟(jì)損失和受災(zāi)人口的檢定統(tǒng)計(jì)量分別為-7.471和-6.574,均小于各項(xiàng)檢驗(yàn)值的臨界值,即認(rèn)為可以在1%的水平上拒絕“存在單位根”的原假設(shè),所以認(rèn)為直接經(jīng)濟(jì)損失和受災(zāi)人口的殘差值是平穩(wěn)的時(shí)間序列。
系數(shù)顯著性檢驗(yàn)通過后,要進(jìn)行模型的有效性檢驗(yàn),也就是檢驗(yàn)殘差性是否為白噪聲,用Q統(tǒng)計(jì)量進(jìn)行白噪聲檢驗(yàn),檢驗(yàn)結(jié)果見表5。

表5 白噪聲檢驗(yàn)結(jié)果
從檢驗(yàn)結(jié)果來看,r1的P值為0.3321>0.05,可以認(rèn)為存在白噪聲,因此該序列的信息已經(jīng)被提取完畢,可知模型的擬合性較好。而r2的P值為0.0014<0.05,認(rèn)為不存在白噪聲,因此模型不合理,故重新對(duì)ARIMA模型進(jìn)行選取。按照AIC值和BIC值從小到大進(jìn)行選取,選出白噪聲檢驗(yàn)合格的ARIMA模型,結(jié)果見表6。

表6 受災(zāi)人口殘差值檢驗(yàn)
根據(jù)表6的結(jié)果,只有ARIMA(2,0,1)模型的P值滿足要求為0.0517>0.05,可以認(rèn)為存在白噪聲,因此該序列的信息已經(jīng)被提取完畢,可知模型的擬合性較好,可以開始模型的預(yù)測(cè)。同時(shí),從其殘差圖(見圖9)和單位根檢驗(yàn)(見表7)來看,ARIMA(2,0,1)模型也滿足條件。

圖9 受災(zāi)人口殘差圖(新)
從圖9可以看出,受災(zāi)人口的殘差序列無(wú)明顯的上升或者下降趨勢(shì),可認(rèn)為受災(zāi)人口是平穩(wěn)時(shí)間序列。

表7 殘差單位根檢驗(yàn)結(jié)果(新)
根據(jù)結(jié)果檢定統(tǒng)計(jì)量的值為-7.681,均小于各項(xiàng)檢驗(yàn)值的臨界值,即認(rèn)為可以在1%的水平上拒絕“存在單位根”的原假設(shè),所以認(rèn)為殘差值是平穩(wěn)的序列。
綜上結(jié)果來看,最終選定直接經(jīng)濟(jì)損失的ARIMA模型為ARIMA(2,0,2),受災(zāi)人口的ARIMA模型為ARIMA(2,0,1)。
對(duì)于模型,研究先采用樣本內(nèi)數(shù)據(jù)進(jìn)行估計(jì)[17]。樣本內(nèi)預(yù)測(cè)是使用預(yù)測(cè)模型對(duì)樣本內(nèi)的原始值進(jìn)行預(yù)測(cè),其與實(shí)際樣本的差異即為殘差值。生成新的直接經(jīng)濟(jì)損失和受災(zāi)人口的時(shí)間序列作為預(yù)測(cè)值,將其比對(duì)原始值的擬合線,見圖10和圖11。

圖10 直接經(jīng)濟(jì)損失樣本內(nèi)預(yù)測(cè)

圖11 受災(zāi)人口樣本內(nèi)預(yù)測(cè)
圖10、圖11中,實(shí)線為原始值,虛線為樣本內(nèi)預(yù)測(cè)值。ARIMA模型對(duì)實(shí)際值進(jìn)行了更為平均的計(jì)算,從直觀輪廓可以看出,圖中預(yù)測(cè)值與原始值時(shí)間趨勢(shì)相同,因此可以認(rèn)為所選預(yù)測(cè)模型有一定的擬合效果。相比于直接經(jīng)濟(jì)損失的模型,受災(zāi)人口的模型整體擬合效果稍弱,但能其在時(shí)間節(jié)點(diǎn)的上升或下降趨勢(shì)與原始數(shù)據(jù)相近,能從直觀輪廓中看出受災(zāi)人口的歷年變化趨勢(shì),因此認(rèn)為所選預(yù)測(cè)模型有一定的擬合效果。從擬合的結(jié)果來看,在同一年內(nèi)一般具有兩個(gè)較大的起伏,最高值分別處于夏季7月份和冬季1月份,最低值分別處于春季3月份和秋季11月份,最高值約為最低值的2~4倍。
樣本外預(yù)測(cè)效果在未來預(yù)測(cè)方面更具有說服力[18]。樣本外預(yù)測(cè)首先要填補(bǔ)空缺值,Stata軟件能對(duì)未來一定時(shí)間內(nèi)的情況進(jìn)行預(yù)測(cè),該范圍取決于時(shí)間序列的單位,本文以月份為單位,新添加了12個(gè)月的空缺值,即時(shí)間范圍達(dá)到2021年5月末。生成新的時(shí)間序列作為樣本外預(yù)測(cè)值,將其與原始值進(jìn)行比對(duì),結(jié)果見圖12和圖13。

圖12 直接經(jīng)濟(jì)損失樣本外預(yù)測(cè)

圖13 受災(zāi)人口樣本外預(yù)測(cè)
圖12和圖13中實(shí)線為原始值,虛線為樣本外預(yù)測(cè)值。樣本外預(yù)測(cè)是在樣本內(nèi)預(yù)測(cè)的基礎(chǔ)上進(jìn)行的,從圖12和圖13可以看出,樣本外預(yù)測(cè)值相較于原始值多出了一部分,該部分即為2020年6月初至2021年5月末的直接經(jīng)濟(jì)損失和受災(zāi)人口的預(yù)測(cè)值。從預(yù)測(cè)值的結(jié)果來看,接下來的12個(gè)月直接經(jīng)濟(jì)損失和受災(zāi)人口整體呈先上升再下降的趨勢(shì)。預(yù)測(cè)時(shí)間從2020年6月開始,此時(shí)處于夏季,是自然災(zāi)害的頻發(fā)階段,圖中的預(yù)測(cè)結(jié)果顯示在接下來的時(shí)間中,自然災(zāi)害導(dǎo)致的直接經(jīng)濟(jì)損失和受災(zāi)人口將會(huì)上升,這與實(shí)際情況相符合,但是在整體預(yù)測(cè)中只出現(xiàn)了一個(gè)較大的起伏,另一起伏表現(xiàn)不明顯。
①對(duì)比直接經(jīng)濟(jì)損失和受災(zāi)人口時(shí)間趨勢(shì)圖發(fā)現(xiàn),兩者變化趨勢(shì)基本相同,即自然災(zāi)害造成經(jīng)濟(jì)損失的同時(shí)也會(huì)產(chǎn)生受災(zāi)人口。一般來講,直接經(jīng)濟(jì)損失高,受災(zāi)人口也多,但是并非絕對(duì),而是與具體造成損失的自然災(zāi)害有關(guān)。
②由相關(guān)性分析得到直接經(jīng)濟(jì)損失和受災(zāi)人口的自相關(guān)和偏相關(guān)系數(shù),并由AIC值和BIC值得到時(shí)間序列模型。通過白噪聲檢驗(yàn)和殘差值檢驗(yàn),最終選定兩者的時(shí)間序列模型。
③從樣本內(nèi)預(yù)測(cè)來看,新生成的模型與原始值有一定差值,但是具有相同的起伏趨勢(shì),預(yù)測(cè)值也滿足在冬夏季節(jié)直接經(jīng)濟(jì)損失和受災(zāi)人口多的特征。從樣本外預(yù)測(cè)來看,生成的模型是在樣本內(nèi)預(yù)測(cè)的基礎(chǔ)上形成的,具有樣本內(nèi)預(yù)測(cè)的特征。得到的結(jié)果滿足從春季到夏季先升后降的趨勢(shì),與實(shí)際情況比較符合,對(duì)于預(yù)測(cè)未來直接經(jīng)濟(jì)損失和受災(zāi)人口有一定參考意義。