摘要:根據國家統計局各年度人口統計匯總,對總人口數時間序列進行分析,建立了1949年至今總人口數時間序列模型,并利用所得模型對照2009年中國人口預測,檢測該模型正確率。
關鍵詞:統計;時間序列模型;總人口數
中圖分類號:C92 文獻標志碼:A 文章編號:1673-291X(2010)10-0195-03
一、總人口數時間序列分析
在AR、MA或ARMA模型中,時間序列是由一個零均值的平穩隨機過程產生,即其過程的隨機性具有時間上的不變性,在圖形上表現為所有樣本點在某一水平線上下波動,對于非平穩時間序列,需要預先對時間序列進行平穩化處理。
1.平穩化檢查。利用Eviews5.0繪制中國1949年至今總人口數時間序列數據。通過圖1看出,中國人口數據序列有趨勢項,無周期。
由圖1可以看出,1960年出現了人口負增長,究其原因,可能是1958年搞大躍進,吃大鍋飯,緊接著三年自然災害,故而出現人口負增長。而1966—1975年是中國人口增長高峰期。1977年后由于實行計劃生育,中國人口增長率放慢。
2.平穩化過程。先對變量進行一次差分,之后用單位根方法對序列進行平穩性檢驗,但是所得結果無法拒絕θ=0。如圖所示。再對原序列進行二次差分,所得ADF檢驗值為-7.202233,大于1%,5%,10%的顯著性水平所對應的臨界值-4.130526,-3.492149,-3.174802,故可以拒絕θ=0,故呈現單位根的假設,二階差分所得的序列可以認為是平穩的,沒有展現任何趨勢,為Ι(0)隨機過程(如下圖):
一次差分序列單位根結果
*MacKinnon(1966)one-sided p-values.
二次差分序列單位根結果
*MacKinnon(1966)one-sided p-values.
二、時間序列模型的建立及相關檢驗
本文研究的序列為一元時間序列,建模的目的是利用其歷史值及當前和過去的隨機誤差項對該變量變化前景進行預測,通常假定不同時刻的隨機誤差項為獨立且正態的隨機變量。對于時間序列預測,首先要找到與數據擬合最好的預測模型,所以階數的確定和參數的估計是預測的關鍵。
1. 模型識別。使用Eviews5.0軟件,計算二次差分后的時間序列24階自相關系數和偏自相關系數(如下圖所示):
經過反復測試,發現ARMA(1,2)AIC值最小,所以選取ARIMA(1,2,2)。
2. 模型參數估計及建立。本文選用非線性最小二乘法(NLS)來估計參數,所得ARIMA(1,2,2)形式為:
Xt = a1Xt-1 +εt + b1εt-1 + b2εt-2
使用Eviews5.0對模型進行參數估計,得到估計結果如下:
得到所需估計量,即可得到以下模型表達式:
Xt = 0.514974Xt-1 +εt - 0.614358εt-1 - 0.344475εt-2
3.模型檢驗。對所得模型殘差序列ut進行平穩性和隨機性檢驗。如果殘差序列是白噪聲,可以接受這個具體的擬合。如果不是,那么殘差序列可能還存在有用信息沒被提取,需要進一步改進模型。經過檢驗,并結合殘差自相關,偏自相關圖以及ADF檢驗數值結果可以認為殘差序列是平穩的。并且DW值分別為:2.015826,在2的附近,表明不存在嚴重的序列相關。所過白噪聲檢驗(如下圖所示):
三、中國人口短期預測及分析
對ARMA(1,2)做回歸得到以下結果:
如下表所示調整后的擬合優度達到了0.999674,可見該模型相當可靠。
利用所得模型進行2009年中國人口預測,得到結果如下:
推測得到中國2009年人口將增至133 894.6。
注:由于本模型經過二階差分得到,并且由有限個數據擬合而成,所以只適合于短期預測(本文數據系國家統計局各年度人口統計匯總而成)。
參考文獻:
[1]田應福,繆柏其.貴州省人口總量時間序列的ARIMA模型[J].云南民族大學學報:自然科學版,2006,(6).
[2]何書元.應用時間序列分析[M].北京:北京大學出版社,2007.
[責任編輯 王薇]