摘要:本文基于內蒙古自治區人口發展的基本特點,研究內蒙古人口發展規律,并采用ARMA模型對內蒙古未來10年的人口進行了預測,預測出到“十一五”末內蒙古總人口達到2519.915萬人,到2020年內蒙古總人口達2556.199萬人。
關鍵詞:ARMA模型 預測 總人口
目前,預測經濟運行的理論與方法較多,如有灰色預測模型、生長曲線、指數平滑法等,這些模型對經濟運行的長期趨勢預測較準,但對短期波動不是很精確。相比之下,ARMA模型在經濟預測過程中既考慮了經濟現象在時間序列上的依存性,又考慮了隨機波動的干擾性,對于經濟運行短期趨勢的預測準確率較高,是近年應用比較廣泛的方法之一。
一、ARMA模型的建模思想
時間序列分析的ARIMA建模法,也叫做Box-Jenkins法,它是美國統計學家伯克斯(Geogre.E.P.Box)和英國統計學家詹金斯(Gwilym M.Jenkins)于1970年提出的時間序列預測方法,主要是在對時間序列進行分析的基礎上,選擇適當的模型進行預測。ARMA模型也叫自回歸移動平均模型(Auto-Regressive Integrated Moving Average Model)。
Box-Jenkins法的基本思想是用時間序列的過去值和現在值的線性組合來預測其未來值。也就是說,將時間推移而形成的系列數據視為一個隨機序列,把時間序列作為一組僅依賴于時間t的隨機變量,這組隨機變量所具有的依存關系或自相關性表現了其所觀測對象發展的延續性,而這種相關性一旦被相應的數學模型描述出來,就可以從時間序列的過去值及現在值,去預測其未來值。
建立時間序列模型的前提是時間序列必須具有平穩性。如果時間序列是非平穩的,建立模型之前應先把它變換成平穩的時間序列,同時仍保持原時間序列的隨機性。
ARMA模型有三種基本形式:自回歸模型(autoregressive,AR)、移動平均模型(movingaverage,MA)以及自回歸移動平均模型(或混合模型)(auto-regressive Moving Average,ARMA)。
二、ARMA模型人口預測
(一)數據的選取
選取的數據是內蒙古自治區1980-2010年總人口(數據來源:《2011年內蒙古統計年鑒》),把內蒙古人口數據用序列POP表示,對POP序列做折線圖并進行單位根檢驗。
從折線圖中我們看出,線性圖向右上方傾斜,說明此序列具有增長的趨勢。
ADF檢驗的結果中看出,ADF=-2.611,分別大于不同檢驗水平的三個臨界值,(1%,-3.689;5%,-2.978;10%,-2.623),所以該序列是一個非平穩序列。
(二)平穩化處理
我們對時序數據取對數之后,再進行ADF檢驗,可得,ADF=-2.979,分別小于不同檢驗水平的三個臨界值(1%,-3.689;5%,-2.978;10%,-2.623),所以得到的序列LNPOP是平穩序列。
從自相關和偏自相關圖可知,序列LNPOP的增長趨勢已消除。
(三)模型定階并估計參數
我們設定顯著性水平α=0.05,其 P值小于0.05,說明觀察值序列有相關信息可以提取,即序列是平穩非白噪聲序列。序列DLNPOP的自相關圖(AC)和偏相關圖(PAC)都是1階截尾的,初步判別選用ARMA模型。
根據SBC準則對模型定階后,用最小二乘法對模型的參數進行估計,取對數后時間序列POP的ARMA(1,1)模型為:
(四)模型檢驗
ARMA(1,1)模型中,各系數的t檢驗值均大于t值大于2,根據經驗判斷,就可以認為參數估計值顯著。參數估計和模型擬合后,應對ARMA模型的殘差序列進行白噪聲檢驗。若殘差序列不是白噪聲序列,意味著殘差序列還存在有用信息未被提取,說明擬合的模型不夠有效,需要對模型重新進行識別。
對其進行白噪聲檢驗,檢驗結果,模型殘差項為白噪聲,信息提取充分。從殘差圖也可以看出,模型擬合效果良好。
三、預測
根據時間序列LNPOP的ARMA(1,1)模型,我們可以得出時間序列POP的ARMA(1,1)模型的預測公式:
[POP^=Exp(7.898+0.953AR(1)+0.437MA(1))]
現在對時間序列2006-2010年的POP進行模擬:2006年的模擬值為2430.03萬人,實際值為2415.10萬人,相對誤差為6.18‰;2007年的模擬值為2441.87萬人,實際值為2428.80萬人,相對誤差為5.38‰;2008年的模擬值為2453.20萬人,實際值為2444.30萬人,相對誤差為3.64‰;2009年的模擬值為2464.05萬人,實際值為2458.20,相對誤差為2.38‰;2010年的模擬值為2474.43萬人,實際值為2472.20萬人,相對誤差為0.90‰。模擬值和實際值之間的誤差最大為2006年的6.18‰,最小僅為0.9‰,平均相對誤差僅為3.7‰。
通過上述檢驗性預測,我們認為ARMA模型在人口數量預測方面精度較高,是科學的預測方法,可以對內蒙古2011-2020年總人口及男、女人口預測。
預測出2011-2015年內蒙古總人口及男、女人口數如下:2011年總人口的模擬值為2484.358萬人,男性人口為1289.7610萬人,女性人口為1191.57萬人,男女人口合計為2481.33萬人,二者合計人口絕對誤差為3.028萬人;2012年總人口的模擬值為2493.854萬人,男性人口為1295.475萬人,女性人口為1194.91萬人,男女人口合計為2490.385萬人,二者合計人口絕對誤差為3.469萬人;2013年總人口的模擬值為2502.934萬人,男性人口為1300.992萬人,女性人口為1198.051萬人,男女人口合計為2499.043萬人,二者合計人口絕對誤差為3.891萬人;2014年總人口的模擬值為2511.616萬人,男性人口為1306.319萬人,女性人口為1201.004萬人,男女人口合計為2507.322萬人,二者合計人口絕對誤差為4.294萬人;2015年總人口的模擬值為2519.915萬人,男性人口為1311.46萬人,女性人口為1203.779萬人,男女人口合計為2515.239萬人,二者合計人口絕對誤差為4.676萬人。
人口預測通常采用時間序列分析為基礎的自回歸模型,自回歸模型的前提必須是平穩序列,而對于非平穩的人口時間序列由于解釋變量選擇不當或是設計不合理往往預測精度不高,甚至喪失預測功能。由于內蒙古城鎮、鄉村人口與出生、死亡人口在取對數后序列仍不平穩,因此不宜采用ARMA模型。
四、小結
從上述實證分析我們得到結論如下:2011-2015年,從發展趨勢來看內蒙古人口規模和人口結構將逐年增加,自然增長率卻持續降低,人口規模的增長速度緩慢。同時,預測出2015年內蒙古總人口為2519.915萬人,這與內蒙古提出的到“十二五”末人口控制在2520萬的目標是一致的。2015年按男女人口預測值合計得到的總人口為2515.239萬人,與總人口預測值2519.915相差也較小。
內蒙古是少數民族聚居的西部邊遠地區,人口問題始終是制約經濟社會發展的關鍵因素之一,內蒙古人口發展經歷了多個階段,近年來人口發展出現了一些新的特點:老齡化進程加速、出生人口性別比持續升高、鄉村人口城鎮化等,這些都影響著自治區人口的增長。在經濟社會快速發展的轉型期,人口發展面臨著前所未有的復雜局面,人口安全面臨的風險依然存在。
作者簡介:
曹美麗(1962- ),女,山西省右玉縣,學士,統計與數學學院副教授,從事統計理論及其應用研究。