董莉娜++李倩
【摘要】通過對我國1949年至2012年共49年的人口數據進行實證分析,分別運用確定性因素分解法和ARIMA模型兩種不同的時間序列分析方法,對我國人口的變化規律進行了擬合研究。
【關鍵詞】時間序列分析 確定性因素分解法建模 ARIMA模型
人口過多一直是我國最重要的問題之一,合理的人口規模是經濟、社會、資源和環境協調發展的有力保證,因此了解我國人口規模發展的現狀和預測未來人口規模發展的趨勢,具有重要的理論和現實意義。早在十八世紀末,英國人馬爾薩斯在研究了百余年的人口統計數據資料后,利用微分方程建立了Logistic人口模型;國內眾多學者也對人口預測方面的數學模型進行許多研究。本文通過對我國1949年至2012年共49年的人口數據進行實證分析,分別運用確定性因素分解法和ARIMA模型兩個不同的時間序列分析方法,對我國人口的變化規律進行了擬合研究。
時間序列是指同一現象的觀測值按不同時間排列的數字序列。在早期的時間序列分析中,通常是通過歷史數據的比較和圖形的觀察來揭示現象隨時間變化的規律,即所謂的描述性時序分析。傳統時間序列分析在實踐中的應用主要是確定性時間序列分析方法,包括指數平滑法、移動平均法、時間序列分解法等等。但在現實生活中,許多不確定性因素的影響越來越嚴重,已經引起人們的重視。博克斯和詹金斯(1970)提出了一種基于隨機理論的時間序列分析方法,使時間序列分析理論達到了一個新的高度,大大提高了預測的精確度。對于平穩時間序列來說,基本模型有:自回歸(AR)模型、移動平均(MA)模型以及自回歸移動平均(ARMA)模型等。對非平穩時間序列,基本模型為:求和自回歸移動平均模型以及殘差自回歸模型等。近年來,隨著計算機技術和信號處理技術的迅速發展,時間序列分析的理論和方法越來越完善。
運用確定性因素分解法建立模型時,克萊默分解定理認為任何時間序列都可以分解為兩部分:一部分是由多項式決定的確定趨勢的一部分,另一部分是平穩零均值誤差。由于1949年到1970年間的總人口數據有部分缺失,所以只選擇1970年到2012年的人口數據進行分析。處理過程中以1970年為時間起點,即t=1。通過觀察發現,總人口序列圖有明顯的線性趨勢,嘗試擬合一元線性直線。
建立ARIMA模型時,先將時間序列從Excel表中讀入R中,做總人口的趨勢圖,觀察趨勢及平穩性。時序圖清晰地顯示每年總人口呈現出明顯的逐年遞增的趨勢,顯然該序列一定不是平穩序列。同時單位根檢驗的結果顯示,統計量的P值大于0.05,拒絕平穩這一原假設,所以可以認為我國總人口序列顯著非平穩。顯然,這個序列的DF檢驗結果與根據時序圖得到的直觀判斷完全一致。先對總人口序列進行一階差分,觀察發現一階差分序列仍然是不平穩序列,再對總人口序列進行二階差分,時序圖和單位根檢驗結果表明二階差分序列是平穩序列。建立二階差分序列的ARMA模型.。ACF為四步截尾的,PACF收斂的速度能達到要求,嘗試擬合MA(4)模型。先對回歸系數進行估計和顯著性檢驗,根據輸出結果計算T統計量值(由參數除以標準差而得),MA(1)參數的T統計量值:-0.4502/0.1396=-3.22492837,MA(2)參數的T統計量值:-0.2038/0.1571=-1.29726289,MA(3)參數的T值:0.0946/0.1470 =0.64353741,MA(4)參數的T值0.4406/0.1460=-3.01780822,顯然MA(1)和MA(4)參數均在5%的顯著水平下拒絕零假設。根據檢驗結果去掉不顯著的變量,建立疏系數模型,MA(1)和MA(4)參數均在5%的顯著水平下拒絕零假設。為了檢驗模型是否用于結果的預測,對模型進行進一步的適應性檢驗。檢驗結果表明:LB統計量的P—值多數大于0.05(或其ACF均落在區間內),說明殘差序列無自相關,模型為適應的。利用觀察值數據和前面得到的擬合數據,進行預測。
模型一中,擬合模型Xt=85342.930+1273.835t+εt
模型二中,綜合前面的差分運算,實際上是對原序列擬合疏系數模型ARIMA(0,2,(1,4))。
參考文獻
[1]王燕.應用時間序列分析[M].中國人民大學出版社,2005
[2][英]C.查特菲爾德著,駱振華譯.時間序列分析引論(第二版).廈門:廈門大學出版社,1987
[3][美]Jonathan D.Cryer,Kung-Sik Chan著,潘紅宇等譯.時間序列分析及應用(原書第二版).機械工業出版社,2011.1
作者簡介:董莉娜(1993-),女,山西運城人;李倩(1993-),女,山西長治人,山西財經大學應用統計專業碩士研究生,研究方向:市場調查與分析。