呂盛鴿 徐 祎 (杭州電子科技大學,浙江 杭州 310018)
基于VAR模型的上海市老齡化系數預測
呂盛鴿 徐 祎 (杭州電子科技大學,浙江 杭州 310018)
目的 掌握上海市老齡化發展進程及變動趨勢。方法 以上海市1978~2010年戶籍人口數據為樣本,利用格蘭杰因果檢驗和協整分析,選取對總人數和老年人數有顯著影響的序列,確定一個穩定的人口系統,構建老年人數預測值滿足上海市老年人口峰值期的向量自回歸模型。在設定省際凈遷移人數序列及低、中、高總和生育率方案下,利用模型預測上海市2011~2050年的總人數、老年人數和老齡化系數。結果 在低、中、高方案下,老齡化系數分別在2034、2032和2032年達到峰值22.25%、21.80%和21.40%,到2050年分別下降至21.58%、20.85%和20.25%。結論 高總和生育率方案能有效延緩上海市人口老齡化進程,有利于逐步優化上海市人口年齡結構。
戶籍人口;老齡化系數;老年人口峰值期;VAR模型
預測一個地區的老齡化系數,一般是通過預測該地區的總人數和老年人數來實現??側藬岛屠夏耆藬蛋l展的內在規律表現在人口序列的自相關性和不同人口序列的互相關性上,向量自回歸模型(VAR)能較好地反映這種關系。本文利用上海市戶籍人口數據建立VAR模型,在一定的約束條件下預測2011~2050年上海市的總人數和老年人數,分析上海市老齡化系數的變動趨勢。
1.1 指標選取 根據人口統計學原理,生育、死亡和遷移是引起人口變動的三大基本要素,為預測上海市戶籍總人數和老年人數,初步選取總人數、老年人數、男女性別比、總和生育率、死亡率、平均預期壽命及省際凈遷入人數7個指標序列。為方便起見,將這 7 個序列依次記為 y1t、y2t、y3t、y4t、y5t、y6t、y7t,并用 yit-i表示 yit的 i階階滯后期(j=1,2,…,7)。
1.2 數據說明 采用上海市1978~2010年戶籍人口數據(見表1)??側藬?、男女性別比、死亡率、平均預期壽命和省際凈遷移人數的數據均來自于《上海市統計年鑒》;1978~1999年和2000~2010年的總和生育率分別來自《上海市人口與計劃生育統計資料匯編》和上海市人口計生委統計報表;1996~2010年老年人口數據來源于上海市老齡科學研究中心公布的《上海市老年人口和老齡事業監測統計信息》,1982、1987及1990年老年人數分別由當年的人口普查或1%人口抽樣調查數據計算得到,1978~1980年、1986和1989年老年人數分別來自文章《2000年上海人口老齡化趨勢分析》、《1986年上海老年人口調查報告》及《試析上海人口老齡化與就業之關系》。
2.1 格蘭杰(Granger)因果檢驗 利用表1中的數據,對序列y1t,y2t,…y7t,兩兩進行格蘭杰因果檢驗,找出對 y1t和 y2t有顯著影響的序列,在現有樣本條件下,對可能的滯后期都進行檢驗,取相伴概率最小的。由表2可見,在8%的顯著性水平下,y1t和y2t存在雙向因果關系,y3t、y4t、y6t、y7t均是 y1t和 y2t的格蘭杰原因,y5t不是y1t和y2t的格蘭杰原因。實際上,上海市人口死亡率y5t近25年一直在常數7.20‰附近波動,人口系統可以不考慮幾乎是常數的y5t。

表1 1978~2010年上海市戶籍人口數據

表2 格蘭杰因果檢驗結果
2.2 協整分析 原始的格蘭杰因果檢驗并沒有要求被檢驗的序列是平穩的,不過對非平穩序列進行格蘭杰因果檢驗,其結果的可信度不高。下面通過協整分析來提升格蘭杰因果檢驗結論的可信度。用 ADF檢驗方法分別對序列 y1t、y2t、y3t、y4t、y6t和y7t及各序列的一階差分進行平穩性檢驗。檢驗結果顯示,在5%的顯著性水平下,序列y7t平穩,其余變量均不平穩,一階差分 Vy1t、y2t、y3t、Vy4t和 y6t均為平穩序列,即序列 y1t、y2t、y3t、y4t和y6t同為一階單整。對 y1t、y2t、y3t、y4t和 y6t進行約翰森(Johansen)協整檢驗,在1%的顯著性水平下,取兩個線性無關的協整關系,它們的數學表達式分別為(1)y1t=-1 449.13-16.56×y3t+285.79×y4t+53.36×y6t+Vecm1t和(2)y2t-188.20+0.11×y3t+61.64×y4t+5.09×y6t+Vecm3t;式(1)和式(2)中誤差修正項Vecm1t和Vecm2t在5%顯著性水平下均是0附近波動的平穩序列,說明序列 y1t、y2t、y3t、y4t、y6t存在著長期穩定的均衡關系,即 y3t、y4t、y6t對 y1t和 y2t存在長期穩定的線性影響關系。對 y1t、y2t-1、y3t、y4t和 y6t進行約翰森協整檢驗,在 5% 的顯著性水平下,取一個協整關系,其數學表達式為(3)y1t=-781.64+0.59×y2t-1-1.57×y3t+206.70×y4t+25.00×y6t+Vecm3t;同理可得y2t、y1t-1、y3t、y4t和y6t5%顯著性水平下的協整關系數學表達式(4)y2t= -1 160.25-1.26×y1t-1-5.35×y3t-219.20×y4t-24.08×y6t+Vecm4t;式(3)和式(4)中誤差修正項Vecm3t和Vecm4t在5%顯著性水平下均是0附近波動的平穩序列,說明序列 y1t、y2t-1、y3t、y4t和 y6t(y2t、y1t-1、y3t、y4t和 y6t)存在著長期穩定的均衡關系,由此可見y2,t-1(y1t-1)對y1t(y2t)存在長期穩定的線性影響關系,即y1t與y2t互為線性影響關系。Vecm1t(Vecm2t)和y7t同為零階單整,對 Vecm1t(Vecm2t)和 y7t作EG(Engle&Granger)協整檢驗,結果顯示Vecm1t(Vecm2t)與y7t之間存在著長期穩定的均衡關系,為此,認為y7t對y1t(y2t)存在著長期穩定的線性影響關系。
綜上,協整檢驗結果與格蘭杰因果檢驗結論一致,即y3t、y4t、y6t和y7t對y1t和y2t有顯著影響,這一結論有一定可信度,因此,最終將 y1t、y2t、y3t、y4t、y6t和 y7t看成一個人口系統。
3.1 選擇模型標準 同時有兩個或兩個以上模型可供選擇時,選取總人數(老年人數)的預測值與實際值的平均絕對百分誤差(MAPE)較小的模型;選取以總人數(老年人數)為被解釋變量的方程Ⅰ(Ⅱ)的調整決定系數較接近于1者;針對VAR系統整體而言,選擇赤池信息量(AIC)和施瓦茲信息量(SC)較小者;在模型擬合精度和預測精度大致相同的情況下,盡可能選擇待估參數較少的模型。
3.2 模型約束條件 1982年進行的全國第三次人口普查數據顯示,上海市人口密度最大的年齡段是18~28歲,1984年以前上海市每年的常住人口數與戶籍人口數幾乎相等,說明1982年上海市常住人口和戶籍人口中密度最大的年齡段均是18~28歲。由表1可見,1982~2000年戶籍總人數增長緩慢,這段時間人口密度最大年齡段應由1982年的18~28歲移至2000年的36~46歲,2000年進行的全國第五次人口普查數據顯示,上海市常住人口密度最大的年齡段也是36~46歲,由此說明,上海的凈外來人口對戶籍人口的年齡移動趨勢的影響不明顯,即對老年人口峰值期的影響不大。綜上,在《上海市老年人口峰值期預測》一文中得到的結論“上海市常住人口老年人數峰值在2030年前后出現”,仍可作為戶籍老年人口的峰值期,因此,本文在選擇模型進行預測時,將以“上海市戶籍老年人口峰值期在2030年前后出現”為約束條件。
3.3 向量自回歸模型
3.3.1 模型的建立 在上海市人口系統中,平均預期壽命y6t將參考聯合國有關機構對日本人口平均預期壽命預測的數據確定,總和生育率y4t由計劃生育部門控制,省際凈遷入人數y7t隨著國家產業政策、發展戰略逐步變化,可認為由決策部門掌握,男女性別比y3t可由政府相關部門采取適當措施調節,因此,y3t、y4t、y6t和 y7t應是 VAR 模型中的純解釋變量(或稱外生變量);待預測的總人數y1t和老年人數y2t應是VAR模型中的被解釋變量(或稱內生變量)。綜上分析,考慮建立被解釋變量為y1t和y2t的兩類VAR模型:①第一類:自回歸部分包括y1t和y2t,y4t、y6t和 y7t及其滯后期為純解釋變量,記為〔y1t,y2t(p);y4t(r),y6t(s),y7t(w)〕; ②第二類:自回歸部分包括 y1t和 y2t,y3t、y4t、y6t和 y7t及其滯后期為純解釋變量,記為〔y1t,y2t(p);y3t(q),y4t(r),y6t(s),y7t(w)〕;其中正整數p為自回歸階數,非負整數q、r、s和 w 依次是 y3t、y4t、y6t和 y7t的最大滯后期。利用表1 中數據,綜合格蘭杰因果檢驗和協整分析的結果,從兩類VAR模型中選取了192個模型,根據選擇模型準則,最終確定3個備選模型:①模型一:〔y1t,y2t(2);y4t(1),y6t(1),y7t(2)〕;②模型二:〔y1t,y2t(3);y4t(2),y6t(0),y7t(0)〕;③模型三:〔y1t,y2t(2);y3t(2),y4t(1),y6t(1),y7t(2)〕。


表3 備選模型檢驗結果
3.3.2 設定預測參數 ①設定平均預期壽命。隨著凈外來人口的比重增加,上海市常住人口平均預期壽命與戶籍人口差異逐步擴大,2011~2050年戶籍人口平均預期壽命應高于《上海市老年人口峰值期預測》一文中設定的常住人口平均預期壽命。聯合國有關機構2007年對日本2007~2050年人口平均預期壽命作出預測:當平均預期壽命達到80.00~82.50歲時,每年增長0.230歲;達到82.50~85.00歲時,每年增長0.141歲;超過85.00歲后每年增長0.093歲。上海與日本同屬亞洲,地理緯度差異較小,且經濟平均發展水平與生活水平相差不大,參考聯合國對日本平均預期壽命的預測數據,設定上海市2011~2050年戶籍人口平均預期壽命為:當平均預期壽命達到80.00~82.50歲時,每年增長0.229歲;達到82.50~85.00歲時,每年增長0.140歲;超過85.00歲后每年增長0.092歲。②設定省際凈遷移人數。隨著西部大開發、中部崛起和區域振興等戰略實施,勞動密集型產業逐步往中西部轉移,預計未來上海省際凈遷移人數將呈現先增后減的趨勢。具體遷移方案設定如下:2011~2015年,每年省際凈遷移人數較上一年增加0.4萬,2016~2025年每年較上一年減少1.2萬,2025年起,省際凈遷移人數為0。③設定總和生育率。根據歐美、日本等發達國家或地區生育率下降的經驗,上海未來即使放寬生育政策,其總和生育率也不太可能出現較大的提高。但考慮到上海過去生育高峰的慣性影響和未來計劃生育政策的逐步調整,總和生育率可能出現一定程度的提高。綜合上述分析,本文設定如表4所示的低、中、高三個總和生育率方案。
3.3.3 老齡化系數預測 在低方案下,基于模型一用靜態預測方法進行一步外推,得到2011年總人數和老年人數置信度95% 的預 測 區 間〔1 421.276,1 425.369〕和〔226.853,234.049〕,分別從預測區間內選取值1 422.42萬人和231.87萬人,依次作為2011年總人數和老年人數的實際值,并與人口系統中樣本數據一起重新建立類似模型一的表達式,再用靜態預測方法進行一步外推,…直到2014年為止,最后用動態方法估算2015~2050年總人數和老年人數的預測值,由此求得2011~2050年各年老齡化系數預測值。其中2011~2014年從靜態區間內選取的總人數和老年人數預測值,是以老年人數預測值滿足約束條件“上海市戶籍老年人口峰值期在2030年前后出現”確定的。中方案和高方案預測過程與低方案過程雷同。三個不同方案下總人數、老年人數和老齡化系數的主要預測值見表5。

表4 總和生育率方案設定

表5 低、中、高方案下總人數、老年人數和老齡化系數的主要預測值
3.3.4 預測結果分析 ①上海市未來總人數大體呈現先增后減再小幅反彈的趨勢。在低、中、高方案下,總人數分別在2019、2020和2020年達到峰值1 473.96萬人、1 489.11萬人和1 505.73萬人,又分別在2043、2040和2039年出現小幅反彈。統計資料顯示1981~1989年期間上海出現過一次小的生育高峰,按照上海婦女目前平均初育年齡28.20歲計算,該期間出生的女孩將于2009~2017年到達初育年齡,2009~2017年出生的女孩又將于2038~2046年進入初育年齡,因此總人數在2040年前后出現小幅反彈。到2050年末,在低、中、高方案下總人數分別反彈至1 362.66萬人、1 404.35萬人和1 439.82萬人。②老年人數在2011~2050年內不受生育水平變動的影響,且在2046年前后出現反彈。在三種方案下老年人口峰值期均在2030年,滿足“上海市戶籍老年人口峰值期在2030年前后出現”的約束條件。不同方案下老年人口峰值均在306萬左右,這是由于新出生的人口要在65年后才會進入老年群體,因而老年人數預測值在預測期內不受生育水平變動的影響。在低、中、高三個方案下老年人數分別在2047、2046和2046年出現反彈,這是由于在1981~1989年生育高峰出生的人口將于2046~2054年進入老年群體,因此老年人數在2046年前后出現反彈,不過至2050年老年人數仍低于峰值306萬人。③上海市未來老齡化系數呈先增后減的趨勢,老齡化形勢十分嚴峻。無論何種方案,上海市老齡化系數都呈現先增后減的變化趨勢。在低、中、高三個方案下,老齡化系數分別在2034、2032和2032年達到峰值22.25%、21.80%和21.40%,雖然到2050年分別下降至21.58%、20.85%和20.25%,但仍高于20%,上海將長期處在重度老齡化階段。
本文針對上海市1970年以來總和生育率迅速下降、1949年以來平均預期壽命不斷增長的實際情況,將建立人口數量模型的思維視角由注重擬合樣本精度擴展到滿足“上海市戶籍老年人口峰值期在2030年出現”的約束條件,我們認為通過擬合樣本精度高且滿足約束條件的VAR模型進行預測,有助于提高總人數、老年人數以及老齡化系數中長期預測值的精度。若文中設定的凈遷移人數與平均預期壽命符合上海市的實際,由預測結果可見,上海市未來人口老齡化問題十分嚴峻。為了提前應對老年人口高峰期到來,可以考慮在控制上海人口總量增長的前提下,逐步放開生育政策。雖然高方案下老齡化程度可以得到一定的緩解,但總和生育率越高的方案,總人數達到峰值后人口數量下降越慢,越不利于緩解人口總量規模對上海經濟發展帶來的壓力,因此,建議采用中方案的生育政策。
1 徐 祎,呂盛鴿.上海市老年人口峰值期預測〔J〕.中國老年學雜志,2011;31(24):4973-6.
2 李永勝.人口統計學〔M〕.成都:西南財經大學出版社,2002:105-247.
3 駱 勇,趙明強.上海市人口老齡化:現狀、影響以及對策思考〔J〕.西北人口,2009;30(6):72-6.
4 曹永福.格蘭杰因果檢驗評述〔J〕.數量經濟技術經濟研究,2006;23(1):155-60.
5 王桂新,魏 星.上海老齡化高峰期預測及對策研究〔J〕.科學發展,2009;27(10):38-57.
6 World Population Prospects The 2007 Revision.http://esa.un.org/unpd/wpp/index.htm.
C921
A
1005-9202(2012)07-1455-04;
10.3969/j.issn.1005-9202.2012.07.060
國家社會科學基金項目(09BTJ005)
徐 祎(1987-),女,在讀碩士,主要從事人口統計學研究。
呂盛鴿(1953-),男,教授,主要從事人口統計學研究。
〔2011-08-08收稿 2011-11-03修回〕
(編輯 張 慧)