李華炯,尹喆軒,胡新昱,陳彥升
廣州城市理工學院,廣東廣州,510000
截至2019年末,我國年度新增人口跌破500萬,創幾十年來增量新低。近年來關于對人口出生率影響因素的研究并不少,為尋求導致出生率下降的重要因素,找到有效防止出生率持續下降的方法,本文對相關研究報告進行聯合分析,利用針對性模型結合我國最新的人口數據進行更全面的分析。借助數據挖掘技術,使用優化模型預測擬合出生率的發展趨勢,得出導致我國出生率下降的主要因素。隨后為我國發展道路中面對低出生率這一問題提出可行性方案,根據多方面因素的影響提出有效建議,為政府提供可行性決策。
在找到所有影響因素的數據后進行匯總,得到共86個以1990-2019年為時間范圍的影響因素,并把其分為四大類。包括以圍生期疾病粗死亡率(1/10萬)、65歲及以上人口占總人口的比重(%)、孕產婦死亡率、15~24歲女性就業人口比率(百分比)等指標為主的人口因素;以高中學校數、中學學校數、幼兒園數、小學畢業人數(萬人)等指標為主的教育因素;以刑事犯罪總數、離婚率、調解婚姻家庭糾紛數(件)、城鎮登記失業率等指標為主的社會因素;以國內增值稅、國內消費稅、營業稅、企業所得稅等指標為主的經濟因素[1-15]。
在進行數據處理中,有十幾個影響因素存在某些年份的缺失值,需要使用缺失值填補方法對數據進行填充。缺失值填補方法主要分為兩類:一類為傳統缺失值修復方法,即均值替代、移動平均法、空間自回歸等;另一類則為新型缺失值修復方法,即隨機森林插補法、LSTM神經網絡等。在對每種方法都進行了實驗后,結果表明,ARIMA時間序列填補缺失值的效果最好,所以本文使用該方法進行缺失值填充。部分影響因素的缺失值填補見表1。

表1 個人所得稅缺失值填補表
根據調查顯示,從1994年稅收改革開始,中國的個人所得征稅制度才正式執行,所以ARIMA模型填補缺失值合理。
灰色關聯度分析是一種多因素統計分析的方法,它表明若兩個因素變化的趨勢具有一致性,即同步變化程度較高,即可謂二者關聯程度較高;反之,則較低。由于需要研究對出生率影響程度大的因素,所以文章采取灰色關聯度分析研究出生率與影響因素之間的關聯度。具體實現步驟見文獻[16]。參考表2,大于0.8的影響因素為強相關,所以文章選擇出43個與出生率強相關的影響因素,分別為居民家庭恩格爾系數、圍生期疾病粗死亡率、0~14歲人口數等影響因素。

表2 關聯強度表
將挑選出來的43個影響因素與出生率做雙折線圖分析,發現大部分影響因素與出生率存在線性關系,所以使用多元線性回歸模型進行分析[17]。雙折線圖如圖1所示(由于指標太多,僅展示部分圖片)。

圖1 恩格爾系數與出生率的雙折線圖
通過使用SPSS軟件進行計算,發現各影響因素間存在多重共線性關系。嘗試使用了手動移除共線性的變量、逐步回歸法、增加樣本容量、嶺回歸四種方法后,發現使用嶺回歸可以有效地解決該問題。因此采用嶺回歸處理此問題。編寫python代碼計算得出如下嶺回歸方程(由于指標過多,只展示部分指標參數):

本文分別使用嶺回歸、XGBoost、隨機森林、BP神經網絡四種模型來對影響因素與出生率進行擬合和調參。具體實現步驟見文獻[18-20]。三種模型的回歸結果見表3。

表3 模型回歸評價表
根據表3的R方,可見BP神經網絡的R方0.987為三者中數值最大,且MSE、RMSE最小,則對數據的擬合效果最佳,所以選擇BP神經網絡模型預測人口出生率。然后通過ARIMA時間序列模型預測出未來六年的43個影響因素數據,代入保存好的BP神經網絡模型,預測結果見表4。

表4 出生率預測結果表
表4中2020年預測出的出生率為8.8519%,與2020年國家統計局統計出的人口出生率8.5%非常接近,所以可以證明預測結果較合理。
根據嶺回歸得出的模型可知,養老保險、儲蓄率、性別比、避孕普及率是影響出生率變化趨勢的重要因素,其中出生率與養老保險、儲蓄率存在正相關關系,與性別比、避孕普及率存在負相關關系。而且公式顯示養老保險和儲蓄率的相關系數遠遠大于其他的系數,所以這里本文將經濟因素作為影響出生率的第一影響因素。
根據第七次人口普查數據,我國65歲及以上人口比重達到13.5%,人口老齡化程度已高于世界平均水平。當前我國每5名年輕人就需要贍養1位老人,除去其他必要支出,老齡化程度的增高,增加了家庭養老負擔。由此可見,經濟實力很大一部分都取決了家里老人的生活水平,恢復高生育率、維持大家庭的概率,在目前看來微乎其微,老齡化已成為一種常態。
儲蓄水平反映了現代社會的消費能力、物價、以及人們的收入水平,隨著現代化社會的加速發展,人們對于金錢的利用率也逐步上升,當前90后、00后逐步成為中國消費的主力軍,消費觀念發生了根本轉變。隨著消費文化的盛行,居民的消費意愿明顯增強,儲蓄意愿明顯降低。我國國民儲蓄包括居民儲蓄、政府儲蓄及企業儲蓄,而居民儲蓄占比最大,將會多方面影響人口出生率。
面對養老保險對人口出生率的影響,有以下建議:
(1)加速健全完善我國養老保險制度,增加參保人數,擴大社會養老保險覆蓋率,推動機關事業單位養老保險制度優化改革。實現新型農村社會養老保險和城鎮居民社會保險制度全覆蓋,減輕家庭養老負擔,更有利于改善我國人口出生率現狀。
(2)設置合理的養老保險繳費率,增加對養老保險的征繳力度,改善對養老保險的管理。延長工作年限,試點推行彈性退休制度,給予老人可靠的收入來源,減輕社會的養老保險負擔。
面對儲蓄率對人口出生率的多方面影響,有以下建議:
(1)當人們的收入水平高于消費水平時,多余部分便會作為儲蓄,納入居民儲蓄的范疇,而居民的收入水平是承擔家庭及其他部分支出的主要來源。因此改善居民收入水平有利于提高儲蓄率。
(2)市場物價水平作為居民消費的主要影響因素,市場物價水平的上漲將會導致居民消費水平增加,進而影響人們的儲蓄意愿。因此國家應該盡快采取措施,充分發揮市場機制作用和政府宏觀調控的有機結合作用。
(3)銀行的存款利率作為銀行吸收存款的一個經濟杠桿,存款利率的提高有利于吸引國民儲蓄,提高國民儲意愿,從而增加儲蓄率。
(4)建立完善的社會保障制度,降低人們對未來支出的不確定性。其是刺激消費需求的前提條件,也是影響我國居民行為的體制性因素。體制因素對居民儲蓄的影響程度難以量化,卻是可以通過居民收入間接影響居民儲蓄。
本文通過廣義回歸模型對出生率下降的影響因素進行分析,發現養老保險、儲蓄率、性別比、避孕普及率是影響出生率變化趨勢的重要因素。再根據BP神經網絡預測出2020年的出生率8.8519%與實際8.5%接近,驗證了模型的準確性。綜上所述,本文對研究出生率下降過快有較好的參考價值。