王葉WANG Ye
(安徽財經大學統計與應用數學學院,蚌埠233000)
新中國成立以來,我國人口總量持續增長,近年來雖然人口增速放緩,但人口問題始終是中國的一個大問題,人口基數多,人均耕地面積少,人均占有資源不足是我國的基本國情。從本質上來說,人口問題是發展問題,會制約我國的發展。要有效控制人口增長,前提是要了解人口數量的變化規律,需要建立合適的人口預測模型,進行較為準確的預測。
國內目前有很多學者采用不同的方法來預測中國的人口總量。涂雄苓(2009)分別利用指數平滑法和ARIMA 時間序列模型對中國人口數量進行預測, 并將二者的預測結果進行比較,得出最優預測模型是ARIMA(2,2,1)模型[1];韓紹庭(2014)運用了多元線性回歸預測和ARIMA 預測,發現多元線性回歸模型的預測精度更高[2];李利利(2014)在綜合考慮了自然資源、環境條件等因素的情況下,建立了Logistic 模型對中國人口進行預測[3]。經過學者不斷研究發現,單一的預測方法存在著很多的缺陷和不足。Bates和Granger 在1969 年提出了組合預測方法,它是將各個單一預測方法看成一個個包含著不同信息的片段,通過將各項信息集成后分散單項預測的不確定性和減少總體不確定性,從而提高預測精度[4];陳華友和劉春林通過引進誘導有序加權算術平均(IOWA)算子,這是一種以誤差平方和最小為準則的組合預測模型,并給出了IOWA 權向量的確定的數學規劃方法[5]。該模型提出了一種新的賦權思想,根據各單項預測方法在各時點上的擬合精度的高低進行有序賦權,優先給予預測精度最高的單項預測方法最高的賦權系數。
因此,為了更準確的預測中國人口總量,本文采用基于IOWA 算子的組合預測模型對我國人口總量進行預測。首先分別采用多元線性回歸模型、ARIMA 模型和二次指數平滑預測法這三種預測方法對中國的人口進行單項預測,然后建立基于IOWA 算子的組合預測模型來分析所建立的組合預測模型的優越性。在此基礎上,使用IOWA 算子組合預測模型對我國未來五年的人口總量進行預測,以此來分析我國的人口總量及其增長情況。

則稱函數fw是由v1,v2,…,vm所產生的m 維誘導有序加權平均算子,即IOWA 算子。其中v-index(i)是v1,v2,…,vm中按照從大到小的順序排序后第i 個大的數的下標,其中是加權向量,滿足。從上述概念中可以看出IOWA算子是對誘導值v1,v2,…,vm按從大到小的順序排序后所對應的a1,a2,…,am中的數進行有序加權平均,ωi與ai的大小和位置無關,而是與其誘導值所在的位置有關。
選擇不同預測方法在各個時點上的預測精度作為該方法的誘導值,其中預測精度為:

其中,i=1,2,…,m;t=1,2,…,N,vit表示第i 種預測方法在第t 時刻的預測精度,xt為第t 時刻的實際值,xit表示第i 種預測方法在第t 時刻的預測值。此時,m 種預測方法在t 時刻的預測精度與其預測值構成了m 個二維數組:

于是,N 期總的組合預測誤差平方和S2為:


IOWA 算子組合預測法通過各單項預測法在各個時點上預測精度的高低按順序賦權,并以誤差平方和最小為準則建立組合預測模型,符合實際需要,所以本文采用IOWA 算子的組合預測模型。
筆者選取2000~2018 年之間24 年的全國總人口(y)作為被解釋變量,人均GDP(x1),城鎮化率(x2),初中畢業生人數(x3),城鄉收入差距(x4),人均受教育年限(x5)以及時間t 作為解釋變量。在導入數據后,利用R 軟件進行多元線性回歸模型,逐步回歸后,剔除一些不顯著變量,最終得到如下回歸模型:

各個自變量的系數均通過顯著性檢驗,R2=0.9969,F統計量的值為32020,p 值為0,說明在0.05 水平下回歸方程整體顯著。模型的預測值和預測精度見表1。(注:***表示在0.05 水平下顯著)
ARIMA 模型是以平穩隨機序列為前提建模的,經過對原序列以及各階差分數據進行ADF 檢驗后,發現二階差分序列平穩,并通過觀察其自相關圖和偏自相關圖以及比較模型的R2,統計量t 和AIC 準則,最后確定建立ARIMA(0,2,0)模型,模型的預測值及預測精度見表1。
指數平滑法是在時間序列統計模型的基礎上進行預測的方法。指數平滑法分為一次指數平滑法和多次指數平滑法。一般情況下,運用最多的是二次指數平滑法,其公式為:

對于以上三種模型的預測結果,選取2000~2018 年的預測數據建立組合預測模型。其中三種預測方法的各項預測結果如表1 所示。
由于要建立誘導(以預測精度作為誘導值)有序加權算術平均(IOWA)組合預測模型,將三種預測模型在樣本期(2000-2018 年)各時點按照預測精度由大到小的順序重新排列,得到預測精度最高、預測精度次高和預測精度最差的誘導預測模型對應的預測值和預測精度,見表2。
根據各單項預測精度值和誤差,建立基于誤差平方和最小的組合預測模型,三種單項預測的誤差信息矩陣為:

使預測誤差平方和最小的誘導有序加權算術平均組合預測模型:


表2 按照精度從大到小排序的預測值與精度

表1 三種單項預測預測值與精度

利用LINGO11 解得最優權重系數為:ω1=0.684,ω2=0.283,ω3=0.033。根據最優權重系數及IOWA 算子組合預測模型,得出各年組合預測值見表1,以及各年組合預測值的預測精度見表2。
結合各單項外推預測計算出2019-2023 年的各單項預測值,再乘以各單項預測方法的最優權重系數求和,即可計算出我國人口總量的后五年預測值,見表3。
由表3 可知,未來幾年我國人口仍在持續不斷地增長,到2023 年人口總數會達到142854 萬人,從預測結果可以看出我國由于人口基數過大,短期一段時間內人口仍呈增長趨勢,人口發展問題仍是未來幾年的工作的重點。

表3 2019-2023 年全國人口預測值
本文在回顧誘導有序加權平均(IOWA)算子的組合預測模型的理論基礎上,首先分別采用了多選線性回歸模型、ARIMA 模型及二次指數平滑三種單項預測模型對我國2000-2018 年期間的人口總量,然后建立以單項預測法預測精度為誘導值,以誤差平方和最小為準則的IOWA 算子的組合預測模型。預測結果顯示,由于我國人口基數較大,在未來的幾年中,人口依然處于持續增長階段,中國在發展過程中的人口問題依然是一個重點問題。