潘婉彬,黃 磊
(中國科學技術大學 管理學院,合肥 230026)
就業問題一直是廣受關注的重大民生問題。李克強總理在2017年的政府工作報告中指出“大力促進就業創業。完善就業政策,加大就業培訓力度,加強靈活就業、新就業形態的支持?!痹诜e極擴大新增就業崗位的同時,對就業人數的預測也越來越成為政府和學界關注的焦點。近些年,有許多學者已經在就業人數的預測問題上進行了有益的嘗試。喬娜(2009)[1]利用時間序列的Cramer分解定理,建立了確定性趨勢模型和ARIMA模型對我國的就業人數進行預測。朱家明等(2010)[2]則采用主成分分析的方法對我國的就業人數進行預測。劉廣永(2012)[3]運用灰色系統理論,通過建立灰色GM(1,1)模型對我國的城鎮就業人數進行預測。張玉杰和殷寶明(2016)[4]通過建立ARIMA模型對三大產業就業人數及城鎮、農村就業人數分別進行了預測?,F有的對我國就業人數進行預測的研究主要采用的是單項預測方法,該方法的顯著不足是不夠準確,且缺乏穩健性。為此,Bates和Granger(1969)[5]提出了組合預測的思想。組合預測可以綜合各單項預測的優勢,并能得到比單項預測更準確和更穩健的預測結果。
本文采用組合預測的方法對我國的就業人數進行預測,結果表明,相比于單項預測,組合預測可以顯著提高預測精度。此外,本文以同時考慮了數據間相似性和相近性的B型關聯度作為目標函數建立模型,并討論了基于B型關聯度及GIOWA算子的組合預測模型在不同條件下的就業人數組合預測值。
1988年,美國學者Yager首先提出了有序加權平均算子的概念(Yager,1988)[6],并得到廣泛應用。后來,國內學者徐澤水(2004)[7]對其進行了推廣,提出了廣義誘導有序加權平均算子。下面分別對其進行介紹。
定義1:稱滿足下述關系的算子為有序加權平均(OWA)算子:

其 中 ,ω=(ω1,ω2,…,ωn) 為 加 權 向 量 ,并 滿 足0≤ωi≤1(i=1,2,…,n)及而bj則表示數據(a1,a2,…,an)中第j大的數。OWA算子本質上反映的是一種從n維到1維的映射關系:Rn→R。
定義2 :設有二元數對 πi,ai(i=1,2,…,n),稱滿足下述關系的算子為誘導有序加權平均(IOWA)算子:

其中,ω=(ω1,ω2,…,ωn)是與 IOWAω相關聯的加權向量,并滿足0≤ωi≤1(i=1,2,…,n)及 ∑i=1nωi=1。二元數對 πi,ai(i=1,2,…,n)稱為OWA對,第一個分量 πi稱為誘導分量,第二個分量ai稱為數值分量。bj表示(π1,π2,…,πn)中第j大的元素所在的OWA對中的第二個分量。
定義3 :設有二元數對 πi,ai(i=1,2,…,n),稱滿足下述關系的算子為廣義誘導有序加權平均(GIOWA)算子:

其中,ω=(ω1,ω2,…,ωn)是與 GIOWAω相關聯的加權向量,并滿足 0≤ωi≤1(i=1,2,…,n)及二元數對 πi,ai(i=1,2,…,n)和 bj的含義同上,d為非零的實數。
GIOWA算子的特點是二元數對 πi,ai與ωi并沒有直接的關系,ωi只與加權集結過程中順序的第i個位置有關,而且,對數值分量ai的加權集結并不是根據其本身的大小,而是根據誘導分量的πi大小。
GIOWA算子具有以下性質:
(1)置換不變性:設有二元數對 ( π1,a1, π2,a2,…,是其任一置換,
則:


(3)單調性:設有二元數對 (π1,a1, π2,a2,…,和若對于任意的i(i=1,2,…,n),均有 ai≥,則:


在GIOWA算子中,當參數δ取不同值時,可以構造不同的算子,以下是幾種常見的構造方法:
當δ=1時,退化為誘導有序加權平均算子,其形式見式(2)。
當δ→0時,為誘導有序加權幾何平均(IOWGA)算子,其形式為:

當δ=-1時,為誘導有序加權調和平均(IOWHA)算子,其形式為:

設有一時間序列,其實際值為{xt,t=1,2,…,T},此前,采用了n種方法對其進行預測,并記第i種方法得到的預測序列為{xit,t=1,2,…,T}(i=1,2,…,n)。設組合預測中各種單項預測方法的權重為則可以得到組合預測序列t及其誤差序列et。
本文以預測精度hit作為誘導分量πit,其計算公式如下:

因此,根據定義3可知:


其中,ω=(ω1,ω2,…,ωn)是與 GIOWAω相關聯的加權向量,并滿足 0≤ωi≤1(i=1,2,…,n)及為OWA對,yj表示 (h1,h2,…,hn)中第j大的元素所在的OWA對中的第二個分量。
為了方便計算,并考慮到檢驗模型的有效性,本文主要討論式(7)中當δ=1、δ→0和δ=-1這三種情形下的結果。設在時點 t(t=1,2,…,T),權重為 ωi(i=1,2,…,n)的單項預測方法的預測誤差為:
結合式(7)和式(8),可以得到各時點的組合預測誤差et。
當δ=1時:

當δ→0時:

當δ=-1時:

已有的組合預測模型中,根據其預測目標的不同而有不同的目標函數和最優化指標,常見的目標函數和最優化指標包括:Theil不等系數(陳華友,2004)[8]、相關系數(陳華友,2006)[9]、貼近度(楊蕾等,2013)[10]、灰色關聯度(周遠翔等,2016)[11]等。本文以B型關聯度作為目標函數,主要是考慮到B型關聯度兼顧了數據之間的相似性和相近性,因而可以更加準確地衡量數據間的相關程度。
定義4:設時間序列的實際值為{xt,t=1,2,…,T},組合預測序列為{t,t=1,2,…,T},誤差序列為{et,t=1,2,…,T},并有誤差序列的一階差分序列?et=et+1-et(t=1,2,…,T-1),和誤差序列的二階差分序列?2et=令:

則稱 γ為{xt,t=1,2,…,T}和{t,t=1,2,…,T}的B型關聯度。其中:

B型關聯度利用時間序列間的差及其一階和二階差分來衡量兩個時間序列之間的相似性和相近性。顯然,γ的值介于0到1之間,且γ的值越接近于1,表示預測序列{t,t=1,2,…,T}越接近實際值序列{xt,t=1,2,…,T},預測序列的預測效果越好。
通過上述分析,可以建立如下基于B型關聯度及GIOWA算子的組合預測模型:

為了說明上述建立的基于B型關聯度及GIOWA算子的組合預測模型的有效性,本文選取2008—2016年的三大產業的總就業人數進行實證檢驗。表1給出了總就業人數的實際值序列xt和三種單項預測方法:ARIMA(1,1,1)模型預測、Holt指數平滑預測、M估計值穩健回歸預測下的預測序列 x1t、x2t、x3t及其預測精度 h1t、h2t、h3t。

表1 單項預測
從表1可以看到,三種預測方法各有優劣,均在某些時點具有最高精度,這也說明了存在通過組合預測模型進行優化的空間。通過R軟件對上述組合預測模型進行建模,并利用Nelder-Mead最優化方法進行參數估計,在δ=1、δ→0和δ=-1三種情形下的參數估計結果見表2所示。

表2 δ=1、δ→0、δ=-1三種情形下的最優權重
從表2可以看到,在δ=1、δ→0和δ=-1三種情形下的模型最優權重非常接近,說明了本文構建的基于B型關聯度及GIOWA算子的組合預測模型具有穩健性。在估計出組合預測模型的最優權重之后,可以得到組合預測值,見表3所示。
對比表1和表3的結果,可以看到組合預測的效果要好于單項預測。為了更加客觀地說明組合預測的優越性,本文計算了不同預測模型的平均絕對誤差(MAE)、誤差平方和(SSE)、比例平方和誤差(SSE)、均方根誤差(RMSE)和比例均方根誤差(PRMSE),見表4。

表3 δ=1、δ→0、δ=-1三種情形下的組合預測值
從表4可以看出,組合預測模型的MAE、SSE、PSSE、RMSE和PRMSE顯著小于單項預測,說明了本文構建的基于B型關聯度及GIOWA算子的組合預測模型的預測效果要好于單項預測。

表4 預測效果評價指標值
就業是重大的民生問題,對就業人數的預測一直是政府和學界關注的焦點問題。不同于以往研究中采用的多是單項預測的方法,本文借助組合預測的思想,構建了基于B型關聯度及GIOWA算子的組合預測模型對我國的就業總數進行組合預測。研究結果表明,本文構建的基于B型關聯度及GIOWA算子的組合預測模型的預測精度要顯著好于ARIMA(1,1,1)模型、Holt指數平滑模型、M估計值穩健回歸等單項預測方法,并且組合預測模型本身具有良好的穩健性。