張貝貝,李靜文,楊亞楠
(北京信息科技大學 經濟管理學院,北京100192)
事物是普遍聯系的,經濟系統內部各因素之間及它們同外部因素之間存在著錯綜復雜的交互因果關系。對經濟系統的預測僅使用一種預測方法,往往導致信息不夠廣泛,可能會因為忽略某些因素而導致較大的預測誤差,難以進行精確可靠的預測[1]。如果對同一預測問題采用各種不同的預測方法,并加以適當的組合,則能夠充分地利用各種信息,達到分散預測風險、提高預測精度的目的,由此組合預測應運而生。Bates和Granger首次提出組合預測的概念[2],即以某種加權平均的形式將各種不同的單項預測方法進行組合。組合預測模型較之單項預測模型能夠更充分地反映各種預測樣本信息,目前如何有效提高預測精度是預測界的熱點問題,權重系數的確定和集結算子的選擇一直是預測工作者研究的重點和難點。
本文構建的基于IOWA算子的組合預測模型不同于傳統的組合預測模型。傳統的組合預測模型中同一個單項預測方法在樣本區間上各個時點的加權系數是相同的。但是對于同一個單項預測方法而言,不同時點的預測精度“時好時壞”,因而傳統的組合預測方法存在一定的缺陷。本文分別使用三種多參數指數平滑模型預測出觀測值在樣本區間的預測值,對每個單項預測方法在樣本區間上各個時點預測精度的高低按順序賦權,并分別建立以誤差平方和最小和以絕對誤差絕對值之和最小為準則的新的數學規劃模型,進而計算出樣本區間的預測值。最后通過對比預測效果評價體系中的各個指標,表明了組合預測模型的有效性。
指數平滑模型中包含了單指數平滑模型、雙指數平滑模型和多參數指數平滑模型,多參數指數平滑模型包含Holter-Winter無季節模型、Holter-Winter季節加法模型、Holter-Winter季節乘法模型[3]。鑒于多參數指數平滑模型的線性趨勢及季節特性,本文使用三種多參數指數平滑模型分別對樣本區間的觀測值進行預測。
HW無季節模型[4]主要有兩個平滑系數α、β,取值范圍:(0≤α,β≤1),預測模型為:

式中:

如果t=T(最后一期),預測模型為:

其中,aT是截距,bT是斜率。
本文使用Eviews8.0軟件計算原始序列的HW無季節模型預測值,計算結果如下頁表1所示:
HW季節加法模型主要有三個平滑系數α、β和γ,取值范圍:(0≤α,β,γ≤1),預測模型為:

式中:


表1 HW無季節模型預測結果
其中,s是季節周期長度,月度數據,周期為12個月,即s=12;季度數據,周期為4個季度,即s=4。
如果t=T(最后一期),預測模型為:

其中,aT是截距,bT是斜率,cT是季節因子(季節指數)。可以看出他們都是通過平滑得到的。
本文使用Eviews8.0軟件計算原始序列的HW季節加法模型預測值,計算結果如表2所示:

表2 HW季節加法模型預測結果
HW季節乘法模型[4]主要有三個平滑系數α、β和γ,取值范圍:(0≤α,β,γ≤1),預測模型為:

式中:

其中,s是季節周期長度,月度數據,周期為12個月,即s=12;季度數據,周期為4個季度,即s=4。
如果t=T(最后一期),預測模型為:

其中,aT是截距,bT是斜率,cT是季節因子(季節指數)。
本文使用Eviews8.0軟件計算原始序列的HW季節乘法模型預測值,計算結果如下頁表3所示:
定義1[5]:設OWAW:Rm→R為m元函數,T是OWAW有關的加權向量,并且滿足:

式中,bi是a1,a2,a3,…,am中按從大到小的順序排列的第i個大的數,則稱函數OWAW是m維有序加權平均算子,簡記為OWA算子。
例如,設w1=0.3,w2=0.4,w3=0.2,w4=0.1則由定義1可得:

實際上,OWA算子是對m個數a1,a2,a3,…,am按從大到小的順序排序后的序列進行有序加權平均,系數wi與ai的數值無關,而僅與ai的大小順序有關。
定 義 2[6]:設v3,a3>,…,

則稱函數IOWAW是由v1,v2,v3,…,vm所產生的m維誘導有序加權平均算子,簡記為IOWA算子,vi稱為ai的誘導值,v-index(i)是v1,v2,v3,…,vm中按從大到小的順序排列的第i個大的數的下標,W=(w1,w2,w3,…,wm)T是OWAW有關的加權向量,滿足i=1,2,3,…,m。
例如,設<8,3> ,<4,7>,<2,3>,<6,1>為4個二維數組,OWA的加權向量為:W1=0.4,W2=0.25,W3=0.15,W4=0.2
則由定義2可得:

由此可知,IOWA算子是對誘導值v1,v2,v3,…,vm按從大到小的順序排序后所對應的a1,a2,a3,…,am中的數進行有序加權平均,wi與數ai的大小和位置無關,而僅與其誘導值vi所在的位置有關。

表3 HW季節乘法模型預測結果

式中:Ait是第i種預測方法在t時刻的預測精度指標,顯然Ait∈(0,1);xt是某一序列的觀測值,xit是第i種預測方法在t時刻的預測值,i=1,2,3,…,m;t=1,2,3,…,n。本文把預測精度Ait看成預測值xit的誘導值,因而第t時刻的m單項預測方法的預測精度和其對應的預測值就構成了m個二維數組:<a1t,x1t>,<a2t,x2t>,<a3t,x3t>,…,<amt,xmt>,設W=(w1,w2,w3,…,wm)T是各種預測方法在組合預測中的OWA加權向量,將m中單項預測方法在t時刻的預測精度a1t,a2t,a3t,…,amt按從大到小的順序排列,設a-index(it)為第i個大的預測精度的下標,根據定義2有:

則式(2)稱為由預測精度序列a1t,a2t,a3t,…,amt所產生的IOWA組合預測值。則n期總的組合預測誤差平方和S和n期總的絕對誤差絕對值之和D可表示如下:

因此,以誤差平方和最小為準則的IOWA組合預測模型可表示如下:

以絕對誤差絕對值之和最小為準則的基于IOWA組合預測模型可表示如下:

利用非線性規劃求解上述模型可以分別得出wi(i=1,2,…,m)的值,即組合預測中的OWA加權向量wi(i=1,2,…,m)使得組合預測總的誤差平方和或絕對誤差絕對值之和最小。
本文選用中關村示范區月度累計數據進行建模預測分析,缺失數據采用比例插補法補全[7],搜集數據時間段為2014年3月到2017年4月,實際計算中使用的是指標的同比增長率,因而數據同比增長率的長度為2015年3月到2017年4月。本文對比分析組合預測模型與各單項預測模型預測效果評價指標體系的各個指標,并預測2017年5月至2017年9月五個月的中關村高新技術園區總收入。
根據表1至表3的預測結果,并根據式(1)計算出上述三種單項預測模型的預測精度。如表4所示:

表4 單項預測模型預測結果及其預測精度
本文三種單項預測模型均取得較好的預測效果,其中,HW季節加法模型平均預測精度>HW季節乘法模型平均預測精度>HW無季節模型平均預測精度。
本文選取三種多參數指數平滑模型進行中關村高新技術園區總收入同比增速的組合預測。按式(2)計算IOWA組合預測值,具體計算過程如下所示:

同理:

3.2.1 誤差平方和最小準則下的IOWA組合預測
將上述公式帶入式(3)中,可以得出誤差平方和最小準則下最優化模型:

其中xt(t=1,2,…,26)是序列的原始數據同比增速值,使用EXCEL中的規劃求解,或者利用MATLAB最優化工具箱,可以得出誤差平方和最小準則下的IOWA組合預測模型的最優權系數為:

由此根據最優權系數可以計算出誤差平方和最小準則下的IOWA的組合預測模型在各個時期的組合預測結果,如表5所示。
3.2.2 絕對誤差絕對值之和最小準則下的IOWA組合預測
將上述公式帶入式(4)中,可以得出誤差平方和最小準則下最優化模型:

同理,可以得出絕對誤差絕對值之和最小準則下的IOWA組合預測的最優權系數:w1=1,w2=0,w3=0

表5 誤差平方和最小準則下的IOWA的組合預測結果
得出的最優權系數表明,各個時點的組合預測值為預測精度最大者所對應的單項預測值。由此根據最優權系數可以計算出絕對誤差絕對值之和最小準則下的IOWA的組合預測模型在各個時期的組合預測結果,如表6所示:

表6 絕對誤差絕對值之和最小準則下的IOWA的組合預測結果
3.3.1 兩準則下IOWA組合預測結果分析
鑒于數學期望反應數據集平均取值大小,標準差反應一個數據集的離散程度,兩者結合能較好地判斷模型預測結果的有效性。本文分別計算兩準則下模型預測精度序列的數學期望和標準差,計算公式如下所示:

其中,E(A)為預測精度序列的數學期望;e(A)為預測精度序列的標準差;Qt為預測精度序列的離散概率分布;At為t時點預測精度。由于對預測精度序列的離散概率分布的先驗信息不確知時[8],可取因此本文中由式(5)和式(6),可以得出兩準則下基于IOWA組合預測模型預測精度的數學期望和標準差,如表7所示:

表7 兩準則下IOWA的組合預測精度指標
比較兩準則下預測精度序列的數學期望和標準差結果可知,兩者數學期望基本相同,而誤差平方和最小準則下預測精度序列的標準差小于絕對誤差絕對值最小準則下預測精度序列的標準差。因此,誤差平方和最小準則下的IOWA組合預測模型更為有效。
3.3.2 組合預測與各單項預測結果分析
由上述分析可知,誤差平方和最小準則下預測效果整體“好于”絕對誤差絕對值之和最小準則下預測效果,因此本文在此基礎上又具體分析了以誤差平方和最小為準則建立的組合預測模型與各單項預測模型的預測結果。由表5中的組合預測數據,可以畫出中關村示范區總收入同比增速和組合預測同比增速的擬合圖,如圖1所示,同時可以畫出中關村高新技術園區總收入和IOWA組合預測總收入的擬合圖,如圖2所示:

圖1 組合預測同比增速擬合圖
由模型的計算過程可知,中關村高新技術園區總收入同比增速預測值是通過IOWA組合預測模型計算獲得,從圖1可以看出同比增速預測值和實際值是非常接近的。中關村高新技術園區總收入的IOWA組合預測值是通過總收入同比增速的IOWA組合預測值計算獲得,從圖2可以看出總收入的預測值和實際值非常接近,兩者的擬合度很高。

圖2 組合預測總收入擬合圖
為了更加明確地反映基于IOWA的組合預測模型與三種單項預測模型之間的優劣,本文計算了各模型在觀測樣本各個時期的平均相對誤差的絕對值,具體的計算結果如表8所示:

表8 各時期的平均相對誤差絕對值 (單位:%)
從表8中可以看出,基于IOWA的組合預測模型在各個時期的平均相對誤差絕對值(0.70%)均小于三種單項預測模型,能有效降低預測誤差,達到較好預測效果。
為了更精確地反映基于IOWA的組合預測模型與各單項預測模型的整體預測效果,本文同時選取SSE、MAE、MAPE、MSE、RMSE、MSPE等預測效果評價指標作為評價組合預測模型與各單行預測模型預測好壞的依據,其中xi為i時間的實際值,xi為i時間的預測值。
通過比較評價指標體系的各項計算值,可以明顯地看出基于IOWA組合預測相對于其他三種單項預測模型的優勢。計算結果如表9所示:

表9 預測效果評價指標體系
從表9計算數據來看,本文使用的基于IOWA的組合預測模型的各項誤差指標值均明顯低于其他三種單項預測模型的誤差計算結果,從而表明本文使用的基于IOWA的組合預測模型要優于HW無季節、HW季節加法和HW季節乘法單項預測模型,從表1和表5可以得出,基于IOWA組合預測模型的平均預測精度相對于HW無季節模型、HW季節加法模型和HW季節乘法模型分別提高14.73%、7.99%和9.32%,模型的預測精度明顯提高。
根據文獻[9] 中提及的預測連貫性原則,可以計算樣本在未來區間[n+1,n+2,……] 的預測值。計算公式如下所示:


t=n+1,n+2,n+3,…;wi(i=1,2,3,…,m)為IOWA組合預測最優權系數。
IOWA組合預測值在預測區間[n+1,n+2,…] 上的誘導值,即為預測精度序列ait(i=1,2,…,m,t=n+1,n+2,…)。即若要對未來k期進行預測,則預測區間上n+k期的預測精度根據最近k期的擬合平均精度確定,即:

因而,可以得出中關村高新技術園區2017年5月至2017年9月的預測值,如表10所示:

表10 未來5期預測值