楊孝良,周 猛,曾 波
(重慶工商大學a.長江上游經濟研究中心;b.國家智能制造服務國際科技合作基地,重慶 400067)
灰色理論[1]是研究和解決現實世界不確定性問題的主要方法之一,以GM(1,1)模型為基礎的灰色預測模型是灰色理論的重要組成部分,而背景值[2]則是影響灰色預測模型性能的重要參數之一。為了改善灰色預測模型性能,研究人員從不同角度對灰色預測模型背景值的構造方式與優化方法進行了深入研究,并取得了較為豐碩的研究成果。
灰色預測模型背景值構造方式的優化?;疑A測模型背景值z(1)(k)是一個平滑公式,當建模數據變化平緩時,通過緊鄰均值來計算灰色預測模型背景值是合理的;反之,當建模數據具有一定的波動性或振蕩特征時,假如同樣使用z(1)(k)作為灰色預測模型背景值,往往導致灰色預測模型誤差偏大。為了解決該問題,譚冠軍[3]、劉樂[4]、蔣詩泉[5]等對灰色預測模型背景值的構造方法進行研究。如蔣詩泉[5]基于積分幾何意義的視角,利用函數逼近的思想并結合復化梯形公式,提出了一種新的GM(1,1)模型背景值優化方法,所建立的GM(1,1)模型在預測精度上有顯著的提高。
灰色預測模型背景值計算方式的優化?;疑A測模型背景值z(1)(k)=0.5x(1)(k -1)+0.5x(1)(k),換言之,建模時通過x(1)(k -1)與x(1)(k)的均值來作為灰色預測模型的背景值。實際上這是一種簡化處理,為此,肖新平[6]、謝開貴[7]等將z(1)(k)推廣為z(1)(k)=αx(1)(k -1)+(1-α)x(1)(k ),其中α∈(0,1)為待定參數,通常利用遺傳算法等智能尋優算法來確定α的相對最優值,并稱該模型為GM(1,1,α)模型。另外,李俊峰[8]、童明余[9]、劉震[10]等提出用插值和數值積分中的Newton-Cores公式、數值積分中的Gauss公式等來優化和改善灰色預測模型背景值,并將其應用于我國城市內分泌、營養和代謝疾病及免疫病致死人數占死亡總人數的百分比預測,取得了較好的效果。
灰色預測模型背景值構造的非等間距拓展?,F有灰色預測模型主要研究和討論等時距情況下的系統預測問題,實際上等時距只是一種理想情況,現實生活中大量實際應用是非等時距的。因此,如何在非等時距情況下實現灰色預測背景值的合理構造,是構建非等時距灰色預測模型的重要內容[11,12]。為此,李翠鳳等[13]提出用 x(1)(t)在區間[ki, ki+1]中點的實際值來構造非等時距灰色預測模型的背景值;王葉梅等[14]根據灰色模型的指數特性和積分特點,利用非齊次指數函數來擬合一次累加生成序列,提出了一種重構非等間距灰色模型背景值的方法。
灰色預測模型背景值構造方式與計算方法的優化,對提高灰色預測模型模擬及預測性能,拓展灰色預測模型應用范圍,豐富和完善灰色預測模型理論體系,具有重要的理論意義和應用價值。然而,現有灰色預測模型的構造或優化都是建立在x(1)(k -1)與x(1)(k)的基礎之上,這導致灰色預測模型背景值容易受到建模序列中極端數據的影響,從而影響灰色預測模型性能。為此,本文提出一種灰色預測模型背景值構造的新方法。
定 義1:設 非 負 原 始 序 列Y(0)=(y(0)(1),y(0)(2),…,y(0)(m )) ,其中 y(0)(k )≥0,k=1,2,…m ,序列 Y(1)是序列Y(0)的1-AGO生成序列,即:

其中:

則,當k=3,4,…,m,

稱公式(1)為背景值含三參數的新型灰色預測模型,簡稱NGM3(1,1)模型。
定理1:序列Y(0)及Y(1)如定義1所述,p^=(a ,b,c)T為NGM3(1,1)模型的參數列,且:

則稱NGM3(1,1)模型的最小二乘估計參數列滿足:

證明:將數據代入NGM3(1,1)模型,即公式(1),得:

上述方程組的矩陣形式為:

對參數a,b及c的一堆估計值,以-a(y(1)(k)+y(1)(k -1)+y(1)(k -2))/3+kb+c來代替 y(0)(k ),k=3,4,…,m ,可得誤差序列:

設:

使s最小的參數a,b及c應滿足:

即:

根據公式(4),可以做出如下推導:

即:

證明結束。
根據定義1可知:

則:

即:

整理公式(5),可得:

設:

可得:

根據定義1可知,NGM3(1,1)模型的最終還原式可以表示為:


當k=3,4時,根據公式(6)可得:在公式(8)中,y(1)(1)及y(1)(2)=y(1)(1)+y(0)(2)分別稱為NGM3(1,1)模型的初始值,視為已知數據?,F根據公式(6),推導NGM3(1,1)模型的時間響應函數。
將公式(8)代入公式(9),整理得:

類似地,當k=5時,根據公式(6)可得:

將公式(8)及公式(10)代入公式(11),可得:

當k=5時:

即:

根據上文的推導過程可以發現,NGM3(1,1)模型時間響應函數的構成是非常復雜的,很難發現其遞推規律。實際上,構建NGM3(1,1)模型的主要目的是模擬或預測數據(k)及y^(0)(k)。因此,NGM3(1,1)模型時間響應函數并非建模的必須環節。根據公式(7)可知,NGM3(1,1)模型滿足遞推算法,因此可以通過一段簡單的遞推程序來完成NGM3(1,1)模型的建模過程,實現NGM3(1,1)模型的模擬及預測功能。
相對于傳統的灰色預測模型,NGM3(1,1)模型具有如下優點:
(1)NGM3(1,1)模型將背景值參數從兩個拓展至三個,提高了灰色預測模型背景值的平滑效果,弱化了原始序列中的極端數據對灰色預測模型性能的影響??紤]到背景值的光滑度是影響灰色預測模型模擬及預測性能的重要因素,因此,理論上NGM3(1,1)模型性能優于傳統的灰色預測模型。
(3)傳統的灰色預測模型主要應用于小數據建模,隨著樣本量的增加,其預測性能往往變得更差。由于NGM3(1,1)模型背景值的光滑度優于傳統的灰色預測模型,因此基于三參數的背景值構造方法對大樣本數據具有更好的平滑效果,使得NGM3(1,1)模型能夠模擬及預測更大樣本量的應用場合,從而拓展傳統灰色預測模型的適用范圍。
為了測試模型性能,以文獻[15]中的時序數據為基礎,分別建立NGM3(1,1)模型、GM(1,1)模型及CNDGM(1,1)模型,計算這些模型的殘差、相對模擬誤差及平均相對模擬誤差,并對上述模型的模擬性能進行比較。

表1 來自文獻[15]的建模數據
根據表1中的數據建立灰色預測模型,模擬值及模擬誤差如表2所示。表2中,模擬誤差Δk及平均相對模擬誤差的計算過程分為:

公式(16)用于計算灰色預測模型的平均相對模擬誤差。由于初始值不是通過模型計算得到的,視為已知數據,在計算時應剔除。由于NGM3(1,1)模型具有與GM(1,1)模型及CNDGM(1,1)模型不同的初始值個數,因此對于GM(1,1)模型及CNDGM(1,1)模型,n=1;對于NGM3(1,1)模型,n=2,特此說明。

表2 NGM3(1,1)模型、GM(1,1)模型及CNDGM(1,1)模型的模擬值及模擬誤差
從表2可以看出,本文所構建的NGM3(1,1)模型平均相對模擬誤差為2.96%,精度等級接近I級,性能最優;其次為文獻[15]提出的CNDGM(1,1)模型,其模型精度等級為II級;而傳統的GM(1,1)模型精度最差。實例分析說明了NGM3(1,1)模型的背景值參數從兩個增加至三個,能明顯改善灰色預測模型背景值的平滑效果,進一步弱化了原始序列中的極端數據對灰色預測模型性能的影響,因此其模型性能優于傳統的灰色預測模型。
本文擬通過建立NGM3(1,1)模型,對三峽庫區農村居民人均可支配收入進行了預測和分析。表3是2009—2016年三峽庫區農村居民的人均可支配收入情況(數據來源于重慶市2009—2016年統計年鑒)。

表3 三峽庫區2009—2016年農村居民人均可支配收入情況表 (單位:元)
根據表3可知,原始序列Y(0)=(y(0)(1),y(0)(2),y(0)(3),y(0)(4),y(0)(5),y(0)(6),y(0)(7) y(0)(8))=(21.62,22.83,23.74,23.89,24.50,26.88,27.66,26.31,32.44,37.67,39.50)
建立序列Y(0)的NGM3(1,1)模型,模型參數 μ1,μ2, μ3及μ4分 別 為 : μ1=1.0276; μ2=0.0138; μ3=667.3954; μ4=4234.6345
根據公式(7)可知,三峽庫區農村居民可支配收入的NGM3(1,1)模型為:

公式(17)中,當 k=3,4,...,8時,y^(0)(k +1)為模擬數據;當 k=9,10,...時,y^(0)(k +1)為預測數據。根據公式(17),可以計算NGM3(1,1)模型的模擬值及模擬誤差,如表4所示。為了比較NGM3(1,1)模型
的模擬性能,表4中同時列出了序列Y(0)的GM(1,1)模型及DGM(1,1)模型的模擬值及模擬誤差。

表4 NGM3(1,1)模型、GM(1,1)模型及DGM(1,1)模型的模擬值及模擬誤差
為了直觀比較NGM3(1,1)模型、GM(1,1)模型及DGM(1,1)模型對三峽庫區農村居民人均可支配收入的模擬性能,本文用MATLAB分別繪制上述三個模型的平均模擬相對差曲線圖,如圖1所示。

圖1 NGM3(1,1)、GM(1,1)及DGM(1,1)的平均相對模擬誤差對比圖
根據圖1不難發現,GM(1,1)模型及DGM(1,1)模型的平均相對模擬誤差非常接近,前者略高于后者;而NGM3(1,1)模型的平均相對模擬誤差具有絕對優勢,遠優于其他兩個模型。研究結果表明本文所提出的灰色預測模型背景值構造新方法是合理有效的。
根據 公式(17),當 k=9,10,11,12,13,14,15,16,17,可以對2017—2025年三峽庫區農村居民人均可支配收入進行預測,結果如表5所示。
根據表5不難發現,2025年三峽庫區農村居民人均可支配收入預計將達到23614.18元,表明三峽庫區農村居民人均可支配收入近些年來呈現快速增長的趨勢。三峽庫區經濟社會取得了長足的發展,農村居民純收入不斷提高,縮小了與全國平均水平的差距。
灰色預測模型背景值是影響灰色預測模型模擬及預測精度的重要參數。然而,現有灰色預測模型的構造或優化都是建立在參數x(1)(k -1)與x(1)(k)的基礎之上,這導致灰色預測模型背景值容易受到建模序列中極端數據的影響,從而影響灰色預測模型性能的穩定性。為此,本文提出一種含三參數的灰色預測模型背景值構造的新方法,該方法提高了灰色預測模型背景值的平滑效果,弱化了原始序列中的極端數據對灰色預測模型性能的影響。通過案例比較,驗證了基于三參數背景值的新型NGM3(1,1)模型的模擬性能優于傳統以x(1)(k -1)及x(1)(k)為背景值基礎的灰色預測模型。最后,將NGM3(1,1)模型應用于三峽庫區農村居民可支配收入的模擬,模擬精度高達99.72%,進一步驗證了三參數背景值構造新方法的可靠性及有效性。如何對以三參數為背景值的NGM3(1,1)模型進行進一步優化,是下一步的研究問題。

表5 三峽庫區2017—2025年農村居民人均可支配收入情況表 (單位:元)