俞華鋒,陳鵬宇
(1.浙江大學,杭州 310027;2.中國地質大學 工程學院,武漢 430074)
灰色預測模型是灰色理論的重要組成部分,而GM(1,1)模型是灰色預測模型中最基本的模型,已經在計算機、管理和圖像工程等領域得到了廣泛應用[1]。GM(1,1)預測模型雖有許多成功的實例,但也存在預測誤差偏大等問題,因此找出影響 GM(1,1)預測模型精度的因素具有非常重要的理論和實際意義[2]。文獻[3-4]中分別指出了GM(1,1)模型背景值構造存在缺陷,但都是以背景值面積不等為基礎,而本文將以灰微分方程與其白化型的對應關系為基礎分析背景值構造的缺陷,并建立加權背景值構造。文獻[5-6]中分別指出了初始值的選擇對模型預測精度存在影響,但未作理論上的分析,因此本文以最小二乘法理論為基礎分析了初始值確定的不足,并對初始值添加修正項。由于背景值構造和初始值的確定對模型預測精度的影響是相互制約的,只有同時對背景值和初始值進行優化,才能達到最佳的預測精度,為此,本文提出了利用模式搜索法在原始數據殘差平方和最小或平均相對誤差最小的目標下求解最佳背景值權值和初始值修正項,實例結果表明優化的GM(1,1)模型提高了預測精度。
令 x(0)為 GM(1,1)建模序列

則GM(1,1)的定義型,即GM(1,1)的灰微分方程模型為

其中a為發展系數,b為灰作用量,是微分方程的參數。
灰微分方程白化型為

GM(1,1)白化型響應式為

由最小二乘法,可以求得參數

1.2.1 背景值構造分析
顯然模型參數是基于灰微分方程(2)利用最小二乘法求取的,而模型的最終預測式是基于灰微分方程白化型(3)求取的,而式(3)直接利用了基于式(2)所得的參數,這就意味著式(3)和式(2)必須是等同的,也就是有下式

此時導數 x(0)(k)對應的點為(ξ,x(1)(ξ)),而 x(1)(ξ)=x(1)(λ)(k)+x(1)(k-1))并不一定成立,所以式(5)中兩等式并不一定同時成立,也就是式(2)與式(3)并不一定等同,為此本文建立了以下加權背景值形式

顯然存在 p 值使 x(1)(ξ)=x(1)(λ)=px(1)(k)+(1-p)x(1)(k-1)成立,只是由于原始數據并不可能是規則序列,因此每兩個數據之間的p值并不一定相同,但是我們可以尋找一個使每個k值下的式(6)最接近于成立的p值,或者說尋找一個使模型預測精度最高的p值,p值的具體求解方法將在下文給出。
1.2.2 初始值確定分析
觀察最小二乘法的計算式
x(0)(k)=-az(1)(k)+b,k=2,3,…,n
根據最小二乘法原理可知,其達到的最小為

而如果以原始數據殘差平方和最小作為預測精度最高的標志,那我們所要達到的目標是

GM(1,1)模型中為了得到式(3)的解,模型默認經過初始值點,這從式(4)也可以看出,此時初始值殘差為零,但由最小二乘法原理可知,使原始數據殘差平方和最小的模擬曲線并不一定過其中一點,也包括初始值點,也就是說此時式(7)并不一定是最小的。同樣如果以平均相對誤差最小作為預測精度最高的標志,模型默認經過初始值點也達不到預測精度最高的目標。因此,我們對初始值添加修正項,表示初始值與最佳初始值之間的差別,此時式(4)變形為

前面本文已經分析得出了GM(1,1)模型的缺陷以及改進的方法,也就是將模型的背景值構造改為

同時對初始值添加修正項

至于權值p和修正項β的求解,本文采用具有全局尋優能力的非線性搜索算法—模式搜索法(pattern search),模式搜索法是Hooke和Jeeves于1961年提出的,這種方法的基本思想是先“探測性移動”尋找最佳點信息,然后用“模式性移動”沿著找到的最佳點信息前進,2種移動交替進行直到步長δ小于事先給定的某個小正數ε為止[7],其基本原理及搜索過程可參考文獻[8-9]。以模式搜索法在原始數據殘差平方和或平均相對誤差最小的目標下搜索最佳權值和修正項,具體操作可利用Matlab模式搜索工具箱,以[0.5,0]點為初始點以式(8)為目標函數進行搜索。

下面以某超市信息管理和決策支持系統中客戶流失預測(數據挖掘)中的相關數據資料建立優化的GM(1,1)模型,原始數據及預測值見表1,其中經模式搜索法求得p=0.479088,β=-1.61×10-4,其中優化目標為原始數據殘差平方和最小。
從表1可以看出,優化后的GM(1,1)模型平均擬合相對誤差從0.915%降低到0.075%,平均預測相對誤差從1.348%降低到0.086%,無論是擬合精度還是預測精度,優化的GM(1,1)模型都比原有GM(1,1)模型有了明顯地提高,顯然模型的改進是有效的。

表1 優化的GM(1,1)模型與原模型預測結果
在信息技術快速發展的今天,人們面對的各種數據越來越復雜;將GM(1,1)模型應用于計算機信息管理、決策支持和數據挖掘過程,對整體規律復雜而在某一時間或空間有很強規律性的數據系列進行挖掘,能取得很好的分析效果;為決策人員提供科學、準確的數字依據,對提高我們決策的準確性、科學性具有重要意義。
本文背景值構造和初始值確定兩個方面分析了GM(1,1)模型的缺陷,建立加權背景值和帶有修正項的初始值,而權值和修正項采用模式搜索法在原始數據殘差平方和或平均相對誤差最小的目標下進行搜索,實例應用結果顯示優化后的GM(1,1)模型提高了預測精度,這對提高GM(1,1)模型的應用價值具有一定的意義。
[1]劉思峰,黨耀國,方志耕.灰色系統理論及其應用[M].北京:科學出版社,2004.
[2]陳永剛,楊定遠,戴文戰.基于背景值改進的GM(1,1)預測模型的研究及其應用[J].浙江理工大學學報,2007,24(4).
[3]譚冠軍.GM(1,1)模型的背景值構造方法和應用(Ⅰ)[J].系統工程理論與實踐,2000(4).
[4]李翠鳳,戴文戰.非等間距GM(1,1)模型背景值構造方法及應用[J].清華大學學報(自然科學版),2007,47(S2).
[5]王忠桃,彭鑫,戴齊.基于初值修正的灰色預測模型的改進及其應用[J].重慶工學院學報(自然科學版),2007,21(10).
[6]黨耀國,劉思峰,劉斌.以為初始條件的GM模型[J].中國管理科學,2005,13(1).
[7]陳炳瑞,馮夏庭,丁秀麗等.基于模式搜索的巖石流變模型參數識別[J].巖石力學與工程學報,2005,24(2).
[8]Yosef S S,Bruce A B.Optimization by Pattern Search[J].European Journal of Operational Research,1994,78(13).
[9]陳寶林.最優化理論與方法[M].北京:清華大學出版社,2000.