王 亮,滕克難,呂衛民,金永川
(1.海軍航空工程學院a.七系;b.訓練部,山東 煙臺 264001;2.中國人民解放軍 91681部隊,浙江 寧波 315731)
灰色系統理論是我國學者鄧聚龍于20世紀80年代創立的一種處理“部分信息已知,部分信息未知”的“小樣本,貧信息”不確定系統的理論,其中灰色預測建模技術是灰色系統最重要的內容之一,也是預測理論體系中一個新的研究分支[1]。GM(1,1)模型是灰色預測技術的基礎模型,在其發展過程中得到了深入的研究,并有很多學者提出了不少改進方法,主要包括:殘差修正法[1]、背景值構造法[2]、中心逼近法[3]、時間響應函數法[4]等。雖然這些方法在一定程度上提高了模擬與預測精度,但始終無法克服GM(1,1)模型利用離散方程進行參數估計,而利用連續時間響應方程進行預測造成的跳躍性誤差。2005年,謝乃明[5]提出了離散灰色預測模型,將參數估計和預測模型統一為離散形式,有效地避免了由離散序列到連續方程造成的誤差。之后有學者對DGM(1,1)模型進行了進一步的優化與改進。姚天祥等[6]針對經典DGM(1,1)模型的不足,研究了離散灰色模型選取不同初始迭代點的模擬數據增長率特點,并提出了兩類分段修正離散灰色模型。劉衛鋒等[7]通過選取三種不同修正形式初始迭代值,分別建立了三種優化離散灰色模型。李偉等[8]針對傳統DGM(1,1)模型建模過程中假定原始數據序列服從近似指數增長規律,且以數據序列的第1個數據保持不變得出預測結果的缺陷,利用組合函數“對數—冪函數”對原始數據進行處理,使其符合灰色預測模型的建模規律,并引入遺傳算法尋求離散灰色模型初始迭代值的最優解。但實際上傳統的GM(1,1)與DGM(1,1)模型在工程應用中仍存在一些共同的缺陷與弊端。
本文分析了GM(1,1)及DGM(1,1)模型對數據要求上的限制,指出對于非定值增長的數據序列,GM(1,1)與DGM(1,1)模型的模擬及預測效果并不理想。考慮到系統行為發展的復雜時變性,為提高對各類型趨勢數據的預測能力,引入非線性時間項,構造了一種拓展的非線性時變參數離散灰色模型(NTDGM(1,1)模型),利用粒子群算法(PSO)優化得到模型中各參數,并說明應用該模型進行建模和預測的步驟。最后通過實例比較該模型與其他模型的模擬及預測精度,結果顯示本文模型對各類型趨勢的數據模擬及預測均具有更高的精度。

由上式可知GM(1,1)模型的模擬數據是一個等比序列,數據序列的增長率為一個定值,而且由于在時間響應序列中假定了x(1)(1)=x(0)(1),在應用中也會導致預測結果精確度不高。同時,由于樣本數據初始值的改變不影響模型的發展系數和模擬值,因此,這也從某種程度上反映了初始值信息的損失。
GM(1,1)模型的離散形式,即離散灰色模型(Discrete grey model,DGM(1,1))為

由上式可知,與GM(1,1)模型相同,利用DGM(1,1)模型計算的模擬序列增長率也是一個定值。而且與GM(1,1)模型一樣,DGM(1,1)模型也假設x(1)(1)=x(0)(1),這將導致初始值信息的丟失。
通過以上分析可知,無論是GM(1,1)還是DGM(1,1)模型的模擬值和預測值始終保持固定的增長率,因此這兩個模型對近似指數規律的數據序列具有較好的模擬和預測效果。但在實際工程應用中,數據序列往往并不具備指數規律,兩種模型的計算誤差均較大。
進一步分析DGM(1,1)模型可以看出,該模型中參數β是固定值,即表明DGM(1,1)模型適用于線性時不變系統的分析建模。但是在工程技術領域中,系統行為序列自身及不同行為序列間的相互作用導致系統輸出序列呈現出復雜的非線性,而且系統隨著時間的推移,其參數及結構也不斷發生演化,因此利用恒定參數對現實系統行為進行模擬和預測是不合理、不科學的。為克服這種不足,本文將非線性時變參數引入,代替傳統DGM(1,1)模型中的恒定參數,構造一種拓展的非線性時變參數灰色離散預測模型。

為拓展的非線性時變參數灰色離散預測模型(NT-DGM(1,1))。
該模型主要由三部分構成:第一部分稱作趨勢項,為(β1+β2sin(β3k+β4))x(1)(k),引入非線性時變正弦函數,通過4個參數的變化實現對系統行為總體趨勢的模擬及預測;第二部分稱作新信息項,為β5x(0)(k),主要表現了最新信息對系統行為的影響;第三部分稱作調整項,為β6k2+β7k+β8,對模型的模擬精確度進行進一步調整。同時,令 x(1)(1)=x(0)(1)+ε,利用參數ε修正x(1)(1),以解決初始值信息丟失的問題。
鑒于模型的復雜性,本文利用粒子群算法計算模型的各個參數。
粒子群算法[9.10](PSO)最早是由Eberhart和Kennedy于1995年提出,它的基本概念源于對鳥群覓食行為的研究。設想這樣一個場景:一群鳥在隨機搜尋食物,在這個區域里只有一塊食物,所有的鳥都不知道食物在哪里,但是它們知道當前的位置離食物還有多遠。那么找到食物的最優策略是什么呢?最簡單有效的就是搜尋目前離食物最近的鳥的周圍區域。
PSO從這種模型中得到啟示并用于解決優化問題。PSO中,每個優化問題的解都是搜索空間中的一只鳥。我們稱之為“粒子”。所有的粒子都有一個由被優化的函數決定的適應值(fitness value),每個粒子還有一個速度決定他們飛翔的方向和距離,然后粒子們就追隨當前的最優粒子在解空間中搜索。
PSO初始化為一群隨機粒子(隨機解)。然后通過迭代找到最優解。在每一次迭代中,粒子通過跟蹤兩個“極值”來更新自己。第一個就是粒子本身所找到的最優解,這個解叫做個體極值pBest。另一個極值是整個種群目前找到的最優解,這個極值是全局極值gBest。另外也可以不用整個種群而只是用其中一部分作為粒子的鄰居,那么在所有鄰居中的極值就是局部極值。其數學描述如下:
設搜索空間為D維,總粒子數為n。第i個粒子位置表示為向量Xi=(xi1,xi2,…,xiD),第 i個粒子迄今為止搜索到的最優位置為Pi=(pi1,pi2,…,piD),整個粒子群迄今為止搜索到的最優位置為 Pg=(pg1,pg2,…,pgD),第i個粒子位置的變化率(速度)為向量Vi=(vi1,vi2,…,viD)。每個粒子的位置按如下公式進行變化:

其中,c1,c2為正常數,稱為加速常數;rand()為[0,1]之間的隨機數;ω為慣性權重。公式由三部分組成,第一部分是粒子先前的速度,說明了粒子目前的狀態;第二部分是認知部分,表示粒子本身的思考;第三部分為社會部分。三個部分共同決定了粒子的空間搜索能力。第一部分起到了平衡全局和局部搜索的能力;第二部分使粒子有了足夠強的全局搜索能力,避免局部極小;第三部分體現了粒子間的信息共享。在這三部分的共同作用下粒子才能有效地達到最好位置。
利用PSO計算NTDGM(1,1)模型中各個參數,以模擬值與原始值的總絕對百分誤差為適應度函數:

綜上所述,基于粒子群算法的非線性時變參數離散灰色預測模型的建模及求解過程可分為如下步驟:
(1)以(11)式作為適應度函數,利用PSO算法求解NTDGM(1,1)模型中各個參數,算法終止條件設置為最大迭代次數。
(2)將各個參數帶入(9)式,計算 x?(1)(k)的數值解,k=1,2,…,n。
(3)利用累減還原算子計算 x?(0)(k),k=2,3,…,n 。
算例1:文獻[11]研究提出了一種拓展的DGM(1,1)模型,但是并未考慮系統行為發展的非線性特點,利用其算例對比分析兩種模型的模擬效果,NTDGM(1,1)1模型中各參數利用粒子群算法得到,令加速常數c1=c2=2,慣性權重ω設定為0.8,粒子數設定為60,迭代次數為600,并循環200次,得到各模型結果如下表所示。圖1表示利用粒子群算法使適應度函數最小時,適應度函數值(總絕對百分誤差)的收斂情況。

表1 與文獻[11]對比各模型模擬預測值及平均絕對百分誤差(%,MAPE)

圖1 適應度函數收斂情況
由表1可以看出,相對傳統GM(1,1)模型和文獻[11]提出的模型,本文提出的NTDGM(1,1)模型對13個數據的模擬預測值的平均絕對值相對誤差僅為2.283%,大幅提高了精度。另外從圖1中可以看出,大約在迭代360次左右時,適應度函數值(總絕對百分誤差)逐漸收斂為0.2967(29.67%)。
算例2:文獻[12]研究提出了一些特殊序列的改進的DGM(1,1)模型,并給出了幾種模型的比較,本文以該文獻所給出的算例進行驗證。
利用粒子群算法計算本文所提出模型的參數,令加速常數c1=c2=2,由于數據趨勢各不相同,為得到更精確地預測模型,本文將粒子數設定為100,迭代次數為600,并循環500次,慣性權重ω從0.4到1.2分別進行優化計算,得到各類型數據序列的模擬結果如表2所示。
由表2可以看出,相對于傳統的DGM(1,1)模型以及文獻[12]提出的DDGM(1,1)和IDGM(1,1)模型,本文提出的拓展非線性時變參數灰色離散預測模型的模擬精度極高,對各種類型趨勢的數據均具有極好的模擬能力。對比算例1還以可看出,對于只有幾個數據(算例2中每類數據序列只有5個數據)的序列進行模擬預測時,NTDGM(1,1)模型基本可以完全一致的模擬預測出原始數據序列。
本文分析了傳統的GM(1,1)及DGM(1,1)模型的模擬數據的增長率是一個定值,指出對非近似指數增長的數據序列,GM(1,1)與DGM(1,1)的模擬機預測效果較差。為解決實際工程中系統行隨時間變化的復雜性,針對離散灰色模型參數恒定的缺陷,通過引入非線性時變項,并加入新信息構造了非線性時變參數離散灰色預測模型,鑒于模型的復雜性提出利用PSO算法求解模型參數,通過2個算例的對比分析可以看出NTDGM(1,1)模型很大程度上提高了模擬精度,特別是對“貧信息,少數據”的系統,幾乎可以完全模擬各種類型趨勢的數據序列。

表2 與文獻[12]對比各模型模擬預測值及平均絕對百分誤差(%,MAPE)
[1]劉思峰,黨耀國,方志耕,等.灰色系統理論及其應用[M].北京:科學出版社,2010.
[2]尚軍亮,方敏.一種優化的高精度灰色GM(1,1)預測模型[J].電子與信息學報,2010,32(6).
[3]宋中民,同小軍,肖新平.中心逼近式灰色GM(1,1)模型[J].系統工程理論與實踐,2001,21(5).
[4]劉斌,劉思峰,翟振杰,等.GM(1,1)模型時間響應函數的優化[J].中國管理科學,2003,11(4).
[5]謝乃明,劉思峰.離散GM(1,1)模型與灰色預測模型建模機理[J].系統工程理論與實踐,2005,25(1).
[6]姚天祥,劉思峰,黨耀國.初始值優化的離散灰色預測模型[J].系統工程與電子技術,2009,31(10).
[7]劉衛鋒,何霞,程少華,等.一類優化離散灰色模型及其等價模型[J].西華大學學報,2011,30(1).
[8]李偉,董偉棟,袁亞南.基于組合函數和遺傳算法最優化離散灰色模型的電力負荷預測[J].電力自動化設備,2012,32(4).
[9]肖俊.基于粒子群算法的GM(1,1)模型及其應用[D].武漢:華中科技大學,2005.
[10]吳曉軍,李峰,馬悅,等.均勻搜索粒子群算法的收斂性分析[J].電子學報,2012,40(6).
[11]姚天祥,劉思峰.改進的離散灰色預測模型[J].系統工程,2007,25(9).
[12]曾波,孟偉.面向特殊序列的灰色預測建模方法[M].重慶:重慶大學出版社,2011.