袁 泉,曾祥艷
(桂林電子科技大學 數學與計算科學學院,廣西 桂林 541004)
GM(0,N)模型考慮了多個相關因素對預測序列的影響,并且需要的樣本數據量小,彌補了線性回歸模型樣本容量需求較大的不足,因此在預測和決策領域得到廣泛應用[1,2]。GM(0,N)模型常用的參數估計法為最小二乘法[3]:通過誤差平方和的最小化,尋找數據的最佳函數匹配,但是這種對誤差的假設會造成預測模型的結構參數與估值之間的偏離或不一致。
1778年,意大利數學家P.Marchsi提出累積法:利用樣本數據的加權累加直接估計模型參數,不需對誤差進行假設,其幾何意義是尋找樣本點的一條重心線,能保證預測誤差和趨于零[4]。累積法在經濟計量和工程技術模型的結構參數估算中已經得到廣泛應用[5-7]。李鋒等已將累積法引入GM(0,N)模型中,提高了模型的預測精度[8]。但是普通累積法存在越老的數據占的權重越大,越新數據占的權重越小的問題,這與實際情況相悖,在現實中,新的信息對未來發展趨勢的影響更大,所以,本文將基于新息優先的原則,改變累積法的累加順序,使越新的數據占的權重越大,并將其引入GM(0,N)模型的參數估計中,提高模型的預測精度。
在實際情況中,預測需要更多地考慮最新的發展動態,新的信息對未來的影響大于舊的信息[9,10]。新息優先累積法就是基于越新的數據的權重越大,越老的數據的權重越小的原則。
設原始序列為:X={x1,x2,…,xn},定義各階新息優先累積和如下:


依此類推,對任意自然數r,有:

特別地,對序列長度為n的X={1,1,…,1},稱D(r)1為r階基本新息優先累積和,其計算通式為:

GM(0,N)模型是變量導數階數為0的靜態灰色模型,基于原始數據的一次累加生成序列進行建模,一次累加生成可將非負序列生成為遞增序列,從而增加序列的規律性。GM(0,N)模型含有多個變量,能反映多個相關因素對系統行為的影響。

對上述N個序列分別做一次累加生成(1-AGO):

并設Xi(1)為Xi(0)的一次累加生成序列,即:

GM(0,N)模型的定義型方程為:

其中,a,b2,b3…,bN為模型參數。
下面,將新息優先累積法引入GM(0,N)模型的參數估計,假設新息優先累積算子的最高階數為r,由GM(0,N)模型的參數有N個,因此r≥N,對GM(0,N)模型方程(4)兩邊施加1至r階新息優先累積算子,得下列方程組:


其中:

則方程組可以寫為矩陣形式:

對a?的估計分為以下三種情況:
(1)若r=N,A是非奇異矩陣。此時A-1存在,參數估計式為:a?=A-1Y;
(2)若r=N,A是奇異矩陣,且存在r>N使得A是非奇異矩陣。此時取滿足條件最小的r,參數估計為:
a?=(ATA)-1ATY;
(3)若對任意r≥N,A均為奇異矩陣。此時更換原始數據的選取方式即可轉換為情況(1)或情況(2)。
在實際應用中,一般A-1存在,所以,取r=N,參數a,b2,b3…,bN的估計為:

參數估計后,由基于新息優先累積法的GM(0,N)模型的定義型方程(4)即可得到系統行為特征數據序列的預測值
取2009—2012年我國的年水電發電量作為模型的行為特征數據序列,相應年份的水電裝機容量與國內生產總值作為模型的相關因素序列。相關數據見表1所示。其中國內生產總值水電發電量與國內生產總值的數據來源為《中國統計年鑒》,水電裝機容量的數據來源為《全國電力工業統計數據》。

表1 2009—2012年我國的水電發電量及相關因素
原始數據包含一個系統行為特征數據序列與兩個系統相關因素序列:

建立GM(0,3)模型:

基于新息優先累積法估計模型參數有:

可得:

則模型的預測公式為:

由式(8)計算可得模型預測值,對2013—2015年我國水電發電量進行預測,并與基于最小二乘法和基于文獻[9]給出的累積法建立的GM(0,3)模型的預測結果進行對比,見表2所示。

表2 三種參數估計法的GM(0,3)模型的預測結果比較
顯然基于新息優先累積法的GM(0,3)模型的預測值更接近于實際值,預測精度更高。
取2008—2012年我國的社會消費品零售總額作為行為特征數據序列,選取國內生產總值、年末總人口與貨幣供應量這3個因素,作為模型的相關因素序列。相關數據見表3所示。數據來源為《中國統計年鑒》。

表3 2008—2012年我國的社會消費品零售總額及相關因素
建立基于新息優先累積法的GM(0,4)模型,模型的預測公式為:

由式(9)計算得模型預測值,對2013—2015年我國的社會消費品零售總額進行預測,并與基于最小二乘法和文獻[9]給出的累積法GM(0,4)模型的預測結果比較,見表4所示。

表4 三種參數估計法的GM(0,4)模型的預測結果比較
由表4可看出基于新息優先累積法的GM(0,4)模型的預測結果優于另兩個模型,而且短期預測的精度更高。
本文改進了普通累積法,提出以越新的數據的權重越大為原則的新息優先累積法,并建立了基于新息優先累積法的GM(0,N)模型。兩個實例驗證的結果表明新息優先累積法GM(0,N)模型的預測精度相對于最小二乘法及普通累積法有了很大的提升。