葉雪強,桂預風
(武漢理工大學理學院,武漢430070)
長江是我國內河水運最重要、運輸規模最大的通航河流。自2003年三峽船閘投入運行以來,過閘貨運量快速增長,2014年三峽船閘過閘貨運量達到近1.2億噸。長江三峽船閘過閘貨運量常應用于各種經濟規劃分析中,并作為衡量內河航運發展程度的一項重要指標[1]。
目前,貨運量的預測方法主要有時間序列分析法,回歸分析法,彈性系數法,平均增長率法,灰色系統預測法等。杜嘉[1]采用彈性系數法、平均增長率法、回歸分析法、曲線擬合法分別預測三峽過閘貨運量,并根據各種預測方法的特點及適用場合,最終確定四種過閘貨運量預測方法的權重系數。趙奇志[2]采用回歸分析模型、二次指數平滑法、抽象方式選擇模型、增長系數法分別預測廣西內河貨運總量,最后通過綜合比較分析,最終預測出西津水利樞紐過閘貨運量。馬海峰[3]采用平均增長率法預測三峽船閘過閘貨運量。
本文根據三峽船閘過閘貨運量的歷史數據,建立了GM(1,1)預測模型和線性回歸預測模型,并提出了熵值法組合預測模型。由于熵值法確定組合預測權系數不可避免地會碰到一些極端值,如相對誤差為零,或者數據出現異常點等,而熵值法確定組合預測權系數要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,從而提出了改進熵值法組合預測模型,并對三峽船閘過閘貨運量進行預測。
1.2.1 基于熵值法的組合預測模型權系數的確定方法[4]
組合預測綜合利用各種單項預測方法所提供的信息,以適當的加權平均形式得出組合預測模型。組合預測核心的問題就是如何求出組合預測加權平均系數,使得組合預測模型更加有效地提高預測精度。本文從信息論的觀點出發,根據各單項預測方法預測誤差序列的變異程度,利用信息熵的概念。計算出組合預測加權平均系數。
設第i種單項預測方法第t時刻相對誤差為:

用熵值法確定組合預測加權系數的步驟如下:
(1)將各種單項預測方法預測相對誤差序列歸一化。即計算第i種單項預測方法第t時刻的預測相對誤差的比重:

(2)計算第i種單項預測方法的預測相對誤差的熵值hi:

其中k>0為常數。對第i種單項預測方法而言,如果pit全部相等,即,那么hi取得極大值klnN,這里取k=1 lnN,則有0≤hi≤1。
(3)計算第i種單項預測方法的預測相對誤差序列的變異程度系數:

(4)計算各種預測方法的加權系數:

(5)計算組合預測值:

1.2.2 基于改進熵值法的組合預測模型權系數的確定方法
傳統的熵值法確定權系數不可避免地會碰到一些極端值,如相對誤差為零,或者數據出現異常點等。而傳統的熵值法確定權系數要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,或者人為主觀的定義0ln0=0,是為了保證數據的完整性和確定權系數的客觀性,等于零的數值又不能直接刪去,因此需要對該相對誤差進行變換,從而對熵值法進行改進。為了縮小極端值對權系數的影響,并保證賦權的客觀性,可以對相對誤差序列進行變換,然后再按照傳統熵值法的步驟(1)至步驟(5)進行計算。相對誤差變換公式為:

其中:

Markov鏈是一種特殊的隨機過程[5],其可以根據系統當前時刻的狀態推求下一時刻的狀態概率分布,進而得到下一時刻的狀態。其基本原理是:每個系統的狀態可用隨機變量表示,并對應一定的狀態概率,當某一時刻狀態轉移到下一時刻狀態時,同時在這個過程中存在概率的轉移,即轉移概率[6]。
假設有個n狀態,并且狀態的個數是可數的,那么狀態Ei經一步轉移到狀態Ej都有可能發生,則這個過程可能發生的概率稱為一步轉移概率pij。所有的狀態一步轉移概率構成一步轉移矩陣P(1)。Markov鏈預測模型[7]可表示為:

其中,P0為初始時刻的概率分布,Pt+1是t+1時刻的概率分布,P(1)為一步轉移概率矩陣,其表達式為:

式中:pij為一步轉移概率,
根據改進熵值法組合預測模型預測結果,選擇適合的指標(這里采用預測結果的相對誤差)劃分狀態空間;計算其一步轉移頻數矩陣,求出其一步轉移概率矩陣;利用Markov鏈預測模型對改進熵值法的預測結果進行修正。
本文根據三峽船閘過閘貨運量2003—2014年數據的變化趨勢,先利用GM(1,1)模型和線性回歸預測模型分別進行預測;之后再利用組合預測模型對年過閘貨運量進行預測,并對各種方法的預測結果進行對比分析;最后通過Markov鏈模型對預測結果進行修正。三峽船閘過閘貨運量2003—2014年數據(記為y,單位:萬噸)見表1所示。

表1 預測方法的預測擬合值
3.1.1 GM(1,1)模型
灰色系統建模是通過數據序列建立微分方程來擬合給定的時間序列,從而對數據的發展趨勢進行預測[8]。
設為原始數據序列:

將原始序列進行一次累加,得到:

GM(1,1)模型的時間響應序列為:

還原值為:

利用GM(1,1)模型建模可以得出三峽船閘過閘貨運量的GM(1,1)模型的時間響應序列為:

利用GM(1,1)模型的時間響應序列進行預測并對預測結果進行一次累減后的數列即為運用GM(1,1)模型對過閘貨運量的預測估計值(記為x1),見表1所示。
通過對模型的檢驗,得出以下結果:
(1)殘差檢驗:相對殘差φˉ=6.94%>10%,認為其預測精度較高。
(2)關聯度檢驗:關聯度r=0.7243>0.6,認為其模型可以接受。
(3)后驗差檢驗:小殘差概率p=1>0.95,認為其模型為小殘差概率合格模型。
3.1.2 線性回歸模型
一元線性回歸模型[9]的數學形式:

其中,ε是隨機誤差,通常假定ε~N(0,σ2)。
由于過閘貨運量數據隨年份呈線性趨勢,故建立一元線性回歸模型:
通過對模型的檢驗,得出以下結果:
(1)回歸系數的顯著性檢驗:β1顯著性檢驗的t值為t=13.6953,其對應的p值p=0<0.05,認為β1顯著性不為零。
(2)線性回歸方程的顯著性檢驗:線性回歸方程的顯著性檢驗的F值為F=187.5624,其對應的p值p=0<0.05,認為線性回歸方程顯著。
3.2.1 基于熵值法確定權系數的組合預測模型
在利用以上兩種單項預測模型計算出預測擬合值后,根據熵值法來確定兩種單項預測模型的組合權系數,得到的權系數向量為:
ω=(0.4562,0.5438)
從而得到相應的熵值法組合模型為:

利用熵值法組合預測模型(記為組合模型1)得到的預測擬合值(記為x3)見表1所示。
3.2.2 基于改進熵值法確定權系數的組合預測模型
根據改進熵值法來確定兩種單項預測模型的組合權系數,得到的權系數向量為:
ω=(0.6054,0.3946)

從而得到相應的改進熵值法組合預測模型為:利用改進熵值法組合模型得到的預測擬合值(記為x4)見表1所示。
比較兩種單項預測模型和兩種組合模型的擬合精度,以預測誤差平方和作為反映預測精度的一個指標。通過計算兩種單項預測模型和兩種組合模型的預測誤差平方和(結果見表2所示)可以得出,熵值法組合預測模型精度低于改進熵值法組合預測模型精度,但高于兩種單項預測模型的精度,由此可見,改進熵值法能有效的減少預測誤差,提高預測精度。預測誤差平方和公式為:


表2 各種預測模型的預測誤差平方和
計算改進熵值法組合預測模型對過閘貨運量的預測相對誤差,計算結果見表3所示。根據預測相對誤差的具體數值,劃分的Markov狀態空間間為:(1)狀態空間E1為預測相對誤差ε∈[-18%,-6%),屬于預測偏低狀態;(2)狀態空間E2為預測相對誤差ε∈[-6%,6%),屬于預測正常狀態;(3)狀態空間E3為預測相對誤差ε∈[6%,18%),屬于預測偏高狀態。并以此對改進熵值法組合預測模型的預測相對誤差進行狀態劃分,結果見表3所示。

表3 2003—2014年過閘貨運量的預測相對誤差及狀態分類
由表3可計算出其一步轉移頻數矩陣Q,從而計算出一步狀態轉移概率矩陣P(1),其中:

同理,

轉移矩陣的不變分布為:

根據Markov鏈預測模型,由轉移概率矩陣可以得出預測值的狀態空間及其相對應的概率,從而可以計算出基于Markov鏈修正的改進熵值法組合預測模型的預測結果。由不變分布可以得出,若干年之后Markov鏈處于狀態E1,E2和E3的概率分別0.5455,0.2727和0.1818。表4(見下頁)列出了2015—2020年基于Markov鏈修正的改進熵值法組合預測模型的預測結果。
本文采用了熵值法組合預測模型對三峽船閘過閘貨運量進行預測,針對熵值法確定組合預測權系數的不足,提出了改進熵值法組合預測模型,并且預測精度比熵值法組合預測模型的預測精度更高。最后利用Markov鏈預測模型對改進熵值法的預測結果進行修正,進一步增加了預測的精度和可信度。

表4 改進熵值法組合預測結果的Markov鏈修正值
[1]杜嘉.長江三峽樞紐水路客貨運輸量預測[D].重慶:重慶交通大學碩士學位論文,2008.
[2]趙奇志.西津樞紐貨運量預測及二線船閘通航條件研究[D].重慶:重慶交通大學碩士學位論文,2013.
[3]馬海峰.三峽樞紐過閘貨運量預測分析及對策研究[J].中國水運,2015,38(3).
[4]陳華友.組合預測方法有效性理論及其應用[M].北京:科學出版社,2008.
[5]朱新國,張展羽,祝卓.基于改進型BP神經網絡馬爾科夫模型的區域需水量預測[J].水資源保護,2010,26(2).
[6]景亞平,張鑫,羅艷.基于灰色神經網絡與馬爾科夫鏈的城市需水量組合預測[J].西北農林科技大學學報,2011,39(7).
[7]付長賀,鄧甦.馬爾科夫鏈在傳染病預測中的應用[J].沈陽師范大學學報:自然科學版,2009,27(1).
[8]許國根,賈瑛.模式識別與智能計算的MATLAB實現[M].北京:北京航空航天大學出版社,2012.
[9]何曉群,劉文卿.應用回歸分析[M].北京:中國人民大學出版社,2011.