馬全黨, 江福才, 范慶波, 朱蓉蓉
(武漢理工大學 a.航運學院;b.內河航運技術湖北省重點實驗室, 武漢 430063)
伴隨著我國經濟的發展,尤其是“一帶一路”政策的實施,加速了水上交通運輸的發展,船舶數量逐漸增多,船舶大型化和高速化趨勢日益明顯。[1-2]船舶交通流量的準確預測,可讓港口部門根據船舶交通流的變化規律,科學合理地規劃水域布局,提高航道的通航效率,同時也為海事管理部門提供基礎性數據,更好地保障通航安全。[3]
目前國內外的學者在船舶交通流量預測方面主要有定性預測和定量預測兩大類。
1) 定性方法主要指經驗判斷性質的分析預測,具有代表性的方法有“頭腦風暴法”“德爾菲法”和“廣義德爾菲法”[4]等,這些方法包含很強的主觀因素,誤差較大且預測精度不高。
2) 定量預測是指運用數學模型進行預測,目前應用比較廣,例如:運用線性增長模型[5]、徑向基函數(Radical Basis Function,RBF)神經網絡模型[6]等。
本文主要就灰色模型、馬爾科夫模型、粒子群算法應用情況進行介紹。馬曉波等[7]運用灰色系統預測模型,引入殘差修正等方法優化模型,對長山水道2015—2016年船舶交通流量進行預測。鄭友銀等[8]運用灰色模型與自回歸模型結合,對港口的船舶交通流量進行預測等;灰色模型可提高樣本數量和信息少的數據的預測精度,但對波動性大的數據預測精度低,且未消除指數偏差。呂鵬飛等[9]利用BP(Back Propagation)神經網絡與馬爾科夫模型結合,將殘差劃分狀態,白化系數取0.5,用馬爾科夫修正神經網絡預測值的方法對長江九江大橋的月度船舶交通流量進行預測;馬爾科夫模型對殘差序列區間進行白化,一般選取狀態區間的中間值,白化系數為0.5,不具有普適性,誤差較大。李松等[10]應用粒子群算法所具有的全局搜索能力對BP神經網絡進行優化,輔助求解最佳的權值和閾值,提高交通流量的預測精度。許多學者已將無偏灰色模型、馬爾科夫模型、粒子群算法應用到煤礦、道路交通和降水等領域,取得很好的預測效果。
鑒于以上分析,本文在無偏灰色模型的基礎上,引入馬爾科夫模型,彌補無偏灰色模型在對波動性大的數據,預測精度低的不足,并運用PSO優化算法,自適應求取最佳白化系數,應用該方法對東營港2012—2017年船舶交通流量季度統計數據進行擬合與預測,以期得到最佳的預測效果。
在生活中,存在很多系統的信息為部分已知但并不全知,稱為灰色系統,灰色模型就是對灰色系統進行預測,雖然系統表現的現象是隨機的、雜亂無章的,但依然具備一定的潛在規律。灰色模型就是尋找這種規律并加以利用,從而進行預測。[11]選擇灰色模型中的GM(1,1)進行預測,灰色模型GM(1,1)在原始時間序列隱含著指數變化規律時預測誤差較小。傳統的灰色模型GM(1,1)在構建序列模型步驟過于繁瑣,為方便計算,構建無偏灰色GM(1,1)模型,建模步驟如下:
構建原始序列為
X(0)(k)=(X(0)(1),X(0)(2),…X(0)(k))=
(1)
1) 對原始序列作一階累加,生成數據累加序列和一階線性微分方程為
(2)
(3)
2) 為得到待定參數的解,構建矩陣Bn,Yn為
(4)

3) 用最小二乘法計算線性微分方程的參數a和μ。
x(0)(k)=-aZ(1)(k)+μ
(5)
(6)
(7)

(8)
馬爾科夫模型是一個隨機變量序列,它與某個系統的狀態相對應,而此系統在某個時刻的狀態只依賴于它的前一時刻的狀態,該模型[13]表示為
X(n)=X(k)Pn-1
(9)

(10)
殘差序列e(i)存在規律性,應對殘差序列利用馬爾科夫模型來修正。將殘差序列按照大小劃分為間隔寬度相等的r個狀態,殘差序列F(i)的第i步的第j個狀態的上下邊界分別用Hij和Qij表示,計算方法[13]為
(11)
(12)
設狀態空間為I={i1,i2,…,ir},在每一個時間點,隨機過程中的每一個值只能處于一種狀態,每個狀態在接下來的狀態轉移有r個轉向(包括轉向自身),即:{ii→i1,ii→i2,…,i→ir}。從狀態i經過一步狀態轉移到狀態j的概率為
?i,j∈I。
(13)
同理可得到k步狀態轉移概率為
?i,j∈I
(14)
進而構建能反映系統間各狀態概率轉移的一步轉移矩陣為r×r。[14]該轉移矩陣為
(15)
從狀態轉移矩陣的行向量里可得到無偏灰色模型殘差序列里某序列值經過一步狀態轉移的概率,記為ai(t)(i=1,2,3,…,r),轉移時間用T表示。選取r個狀態區間,每個狀態區間的中間值為該區間可能的預測值,用zi(i=1,2,3,…,r)表示,通常取0.5,得到預測結果的表達式為
(16)
在以上建模過程中,zi(i=1,2,…,λ)取狀態區間的中間值(白化系數為0.5),該值不具有普適性且誤差較大。本文引入粒子群算法對上述模型進行優化,根據數據序列的變化規律,求取最佳的白化系數。
將得到的狀態區間看作為一個灰區間,對這種灰區間進行白化的方法為
(17)
KENNEDY等[15]提出粒子群算法,這是一種模擬鳥群社會性的多點搜索方法,具有全局搜索能力強、過程簡潔和參數少的特點,用以自適應選取最佳白化系數。
vi(t+1)=wvi(t)+c1rand1(xpbesti-xi(t))+
c2rand2(xgbesti-xi(t))
xi(t+1)=xi(t)+vi(t+1)
(18)
式(18)中:xi為在t時刻的位置;vi為粒子在t時刻的速度;xpbesti為群體搜索到的最佳位置;xgbest為粒子全體極值經歷的最好位置;rand1、rand2為服從U(0,1)的隨機數;ω為慣性系數;c1、c2為加速度系數。
用均方差fit來衡量每個粒子的適應度函數
(19)
PSO-無偏灰色馬爾科夫模型的建模步驟見圖1。

圖1 PSO-無偏灰色馬爾科夫模型計算步驟
為定量評價模型的船舶交通流量預測結果,綜合采用平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)[14]對預測精度進行計算。
MAE的計算公式為
(20)
MAPE的計算公式為
(21)
MAE與MAPE分別反映原始值與預測值的平均偏離程度及模型預測數據的擬合程度,值越小,越能反應預測值的準確性與可靠性。
標準船舶的選取是為方便對不同水域相同時段或同一水域不同時段的船舶交通流量進行統計、更好地表征船舶交通流的概念。文獻[16]提到標準船舶作用有:實現不同航段船舶交通流量的比較,反映不同航段船舶交通流量的特點。日本運用“L系數”“L2系數”的方法確定標準船舶,我國采用如下換算系數將原始數據轉化為標準船舶數據[13],見表1。

表1 標準船舶換算系數表
為保證預測數據的準確性,在東營海事局的配合下利用船舶簽證原始資料統計得到東營港2012—2017年共23個季度的船舶交通流量。根據以上換算系數,對原始數據進行標準船舶轉換,得到的標準船舶見表2。

表2 東營港2012年1月—2017年9月船舶交通流量季度統計表 標準船/艘次
根據表2,擬選擇前21個樣本數據作為擬合數據,建立非負原始數據序列為
(22)
依據無偏灰色模型的建模步驟,運用MATLAB R2014a軟件編制無偏灰色模型程序計算,得到

(23)
(24)
應用MATLAB R2014b,參照式(4)得到無偏灰色模型的預測值。
依據上文無偏灰色馬爾科夫模型的建模流程,確定殘差序列的范圍e(i)∈[-1 562.93,1 284.68]。將殘差序列劃分為4個狀態區間,區間的上下邊界值如下:
狀態E1為
同理得到E2、E3、E4狀態的上下邊界區間分別為[-851.02,-139.12]、[-139.12,572.77]、[572.77,1 284.68]。無偏灰色模型殘差序列狀態分布見表3。

表3 無偏灰色模型殘差序列狀態分布表
根據表3狀態的分布情況,對從Ei經一步轉移到Ej的頻數統計見表4。進而得到狀態轉移概率矩陣為
(27)
計算4個狀態區間的中間值:z1=-1 211.71,z2=-489.24,z3=233.24,z4=955.71。根據式(16)得到無偏灰色馬爾科夫模型的預測結果,見表5。

表4 一步狀態轉移頻數統計表

表5 模型預測結果及殘差
粒子群算法全局搜索能力強,綜合考慮殘差序列、狀態區間和狀態轉移概率等,能夠幫助尋找到最佳的白化系數。運用式(17)得到
(28)
(29)
(30)
(31)

根據以上的計算結果,現將無偏灰色模型、無偏灰色馬爾科夫模型、PSO-無偏灰色馬爾科夫模型船舶交通流量預測值和殘差匯總如表5所示。
船舶交通流量預測值結果對比見圖2。無偏灰色模型的預測值從第2季度開始為單調遞增的光滑直線,樣本實際值基本位于直線兩側,該模型對單調遞增的數據預測精度高,對受到多種因素影響的波動性較大的數據預測精度較低。無偏灰色馬爾科夫模型擬合效果不好,原因在于該模型白化系數值為0.5,即選擇的每個狀態區間的中間值為該區間的可能值,但在實際中,中間值并不一定是最優解。運用PSO算法進行全局搜索,尋找到最佳的白化系數,彌補了馬爾科夫模型在白化系數選取上的不足,擬合效果較好,且擬合精度明顯優于前兩者。

圖2 船舶交通流量預測值結果對比
擬運用該方法對東營港2017年第2季度、2017年第3季度船舶交通流量進行預測。第21組數據轉移到第22組、第23組數據的第1、第2步狀態轉移概率矩陣為
P(1)=P(0)×P(1)=0 1 0 0×P(1)
第21組數據處于E1,參照PSO-無偏灰色馬爾科夫模型的計算過程和第2步狀態轉移矩陣,計算結果見表6。
根據式(20)和式(21),分別計算3種模型在對前21組數據進行擬合及對第22、第23組數據進行預測情況下的MAE和MAPE,見表7。
由表7可知:采用PSO-無偏灰色馬爾可夫模型擬合誤差中MAPE為8.561%,精度為91.439%,優于無偏灰色模型及無偏灰色馬爾科夫模型,擬合較好。PSO-無偏灰色馬爾可夫模型對于2017第2、第3季度的預測誤差中MAPE為4.041%,精度為95.959%,驗證模型的可靠性。

表7 3種模型誤差比較結果統計表
1) 本文提出PSO-無偏灰色馬爾科夫船舶交通流量預測模型,該模型在綜合考慮預測中殘差序列、狀態區間和狀態轉移概率的基礎上,自適應求解最佳白化系數,用以克服無偏灰色馬爾科夫模型在預測波動性數據存在精度低的問題。
2) 本文模型與傳統無偏灰色模型和無偏灰色馬爾科夫模型相比,能確保更高精度的預測結果。
3) 為進一步提高船舶交通流量預測精度,后續工作將重點研究馬爾科夫模型中的最佳狀態劃分方法和粒子群算法,有效克服船舶交通流量預測中的復雜性和非線性。
4) 預測結果可為港口水域的合理布局及海事主管部門提高水上交通管理效能提供基礎性數據。