齊緒存, 黃常海, 沈佳, 婁乃元
(上海海事大學商船學院, 上海 201306)
隨著中國社會經濟的快速發展,特別是對外貿易的快速發展,水上交通運輸發展迅速,船舶交通流量不斷增加,導致特定河段內通航效率下降[1],特別是感潮河段在高峰時刻交通擁堵現象比較明顯。
感潮河段是連通內河航道、港口與沿海航道的重要通道,感潮河段的水位和水流受潮汐影響明顯。在感潮河段,吃水較大的船舶需要乘潮進出港;出于節省燃料的目的,大批小型船舶也乘潮航行。因此,感潮河段交通流潮汐效應比較明顯。對感潮河段交通流的精準預測,可為海事管理機構交通管理措施調整、引航機構引航計劃制定和船舶航次計劃制定等提供決策參考,緩解感潮河段交通擁堵問題,進一步提高感潮河段通航效率。
目前,針對船舶交通流特性,學者們提出了多種預測模型:考慮非線性、復雜性等特性的二維矩陣分解預測模型[2];考慮出發港口、周轉港口、目的港口間時空關聯性的預測模型[3];考慮季節和氣候等因素的適用于周期波動船舶交通流的預測模型[4];考慮船舶交通流隨機性、非線性特點的基于機器學習算法的預測模型[5-8];等等。然而,上述預測模型多考慮船舶交通流自身特性,未充分考慮感潮河段潮汐波動對船舶交通流的影響,存在一定的預測誤差。
為充分利用潮汐波動對船舶交通流量的影響,本研究提出復合潮汐信息的船舶交通流預測方法。綜合利用潮汐信息和歷史交通流信息,需選擇多變量預測模型。常見的多變量預測模型有1階N變量灰色預測模型GM(1,N)、智能算法模型(支持向量機、神經網絡等)等。GM(1,N)可在小樣本、貧信息情況下保持較高的預測精度,已被運用于多個領域[9-11]。在GM(1,N)基礎上,MA等[12]將GM(1,N)灰色差分式右端項中的齊次項函數轉為非線性核函數,提出KGM(1,N),預測精度得到進一步提升。考慮船舶交通流非線性等特性,選擇KGM(1,N)作為本研究基礎模型。然而,KGM(1,N)灰色差分式中背景值存在預估誤差。本研究選用插值系數法[13]對KGM(1,N)進行背景值優化,構建基于背景值優化的KGM(1,N)(KGM(1,N) based on background value optimization, KGBM(1,N))模型。KGBM(1,N)模型存在最優參數確定問題,即高斯核參數σ、修正參數C和背景值插值系數λ的確定。考慮到粒子群優化(particle swarm optimization, PSO)算法具有原理簡單、容易實現、全局搜素能力強、運算速度快等優點[14],選擇PSO算法確定本研究模型所需最優σ、C和λ,構建基于PSO算法優化的KGBM(1,N)(the KGBM(1,N) model based on PSO, PSO-KGBM(1,N))模型,并采用實時滾動預測方法。為驗證PSO-KGBM(1,N)滾動預測模型在感潮河段的適用性,以上海港南槽航道九段警戒區上游斷面的船舶交通流預測為例進行應用,與常見預測模型對比驗證其預測精度。
感潮河段船舶交通流量增減趨勢與該河段潮汐波動具有較強的相關性。一般情況下,感潮河段潮汐波動與船舶交通流之間存在一定的時間差T,即存在船舶交通流變化相較潮汐波動滯后或超前一段時間的情況。為此,感潮河段船舶交通流預測模型應將感潮河段潮汐信息和歷史交通流信息同時作為預測模型的輸入信息,即輸入時段T+1至T+m的船舶交通流量數據和時段1至m的潮高數據,這些數據形成m×2維矩陣:
(1)
式中:Z1表示時段T+1至T+m的船舶交通流量數據;Z2表示時段1至m的潮高數據。
預測任意時段船舶交通流量的模型可用下式表示:
(2)

(3)



(i=1,2,…,N;k=2,3,…,m)
(4)
KGBM(1,N)模型的灰色差分式為
(5)


(k=2,3,…,m;λ∈[0,1])
(6)
可通過調節背景值系數λ的值,確定最優背景值。當λ=0.5時,式(6)為傳統背景值定義式,即梯形公式求解下的背景值,此時式(5)為KGM(1,N)模型的灰色差分式。

φ(k)=wT·φ(χ(k))
(7)

由于式(5)中φ(χ(k))不可通過式(7)給定,故不可直接用最小二乘法求解式(5)中的φ(k)、a、u的值,上述問題需轉化為正則化問題:
(8)
式中:C為修正參數;ek為預設誤差。
采用拉格朗日乘子法引入拉格朗日乘子βk(k=2,3,…,m)求解后,通過KKT(Karush-Kuhn-Tucker)條件式將上述問題轉化為線性求解問題[12],即
(9)

本研究采用高斯核給定內積φ(χ(i))·φ(χ(j))的值,即
K(χ(i),χ(j))=φ(χ(i))·φ(χ(j))=
(10)

φ(k)=wT·φ(χ(k))=
結合式(5)與式(6),有
φ(k)+u,k=2,3,…,m
(11)

k=2,3,…,m
(12)

k=2,3,…,m
(13)
通過一階累減得到原始序列的預測值:
k=2,3,…,m
(14)

s.t.

(15)
PSO算法的速度和位置迭代公式分別如下:

(16)
xq+1(i,d)=xq(i,d)+vq+1(i,d)
(17)

x1(i,d)=Pmin(d)+r(Pmax(d)-Pmin(d))
(18)
式中:r為[0,1]內的隨機數;Pmin(d)和Pmax(d)分別為第d個參數取值范圍的下限和上限,在本研究中為λ、σ和C的取值范圍下限和上限。
本研究初始定義了50組關于λ、σ和C的初始值,迭代次數為300次。具體的算法步驟如算法1所示:
算法1

1.初始狀態下自定義系數ω=0.8,c1=2,c2=2,確定最大迭代次數為300。
2.分別在[0,1]內隨機選取50個粒子λ1(i),在(0,1)內隨機選取50個粒子σ1(i),在(0,1 000)內隨機選取50個粒子C1(i),并確定這些粒子的初始個體最優解為隨機取值。
3.Forq=1:300
(1)Fori=1:50
①將經q次迭代給定的λq(i)、σq(i)、Cq(i)代入式(5)~(11)確定式(13)內所需參數的值。

(2)End for
(4)通過式(16)和式(17)更新經q+1次迭代后得到的λq+1(i)、σq+1(i)、Cq+1(i)的初始位置。
4.End for
輸出:最終的全局最優解即為λ、σ和C的最優取值。
確定擬合序列長度n和預測序列長度p,n應保持大于p。在確定n和p后,用PSO-KGBM(1,N)滾動預測模型進行預測,步驟如下:



步驟4重復循環步驟3,直至完成所有待測點預測。
PSO-KGBM(1,N)滾動預測模型的預測流程見圖1。

圖1 PSO-KGBM(1,N)滾動預測模型的預測步驟
實驗數據來源于上海港南槽航道九段警戒區上游斷面(以下簡稱“實驗斷面”)的AIS和雷達跟蹤數據。該航道船舶交通流存在明顯波動規律,且與該航道潮汐波動規律具有一定相似性。選取實驗斷面2020年5月22日和23日的小時進口船舶交通流量數據,驗證本研究所提出模型的精度。為驗證復合潮汐信息對模型預測的影響,選擇1階單變量的非線性核函數灰色預測模型KGM(1,1)作為比較模型;為驗證船舶交通流非線性特性對模型預測的影響,選擇離散1階N變量灰色模型DGM(1,N)作為比較模型;為驗證灰色模型在小樣本情況下的優勢,將傳統智能算法模型(最小二乘支持向量機(least square support vector machine, LSSVM)模型、反向傳播(back propagation, BP)神經網絡模型)作為比較模型。
利用相關系數法[16]分別對實驗斷面5月22日和23日全天船舶交通流量數據與該地區前置1~12 h潮汐的潮高數據進行相關性分析,計算所得的相關系數見表1。由表1可知,5月22日和23日全天船舶交通流量數據均與其前置8 h潮高數據的相關系數最高,接近0.9。船舶交通流量與前置8 h潮高變化趨勢見圖2和3。
由圖2和3可知,實驗斷面5月22日和23日的小時進口船舶交通流量與該地區前置8 h的潮高數據的波動變化趨勢具有較高相似性。根據第1節提出的復合潮汐信息的船舶交通流量預測方法,可將該組船舶交通流量數據作為本研究模型實驗數據,各時段船舶交通流量數據及前置8 h潮高值見表2。

表1 2020年5月22日和23日00:00—24:00船舶交通流量與地區前置1~12 h的潮高數據間的相關系數

圖2 2020年5月22日船舶交通流量與前置8 h潮高關系

圖3 2020年5月23日船舶交通流量與前置8 h潮高關系

表2 2020年5月22日和23日船舶交通流量及前置8 h潮高
為評價預測結果,采取最大絕對誤差EMA、平均絕對百分比誤差EMAP和等值系數CE反映模型的預測精度。

i=1,2,…,m
EMA和EMAP值越小,說明模型預測精度越高;CE值越大,說明模型預測精度越高。
通過相關系數法得到2020年5月22日和23日船舶交通流量數據與前置8 h潮高數據的相關系數最高,因此,為保持較高精度,利用復合潮汐信息預測未來時刻船舶交通流的預測時間窗寬度(預測序列長度)應小于等于8,即時間窗寬度的取值范圍為[1,8]h。為確定最優時間窗寬度,計算不同寬度的時間窗內的EMAP值。

表3 2020年5月22日和23日不同寬度的時間窗內的預測精度比較
通過表3中不同寬度時間窗內的預測精度結果,可知時間窗寬度為4 h(擬合序列長度設定為20,預測序列長度設定為4)時的EMAP值最低。因此,本實驗案例將預測序列長度設定為4,將擬合序列長度設定為20,以00:00—20:00(時段1~20)的船舶交通流量數據作為擬合數據,20:00—24:00的船舶交通流量數據作為驗證數據。
確定好預測序列長度和擬合序列長度后,以5月23日20:00—24:00的船舶交通流量預測為例,具體的輸入矩陣及預測過程如下:
本研究模型與DGM(1,N)模型、LSSVM模型和BP神經網絡模型均利用感潮河段內復合潮汐信息。KGM(1,1)模型雖未利用復合潮汐信息,但其右端項采用核函數替代齊次項函數或常數,與本研究模型一致。模型預測結果見圖4和5,預測精度比較見表4和5。

圖4 船舶交通流量預測結果(2020年5月22日)

圖5 船舶交通流量預測結果(2020年5月23日)
通過圖4與圖5可明顯看出,本研究模型在擬合過程中優于其他模型,幾乎與原始數據曲線重疊。DGM(1,N)模型無論是擬合還是預測曲線均是幾種模型中與原始數據曲線偏差最大的,且比較平滑,這是由于DGM(1,N)模型相較其他模型并不能有效反映船舶交通流的非線性和隨機性等特性。
由表4和5對連續兩天船舶交通流預測精度的比較結果可知,本研究模型在EMAP、EMA、CE指標上均明顯優于其他幾種對比模型。本研究模型預測結果的EMA值均在3.1以下,而在其他4種模型中,預測較好的KGM(1,1)模型和BP神經網絡模型的EMA值分別超過了4.5和8,預測精度最差的DGM(1,N)模型的EMA值超過了13。此外,本研究模型CE值均在0.92以上,EMAP值均小于13%,其他4組模型的預測精度與本研究模型的預測精度具有一定差距。

表4 船舶交通流量預測精度比較(2020年5月22日)

表5 船舶交通流量預測精度比較(2020年5月23日)
充分考慮潮汐對船舶交通流量的影響和船舶交通流非線性等特性,提出復合潮汐信息的船舶交通流預測方法。提出一種適用于感潮河段船舶交通流預測問題的復合潮汐信息的PSO-KGBM(1,N)滾動預測模型,并以上海港南槽航道九段警戒區上游斷面船舶交通流預測為例進行驗證。經與智能算法模型(LSSVM模型、BP神經網絡模型)、DGM(1,N)模型、KGM(1,1)模型進行系統科學的比較,發現所提出的PSO-KGBM(1,N)滾動預測模型預測精度明顯優于其他對比預測模型。
(1)本研究模型選取KGM(1,N)模型作為基礎模型,模型的右端項為可選擇的非線性核函數,可更好地反映潮汐對船舶交通流的影響。
(2)本研究提出的PSO-KGBM(1,N)滾動預測模型采用插值系數法優化背景值,并采用PSO算法確定背景值系數λ、右端項核函數所需高斯核參數σ和修正參數C的最優取值,預測精度較高。
(3)采用實時滾動預測方法,可在數據有限的條件下保持新信息優先,從而模型精度更高,工程應用難度更低。
感潮河段上游水庫放水或極端天氣帶來的航道水位突變對船舶交通流預測的影響,有待進一步研究。