陳 琛,吳 青,高 嵩
(1.武漢商學院 商貿物流學院,武漢 430056;2.武漢理工大學 物流工程學院,武漢 430063;3.武漢理工大學 智能交通系統研究中心,武漢 430063)
貨運量是指一定時期內實際運送的貨物噸數,是到達貨運量和發送貨運量的總和.水路貨運量既是水路運輸為國民經濟服務的生產成果指標,也對港口、航運企業生產計劃、組織的重要指導作用.目前的貨運量多為年度中長期預測,主要有2類:一類通過擬合貨運量與影響因素間的關系展開預測[1-2],但是大部分影響因素是以年度為單位的經濟統計量,無法進行短期預測;另一類是考慮時間因素,通過貨運量歷史時間規律對未來進行預測,主要是各種時間序列方法[3-5],目前多為年度預測,短期預測研究較少.Gao等[4]利用向量自回歸模型將6種典型的預測模型結合,對月度港口吞吐量進行預測.吳麗彬等[5]構建時間序列與回歸分析混合預測模型對月度貨運量進行預測.隨著時間粒度減小,時間序列波動明顯,預測精度不能滿足要求,時間序列方法短期預測時間粒度一般只到月度預測.
考慮空間因素可以提高短期預測精度,越來越多的學者在短時公路交通量預測中將空間因素考慮在內[6],尤其是時空因素與神經網絡相結合的短期預測取得了不錯的效果.Vlahogianni等[7]集成和優化了上下游道路上順序傳感器采集的數據,構建了模塊化神經元預測器.Zeng等[8]基于道路上游和下游的交通數據構建了時間延遲時空神經網絡(TDSSNN)模型.Wang 等[9]通過時間空間神經元構建路網的時空關系,建立時空神經網絡交通量預測模型.田保慧等[10]利用上下游道路路網內流量相似性高的傳感器獲得的數據進行預測.然而,公路網絡中的交叉路口使得道路在網絡中有明確的上下游路口,交通量預測時通常考慮與這幾條簡單明確的上下游路口的時空關系即可.但是水路運輸網絡中,任意水路連通的港口間都可以開通直達航線,使得影響貨運量的上下游港口數量眾多.如武漢港某月接收171個航線上游港口貨物,向156個航線下游港口發送貨物,如此高維的空間數據難以直接運用于貨運量預測.如何尋找影響港口貨運量的主要上下游港口,提取貨運網絡主要空間特征,從而降低貨運空間維度是利用空間因素的關鍵.
由此,本文提出了一種基于頻繁港口和神經網絡(FR-NN)的水路貨運量預測模型.該模型基于頻繁模式思想,將頻繁港口作為影響貨運量的主要上下游港口,利用頻繁低維數據保留貨運網絡的主要空間關聯,然后利用神經網絡擬合頻繁貨運網絡內港口貨運量間的時空關系.實驗結果表明,模型能較好地解析頻繁港口和目標港口的時空關系,以此對各種時間粒度的短期水路貨運量進行預測,預測效果優于僅依賴于時間維度的傳統時間序列方法,尤其是能進行小時間粒度的周、日貨運量預測.
傳統的貨運量預測只考慮了時間維度,而對于短期預測,貨運量時間序列不平穩加劇,還需要借助于貨運網絡的空間關系提高預測精度.圖1和圖2分別為長江干線4個港口24個月和60周的貨運量(M).由圖可見,時間粒度減小,貨運量波動加劇,僅依靠時間維度進行預測受到影響較大.而貨運網絡中,不同港口間的貨運量表現了一定的相似性,考慮這種空間因素可能有助于短期預測.

圖1 港口月貨運量Fig.1 Monthly freight volume

圖2 港口周貨運量Fig.2 Weekly freight volume
理論上,了解與目標港口所有空間關系可以更精確預測,但有水路連通的港口間就可以開通航線,使得水路貨運網絡中的上下游港口比公路和鐵路網絡中的數量多得多,如武漢港2015年5月的某一周就有船舶駛向79個不同港口,同時還有來自124個不同港口的船舶駛入,如此復雜的水路貨運空間網絡信息難以直接利用,需要挖掘網絡內港口結點間的主要關聯,用低維數據保留主要空間關聯.
頻繁模式是頻繁出現在數據集中的模式,如項集、子序列和子結構等,頻繁模式挖掘可以搜索數據集中反復出現的聯系,借助頻繁模式思想和頻繁模式挖掘方法發現貨運網絡內目標港口的頻繁港口,由頻繁港口保留港口間主要空間關聯.
1.2.1頻繁模式相關定義 設I={i1,i2,…,in} 是一個項集,一個事務T是項集組成的一個序列,事務數據庫D是一個事務集.
定義1X的絕對支持度為在事務集中出現的次數,記為SC(X),支持度為絕對支持度與事務總數的比值,記為S(X).
定義2給定最小支持度閾值σmin,若S(X)≥σmin,則稱X為頻繁的.
1.2.2頻繁港口挖掘 船舶航次頻繁程度反映了港口間空間關聯程度,對船舶航次事務數據集進行挖掘,找出航線網絡中與目標港口關聯度高的頻繁港口集合.
目標港口v的貨運網絡G=(V,E),其中V={v1,v2,…,vn}是網絡中所有與v有航線連接的港口集合,邊集E是v與vi的連通航線集合,一個航次事務T1=〈…,v,vi,…〉或T2=〈…,vi,v,…〉,其中vi∈V包含了一次貨物在兩港間的運輸,對應的事務數據集D1和D2分別是航次事務T1和T2的集合,C(D1)和C(D2)分別為D1和D2中的事務總數.由頻繁模式定義可得
(1)

設目標港口的頻繁港口PF={P1,P2,…,Pk},Q=[q1q2…qt]T為某港口時間段t的貨運量時間向量,目標港口和頻繁港口間的時空狀態關系如圖3所示.

圖3 頻繁港口與目標港口貨運量間的時空關系Fig.3 Temporal-spatial relationship between frequent ports and target port
預測模型首先利用頻繁港口提取了貨運網絡的主要關系.然后在擬合時空關系時,由于網絡空間內港口貨運量存在著相關性,但他們的時空關系并不明確且可能存在著復雜非線性,考慮神經網絡對多種相關關系的較好處理能力,及其在公路短時交通量預測中的良好表現[8-9,11],采用神經網絡擬合頻繁港口與目標港口間的時空關系.
神經網絡自20世紀80年代進入蓬勃發展時期以來一直熱度不減,全世界范圍內對其網絡結構研究、改進、應用的成果舉不勝舉.神經網絡主要有前饋、反饋、自組織3大類,前饋神經網絡從輸入層到輸出層傳遞信息,通過神經元間的權值調整對復雜關系進行映射;自組織神經網絡通過競爭學習進行無導師監督學習;反饋神經網絡通過神經元狀態演變到達網絡穩態.由于不同的工作機制,前饋網絡適合于非線性映射、回歸、分類等,自組織網絡擅長于無監督分類,反饋網絡在模式識別、優化計算等方面會有較好應用.模型中采用前饋網絡解析頻繁港口與目標港口貨運量間的時空關系.
誤差反向傳播(BP)的多層前饋神經網絡是最基礎也是應用最廣泛的神經網絡,它正向從輸入層、隱層、輸出層逐層傳播信息,再反向傳播信號誤差,通過調整網絡權值減小誤差.雖然BP網絡存在局部最優、收斂速度慢、過度擬合等風險,但非線性映射和泛化能力仍然使其在預測領域有著無與倫比的卓越表現.僅含一個隱層的BP神經網絡已經在數學上證明能以任意精度逼近任意非線性函數,選擇如圖4所示的3層BP神經網絡進行預測,結合經驗和實驗對比建模.

圖4 神經網絡結構圖Fig.4 Structure of neural network
圖4中,輸入向量F=[f1f2…fk]T通過權值矩陣V得到隱含層輸出向量H=[h1h2…hm]T,
hj=f(VTF)
(2)
H再經由權值矩陣W獲得神經網絡輸出
o=f(WTH)
(3)
正向獲得神經網絡輸出o之后,再利用網絡輸出o與期望輸出q之間的誤差e反向調整網絡的權值矩陣V和W,利用梯度下降法調整量分別為
(4)
hj(1-hj)fi
(5)
式中:η為學習系數,正向輸出和反向調整迭代多次直至達到迭代次數或者誤差e減小到指定范圍;hp為隱含層第p個值;wj為隱含層到輸出層權值矩陣第j個元素;l為輸出向量元素.
算法步驟:
(1)數據準備.確定最小支持度閾值σmin和時間范圍,整理航線網絡數據;
(2)頻繁港口挖掘.從目標港口歷史數據時間段的所有航次事務數據集中,挖掘滿足最小支持度閾值σmin的頻繁港口;
(3)確定神經網絡結構.輸入層節點數為頻繁港口數量,隱含層1層,隱含層節點數在經驗范圍[11]內比較確定,輸出層1個節點;
(4)神經網絡訓練.頻繁港口歷史貨運量為輸入,目標港口貨運量為期望輸出對神經網絡進行訓練,調整網絡權值直至誤差達到指定范圍;
(5)利用訓練好的神經網絡來預測目標港口貨運量.
港口、航運企業等生產調度常以周為單位,周貨運量預測對企業生產計劃有重要指導意義,以武漢港周貨運總量為例驗證模型預測效果,然后擴展分析關鍵參數和模型在不同時間粒度上的預測效果.
數據來源于長江航運大數據平臺的船舶進出港簽證數據.長江航運大數據平臺是依托交通部建設科技項目《長江航運大數據平臺關鍵技術及應用研究》建成的大數據中心,整合了多源的長江航運數據.船舶每次進、出港都需要進行簽證,每條進(出)港簽證數據包含了船舶上一經過港(下一經過港)、在本港到達貨運量(發送貨運量)等信息.
選取2012年1月2日0時~2014年12月29日24時的船舶進出港簽證數據,周一0時~周日24時記為1周,包括156周共155組數據.該時間段內武漢港進出港簽證數據約 1.56×105條,與300多個港口有航線聯系,周貨運總量為到達貨運量和發送貨運量之和.
3.1.1頻繁港口挖掘 事務數據庫集D是研究時間段內所有包含武漢港的航次事務T集合,事務數據集Darrive和Dleave分別為包含武漢港進港和出港的航次事務Tarrive和Tleave.航次事務的事務數據庫集D=D1∪D2,包含數據 156 665 條,且D1∩D2=?,其中進港簽證記錄集Darrive為 77 887 條,出港簽證記錄集Dleave為 78 778 條.
選取σmin=2.5%,根據頻繁港口的定義計算得到武漢港的頻繁港口PF={城陵磯(6.32%),上海(5.75%),重慶(3.81%),富池(2.93%),武穴(2.64%),宜昌(2.63%),九江(2.50%)},共7個港口.
3.1.2神經網絡建模 神經網絡的黑箱訓練過程使其結構、訓練集和訓練過程都缺少明確的定量研究,通過隨機取值、多次仿真的方式確定合適的模型.每個模型仿真50次,選擇效果較好的作為最終模型.每次訓練設計如下.

(2)訓練集設計.155組數據中的前139組作為訓練集,輸入向量為7個頻繁港口第1~139周標準化貨運量后,期望輸出為武漢港第2~140周標準化貨運量,剩余16組用于測試模型預測效果.訓練集中隨機選擇80%樣本進行訓練,剩余20%樣本作確認,防止過擬合.
(3)網絡訓練.神經網絡訓練選用S型激勵函數,訓練算法為梯度下降法,學習率η=0.05.終止條件為:最大迭代次數500次,相對誤差ΔE<10-5時,確認樣本誤差連續50次迭代不下降,滿足任一訓練結束.
3.1.3預測結果對比分析 選用典型的時間序列方法(指數平滑、ARIMA、灰色預測),通過多元線性回歸擬合頻繁港口與目標港口貨運量,并將結果與本文FR-NN方法的預測結果進行對比.時間序列周期設定為52,通過分析武漢港1~140周歷史貨運量的變化規律,分別選擇簡單周期指數平滑、ARIMA(1,0,1)和GM(1,1)對99~103周貨運量進行預測.用平均絕對百分比誤差MAPE和方均根誤差RMSE評價預測精度和穩定性,R2評價模型擬合效果,即
(6)
(7)
(8)

采用不同方法對用貨運量進行預測的結果如表1所示.由表1可見,FR-NN模型的預測精度和穩定性從數值上較時間序列方法有一定提升,多元線性模型的解析效果不如采用神經網絡多元線性,其回歸擬合結果為
y=733 704.61+0.118x1+0.252x2-
0.10x3+0.299x4-0.058x5+
0.609x6+0.255x7
時間序列方法的決定系數都不高,模型可解釋性很低,引入頻繁港口與目標港口時空因素后預測效果變好,顯然線性關系解析的效果不如FR-NN模型,神經網絡能更好地擬合頻繁港口與目標港口間的時空關系.

表1 周貨運量預測結果對比Tab.1 Comparison of week predicting freight volume
頻繁模式的最小支持度閾值σmin決定了頻繁港口的數量.閾值設定較高時,頻繁港口數量較少,神經網絡結構簡單,但是保留的貨運網絡時空信息少;閾值較低時,頻繁港口數量較多,可保留更多的網絡時空信息,但是神經網絡結構過于復雜.通過分析最小支持度閾值對預測結果的影響,確定合適的取值范圍.武漢港不同支持度閾值對應頻繁港口如表2所示.
神經網絡建模同前,隱含層神經元個數在經驗范圍對比分析多次仿真選擇最優的網絡結構,不同閾值下預測效果如表3所示.
支持度閾值減小,頻繁港口數量更多,神經網絡能更好地解析頻繁港口與目標港口的時空關系,預測精度和穩定性也提升.隨著閾值進一步減小,神經網絡出現過擬合,泛化能力降低,可能是由于訓練樣本數量不足,而目前數據資源限制,無法增加更多的訓練樣本;也可能說明閾值較低的港口對目標港口貨運量預測的作用并不明顯.綜合考慮預測效果和建模成本,支持度閾值應設置在[2.0%,3.0%]范圍內,本文建模時選取σmin=2.5%.

表2 武漢港頻繁港口及支持度Tab.2 Frequent ports and support of Wuhan Port

表3 不同支持度閾值預測比較Tab.3 Comparative analysis of different support threshold
3.3.1月貨運量預測 受數據資源限制,只收集到2012年1月~2014年12月共36個月的數據.利用FR-NN模型,用前30個月29組數據訓練模型,預測第31~36月的貨運量.同時選用典型的時間序列方法:指數平滑、ARIMA、灰色預測第31~36月的貨運量,時間序列周期為12.通過分析第1~30月武漢港歷史貨運量規律,分別選擇winter可加性季節指數平滑、ARIMA(1,0,0)和GM(1,1)進行預測,結果如表4所示.

表4 月貨運量預測結果對比Tab.4 Comparison of month predicting freight volume
從預測結果來看,FR-NN模型的預測精度、穩定性和模型表現都最好,3種時間序列方法中GM(1,1)的預測精度和穩定性最好,他通過灰數尋找時間序列的變化規律,決定系數R2的參考意義不大,同時指數平滑和ARIMA模型的R2=0.765 和R2=0.883,擬合效果也較為理想.
3.3.2天貨運量預測 選取2014年7月28日~2014年12月31日共156天155組數據.運用FR-NN模型,用前139組訓練模型,最后16組驗證,與指數平滑、ARIMA、灰色預測對比分析.通過分析第1~86天武漢港歷史貨運量規律,分別選擇簡單指數平滑、ARIMA(0,0,0)和GM(1,1)進行預測.預測結果如表5所示.

表5 日貨運量預測結果對比Tab.5 Comparison of day predicting freight volume
隨著時間粒度的減小,預測精度都降低,時間序列和多元線性方法很難擬合相關關系,FR-NN的預測精度和擬合水平明顯好于時間序列方法,但是模型的解析能力也并不完全不令人滿意,繼續增加隱層節點可以略微提升決定系數但出現過擬合,需要進一步研究如何提升預測精度和模型擬合水平.
通過不同時間粒度預測分析,隨著時間粒度減小,貨運量隨機干擾增多,預測精度降低,FR-NN模型對不同時間粒度都能進行有效預測,尤其是在周和日這樣較小時間間隔上預測結果明顯優于時間序列方法.
(1)基于頻繁模式思想尋找頻繁港口可以提取水路貨運網絡主要空間關系,利用低維數據保留主要時空特征.在此基礎上建立的FR-NN模型能利用神經網絡較好地擬合頻繁港口與目標港間的貨運量時空關系.考慮時空因素的模型能提高短期貨運量預測精度,在各種時間粒度上預測效果均好于時間序列方法,尤其是可以進行時間序列難以完成的小時間粒度的周和日貨運量預測.
(2)較小的最小支持度閾值能保留較多的網絡空間信息,可以提高模型擬合效果和預測精度,但過多的頻繁港口會增大模型開銷并產生過擬合,通過對比分析,挖掘頻繁港口的最小支持度閾值σmin應設置在[2.0%,3.0%]范圍內.
(3)神經網絡通過解析頻繁港口和目標港口貨運量時空關系能進行預測,但最小支持度閾值過小和對日貨運量預測時,神經網絡明顯過擬合泛化能力反而降低,是否說明頻繁港口與目標港口貨運量時空關系存在不能夠解析的不確定的部分,后續研究將探討用灰度預測中灰度的處理方法或非參數回歸的不精確映射關系處理不確定部分,與時空因素結合進行貨運量預測.