趙文文 胡志華 魏 晨
(上海海事大學物流研究中心 上海 201306)
隨著世界經(jīng)濟發(fā)展,海上貿易量顯著增長,海上交通壓力不斷增加,船舶交通事故頻發(fā)。歐洲安全局2017年發(fā)布的年度海上傷亡事故概況顯示,在統(tǒng)計的16 500起海難事故中,百分之五十以上的海難事故由船舶航行導致,如船舶碰撞與觸礁。分析船舶海上航行特征與軌跡周期性,是提高船舶航行安全管理水平的重要方法。船舶行船周期是一種船舶行為,基于船舶自動識別系統(tǒng)AIS數(shù)據(jù)識別船舶周期,對預測船舶位置、預警船舶行駛異常,具有重要實踐意義。
AIS是基于船舶作業(yè)信息采集設備而構建的海上船舶數(shù)字助航系統(tǒng),AIS數(shù)據(jù)廣泛應用于船舶監(jiān)控[1-2]、船舶防碰[3]、船舶行為預測[4]與環(huán)境保護[5-6]等方面。船載AIS數(shù)據(jù)是記錄船舶航行與作業(yè)信息的大規(guī)模數(shù)據(jù),包含船舶行為特征與航行規(guī)律[7],分析和計算AIS數(shù)據(jù),是研究船舶行為特點的重要方法。
船舶行為的作業(yè)特點與數(shù)值特征受到部分學者關注。文獻[8]等利用隱馬爾可夫模型和BAUM-WELCH算法,統(tǒng)計并分析船舶入港時的行為特點,確定船舶行為是否異常,對異常行為發(fā)出預警,保護港口設施和人員。文獻[9]等基于港口海文地圖和船舶軌跡建立船舶行為模型,分類和識別在港活動船舶。文獻[10]等對通過港口周圍擁擠航道的船只航行行為進行預測。文獻[11]等基于動態(tài)貝葉斯網(wǎng)絡建立船舶行為識別系統(tǒng),預警港口船舶異常行為,并針對異常類型設計解決方案。在航運領域,船舶行為的研究主要集中在港口。與船舶在港口行為的研究相比,船舶航行行為的研究相對較少。因此,本文對船舶航行周期行為進行研究。
船舶航線指在兩個或多個港口之間,運輸旅客和貨物的船舶線路。船舶航線類型根據(jù)航線有效時間、運力與組織形式等標準進行劃分。以航線有效時間段為依據(jù),船舶航線可分為季節(jié)性航線和常年航線;以運力為依據(jù),船舶航線可分為主干航線和分支航線;以組織形式為依據(jù),船舶航線可分為直達航線與中轉航線。
受到環(huán)境與航行條件影響,同一船舶在??扛劭?、貨物需求等因素相同的情況下,其航線也會發(fā)生變化。此外,港口當?shù)乇O(jiān)管政策、港口作業(yè)人員行為以及水路特征等因素均會影響船舶行為[12]。因此,有效識別船舶周期,有利于分析船舶行為特點,為掌握船舶航行規(guī)律、預警船舶異常行為、改進助航設備以及管理船舶交通提供幫助。
船舶AIS提供船舶靜態(tài)數(shù)據(jù)、船舶動態(tài)數(shù)據(jù)和船舶航程數(shù)據(jù)。船舶靜態(tài)數(shù)據(jù)包括船名、呼號、MMSI、IMO、船舶類型、船長和船寬等;船舶動態(tài)數(shù)據(jù)包括經(jīng)度、緯度、船首向、航跡向和航速等;船舶航程數(shù)據(jù)包括船舶狀態(tài)、吃水和目的地等。其中,船舶動態(tài)數(shù)據(jù)是船舶位置經(jīng)緯數(shù)據(jù)的主要來源。本文基于船舶AIS數(shù)據(jù)中的經(jīng)緯度數(shù)據(jù),對船舶周期行為進行識別。
船舶航行軌跡是經(jīng)度與緯度的有序集合,表示為公式所示:
U={(λ1,φ1),…,(λn,φn),…,(λN,φN)}
(1)
式中:U為船舶軌跡點集合;N為船舶軌跡序列長度,表示在軌跡段U中,共有N個船舶軌跡點,n=1,2,…,N;λn為第n個船舶軌跡點的經(jīng)度;φn為第n個船舶軌跡點的緯度。
AIS數(shù)據(jù)在傳輸過程中,信號可能受到多種因素的干擾,如河岸和建筑物的遮擋、基站信號不穩(wěn)定或周圍其他船舶信號的干擾等。在這些情況下,信息傳輸很容易出現(xiàn)錯誤,因此首先對原始數(shù)據(jù)進行清洗。結合文獻[13]等在對內河航道船舶軌跡進行恢復時清洗AIS數(shù)據(jù)的方法,本文從剔除重復數(shù)據(jù)、剔除范圍異常數(shù)據(jù)、剔除船舶速度異常數(shù)據(jù)和剔除船舶航向異常數(shù)據(jù)四個方面對AIS數(shù)據(jù)進行清洗。
2.1.1 剔除重復數(shù)據(jù)
船舶兩個連續(xù)軌跡點A(λn,φn)和點B(λn+1,φn+1),計算兩軌跡點間距離,計算方法如下[14]:
δn= 111 199[(φn-φn+1)2+(λn-λn+1)2·
(2)
式中:δn表示第n個與第n+1個船舶軌跡點間的距離,單位為m;λ表示經(jīng)度;φ表示緯度。
由式(2)可知,δn=0的唯一條件是λn=λn+1且φn=φn+1。因此,剔除重復數(shù)據(jù)的主要思想如下:首先比較第一個船舶軌跡點和第二個船舶軌跡點是否為重復軌跡點,利用式(2)得到δn,判斷δn是否等于0。若δn=0,說明兩個軌跡點經(jīng)緯度數(shù)據(jù)相同,此時剔除第二個軌跡點;若δn≠0,則兩個軌跡點均保留。相同方法對兩兩軌跡點間的距離進行判斷,直到遍歷完所有經(jīng)緯度數(shù)據(jù)組。
2.1.2 剔除范圍異常數(shù)據(jù)
假設船舶某軌跡點(λn,φn),船舶航行經(jīng)度范圍為[λmin,λmax],緯度范圍為[φmin,φmax],若船舶軌跡點坐標符合規(guī)則式(3)中的任意一條,則將其作為范圍異常數(shù)據(jù)剔除。
λn<λmin
φn<φmin
λn>λmax
φn>φmax
(3)
式中:λmin、φmin表示經(jīng)緯度范圍的最小值,λmax、φmax表示經(jīng)緯度范圍的最大值。
2.1.3 剔除船舶速度異常數(shù)據(jù)
式(2)給出了計算船舶兩軌跡點間距離的方法,兩軌跡點間船舶速度計算式如下[14]:
(4)

Input: 船舶軌跡點、速度及預測速度集合
m=1;
whilem<=n
V(m,:)=[ ];

else
m=m+1;
end
end
2.1.4 剔除船舶航向異常數(shù)據(jù)
已知船舶三個連續(xù)軌跡點M(λ1,φ1)、N(λ2,φ2)、P(λ3,φ3),船舶航向變化如圖1所示,∠γ為船舶從M點到N點的航向變化角,∠γ的求解過程如圖1所示。

圖1 船舶航向變化示意圖
步驟1求出由點M、N、P確定的唯一圓心O的坐標。分別作線段MN和NP的中垂線,相交得到點O,假設點O的坐標為(λx,φx),得到方程組如下:
(5)
對方程組進行求解,得到λx和φx如下:
(6)
式中:A=φ12-λ22-λ12-φ22,B=φ22+λ32-λ22-φ32。
步驟2假設船舶以速度v1完成整個圓周運動所用時間為T1,以速度v2完成整個圓周運動所用時間為T2。v1表示船舶經(jīng)過M、N兩點間的速度,v2表示船舶經(jīng)過N、P兩點間的速度,R表示圓周半徑。T1、T2的表示方式如下:
(7)
步驟3∠γ的求解公式如下:
(8)
利用2.1.3節(jié)中確定閾值εn和剔除速度異常點的方法,確定閾值θn,從而對船舶航向異常點進行剔除。
2.2.1 確定港口點
尋找可能的港口位置,應從時間和速度兩個方面來考慮。首先,若船舶在一個地方??繒r間較長,此處就有可能是港口,因此要對船舶??繒r間進行合理假設。其次,船舶??吭诟劭跁r理論上應靜止不動,但由于受到風、浪、流的聯(lián)合作用,船舶會有極小范圍的速度變化。符合以上兩個條件的位置點可初步認為是港口所在地。
(1) 船舶在港時間 由于該船舶所裝貨物類型、噸位等具體信息未知,且船舶在港總停泊時間中包含了自然因素停泊時間等不可預知的時間,因此在對船舶在港時間進行合理假設。
船舶在港口中的主要作業(yè)為裝卸作業(yè)。經(jīng)試驗,假設該船舶平均裝卸貨物為6 000噸,船舶平均每裝卸千噸貨在港停泊時間為0.25天,則船舶裝卸作業(yè)時間T裝=0.25×6=1.5(天)。式中,T裝代表船舶裝卸作業(yè)時間??紤]到非生產(chǎn)性停泊、自然因素等不可預知因素,初步確定在港總停泊時間至少為1.5天,即在尋找可能港口位置時,船舶在某處停泊1.5天或以上的時間時,才考慮該處為港口所在位置。
(2) 船舶在港速度 船舶停泊時,理論上應靜止不動。但在實際情況中,由于受到風、浪、流的聯(lián)合作用,船舶將發(fā)生橫蕩、縱蕩、垂蕩、橫搖等六個自由度方向的運動,在這種情況下,假設船舶在港速度為1×10-3m/s左右。
符合以上兩個條件的位置初步認為是港口所在地,將所選取位置的經(jīng)緯度輸入Google earth中進行驗證和調整,得到港口點集合。假設得到的港口點集合為:
Z={(λa,φa),(λb,φb),(λc,φc)}
已知船舶航行軌跡為U={(λ1,φ1),…,(λn,φn),…,(λN,φN)},此時船舶各段子軌跡的表示方式如下:
(9)
2.2.2 識別船舶航行周期
利用軌跡相似性來識別船舶航行周期。在判定軌跡相似性的研究中,歐式距離是度量相似性的經(jīng)典方法[15],但其只能應用于軌跡長度相等的情況,且未考慮到軌跡中的每一個特征點;DTW距離適用于求解連續(xù)時間序列的相似性;Hausdorff距離沒有考慮到曲線走勢[16]。船舶分段子軌跡長度不一,且數(shù)據(jù)為離散點,因此本文采用Fréchet距離法求解軌跡相似性。
Fréchet距離是法國數(shù)學家Maurice Fréchet提出的一種路徑相似性描述方法。假設A、B是空間S上的兩條曲線,A:[0,1]→S,B:[0,1]→S。其Fréchet距離的數(shù)學定義如下:

(10)

本文中,曲線A、B即為船舶任意兩條子軌跡。計算船舶子軌跡的Fréchet距離,距離最小的認為兩條軌跡相似,即船舶在該段航行中具有周期性。
本文以MMSI號為566906000的船舶作為研究對象,應用船舶在2014年1月15日至2014年11月18日的AIS數(shù)據(jù)對船舶航行周期進行分析識別。MMSI號即水上移動通信業(yè)務標識碼(Maritime Mobile Service Identify),是船舶無線電通信系統(tǒng)在其無線電信道上發(fā)送的,能獨特識別各類臺站和成組呼叫臺站的一列九位數(shù)字碼。時間戳是指格林威治時間1970年01月01日00時00分00秒(北京時間1970年01月01日08時00分00秒)起至現(xiàn)在的總秒數(shù)。每一組數(shù)據(jù)包括時間戳、經(jīng)緯和緯度。圖2所示為船舶航行軌跡圖。

圖2 船舶航行軌跡圖
(1) 確定港口點 對原始數(shù)據(jù)進行預處理后,得到船舶??扛劭邳c如表1所示。

表1 船舶停靠港口點匯總
對于表中經(jīng)緯度數(shù)據(jù),經(jīng)度在前,緯度在后。東經(jīng)為正,西經(jīng)為負;北緯為正,南緯為負。
(2) 船舶軌跡分段 由表1可知,船舶航行路線為:Mombasa Port → Dar es Salaam Port → Durban Port → Maputo Port → Singapore Port → 天津港 → Singapore Port → Al Khobar Port → Singapore Port → 大連港 → 上海港 → 大連港 → Singapore Port → Maputo Port → Durban Port。依據(jù)港口點將船舶航行軌跡分段,共分為14段子軌跡,表示方式如表2所示。

表2 船舶子軌跡表示方式
(3) 船舶子軌跡Frechet距離 船舶子軌跡Frechet距離的計算結果如表3所示。
由表4可知,子軌跡3與14、子軌跡4與13、子軌跡5與6、子軌跡7與8、子軌跡9與12以及子軌跡10與11極其相似,最終結果如表4所示。
由表4可知,2014年1月15日至2014年11月18日的航行過程中,MMSI號為566906000的船舶在德班港與馬普托港,新加坡港與馬普托港、天津港、胡拜爾港、大連港以及大連港與上海港之間存在航行周期。
以船舶308天的AIS數(shù)據(jù)為基礎,對船舶航行周期進行識別。在對原始數(shù)據(jù)進行重復和異常數(shù)據(jù)的剔除后,確定出Mombasa Port(蒙巴薩港)等9個港口點,并將船舶航行軌跡分為14段子軌跡。對子軌跡進行Frechet距離的兩兩求解,最終得到船舶在各港口之間的周期性。結果表明,該方法可識別出船舶在不同港口間的航行周期,可行有效。
后續(xù)研究將對多條船舶的航行周期進行分析,依據(jù)航行周期可對船舶進行分類,為分析船舶行為提供進一步的理論依據(jù)。