史方敏,郝永志,2
(1.浙江國際海運職業技術學院航海工程學院,浙江舟山 316021;2.上海海事大學商船學院,上海 201306)
全球貨物貿易絕大部分都需要通過船舶運輸來完成,經濟一體化的發展趨勢帶來了航運業的變化,使航運業出現了貿易貨物標準化管理、裝卸、運輸的趨勢,推進了船舶技術的不斷變革[1]。但在船舶技術變革的過程中,存在船舶航行效率較低、無法克服復雜的海上環境等多種問題[2]。針對這種情況,人們將注意力集中在怎樣減少人力、物力損失以及實現智能化船舶控制等問題上,而對于航線規劃等問題則缺乏關注。事實上,航線規劃問題與船舶操縱智能化水平息息相關,對于實現船舶快速、經濟、安全航行可以說是至關重要。為了實現船舶的智能航線規劃,需要對船舶航行水域航線調度信息進行采集。國內外都十分重視對船舶航行水域航線調度信息的采集問題。在國外研究中,致力于將數據挖掘、機器學習、人工智能等技術與理論應用到航運數據智能應用與分析上,以進行船舶航行水域航線調度信息采集,金輝等[3]提出1 種基于高斯混合模型的船舶航行水域航線調度信息采集方法,主要通過高斯混合模型構建船舶航行水域航線調度信息采集模型進行船舶航行水域航線調度信息的采集。在國內,對于船舶航行水域航線調度信息采集的研究則相對起步較晚,最早開始通過借鑒國外的研究成果進行相關研究,接著主要集中于對船舶航行水域航線調度信息的捕捉與預測等方向進行研究,冉明華[4]提出一種基于DSP(digital signal processing)技術的船舶航行水域航線調度信息采集方法,主要通過DSP 技術實現船舶航行水域航線調度信息的采集。但是,在利用以上方法進行船舶航行水域航線調度信息的采集時,受軌跡數據中存在缺失值與異常數據的影響而無法進行數據壓縮,導致船舶在航行過程中的航線轉向點存在識別率較低的問題。因此,本文提出一種基于ECDIS 平臺的船舶航行水域航線調度信息采集方法。基于Hadoop 大數據處理框架提取船舶軌跡數據,對軌跡數據進行預處理,并利用D-P 壓縮方法對軌跡數據進行壓縮,利用ECDIS 系統平臺進行船舶航行水域航線的軌跡調度信息采集。
首先獲取AIS(automatic identification system)報文里的UTC 時間、船寬、船長、對水速度、對地速度、航向、船舶位置、MMSI(maritime mobile service identify)碼等船舶軌跡數據[5]。利用AIS 系統(船舶自動識別系統)對船舶進行解碼識別,并將其導入SHIPDB 數據庫中。并對需要的船舶軌跡數據基于Hadoop 大數據處理框架進行提取[6]。根據船舶實際航行狀態提取船舶軌跡數據,將原始的船舶軌跡數據序列設為T={p1,p2,p3,……pn},則具體提取步驟如下:第一步:對原始的船舶軌跡數據序列集合進行初始化處理;第二步:對原始的船舶軌跡數據序列進行遍歷,一直到找到pj這一數據點,該數據點的對應航行狀態是錨泊;第三步:從pj這一數據點開始向下進行遍歷,一直到找到pk這一數據點,該數據點的對應航行狀態是在航[7]。第四步:重新構建1 個軌跡序列s={pj,pj+1,pj+2,……pk-1},將重新構建的軌跡序列添加到原始的船舶軌跡數據序列集合中,將k 作為新的起點對第二步進行重復,一直到完成所有數據點的偏離[7]。
提取到所需的船舶軌跡數據信息如表1 所示。

表1 提取到所需的船舶軌跡數據信息Tab.1 The required ship track data information is extracted
首先運用均值插補法對提取的船舶軌跡數據實施缺失值處理。將提取的船舶軌跡數據整體視為線性軌跡[8],利用缺失數據的2 個相鄰的已知數據D-P 壓縮缺失數據[9]。將缺失數據設為(ti,pti),其中pti代表缺失值;ti代表缺失數據所對應的時間。缺失數據的2 個相鄰的已知數據分別為(tk,ptk)與(tm,ptm),利用這2 個數據點對pti進行擬合,以對缺失值進行填補。插補公式見式(1)。

接著對提取的船舶軌跡數據中的異常數據進行處理,包括軌跡點漂移情況、軌跡稀疏情況以及航線過短情況[10]。對于軌跡稀疏情況與航線過短情況需要直接放棄[11]。
對于軌跡點漂移情況,需要對其進行D-P 壓縮處理,以軌跡變化情況為依據對軌跡點漂移情況進行識別[12]。將當前軌跡點設為Ti,當Ti與其前后的軌跡點距離較大時,則認為其為軌跡漂移點,通過Ti前后的軌跡點對直線進行擬合。軌跡點漂移情況及擬合后的軌跡點情況示意圖如圖1 所示。

圖1 軌跡點漂移情況及擬合后的軌跡點情況示意圖Fig.1 The drift of track points and the sketch diagram of track points after fitting
接著利用D-P 壓縮方法對船舶軌跡數據實施壓縮處理,具體處理流程如下:
(1)對軌跡序列中各軌跡點進行逐個掃描,獲取相鄰子段間的平均速率和角度變化值[13]。
(2)對航向變化率或航向變化進行判斷,當其超越閾值時直接存入軌跡特征點航向數據庫內[14]。
(3)當航速和航向都比閾值小,對下一個軌跡點進行掃描,對其是否為最后一個船舶軌跡點進行判斷[15],當確定其是最后一個船舶軌跡點,將其直接存入軌跡特征點航向數據庫內,結束壓縮流程;否則繼續對下一個軌跡點進行掃描。
在上述所得船舶軌跡數據的基礎上,利用ECDIS 系統平臺進行船舶航行水域航線的軌跡調度信息采集,從而利用采集的軌跡調度信息自動生成水域航線[16]。首先利用ECDIS 基礎顯示平臺構建ENC(environmental noise cancellation) 數據模型,ENC 是指由海道測量機構或其他相關政府機構制定的矢量電子海圖,如圖2 所示。

圖2 ENC 數據模型Fig.2 ENC data model
通過ENC 數據模型[17]對壓縮后的船舶軌跡數據進行記錄分析,采集壓縮后的船舶軌跡數據中的5 種船舶航行水域航線調度記錄[18],在其中提取船舶航行水域航線軌跡調度信息,具體如表2 所示。

表2 提取的船舶航行水域航線軌跡調度信息Tab.2 The route track scheduling information extracted from the navigation area of the ship
為證明設計的基于ECDIS 平臺的船舶航行水域航線調度信息采集方法的性能,對其進行實驗驗證。實驗中船舶航行水域為某海峽水域,收集該海峽水域的50 248 條船舶軌跡數據作為實驗數據。船舶速度、航跡向和船舶轉向點是航線規劃信息采集中的重要因素,統計不同船舶速度和航向數據并進行壓縮篩選,匹配ENC 數據模型,從而獲取水域航線軌跡調度信息。該海峽水域的最大速度、平均速度及交通流速度等相關速度數據如圖3~5 所示。最大速度是指船舶在該海峽水域的最大行駛速度;平均速度是指船舶在該海峽水域的平均行駛速度;交通流速度是指船舶在該海峽水域上連續行駛形成的船舶流量速度。

圖3 該海峽水域的最大速度分布Fig.3 Maximum velocity distribution in the channel

圖4 該海峽水域的平均速度分布Fig.4 Mean velocity distribution in the channel

圖5 該海峽水域的交通流速度分布Fig.5 Velocity distribution of traffic flow in the channel
該海峽水域內的實際速度分布具體如圖6 所示。實際速度是指船舶在該海峽水域受到水流壓力等因素的影響而實際航行的速度。獲取該海峽水域的實際航向分布特征,具體如表3 所示。

表3 該海峽水域的實際航向分布特征Tab.3 The actual course distribution characteristics of the channel waters

圖6 該海峽水域內的實際速度分布Fig.6 The actual velocity distribution in the waters of the channel
對該海峽水域的航跡向實施統計分析,具體結果如圖7 所示。

圖7 航跡向統計分析結果Fig.7 Statistical analysis results of track direction
利用設計的基于ECDIS 平臺的船舶航行水域航線調度信息采集方法針對該海峽水域進行船舶航行水域航線軌跡調度信息采集實驗。為避免本次實驗結果過于單一,將原有的2 種方法作為實驗中的對比方法,分別為基于DSP 技術、基于高斯混合模型的船舶航行水域航線調度信息采集方法。DSP 技術是基于數字信號處理的船舶信息采集系統,這種方法進行航線調度信息的采集時,受軌跡數據中存在缺失值與異常數據的影響,航線轉向點存在識別率較低。高斯混合模型是一個常用的描述混合密度分布的模型,通過刻畫參數空間中數據的分布及其特性,用高斯概率密度函數量化事物,它是一個將事物分解為K 個基于高斯概率密度函數的線性組合而形成的模型。
運用這3 種方法進行實驗,船舶在航行中轉舵改變航向時的地點叫轉向點,轉向點識別率越高,船舶水域航線調度能力越高,對航線調度信息采集具有重要意義,選用該海峽水域內具有20~30 個船舶航線的轉向點識別率數據作為對比實驗數據。
當船舶轉向點為20~25 個時,基于ECDIS 平臺的船舶航行水域航線調度信息采集方法與基于DSP 技術、基于高斯混合模型的船舶航行水域航線調度信息采集方法的航線轉向點識別率對比實驗數據具體如表4 所示。

表4 航線轉向點識別率對比實驗數據Tab.4 Comparison experimental data of recognition rate of course turning point
根據表4 的航線轉向點識別率對比實驗數據可知,基于ECDIS 平臺的船舶航行水域航線調度信息采集方法的航線轉向點識別率普遍高于92%,相比基于DSP 技術、基于高斯混合模型的船舶航行水域航線調度信息采集方法,基于ECDIS 平臺的船舶航行水域航線調度信息采集方法的航線轉向點識別率較高。
當船舶轉向點為26~30 個時,基于ECDIS 平臺的船舶航行水域航線調度信息采集方法與基于DSP 技術、基于高斯混合模型的船舶航行水域航線調度信息采集方法的航線轉向點識別率對比實驗數據具體如表5 所示。

表5 航線轉向點識別率對比實驗數據Tab.5 Comparison experimental data of recognition rate of course turning point
由表5 的航線轉向點識別率對比實驗數據可知,基于ECDIS 平臺的船舶航行水域航線調度信息采集方法的航線轉向點識別率高于基于DSP 技術、基于高斯混合模型的船舶航行水域航線調度信息采集方法。這是因為本文方法利用ECDIS 系統平臺采集船舶航行水域航線軌跡調度信息,提高航向轉向點識別率。
本研究提出1 種基于ECDIS 平臺的船舶航行水域航線調度信息采集的新方法。運用AIS 系統獲取船舶實際航行軌跡數據信息,提取所需要的船舶軌跡數據進行分析,并對該數據進行預處理和壓縮處理,利用ECDIS 系統平臺采集船舶航行水域航線軌跡調度信息,從而實現了航線軌跡調度信息采集。最后進行實驗研究,得到結果顯示基于ECDIS 平臺的船舶航行水域航線調度信息采集方法實現了航線轉向點識別率的提升,對于船舶水域航線調度信息采集有很大意義。