朱 剛 胥 剛
中國電子科技集團公司第二十八研究所 江蘇 南京 210007
隨著船舶業的快速發展,水上安全監管形勢越發嚴峻。準確及時地掌握對方規律,預判對手的行為特點,實現戰場態勢實時感知[1]、海上搜救和海上交通指揮是海事系統的關鍵內容。船舶實時航跡數據作為直觀反映船舶與環境、船舶與船舶的相互作用、相互影響的時空證據,其中蘊含了船舶行為模式,通過有效的方式對船舶航跡數據的挖掘,能夠為辨識船舶行為、進行有效的船舶行為監控和管理提供新的方式[2],因此,如何有效利用船舶的海量航跡數據,識別船舶運動模式,進一步輔助水上安全監管,已經成為當前海事領域的熱點課題。
由于海上船舶航跡數據無典型的相似性,難以正確選擇樣本進行標注,因此本論文采用無需標注數據的非監督學習聚類方法,對船舶歷史軌跡進行聚類,并生成航行規則模型。針對船舶運動建模,通常有基于軌跡點和基于軌跡段兩種。本課題采用基于軌跡段的方式。該方法首先依據輪廓將船舶航跡分成線段,獲取航跡點數量不等的軌跡線段集合。在每個線段中,采用起始點、結束點的運動狀態(位置、航向、航速)及變化描述船舶的運動特征。線段的集合作為密度空間聚類算法(DBSCAN)的輸入。DBSCAN 將集合中的所有點分為核心點、邊界點和噪聲點,判斷一個數據點是何種類型主要由算法中的兩個參數ε、Min Pts。ε 確定對象的領域范圍大小的半徑,Min Pts是設定的閾值[3]。
基于線段的密度空間聚類算法原理如下:假定數據集Li、Lj、Lk為數據集D中的單條線段。
(1)ε-鄰域集Nε:Nε(Li)為Li在數據集D 內所有與Li距離小于領域范圍ε的數據集合。
(2)核心線段;給定數值參數ε、Min Pts,若Nε(Li)中的數據量大于等于Min Pts,則認為Li為核心線段。
(3)直接密度可達;給定數值參數ε、Min Pts,若Lj為核心線段,Li在它的ε-鄰域集當中,則認為Li從Lj直接密度可達。
(4)密度可達:給定數值參數ε、Min Pts,若從Li到Lk直接密度可達,從Lk到Lj也直接密度可達,則認為Li到Lj密度可達。
(5)密度相連:給定數值參數ε、Min Pts 若存在Lk,Li與Lj同時從Lk密度可達,則認為Li與Lj互相密度相連。
(6)噪聲:給定數值參數ε、Min Pts,若Li與數據集D內所有數據都不密度相連,則認為Li為噪聲。
訓練數據是大量歷史航跡點,其中包含了正常航跡點和部分的異常航跡。本項目使用非監督聚類的方法,將航跡聚類,挖掘航跡線段間的關聯,剔除異常信息,針對聚類后數據進行網格訓練,生成網格區域的航向和航速特征。
3.1 數據預處理 數據預處理主要是為了剔除數據中的無效數據,避免異常值產生的偏差。數據預處理首先將歷史數據按照船舶類型進行分類,接著去除速度、位置、方向異常值;然后對航跡點位置進行坐標變換;最后對目標的航跡進行關鍵點進行提取,進行航跡抽稀處理。
3.2 航跡聚類 對預處理后的航跡數據進行聚類分析,目的是為了提取航跡中具有相似特性的航跡集,剔除離群的航跡。本文使用基于線段的密度空間聚類算法。根據數據中發現的描述對象及其關系的信息,將數據對象分組。其目標是組內的對象相互之間相似,而不同組中的對象不相似。針對不同類型的目標航跡需要單獨訓練相關屬性,并且從歷史數據中剔除異常數據。
3.3 區域網格化 區域網格化將海上區域劃分為指定區域大小的位置網格,分別訓練每個網格中航跡點總數、方向、速度的規則模型。
3.4 航線規則訓練生成 位置模型訓練的是從歷史數據中提取船舶位置規律,學習各類型艦船主要去的區域。具體方法是統計在網格化區域中的各個區域通過的船舶數量,因為船舶航路經過的網格會有大量歷史航跡點,而非正常線路的歷史航跡點很少或沒有。位置模型可輔助支持對船舶航行異常區域行為的監測。
速度模型訓練的是從歷史數據中提取船舶速度規律,學習各艘船舶在不同區域的速度分布。具體方法是通過統計直方圖和箱型圖來統計區域網格內的最大和最小速度分布。速度模型可以為船舶速度異常、疑似漂航行為提供支持。
方向模型訓練是從歷史數據中提取船舶在各位置的航向規律,學習各航道各艘船舶在不同區域的正常航向范圍,方向模型可以為船舶偏離航線行為提供支持。
本文提出一種基于非監督學習的海上目標行為分析方法,利用目標航跡的模擬數據,進行航道聚類,挖掘航跡線段間的關聯,剔除異常信息,針對聚類后數據進行網格訓練,生成網格區域的航向和航速特征,針對實時航跡數據,進行對船舶行為進行監測。
通過試驗,模擬2000批目標進行實時檢測,對航行異常區域行為的發現率是90%,對船舶速度異常的發現率是92%,對船舶偏離航線行為的發現率是95%。
當前系統主要靠人工設定規則和指揮員經驗來發現船舶的異常行為,過程比較復雜且與船舶實際航行規律存在偏差,誤報警過多,且容易遺漏船舶異常行為。本論文將機器學習方法應用到海上目標行為分析中,可以改進系統自動對船舶異常行為監控能力,提升系統的自動化和智能化水平。