








中圖分類號:U675;E91 文獻標志碼:A DOI:10.3969/j.issn.1673-3819.2025.04.007
引用格式:牟方厲,劉穎,樊子德,等.一種基于AIS數(shù)據(jù)建模分析的艦船類型識別方法[J].指揮控制與仿真,2025,47(4):40-48MOUFL,LIUY,F(xiàn)ANZD,etal.AshiptypeidentifcationmethodbasedonmodelingAISdataJ].CommandControlamp;iulation,2025,47(4) :40-48.
A ship type identification method based on modeling AIS data
MOU Fangli1 , LIU Ying2 , FAN Zide1?,DENG Yawen1, ZHU Keqing1, ZHAO Xinyu1 (1.Key Laboratory of Target Cognition and Application Technology,Aerospace Information Research Institute, Chinese Academy of Sciences,Beijing,100084,China;2. Unit 91977 ofPLA,Beijing,100089,China)
Abstract:Withthecontinuous developmentof shipinformation technology,automatic identificationsystem(AIS)playsan increasinglyimportantroleinmarine traficmanagementandshipnavigationsafety.Inthispaper,ashipidentificationmethodbasedonAISdataisproposedtosolvethe problemofmilitary-civilian typeidentificationofships.The method establishes asensitiveseaareamodelforthedistributionofkeypointsofshiptrajectories,calculatestheprobabilityofmilitary-civilian atributesofships,andconstructsacategoryclasifiertojudgethemilitary-civilianatributesofships.Theproposedmethod usescheap,al-domaincoverageandhigh frequencyAISinformationtoidentifythemilitaryandcivilian typesof ships, which can detectand warnthethreatening behaviors existing intheseaareainadvance,providesupportandauxiliarydecision-making for subsequent response and disposal.
KeyWords:AIS data;ship's military and civilian attributes;data mining;abnormal features
我國海域面積廣闊,各項涉海事業(yè)發(fā)達,海上潛在威脅往往隱藏在繁忙的民事經(jīng)濟活動中,這給海域常態(tài)化監(jiān)管、維護國家海洋權(quán)益帶來了很大挑戰(zhàn)。
艦船的軍民類別是艦船具有的重要屬性,直接體現(xiàn)了艦船目標在特定任務中的重要性和威脅程度,對進行海上目標監(jiān)視、威脅分析評估以及后續(xù)任務的指揮籌劃等方面具有重要意義。現(xiàn)有的艦船軍民類別識別主要通過光學遙感、航偵影像判別的方式,即通過圖像目標檢測方法,根據(jù)提取的艦船圖像特征進行艦船軍民類別的自動判別。然而,光學遙感、航偵等基于圖像的方法具有時效性與覆蓋率有限、受天氣影響大、觀測成本高等缺陷。
自動識別系統(tǒng)(AIS)在如今的海上交通管理和船舶航行安全中愈發(fā)重要,AIS數(shù)據(jù)具有大覆蓋區(qū)域、數(shù)據(jù)頻率高、成本低廉等特點,包含各類艦船歷史航行中的規(guī)律信息,具有很高的應用價值[1]。為解決現(xiàn)有基于遙感、航偵信息進行艦船軍民類型識別的缺陷問題,實現(xiàn)對我國廣闊海域的常態(tài)化管控,本文提出一種基于AIS數(shù)據(jù)的艦船軍民類型識別方法。所提方法利用廉價、全域覆蓋、高頻率的AIS信息,能夠?qū)S蛑写嬖诘臐撛谕{行為提前發(fā)現(xiàn)和預警,為后續(xù)的應對處置提供支撐和輔助決策,更好地保障國家海洋安全。
目前,對AIS數(shù)據(jù)的挖掘研究主要集中在以下兩個方面[2]:一是基于AIS數(shù)據(jù)的航路聚類研究,二是基于AIS數(shù)據(jù)的艦船異常行為檢測研究。AIS聚類分析是航跡分析預測、異常行為檢測、碰撞預警等AIS數(shù)據(jù)挖掘分析的基礎,該過程通過構(gòu)建航跡相似度度量并利用聚類算法實現(xiàn)對船舶航行路線和交通流的分析[3]。艦船異常行為檢測通常采用總結(jié)歸納方法建立艦船的異常行為庫,樸素貝葉斯、卡爾曼濾波、核密度估計等是常見的艦船異常行為檢測方法[4],一些基于時序網(wǎng)絡的檢測方法同樣被提出用于進行艦船異常行為的檢測[5]。艦船的加速度、平均速度和轉(zhuǎn)向率則為構(gòu)建判據(jù)的常見評價準則。現(xiàn)有的艦船異常行為檢測主要針對特定檢測場景,存在大多數(shù)因素無法直接量化以及異常特征知識庫不具有廣泛適用性的問題,對大范圍內(nèi)艦船的異常行為檢測不適用[]
以上研究展示了AIS數(shù)據(jù)在海洋管控等領(lǐng)域中的有效應用,但是在艦船的軍民類型識別問題上,目前尚未有深入的研究報道。AIS數(shù)據(jù)作為典型的地理時空大數(shù)據(jù),具有密度不均、分布復雜、頻率差異大等特性。相較而言,民用艦船AIS數(shù)據(jù)具有數(shù)據(jù)量大、分布廣、連續(xù)性強的特點;而軍用艦船AIS數(shù)據(jù)具有數(shù)據(jù)稀疏、分布不均、分散性強的特點,故需要采用不同的分析方法。由于軍用艦船與民用艦船在海域中執(zhí)行任務目的具有顯著差異,因此,如何從海量的民用艦船AIS信息中快速、有效識別出軍用艦船的AIS信息對實現(xiàn)高效的海上目標監(jiān)視、威脅分析以及后續(xù)任務的指揮籌劃等方面具有重要意義。
面向國家需求,充分發(fā)揮現(xiàn)有民用資源潛力,本文針對艦船的軍民類型識別問題,提出了一種基于AIS數(shù)據(jù)的艦船軍民類型識別方法。該方法對AIS數(shù)據(jù)進行高效航路聚類分析,建立航跡關(guān)鍵點分布的敏感海域模型,以計算艦船的軍民屬性概率,并構(gòu)建類別分類器實現(xiàn)對艦船軍民屬性的判斷。實際AIS數(shù)據(jù)集中的驗證結(jié)果表明,該方法可以實現(xiàn)基于AIS信息的艦船軍民類型識別,能夠?qū)S蛑写嬖诘臐撛谕{行為提前發(fā)現(xiàn)和預警,為后續(xù)的應對處置提供支撐和輔助決策,具有很好的應用價值。
1基于AIS信息的艦船軍民屬性識別方法
基于AIS信息的艦船軍民屬性識別問題即從海量歷史AIS數(shù)據(jù)中提取民用艦船和軍用艦船具有的特征,設計判別器實現(xiàn)對給定AIS航跡的艦船軍民屬性識別。本文方法的整體思路如下:
首先,通過對AIS數(shù)據(jù)進行投影、壓縮等方式剔除錯誤數(shù)據(jù);之后,通過基于聚類的分析方法進行海域航路建模,實現(xiàn)對具有大數(shù)據(jù)占比的民用艦船AIS特征建模;接下來,通過基于高斯混合模型的方法實現(xiàn)對具有小數(shù)據(jù)占比的軍用艦船AIS特征建模;最后,結(jié)合提取的民用、軍用艦船AIS特征,設計基于支撐向量機的分類器完成對給定AIS航跡的艦船軍民屬性識別。
為了解決基于AIS數(shù)據(jù)的艦船軍民類型識別中存在的海量AIS數(shù)據(jù)難以分析、軍民艦船數(shù)據(jù)分布極度不均衡、軍用艦船數(shù)據(jù)連續(xù)性差的難點問題,本文設計方法的基本流程如圖1所示。
圖1本文方法基本流程
Fig.1 General process of proposed method

1.1AIS數(shù)據(jù)預處理
AIS數(shù)據(jù)是一種典型的地理時空大數(shù)據(jù)。通常一艘艦船完整的AIS航跡具有數(shù)據(jù)量大、報點時空間分布不均衡等特點,導致使用原始的AIS信息進行艦船航行狀態(tài)分析具有較大的困難,也加大了算法的計算復雜度。因此,在分析AIS數(shù)據(jù)之前,需要對AIS數(shù)據(jù)進行預處理,本文采用的具體方法如下:
(1)在讀取原始的AIS數(shù)據(jù)后,我們首先將AIS數(shù)據(jù)的地理坐標轉(zhuǎn)換為墨卡托投影下的坐標,計算公式如下[7]:

其中, (lo,la) 為AIS數(shù)據(jù)的地理經(jīng)緯度坐標; (x,y) 為墨卡托投影坐標; r0 表示標準緯度平行圓的半徑; la0 表示墨卡托投影中的標準緯度; αa 表示地球橢球的赤道半徑, e1 為地球橢球的第一偏心率, q 為等量緯度。
之后,我們根據(jù)投影后AIS的航行航向和船舶航行速度進行AIS數(shù)據(jù)清洗,排除具有錯誤位置、速度或加速度的航跡數(shù)據(jù)點并將具有同一MMSI(Maritimemobileserviceidentity)代碼的AIS點關(guān)聯(lián)為同一艦船。
(2)在完成AIS異常點清洗后,我們使用道格拉斯-普客(Douglas-Peucker,DP)算法實現(xiàn)AIS航跡的壓縮[8]。DP算法是一種遞歸迭代的線狀要素抽稀算法,是目前應用最廣泛的軌跡壓縮算法。其主要思想是從原始軌跡點集 TS 中抽取關(guān)鍵特征點集 KS={K1,… Kn} ,使得在一定保留閾值 ε 下,該特征點集與原始軌跡點集形狀盡可能相似。其中, n 為壓縮后軌跡點的數(shù)目,且 Ki=(xi,yi) 。
DP 算法流程如圖2所示,其基本實現(xiàn)步驟為:

步驟1:將軌跡TS的起點和終點加入 KS
步驟2:遍歷 KS
步驟2.1:記相鄰兩點 Ki 和 Ki+1 之間的直線為基線,兩點之間的線段為子軌跡線段 Subτ={T1,…,Tm} (其中, m 為子軌跡線段的點數(shù)),計算子軌跡線段 Subr 中各點到基線的距離。
步驟2.2:取最大距離 dmax ,若 dmax?ε ,則將最大距離對應的點 Ti 記錄在集合 KS 中。
步驟3:令所有 dmax 中的最大值為 Dmax?ε ,若Dmax?ε ,重復步驟2,否則結(jié)束算法。
算法中點與基線間的距離計算可以使用如下的海倫公式獲得:

式中, a 為曲線的基線長; b?c 分別為分析點到基線兩端
點的距離: α+b+為半周長;S表示由點和基線構(gòu)成三角形的面積。
至此,完成對AIS航跡數(shù)據(jù)的預處理,我們將經(jīng)DP壓縮后得到的AIS航跡點稱為艦船的航行特征點。
1.2海域航路建模
為便于進行海域特性分析,需要對AIS航跡進行聚類。針對AIS地理大數(shù)據(jù)的特點,我們基于交通密度圖像的方法,將復雜AIS軌跡的聚類問題轉(zhuǎn)化為圖像處理問題。該方法不需要計算全部軌跡之間的相似性,綜合考慮了軌跡的局部特征和全局特征,具有適應性強、效率高的優(yōu)點,有效解決了在處理海量AIS數(shù)據(jù)時常規(guī)算法產(chǎn)生的維度災難。
通過對每個網(wǎng)格中的AIS報點進行計數(shù)來構(gòu)建航路密度圖,航路密度圖的像素值為像素區(qū)域內(nèi)AIS報點的計數(shù)值,其過程如圖3所示。
圖3海域AIS航路密度圖建模過程
Fig.3General process of constructing traffic density image

從構(gòu)建過程可知,對于某一相關(guān)區(qū)域,構(gòu)建得到的航路密度圖具有以下線性特征:

式中, Img(t) 是時間段 χt 內(nèi)構(gòu)建的航路密度圖。該特性保證了航路密度圖具有時間上的線性可疊加性,便于進行AIS數(shù)據(jù)的增量分析。
根據(jù)上述構(gòu)建過程可知,航路密度圖中較亮的區(qū)域為艦船在海域中航行的主要干路。結(jié)合AIS數(shù)據(jù)特點可知,該區(qū)域反映了民用艦船的航行特點,可作為民用艦船模式(特征曲線)提取的依據(jù)。本節(jié)建模的主要目標如圖4所示。
如圖4(a)所示,直接構(gòu)建的海域AIS航路密度圖具有大量的噪點。這些噪點反映的是少量非規(guī)律艦船的航跡,對應于航路密度圖中的高頻分量。為進行主要干路區(qū)域提取,獲得具有魯棒性的民用艦船航行特征,首先利用高斯濾波對航路密度圖中的次要航行軌

跡所在區(qū)域進行抑制:
Img1=Gf(σ)*Img0
高斯濾波器是一種線性濾波器,能夠有效抑制圖像噪聲,達到平滑圖像的目標。式中, Img1 為高斯濾波后的航路密度圖,濾波器的 Gf 方差為 σ;Img0 為原始的航路密度圖。高斯濾波器的應用目的如圖5所示,濾波后的航路密度圖如圖6(b)所示。
圖5高斯濾波器和Gabor濾波器應用目的
Fig.5General purposeofusinggaussianfilterandGaborfilter

基于恒虛警率(Constant1alarmrate,CFAR)思想,主要干路區(qū)域的提取方法如下:
RL={xL:xL?Tb},P(Tb)=α
其中, RL 為提取區(qū)域; xL 為 Img1 中的像素值; Tb 為提取閾值; P 為 Img1 的經(jīng)驗累積分布函數(shù); α 為選取的顯著性水平。
由于提取的區(qū)域也可能是主要航道以外的相交區(qū)域(如圖4所示),我們采用形態(tài)學處理和連通域分析的方法來消除這些區(qū)域:
A(xL)?A0OREc(xL)?Ec0
式中, xL 是 RL 中的連通區(qū)域; A(xL) 和 Ec(xL) 分別為區(qū)域
的面積和偏心率; A0 和 ∣Ec0 是對應的閾值常數(shù)。我們將處理后的航路密度圖記為Imgmo
至此,我們有了航路密度圖中的所有主要航道區(qū)域,如圖6(d)所示,下一步是將它們聚類并分割成不同的航行模式,獲得可以量化計算的特征曲線。
在航路密度圖中,主要干路航路的圖像紋理反映了該區(qū)域內(nèi)艦船的主要航行方向,航路的主要航行方向結(jié)合航路的空間位置便能形成該航路的航行模式特征。為便于獲得受亮度影響小、便于聚類的方向特征(圖4b中的特征曲線),構(gòu)建可以進行計算的航行特征,我們使用Gabor濾波器提取航路密度圖的紋理特征。Gabor濾波器是一種線性帶通濾波器,被廣泛應用于圖像處理中的邊緣檢測、紋理分類、特征提取和視差估計。Gabor 特征 HG 是將圖像 Imgy 與Gabor 濾波器{g(x,y∣λ,θ,ψ,σ,γ)} 進行卷積得到的具有相同濾波方向的響應向量 hg 之和:


此處,可以選擇方向參數(shù)為
5],波長為λ=[2,4,8],x表示像素的坐標,y表示像素的 y 坐標, ψ 表示相位偏移量, σ 表示高斯包絡函數(shù)方差參數(shù), γ 表示空間尺度縱橫比。
在此基礎上,我們使用基于密度的帶噪聲應用空間聚類(Density-based Spatial Clustering of ApplicationwithNoise,DBSCAN)方法利用Gabor特征對像素進行聚類。
DBSCAN算法的核心思想為構(gòu)建數(shù)據(jù)點的 ε 鄰域 Nε(p)[9] :
Nε(p)={q∈Xc∣dist(p,q)?ε}
式中, Xc 為聚類數(shù)據(jù)點集; Δdist 為定義數(shù)據(jù)點間的距離函數(shù),文中距離為 L2 范數(shù)距離。
之后,給定鄰域數(shù)據(jù)密度閾值 Mε 來獲得至少包含Mε 個數(shù)據(jù)點的數(shù)據(jù)聚類結(jié)果。
我們將這些具有相似航行航向的航線聚類成一個相同的航行模式,如圖6(e)所示。為反映航跡的空間距離,我們將位置加入圖像特征中,對每個航路模式進行二次DBSCAN聚類,進一步得到在空間上被隔離的航路,如圖6(f所示。然而,由于一些相鄰區(qū)域可能存在過度分割現(xiàn)象。因此,我們根據(jù)每個航跡的空間位置和密度對這些區(qū)域進行檢查,以實現(xiàn)更精確的分割。

我們提出以下判斷相鄰航道區(qū)域是否合并的標準:

MI 的數(shù)值越大,表示相鄰航線之間的相似性越大。其中, Ii∈[0,1] 表示由圖像特征生成的歸一化指標, wi 為對應指標的權(quán)重。
本文用區(qū)域距離指標 I1 、路線相似度 IO2 和密度相似度 I3 三個特征來計算航路間的相似度。區(qū)域距離指標 I1 使用最大-最小距離來計算兩條相鄰航路之間的空間距離;航向相似度 I? 是利用航路的平均航向角來防正獲得的一類航道區(qū)域具有過大的航向差異;密度相似度
利用航路的平均交通密度使得航道區(qū)域間的艦船流量盡量一致。
選擇合并閾值 MI0 ,并將滿足 MIgt;MI0 的相鄰航路合并,結(jié)果如圖 6(g) 和圖 6(h) 所示。完整的海域航路聚類過程如圖6所示。
在完成海域航路聚類后,圖4(b)中海域航路的特征曲線便可由聚類區(qū)域的中心曲線定義。
1.3敏感海域建模
如圖7所示,軍用艦船與民用艦船的AIS數(shù)據(jù)具有明顯不同形式分布的航行特征點。這里,我們將軍用艦船航行特征點集中分布的海域稱為敏感海域。同樣可知,1.2節(jié)建模得到的海域多為非敏感海域。為提升類型判別的準確性,我們需要對軍用艦船的航行特征點進行分析。

我們首先利用DBSCAN算法對航行特征點進行初步聚類,文中DBSCAN的參數(shù)取值為
ε=1,Mε=4
經(jīng)DBSCAN聚類后,航行特征點將被分為若干類別。我們將具有少于 Ms 個數(shù)據(jù)點的類稱為孤立類,對應于DBSCAN結(jié)果中標簽為-1的類別;將具有不少于Mε 個數(shù)據(jù)點的類稱為非孤立類,對應于DBSCAN結(jié)果中標簽不為-1的類別。
之后,對每個非孤立類根據(jù)高斯混合模型(Gaussian mixture model, GMM[10] )進行建模,即將每個非孤立類建模為

式中,
為該高斯混合模型的概率分布,
{[αk,θk],k=1,…,K} 為模型參數(shù); K 為混合模型中子高斯模型的數(shù)量; αk?0,Σαk=1 為航行特征點隸屬第k 個子高斯模型的概率; ?(x∣θk) 為第 k 個子模型的高斯分布密度函數(shù),形式如下:

其中, θk=[μk,Σk] 為子高斯模型參數(shù); D 為高斯模型的維度 σi,μk 為高斯模型的期望;
為高斯模型的協(xié)方差矩陣。
GMM模型是一個由 K 個子高斯模型組成的混合分布,表示觀測數(shù)據(jù)在總體中的概率分布。GMM模型的參數(shù)可以通過Expectation-Maximum(EM)算法進行迭代求解[1]
模型中子高斯模型的數(shù)量 K 通過優(yōu)化Akaikein-formationcriterion(AIC)信息準則[1]得到
AIC=2km-2ln(Lm)
式中, km 為模型的參數(shù)數(shù)量; Lm 為似然函數(shù)。
至此,完成了對非孤立類敏感海域分布的建模。
1.4孤立類處理方法
對于孤立類中的航行特征點,存在以下兩種可能情況:
(1)該孤立類中的航行特征點為原始航跡中的空間冗余點。
(2)該孤立類中的航行特征點為原始航跡中的曲線特征點。
上述情況可以根據(jù)孤立類中航行特征點的平均速度進行判斷,低速或靜止的航行特征點為原始航跡中的空間冗余點;而高速的航行特征點為原始航跡中的曲線特征點。下面分別進行討論:
對于情況1,此時該航行特征點對應于艦船的停泊點或駐點。故同樣需要將航行特征點按敏感海域進行建模,并使用二維高斯分布 ?(x∣ηk) )進行描述,模型參數(shù) ηk=[εk,σk] 選擇準則為: ε?k 為孤立類中心坐標,σk 為對角的協(xié)方差矩陣,其取值為進行軌跡壓縮前該類附近AIS點的協(xié)方差。
對于情況2,此時該航行特征點對應于艦船航行曲線的近似轉(zhuǎn)向點。此時,需要對該點的航行特征同構(gòu)建的航路特征進行相似性計算,統(tǒng)計該點鄰域內(nèi)曲線的曲率和平均速度,記為輔助特征 Fk 。
1.5 艦船屬性識別
經(jīng)過以上過程,我們實現(xiàn)了民用艦船航行特征和軍用艦船特征點分布敏感海域的建模。
之后,可以利用獲得的建模結(jié)果實現(xiàn)對給定艦船軍民屬性的判斷,具體方法如下:
令艦船特征點處于敏感海域的概率 PA 為

并記訓練集中軍用艦船航行特征點
的集合為{PA∣M} ;民用艦船航行特征點
的集合為 {PA∣C} ;可按支撐向量機[13](Supportvectormachine,SVM)的方法求解最優(yōu)的軍民屬性分界面判斷函數(shù):


ξi?0
其中,
為艦船第 i 個航行特征點的
為最優(yōu)的分界面判斷函數(shù)
為核函數(shù),本文中選擇為線性核; C∈R+ 為罰因子; ξi 為允許樣本的錯誤分類區(qū)域。
對艦船每個航行特征點的軍民類別判斷函數(shù)如下:
wf(pi)+b?0,yi=1
wf(pi)+blt;0yi=- 1
式中,1類代表軍用艦船; -1 類代表民用艦船。
對給定艦船軍民屬性的識別流程如圖8所示,具體描述如下:

(1)對艦船的AIS數(shù)據(jù)進行預處理和DP壓縮,得到該艦船的航行特征點;
(2)計算該艦船所有航行特征點處于敏感海域的 概率PA;
(3)根據(jù)軍民類別判斷函數(shù)判斷每個艦船航行特征點的可能軍民類別;
(4)根據(jù)投票法得到該艦船的軍民屬性,若投票法結(jié)果為軍用艦船,退出識別算法;
(5)若投票法結(jié)果為民用艦船,則計算艦船航跡與海域航路間最小距離 D?1 ,以及艦船輔助特征 Fk 與訓練集中軍用艦船 Fk 的最小距離 D2°D1 的計算過程如下:


式中, ?yk??yi?yj 表示局部匹配不同條件的符號函數(shù),當F1*(k)=F2*(k)≠0 時, yk=1 ;當 ηk=[εk,σk] 時, ?yi= 1;當
時, ?yj=1 ;此外 ,yk,yi,yj=0;α1 ,α2,α3 為權(quán)值因子, ,L(F1),L(F2),L(F1*) 分別表示F1,F(xiàn)2,F(xiàn)1* 的長度。
上述過程使用Smith-Waterman算法在獲得的AIS軌跡的模式特征向量和之間尋找最合適的局部匹配,評分標準 s 定義為

其中, F1 為海域的模式特征向量; F2 為海域的數(shù)量特征向量; ai 和 bj 代表
與
中的第 i 個元素和第 j 個元素,我們將
和
最合適的局部匹配記為 F1* 和F。
D?1 越小,則該航跡與民用艦船航跡越相似, D2 越 小,則該航跡與軍用艦船航跡越相似。
綜合最小距離 Df 定義為 D2 和 D1 的加權(quán)結(jié)果:
Df=ε2D2-ε1D1
式中, ε1,ε2 為對民用匹配和軍用匹配的置信因子。
若獲得的綜合最小距離小于給定閾值,則將該艦船標記為軍用艦船。
2 實際AIS數(shù)據(jù)驗證結(jié)果
驗證中的AIS數(shù)據(jù)集來源于第二屆“金海豚杯”算法競賽數(shù)據(jù)集[14]。該數(shù)據(jù)集由全球開源AIS數(shù)據(jù)整理制備得到。其中,民用類別數(shù)據(jù)共1915條,軍用類別數(shù)據(jù)共351條。數(shù)據(jù)的分布情況如圖1所示。
算法運行環(huán)境為Matlab2021b,訓練集與測試集的數(shù)據(jù)劃分比為8:2。研究中的對比算法為基于航行特征的艦船異常行為檢測算法[15]和基于LSTM長短期神經(jīng)網(wǎng)絡的檢測算法[5,訓練集和測試集中算法對軍民屬性的識別結(jié)果分別如表1和表2中數(shù)據(jù)所示。

表中的民用識別準確率 p1 、軍用識別準確率 p2 和綜合識別準確率 pa 分別定義如下:

式中, TPci 為檢測算法判斷為民用艦船的樣本; TPMi 為檢測算法判斷為軍用艦船的樣本; Pci 為實際民用艦船的樣本; PMi 為實際軍用艦船的樣本; λ1,λ2 為對民用檢測和軍用檢測的關(guān)注程度,文中取 λ1=0.4,λ2=0.6 0
由表中數(shù)據(jù)可知,由于數(shù)據(jù)集樣本量有限且類別不均、軍用艦船的AIS數(shù)據(jù)分布較為稀疏等原因,傳統(tǒng)的基于航行特征的艦船異常行為檢測算法和基于LSTM的時序檢測算法均難以實現(xiàn)對軍用艦船的有效識別。在訓練集上的軍用識別率分別為 42.75% 和56.34% ,綜合識別率分別為 59.70% 和 68.34% ,對軍用艦船的鑒別能力較差;所提方法在訓練集上的軍用識別率和綜合識別率分別為 85.05% 和 87.14% ,對軍用艦船的鑒別能力提升了 15% 以上。
在測試集上,傳統(tǒng)的基于航行特征的艦船異常行為檢測算法和基于LSTM的時序檢測算法產(chǎn)生了顯著的性能衰退,對軍用艦船的檢測率分別約 5% 與 12% ,幾乎無法對軍用艦船進行正確鑒別。所提方法在測試集上仍具有超過 74% 的軍用艦船識別正確率和 80% 的綜合識別準確率,該結(jié)果說明本文方法具備較好的應用效果。
3 結(jié)束語
本文針對艦船的軍民類型識別問題,提出了一種基于AIS數(shù)據(jù)的建模分析方法。該方法對AIS數(shù)據(jù)進行高效航路聚類分析,建立航跡關(guān)鍵點分布的敏感海域模型,以計算艦船的軍民屬性概率,并構(gòu)建類別分類器實現(xiàn)對艦船軍民屬性的判斷。實際AIS數(shù)據(jù)集上的驗證結(jié)果表明,所提方法可以利用廉價、全域覆蓋、高頻率的AIS信息識別艦船的軍民類型,可以對海域中存在的威脅行為進行提前發(fā)現(xiàn)和預警,為后續(xù)的應對處置提供支撐和輔助決策,更好保障國家海洋安全,具有很好的應用價值。
參考文獻:
[1]YAN R,WANG SA,CAO JN,et al. Shipping domain knowledge informed prediction and optimization in port statecontrol[J].Transportation ResearchPart B:Methodological,2021(149):52-78.
[2] MOUFL,F(xiàn)ANZD,LIXH,etal.Amethod forclusteringand analyzing vessel sailing routes efficiently fromAIS data using trafc density Images[J]. J. Mar. Sci.Eng., 2024,12(1):75.
[3] YANGD,WU L,WANG S,et al. How big data enriches maritimeresearch—acritical reviewofautomaticidentification system(AIS)data applications[J]. Transport Reviews,2019(39):755-773.
[4] ANNEKENM,F(xiàn)ISCHERY,BEYERERJ.Evaluationand comparison of anomaly detection algorithms in annotated datasetsfrom themaritime domain[C]//SaiIntelligent SystemsConference.IEEE,2015.
[5]楊帆,何正偉,何帆.基于LSTM神經(jīng)網(wǎng)絡的船舶異常 行為檢測方法[J].武漢理工大學學報(交通科學與工 程版),2019,43(5):886-892. YANGF,HEZW,HEF.Detectionmethodofabnormal shipbehaviour based onLSTM neural network[J].Journal ofWuhan UniversityofTechnology(Transportation Scienceamp;Engineering),2019,43(5):886-892.
[6] RONG H,TEIXEIRA A P,GUEDESSOARESC. Data mining approach to shipping route characterization and anomaly detection based on AIS data[J].Ocean Engineering,2020(198):106936.
LJ HCICLJ Data Assimilation for the Geosciences,2017:483-554.
[8]ZHAO L B,SHI G Y. A trajectory clustering method based on Douglas-Peucker compression and density for marine traffic pattern recognition[J]. Ocean Engineering, 2019(172) : 456-467.
[9]ESTER M, KRIEGEL H P,SANDER J,et al. A densitybased algorithm for discovering clusters in large spatial databases with noise[J]. Proceedings of the second International Conference on Knowledge Discovery and Data Mining,1996,96(34):226-231.
[10]HUANG Y H,ENGLEHARTKB,HUDGINS B,et al.A Gaussian mixture model based classification scheme for myoelectric control of powered upper limb prostheses[J]. IEEE Transactions on Bio-Medical Engineering, 2005, 52 (11):1 801-1 811.
[11]MOON T K. The expectation-maximization algorithm. IEEE signal process mag[J]. IEEE Signal Processing Magazine,1996,13(6) :47-60.
[12]POSADAD,BUCKLEY TR.Model selection and model averaginginphylogenetics:advantagesofakaike information criterion and Bayesian approaches over likelihood ratio tests[J].Systematic Biology,2004,53(5): 793-808.
[13]SUYKENS J A K,VANDEWALLE J.Least squares support vector machine classifiers[J]. Neural Processing Letters,1999,9(3):293-300.
[14]海軍第二屆\"金海豚\"杯算法挑戰(zhàn)賽海情板塊公告(含 訓練數(shù)據(jù)集、測試集)[EB/OL].[2023-11-09]. https://radars.ac. cn/web/data/getData? dataType Σ=Σ DatasetintheCompetition. Announcement of the second\" Gold Dolphin \"cup algorithm challenge competition—oceanographic conditions section(including training dataset and test set).[EB/ OL].[2023-11-09]. https://radars.ac.cn/web/data/getData?dataType
DatasetintheCompetition.
[15]段浩然.基于AIS數(shù)據(jù)的漁船異常行為檢測[D].大連 海洋大學,2023. DUAN H R.Abnormal behavior detection of fishing boats based on AIS data[D]. Dalian Ocean University,2023.
(責任編輯:李楠)