謝廷堯,姜 偉,呂宇宙,葉 舟
(上海航天電子通訊設(shè)備研究所,上海 201109)
傳統(tǒng)雷達航跡起始算法,主要有兩大類:順序處理算法和批處理算法。順序處理算法以基于邏輯的方法和基于規(guī)則的方法為主[1-3]。順序處理算法在運算復(fù)雜度和空間復(fù)制度上都很低,對于硬件資源較少的雷達數(shù)據(jù)處理組件比較友好。但是,順序處理算法不適用于雜波較多的環(huán)境,對于地物雜波較重的低空目標(biāo)航跡處理,無法做到在較低的虛警率請求下有較高的發(fā)現(xiàn)概率。
批處理算法[4-6]主要以霍夫變換和基于改進霍夫變換的算法為主[7-9]。批處理算法和順序處理算法相比,批處理算法計算復(fù)雜度更高、空間復(fù)雜度也更高,但批處理算法能處理高密度雜波下的航跡起始任務(wù),比順序處理算法的魯棒性好。
傳統(tǒng)的航跡起始算法各有其優(yōu)點,但在一些方面也有所欠缺。近年來,神經(jīng)網(wǎng)絡(luò)在各方面的應(yīng)用[10-16]越來越廣泛、成熟,如何將成熟的神經(jīng)網(wǎng)絡(luò)用于航跡處理中,將是人工智能與傳統(tǒng)雷達航跡處理結(jié)合時研究的重點。本文將著重研究對于空域中是否存在航跡的判別。
傳統(tǒng)航跡處理算法建立在數(shù)學(xué)模型基礎(chǔ)上,性能的好壞與建立的數(shù)學(xué)模型、真實航跡以及環(huán)境的吻合程度有很大關(guān)系。本文提出的航跡判別算法利用真實數(shù)據(jù)訓(xùn)練航跡判別模型,所得出的航跡判別模型與真實的航跡以及環(huán)境吻合度很高,相對于傳統(tǒng)航跡處理算法更加真實。
航跡判別模型主要用到主成分分析(PCA)降維和卷積神經(jīng)網(wǎng)絡(luò)。
PCA是一種用于無監(jiān)督學(xué)習(xí)的降維方法,使用一個新的坐標(biāo)系去描述原來坐標(biāo)系中的數(shù)據(jù),舍棄原來坐標(biāo)系中不重要的分量。被保留的分量稱為主成分,因此,PCA實質(zhì)上是一種坐標(biāo)變換,如下所示:
Y=XUT,
(1)
式中,U表示原始的特征矩陣,每一行表示一個數(shù)據(jù),每一列表示一個特征。這里假設(shè)X∈Rm×n是投影矩陣每一列表示一個投影的方向,轉(zhuǎn)移矩陣U∈Rk×n,k表示降維后的特征個數(shù),X∈Rm×n表示原始數(shù)據(jù)(降維前)。
PCA降維算法主要由去平均值、協(xié)方差矩陣計算、協(xié)方差矩陣特征值與特征向量計算、特征值排序與挑選、數(shù)據(jù)特征向量構(gòu)建幾個步驟構(gòu)成。
通過PCA降維后,數(shù)據(jù)的絕大部分維度特征被保留,將方差基本為零的特征維度剔除,有利于后續(xù)的航跡判別。
航跡判別模型使用的卷積神經(jīng)網(wǎng)絡(luò)是圖像處理和自然語言處理與神經(jīng)網(wǎng)絡(luò)結(jié)合的研究重點。卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、軟分類層和輸出層組成。相對于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)將卷積層加入傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的輸入層和全連接層之間,通過卷積層,使傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的很多問題得以解決,例如網(wǎng)絡(luò)模型參數(shù)較多、神經(jīng)網(wǎng)絡(luò)最大層數(shù)限制等。
卷積神經(jīng)網(wǎng)絡(luò)的卷積層通過限制隱含單元與輸入單元的連接,使每個隱含單元只連接輸入信號的一部分相鄰區(qū)域,如圖1所示。通過卷積層,數(shù)據(jù)的鄰接關(guān)系將被卷積核提取。卷積層的主要作用是提取特征,通過卷積操作,將輸入矩陣的特征提取成卷積特征矩陣。

圖1 卷積神經(jīng)網(wǎng)絡(luò)計算示意圖Fig.1 Convolution neural network calculation diagram
在卷積神經(jīng)網(wǎng)絡(luò)提取出特征后,需要損失函數(shù)對提取出的特征進行判斷。對于航跡判別模型,在特征識別階段需要對提取出的特征經(jīng)行分類,而交叉熵?fù)p失函數(shù)在特征分類上效果很好。
交叉熵?fù)p失函數(shù)結(jié)合歸一化指數(shù)函數(shù),可以構(gòu)建利于神經(jīng)網(wǎng)絡(luò)梯度下降的凸函數(shù)。在邏輯回歸問題中,通常使用均方誤差函數(shù)作為損失函數(shù),此時損失函數(shù)如式(2)所示(沒有加入歸一化指數(shù)函數(shù)):
(2)

實際輸出在經(jīng)過歸一化指數(shù)函數(shù)之后如式(3)所示:
(3)

經(jīng)指數(shù)歸一化后的均方誤差函數(shù)如式(4)所示:
(4)


圖2 經(jīng)指數(shù)歸一化后均方誤差圖Fig.2 Mean square error graph
而使用交叉熵?fù)p失函數(shù),可以使損失函數(shù)為凸函數(shù),從而能達到全局最優(yōu)。交叉熵?fù)p失函數(shù)如式(5)所示:
(5)

本課題屬于二分類問題,相應(yīng)的交叉熵?fù)p失函數(shù)圖形如圖3所示。從圖3中可以看出,交叉熵?fù)p失函數(shù)是凸函數(shù),并且距離越大梯度也越大。所以交叉熵?fù)p失函數(shù)能使損失函數(shù)達到全局最優(yōu)并且利于損失函數(shù)的優(yōu)化。
通常在使用數(shù)據(jù)之前,會對輸入數(shù)據(jù)做標(biāo)準(zhǔn)化處理:處理后的任意一個特征在數(shù)據(jù)集中所有樣本上的均值為0、標(biāo)準(zhǔn)差為1。標(biāo)準(zhǔn)化處理輸入數(shù)據(jù)使各個特征的分布相近,更有利于訓(xùn)練出有效的模型[17]。

圖3 交叉熵?fù)p失函數(shù)示意圖Fig.3 Schematic diagram of cross entropy loss function
通常來說,數(shù)據(jù)標(biāo)準(zhǔn)化預(yù)處理對于淺層模型就足夠有效了。隨著模型訓(xùn)練的進行,當(dāng)每層中參數(shù)更新時,靠近輸出層的輸出較難出現(xiàn)劇烈變化。但對于深層神經(jīng)網(wǎng)絡(luò)來說,即使輸入數(shù)據(jù)已做標(biāo)準(zhǔn)化,訓(xùn)練中模型參數(shù)的更新依然很容易造成靠近輸出層輸出的劇烈變化。這種計算數(shù)值的不穩(wěn)定性通常難以訓(xùn)練出有效的深度模型。
為解決這一問題,提出了批量歸一化,即Batch Norml,在模型訓(xùn)練時,批量歸一化利用小批量上的均值和標(biāo)準(zhǔn)差,不斷調(diào)整神經(jīng)網(wǎng)絡(luò)中間輸出,從而使得整個神經(jīng)網(wǎng)絡(luò)在各層的中間輸出的數(shù)值更穩(wěn)定。
用于航跡判別的神經(jīng)網(wǎng)絡(luò)整體結(jié)構(gòu)如圖4所示。訓(xùn)練數(shù)據(jù)通過深度神經(jīng)網(wǎng)絡(luò)后的輸出值同真實值(標(biāo)簽)對比,使用交叉熵?fù)p失函數(shù)計算損失值,再通過梯度反向傳播來調(diào)整每一層的網(wǎng)絡(luò)參數(shù),達到訓(xùn)練目的。訓(xùn)練網(wǎng)絡(luò)由PCA預(yù)處理模塊、特征提取模塊和分類決策模塊組成。PCA模塊對數(shù)據(jù)進行降維處理,使得輸入數(shù)據(jù)具有相同的維度(由于輸入雷達的點跡個位非定長,如果不進行降維處理,會導(dǎo)致輸入神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)大小不一);特征提取模塊由2層卷積層組成,用于提取雷達點跡的特征;決策模塊由一個線性分類器組成,用于將提取到的特征進行分類,從而達到分類目的。

圖4 航跡判別神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 Structure diagram of flight path discrimination neural network
采用真實雷達數(shù)據(jù)進行訓(xùn)練與測試,部分?jǐn)?shù)據(jù)(即網(wǎng)絡(luò)輸入數(shù)據(jù)的結(jié)構(gòu))如表1所示。每一行代表一個點,總的行數(shù)等于點的個數(shù)。對于每一個點,第1列表示目標(biāo)距離,第2列表示目標(biāo)相對雷達的方位角,第3列表示目標(biāo)相對雷達俯仰角。
表1 雷達數(shù)據(jù)結(jié)構(gòu)
Tab.1 Radar data structure

距離/m方位/(°)俯仰/(°)180 00160.5212.933177 94160.4772.93317 606160.4992.944………17194160.4882.955
訓(xùn)練用標(biāo)簽由0,1組成,“0”代表樣本中不含航跡信息;“1”代表樣本中含有航跡信息。總的樣本數(shù)為339 053個,其中將30%的數(shù)據(jù)用于測試,70%的數(shù)據(jù)用于訓(xùn)練。
神經(jīng)網(wǎng)絡(luò)的超參設(shè)置如表2所示,卷積層的主要超參有卷積層的輸入通道數(shù)、輸出通道數(shù)、卷積核大小、步長以及標(biāo)準(zhǔn)化,全連接層的主要超參有輸入通道數(shù)和輸出通道數(shù)。初始batchsize設(shè)置為128,學(xué)習(xí)率設(shè)置為0.01,在訓(xùn)練400次之后學(xué)習(xí)率設(shè)置為0.005,batchsize改為64。
表2 神經(jīng)網(wǎng)絡(luò)超參設(shè)置
Tab.2 Neural network hyperparameter settings

卷積層輸入通道數(shù)輸出通道數(shù)卷積核大小步長標(biāo)準(zhǔn)化Conv111621TrueConv2163221True全連接層1922///
訓(xùn)練過程中,總共迭代1 200次,代價函數(shù)變化趨勢如圖5所示。從圖5中可以看出,隨著迭代次數(shù)增加,代價函數(shù)逐漸減小,并且減小幅度越來越小,組合基本趨于穩(wěn)定并且收斂,表明模型的訓(xùn)練是有效的。

圖5 代價函數(shù)變化趨勢Fig.5 Variation trend of cost function
在測試階段,其中30%(101 716個)測試樣本在訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)上的表現(xiàn)如表3所示。其中40 087個正樣本(樣本中存在航跡)被正確檢測出37 551個,發(fā)現(xiàn)概率為93.673 7%;61 629個負(fù)樣本(樣本中不存在航跡)被錯誤判斷2 347個,虛警率為4.099%。
表3 測試集測試結(jié)果
Tab.3 Test results of test set

預(yù)測值真實標(biāo)簽有航跡無航跡有航跡37 5512 347無航跡2 53659 282
模型的魯棒性對于模型十分重要,魯棒性越好表明模型的可重復(fù)性越好,其隨機的成分越低。通過將數(shù)據(jù)重排然后以相同的比例分配訓(xùn)練集、測試集再放入模型進行訓(xùn)練、測試,重復(fù)10次的結(jié)果如圖6所示。從圖6中可以看出,在10次重復(fù)的試驗中,準(zhǔn)確率基本穩(wěn)定在95%,說明模型的魯棒性很好,可以在實際工程中應(yīng)用。

圖6 模型魯棒性測試結(jié)果Fig.6 Model robustness test results
由于雷達的作戰(zhàn)場景多樣化,針對不同的場景,用于雷達濾波的濾波器參數(shù)也將不同。神經(jīng)網(wǎng)絡(luò)使用真實場景數(shù)據(jù)訓(xùn)練的濾波器能自適應(yīng)地匹配真實場景,能降低主觀因素對于濾波器的影響。并且,針對不同的用途,可以結(jié)合目標(biāo)與背景,訓(xùn)練專用的神經(jīng)網(wǎng)絡(luò)用于復(fù)雜環(huán)境下的航跡檢測。