姜春磊,陳寶欣,黃 勇
(1.煙臺黃金職業學院,山東 招遠 265401;2.解放軍92337 部隊,遼寧 大連 116085;3.海軍航空大學,山東 煙臺 264000)
相干雷達系統中一般采用波束形成、脈沖壓縮、相參積累(雜波抑制)、目標檢測和目標跟蹤識別的級聯信號處理方式。相互級聯的各個處理流程之間會相互影響,即前面處理結果的好壞會直接影響后面的處理結果。然而,一般在雷達信號處理研究中都作了簡化處理,默認假設前面的信號處理結果是完美的。并且,各個處理流程對應的各種方法都有相應的模型假設。這種傳統的處理方式可以概括為基于模型驅動的級聯處理,且一般需要兩類假設。第1 類是信號模型假設,即需要確知的信號波形和特定的目標(運動)類型。比如,脈沖壓縮技術利用大時寬- 帶寬積信號可以同時提高檢測性能和距離分辨率。匹配濾波是最常用的脈沖壓縮方法,在點目標和白噪聲假設條件下可以獲得最大輸出信噪比。然而,當采樣失配、目標距離擴展時,常規的匹配濾波的性能將下降,且距離旁瓣會增強。因此,在實際中,多采用加窗處理以抑制旁瓣水平。此外,基于失配濾波的方法被提出以解決距離旁瓣和由目標多普勒造成的失配問題。第2 類是環境模型假設,即需要假設背景的分布類型、分布特性以及干擾目標數量等信息。比如,在基于模型驅動的級聯處理流程中,目標檢測一般位于脈沖壓縮之后。如果干擾目標旁瓣未得到有效解決,勢必會影響后續的檢測效果。一個較為常見的情況是,由于受大目標旁瓣的影響,大目標附近的小目標難以被檢測。另一方面,雷達目標檢測最常用的方法是基于奈曼—皮爾遜(neyman-pearson,NP)準則的恒虛警(constant false alarm ratio,CFAR)檢測器。在過去的幾十年里,CFAR 技術得到了長足的發展。然而,各種CFAR 檢測器存在的一個缺陷是:在使用這些方法時必須滿足對應的背景模型假設,如CA-CFAR 假設參考窗內的和檢測單元的所有干擾數據樣本是獨立同分布的;OS-CFAR 需要滿足參考單元的干擾目標數小于2n-k 的條件,且其余單元數據獨立同分布。CFAR 技術也難以綜合考慮目標旁瓣、多普勒失配和多目標等情況同時存在時的檢測問題。因此,在實際應用過程中,虛警概率與檢測概率的平衡需要在整個系統級層面考慮,即在檢測前通過脈沖壓縮、MTI、STAP 等提高信雜(噪)比和在檢測后通過多次的掃描判斷降低虛警。對于MIMO 雷達而言,非理想正交波形會導致上述問題更加嚴重。
近年來,以深度學習為代表的人工智能方法在圖像識別等計算機視覺領域的巨大成功,極大地促進了其在各個領域的應用。深度學習通過構建深度神經網絡(neural network,NN)在海量數據樣本中逐層抽象挖掘有用信息,極大減輕了對模型假設的依賴。在雷達領域,深度學習的一個直接應用是檢測SAR 或其他雷達圖像中的目標[1-3]。由于目標檢測的本質是一個二分類或多分類問題,因此,對于序列形式的雷達信號而言,神經網絡也可以用來近似雷達目標檢測器。文獻[4-8]分別利用神經網絡實現了雜波中的雷達目標檢測。PRASHANT 等實現了神經網絡在非高斯噪聲中的信號檢測[9]。CAI 和ZHANG 等采用時頻分布作為神經網絡的輸入實現了檢測的過程[10-11]。WANG 等將距離-多普勒譜看作圖像輸入,采用卷積神經網絡實現了目標檢測[12]。早期的研究證明了采用均方誤差的神經網絡可以用來近似貝葉斯最優判別函數和奈曼- 皮爾遜檢測器[13]。MARíA-PILAR 等對此做了大量研究[7-8]。在使用神經網絡近似NP 檢測器時,訓練時的誤差函數是確定神經網絡檢測器逼近性能的關鍵參數。文獻[14]證明了使用MSE 或交叉熵作為損失函數的神經網絡檢測器對所有可能的Pfa 是最優的。此外,還有通過神經網絡判斷背景類型以選擇采用CACFAR 還是OS-CFAR[15],或者通過CA-CFAR 或GO-CFAR 來監督神經網路的訓練,以保證在達到相應CFAR 檢測概率的前提下降低虛警率[16]。然而,上述神經網絡在雷達中的研究前提一般是基于理想的脈壓后信號,沒有綜合考慮多普勒頻移、脈壓旁瓣以及多目標對檢測結果的影響,而這些因素在實際中是難以避免的。根據神經網絡的萬能近似定理,一個具有線性輸出層和至少一個具有擠壓式激活函數作為隱層的前饋神經網絡,可以以任意非零誤差逼近從一個有限維空間到另一個有限維空間的連續波萊爾(borel)可測函數[17]。因此,理論上講,可以實現脈沖壓縮、相參積累(雜波抑制)和目標檢測的一體化處理,從而降低對各種模型假設的要求,也即信號處理的方式由模型驅動轉換到數據驅動。
當前深度學習在MIMO 雷達領域的主要應用包括:人體運動特征分析、人體姿態識別、跌倒檢測與保健檢測、自動駕駛等[18-21],當前的研究多是采用將預處理的頻譜圖像作為深度神經網絡的輸入,本文提出基于深度學習的MIMO 雷達多維目標檢測框架,通過構建三維卷積神經網絡(convolutional neural network,CNN)檢測模型,直接在接收端檢測發射波形,實現空域、時域和距離維的聯合處理。
考慮一MIMO 雷達系統,包含NT個發射陣元和NR個接收陣元,令
表示從第n 個陣元發射的長度為NW的信號。則
為全部發射信號。進一步,令
其中,L 表示感興趣的距離單元數。對于發射NP個相干脈沖的MIMO 雷達,接收的第p 個脈沖可表示為:
其中,α(l,θ)為第l 個距離單元、角度θ 處目標的復散射系數,fd為目標歸一化數字多普勒頻率,a(θ)和b(θ)分別為發射和接收導向矢量,定義為
將來自NP個脈沖的所有信號表示成三階張量的形式
式(8)所示的三階張量模型也是一般陣列雷達的推廣形式,傳統的信號處理流程包括波束形成、脈沖壓縮、雜波抑制和目標檢測。前三者的本質都是基于相關原理實現對期望信號的相參積累,并抑制非相干信號,或者可以看作是一種變換的過程,即將信號從一種域變換到另一種緊湊或抽象的表征域中,如傅里葉變換、分數階傅里葉變換等,這些變換的最終目的是為了更容易地實現分類(檢測),而任何分類器(檢測器)的性能必然會受到之前變換方法的影響。深度學習為這個問題帶來不同的解決方案,不僅可以學習分類器(檢測器),還可以直接從數據中學習所需要的變換。
本章構建基于深度學習的多維目標檢測框架,利用相關原理與卷積神經網絡的相似性,搭建了基于深度三維卷積神經網絡的多維一體化處理模型。
卷積神經網絡是一種特殊的神經網絡,由于其局部分層抽象表示的能力,在計算機視覺等領域取得了巨大的成功。卷積神經網絡成功的關鍵設計思想有兩點:1)卷積神經網絡充分利用了圖像的二維結構,而圖像上相鄰像素之間一般都是高度相關的。此外卷積結構依賴于特征共享,因此,每個通道是由相同的卷積核卷積得到的,這個結構使得卷積神經網絡的參數量大大降低。2)卷積神經網絡通過引入池化的步驟,使得網絡結構對位置偏移具有穩健性。同時,池化還允許網絡隨著深度的增加上獲得更大的視野。例如,在圖像目標識別的過程中,卷積層逐層聚焦物體的邊緣、部分和整體。這兩點與基于相關原理雷達信號處理有很多相似性,如不同陣元、不同脈沖、不同快時間采樣的目標信號之間一般也是高度相關的,卷積核與輸入互相卷積的本質仍是相關操作,池化層的作用類似于穩健波束形成的作用。此外,深度神經網絡強大的非線性映射能力為檢測具有更復雜特性的目標提供了可能性,因此,可以利用深度三維卷積神經網絡實現多維聯合目標檢測。
基于深度三維卷積神經網絡的MIMO 雷達多維目標檢測模型如下頁圖1 所示,輸入為接收的三階張量。由于雷達接收的信號一般是經過IQ 正交采樣的復信號,而一般神經網絡只能處理實數,所以需要將輸入拆分為實部和虛部兩部分,即輸入層的維度為。

圖1 基于深度三維卷積神經網絡的MIMO 雷達多維目標檢測模型Fig.1 MIMO radar multi-dimensional target detection model based on deep 3D convolutional neural network
隱含層包含多個卷積層、一個全連接層和一個Dropout 層,下面分別介紹各層的具體配置:
1)卷積層
每個卷積層由3 種運算構成,即卷積、池化和批歸一化運算。三維卷積神經網絡相對于二維卷積神經網絡增加了一維深度信息,其卷積核是一個三階張量。三維卷積的過程如圖2 所示,圖中卷積核維度為2×2×2×1(第四維為通道),與輸入張量內積得到卷積輸出,卷積的計算如式(9)所示。

圖2 三維卷積Fig.2 Three dimensional convolution
其中,ol,m,n為在l,m,n 處的特征映射,f 為激活函數,wi,j,k為卷積核權重,為前一層的輸入值。卷積層1 與輸入層采用硬連接(hardwired)的方式,卷積核大小為NP×NR×NW×N1,其中,N1表示第1 層卷積核的數量。其余卷積層的卷積核都為3×3×3,以降低計算量和參數量。
每個卷積運算后是池化運算,池化運算本質是一個降采樣的操作,仿照的是人類視覺對輸入降維和抽象的過程。池化的主要功能是保證特征不變形,降低特征維度,并具有防止過擬合的功能。常用的池化運算有最大池化和平均池化兩種。
每個卷積層的最后一個運算是批標準化(batch normalization,BN)運算,批標準化是近年來深度學習領域的重要成果,很多成熟的網絡結構中都有應用。批標準化來源于圖像白化操作,早期的計算機視覺領域研究表明對輸入圖像進行白化操作可以加快收斂速度。在深度神經網絡中,隨著網絡的加深,每一層輸入的分布在發生偏移,激活函數常常工作在取值區間的極限飽和區,導致梯度消失,收斂變慢。因此,如果在神經網絡的每一層都做歸一化處理,那么也可以加快訓練收斂過程。批標準化運算一般伴隨小批量隨機梯度下降方法(mini-batch SGD),計算過程如下
其中,NB為每個小批次的數據量,參數γ 和β 分別為尺度變換和平移變換參數,在訓練的過程中更新,用于將變換后的數據再反變換回激活函數的非線性區間,其作用是平衡輸入到輸出的線性與非線性程度。xi是批標準化的輸入,其既可以是激活函數后的輸出,也可以是激活函數之前的線性變換結果。
2)全連接層與Dropout
將最后一個卷積層的輸出平鋪成NFC×1 的一維向量后連接至全連接層,全連接層再與同維度的Dropout 層連接。Dropout 層的作用同樣是為了防止過擬合,其基本原理是通過一定的概率p 隨機抑制一部分神經元的輸出,使每次訓練的網絡結構不同,這相當于對多個不同的神經網絡取平均。由于不同的網絡會產生不同程度的過擬合,這樣多個網絡的平均會在整體上減少過擬合。
輸出層大小為LNS×1 的向量,即對應感興趣的L 個距離單元和NS 個空域單元。此時的問題就轉化為機器學習里的多標簽分類問題,由于輸出單元較多不便于分析模型的檢測概率和虛警概率,本文假設每個角度-距離單元只有一個目標,輸出層僅考慮一個待檢測的角度—距離單元,即取L=NW,待檢測單元為第NW個距離單元。
本文采用交叉熵作為損失函數,由于目標在觀測空間中一般是非常稀疏的,有目標的數據相對于無目標的數據要少得多,即訓練數據不平衡。數據不平衡會導致訓練結果雖然準確率很高,但是精確率很低,甚至可能會發生神經網絡的預測全部趨向于0。為此,采用加權交叉熵損失函數,如下
其中,α 為加權系數。有目標的數據少,則取α>1。根據文獻[14]中關于神經網絡滿足奈曼皮爾遜準則的充分條件可得
本章通過仿真構建MIMO 雷達數據集用于模型訓練和評估,MIMO 雷達仿真參數如表1 所示。最多30 個干擾目標均勻分布于-30°~30°和0~39 號距離單元內,目標信噪比變化范圍為-40~40 dB,待檢測單元為第20 號距離單元和第31 號角度單元。

表1 MIMO 雷達系統參數Table 1 MIMO radar system parameters
基于三維卷積神經網絡的MIMO 雷達檢測器含有較多超參數,如網絡層數、卷積核數量、卷積層輸出維度、Droupout 概率值和損失函數加權系數等,其中比較重要的是交叉熵損失函數的加權系數α,這里僅給出不同α 時的網絡訓練和驗證損失函數曲線,如圖3 所示。由圖可知,α 過小時,模型可以很快收斂,但此時的訓練和驗證損失都比較大,這是由于嚴重的數據不平衡問題導致網絡輸出結果傾向于樣本數量較多的類別,合理的加權值通過放大小樣本類別的損失,可以緩解不平衡樣本的訓練問題。

圖3 不同α 值的訓練與驗證損失Fig.3 Training and validation losses for different values of α
通過ROC 曲線對比分析基于常規脈沖壓縮、波束形成、相參積累和目標檢測級聯處理的方案與基于三維卷積神經網絡的MIMO 雷達一體化處理的方案,其中,級聯方案的檢測器采用單元平均恒虛警檢測器,參考單元和保護單元數分別為16 和2。待檢測目標位于第20 個距離單元,歸一化空間頻率和多普勒頻率都為0,信號信噪比定義為相對于全相參積累的信噪比增益。
3.2.1 單目標環境
首先考慮單目標時的性能差異,兩種處理方案ROC 曲線結果如圖4 所示。在單目標環境下,常規級聯處理的單元平均恒虛警檢測器仍可看作是最優檢測器,此時基于深度學習的檢測器與級聯處理的檢測結果相差不大。

圖4 單目標時兩種處理方案的ROC 曲線Fig.4 ROC curves of two processing schemes for one single target
3.2.2 鄰近角度單元干擾目標
考慮鄰近角度單元有一干擾目標,干擾目標的距離與待檢測目標相同,角度為5°,多普勒頻率為0。兩種處理方案的性能曲線如圖5 所示,由于干擾目標角度和距離旁瓣的影響,兩種處理方案的檢測性能都開始下降,但是深度學習檢測器要明顯優于常規級聯處理。

圖5 鄰近角度單元目標干擾時的ROC 曲線Fig.5 ROC curves when adjacent angle cells exist interference targets
3.2.3 鄰近角度單元隨機干擾目標
考慮鄰近干擾目標的角度在-30°~30°隨機變化,且不等于0°,干擾目標的距離與待檢測目標相同,多普勒頻率為0。兩種處理方案的性能曲線如圖6 所示,常規級聯處理的性能嚴重下降,深度學習檢測器雖也有下降,但是要顯著優于前者。

圖6 干擾目標角度隨機時的ROC 曲線Fig.6 ROC curves when interference targets angles are random
如果干擾目標角度、距離、多普勒、數量、強度和雜波等因素都隨機變化時,常規基于模型驅動的級聯處理方案的性能將進一步下降,基于深度學習的多維數據驅動方案,為應對這種復雜情況提供了新的解決思路,可以在一定程度上降低對各種模型假設的要求。在實時性方面,盡管深度學習方法提供了一種革命性的數據驅動方法,但這些方法具有顯著的計算復雜性。為便于統計分析深度學習方法與傳統方法的性能,本文在仿真中作了適當的限定,如陣元數量、脈沖數量、目標范圍等。近年來,由于功能強大的圖形處理單元(GPU)和張量處理器(TPU)的可用性,這些方法的實現成為可能,神經網絡可利用其內部的計算提高訓練和預測的實時性。由于涉及的影響因素眾多,難以全面比較分析,本文僅是從仿真的角度,驗證了深度學習對MIMO 雷達多維一體化處理的可行性和有效性,后續研究應該從更高效的網絡結構和與傳統方法相結合等角度考慮。
傳統基于模型驅動的級聯處理方法對模型假設依賴嚴重,如果數據與假設模型不符,則處理性將下降,為此,本文引入了基于深度學習的數據驅動的方法,實現了MIMO 雷達多維一體化處理。構建了基于三維卷積神經網絡的MIMO 雷達多維一體化處理架構,并評估了一體化處理相對于級聯處理的性能。實驗結果表明基于深度學習的多維一體化處理的有效性。