劉軍偉,李 川,聶熠文,崔國龍,汪育苗,徐瑞昆
(1. 中國電子科技集團公司第三十八研究所,安徽合肥 230088; 2. 孔徑陣列與空間探測安徽省重點實驗室,安徽合肥 230088; 3. 電子科技大學信息與通信工程學院,四川成都 611731)
傳統雷達檢測技術主要通過利用回波能量來完成目標檢測。在實際場景中,雷達回波不僅包含目標信息,還包含諸如地雜波、海雜波、干擾等雜波及背景信息。傳統的恒虛警檢測(Constant False Alarm Rate,CFAR)方法[1-3]使用一個電平由雜波和雷達回波附近的噪聲決定的自適應門限值來發現回波中的目標。根據紐曼-皮爾遜準則,在保證虛警率下,CFAR可檢測到目標的信噪比需大于12.8 dB。由于可用于參考的單元環境有限,且受到時間、空間、頻率、功率、波形、極化、算力等資源的限制,最終捕獲的雷達目標信號能量未必能超過門限,對于微弱目標容易造成漏警/虛警。此外,傳統的目標檢測方法本質上是對回波信號進行統計分析,提取具有代表性的統計特征,通過對統計特征的判斷實現對目標的檢測。但在實際應用中,地物雜波與目標所處環境緊密相關,沙漠、海洋、高原等不同地形下雜波分布存在差異,城市、郊區等不同環境下雜波分布也不相同,森林、草原等不同植被條件下的雜波情況也各有差異,甚至不同天氣環境下雜波的分布也不盡相同。因此根據環境提供差異化、符合環境雜波特性的目標檢測方法,對于在不同環境下及時準確地發現雷達目標具有重要意義。
深度學習[4-8]是機器學習領域中一個新的研究方向。2012年基于深度學習技術實現的深度卷積神經網絡AlexNet在ImageNet大規模視覺識別挑戰賽獲得冠軍,自此基于深度學習的目標檢測方法逐漸走入研究人員的視野。目前深度學習也被廣泛應用到目標檢測中,如在沙漠環境下的SAR圖像目標檢測[9]、基于卷積神經網絡的SAR圖像車輛[10]、飛機[11]等目標的檢測。
基于深度學習的目標檢測方法可分為兩類,一類為基于候選區域方式,另一類為基于端到端[12]方式。基于候選區域的方式,目標所在區域會被作為候選窗,從候選窗中提取特征,神經網絡模型依據提取出的特征再去判斷區域中是否有目標。這種方法可以有效減少人工判斷目標特征的工作量,且可發現利用一些并不直接可視的特征,提高目標發現概率,但候選窗產生和特征提取分類步驟分離,難以實現工程實時性要求。另一種基于端到端的方式相比于候選區域方式則犧牲一定檢測精度換取工程化應用的實時性。
針對環境多樣性造成的雜波分布差異性,本文提出一種利用條件生成對抗網絡(Conditional Generative Adversarial Nets,CGAN)建立的距離-多普勒(Range-Doppler,RD)域雜波抑制處理方法,對抗式訓練一種可以從帶有雜波干擾的復雜分布中找到感興趣目標的生成模型,從而達到抑制雜波干擾,提升目標信噪比的目的。
雜波抑制的目的是保留目標的同時消除雜波干擾,從另一理想角度來說是從干擾雜波中提取感興趣目標的過程。在不發生突變的環境下,感興趣目標往往處于特定分布上,而雷達采集到的回波數據處于另一種復雜高維分布,其中隱藏著感興趣目標的分布,我們的目的就是利用CGAN網絡在高維空間的復雜雜波分布中找到目標的特定分布并將其提取放大,從而檢測。
CGAN的訓練并不是隨機生成,而是一一對應進行生成,因此考慮采用圖像解譯的思想,結合感興趣目標的分布作為生成與對抗中的監督信息輔助提取。若環境發生變化,通過網絡模型的再訓練來學習這種變化,從而達到對環境變化的及時響應,保證目標檢測效果。
生成對抗網絡是一種無監督學習方法,包含生成模型(Generator,G)和判決模型(Discriminator,D)兩個組成模塊,在相互博弈學習中獲得優化的網絡結構和參數。通過對每個小區域進行差別判別,實現對局部特征的提取和表征,之后在對抗過程中將局部特征與整體特征相融合,不斷迭代。
如圖1所示,首先以少量有標簽時域雜波/干擾抑制后的距離像作為雜波抑制模塊的輸入,順序使用傳統雷達目標檢測跟蹤方法中的動目標顯示(Moving Target Indication,MTI)和動目標檢測(Moving Target Detection,MTD)進行處理,得到RD矩陣;后將二維RD矩陣輸入生成對抗網絡進行對抗訓練;待結果收斂,輸出雜波抑制后的RD矩陣以及此時訓練所得的生成對抗網絡模型參數。

圖1 RD域雜波抑制網絡訓練過程
以距離像的二維矩陣為輸入,每一行都對應于對一個脈沖回波的連續采樣,即連續的距離單元。行中的每一個元素都是一個復數,代表一個距離單元的I通道分量以及Q通道分量,每一列代表對同一距離單元的多個脈沖測量。MTI是對矩陣的列數據(同一距離單元的數據)進行操作。當固定目標、地雜波等與運動目標處于同一距離單元時,因固定目標回波中的多普勒頻率為零。因此,若將同一距離單元在相鄰脈沖中作相減運算,則運動目標回波得以保留,可以除去零頻附近的雜波和靜止的目標。
由于雷達數據為非均勻脈沖重復間隔(Pulse Repetition Interval,PRI),所以無法對二維矩陣中列數據作傅里葉變換。目標所在距離單元的慢時域回波向量如式(1)所示:
gr=[ej2πfdt1,ej2πfdt2,…,ej2πfdtN]T
(1)
因此采取利用非均勻離散傅里葉變換(Non-Uniform Discrete Fourier Transform,NUDFT)濾波器對目標回波的相位進行相參積累。經過NUDFT處理后的數據依然為一個二維矩陣,輸入MTI進行處理。NUDFT濾波器矩陣如式(2)所示:
(2)
慢時域回波信號經過NUDFT積累后,目標所在距離單元的多普勒電平可表示為
(3)
式中,fi(i=1,2,…,N)表示多普勒域的采樣頻點,當fd=fi時,相參積累增益達到最大,最大值為1。經過數據預處理可得到兩類數據樣本,并分別按一定比例劃入訓練集和測試集。
有標簽的一維距離像和理想一維距離像為網絡訓練的輸入,其中第二類數據為引導信息,引導生成模型將第一類數據朝著理想數據去生成。生成模型給判決模型輸送包含雜波干擾的樣本,判決模型識別雜波條件下的樣本和僅有目標存在的樣本及不匹配樣本。生成的數據通過判別模型去判別與理想數據的差異,結果反饋給生成模型;生成模型再依據差異去處理包含干擾的數據。生成模型和判別模型不斷運轉和對抗,直到判別模型無法判別生成的數據是否是理想數據,即生成數據已經十分逼近理想數據,此時輸出生成器模型參數。通過生成模型與判決模型的對抗過程,CGAN在保留目標的同時去除雜波干擾。其訓練過程如圖2所示。

圖2 模型訓練過程
CGAN在生成模型和判決模型中均使用目標信息標簽進行訓練,不僅能產生僅有目標存在的特定標簽的數據,還能夠提高生成的雜波抑制后數據的質量。訓練過程中,CGAN優化函數由兩部分組成,分別為條件生成對抗網絡的誤差函數LCGAN(G,D)和生成器判別誤差函數L1(G)組成,兩者按照參數λ進行權重分配:
(4)
條件生成對抗網絡的誤差函數和生成器判別誤差函數分別為
LCGAN(G,D)=Ey[logD(y)]+
Ex,z[log(1-D(G(x,z)))]
(5)
L1(G)=Ex,y,z[‖y-G(x,z)‖1]
(6)
式中,y表示指導信息,z表示條件信息,x表示生成信息。
利用訓練好的模型對在線采集的數據進行雜波/干擾抑制。根據模型在大量無標簽基帶雷達回波數據上的表現,分析該雜波抑制網絡的泛化性能。經過該條件生成網絡處理后,目標信息在RD域的雜波和干擾得到一定程度的抑制,最終得到RD域雜波/干擾抑制后結果。將該結果作為目標檢測網絡的輸入,進而實現目標檢測的目的。測試過程如圖3所示。

圖3 模型測試過程
為了驗證基于條件生成對抗網絡的RD域雜波抑制網絡可行性,通過仿真雷達實際波形,并分別添加切片(Chopping Interleaving,CI)、彌散頻譜(Smeared Spectrum,SMSP)干擾、瑞利分布雜波和高斯白噪聲來模擬真實數據中某一個波束的回波數據;將進行預處理后得到的RD圖送入CGAN網絡進行雜波/干擾抑制,比對抑制效果,證明基于條件生成對抗網絡的RD域雜波/干擾抑制網絡可行性。
為模擬復雜電磁環境,本實驗選取新式靈巧CI和SMSP干擾。首先產生CI干擾,使用一等間距的矩形脈沖串對信號采樣,并將采樣后的信號復制到相鄰的間隙中,直到間隙被填充滿。SMSP干擾產生是利用信號載頻在脈沖寬度內隨時間線性變化這一規律產生的。先對原始信號在時域上采樣,再將時鐘頻率提高到原來的n倍,對采樣數據進行抽取并按原順序進行排序,然后對排序后的信號復制n次,便可產生SMSP干擾。
在雷達可分辨范圍內,當散射體的數目很多時,如氣象雜波、箔條干擾等,根據散射體反射信號振幅和相位的隨機特性,它們合成的回波包絡振幅服從瑞利分布。因此我們采用瑞利分布來模擬雜波分布。瑞利分布的概率密度函數為
(7)
高斯白噪聲能部分反映雷達通道中的噪聲情況,故噪聲樣式使用高斯白噪聲。高斯白噪聲的概率分布為高斯分布,其二階矩不相關而一階矩為常數,高斯分布的一維概率密度函數可表示為
(8)
通過預處理可以獲得兩類目標參數完全一致的數據,第一類數據為包含噪聲/干擾/雜波有標簽RD圖,第二類數據為理想環境下目標RD圖。實驗分為訓練模型和測試模型,其中訓練集包含600個樣本,進行200輪迭代訓練;測試集包含 8 000個樣本,進行驗證。
存在噪聲時,基于條件生成對抗網絡的雜波抑制RD圖距離維對比效果如圖4所示。圖中縱坐標為各距離段上的目標值除以整個距離段上目標最大值的歸一化結果。

圖4 高斯白噪聲模式下效果
存在瑞利分布雜波時,基于條件生成對抗網絡的雜波抑制的RD圖距離維效果如圖5所示。圖中縱坐標為各距離段上的目標值除以整個距離段上目標最大值的歸一化結果。

圖5 瑞利分布雜波環境下效果
從圖4、圖5可知,本方法在對于雜波和噪聲的抑制效果較為明顯,相同虛警率下等效檢測門限下降3.2 dB,雜波抑制效果明顯,有效突出目標。
存在CI干擾和SMSP干擾時,基于條件生成對抗網絡的雜波抑制效果分別如圖6和圖7所示。與原本RD圖相比,經CGAN網絡處理后的RD圖干擾信號幾乎清除干凈,目標信號明顯,說明本方法對于CI、SMSP干擾抑制效果顯著。

圖6 CI干擾環境下效果

圖7 SMSP干擾環境下效果
上述實驗數據表明,在新型靈巧CI和SMSP干擾、瑞利分布雜波、噪聲存在的情況下,經過CGAN網絡雜波抑制,目標信息均可得到有效增強,本方法的可行性和效果可得到驗證。此外通過對雜波抑制后輸出點跡的統計,與恒虛警檢測方法相比,點跡數減少32.3%,本方法可有效減少雜波點數目。
針對傳統目標檢測恒虛警方法對雷達微弱目標檢測性能的限制,本文提出了一種基于條件生成對抗網絡的RD域雜波抑制方法。對雷達回波數據的實驗表明,本文方法可避開12.8 dB的限制,在抑制雜波和噪聲,提升目標信號顯著度方面具有良好性能,為改善雷達雜波抑制和目標檢測效果提供新的可行途徑。