徐桂光, 王旭東,*, 汪 飛, 胡國兵, 高涌荇, 羅澤虎
(1. 南京航空航天大學電子信息工程學院/集成電路學院, 江蘇 南京 211106;2. 金陵科技學院電子信息工程學院, 江蘇 南京 211169)
低截獲概率(low probability of intercept, LPI)雷達利用發射波形的特殊調制特征可防止被非合作截獲接收機的截獲和檢測,在現代化戰爭中被廣泛應用。
隨著深度學習在計算機視覺、語音識別、文本理解等領域的廣泛應用,國內外學者已將深度學習與時頻分析應用于LPI雷達信號的特征提取與識別[1-6]。這些方法先將雷達信號轉換為時頻圖像(time-frequency image, TFI),再用深度學習網絡對TFI進行特征提取和辨識,已取得良好效果。
Zhang等[7]提出一種基于時頻分析和卷積神經網絡(convolutional neural network, CNN)的方法,實現了對8種LPI雷達脈內調制信號的識別;在信噪比(signal to noise ratio, SNR)為-2 dB時,對8種雷達信號的識別準確率達到94.5%。但是,該方法除Frank編碼之外,并沒有考慮LPI雷達中4種多相編碼信號(P1~P4)。另外,由于低SNR下二進制相移鍵控(binary phase shift keying, BPSK)波形和T1編碼在時頻圖上具有相似的特征,不利于識別。所以文中針對BPSK波形用了多個連續脈沖內的數據,而其他的波形數據都是采用單脈沖的,進而制造了不相似特征,這都限制該方法在實際中的運用。此外,輸入格式和網絡超參數與手寫數字識別任務的參數相同,僅對全連接層進行了修改,且低SNR下使用二值化處理會導致TFI信息損失嚴重。郭立民等[8]提出基于棧式自編碼器(stacked sparse autoencoder,sSAE)和時頻分析的雷達信號識別算法,能夠實現對8種常見LPI雷達信號的識別。雖然取得了較好的結果,但依舊沒有考慮LPI雷達信號中易混淆的多相編碼信號。Qu等[9]使用Cohen類時頻分布、圖像處理和卷積神經網絡識別12種雷達調制信號。雖然在低SNR條件下,取得了很好的識別效果,但該方法仍以二值圖像作為網絡輸入。葉文強等[10]結合降噪自編碼器和卷積神經網絡實現對6種常見雷達輻射源信號的識別,在SNR=-6 dB時,識別準確率超過80%。Qu等[11]使用圖像處理方法抑制噪聲,調整TFI的大小和振幅,將64×64 的TFI作為深度Q學習網絡的輸入層,在SNR較低時,可以識別8種隨機重疊雷達信號。雖然文獻[7-11]在提高雷達波形識別性能方面都取得了一定進展,但并沒有充分研究低SNR條件下,TFI具有相似特征的LPI雷達信號識別問題。
針對上述問題,本文利用深度學習和時頻分析研究低SNR條件下12類LPI雷達信號識別問題,包含BPSK,線性調頻(linear frequency modulation, LFM),Costas,Frank,P1~P4和T1~T4[12]。首先進行時頻分析和圖像預處理抑制TFI中的噪聲,剪除冗余頻帶。然后在ResNeXt網絡[13]的基礎上結合擴張卷積[14]和壓縮激勵(squeeze excitation, SE)結構[15],構建了SE-ResNeXt網絡提取時頻特征,并用于分類。網絡中的擴張卷積擴大了神經元的感受野,SE結構增強了特征通道相關性,解決了低SNR條件下原有網絡對時頻特征提取不足的問題。
本文方法由3部分組成:信號預處理、特征提取以及信號分類。首先,通過Choi-Williams分布(Choi-Williams distribution, CWD)將LPI雷達波形轉換為TFI。為了提高TFI的分辨率和降低網絡的訓練成本,對TFI進行灰度化、二維維納濾波、圖像裁剪和圖像縮放等預處理操作。其次,訓練SE-ResNeXt網絡,對上述處理后的TFI進行特征提取。最后,將特征向量輸入Softmax分類器[16],實現LPI雷達信號分類。
工程中一般假設截獲接收機收到的是高斯白噪聲下的LPI雷達脈沖信號,可表示為
y(t)=Aej(2πf(t)t+φ(t))+n(t),0≤t≤T
(1)
式中:A為幅度;T為脈沖寬度;n(t)為加性高斯白噪聲;f(t)和φ(t)分別為載波頻率和相位函數,決定信號的調制類型。
由于Wigner-Ville分布中存在很強的交叉項,會掩蓋LPI信號的調制特征。因此,使用CWD,采用指數核函數φ(υ,τ)抑制交叉項的同時使TFI保持較高的分辨率[17]。輸入連續信號的CWD的表達式為
(2)
(3)
式中:ω為角頻率變量;t為時間變量;x*(·)表示輸入信號的復共軛;ε>0是縮放因子,本文選取ε=1平衡交叉項抑制和時頻分辨率的矛盾。當SNR=10 dB時,12種LPI雷達信號的CWD時頻分布如圖1所示,對于不同調制類型的信號有不同的TFI特征差異。LFM的TFI是直線型;Costas的TFI歸一化頻率數與調制頻率數相等;BPSK在相位跳變時,時頻能量聚集處也會跳變,呈現“<”形狀;多時編碼(T1~T4) 中,T1和T3碼的TFI具有“<”形狀,T2和T4碼的TFI具有“X”形狀;多相編碼(Frank,P1~P4)中,Frank、P1和P2碼的TFI為階梯型,P3和P4碼的TFI為直線型。隨著SNR降低,多相編碼信號和LFM信號的階梯狀和線狀的時頻特征有所減弱,BPSK和T1,T2碼和T4碼的TFI較為相似,識別時容易產生混淆。

圖1 12類雷達信號的CWD
雖然CWD可以抑制交叉項,但TFI中仍然分布有大量噪聲,這些噪聲會影響后續的識別效果。因此,需要減小噪聲干擾,二維維納濾波是一種自適應濾波器,能依據圖像的局部方差來調整濾波器的效果,對白噪聲有較好的濾波效果[18]。
假設用矩陣Mm×n表示m×n個像素的灰度時頻圖像,M(i,j)表示每個像素點,i=1,2,…,m,j=1,2,…,n。ηa×b是圖像Mm×n中每個像素點的a×b局部鄰域,ηa×b的大小一般設置為40×40[9]。每個像素的鄰域均值μ和方差σ2,維納濾波后的圖像Q(i,j)計算如下:
(4)
(5)
(6)
式中:v2是噪聲方差,可使用所有鄰域估計方差的平均值表示。
經過二維維納濾波,TFI已經較大地抑制了噪聲,為了突出LPI雷達信號不同調制類型之間的差異,本文采用基于邊際頻率分布的圖像裁剪方法去除冗余區域。然后通過雙線性插值將裁剪后的圖像尺寸調整為224×224。具體步驟如下。
步驟 1對原始TFI進行平滑處理
如圖2所示為SNR=-8 dB時,T1信號維納濾波前后的TFI。可以看出,二維維納濾波對TFI中的高斯白噪聲有較好的濾除效果。

圖2 維納濾波的效果
步驟 2確定TFI的邊際頻率分布
對二維維納濾波后的TFI,采用邊際頻率分布確定TFI中包含調制能量的區域[19]。將信號的瞬時能量看作頻率的函數,邊際頻率分布表示為
(7)
將二維維納濾波后的TFI中每個頻率點ω在時間軸上分布的N點值相加,并進行歸一化處理。T1信號的歸一化邊際頻率分布圖如圖3所示。

圖3 T1信號歸一化邊際頻率分布
步驟 3確定調制能量分布的有效區間
通過對歸一化的邊際頻率分布生成包含100個分組的直方圖,選取能產生最佳分類概率的分組號r確定為第一次檢測門限。然而在低SNR下,即使沒有信號分布也會有超過檢測門限的情況。并且在r較大時,也有信號分布低于門限的情況。所以采用“二次門限”,即邊際頻率連續超過門限θ次才認為有信號,連續低于門限λ次時才認為無信號,從而確定調制能量分布的有效區間[20]。本文選取r=45,θ=λ=3。T1信號的歸一化邊際頻率分布直方圖如圖4所示。

圖4 T1信號的歸一化邊際頻率分布直方圖
步驟 4裁剪TFI中的信號主成分圖像
確定TFI中有效信息區域的起始和終止位置后,對TFI進行截取。當SNR=-8 dB時,截取圖3(b)中的主成分圖像,如圖5所示。

圖5 T1信號的TFI主成分圖像
步驟 5圖像尺寸調整
為了減少網絡的訓練成本,通過雙線性插值將圖5的圖像尺寸調整為224×224,如圖6(a)所示。在低SNR條件下,易混淆的T1和BPSK信號TFI經過上述預處理后能更好地體現時頻特征差異,便于后續特征提取,如圖6(a)和圖6(b)所示。

圖6 TFI預處理結果
ResNeXt結合了ResNet[21]和Inception[22]的思想,既避免了由網絡層數過深帶來的梯度消失問題,又無需設計復雜的Inception結構。同時,將瓶頸結構擴展成分支結構,每條支路都遵循相同的拓撲結構。ResNeXt塊結構的輸出為
(8)
式中:x為輸入;y為輸出;L為拓撲結構;G為分支數量。圖7為ResNeXt塊結構的等效變換,用分組卷積替換分支結構,圖中每層的參數表示格式為:輸入通道數,卷積核尺寸,輸出通道數。

圖7 ResNeXt塊的等效結構
Hu等從通道維度提出SE結構[15]。通過SE結構獲取每個特征通道的權重,然后依照權重去提升有用的特征,從而抑制對當前任務用處不大的特征,SE結構如圖8所示。SE結構首先對卷積和池化后得到的特征圖U∈RH×W×C(H,W,C分別代表高度、寬度和通道數)進行全局平均池化(global average pooling,GAP),輸出維度為1×1×C的全局平均特征,稱為壓縮操作。然后,將全局平均特征送入兩級全連接(full connection,FC),線性整流函數(rectified linear unit,ReLU)[23]和Sigmoid函數[24],輸出維度為1×1×C的通道權重向量,該過程稱為激發。最后將通道權重與U相乘,得到特征圖Z∈RH×W×C。

圖8 SE結構
本文基于SEnet和ResNeXt來構建SE-ResNeXt網絡,圖9為網絡的核心結構SE-ResNeXt塊。圖中輸入為X,輸出為Y,每個卷積操作由卷積、批量歸一化(batch normalization,BN)[25]和ReLU組成。

圖9 SE-ResNeXt塊結構
SE-ResNeXt網絡由1個卷積層、4個SE-ResNeXt塊結構、2個池化層、1個全連接層和1個Softmax分類器構成,網絡結構如圖10所示。輸入為經過預處理后的TFI,圖像尺寸為224×224,通過SE-ResNeXt網絡提取用于分類的特征向量,最后使用Softmax分類器進行分類。網絡具體參數如表1所示,SE-ResNeXt塊結構的操作和參數均列在方括號中。卷積后的參數表示卷積核尺寸、輸入通道數、分組數。FC后面的括號中表示SE結構中兩個全連接層的輸出尺寸。

圖10 SE-ResNeXt網絡結構

表1 SE-ResNeXt網絡詳細信息
本文方法基于Pytorch[26]實現,優化器為自適應矩估計(adaptive moment estimation, Adam)[27],批次設置為128,訓練迭代次數為90,初始學習率為0.03。當訓練驗證集的損失連續3次不再降低時,將學習率降低30%。為了節省不必要的訓練時間、防止過擬合,采用提前停止技術,即將本輪迭代的損失和歷史迭代最小損失值比較,如果歷史最小損失減去本輪迭代的損失后大于閾值0.000 5,就認為損失函數減小了,并更新歷史最小損失。當損失函數連續減小5次,就認為模型不再提升,停止訓練并保存當前的模型參數。
針對上述12種LPI雷達信號,在指定范圍內隨機設定信號的參數,并在信號中加入高斯白噪聲。為了分析泛化能力,對于每種信號,訓練集的SNR范圍為-8 dB到8 dB,每隔2 dB產生200個信號,共21 600個樣本。測試集的SNR范圍為-10 dB到10 dB,每隔2 dB產生100個信號,共13 200個樣本。
信號參數設置如表2所示,采樣頻率fs為歸一化頻率1,U(·)為均勻分布,信號的長度設置為1 024到2 048之間。

表2 LPI雷達信號仿真參數
下面比較不同預處理操作對識別正確率的影響。Qu等將維納濾波后的TFI進行二值化和縮放處理,提高了識別效果,但低SNR條件下二值化圖像信息丟失嚴重,導致分類準確率較低[9]。本文方法在提取TFI主成分區域和尺寸調整后,降低了噪聲干擾,消除了雷達信號在TFI中頻率維的位置差異,以灰度圖像作為SE-ResNeXt網絡的輸入,可完整保留信號的時頻分布特征。將不同預處理后的數據在SE-ResNeXt網絡中進行訓練,整體識別率如圖11所示。為驗證本文提取主成分區域方法對識別正確率的提升,將維納濾波后的TFI也作為網絡輸入進行對照。仿真結果表明,在不同SNR條件下,本文預處理方法對LPI雷達信號的整體識別正確率高于其他同類預處理方法。特別是在SNR=-8 dB的較低SNR時,12類LPI雷達信號的整體識別準確率依然能達到98.08%。

圖11 不同預處理方法識別準確率對比
本節測試了基于主成分TFI加SE-ResNeXt網絡的識別性能,并與CWD-CNN方法[9]、CWD-擴張殘差網絡(dilated residual network, CWD-DRN)方法[28]和CWD-ResNet方法[29]進行對比。CWD-ResNeXt作為對照方法以驗證SE結構和擴張卷積對ResNeXt識別性能的改善。其中文獻[9]利用CNN提取維納濾波后的二值時頻圖像特征,文獻[28]和文獻[29]采用灰度化,開運算和雙三次插值的預處理操作,再分別使用DRN和ResNet進行特征提取,最后都使用Softmax分類器實現LPI雷達信號分類。圖12為5種方法對12類LPI雷達信號的整體準確識別率。

圖12 5種方法在不同SNR下的性能比較
由圖12可知,當SNR>-2 dB時,除文獻[9]以外的4種方法的識別準確率都超過了97%。隨著SNR的降低,CWD-CNN、CWD-DRN和CWD-ResNet方法的識別曲線明顯下降。當SNR=-8 dB時,本文提出的方法仍能達到98.08%的識別準確率,比CWD-CNN、CWD-ResNet、CWD-DRN和CWD-ResNeXt分別高出20.86%,4.98%,4.09%和1.03%。同時,當SNR=-10 dB時,對于未參與訓練的測試數據,本文所提出的方法仍能取得較高的識別準確率,說明泛化能力明顯優于其他方法。
為了更好地理解上述4種方法的識別性能,分別從每個方法的測試數據集(SNR=-8 dB)中每類選取90個樣本,并使用t分布隨機近鄰嵌入(t-distribution stochasticneighbor embedding,t-SNE)算法[30]將CNN、ResNet、DRN、SE-ResNeXt提取的特征投影到二維平面上,如圖13所示。不同的顏色和形狀代表數據集中的12類LPI雷達信號,由于對提取的特征進行t-SNE運算可以反映信號之間的相似信息,所以圖13中具有相似特征的LPI信號在特征空間中相互接近。

圖13 t-SNE可視化4種方法輸出(SNR=-8 dB)
由圖13(a)可知,文獻[9]中經過維納濾波后的二值化圖像信息丟失嚴重,最后用于分類的特征圖大小僅為5×5,導致低SNR條件下,分類準確率下降明顯。文獻[28]和文獻[29]中預處理后的TFI雖然保留了完整的時頻信息,但是受到冗余頻帶噪聲和位置分布干擾,導致4組(LFM和P2,Frank、P1、P3和P4,BPSK和T1,T2、T3和T4)容易混淆的信號在二維平面中分布較近,分別如圖13(b)和圖13(c)所示。本文方法提取的特征具有更強的識別能力,如圖13(d)所示,不同類別信號間具有更好的分離度,同類別信號間具有更好的緊湊度,得益于3個方面:① 通過預處理消除TFI中的噪聲和冗余頻帶干擾;② SE-ResNeXt網絡利用多尺度結構提取TFI的特征;③ 通過SE結構強化有用通道特征和擴張卷積維護圖像分辨率。圖14顯示了12種LPI雷達信號在不同SNR下的識別準確率。由圖14可知,隨著SNR降低,本文方法依然表現出更優越的識別性能。
圖15為在SNR=-8 dB條件下,本文方法的混淆矩陣。由圖15可知,12種LPI雷達信號都有很高的識別率,識別錯誤主要發生在P1和P4碼、P3和Frank碼兩組信號,因為低SNR下,P1和Frank碼的TFI中的階梯特性變得模糊甚至消失,導致信號之間的混淆。

圖15 混淆矩陣(SNR=-8 dB)
本文提出了一種基于時頻圖像預處理和SE-ResNeXt網絡的LPI雷達信號識別方法。首先通過特定的預處理流程消除雷達信號在時頻圖上噪聲干擾和頻率維的位置差異,降低特征維度。然后在ResNeXt基礎上,引入了擴張卷積和SE結構思想,強化了網絡感受野和特征通道的相關性。具有在較低SNR環境下識別12種LPI雷達信號(BPSK、Costas、Frank、LFM、P1、P2、P3、P4、T1、T2、T3和T4)的工程應用價值。實驗結果表明,當SNR低至-8 dB時,該方法對12種典型LPI雷達波形的整體識別正確率依然可達98.08%,與現有方法相比具有更好的低SNR適應能力、更強的抗混淆能力。