王亮,肖易寒
哈爾濱工程大學 信息與通信工程學院,黑龍江 哈爾濱 150001
雷達是戰爭環境下的重要信息來源,可以獲得千里之外的戰爭情報,因此如何獲得敵方雷達信息,并且針對敵方雷達進行有效地識別與干擾則顯得尤為重要。雷達輻射源識別工作實際上是對不同的雷達輻射源產生的信號進行特征提取,然后進行識別,由于信號特征來自輻射源個體的硬件部分,因此又稱輻射源識別。目前對于雷達輻射源個體的識別工作主要可以分為2 個過程,先進行特征提取,再進行分類,從而完成輻射源的識別[1]。目前,將深度學習應用到雷達輻射源個體識別工作的研究越來越多,但是本質上仍然是從信號的脈內特征或個體特征等方面進行識別[2]。卷積神經網絡是應用最為廣泛的一類深度學習方法,但是在將數據送入網絡之前一般會對原始數據提取初步特征,如雙譜特征[3]。但是卷積神經網絡容易產生梯度問題,因此可以引入殘差網絡進行優化[4]。除此之外,其他深度學習方法如強化學習[5]、InfoGAN 網絡[6]等也可以用于特定輻射源信號特征提取與識別。
然而上述深度學習方法在進行輻射源識別時存在一些問題:一方面雷達輻射源信號的單脈沖時域信號前后具有強相關性,上述方法對于這種特性的關注度不夠;另一方面單脈沖信號的數據量較大,采用不同數據量的識別效果不同。為了解決上述問題,本文采用將Transformer 網絡應用于雷達輻射源識別工作,并探究不同因素對于識別效果的影響。
為了能夠提取到雷達輻射源信號自身具有的個體特征,需要對采集后的信號進行預處理,同時盡量避免影響到信號原本的信息。不同信號發射器的功率等方面存在差異,為了使信號幅值與能量保持一致,需要對原始信號進行幅度歸一化操作[7]。為了消除原始信號中突變或無效的點帶來的影響,本文使用內部歸一化的思想進行信號處理,采用Hilbert 變換法取出包絡[8],原始信號s(t)的Hilbert 變換為

取信號包絡特征具體操作如下:
1) 首先將原始信號s(t) 中間約的穩態信號x(t)作為標準,計算全部點數的平均幅值A;
2) 對原始信號s(t)做Hilbert 變換,取出其實部s′(t)與 虛部(t);
3) 計算包絡幅值S(t)=,再 將其除以平均幅值得到歸一化后的包絡。
圖1 展示了信號包絡及其上升沿的部分,而上升沿數據量較少,大部分信號仍處于穩態。

圖1 信號包絡上升沿部分
信號包絡特征作為特征時存在受噪聲影響較大的缺點,在噪聲強度較高時,會產生較大的起伏。脈內無意相位調制特征同樣可以反映出信號無意特征,而相位特征更多體現在信號的穩態部分[9]。取相位具體過程如下:
1) 對原始信號 做Hilbert 變換,取出其實部s′(t)與 虛部(t);
2) 對脈沖信號相位為信號實部與虛部的反正切變換,即 φ(t)=arctan((t)/s′(t))。
如圖2 所示是信號發生器某個脈沖的穩態相位信息,該信號折疊相位在 [?π,π]之間成周期性變化,在不同的雷達輻射源信號中相位信息會發生變化,體現輻射源個體之間的差別。

圖2 信號穩態部分相位
Transformer 網絡最初是Google 在2017 年提出的,該結構采用了注意力機制來對輸入數據進行并行方式的特征提取,為了保證前后數據的關聯性,該網絡使用位置編碼來對輸入數據的位置信息進行記錄。因此,一方面Transformer 結構仍然可以保證數據前后的關聯性;另一方面,由于并行輸入,使得網絡訓練時間大大縮短。如圖3所示是Transformer 網絡基本結構單元,完整的Transformer 特征提取網絡結構由兩部分構成,編碼器Encoder 與解碼器Decoder,在進行特征提取時,首先將輸入數據送入編碼器進行編碼,得到數據的自相關性等特征,然后再由解碼器解碼,輸出序列[10?11]。

圖3 Transformer 基本結構
Transformer 結構采用注意力機制來進行特征提取,本文所需要完成的工作是多臺信號源發生器的識別,需要完成不同信號源發生器產生的信號分類工作,因此僅需用到編碼器來提取特征。一般情況下,為了充分提取特征,在將數據進行位置編碼后,送入到多層結構相同的編碼器中,單層編碼器一般由自注意力層和全連接層組成。自注意力層一般使用多頭注意力機制,在這兩層中間可以添加殘差網絡等結構。
Transformer 網絡結構由于不是按照時序結構順序提取特征的,因此沒有結合數據不同位置的序列關系,這對于學習諸如雷達信號這類前后關聯性較強的數據特征是極其不利的。因此,在原始數據分段后,需要對其進行位置編碼,使之帶有位置信息,保持數據相關性[12]。位置編碼公式為

式中:dpos為 某段信號p在信號脈沖中的實際位置,PE為 處于 pos位置信號的向量。在編碼后,原始數據如雷達特征序列可以保持前后的關聯信息,同時網絡的并行運算使得Transformer 的長距離學習能力較為優秀。
Transformer 網絡的核心算法是注意力機制,縮放點積注意力機制是其中的一種,其優點在于可以批量處理數據??梢员硎緸?/p>

為了讓注意力機制具有更高的運算效率,Transformer 框架將多個縮放點積注意力機制結合,組成了多頭注意力機制[13?14],n個頭的多頭注意力機制可以表示為

式中:Concat 為對多個單獨的點積注意力機制進行拼接;參數矩陣Rdmodel×dv,dmodel為編解碼過程的向量維度。具體過程如圖4 所示:首先,將Q、K與V通過一個Linear層進行線性變換,這一點與單層的點積注意力機制相同,之后進行n次單層點積變換,每個機制的參數完全獨立,不會共用,在n次運算完畢后,最終得到輸出H。

圖4 多頭注意力機制結構
如圖4 所示,這種多頭注意力機制是將多頭運算的結果進行拼接而成,原始數據經過不同空間的映射,使得模型能夠從多個方面進行特征提取。同時多頭機制也同樣能夠對不同位置的雷達數據提取它們邏輯之間的關系。另外,這種機制具有更加強大的矩陣并行運算能力。
雷達輻射源信號一般會具有較大的數據量,對于單個脈沖而言,其中可以包含幾萬甚至十幾萬個點,并且數據前后的關聯性較強,因此Transformer模型適合用來對雷達輻射源信號進行特征提取。一方面多頭自注意力機制能夠將數據進行并行的快速運算,另一方面,位置編碼使得數據具有關聯性。圖5 給出了Transformer 模型提取雷達輻射源信號特征的前向特征提取的具體流程。

圖5 Transformer 提取特征流程
1)輸入信號預處理。首先對雷達信號進行歸一化,然后提取雷達包絡特征或相位特征,最后進行數據截取。

本文采用3 種信號發生器進行實際信號采集,模擬真實雷達數據,從而進行更加符合戰場情況的雷達輻射源個體識別工作[15]。通過添加高斯噪聲來改變信噪比,全部信號均為線性調頻信號,信號參數設置如表1 所示。

表1 無意信號參數設置
除此之外,各參數均包括正負2 種斜率,因此每個信號發生器產生2 160 個脈沖,其中80%用于訓練,20%用于測試。在進行單個脈沖的數據截取時,首先需要將原始數據對齊,以方便截取數據。對于包絡信息來說,其上升沿以及下降沿包含較多的特征信息,因此在提取時需要保留。而對于相位信息而言,在信號起振時相位并不穩定,因此上升沿處的相位信息最好舍棄,取穩態處的相位信息。
圖6 為信號截取位置示意圖,在取用包絡特征數據時,以原始信號包絡幅值為0.1 處作為起始值,根據需要的數據量進行數據的截??;而在提取相位數據時,首先以包絡幅值為1 處對齊,此時,相位已經達到了穩定狀態,以該處作為數據起始的索引點,對原始信號進行相位變換,并在索引點處對相位特征數據進行截取。

圖6 信號截取位置示意
在模型參數選擇的問題上,損失函數選擇適合于數據分類的交叉熵(cross entropy,CE)損失函數。由于訓練時需要改變數據長度,因此數據維度視數據量而定。Transformer 網絡單元設置為6 個,在網絡訓練時,采用Adam 優化函數。學習率設置初始值為0.001,以使得梯度快速下降,在100 個循環后,設置為0.000 1,以防止梯度跨度過大,難以收斂。對于參數的選擇如表2 所示。

表2 參數設置
為了驗證網絡提取特征的有效性,每類信號源取150 個添加10 dB 噪聲的原始數據,經過Transformer 網絡層得到輸出,并且進行均值池化后,再將數據通過t-SNE 方法進行降維,從而將特征數據可視化。如圖7 所示,由圖中可以看出經過特征提取的數據具有可區分的特征。

圖7 Transformer 網絡提取特征可視化
在本文方法中,單個數據樣本的長度對于識別結果的影響較大,而識別率是評價網絡模型好壞的最有效手段,圖8~11 是針對于單個脈沖樣本取用不同長度數據以及在不同信噪比下的識別率折線圖,其中單個脈沖數據長度分別設置為100 個點、200 個點、500 個點以及1 000 個點,添加的噪聲為高斯噪聲,信噪比為0~15 dB,間隔為5 dB。

圖8 100 個數據點識別率

圖9 200 個數據點識別率

圖10 500 個數據點識別率

圖11 1 000 個數據點識別率
從圖8~11 中可以看出各種因素均會對于最終識別率產生影響。首先,就數據長度而言,不同的數據長度對于結果影響較大,在單個樣本點數為100 點時,無論哪種方法,整體識別率均較低,這是由于單個樣本的雷達數據過小,無法在較小的數據上提取到有效特征而導致的。隨著數據長度的增加,各種方法的識別率均有所上升,尤其是相位數據,識別效果隨數據長度的增長最為迅速。表3 給出了本文方法采用相位數據的識別混淆矩陣,表示了在信噪比為15 dB 時網絡對于每一類的識別情況。其中第1 行為真實數據標簽,第1 列為預測標簽。

表3 識別混淆矩陣
對于不同的特征而言,在數據長度為100 個點時,包絡特征的識別率要高于相位特征,這是由于本文方法在提取包絡上升沿部分的特征時更加有效,之后雖然包絡數據長度仍然在增長,但是由于該方法難以對包絡穩態部分進行有效地特征提取,因此識別率卻幾乎沒有變化。而結合相位特征的識別率卻隨著數據長度的增加在逐漸上升,并在數據長度為500 點時趨于穩定。最后,對于不同的信噪比而言,噪聲對于包絡特征的影響要更大一些。
本文首先對3 臺信號源發生器進行信號采集,以模仿真實雷達輻射源數據。在Pytorch 平臺下構建了Transformer 網絡模型,并將3 臺信號發生器采集的LFM 信號的包絡特征以及相位特征作為網絡的輸入,從而實現對信號源數據的識別與分類。同時本文探究了樣本的不同長度對于識別效果的影響。結果表明,本文算法對于原始信號不同特征的敏感度不同,在提取相位特征時更加有效。并且在每個相位特征樣本長度為500 個點時即可基本達到最佳的識別效果,同時該方法具有較強的抗噪聲性能。