幸晨杰,王良剛
(中國西南電子技術研究所,成都 610036)
電臺個體識別是現代電子戰和民用通信管控的重要環節,通過信號處理技術對所截獲的通信電臺信號進行處理分析,提取所獲取信號個體的屬性特征,快速將每個信號對應到相應的電臺[1-7]。該技術有助于準確獲得電臺個體的屬性信息,定位和跟蹤敵方的電臺位置,進而分析通信組網構成,推測敵軍的未來操作。
電臺個體識別任務的傳統研究方法可分為兩個方向,一種是使用電臺個體信號的暫態特征[8-9],另一種是使用電臺個體信號的穩態特征[10-13]。暫態特征是指信號的瞬時幅度、相位、頻率、功率等參數呈現的分布特性,以及在輻射源設備開關機瞬間或工作模式轉換的瞬間,因受工作環境、溫度、噪聲等因素的影響而產生的非線性特性;穩態特征一般是提取數據部分進行分析,數據部分由前導序列、中間碼和有效負載聯合組成[14]。例如,文獻[15-20]都運用了雙譜法提取信號穩態特征及其變換形式,或在此基礎上再結合信號其他特征,取得了較好的電臺識別效果;文獻[21]和文獻[22]運用了分形法提取電臺暫態特征,取得了較好的識別效果。隨著流形學習理論的深入研究,雷迎科等人[23]提出首先對信號樣本進行雙譜變換,然后利用正交局部樣條判別嵌入方法深入提取輻射源的指紋特征,有效解決了輻射源個體特征缺乏魯棒性的問題。
上述傳統研究方法往往需要進行特征工程,存在依賴領域專業知識的問題。另外,傳統特征還存在對信噪比要求較高和難以用單一模型描述多種特征、識別算法難以統一的問題。
現代電子通信裝備制造精度的提高,使得同型號、同批次電臺的個體特征越來越相似。同時,信道干擾多、通信質量較差的復雜電磁環境中,接收的電臺通信信號質量難以保證。在此情況下,傳統方法提取的特征因此將難以區分極其相似的同類電臺個體。
現代通信裝備種類、信號制式越來越多,技術細節越來越復雜,往往難以靠專家人力窮盡所需識別的個體信號體制和有效的指紋特征提取方法,因此需要研究一種方法,在電臺個體識別中降低對專業知識的依賴,實現更高魯棒性的電臺個體識別。
本文提出一種基于深度神經網絡的智能個體識別方法,直接將電臺個體時序信號輸入深度網絡,提取特征并開展分類,能降低特征提取的難度。本文設計的一維多子網絡模型,能減輕深度網絡模型調參優化耗時費力的問題,提升模型的深度特征表達能力,能較單一結構網絡提高電臺個體分類精度與泛化能力。
本文提出的基于深度神經網絡的智能個體識別方法的總體流程包括電臺個體數據預處理、劃分樣本集、模型構建、模型訓練、分類效果評估五大步驟,如圖1所示。

圖1 基于深度神經網絡的智能個體識別方法的具體流程
電臺個體信號原始數據以脈沖采樣形式存儲,為符合網絡輸入層結構,所有樣本都以1 024點長度存儲,超出部分采樣點刪除,不足部分補零。
將預處理后的電臺個體數據和對應的類別標簽組成樣本對,隨機從中選取80%的樣本數據組成訓練集,將剩下的樣本等比例隨機抽取,組成驗證集和測試集。
在生成樣本集時,考慮各個電臺樣本數量有差異的情況。對樣本數量差異懸殊的情況,采用樣本復制或者樣本刪除的方式,實現樣本數量平衡,以免模型訓練時樣本數量懸殊,導致模型擬合誤差大。
卷積神經網絡(Convolutional Neural Network,CNN)由于共享權重所帶來的平移不變性,可以高效地用于數據的特征提取。把信號時域數據看作一維特征向量,便可用一維卷積計算提取信號的個體特征。
一維離散卷積定義如下:
(1)
式中:x是輸入的特征向量,w是卷積核。使用公式(1)定義的一維離散卷積計算每一層的特征向量。
值得強調的是,與二維CNN不同,在深度一維卷積神經網絡中,應用一維CNN層進行特征提取,無需對輸入數據做任何預先增強或特征轉換。將特征化領域從二維簡化為一維后,模型參數更少,與其他應用二維深度神經網絡的個體識別模型相比,本方法具有量級更輕的優勢。同時,本方法無需進行一維信號特征化等有人參與的特征提取過程,不但降低了整體的計算量和算法復雜度,而且減少了整個網絡的參數量。
圖2給出了本方法的結構示意圖,針對一維信號的本質特征,本文設計了基于深度一維卷積網絡的電臺信號特征提取與分類識別網絡。依靠所設計的金字塔式網絡結構,模型可以更為深入地從信號提取電臺的多層次個體特征,使特征提取更有效。

圖2 電臺信號特征提取一維卷積神經網絡流程示意圖
1.4.1 搭建一個包含3個子網絡的一維多子網絡深度集成模型
為了提取一維信號中的個體特征,參考深度神經網絡在計算機視覺領域的成功經驗,本文提出的集成模型及其子網絡被設計為含有多層卷積網絡的結構。為了在多次卷積中適當減少模型參數量以提高模型訓練和運行效率,并在模型中保留信號主要特征,防止訓練時過擬合,本文在卷積層中穿插加入了池化層。在多層卷積結構提取信號中包含的個體深度特征后,本文使用全連接層和Softmax分類器,將特征映射到電臺類別中,實現電臺的個體識別。
該多子網絡深度集成模型包含3個不同結構的子網絡,其結構互相關聯,其中子網絡B是從子網絡A中刪去少量卷積層后形成,子網絡C是從子網絡B中刪去少量卷積層后形成。這樣設計的目的是采用多種不同深度的子網絡分別從輸入信號序列中提取深度不同的個體特征,并使用不同深度的特征產生子網絡分類置信度,使得集成模型能提取的特征和計算的分類置信度多樣化,提高集成模型的適應性,盡量避免過擬合。
子網絡A結構如圖3所示,共包含1個輸入層、10個卷積層、4個池化層、2個全連接層、2個批歸一化層、1個分類器層和1個輸出層。

圖3 子網絡A結構
子網絡B結構如圖4所示,共包含1個輸入層、8個卷積層、3個池化層、2個全連接層、2個批歸一化層、1個分類器層和1個輸出層。

圖4 子網絡B結構
子網絡C結構如圖5所示,共包含1個輸入層、6個卷積層、2個池化層、2個全連接層、2個批歸一化層、1個分類器層和1個輸出層。

圖5 子網絡C結構
1.4.2 設置三個子網絡的網絡參數和集成方式
上述子網絡中,輸入層神經元個數為電臺個體數據長度1 024,卷積層的卷積核個數為括號內的第一個數,卷積核大小為括號內第二個數,激活函數均使用線性整流函數(Rectified Linear Unit,ReLU),全連接層的神經元個數為括號內數字;所有池化層均使用最大池化,大小為2;分類器層使用多分類函數Softmax。
在集成三個子網絡的分類置信度并形成集成網絡的分類置信度時,采用直接平均法,即直接平均三個子網絡模型對輸入信號產生的類別置信度,得到集成網絡對該輸入信號的類別置信度,并據此得到分類結果。
1.4.3 設置三個子網絡的損失函數、優化算法和訓練迭代次數
子網絡損失函數均使用交叉熵損失函數,如公式(2):
(2)
式中:M表示電臺個體類別數量,yc∈{0,1}表示電臺個體數據實際類別標簽的獨熱編碼(one-hot)形式,pc∈{0,1}表示網絡對訓練樣本的預測標簽向量。
子網絡優化算法均使用基于自適應矩估計的優化算法(Adaptive Moment Estimation,Adam)。
子網絡的訓練步長即訓練樣本集每批次送入子網絡的數量設置為512,迭代次數設置為50。
首先,將訓練樣本隨機輸入一維多子網絡深度集成模型,進行訓練預測。然后,反向傳播誤差損失,并通過優化函數計算模型參數改正量,直到達到所設置的訓練迭代次數,或直到使用驗證樣本驗證模型的損失函數波動小于預設值。完成多子網絡深度集成模型的訓練過程后,保存最優的網絡權重參數。
首先,將一條測試樣本輸入模型,對三個子模型的每一類識別置信度求平均,得到預測的Softmax分類結果,如公式(3)所示:
(3)
式中:p1、p2、p3、pc分別表示子網絡A、B、C對一個測試樣本數據在各個類別的分類置信度向量和平均的分類置信度向量。
將平均置信度向量最大值對應的類別作為識別出的電臺個體類別。
然后,將測試集樣本的分類結果和真實的類別標簽進行比較,計算總體分類精度(Overall Accuracy,OA)、平均分類精度(Average Accuracy,AA)和Kappa系數,以評估算法有效性。
總體分類精度指被正確分類的電臺個體個數與總的電臺個體個數的比值,如公式(4)所示:
(4)
式中:TPi代表準確識別為第i個電臺的樣本個數,FNi代表第i個電臺的樣本中沒有準確識別出的個數,M代表樣本集中所有電臺個數。
平均分類精度是各類電臺分類精度的平均值,如公式(5)所示:
(5)
Kappa系數代表分類與完全隨機分類相比,錯誤減少的比例,如公式(6)~(7)所示:
(6)
(7)
式中:FPi代表本不屬于第i個電臺但被識別為第i個電臺的樣本信號條數,N代表所有測試樣本條數。
為驗證本文所提模型的可行性和準確性,選用實采電臺數據開展了仿真實驗。參與實驗的電臺個體有10部,信號數據為兩組原始采樣的基帶脈沖信號,調制方式分別為8PSK和MSK,長度為短脈沖500采樣點左右,長脈沖1 000采樣點左右,兩組數據的帶內信噪比均為12 dB,其中第一組數據的各類樣本個數如表 1所示,第二組數據的樣本數量規模與之相當。

表1 電臺個體樣本統計
仿真實驗的硬件平臺為惠普服務器Z840,使用Intel至強處理器,兩塊NVIDIA GTX1080顯卡,各8 GB顯存。
仿真實驗環境的操作系統為Ubuntu16.04LTS,算法實現依賴的軟件工具包括TensorFlow1.6.0、Keras2.2.0、CUDA9.0+cudnn7、python3.6。
仿真實驗使用數據如2.1節所示,步驟按照第1節所述開展。
2.3.1 OA、AA和Kappa系數
為了驗證本方法的效果,利用總體分類精度、平均分類精度和Kappa系數三個評價指標對本方法所涉及的各個子網絡與深度集成模型在第一組數據集(8PSK調制的電臺信號)的分類結果進行評估,將得到的所有計算結果列入表2中。

表2 本方法分類結果評估
分別使用子網絡A、B、C單獨對10類電臺信號進行特征提取與識別,其總體分類精度、平均分類精度、Kappa系數如表2前三行所示。總體分類精度、平均分類精度和Kappa系數最高的為子網絡B,說明子網絡B的性能優于子網絡A和子網絡C。
再通過集成網絡綜合上述子網絡的分類結果,對10類電臺信號進行特征提取與識別,總體分類精度91.83%,平均分類精度為89.12%,Kappa系數為0.901 5,如表2第四行所示。
集成網絡的三個評判標準比所有子網絡都高,說明集成網絡性能超過了子網絡A、B、C中任何一個網絡單獨的性能,通過網絡集成實現了電臺個體識別性能的提升。
2.3.2 混淆矩陣
混淆矩陣也稱誤差矩陣,是表示精度評價的一種標準格式。圖6為子網絡A、B、C及集成網絡分類結果的混淆矩陣,其中橫軸都代表測試樣本所分類結果,縱軸都代表測試樣本的真實類別,每一個單元格的數值都代表縱軸真實類別預測到橫軸類別的統計頻率值。

(a)子網絡A的識別混淆矩陣

(b)子網絡B的識別混淆矩陣

(c)子網絡C的識別混淆矩陣

(d)集成網絡的識別混淆矩陣圖6 子網絡A、B、C以及集成網絡對8PSK調制電臺信號分類結果的混淆矩陣
從混淆矩陣的數值主要集中在主對角線上可以看出,各個電臺個體分類總體情況較好,每種網絡只有少數的錯分情況。結合上述分類精度、Kappa系數的統計可以表明,本方法在信噪比12 dB的8PSK調制信號條件下,可以實現10類通信電臺個體的細微特征提取和個體分類識別,總體和平均分類精度都達到約90%的同時,大多數類別的識別正確率能超過85%,一半類別的識別正確率能超過95%。
2.3.3 不同調制方式對分類結果的影響驗證
為了驗證本文提出的集成模型對信號調制方式的適應性,第二組數據集(MSK調制方式的電臺信號)還被用于輸入集成模型并開展分類。平均分類精度為89.1%,形成的混淆矩陣如圖7所示。

圖7 集成模型對MSK調制電臺信號分類結果的混淆矩陣
從平均分類精度和混淆矩陣可以看出,該集成模型對MSK調制的電臺個體數據仍然可以開展分類。除電臺4有較明顯的錯分以外,其余電臺的分類精度與8PSK調制的數據在該模型上的分類精度總體相當,甚至分類準確度100%的個體(共5個)占到總個體量的一半,說明改變調制方式有可能影響分類精度,但影響不大。
對比兩組實驗數據在本文提出的集成模型上的分類效果可以看出,該集成模型對8PSK和MSK調制的電臺個體數據都有較好的適應性。以上的仿真實驗可以說明,本方法通過深度神經網絡采用一維卷積直接對電臺個體原始數據進行特征提取與識別,擁有較高的識別準確率。相比單一深度神經網絡模型,本文方法通過集成多個深度神經網絡,提高了電臺個體識別的準確性。
本文基于一維卷積神經網絡結構提出了一種一維多子網絡深度集成模型,將待識別的電臺原始信號作為輸入,使用網絡進行端到端學習,提取電臺信號中的個體特征并進行電臺個體分類識別,獲得了較高的分類精度。
本方法由于直接從時序采樣數據提取特征,免去了提取電臺個體傳統特征的步驟,同時避免了依賴專家知識的特征設計或選擇工作,能降低數據處理的難度,提高電臺個體識別系統的適應性,有望解決傳統特征難以區分相似度極高的電臺個體的問題。
本方法通過設計并集成多個子網絡模型,憑借有規律可循的子網絡模型設計,能降低設計深度網絡模型時優化調參的難度,節省算法研發時間與實驗計算資源。同時,將多子網絡集成在一起,能克服單一結構神經網絡模型提取特征不全面、分類精度不足的問題,有望降低單一模型的過擬合風險,有望提高電臺個體識別算法的泛化能力與魯棒性。
在本方法的基礎上,下一步還將研究使用多任務模型滿足實際應用場景“檢測加識別”的需要,研究適應更廣泛電臺個體類型的識別模型和方法;還將針對電臺個體數據難以獲取、樣本數不均衡等不利條件開展研究,進一步鞏固研究成果,為軍民用信號智能處理提供新方案。