姚艷艷 俞璐 武欣嶸 陳一鳴


摘要:文章主要分析近年來面向個體識別的輻射源特征提取方法的研究現狀,探討各種方法的優缺點、依賴的數據集、輻射源數量、算法性能等,總結輻射源特征提取方法的技術關鍵點和難點,并指出深度學習方法在輻射源特征提取上的優勢。以期對輻射源特征提取方法的研究做出較為全面的綜述。
關鍵詞:輻射源;特征提取;人工設計特征;深度學習
中圖分類號:TP3-0
文獻標識碼:A
文章編號:1006-8228(2020)09-41-04
A survey of feature extraction methods of communication emitter for individual recognition
Yao Yanyan, Yu Lu, Wu Xinrong, Chen Yiming
(Institute of Cornrnunication Engineering Army Engineering University of PLA, Nanjing, Jiangsu 210007, China)
Abstract: This paper mainly analyzes the research status of emitter feature extraction methods for individual recognition in recentyears, discusses the advantages and disadvantages of various methods, dependent data sets, number of emitters, algorithmperformance. etc., summarizes the technical key points and difficulty points of emitter feature extraction methods. and points outthe advantages of deep learning method in emitter feature extraction. In order to make a more comprehensive overview of theresearch on emitter feature extraction methods.
Key words: emitter; feature extraction; artificial desiign feature; deep learning
0引言
本文輻射源是指無線電信號輻射源,包括雷達、電臺、射頻身份卡片等無線設備。
輻射源指紋識別技術是把眾多生產廠家、型號、參數完全相同的電子設備準確區分出來,進而可以獲取更多有價值的情報。現代通信和軍事領域中,SEI(Specific Emitter Identification,特定輻射源識別)發揮著重要作用,在識別非法設備、提高系統安全性能、分析非合作通信中對方目標個體、分析戰場電磁態勢、獲取有價值情報等方面均有著十分有效的應用。
1輻射源特征提取
由于信號發射端I路、Q路信號調制的不平衡以及元器件安裝、調試等方面的細微不同,導致了相同型號輻射源發射的信號內在特征的不同(即“指紋”[1]),通過分析不同輻射源指紋可以識別特定輻射源。
輻射源特征按可獲取難易程度,可分為有意特征和無意特征[2]。有意特征主要是指傳統電子偵察設備中,包括傳統的到達方位、載頻、到達時間、脈寬及幅度這五個信號參數以及載頻、帶寬、幅度、調頻系數、碼寬、編碼規律等脈沖序列參數,常用于信號分選與調制方式識別中。而無意特征是由于發射機器件固有的非理想特性,產生的相同型號、同種參數設置的輻射源發射信號的細微特征。這兩種特征都是信號“指紋”。
通常把SEI問題看做常見的模式識別問題,主要包括:信號采集、數據預處理、特征提取、分類識別這四個主要步驟。一個典型的SEI系統如圖1所示。
其中,特征提取是一個較為廣義的概念,包括SEI中信號特征的選擇、變換、提取等相關操作。輻射源特征提取是SEI的基礎,是輻射源個體識別過程中的關鍵一步,具有重要的研究意義。
本文研究的是面向個體識別的輻射源信號特征提取方法。
2面向個體識別的輻射源特征提取方法
目前,由軍事帶動商業的模式使得國內外SEI技術發展迅速,輻射源特征提取方法種類眾多。
經過幾十年的研究,針對通信電臺這類輻射源,逐漸發展形成了電臺輻射源指紋觀測技術體系。其基本思路是:從時域、頻域、調制域、變換域等不同的“視角”來觀察指紋,根據指紋在不同“視角”表現出的不同特點,再運用一些有效的數學工具來提取指紋。特別是隨著深度學習技術的興起,將神經網絡運用的輻射源個體識別也成為了一個熱門課題。
按照其技術特點,文章將其分為兩類,分別是傳統特征方法和深度特征方法,其中,傳統特征方法又分為單一特征方法和組合特征方法,如圖2所示。
傳統特征方法一般是將特征提取和分類器設計分別進行,從而識別輻射源個體。深度特征方法則是分為訓練和測試兩部分,從訓練集中學習到輻射源個體特征,在測試集上進行輻射源個體識別。這兩種方法各有其優劣,在不同輻射源信號和場景下均取得過良好的識別效果。
2.1傳統特征方法
2.1.1單一特征方法
我們將信號單一某個域特征或對信號的片面度量方法稱為單—特征方法,包括脈沖包絡前沿特征匹配[3]、脈沖包絡前沿高階矩特征[4]、基于EMD( EmpiricalMode Decomposition,經驗模態分解)方法的雜散特征提取[5]、基于模糊函數特征優化[6],基于時頻譜奇異值和奇異向量[7]等。
文獻[3]中,陳濤等使用FPGA做為輻射源信號發射器,通過使用寬帶數字接收、信號分選與跟蹤、數字正交混頻等技術即時提取包絡上升沿波形,并改進Hausdorff距離的窗口搜索匹配算法,進行兩類信號“指紋”模板匹配,利用閾值達到可靠識別并匹配雷達輻射源的目的。算法運算量較小,可以在接收機處實現快速識別,具有較好的實時性。文獻[4]中,王宏偉等選取來自三個實際雷達輻射源的包絡采樣信號各200組,對輻射源包絡前沿波形的高階矩特征和包絡前沿一階差分波形的高階矩特征的聚類特性,通過最近距離準則實現輻射源快速識別。文獻[5]中,梁紅海等使用四個同型號的無線網卡個體前導碼信號來著重研究穩態信號的雜散成分的頻域特征,利用EMD方法將雜散成分從信號中分離出來,然后再雜散信號的各頻率成分的能量作為信號的細微特征,實現30dB信噪比情況下,98.21%的識別正確率。文獻[6]中,王磊等對實測的30個輻射源個體的脈沖信號的無意調制特性進行模糊函數建模,抽取模糊函數的“近零”頻偏切片作為輻射源信號的主要特征,設計切片串聯策略構建了互補的特征子集對,從而分別利用典型相關分析和鑒別典型相關分析實現切片特征的融合,最后通過SVM、NN分類器進行輻射源最優識別率下的分類性能比較。文獻[7]中,Gangsong Ding等使用三臺相同類型的數字收音機采集到的信號,在短時傅里葉變換(short-time Fourier transform,STFT)后,得到128維矩陣進行奇異值分解(Singular Value Decomposition,SVD),將通過分析表明最具有區分度的第二維奇異向量和第2-50維奇異值,作為“指紋”特征,在信噪比大于8dB,采用高斯分類器的情況下,能夠達到超過90%的輻射源個體識別率。
2.1.2組合特征方法
對于特征描述的完整性和全面性,僅依賴于單一某個域特征或對信號的片面度量往往不足以形成充分而可信的表征,因此許多文獻從特征組合角度構建更加完備的信息集。
文獻[8]中,蔡忠偉等選擇相同型號、相同批次的10部TBRl20B調頻通信電臺作為待分類對象,分析其瞬態特征,采用高階譜分析對輻射源個體特征參數進行提取,并在特征向量中融合對分類具有顯著貢獻的特征參數。采用徑向基神經網絡完成對相同型號、相同批次、工作參數相同的電臺進行個體識別。在15dB信噪比的條件下,識別正確率優于90%。文黼[9]中,史亞等利用三組實測數據來驗證所提方法的有效性。所有數據由國內某研究所提供,都是在民航機場獲取到的航管應答信號。對雷達輻射源信號所提取的不同特征表示,分別構建相應的核函數或核矩陣,然后通過一定的準則計算它們的組合系數,并同時或獨立獲得支持向量機的分類超平面,最終實現對輻射源信號的分類。該方法能夠實現輻射源信號模糊函數多個“近零”切片特征的有效融合,得到比代表性切片更優的識別性能。文獻[10]中,唐哲等利用10部同廠家同型號FM電臺在相同工作模式下采集的實驗數據,提出一種基于全局潛在低秩表示(Global LatentLow Rank Representation,GLat-LRR)的通信輻射源潛在細微特征提取方法。首先,提取通信輻射源信號的瞬時頻率,通過傅里葉變換將信號投影到高維特征空間;挖掘特征樣本之間全局的低秩結構和維度之間全局的潛在低秩關系,將特征樣本集作為整體應用到潛在低秩表示模型中,利用維度之間低秩關系得到特征樣本集的潛在部分矩陣,每個列向量即為每個通信輻射源信號的潛在細微特征向量。實驗表明,在特征維度取512維至768維之間時,通信輻射源識別率增長最為明顯,普遍能夠增加30%的識別率。文獻[11]中,Shouyun Deng等在實驗室條件下(28.2dB)捕獲收音機信號,利用不同的信號發射機在信號幅度信息上無意調制和有意調制的細微差別,即其“指紋”,利用概率學和統計論中的經典測量方法(偏度和峰度),定義了線性偏度和線性峰度作為輻射源個體特征,近千次的實驗結果表明能夠實現對輻射源個體的完美識別,大于20dB時識別準確率能夠達到100%。文獻[12]中,黃欣等使用仿真的高斯頻移鍵控(Gaussian Frequency-Shift Keying,GFSK)信號,利用通信輻射源信號的長時譜統計特性,提取信號功率譜峰值特征和包絡模板,構造通信輻射源個體特征向量,通過樸素貝葉斯分類算法與個體特征矢量相結合,在訓練樣本數目足夠大的條件下可進行有效識別。測試實驗表明,識別方法穩健有效,可在信噪比5dB情況下實現93.7%的正確識別概率。
2.2深度特征方法
深度學習提出讓計算機自動學習出模式特征的方法,并將特征學習融入到了建立模型的過程中,能夠減少人為沒計特征造成的不完備性。無監督學習策略使其直接從輸入的數據中提取指紋特征,跨越人工設計指紋特征的階段,能夠節省大量科研成本;相比于有限的已知樣本,深度學習方法可以很好地利用實際復雜電磁環境中的海量無標簽通信輻射源樣本,充分訓練學習機模型,更好表征通信輻射源個體,有效改善“小樣本”問題對指紋特征提取的影響;以逐層貪婪的方式對數據特征壓縮,可使最終提取的指紋特征具備較低的維度,在以較低維度特征有效表征通信輻射源個體的同時,還可與傳統分類器對接通用,解決通用分類器不能完整利用指紋特征信息的問題。
文獻[13]中,黃健航等在實際環境下采集的kenwood手持式FM電臺數據集和kirisun通信電臺數據集上進行大量實驗,對通信輻射源信號進行矩形積分雙譜變換后獲得包含通信輻射源指紋特征的高維數據,利用大量無標簽的通信輻射源高維樣本訓練堆棧自編碼器網絡,在此基礎上,通過少量有標簽的通信輻射源樣本對softmax回歸模型進行精校洲練,從而獲得面向通信輻射源指紋特征提取的深度學習網絡,算法顯著改善了小樣本條件下通信輻射源指紋特征提取能力。文獻[14]中,Shamnaz Riyaz等在SDR收發環境下,通過對I/Q序列樣本模塊的修改以增大輻射源個體內在特征之間的差異,并利用優化的深度卷積網絡實現輻射源個體的可靠識別,同時對比了SVM與邏輯回歸方法的性能表現,證明了卷積神經網絡(Convolutional Neural Network,CNN)架構識別輻射源個體的有效性,并實驗驗證了2-50英尺距離范圍內采集的數據識別性能。文獻[15]中,Qingyang Wu等對六個同類型USRP發射器采集的I/Q數據,利用循環神經網絡(Recurrent Neural Network, RNN)中的長短期記憶網絡(Long Short-Term Memory,LSTM),有效捕捉輻射源長期和短期硬件特性,并基于發射機和接收機之間電纜增加噪音干擾,實驗論證了LSTM架構對于輻射源個體識別具有較高的檢測精度。文獻[16]中,劉高輝等提出了一種小樣本條件下基于深度置信網絡(Deep Belief Network.DBN)的通信輻射源個體識別方法。首先分析通信輻射源信號頻帶內互調干擾信號的幅度和相位特性,建立基于互調干擾信號的通信輻射源個體特征;然后對輻射源信號進行預處理得到通信輻射源信號的矩形積分雙譜,再采取對比散度的方法,利用高階譜自底向上訓練每個受限玻爾茲曼機,通過多次迭代得到合適的權重、隱藏層的偏差和可見層的偏差,從而提取出輻射信號的互調干擾信號特征;最后使用softmax分類器對訓練模型進行微調,獲得面向通信輻射源細微特征識別的深度學習網絡。使用仿真的輻射源信號采樣的數據集進行分類實驗,提出的四層DBN網絡能夠有效地識別出通信輻射源的個體。文獻[17]中,Yiwei Pan等提出了一種仿真條件下基于深度殘差網絡(Deep ResidualNetwork)的輻射源個體識別方法。利用接收信號的希爾伯特譜得到灰度圖像,并輸入深度殘差網絡中進行學習,結合了希爾伯特譜圖像的高信息完整性,和深度殘差網絡相比CNN網絡計算低復雜性,在單跳和中繼場景中均具有良好的個體識別性能。