茆旋宇,官友廉,陳永游,祁友杰,王 歡
(1.中國航天科工集團8511研究所,江蘇南京210007;2.中國人民解放軍75798部隊,廣東汕頭515000)
輻射源個體識別,也稱特定輻射源識別(specific emitter identification),是通過輻射源信號之間的細微差異區(qū)分不同輻射源個體的技術,在軍用和民用領域有著巨大的實用價值。傳統(tǒng)方法主要通過構造并提取相關細微特征實現(xiàn)個體識別,比如文獻[1]提取信號的模糊函數(shù)的零點切片作為輻射源個體特征,實驗證明該特征具有較好的分類性能;文獻[2]通過測量信號的瞬時頻率對FSK調制信號進行個體識別;文獻[3]使用希爾伯特黃變換對信號進行時頻特征分析,完成信號個體的分類;文獻[4-6]分別使用不同的方法獲取雙譜特征以表征信號的個體特征,得到了不錯的識別結果;文獻[7-8]對輻射源的發(fā)射機進行非線性建模,通過熵分析提取個體特征從而識別不同的輻射源個體,文獻[9-10]分析了信號的暫態(tài)過程并使用分形維數(shù)表示個體特征,在高信噪比條件下取得了較好的識別效果。
上述方法雖然在一些特定場景下有不錯的效果,然而都需要人為提取特征,這需要很強的先驗知識,包括對輻射源類型、信號種類、調制方式、發(fā)射機設備的工作機理、信道環(huán)境等進行分析,這就導致提取特征的過程十分復雜且耗時。同時,提取何種特征、提取的特征是否有效往往沒有嚴格的理論基礎,一般是通過專業(yè)人員的經驗確定,這就導致提取的特征可靠性存疑、特征很難適應不同類型的信號。隨著信號處理技術的迅速發(fā)展,提取有效輻射源細微特征愈發(fā)困難,傳統(tǒng)方法的識別效能愈發(fā)不足。
深度學習的概念最早由Hinton等于2006年提出,指基于樣本數(shù)據(jù)通過一定的訓練方法得到包含多個層級的深度網絡結構的機器學習過程。深度學習之所以被稱為“深度”,是相對支撐向量機、提升方法、最大熵方法等“淺層學習”方法而言的。深度學習所學得的模型中,非線性操作的層級數(shù)更多,淺層學習依靠人工經驗抽取樣本特征,網絡模型學習后獲得的是沒有層次結構的單層特征;而深度學習通過對原始信號進行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動地學習得到層次化的特征表示,從而更有利于分類或特征的可視化。
深度學習由于具有強大的特征學習能力,逐漸成為各個領域的研究熱點。深度學習方法通過卷積神經網絡、受限玻爾茲曼機、自編碼器及其變型等基礎模塊搭建深層神經網絡,這類深層網絡可以自動地學習得到層次化的特征表示,從而更有利于分類或特征的可視化,目前已經在語音識別、信息檢索和計算機視覺等領域取得了突破性進展,也越來越多地被引入到個體識別領域。近年來,基于深度學習的輻射源個體識別技術也得到了研究人員的關注。
一般認為,輻射源個體之間的差異是由于設備內部元器件生產制造時的細微容差,人為調試,工作環(huán)境如溫度、濕度、氣壓的差異以及設備的老化等原因導致的。以典型的輻射源發(fā)射機為例,其簡化框圖如圖1所示。基帶信號經過數(shù)字信號處理與模數(shù)轉換后進入模擬電路,信號通過濾波、調制、混頻、功放、射頻天線等輻射到空間中,這些設備內部的差異以及相互作用最終形成了輻射源的個體特征。

圖1 典型輻射源發(fā)射機結構框圖
任何輻射源設備都需要振蕩器獲得穩(wěn)定的頻率源,對于常見的振蕩器,其內部的半導體器件由于生產工藝的細微差異,其產生的載頻不是恒定的,會存在一定偏差,甚至會出現(xiàn)頻率的不穩(wěn)定變化,這種影響可以用一個時變的相位噪聲表示,其相應的信號表達式為:

式中,ω0表示振蕩器輸出頻率,ε為相對標準頻率的偏移,而θ(t)為振蕩器不穩(wěn)定引起的相位噪聲。
對于IQ正交調制,由于I路和Q路內部器件的微小差異,信號在正交調制時會出現(xiàn)IQ2路的增益不等、相位不是嚴格正交、延遲量有細微差異等問題,而這些非線性畸變會體現(xiàn)在信號的時域波形上,表現(xiàn)為調制參數(shù)的誤差。假設基帶的IQ2路數(shù)字編碼序列為sI(n)與sQ(n),二者首先通過基帶成型濾波器,假設濾波器為理想狀態(tài),則輸出分別為:

式中,h(t)表示基帶成型濾波器,τI、τQ分別為這 2路的延遲誤差,bias表示2路存在的偏置差異。兩路信號經過正交調制后形成中頻信號:式中ωc為信號中頻,εI與εQ分別為2路的相位偏差,這種偏差會導致符號之間的干擾,星座圖會發(fā)生形變。

對于發(fā)射機內部諸如振蕩器、混頻器、功放等有源器件,在信號輸入輸出過程中由于器件的非線性影響,信號本身會產生寄生調制,一般是以寄生波疊加的形式出現(xiàn)在信號上,數(shù)學表達式為:

最終在信號主頻帶附近會出現(xiàn)寄生諧波,這種寄生諧波分量可以用于表示輻射源的個體特征。
以上部分對輻射源內部細微特征的產生原因與表現(xiàn)形式進行了分析,這些因素導致信號出現(xiàn)載頻抖動、偏移、調制參數(shù)誤差、諧波分量、雜散噪聲等,而這些影響會在信號的時域波形以及頻譜、功率譜等方面體現(xiàn)出來,因此通過對原始信號的相應處理,可將這些細微特征提取出來。
卷積神經網絡,即一種通過構建卷積層實現(xiàn)類似卷積運算操作的神經網絡結構,已在數(shù)字圖像處理、目標識別、自然語言處理領域取得了巨大成就,是當前最成功的深度學習模型結構,其主要由卷積層、池化層、全連接層等組成,基本結構如圖2所示。鑒于其強大的實際性能與適用場景,本文將其用于對講機個體識別領域。

圖2 卷積神經網絡基本結構
算法基本原理如圖3所示,首先通過接收設備采集輻射源中頻信號,接下來對中頻數(shù)據(jù)進行預處理和個體類別標注形成訓練數(shù)據(jù)集,然后構建卷積神經網絡,使用訓練數(shù)據(jù)集進行訓練,得到訓練好的模型。最后采集不同場景下的輻射源信號作為測試數(shù)據(jù)集,使用該模型進行推理識別,分析網絡模型的識別性能。

圖3 個體識別結構框圖
本文構建了一種基于殘差網絡結構的深度卷積神經網絡,由卷積層、池化層、BatchNormalization層、殘差結構、全連接層等組成。
卷積層主要用于“空間濾波”,起到提取輸入特征的作用。傳統(tǒng)卷積神經網絡一般用于圖像視頻等高維數(shù)據(jù),而輻射源中頻信號為一維時間序列,因此模型選用一維卷積核構建卷積層,考慮到輻射源信號的特點,使用了大尺度的一維卷積核以感知更大范圍內的信號細微變化。
池化層用于對數(shù)據(jù)進行降維減小模型復雜度,同時可以擴大模型的感受野規(guī)模,提高模型的識別性能,該模型默認使用最大池化,而最后一層池化使用GlobalAveragePooling,通過對卷積層輸出的每一個feature map進行全局平均,可以在大幅降低網絡參數(shù)的同時保留空間信息[11]。
BatchNormalization層對輸入數(shù)據(jù)的分布做歸一化處理,使得輸入分布更加均勻和固定[12],加速網絡收斂。其數(shù)學表達式如下:

式中,X為上一層的輸出結果,xi為其第i個節(jié)點的值,μ與σ2為其均值和方差,ε為一很小的正數(shù)以防σ2為零,Y為最終的輸出結果,γ與β為線性運算的權重,可以通過訓練得到。
引入殘差技術在增加網絡深度的同時減小模型的復雜度[13],進一步減小過擬合風險,提高網絡性能。本文使用了bottleneck的殘差結構,其基本形式如圖4所示。相比傳統(tǒng)殘差結構,其首先對數(shù)據(jù)進行降維,尋找輸入的低維表示,然后對數(shù)據(jù)進行升維,這樣可以去除高頻噪聲,提高模型準確度。short cut將卷積前的輸入連接到卷積后的輸出上,可以在較深的網絡結構中保證模型收斂。

圖4 bottleneck殘差結構
由于個體識別任務的特點,損失函數(shù)需要使得相同個體間特征差異小,不同個體之間特征差異大,常用的損失函數(shù)如交叉熵很難滿足條件,因此本文使用AM-Softmax。對于傳統(tǒng)的Softmax交叉熵損失函數(shù),其數(shù)學表達式為:式中,Xi為最后一層的輸入,屬于yi類,Wj為最后一層第j個神經元的權重矩陣,cosθj代表Xi與Wj的角度余弦值。AM-Softmax通過L2歸一化范數(shù)使得||Wj||為1,為一常數(shù)s,將最大的角度余弦值變?yōu)閏osθj-m,式(10)變?yōu)椋?/p>


AM-Softmax通過對余弦距離添加約束,推動不同個體間的決策邊界相距更遠,從而提高了模型的識別能力。
優(yōu)化器選擇帶動量的隨機梯度下降(SGD)算法,使用變化學習率訓練網絡。
為了驗證本文提出方法的有效性,使用對講機作為測試用輻射源設備,通過采集對講機中頻信號訓練神經網絡,并另外采集一批數(shù)據(jù)用于識別驗證。
本文選用了4臺摩托羅拉A 1D型號對講機,這4臺對講機同型號同批次,因此理論上個體特征更為近似,更能有效驗證模型的識別性能。該型對講機采用調頻工作方式,采集設備為IQ接收機,中心頻率為414.5 MHz,采樣率為976 k Hz。采集的中頻信號波形如圖5所示。

圖5 對講機信號波形
由于對講機信號為調頻連續(xù)波,整段信號波形基本沒有變化,因此采用等長截取的方式,以1 024個采樣點為周期,每一周期的信號作為一個樣本。在室內采集一批無人講話和有人講話場景下的數(shù)據(jù)作為訓練數(shù)據(jù)集,每個對講機共采集2 000條樣本。由于采集信號的幅度不等,將信號歸一化到[-1,1]之間。使用這些數(shù)據(jù)訓練深度卷積神經網絡模型,batch size設為64,初始學習率設為0.025,訓練周期數(shù)設為100。為了對比該方法與傳統(tǒng)特征提取方法識別性能的差異,對該訓練集進行特征提取,選用盒維數(shù)、包絡前沿高階矩、小波熵、方差維數(shù)、信息維數(shù)、灰度矩和小波能量比作為指紋特征,標準化處理后訓練Adaboost得到識別模型。
分別在室內無人聲場景、室內有人聲場景、戶外多人嘈雜場景下采集數(shù)據(jù)對模型進行測試,得到識別結果如表1所示。

表1 識別結果
對于室內無人聲場景下的測試數(shù)據(jù),模型表現(xiàn)最好,識別率都在99%以上,而傳統(tǒng)特征方法同樣取得了優(yōu)秀的識別結果,只有第2臺對講機識別率稍微低了一些,為95.16%。當識別室內有人聲的信號時,模型的識別率明顯下降,但也都在91%以上,而傳統(tǒng)特征方法對第2臺對講機識別率偏低,只有70.59%。當測試戶外嘈雜環(huán)境下的數(shù)據(jù)時,兩種方法的識別率都變得更差,傳統(tǒng)特征方法對第2臺對講機識別率已經不足70%,而卷積神經網絡仍能保持在89.31%。
由實驗結果可知,本文使用的深度卷積神經網絡在各個測試場景下的識別率都高于特征提取的方法,同時該模型對于戶外場景有著更好的泛化能力。此外,2種方法在無人聲場景下的識別準確率要遠高于有人聲場景,這是由于無人聲時,對講機信號為理想正弦波,沒有語音信息的干擾,輻射源個體特征表現(xiàn)最明顯。當有人聲時,信號加入了語音信息,個體特征容易被語音信息掩蓋,使得模型提取個體特征變得困難。而相比室內環(huán)境,室外接收的信號信噪比更低,受到干擾的影響也更大,同時嘈雜環(huán)境帶來的語音信息更為復雜,這些都對模型產生了影響,從而使得識別率變差。
本文通過引入深度學習技術,構建深度卷積神經網絡來解決對講機個體識別問題,并通過采集對講機中頻信號驗證該方法的實際性能,驗證結果表明,該方法在多個場景下識別率都明顯優(yōu)于傳統(tǒng)方法。然而,當信號攜帶大量與個體特征無關的信息時,該方法的識別性能明顯受到影響,同時,當信號受到噪聲和干擾的影響變大時,識別性能也明顯下降,說明該方法針對這些情況還需繼續(xù)優(yōu)化,進一步提高系統(tǒng)的魯棒性。■