












摘 要:通信輻射源個體識別是指通過對無線設備產生的信號數據進行特征提取與信號處理,從而實現對無線設備的個體識別。現有應用于輻射源個體識別的時間序列分類方法,存在無法有效提取IQ時間序列數據特征和識別準確率低的問題。針對以上問題,提出了一種BiLSTM網絡和卷積神經網絡兩個支路并行的網絡架構(BiLSTM-CNN),它顯著提高了分類模型的性能,能夠關注和融合時間序列中重要的特征,從而實現更準確的分類。在該架構中還添加了注意力模塊,根據注意力權重的分配來融合通道信息獲取特征,從而使網絡能夠關注到更加關鍵的特征。實驗結果表明,相較于其他網絡結構,所提出的網絡模型在Oracle公開數據集上的識別準確率更高,尤其在存在多徑效應和路徑損耗的樣本中有明顯提高,說明文中所提出的模型具有更高的魯棒性。
關鍵詞:輻射源個體識別;卷積神經網絡;BiLSTM;注意力機制;無線通信;特征提取
中圖分類號:TP391;TN911.7 文獻標識碼:A 文章編號:2095-1302(2025)01-000-06
0 引 言
近些年來,由于無線通信設備的普及和互聯網通信技術的不斷發展,手機、筆記本電腦等無線通信設備已然成為人們工作生活的必需品。然而,無線通信技術的迅速發展也是一把雙刃劍,由于無線信號調制方式不斷增加,通信環境的干擾也不斷增多,電磁環境也變得更加復雜多變。在軍事方面,在兩軍作戰的區域中,敵我雙方的各類無線通信設備數不勝數,這對于無線電通信設備個體識別的干擾極大,排除噪聲干擾也極其困難[1]。以往用于無線電設備識別的信號調制參數、碼元速率、電平、載頻等基本特征[2],在無線電設備數量較多且存在多方面因素干擾的情況下很難滿足現代戰場上對無線電設備個體準確識別的要求。
在過去的幾十年中,無線通信設備的射頻指紋提取和識別方法受到了廣大學者的研究和關注。文獻[3]提出了一種基于小波變換的特征提取與人工神經網絡相結合的信號自動快速分類和識別方法,并用此方法分析了無線通信設備的瞬態信號,進而完成對未知無線電發射機的分類和識別。文獻[4]提出了在無線發射機中提取瞬態信號,并首次提取出瞬態信號中的“指紋”。文獻[5]提出了用于識別無線設備的技術——“射頻指紋識別”,同時提出了一種利用相位特性進行檢測的新算法,用于提取藍牙通信信號中的瞬態特征,進而識別不同的通信設備。每個無線設備都有其獨一無二的特征,類似于每個人都有不同的指紋,每個無線設備的硬件差異也是一種“射頻指紋”,這種差異可以通過分析接收到的射頻信號來提取,因此從射頻信號中提取射頻指紋的方法被稱為“射頻指紋提取”。
1 通信輻射源個體識別方法
無線通信輻射源個體的射頻指紋提取和識別是一種基于射頻信號特征的識別方法,其流程如圖1所示。首先需要在特定環境下采集無線通信輻射源發出的射頻信號數據,可以使用專業的射頻信號采集設備,如頻譜分析儀、信號分析儀等,對輻射源發出的信號進行采集。在采集射頻信號的過程中,不可避免地會經歷反射、折射、衍射等過程,通過不同的傳播路徑最后到達信號接收端,因此在采集射頻信號之后需要對射頻信號進行能量歸一化、去除噪聲等信號預處理。在預處理階段需要盡量避免噪聲影響,因此在信號的采集預處理過程中對儀器的精度要求較高,一般應使用高精度儀器。近幾年,人們開始研究使用通用軟件無線電外設等中低端設備進行信號的采集與預處理。然后從預處理后的射頻信號數據中提取出有用的特征,通常使用信號處理和機器學習的方法進行特征提取。常用的特征包括信號的頻譜、時域波形、功率譜密度、自相關函數等。提取特征以后,建立射頻指紋識別模型,將從新采集到的信號中提取出的特征輸入到模型中,模型輸出結果表示信號來自哪個輻射源。
無線通信設備在生產和制造過程中會存在不同程度的缺陷,在生產過程中由于各種因素影響,即使是同一批器件也會存在差異,這種器件的差異性最終會導致器件的容差效應。電子元器件的差異通常分為制造容差和漂移容差兩種。制造容差是指電子元器件在生產過程中,由于生產原材料、生產環境以及設備制造工藝等因素所造成的電子元器件參數與標稱值之間的誤差,降低誤差則需要更高的生產成本。而漂移容差指的是由于電子器件的存放和使用時間過長而導致的器件退化老化所造成的參數偏差。除此之外,無線通信設備的使用環境變化也會導致器件參數出現變化。由于存在容差效應,即使是同一個廠家的同一型號甚至是同一批次生產出來的電子器件都會存在一定的參數差異,這些硬件差異就是射頻指紋的基礎,因此射頻指紋能夠作為無線通信設備的獨有特征。
2 時間序列分類
時間序列數據是按照時間順序排列的數據點集合。時間序列分類是根據時間序列的模式和屬性分為不同的類別或標簽。時間序列分類的困難之處在于不同時間序列或不同變量在時間尺度上的差異較大,很難高效地提取到有用特征。通常來說,單一分類模型僅僅針對某些類型的時間序列有較好的分類效果,但在泛化能力上仍然存在不足。
因此,傳統的分類算法往往不能直接應用于時間序列數據。為了解決這個問題,研究者們開發了許多基于機器學習和深度學習的時間序列分類方法,尤其是深度學習在時間序列分類中的應用有效地解決了數據預處理這一繁雜的問題,并且分類準確度得到顯著提高。例如,多層感知機通過全連接神經元為時間序列數組的每個元素逐層賦予權重,并輸出最終各類別的概率分布。但是,多層感知機學習所有元素之間的相關性,無法有效地提取特征。文獻[6]提出了一種全新的端到端神經網絡模型——多尺度卷積神經網絡(Multi-scale Convolutional Neural Network, MCNN)。MCNN將特征提取和分類集成在一個框架中,利用新的多分支層和可學習的卷積層自動提取不同尺度和頻率的特征,從而獲得更好的特征表示。然而,網絡模型的超參數選擇和信號數據的預處理質量好壞在很大程度上決定了MCNN模型的分類精度,因此該模型仍有改進的空間。文獻[7]提出了一種結合了多尺度特征提取和注意力機制的深度學習模型——MACNN(Multi-scale Attention Convolutional Neural Network)。MACNN利用多尺度卷積生成不同尺度的特征圖,以捕獲時間軸上不同尺度的信息;然后提出一種注意力機制,通過自動學習每個特征圖的重要性來增強有用的特征圖。MACNN破除了單尺度卷積和等權重特征圖存在的局限性。
上述網絡模型仍然存在一些不足,例如僅僅使用卷積神經網絡提取時間序列特征經常會導致無法高效提取序列的特征。此外,還存在未考慮序列特征的重要性差異的問題。針對這些問題,可以引入注意力機制或者加權損失函數等方法,使網絡能夠更加關注對分類有較大貢獻的特征。上述2個問題如果得到有效解決,則能夠增強網絡的分類能力,并避免資源的浪費。
針對上述不足,本文提出了一種基于BiLSTM和卷積神經網絡的模型用于進行輻射源個體分類識別。該網絡為BiLSTM和CNN兩個支路并行的網絡架構,其結合了BiLSTM和卷積神經網絡的優點,并且在網絡中添加了注意力機制,使得網絡模型能夠自動學習對更加重要的特征賦予較多的關注。結果表明,本文所提出的模型在Oracle公開數據集上具有良好的效果,證明了所提出的網絡模型的有效性,尤其在傳輸距離較遠的樣本中也具有較好的效果。由于傳輸距離較遠時會引起多徑效應和路徑損耗,增加了輻射源個體識別的難度,而本文所提出的模型仍能成功識別,表明了模型具有更高的魯棒性。
3 相關工作
3.1 LSTM網絡
LSTM網絡是以循環神經網絡(RNN)為基礎,增加了記憶細胞狀態的RNN改進模型,使用門機制和記憶細胞來實現序列信息的有效傳遞。LSTM共有3個門:遺忘門、輸入門(更新門)和輸出門。LSTM在處理較長的時間序列信息時,可以有效解決普通的循環神經網絡存在的記憶丟失和梯度消失問題[8]。LSTM包含一個隱藏向量h和一個記憶向量m,它們協同作用,通過復雜的門控機制控制每個時間步長中的狀態更新。計算公式如下:
式中:gu、gf、go、gc分別代表輸入向量、記憶單元、輸出向量和細胞狀態;ht是LSTM單元的隱藏向量;σ代表Softmax函數;W u、W f、W o、W c表示回歸權重矩陣。
LSTM模型是可以支持雙向輸入的,BiLSTM由前向LSTM和后向LSTM組成。BiLSTM的工作原理是一個LSTM單元處理正向輸入,另一個單元處理反向輸入,這樣能夠兼顧處理過去和未來的信息,使網絡能夠更好地理解某個時刻前后的信息。
3.2 卷積神經網絡模型
卷積神經網絡(Convolutional Neural Network, CNN)是一種深度學習模型,特別適用于處理具有網格結構的數據,如圖像和視頻。卷積神經網絡模型通過使用卷積層、池化層和全連接層來學習圖像特征,并在圖像分類、目標檢測和圖像生成等任務上取得了巨大成功。近些年來也被廣泛應用于輻射源個體識別領域,最常見的有LeNet模型、AlexNet模型、VGG模型、ResNet模型等。卷積神經網絡模型的核心是卷積層,每層卷積層都采用若干個卷積核進行卷積運算,通過滑動卷積核在輸入圖像上提取特征。這些特征在不同的卷積層中被逐漸提取,最終被送入全連接層進行分類或完成其他任務。池化層則用于降低特征圖的尺寸,減少計算量,同時保留重要的特征信息。卷積神經網絡有3個最重要的性質:局部連接、權值共享和平移不變性。這些性質決定了卷積神經網絡的參數數量相比于其他的深度神經網絡顯著較少,并且學習到的特征具有平移不變性等優點。
3.3 注意力機制
注意力機制是一種模仿人類注意力機制的深度學習技術,它可以使神經網絡在處理序列數據時更加關注重要的部分,從而提高模型的性能和效率。文獻[9]提出的注意力機制在近年來已被廣泛應用于語音識別、自然語言處理等領域。在深度學習中,注意力機制最常用在自然語言處理領域,特別是在機器翻譯任務中。傳統的神經機器翻譯模型(如編碼器-解碼器模型)在翻譯長句子時可能會出現信息丟失或模糊的問題,而引入注意力機制可以使模型在翻譯每個詞時更加關注輸入句子中與當前詞相關的部分,從而提高翻譯質量。除了機器翻譯,注意力機制還被廣泛應用于語音識別、圖像標注、圖像生成、時間序列分類等領域,并且取得了良好的效果。
4 BiLSTM-CNN模型
本文提出用于時間序列分類的BiLSTM-CNN模型如圖2所示,該模型由BiLSTM網絡和卷積神經網絡并聯而成。卷積神經網絡和LSTM網絡在互不干擾的情況下對輸入的IQ時間序列進行特征提取,最后經過特征融合,將2個網絡模型支路提取到的時間序列特征和有關信息融合到一起,再輸入Softmax層計算分類概率向量,輸出分類結果,并且在網絡輸出后對其進行監督,根據交叉熵損失函數進行網絡參數的學習和更新。
卷積神經網絡模型支路由卷積層、批歸一化層和ReLU層組成,通道數分別為32、64、128。第一層采用2×3的卷積核提取IQ數據的相關性特征,并且進行數據降維;然后再使用1×5和1×7的一維時域濾波器提取時域上的特征。在每一層卷積層后都使用了批歸一化層和ReLU激活函數。批歸一化操作能夠提高模型的魯棒性,還能加快模型的訓練速度,防止過擬合。網絡中使用ReLU作為激活函數,用于增強網絡模型的非線性關系,使得學習參數更加稀疏化,從而降低網絡的計算復雜度。此外,為了進一步提高模型性能,在前2個卷積層中還添加了一個擠壓-激勵模塊,圖3為該模塊在本結構中的計算過程。擠壓-激勵模塊能夠自適應地重新校準輸入特征圖,即能夠使有效的特征圖權重更大,無效或效果較小的特征圖權重小。對于整個擠壓-激勵模塊,設置減速比r為16,最后時序卷積塊后連接了一個全連接層。
對于另一個支路,本文采用了一種BiLSTM和注意力機制結合的網絡模型,包含維度轉置層(Dimension Shuffle)、BiLSTM層和丟棄層(Dropout)。BiLSTM是對LSTM模型的改進,在許多應用領域均取得了比LSTM更好的效果。本文在BiLSTM中加入了注意力機制,在輸入序列和輸出序列之間建立了一種對齊的方式,使得模型能夠更加關注輸入序列中與輸出序列對齊的部分,從而提高模型的分類效率。首先時間序列數據被輸入到維度轉置層,維度轉置層能夠調換輸入時間序列的維度,使輸入的2×128的時間序列樣本被視為長度為2、具有128個變量的時間序列,維度轉置層能夠顯著提高訓練效率。維度轉置層之后的時間序列數據被輸入到添加了注意力機制的BiLSTM層,以提取時間序列相關性信息;隨后被傳入到丟棄層,在訓練過程中根據所設定的概率p隨機移除一些神經元,目的是為了防止模型過擬合,增加模型的魯棒性,本文將丟棄層概率p設為0.8。
最后將兩個支路的網絡模型所提取的時間序列注意力特征和相關性信息輸入到特征融合層,隨后該融合后的特征被送入Softmax層以計算其分類概率,最后輸出分類結果。另外,為了避免過擬合,還添加了L2正則化項,其正則化參數設置為λ=0.000 1,網絡優化器選擇Adam,學習率設定為0.000 1。
5 實驗結果與分析
5.1 實驗數據集
近些年來,通信輻射源個體識別的研究越來越受到廣大學者的關注,因此對于通信輻射源實采數據集的需求也越來越大。本文使用2019年美國東北大學公開的通信輻射源實采數據集Oracle[10],用于驗證所提出的輻射源個體識別方法。該數據集使用16臺高端X310 USRP SDRs作為發射器,這些SDRs具有相同的B210無線電接收器。通過MATLAB WLAN系統工具箱生成符合IEEE 802.11a標準的幀。數據幀包含隨機生成的數據并具有相同的地址字段,用以進行空中無線傳輸。接收機SDR以5 MHz的采樣率、2.45 GHz的中心頻率對輸入信號進行采樣。該數據集為每個電臺收集了超過2 000萬個樣本數據,并且是在開闊的區域進行試驗,收發距離從2 ft增加到62 ft,每次間隔6 ft。
5.2 數據預處理
本文從Oracle數據集中采集到的每種輻射源設備的信號序列隨機選取10 000個采樣點用于實驗,將這10 000個采樣點的前8 000個點用于產生訓練樣本,后2 000個點用于產生測試樣本。本文采用滑動時間窗法對輻射源的時間序列數據進行分割。圖4展示了采樣過程?;瑒哟翱跁r間長度的選取對于模型訓練以及預測效果是至關重要的。參照文獻[11],本文最終選取長度為128、步長為1的滑動窗口,在IQ信號數據序列中的I路和Q路分別提取2×128的樣本。
完成訓練樣本的采集和篩選之后,需要在建模之前對數據進行預處理,目的是消除量綱的影響。數據標準化對于模型訓練是十分重要的,如果數據未進行標準化直接建模,可能導致模型對于數值相對較大的樣本過多關注,對數值相對較小的樣本缺乏學習,訓練不充分,最終導致模型效果不好。通常來說,數據預處理標準化的方法有Z-Score標準化、Min-Max歸一化、均值方差標準化、小數定標法等方法,本文使用的是Min-Max歸一化法。Min-Max歸一化法就是利用數據列當中的極值(即最大值、最小值)進行標準化處理,將數據線性地縮放到一個指定的范圍,通常是[0, 1]或者[-1, 1],計算方式為將數據與該數據列的最小值作差,再除以最大值與最小值的差。具體計算如下:
(2)
式中:x_表示標準化后的數據;min表示數據列中的最小值;max表示數據列中的最大值。
5.3 實驗環境
實驗環境配置如下:操作系統基于Windows,編程語言采用Python 3.9,硬件配置為12代Intel? Core? i7-12700F CPU處理器,以及NVIDIA GeForce RTX 3060 GPU顯卡。
5.4 對比實驗
為了驗證本文提出模型的有效性,在公開數據集Oracle中選取了收發距離為2~50 ft的4種輻射源信號序列,隨機選取其中10 000個采樣點進行實驗測試,使用滑動窗口法生成訓練集和測試集,窗口長度為128、步長為1。
本文使用Oracle-CNN模型對Oracle數據集的2~50 ft數據進行了分類實驗。Oracle-CNN模型如圖5所示。該模型使用了2層卷積層來提取時間序列中的特征,每層卷積層之后使用一個最大池化層來減少神經網絡訓練的參數和計算的數量。隨后將2層卷積層的輸出作為全連接層的輸入,全連接層對前面卷積層提取的特征進行分類,最后在輸出層使用Softmax激活函數。
由圖6可知,Oracle-CNN在短距離樣本中能夠達到極好的效果,但是在收發距離較長的數據樣本時精度顯著下降。這是因為在信噪比較低的多徑無線信道中,傳輸距離過長或反射所引起的多徑效應和路徑損耗對分類產生了影響。
鑒于此,本文設計了BiLSTM-CNN模型,該網絡模型在遠距離樣本上也具有較好的分類精度,在38 ft樣本上比Oracle-CNN提高8個百分點,在更遠距離的樣本上也能夠取得較好的分類效果,如圖7所示。
為了證明本文所提出的BiLSTM-CNN模型的有效性,分別單獨采用LSTM、BiLSTM、CNN模型做了實驗,并與本文所提出的BiLSTM-CNN分類模型進行對比,實驗結果如圖8、圖9、圖10所示。
結果證明了BiLSTM相較于LSTM有著更好的效果,主要是因為BiLSTM模型在處理時間序列數據時,會同時考慮前序信息和后序信息,因此在處理時間序列分類問題時更有優勢。
通過對比3種網絡模型在遠距離樣本上的精度可以顯而易見地看出,LSTM相比于BiLSTM在時間序列分類上效果要較差一些;單獨使用傳統的CNN模型或BiLSTM模型時,其識別精度相比于本文的BiLSTM-CNN模型也較低。
此外,本文還對比了注意力機制對模型性能的影響,注意力機制能夠幫助模型學習時間序列的底部特征[11],賦予關鍵特征更高的權重,從而能夠獲得更加準確合理的有效特征。分別測試了加入和不加入注意力機制對模型性能的影響,結果如圖11所示。
添加了注意力機制以后,模型的分類性能得到了提升,在遠距離樣本上提升效果更加明顯,表明注意力機制在時間序列分類方面具有有效性和魯棒性,說明將BiLSTM和CNN與注意力機制結合提取局部信息和全局信息能夠有效提高神經網絡模型的性能。
實驗結果對比表明,本文提出的分類模型在Oracle數據集上表現出更好的射頻輻射源分類識別精度,在解決IQ時間序列分類任務方面更有優勢。
6 結 語
目前,無線通信設備的射頻指紋提取和識別仍然存在許多困難和挑戰。為了提高在輻射源個體識別任務中的分類效果,本文設計了一種BiLSTM網絡和卷積神經網絡2個支路并行的網絡架構(BiLSTM-CNN)對輻射源的射頻信號進行分類識別。該模型結合了BiLSTM、卷積神經網絡模塊和注意力機制的優勢。BiLSTM能夠捕捉時間序列數據中的長期依賴關系和時間動態特征,控制序列信息的傳遞,從而更有效地對時間序列進行分類;卷積神經網絡模塊可以有效地捕捉時間序列數據中的局部模式和特征,并通過卷積操作和池化操作實現參數共享,使得模型在學習過程中更好地利用數據的局部相關性;注意力模塊用于融合通道特征信息,使網絡對于重要的特征給予更高的關注度。
在Oracle公開數據集中進行的實驗證明了相較于其他網絡結構,本文所提網絡模型的識別準確率更高,尤其在存在多徑效應和路徑損耗的樣本中其準確率也有明顯提高,說明本文所提出的模型具有更高的魯棒性。
注:本文通訊作者為張贊。
參考文獻
[1]李偉,魏光輝,潘曉東,等. 復雜電磁環境下通信裝備干擾預測方法[J]. 電子與信息學報,2017,39(11):2782-2789.
[2]鄭娜娥,王盛,張靖志,等.基于射頻指紋的輻射源個體識別技術綜述[J].信息工程大學學報, 2020, 21(3):285-289.
[3] CHOE H C, POOLE C E, ANDREA M Y, et al. Novel identification of intercepted signals from unknown radio transmitters [C]//SPIE’s 1995 Symposium on OE/Aerospace Sensing and Dual Use Photonics. International Society for Optics and Photonics. [S.l.]: [s.n.], 1995: 504-517.
[4] NEUMANN C, HEEN O, ONNO S. An empirical study of passive 802.11 device fingerprinting [C]//32nd International Conference on Distributed Computing Systems Workshops (ICDCSW). [S.l.]: IEEE, 2012: 593-602.
[5] HALL J, BARBEAU M, KRANAKIS E. Detection of transient in radio frequency fingerprinting using signal phase [J]. Wireless and optical communications, 2003: 13-18.
[6] CUI Z C, CHEN W L, CHEN Y X. Multi-scale convolutional neural networks for time series classification [EB/OL]. (2016-05-11)[2021-06-20]. https: //arxiv. org/pdf/1603. 06995. pdf.
[7] CHEN W, SHI K. Multi-scale attention convolutional neural network for time series classification [J]. Neural networks, 2021, 136: 126-140.
[8] HOCHREITER S, SCHMIDHUBER J. Long short-term memory [J]. Neural computation, 1997, 9(8): 1735-1780.
[9] FRANCESCHI J Y, DIEULEVEUT A, JAGGI M. Unsupervised scalable representation learning for multivariate time series [C]// Proceedings of the 33rd Conference on Neural Information Processing Systems. [S.l.]: [s.n.], 2020.
[10] SANKHEK, BELGIOVINEM, ZHOU F, et al. Oracle: optimized radio classification through convolutional neural networks [C]//IEEE Conference on Computer Communications. [S.l.]: [s.n.], 2019: 370-378.
[11] RIYAZ S. Deep learning convolutional neural networks for radio identification [J]. IEEE communications magazine, 2018, 56(9): 146-152.