王睿奇,付丁一,馬鵬,陳熙來,侯長波
哈爾濱工程大學 信息與通信工程學院,黑龍江 哈爾濱 150001
隨著科技的進步,影響現(xiàn)代戰(zhàn)爭勝負的關鍵因素逐漸演變到信息化戰(zhàn)場層面[1]。現(xiàn)在信息化戰(zhàn)場上各種雷達、導航、無人機等電子裝備的輻射源數(shù)量愈發(fā)增多,信號的調制方式也越來越多樣,致使戰(zhàn)場中的電磁環(huán)境日益復雜[2]。如何在復雜多變的戰(zhàn)場中,對多信號進行檢測和識別,為我軍在電磁頻譜戰(zhàn)領域取得優(yōu)勢奠定堅實的基礎,具有重要的軍事價值[3?4]。
在大多數(shù)非合作通信場景下,調制識別是實現(xiàn)頻譜感知的關鍵一環(huán),也是進行高效信號處理的重要前提。但面對日益復雜的電磁環(huán)境,一般信號檢測方法和傳統(tǒng)信號識別技術往往無法滿足環(huán)境所需的頻譜感知性能,使得電磁感知設備的準確性、抗干擾性和魯棒性受到了挑戰(zhàn)。同時,過去傳統(tǒng)的電磁感知設備笨重且體積龐大,使得電子作戰(zhàn)部隊在機動性和靈活性上存在不足,難以在瞬息萬變的戰(zhàn)場環(huán)境中有效展開行動。因此,設計開發(fā)出解決上述問題的電磁作戰(zhàn)設備,已經成為我軍電磁頻譜領域目前的一種需求[5]。
近年來,深度學習成為了一項熱點技術,相較于基于目標建模和人工特征的傳統(tǒng)信號識別,基于深度學習的信號識別算法識別準確率高,人工成本低,然而計算量龐大,對硬件設備要求高。文獻[6]提出了基于信號的頻譜和幅度特征,對信號進行識別;文獻[7]通過使用卷積神經網絡完成多種信號的識別,識別準確率高,但計算復雜度大且計算時間長;文獻[8]提出通過在網絡權重上引入稀疏限制,在訓練過程對模型進行通道裁剪,減少網絡參數(shù)量,但剪枝要求訓練計算量較高;文獻[9]提出將模型網絡參數(shù)量化成16 位,在盡可能保證識別精度的情況下減少內存的占用和浮點數(shù)運算量。
本文提出了一種便攜式無線電智能感知儀,通過基于滑動窗的信號頻譜能量檢測方法,提高了檢測概率,采用卷積神經網絡來提取信號的I/Q 兩路的特征信息,進行信號的調制方式識別,設備識別準確率得到提升;設計并搭建了系統(tǒng)的硬件平臺,解決傳統(tǒng)電磁感知設備笨重、體積龐大的問題;對模型進行輕量化處理,將32 位浮點數(shù)模型參數(shù)量化為8 位整型數(shù)據,部署到硬件平臺上,在不損失識別精度的前提下,極大減少內存的占用情況和浮點運算量,加快模型推理速度。
智能信號處理模塊主要包含2 個模塊,分別為信號檢測接收模塊和后端的基于神經網絡的信號識別模塊,如圖1 所示。信號檢測模塊能夠對指定寬頻段信號自動掃描,檢測是否有危險信號的存在;然后收集頻段內的I/Q 兩路信號送入信號識別模塊;最后通過卷積神經網絡識別出信號的調制方式。

圖1 智能偵察模塊架構
本文研發(fā)的便攜式智能電磁感知儀的整體設計方案如圖2 所示。該系統(tǒng)由信號檢測平臺、信號識別平臺這2 部分組成,2 部分模塊中的神經網絡模型均使用線性量化方法實現(xiàn)輕量化部署。

圖2 系統(tǒng)整體設計
在一次完整的系統(tǒng)工作流程中,系統(tǒng)將偵察天線接收到的信號進行微波變頻,然后將中頻信號輸入至數(shù)字信號檢測模塊中,從中提取出頻率信息、脈寬信息、功率信息。其中頻率信息、脈寬信息、功率信息在信號識別中得到信號的調制類型。在感知到電磁環(huán)境信息之后,如需要對非合作方的電磁信號做下一步處理,信號分析識別模塊輸出的信息可以作為智能決策的依據。
信號檢測技術的研究是信號識別方法的基礎。經典的信號檢測方法有能量檢測方法[10?12]、匹配濾波器法[13]和循環(huán)平穩(wěn)檢測法[14]。其中能量檢測方法計算復雜度低、成本小,易于在算力有限的邊緣設備中部署[15]。并且,信號在頻譜上的能量分布可以區(qū)別開信號和噪聲,因此本文使用基于掃頻檢測的信號感知方法。算法流程如圖3所示。

圖3 信號檢測接收模塊工作流程
由于信號頻譜數(shù)據涉及不同的調制類型且缺乏關于信號頻率分布的先驗信息,如果直接采用卷積神經網絡進行識別,隨著采樣點數(shù)以及信號數(shù)目的增多會導致計算復雜度的大幅度提升,識別準確率也隨之下降。因此本文提出了一種基于信號能量感應檢測的頻域基帶預處理方法。
首先將頻域上的所有待識別信號進行幅度歸一化處理,使待檢測信號和分類識別網絡訓練集信號幅度匹配,在卷積網絡進行訓練時,數(shù)據集中的數(shù)據在載入網絡之前進行了相關的預處理,將信號幅度范圍限制在了[?1,1]。信噪比較高的信號一般都位于幅值較大的區(qū)域,通過頻域的能量分布對多分量信號頻譜進行分割,并進行幅度歸一化以及基帶調整。為此,本設計在快速傅里葉變化(fast Fourier transformation,F(xiàn)FT)的基礎上,提出了一種基于滑動窗的信號頻譜能量檢測方法,窗函數(shù)的定義如下式所示:
式中a動態(tài)比例因子,大小隨著輸入窗函數(shù)的最大值emax自動調節(jié),a和emax的關系滿足下式:
通過滑動窗中心感知區(qū)與入窗區(qū)和出窗區(qū)的數(shù)值進行比較,當一段頻譜區(qū)間內的信號能量最大值出現(xiàn)在中心感知區(qū)時,認為截取到的即為一個完整的信號。
信號調制識別的準確率對于電磁態(tài)勢感知是一項重要的指標,相較于傳統(tǒng)人工特征提取方法[16?17],基于卷積神經網絡的信號調制識別可以實現(xiàn)特征的自動提取與分類,具有較高的識別準確率。Tu 等[18]提出了將深度復數(shù)網絡應用于調制識別,提高了識別效果,但大幅增加了模型的計算量,在存儲資源受限制的嵌入式設備上難以應用,且復數(shù)卷積層在現(xiàn)有的部署工具上并不支持。因此,需要一種可部署于嵌入式設備中輕量化網絡作為信號識別使用的神經網絡,該神經網絡應具備算力需求低、網絡層算子可部署的特點。文獻[19]提出了一種基于輕量化神經網絡用于手勢識別的方法,該網絡經過輕量化后可直接部署于嵌入式平臺,有算力需求低的優(yōu)點。結合以上研究,本文提出了一種基于INT8 量化的輕量級卷積神經網絡方法實現(xiàn)對信號進行調制識別。
2.2.1 卷積神經網絡
1)卷積層
神經網絡卷積層用來提取數(shù)據的局部特征,并將輸出的特征圖傳遞給下一層。其卷積層的輸出可以表示為
式中:Zl+1和Zl分別為第l層卷積核的輸入和輸出,Ml+1為第l+1層的卷積核,b為偏置項,Kl為第l層特征圖通道數(shù),f為卷積核尺寸,s0為步長。
2)激活函數(shù)層
ReLU 激活函數(shù)其表達式為
3)平均池化層
使用平均池化層使最主要的特征保留,而次要特征被刪除,另外還可以減少參數(shù)量,使模型不易過擬合。本文采用的結構如圖4 所示。

圖4 調制識別網絡結構
當前模型的復雜度和算力需求門檻越來越高。2012 年,Hinton 團隊在ImageNet 比賽中首次使用深度學習用于圖像分類任務,當時的神經網絡層數(shù)還是個位數(shù);2015 年來自微軟的ResNet 做到152 層;現(xiàn)在很多團隊都在做上萬層的深度學習模型。模型深度的增加有可能帶來表達能力的進一步拓展和突破,但同時也帶來了模型復雜度的飛升[20]。
2.2.2 量化網絡模型
目前大多數(shù)的深度學習網絡框架在訓練模型時,大多采用32 位浮點數(shù)(32-bit floating point,F(xiàn)P32)類型的數(shù)據來表示權重數(shù)據、偏置數(shù)據和激活值數(shù)據[21]。這樣的模型搭建完成后,往往由于計算量較大,對于硬件內存的需求較高,難以在嵌入式設備上部署。
為了使系統(tǒng)運行的速度更快,內存占用需求更小,本文采用訓練后量化的方法,通過對訓練好的模型進行量化處理來提供在開發(fā)板上的運行支持。Tensorflow Lite 支持神經網絡中的卷積層、池化層和全連接層等[22]。使用該工具并采用之前訓練好的模型,最后輸入用于校準的數(shù)據集。根據這些輸入,可以生成8 位輕量級的整數(shù)模型,量化后無需再重新訓練網絡。
在企業(yè)管理中,為了應對如今變幻莫測的市場環(huán)境以及企業(yè)內部的動態(tài)變化,需要對信息進行全面的采集以及整理,這樣可以讓生產經營的實際狀況得到明確,便于企業(yè)管理者進行科學決策,提升企業(yè)的管理水平,讓企業(yè)的經營目標順利實現(xiàn)。這就需要借助數(shù)字技術讓數(shù)據采集以及提取效果更高,分析更加有效,因此數(shù)字技術在工業(yè)企業(yè)的管理工作中也是得到廣泛運用。在設備方面,如今的工業(yè)發(fā)展中,數(shù)字技術在各類電氣設備中實現(xiàn)運用已經是一種必然的趨勢,尤其是傳感器以及執(zhí)行器與數(shù)字技術的融合,以及光纖技術的普遍運用,在網絡技術的支持以及平臺的搭建基礎上,可以讓企業(yè)的生產效率得到明顯提升。
線性量化公式為
式中:X為原始的FP32 數(shù)值,Xint為量化后的一個整數(shù)值,Z為映射的零點(Zero point),S為縮放因子(scale)。
量化后的模型參數(shù)和神經網絡結構會發(fā)生一些改變,對模型的最終計算結果產生一定的影響。圖5 為模型量化的示意。使用整型(integer,INT)線性量化可以完成神經網絡的輕量化實現(xiàn),有計算量小、硬件需求低的優(yōu)點。

圖5 量化示意
本文針對復雜作戰(zhàn)環(huán)境的需求,設計并搭建了一種便攜式無線電智能感知儀,整個設備的實物搭建如圖6 所示。整個設備的硬件組成由嵌入式硬件設備和軟件無線電硬件設備2 部分組成。

圖6 實物搭建框圖
隨著圖形處理器(graphics processing unit,GPU)性能的不斷增強和可編程性的日漸提高,GPU 的用途不再局限于傳統(tǒng)的圖形圖像處理。目前,GPU 已經廣泛應用于從小到圖像解碼,大到超級計算機的各種計算領域,進入到了高性能計算的主流行列[23]。
嵌入式硬件設備作為模型算法的處理核心,內部部署神經網絡模型算法,利用GPU 并行計算的優(yōu)勢,對數(shù)據并行處理,使模型進行快速推理。
本設備采用NVIDIA 公司的Jetson AGX Orin模組,如圖7 所示,基于NVIDIA Pascal? GPU 架構,搭載 8 GB 內存,且內存帶寬為 59.7 GB/s。

圖7 嵌入式硬件設備
軟件無線電硬件底層鏡通過Petalinux 工具配置系統(tǒng)設備樹、構建內核和根文件系統(tǒng)將導出的底層硬件設計文件轉化為可在ZYNQ-7020 芯片上運行的Linux 系統(tǒng)鏡像,然后將打包好的系統(tǒng)鏡像燒錄至SD 卡完成對軟件無線電的底層驅動鏡像開發(fā)。
智能信號識別部分需要制作深度學習的訓練集和測試集,本文采用正交相移鍵控(quadrature phase shift keying, QPSK) 、 二進制相移鍵控(binary phase shift keying,BPSK)、高斯頻移鍵控(gauss frequency shift keying,GFSK)、16 進制振幅調制(quadrature amplitude modulation 16,QAM16)、第四代脈沖幅度調制(4 pulse amplitude modulation,PAM4)以及連續(xù)相位頻移鍵控(continuous phase frequency shift keying,CPFSK)6 種調制信號制作數(shù)據集。每種調制類型為6 000 組信號樣本,訓練集、驗證集和測試集劃分比例為8∶1∶1。
4.2.1 準確率
利用卷積神經網絡對在6 dB 信噪比進行預測得到的混淆矩陣如圖8 所示,在6 dB 信噪比的情況下,模型識別的準確率約為97.94%。而利用INT8量化后的網絡模型對數(shù)據集進行預測得到的混淆矩陣識別的準確率約為97.69%,下降了0.25%。


圖8 量化前后模型在6 dB 情況下的混淆矩陣
量化前后對全部測試集進行預測,得到的識別準確率如圖9 所示。

圖9 量化前后模型的準確率曲線
從圖9 中可以看出,量化前后模型的準確率曲線幾近重合,在有效降低存儲空間要求的情況下,神經網絡模型的識別精度幾乎不損失。
4.2.2 召回率與精準度
加入檢測模塊后,對測試模型的召回率和精準度結果進行分析,其中召回率用來表示模型對某一類數(shù)據的分類能力,精準度表示模型某一類輸出結果的可信度。量化前后模型的召回率和精準度分別如圖10 所示。可以發(fā)現(xiàn)量化前后的2 個模型對6 種信號的召回率和精準度都在93%以上,說明模型的虛警與漏判現(xiàn)象少。具有基本相同的召回率和精準度,也說明量化對模型的識別能力沒有產生影響。

圖10 量化前后模型的召回率與精準率
4.2.3 模型規(guī)律
采用模型的浮點運算量分析模型的規(guī)模,量化前后的模型在模型中的浮點運算量對比見表1。由表1 可以發(fā)現(xiàn),INT8 量化后模型在浮點運算量方面相較于原模型下降了99.07%。

表1 原模型和輕量化模型的浮點運算量
查看模型文件的體積如圖11 所示,量化后為166 600 Byte,量化前為1 739 520 Byte,節(jié)約90.4%的磁盤空間。

圖11 模型文件的大小
4.2.4 模型運行情況
使用訓練好的模型進行推理,通過對程序運行情況進行監(jiān)控得到程序的運行時間和內存資源的占用情況,如圖12 所示。可以明顯看出輕量化后的INT8 模型在推理時間上所需時間更少,內存占用資源更少。


圖12 量化前后模型運行時內存占用情況
本文設計了一款便攜式無線電智能感知儀,主要結論如下:
1)通過改進檢測算法,提高了檢測概率,采用基于I/Q 兩路信號的神經網絡實現(xiàn)信號調制識別,解決傳統(tǒng)信號調制識別準確率低的問題。在0 dB 及以上的信噪比環(huán)境下,調制識別的準確率可達到95%以上,對不同的信號調制類型的召回率和精準度均在93%以上。
2)為降低運算復雜度,對模型進行輕量化處理,優(yōu)化了模型的網絡結構,減少了網絡推理運算量,提升了推理速度。模型輕量化部署后降低了99.07%的浮點運算量,而準確率僅下降了0.25%。