周鑫,何曉新,鄭昌文
(中國科學院軟件研究所天基綜合信息系統重點實驗室,北京 100190)
近年來,隨著無線通信技術的發展,特別是物聯網的興起,無線電波已成為連通萬物的重要載體。然而,無線電波開放性的特點使其容易受到干擾和非法利用,導致正常通信系統受擾甚至中斷,進而威脅社會和國家安全。因此,加強無線電監測與識別,特別是在機場、邊境等重點區域及重大活動現場的無線電監管,具有重要的現實意義和迫切需求。
無線電信號識別技術最初主要用于軍事電子戰和政府頻譜監管領域,近年來,隨著頻譜共享需求的提升和認知無線電技術的發展,又逐漸成為商業通信領域關注的焦點[1]。早期的無線電信號識別技術,是利用各種頻譜采集設備采集空中射頻信號,經過處理后,以頻譜圖、瀑布圖、余暉圖等可視化方式展現出來,由專業人員分析信號時頻特征并尋找目標信號[2]。這種技術對操作人員的專業素質要求非常高,而且當監測時間變長或無線電信號較多時,人工分析效率和準確率也會大幅下降。
目前,比較流行的無線電信號識別方式是先由本領域專家挑選信號關鍵特征,如功率譜密度最大值[3]、信號包絡峭度[4]、瞬時相位標準差[5]、相位脈沖個數[4]、循環譜[6-7]、高階矩[8-9]等時/頻域信號特征,然后利用傳統的信號處理算法計算特征參數值,最后基于固定規則或者機器學習的方法進行分類[10]。通常,一個模型需要選取其中的幾項甚至十幾項特征作為模型輸入,計算復雜度非常高,很難實際部署使用。同時,受信號波形多樣性和多徑衰落效應的影響,該方式在特征選擇和判決準則方面也缺乏普適性。
人工智能在模式識別任務中具有獨特優勢,近年來,在圖像/語音識別、自然語言處理、醫療、金融等很多領域取得了很大的成就,引起了社會各界的熱切關注[11]。無線電信號識別本質上也是一種特殊的模式識別,因此本文認為,可以將人工智能與傳統無線電信號識別技術深度融合,利用人工智能的機器學習方法,特別是深度學習算法,自動提取無線電波的模式特征,避免基于經驗的人工特征提取,提高復雜電磁環境下無線電信號的識別能力。
基于這一設想,本文提出了一種利用圖像深度學習方法解決無線電信號識別問題的技術思路:首先把無線電信號具象化為一張二維圖片,將無線電信號識別問題轉化為圖像識別領域的目標檢測問題;進而充分利用人工智能在圖像識別領域的先進成果,提高無線電信號識別的智能化水平和復雜電磁環境下的識別能力。基于該思路,本文提出了一種基于圖像深度學習的無線電信號識別算法——RadioImageDet算法,并通過實物系統實驗,驗證了所提思路的可行性和RadioImageDet算法的有效性。
早在20世紀90年代,傳統機器學習算法,如樸素貝葉斯、神經網絡、決策樹等,已經在無線電調制識別領域中得到了應用[12-14],但受限于當時的技術發展水平,僅利用機器學習算法根據人工提取出的信號特征進行分類,具體流程如圖1所示。

圖1 基于傳統機器學習的無線電信號識別流程
近年來,隨著計算機技術和深度神經網絡技術的飛速發展,上述限制逐漸被打破。2016年,受到深度神經網絡在圖像識別領域巨大成功的鼓舞,O’shea及其團隊連續發表多篇論文,研究深度學習技術在無線電通信與識別領域應用的方法與問題[15-18],開啟了無線電識別從經驗驅動的人造特征范式到數據驅動的表示學習范式的新紀元。同年,美國國防先進研究項目局(DARPA, Defense Advanced Research Projects Agency)宣布,將于2017年啟動 SC2挑戰賽(The Spectrum Collaboration Challenge),旨在“將先進的機器學習能力應用于無線電領域,優化頻譜使用策略,以緩解電磁頻譜擁擠狀態”[19]。這是21世紀DARPA組織的第三次挑戰賽,前兩次分別是 21世紀初的自動化月球探測器挑戰賽和2015年的機器人挑戰賽。
2017年,DARPA 頻頻推動 AI(artificial intelligence)與無線電的融合。2017年3月,DARPA借助認知無線電領域的著名學術會議——DySPAN(IEEE International Symposium on Dynamic Spectrum Access Networks)會議,組織了一場“ModRec”競賽,要求各挑戰者識別會議現場隨機生成的 20多種不同調制方式的信號波形,并聲稱“這是以更高效的方式管理電磁頻譜的第一步”。同年 8月,DARPA啟動了射頻機器學習系統(RFMLS, radio frequency machine leaning system)項目。作為SC2項目的補充,RFMLS項目旨在“建立一種射頻鑒別能力,能夠從信號嘈雜聚集的頻譜中分辨出獨特和特殊的信號”,未來將應用于民用和軍事領域。
下面從3個方面介紹與本文相關的研究工作。
O’shea在文獻[15]中提出了一種基于端到端CNN(convolutional neural network)的調制識別模型。該模型是以時域I/Q采樣為輸入,經過兩層卷積層(conv層)和兩層全鏈接層(dense層)處理,輸出信號的調制方式,具體結構如表1所示。文獻[15]利用GnuRadio仿真生成了11種不同調制方式的信號作為訓練和測試數據,通過與樸素貝葉斯、K近鄰、決策樹、多層感知機、支持向量機等傳統機器學習方法進行對比,發現新算法與傳統算法的最佳性能相當(傳統算法采用以循環矩為基礎構造的32個特征作為算法輸入),證明了端到端CNN用于自動調制識別的有效性。

表1 O’Shea模型結構
在此基礎上,文獻[20]采用分層識別的方法進行改進,即先用一個 CNN網絡區分模擬調制和數字調制,然后在該先驗知識基礎上,用一個 CNN網絡識別具體的調制類型,最后用一個 CNN網絡識別調制的階數。文獻[21-22]從網絡結構的角度進行改進,在 CNN網絡基礎上,增加了時序特征的考慮,采用CNN+LSTM(long short term memory)的網絡結構進行調制方式識別。文獻[23]在O’shea模型的基礎上,在全連接層之前增加了一些邊緣信息(即傳統的循環平穩特征參數)作為輸入,用于輔助CNN識別。該方法摒棄了完全以原始信息作為輸入的前提條件,將傳統的自動調試識別方法與新型的CNN網絡結合,雖然提高了識別準確率,但遺留了很強的專家系統印記,且計算復雜度較高。
文獻[15, 20-23]均屬于調制方式識別,其輸出需要聯合其他信息,才能形成對電子偵察、頻譜監管等應用有直接作用的結果。文獻[24-27]則屬于更高一層的無線電個體識別,其結果可直接用于上述應用場景,因此更加符合“端到端”識別的理念。
文獻[24]利用信號矩陣的次要特征值區分信號,通過矩陣特征值求解法進行無線電信號識別。文獻[25]利用物理波形和射頻器件的非線性雜散發射特征來區分信號發射源,并采用相位空間重構法進行分析識別。文獻[26]利用信號功率譜密度的相似性來區分信號,并采用基于神經模糊的相似度測量方法進行分析識別。以上文獻均屬于傳統的基于專家系統的無線電識別方法,而Schmidt在文獻[27]中提出了一種基于 CNN的無線電通信標準識別模型,該模型結構與 O’Shea模型相似,但以頻域快速傅里葉變換(FFT, fast Fourier transform)的變換結果為輸入,直接輸出無線電通信標準名稱,涉及802.11、802.15.1、802.15.4這3種通信標準。文獻[28]也采用類似的 CNN網絡,但是以Choi-Williams 時頻分布變換結果作為模型輸入,用于識別線性調頻信號、Frank序列、Costas碼等 8種常見雷達波形。本文研究也屬于無線電個體識別,其輸入為包含時/頻信息的頻譜瀑布圖,輸出為信號的波形名稱及其時/頻坐標。
圖像目標檢測的任務是找出圖像中所有感興趣的物體,并確定其位置和大小,是計算機視覺領域的核心問題之一。2013年以前,以多尺度形變部件模型(DPM, deformable part model)為代表的傳統目標檢測方法一直處于強勢地位。2014年,Girshick 等[29]提出了 R-CNN(region proposal CNN)算法框架,使目標檢測的準確率取得巨大突破,并開啟了基于深度學習的目標檢測的研究熱潮。隨后,fast R-CNN[30]、faster R-CNN[31]、FPN(feature pyramid network)[32]、YOLOv2(you only look once)[33]、SSD(single shot multibox detector)[34]等一系列研究成果的出現,在檢測速度、檢測準確率等方面均有較大提高。目前,基于深度學習的圖像目標檢測主要分為兩類:一類是以R-CNN、faster R-CNN為代表的基于區域提取(region proposal)的目標檢測算法,另一類是以YOLOv2、SSD為代表的基于回歸問題的端到端目標檢測算法。前者需要把檢測過程分為區域提取和檢測分類兩步;而后者直接在一個卷積網絡中實現目標的定位和識別,簡化了網絡結構,在保證準確率的前提下,檢測速度達到了實時檢測的要求,因此,本研究將以YOLOv2為基礎設計無線電信號識別模型。
本文提出了一種基于圖像深度學習的無線電信號識別算法——RadioImageDet算法,該算法基于一種端到端卷積神經網絡,能夠在時/頻混疊的復雜電磁環境下,同時識別出環境中存在的多個信號的波形類型,并可定位出這些信號各自的起止時間和頻率范圍。 RadioImageDet算法結構如圖2所示。

圖2 RadioImageDet算法結構
RadioImageDet算法由預處理模塊和端到端目標檢測模塊兩部分組成。預處理模塊以觀察窗口的原始 I/Q采樣數據為輸入,經過離散傅里葉變換(DFT, discrete Fourier transform),將時域數據變換為更易識別的頻域表達;再經過數據圖像化處理,將連續多次 DFT的結果組合成一張二維頻譜瀑布圖。端到端目標檢測模塊以預處理所得的頻譜瀑布圖為輸入,經過 CNN特征提取層,獲取具象化的信號特征;再經過目標檢測層,將抽象的特征轉化為信號波形類型、時/頻坐標等有確定含義的輸出結果。其中,端到端目標檢測模塊采用端到端深度神經網絡模型實現。本文所提端到端深度神經網絡模型是以YOLOv2模型[33]為基礎,通過遷移學習構建得到,因此稱為RadioYOLO模型。
運行RadioImageDet算法首先要進行數據預處理,預處理的目的是將原始I/Q采樣數據變換為一種更有利于自動特征提取和識別的表達形式。為了充分發揮卷積神經網絡在特征提取方面的優勢,降低計算復雜度,研究者希望預處理過程是無損且容易計算的。根據離散信號處理理論和現代通信系統原理,原始的I/Q采樣數據就是數字通信系統后端處理的基本輸入,任何復雜的數字信號處理算法都是在此基礎上經過數學變換完成的,因此它天然蘊含了無損信息。這也是O’shea等直接選用I/Q采樣數據作為神經網絡輸入的原因[15,20]。從數學角度分析,DFT是對有限長I/Q采樣數據的無損變換,如式(1)所示。

同時DFT的結果作為信號的頻域表達形式,更有利于以電磁輻射為基礎的無線電信號的識別[35],因此,本文首先對原始I/Q采樣數據進行DFT,得到信號的頻域表達,然后進行后續的處理,這與文獻[26, 27]的思路一致。
一次DFT運算的結果是一個一維復數序列,可以形象地認為是“一條線”,它表示某一時間點的頻譜。但是,無線電信號波形總是隨時間變化,僅觀察某個“時間點”的特征很難準確識別信號,因此將連續多個時間點的觀測結果堆疊組合成“一個面”,就可以同時表達時域和頻域的信息特征,有助于提高信號識別率。在這個二維平面中,橫軸表示頻率,縱軸表示時間,元素值就是DFT的結果值。如果將元素值按圖像灰度值進行映射,就可以繪出一張可視化的圖片,該圖片就是頻譜瀑布圖,如圖3所示。因此,本文在DFT之后,增加了一個數據圖像化處理過程,將連續多組DFT的結果組合成頻譜瀑布圖的格式,增加單個樣本的時域信息量,便于后續卷積神經網絡的處理和信號識別。

圖3 頻譜瀑布圖合成示意
理論上,頻譜瀑布圖的尺寸為2MN,其中,2表示圖片有2個通道,分別為通道I和通道Q;N表示DFT的點數;M表示一張頻譜瀑布圖內合并的DFT結果的組數,其大小反映了一個樣本的時間跨度,M值越大,表征的時間跨度越長,計算也越復雜。為了方便運算,本文進行以下3個簡化操作。
1) 為了簡化圖像轉化操作,直接將I/Q兩通道的數據按式(2)合并為一個通道S,合并后的物理含義為功率密度。

其中,SI和SQ分別為I/Q通道的采樣數據。
2) 為了利用FFT加快運算速度,N取值應為2的正整數次冪,本文取N=512。
3) 基于實際通信系統中信號連續發送時間的工程化慣例約束,時間軸持續時間應大于20 ms,換算到本文所提模型,則要求M>390,為了方便2×2池化操作,M值最好為2的正整數次冪,因此本文取M=512。
經過預處理,抽象的無線電信號被具象化為一張形象的頻譜瀑布圖,接下來就要對該圖片進行特征提取,識別出圖片中存在的信號及信號的位置。這項工作的本質與計算機視覺中的目標檢測任務完全相同,所不同的是,該圖片是無線電信號經過DFT后合成的頻譜瀑布圖,而不是自然界中的圖片。由于輸入圖片的特殊性,或許存在更加合適的神經網絡結構進行識別和目標檢測,但本文暫時不對其進行深入研究,而是直接通過遷移學習,以目前比較流行的YOLOv2模型[33]為基礎,通過修改若干超參數,構造無線電信號識別網絡模型,稱之為RadioYOLO模型,其結構如圖4所示。
與YOLOv2模型一樣,RadioYOLO模型結構主要參考了Inceptionv1網絡[36],僅使用3×3和1×1卷積核盡力壓縮模型參數量,并在每次池化操作后將特征通道數翻倍,以盡量保持特征的完整性。同時,借鑒Inceptionv2的思想,對每一個卷積層的輸出都使用批歸一化(bath-normalization)處理,增加了模型的頑健性和訓練速度,并可代替 dropout防止過擬合;借鑒 ResNet的跳躍連接的思想[37],將conv13的輸出整形后,直接與conv20進行通道合并,共同輸出給下一層,使輸出層能夠保留更高分辨率的特征,并降低“梯度消失”概率;使用leakyReLU非線性激活函數,減少訓練中神經元死亡的概率。
與YOLOv2模型相比,RadioYOLO模型的改變主要包括以下幾點。
1) 模型輸入的圖片尺寸。根據 FFT的尺寸,將輸入尺寸改為512×512。
2) 歸一化錨框的尺寸。根據無線電信號的公共特征,選擇5個錨框(width, height),分別為如下。
① (0.015, 0.9):匹配窄帶持續信號;
② (0.5, 0.9):匹配寬帶持續信號;
③ (0.025, 0.05):匹配窄帶瞬時信號;
④ (0.469, 0.01):匹配寬帶瞬時信號;
⑤ (0.469, 0.1):匹配寬帶瞬時信號。
3) 模型輸出的張量尺寸。根據輸入尺寸和數據集特征,推導出新輸出的張量尺寸為16×16×85。
如表2所示,RadioYOLO模型包含23層卷積層和5層池化層,每個卷積層均作批歸一化處理和leakyReLU激活。模型輸入為512×512×1的頻譜瀑布圖,輸出為 16×16×K的張量,K的取值如式(3)所示。

其中,anchor_num 表示錨框(anchor)的個數,class_num表示待識別信號類型的個數。在本文的驗證實驗中,anchor_num=5,class_num=12,因此可得K=85。
式(3)中括號內的加數5表示除了信號類型外還有5個維度的特征參數預測值[tx,ty,tw,th, to],分別代表信號邊框的左上點坐標(bx,by)、邊框尺寸(bw,bh)和置信度(conf)。為了提高模型訓練的穩定性,tx等預測值不是真實值,而是一種歸一化的中間值,它們與真實值的關系滿足式(4)。因此,在利用神經網絡模型得到預測特征張量后,仍需通過式(4)計算最終的真實預測值,完成目標檢測。

圖4 RadioYOLO模型結構

表2 RadioYOLO模型結構

在之前的無線電識別研究文獻中,無線電數據通常來自仿真系統,如Matlab仿真軟件、GnuRadio仿真軟件、信號發生器等,在實驗室環境下,通過人工代碼的控制,生成單一的或混合的有噪信號[15-17,20-23,27-28]。這種方式降低了數據獲取和預處理的難度,方便利用先驗信息進行數據標注,進而完成算法的驗證。但是,受到信道衰落、時鐘抖動、未知輻射源、接收機射頻特性等復雜因素的影響,仿真數據與真實環境下的電磁環境往往存在較大差異,影響算法的真實性和實用性。
為此,本文利用GnuRadio+USRP軟件無線電平臺開發了一套高速頻譜采集系統,用于采集真實環境下的頻譜數據,如圖5所示。USRP設備是美國NI公司設計并生產的一款開源軟件無線電模塊,采用AD9361射頻集成芯片方案,工作頻段可覆蓋70~6 000 MHz。GnuRadio是一個開源軟件,利用普通計算機實現調制/解調、編解碼等數字信號處理,與USRP配套使用可快速構建無線通信原理驗證系統。該系統通過優化數據存儲算法,最高可支持50 MHz瞬時帶寬信號的分鐘級無損保存,并可在預設頻率集上自動掃頻存儲。

圖5 高速頻譜采集系統
本文的所有訓練數據和測試數據均來自GnuRadio+USRP軟件無線電平臺的實地頻譜采樣。采樣速率為40 Msample/s,單頻點采樣時長約5 s,采樣地點包括北京中關村地區、天津濱海新區、天津渤海灣地區等共 7個點位,關注信號為常見2G/3G/4G蜂窩下行信號12種,在包含關注信號的頻段內,每偏移10 MHz設立一個采樣頻點,共計34個頻點,數據集總大小約為650 GB。
表 3是北京中關村地區三大運營商 2G/3G/4G蜂窩下行頻率分配表,該表是基于相關標準文件,利用儀器實際測量觀察后校對所得。結合北京、天津等地的實測結果,發現該表并不通用,各運營商有可能在不同區域按照入網用戶的數量和流量特征,在一定條件下自主調整頻率資源的分配,使不同區域、相同頻點處的信號類型可能有所不同。這對本研究的核心算法沒有任何影響,但會給數據標注工作帶來一定麻煩。

表3 北京地區三大運營商2G/3G/4G蜂窩下行頻率分配
原始數據的格式為時域I/Q采樣,必須先轉換為頻譜瀑布圖,才能被RadioYOLO模型識別和處理。本文利用 Python語言和相關第三方庫,按照3.1節的預處理流程,編寫了一系列腳本代碼,將采集到的650 GB時域I/Q采樣數據轉變為4 740張512像素×512像素的灰白圖片,其中,訓練集3 792張,測試集948張。
對訓練樣本和測試樣本進行標注。使用傳統方法進行數據標注是一項煩瑣的人力勞動,而本文基于本數據集內待識別信號具有固定工作頻段且持續存在的特點,設計了一種半自動的數據標注方法,大大減少了重復性工作。該方法先在每個點位、每個頻點挑選2張頻譜圖進行人工標注,然后對該點位、該頻點剩余的頻譜圖進行軟件自動化標注,其標注坐標在2張人工標注的坐標范圍內隨機抖動,標注示例如圖6所示。在以1 860 MHz為中心的 40 MHz范圍內,共存在一個 Uni4G_DL_FDD1800信號(聯通4G下行信號)和一個Tele4G_DL_FDD1800信號(電信4G下行信號),通過標注可視化邊框,軟件按一定格式自動在后臺生成該圖片的文本標注信息。
值得一提的是,雖然本文方法中數據的采集和標注都基于頻率,而對于 2G/3G/4G蜂窩等授權通信系統,直接利用頻率信息幾乎就可以完成信號識別,但這并不具備通用性,且無法完成核心技術的驗證。因此,本文在模型訓練和檢測時,刻意回避了中心頻率信息,只對接收機通帶內的數字基帶信號進行處理。這也意味著,即使某信號被調諧到未知的非授權頻段內,也不會影響本算法的檢測結果。

圖6 1 860 MHz頻點數據標注示例
為了驗證算法性能,本文在Tensorflow框架下,利用 Python語言實現了 RadioYOLO模型及整個RadioImageDet算法,并進行模型訓練與測試。數據集來自預處理后的真實頻譜數據,共包含 12種信號,其中,訓練樣本3 792個,測試樣本948個,具體數據特征見第3節。模型訓練時,對訓練集的前80%進行訓練,后20%用于訓練過程中的模型驗證。模型訓練優化器采用Adam算法,輪次(epoch)上限設為50,批大小(batch_size)設為8。從實際運行結果來看,在采用NVIDA GTX1060T 顯卡加速的條件下,訓練速度約為600 ms/batch,每輪耗時約為230 s。單個樣本的測試速度約為33 ms,檢測幀速為30 frame/s,基本滿足實時應用需求。
識別結果的輸出如圖7所示,圖中底部標簽中的“√”表示該樣本檢測的結果是正確的,“×”表示該樣本檢測的結果出現錯誤。模型軟件會根據識別的結果自動在原圖上進行標框,并注明信號類型和識別置信度。如圖7 (d)所示,在該時頻觀察窗內識別出2個信號,分別是Mobi4G_TDLTE _20M和Mobi4G_TDLTE_10M信號,2個信號的時頻范圍分別用不同線形的方框圍起來,并在頂部注明信號類型名稱和檢測置信度。由圖可知,某些信號在頻譜瀑布圖上的特征非常明顯,通過人眼可以輕易判決,這是本文開展本研究的基本前提和動機。從檢測結果上看,人眼能夠輕易識別的信號,在絕大多數情況下該算法模型也能正確識別,但也有一些例外,如圖 7(g)所示。而人眼不易識別的信號,算法模型出錯的概率更高,如圖 7(b)所示,但某些情況下也能正確識別,如圖7(e)所示。這些現象都直觀地證明了利用圖像深度學習方法進行無線電信號識別的可行性和有效性。
為了更嚴謹地評估算法的性能,需要更多的量化指標。如圖8所示,對于二分類問題,根據真實值和預測值的結果,可以將整個樣本集分為4個象限,分別是真正例(TP)、偽正例(FP)、真反例(TN)和偽反例(FN)。經過簡單擴展,二分類混淆矩陣(confusion matrix)也可以變成多分類混淆矩陣。基于混淆矩陣,可以構造多種分類器性能評價指標。準確率(accuracy)是最常見的評價指標,其計算式為即被分對的樣本數占總樣本數的比例。通常來說,準確率越高,分類器越好。圖9是本文模型測試結果的歸一化混淆矩陣,其中縱軸表示真實標簽,橫軸表示預測標簽,在12×12的坐標內,用方框灰色的深淺表示數值,灰色越深、數值越大。一般而言,混淆矩陣對角線的灰色越深越好,其他坐標點的灰色越淺越好。由圖可知,本文模型對于大部分信號識別性能很好,但是容易將Uni4G_DL_FDD1800和Uni4G_DL_FDD2100分別識別成 Tele4G_DL_FDD2100和 Tele4G_DL_FDD 1800。根據混淆矩陣和準確率計算式,可以算出該模型的識別準確率為86.04%。

圖7 模型測試結果樣本
準確率雖然是一個很直觀的評價指標,但是有時并不能完全反映一個算法的好壞,特別是在樣本數據分布不均衡時尤為明顯,因此本文引入了功能更強大的 PR(precision-recall)曲線,即查準率-查全率曲線,其縱坐標為precision,橫坐標為recall。precision又稱精準率,其計算式為 precision=表示被分為正例的示例中實際為正例的比例;recall又稱召回率,其計算式為表示所有正例中被分對的比例。PR曲線可以直觀展示分類效果的好壞,在分類、檢索等領域應用廣泛,通常曲線越靠近坐標(1, 1),分類器性能越好。

圖8 二分類問題的混淆矩陣

圖9 測試結果—12類信號識別的歸一化混淆矩陣
但是PR曲線是一個向量,不便于數值比較,因此通常使用平均查準率(AP , average-precision),即PR曲線下的面積,進行分類效果評估。通常一個分類器能夠同時識別多個目標,而一條PR曲線及其AP值只能表示其中一種目標的分類效果,因此,可以對所有AP值求平均,就得到了mAP(mean average precision)值。目前,mAP值已經成為檢測算法的核心性能指標之一。
圖10是本文模型測試結果的PR曲線,表4是其對應的結果數值,由于圖 10存在多條曲線重疊的情況,具體數值可見表4。從表4可以看出,盡管Uni4G_DL_FDD1800和Uni4G_DL_FDD2100的識別精準率很高,均在90%以上,但由于其召回率較低,分別約為26%和60%,因此整體的AP值指標并不好,分別只有26.02和58.50。換句話說,如果該分類器判定一個信號是 Uni4G_DL_FDD1800或 Uni4G_DL _FDD2100,則很可能是對的,但也會出現很多漏檢情況。Tele4G_DL_FDD2100的情況剛好相反,其召回率可達到99%,但精準率不高,只有不到54%,也就是說,該分類器能夠把幾乎所有的Tele4G_DL_FDD 2100信號都檢測出來,但也會出現很多誤判情況。Mobi3G_TDSCDMA的情況則兼具二者的特征,召回率和精準率都一般,整體識別效果也比較一般。除了這4種信號以外,其他8種信號的識別效果都比較好,某些信號的AP值甚至達到95以上。12類信號的平均AP值mAP達到 77.72,在未經任何模型優化的前提下,識別性能非常接近目前自然圖像目標檢測的最好指標——78.8[31],這在一定程度上說明了頻譜具象化圖片的復雜度略低于自然界中的圖片,因此,現有的自然圖像目標檢測模型的復雜度完全能夠勝任無線電信號目標檢測任務。

圖10 12類信號識別的PR曲線,mAP=77.72
本文所提的RadioImageDet算法,能夠同時檢測出混疊信號中存在的每一種信號類型及其時頻坐標,而現有算法往往只能檢測出所含的多個信號類型,甚至只能檢測出最可能存在的一個信號類型。因此,本文在現有算法的能力范圍內,對部分指標進行對比,對比算法選擇 NFSC(neuro-fuzzy signal classifier)算法[26]和 WII(wireless interference identification)算法[27]。

表4 測試結果
NFSC算法屬于一種傳統信號識別算法。它利用信號功率譜密度的相似性區分信號,首先為每一種信號選擇一個參考信號,經過濾波、歸一化等處理后,采用基于神經模糊的相似度測量方法,計算待測信號與每一個參考信號間功率譜密度的相似性,如果相似度大于某門限,則判定含有該類信號。根據文獻[26],神經模糊相似度計算方法如式(5)所示,判決門限為0.5。

其中,R[n]表示參考信號功率譜密度,S[n]表示待測信號功率譜密度,SM為相似度。
WII算法是一種基于深度學習的信號識別算法。它采用與O’shea模型極為相似的4層CNN結構,只是將輸入替換為FFT的頻域表達形式。原始的WII算法只能識別單一信號的類型,無法檢測混疊信號,因此需要對其進行一些改進。首先,將模型最后一層由softmax激活改為sigmoid激活,讓其能夠輸出所有信號類型的置信概率向量,以實現識別混疊信號的能力;然后,利用本研究采集的原始I/Q數據,專門為WII算法的訓練和測試構造數據集,樣本量總計11 700條,并且其標注數據樣式為 Multi-Hot,而非原始的 One-Hot;最后,利用訓練后的模型進行測試,將模型輸出向量Y與某一概率門限進行對比,如果Y[i]大于該門限,則判定信號i存在。顯而易見,門限值對判決結果影響很大。經過遍歷性測試發現,當門限值等于0.1時,精準率指標最高,因此,本對比實驗中將概率門限置為0.1。
為了便于評估某一具體信號類型的分類準確性,選用精準率(precision)作為對比指標,它表示被分為正例的示例中實際為正例的比例。由圖11可見,RadioImageDet算法的平均精準率達到 89.0%,改進后的 WII算法為 53.8%,傳統的 NFSC算法只有49.3%,平均精準率分別提高了35.2%和39.7%。

圖11 3種算法的精準率指標對比
無線電信號識別技術作為無線通信的一個重要研究領域,在軍事電子戰、政府頻譜監管、商業頻譜共享接入等方面應用廣泛。結合其作為一種“模式識別”任務的本質,以及人工智能在模式識別任務中特有的優勢,本文提出了一種基于圖像深度學習的無線電信號識別算法——RadioImageDet算法。該算法首先利用傳統數字信號處理方法,將I/Q采樣數據流變換為一張二維頻譜瀑布圖,將無線電信號識別問題轉化為圖像識別領域的目標檢測問題;進而利用人工智能在圖像識別領域的先進成果,以YOLOv2模型為基礎,構造了一種面向無線電信號識別的端到端深度神經網絡模型——RadioYOLO模型,并利用該模型識別信號的波形類型和時/頻坐標。這種將無線電信號識別問題轉化為圖像目標檢測問題的思路,在國內外尚屬首次提出,給未來復雜電磁環境下智能化無線電信號識別技術的研究開啟了一條新思路。
為了檢驗算法的真實性能,本研究基于GnuRadio和USRP平臺,開發了一套高速頻譜采集系統,并在北京、天津等地實地采集頻譜數據,構建無線電數據集。實驗結果表明,RadioImageDet算法能有效識別具象化后的無線電信號,識別效果與人眼近似,在實地采集的12種、4 740個樣本的數據集中,識別準確率達到86.04%,mAP值達到77.72,檢測時間在中等配置的臺式計算機上僅需33 ms,充分驗證了本文所提思路的可行性和本文算法的有效性。
RadioImageDet算法只是基于圖像深度學習的無線電信號識別技術思路的第一次初步嘗試,從實驗結果中也能看出一些不足。未來,將進一步研究其他信號具象化方法和更加適合無線電信號特征的神經網絡模型。