王 寧
(中國空空導彈研究院,河南 洛陽 471009)
1895 年,人類第一次成功收發無線電報后,天空中的人造電波就再也沒有斷過。電磁空間已經成為了繼“海、陸、空、天”以外的第5 維空間。目前,傳統的射頻信號分析與識別大多基于人工提取射頻信號的微觀技術。該傳統分析方式受分析效率低和實時性差等限制,直接制約了其在瞬息萬變的復雜電磁環境中大規模使用的可能性。該背景下,基于機器學習等技術的人工智能在越來越多的領域展現出巨大的潛力[1]。將機器學習技術引入到射頻信號的分析與識別,已經成為未來發展的必然趨勢。因此,引入了一種射頻機器學習技術,在抽象層面上建模和分析射頻信號,利用機器學習中神經網絡強大的特征抽取與分類能力,聚類分析射頻信號的性質,從而盡量減少人工判斷,提高分析結果的準確性。
文章主要研究一種基于射頻指紋特征和行為序列的射頻信號機器學習技術,創建一種既能夠識別射頻輻射源個體,又能夠根據重要性、危害性、合作性等方面將其分類的機器學習系統[2,3]。射頻信號機器學習系統原理框圖如圖1 所示。

圖1 射頻信號機器學習系統原理框圖
首先,使用時頻分析和高階譜分析等工具提取射頻指紋特征;其次,通過卷積神經網絡(Convolutional Neural Networks,CNN)識別和分類射頻信號,同時在射頻指紋特征中抽取出可供下一級循環神經網絡(Recurrent Neural Networks,RNN)識別的行為序列,RNN 通過學習行為序列,并根據射頻信號的重要性、危害性以及合作性將其分類;最后,提高復雜電磁環境中的態勢感知能力。聚焦于射頻指紋特征和行為序列的提取,具體研究射頻指紋特征提取、個體與行為序列識別以及信號性質分類。
射頻指紋具有通用性、唯一性、可測性以及穩定性,由發射機發出的射頻信號所攜帶。通過提取和分析射頻指紋,可以識別不同種類和個體的發射機[4,5]。國內外的大量研究結果已經證明了射頻指紋的特性,此處直接采信研究結論[6,7]。
原始的射頻指紋中包含大量信息,如果全部采用,那么計算量龐大,因此必須選取特征信息。識別射頻指紋特征的具體過程如下。
(1)射頻信號的預處理。主要是將射頻信號采樣數字化、去除噪聲、并作歸一化處理[8]?;诓煌慕邮諜C構架對射頻信號采樣的影響,選擇一種能夠覆蓋寬帶射頻信號采樣的硬件構架[9]。此外,射頻信號的預處理包括實現抑制噪聲的濾波算法、歸一化、包絡成型以及數字變頻等算法。
(2)射頻指紋特征提取。實際的射頻信號可以分為平穩信號和非平穩信號。平穩信號主要是發射頻率不隨時間變化的平穩狀態或平穩時段的信號;非平穩信號包括發射機開關過程中信號建立和關斷的瞬態信號、頻率隨時間快速變化的跳頻信號以及掃頻信號等。這2 種信號一般采用不同的分析方法。
根據各種穩態信號的不同性質,選擇穩態下有效的指紋特征,通過對比常用的穩態信號特征分析不同技術的優缺點,進而選取合適的分析方法[10]。
對于包含大量調制信息的平穩信號,由于信號的調制特性未知,無法直接從接收信號中提取頻率偏移、相位偏移、時鐘偏移以及同相正交信號原點偏移(In-phase/Quadrature origin offset,I/Q origin offset)等信息作為射頻指紋特征。因此,采用高階譜中最實用和最簡便的3 階譜(雙譜)提取穩態信號。
對于非平穩信號,包含頻率跳變的非平穩信號的特性隨時間變化,需要使用時域和頻域的二維聯合函數來表示。蔣平對不同無人機進行時頻分析,結果表明其時頻特性明顯不同,不同無人機的時頻圖對比如圖2 所示[11]。

圖2 不同無人機的時頻圖對比
目前,經常使用的時頻分析法有短時傅里葉變換(Short-Time Fourier Transform,STFT)法、小波變換法、Wigner-Ville 分析法以及科恩類時頻分析法等。經過比較不同時頻分析方法的時間、頻率、分辨率以及優缺點,選擇一種改進的Wigner-Ville 分布即平滑偽Wigner-Ville 分布,進行研究和算法實現。通過研究平滑偽Wigner-Ville 分布中不同的核函數,分析其對多頻率分量交叉項的抑制效果以及對頻率和時間分辨率的降低程度,進而設計一個局部最優化的核函數,實現目標射頻信號時頻特征的最佳分辨和抽取。
設計一個機器學習中的神經網絡模型,用提取出的射頻指紋特征數據集訓練和優化神經網絡,使用該神經網絡作為分類器,識別個體并抽取行為序列。提取的射頻指紋無論是平穩信號的積分雙譜,還是非平穩信號的時頻圖,都可以作為一種二維的圖像來處理。因此,選擇神經網絡中發展迅速且被廣泛成功應用于計算機視覺和圖像識別等領域的CNN 模型。CNN 是一種成功的多層網絡結構模型,實現了真正的訓練和學習。與經典的逆向傳播(Back Propagation,BP)神經網絡不同,CNN 通過卷積和池化操作成功降低了網絡中的參數數量,從而大大縮短網絡運行時間。
文章主要聚焦于CNN 參數設置、CNN 對射頻指紋特征和行為序列的有監督學習以及使用隨機梯度下降法優化CNN 的訓練效率。
射頻信號的行為序列是人為控制或由設計程序控制的一系列事件,是人們的意圖和意志在射頻信號變換中的體現,包含目的、手段、結果反饋的整體或部分行為序列。無論是用于通信、探測,還是用于欺騙、干擾、阻斷,其行為序列都包含了設計者內在的行為邏輯[11]。按照隱馬爾科夫模型(Hidden Markov Model,HMM),該行為序列構成了一個雙重隨機過程:第一個隨機過程是描述狀態轉移情況的馬爾可夫鏈(Markov Chain,MC),其輸出為一組狀態轉移序列,內在隱藏而不可見;第二個隨機過程是描述可觀察的行為值與對應隱藏狀態之間統計關系的一組概率分布。該行為序列可以按照隱馬爾科夫模型進行建模計算,也可以使用具有強大序列數據處理能力的RNN 來進行分析。
此處主要使用RNN 來分析行為序列,并解決使用RNN 過程中的2 個問題:一是,如何訓練具有反向傳播的神經網絡;二是,如何解決訓練過程中梯度消失或梯度爆炸的問題。
(1)時頻分析中,為抑制交叉項而降低時間、頻率、分辨率,進而影響射頻指紋特征提取和個體識別的問題。為抑制Wigner-Ville 分布中的多頻分量的交叉項,引入指數核函數平滑窗口,會在一定程度上降低Wigner-Ville 分布的時間、頻率、分辨率,一旦降低幅度超過了噪聲門限,就會對后面基于時間和頻率關系的特征識別產生嚴重的干擾,通過神經網絡的逐層積累,進而導致識別錯誤率快速上升。
(2)小樣本訓練集監督學習條件下,神經網絡的局部過擬合問題。深度網絡參數學習效率低的主要原因如下:一是,深度網絡前層神經元和后層神經元參數學習的不對稱引起的梯度不穩定;二是,獲取標簽數據的成本昂貴,小規模的標簽數據會導致出現模型過擬合的情況,進而導致模型的泛化性能差;三是,梯度學習算法屬于一種對初始值敏感的算法,而深度網絡是一種高度非凸函數,因此容易陷入局部極值解困境。
(3)行為序列中可識別模式組合的向量化問題。從射頻指紋特征中抽取的行為序列是一些最基本和固定的行為元素集合,該基本的行為元素代表的信息有限,也很難由神經網絡進行學習分類,就像獨立的字母元素,必須組合成單詞才有具體明確的信息。因此,為便于處理和分析,需要向量化該特定的行為組合,在高維空間中將其編碼為實值向量。該組合信息的相似性表示向量空間中的接近度,向量化后的行為序列可以被神經網絡很好地理解和分析。
國內外研究中,基于射頻指紋特征的研究只涉及射頻指紋特征的提取和射頻信號源識別問題。該背景下,文章從更高層思維出發,從射頻特征中提取出代表意圖信息的行為序列,并對其進行向量化編碼,使用循環神經網絡進行機器學習訓練,并根據重要性、危害性、合作性等基礎性質分類識別射頻信號,大大提高了頻譜空間中的態勢感知能力,為以后的相關研究打開了一條新的思路。