黃知濤,王 翔,趙雨睿
(1. 國防科技大學 電子科學學院, 湖南 長沙 410073; 2. 國防科技大學 電子對抗學院, 安徽 合肥 230037)
電子戰是爭奪制電磁權的關鍵,其旨在利用電磁能、定向能等實現對電磁頻譜的控制,包括掌握、攻擊敵方電子信息系統和電子系統等,以及保護己方電子信息系統和電子系統等[1]。電子戰的發展經歷了三個演變過程,即傳統電子戰、自適應電子戰以及認知電子戰。傳統電子戰是指采用預置的干擾方式破壞敵方雷達、通信等電子信息系統的正常工作;自適應電子戰則是融合自適應技術,使電子戰系統具備適應電磁環境變化的能力;而認知電子戰則代表了電子戰演變的最新形態,具備推理、學習等認知能力,能夠對未知的目標和環境進行分析并自主做出有效的對抗決策。
催生電子戰形態改變的關鍵因素是人工智能技術的蓬勃發展。在20世紀70年代時期,電子戰系統高度依賴以特征工程為主導的專家系統。進入21世紀以來,數據規模和算力的急劇增加促使以深度學習等為代表的人工智能學習模型不斷涌現,電子戰系統中的關鍵算法從特征工程走向機器學習。自今年以來,以生成式大語言模型為代表的新一代人工智能技術突起,為認知電子戰的發展提供了進一步的機遇。
美國最先意識到人工智能技術給電子戰發展帶來的機遇。從2008年起,美軍以提高電子戰裝備認知能力為核心,陸續啟動和開展了多個認知電子戰項目的研究[2]。中國從2013年開始跟蹤研究認知電子戰技術,主要團隊包括中國電子科技集團公司第三十六研究所的楊小牛院士團隊[3]、軍事科學院的王沙飛院士團隊[4]等。
隨著人工智能技術的快速發展,學術界對認知這一概念已經邁進了嶄新的階段。因此,重新梳理認知電子戰的發展脈絡,剖析其核心技術原理,進一步捕捉其發展趨勢就顯得尤為重要。
本文結合人工智能領域的最新研究進展,對認知電子戰系統從概念內涵、典型項目、系統架構、關鍵技術與未來挑戰五個方面進行全面總結及深入分析,進而為領域研究墊下基石。
傳統電子戰系統主要基于人工經驗知識,缺乏足夠的自學習能力,長期面臨著“新型電磁目標”“未知目標難以識別”“難以生成干擾措施”“對抗效果難以評估”等問題。新一代雷達、通信等電子信息系統正在向智能化方向發展,急需電子戰系統提升智能化水平,實現“以智對智”。認知電子戰正是在這個背景下應運而生,其具備對電磁環境和輻射源目標深層次的“認知”能力,能夠在極短的時間內自主地生成最佳對抗策略,通過實時在線評估對抗效果不斷優化對抗策略[5]。
目前,國內外對認知電子戰尚未有統一的定義,研究人員先后給出過不同定義,總結如表1所示。雖然不同研究人員對認知電子戰定義的側重不同,但是核心都在強調對環境和目標的自主認知和理解,從而持續實現對目標輻射源的高效干擾策略生成與優化。然而,對目標輻射源究竟要認知什么、理解什么,才能有助于高效對抗,這方面國內外公開文獻都沒有深入研究。

表1 國內外認知電子戰定義總結Tab.1 Summary of the definition of cognitive electronic warfare at home and abroad
雖然不同研究人員對認知電子戰的定義側重不同,但是核心都在強調對環境和目標的自主認知和理解,從而持續實現對目標輻射源的高效干擾策略生成與優化。但是已有定義并未充分考慮目標不同特性給認知以及策略優化帶來的差異性。綜合已有研究成果,并結合人工智能的新發展,本文結合不同目標變化特性詳細闡述不同等級的認知電子戰。
從目標變化程度的角度出發,認知電子戰可以分為三個層次:一是當輻射源目標信號參數以及工作模式不變或者緩慢變化時,認知電子戰核心是如何基于盡可能少的偵測數據做出高效決策;二是當輻射源目標信號采用事先設定的規則實現變化時,認知電子戰的核心是基于歷史偵測數據實現對目標輻射源工作規則的認知,并基于認知結果實現干擾策略生成與預測;三是當輻射源目標是智能化目標,即其參數或工作模式能夠自主隨環境動態變化時,認知電子戰的核心是如何基于歷史偵測數據和實時偵測數據完成對目標智能學習模型的在線認知,實現“以智對智”,并形成智能對抗決策模型對目標智能規劃模型的“先發制人”優勢。
可見,認知電子戰最大的優勢是實現對未知目標的認知與對抗。從目標未知屬性的角度出發,認知又可以進一步細分為兩個部分:一是當目標采用未知波形時,認知電子戰需要實現對波形的認知以及最佳干擾波形的生成;二是當目標采用未知工作模式時,認知電子戰需要實現對目標工作模式規律的認知以及針對該模式最佳干擾策略的生成。
認知電子戰能夠實時感知電磁環境,高效自主地調整系統以適應目標和環境的變化,提高系統的反應力、精確性和適應水平等綜合效能。結合1.1節中的定義與內涵,本文從感知、判斷、決策三個方面對電子戰系統的能力進行描述。
一是感知能力,即實現對復雜電磁環境中雷達、通信等不同輻射源的精確檢測、分析、識別、測向定位等能力,并能對輻射源的工作模式進行智能分析;二是判斷能力,即實現對敵輻射源行為規律的精確建模及異常檢測,從較長時間尺度上對目標進行深層次認知,并能推斷輻射源及所在平臺的意圖的能力;三是干擾決策能力,即實現最佳干擾決策并生成最佳干擾波形,能基于實時評估干擾效果實現干擾策略優化,具備先發致人式、預測性干擾能力。
自2008年起,美國軍方和工業界就陸續啟動了多個認知電子戰項目,分別從關鍵技術攻關、系統架構、應用集成和演示驗證等方面推動認知電子戰的發展[11]。
在關鍵技術攻關方面,美國海軍實施的反應式電子攻擊措施項目重點聚焦雷達信號探測和分類技術,用于識別敏捷雷達威脅目標,并計劃應用于EA-18G“咆哮者”電子戰飛機;美國國防部建立的“算法戰跨職能小組”開展基于人工智能的海量光電偵察數據態勢分析、目標識別、光電對抗等技術研究;美國DeepSig公司于2020年開發了一套OmniSIG人工智能軟件,開展信號檢測、識別、推理等關鍵技術驗證,為動態頻譜感知與決策提供支撐。
在系統架構研究方面,DARPA資助的“寬帶傳感器系統的處理器重構”項目聚焦開發高吞吐量、流數據處理器,大幅提升硬件反應速度和處理能力,為認知電子戰提供實時運算平臺支持;“射頻機器學習系統”聚焦研究如何將機器學習等人工智能理念與方法應用于射頻系統設計。美國空軍針對認知電子戰面臨新威脅的特點,實施了“電子支援關鍵試驗”項目,試驗具有新目標適應能力的開放式機載電子攻擊系統。
在應用集成和演示驗證方面,美國工業界在DARPA的資助下分別針對雷達對抗、通信對抗等開展了驗證。在雷達對抗方面,主要代表項目是“自適應雷達對抗”項目;在通信對抗方面,主要代表性項目包括“自適應電子戰行為學習”“認知干擾機”“城市軍刀”等。而“極端射頻頻譜條件下的通信”項目則聚焦認知通信防御問題,提高在遭受干擾壓制情況下的通信自適應能力和靈活性。2022年,美國空軍發布的“怪獸”項目是美軍公開的認知電子戰最新項目,其包括了數據框架、硬軟件架構(軟件無線電研究)、多頻譜模擬仿真環境、可重構的電子攻擊處理、實時算法開發、關鍵技術重編程(檢測、分選、識別、去模糊和跟蹤等)、分布式對抗等,實現機載認知電子戰能力的全面驗證。
綜合國內外研究,認知電子戰系統架構一般由可重構射頻模塊、偵察感知模塊、干擾生成模塊、推理學習模塊、動態知識庫等組成,如圖1所示。可重構射頻模塊主要負責與電磁環境的交互,包括接收環境中的射頻信號與發射干擾信號。偵察感知模塊主要負責射頻信號接收與智能分析識別、信息提取以及輻射源行為分析、意圖識別等,為對抗決策提供輸入依據,同時也為在線干擾效果評估提供輸入依據;干擾生成模塊主要負責對抗策略以及干擾波形的實時生成;推理學習模塊為整個系統提供運算條件,支撐離線學習以及在線運算等,充當認知電子戰系統的大腦;動態知識庫存儲感知判斷得到的目標輻射源波形、模式規律等知識并能夠進行動態更新。認知電子戰系統的核心特征是通過智能賦能,動態適應電磁環境和目標變化,敏銳發現、精確識別和高效干擾威脅目標,并能自適應實現資源動態調度,通過學習不斷優化策略。

圖1 通用的認知電子戰系統體系結構Fig.1 General architecture of cognitive electronic warfare system
在系統架構的基礎上,認知電子戰系統還可以進一步根據不同的功能層次進行詳細設計與劃分。
根據自頂向下的設計原則,采用分層架構將認知電子戰系統劃分為用戶層、應用層、算法層、數據層和硬件層,如圖2所示。層次越向上,其抽象層次就越面向業務、面向用戶;層次越向下,其抽象層次就變得越通用、面向設備。

圖2 認知電子戰系統的分層架構Fig.2 Layered architecture of cognitive electronic warfare system
認知電子戰的核心是感知能力、判斷能力、決策能力。考慮到感知、判斷、決策每個方面具有不同評價方式,認知電子戰的效能函數可以表示為
(1)
其中:mob、mor、mde分別表示感知、判斷、決策三個方面的性能指標向量;cob、cor、cde分別表示感知、判斷、決策三個方面的控制參數;U(·)表示系統效能函數,將多個性能指標m合成單一標量值,w是不同模塊對應指標的權重系數。通過尋找最優的cob、cor、cde,使得認知電子戰系統的效能函數最大化。mob、mor、mde等每一個指標的提升都應該會帶來認知電子戰系統性能的提升,但是單一的指標提升只能在一定程度范圍內提升認知電子戰系統的效能,而不能無限提高。Ceq(·)、Cnon-eq(·)分別代表優化問題中的等式限制條件與不等式限制條件,即表示認知電子戰系統在學習優化控制參數過程中需要遵循的約束條件。例如,電子戰系統的干擾樣式集、偵察與干擾的開窗時間限制等。
從每個功能模塊的角度出發,效能函數可以進一步表示為
U(mob(cob),mor(cor),mde(cde),w)
Ude(mde(cde),wde),w]
(2)

4.1.1 問題模型
感知的目標是對截獲到的信號進行處理,獲取信號的基本參數、信號樣式、個體身份等信息,能夠為對抗波形生成提供基礎參數。其核心在于如何根據不同的需求,構造不同的特征提取模型,可以表示為
(3)
為了完成對目標的感知任務,需要對接收到的信號進行分步驟處理,包含信號檢測、測向、信號識別、個體識別等,從而實現從復雜電磁環境中發現、識別輻射源目標,為后續干擾決策提供目標指引。控制參數cob中核心控制變量為特征提取函數f(·),f(·)在很大程度上決定了感知模塊的效能。目前,在認知電子戰感知技術研究中,f(·)一般采用不同的深度學習模型。下面分別對感知技術中涉及的檢測、測向、信號識別和個體識別技術進行介紹。
4.1.2 檢測技術
信號檢測的目的是從接收的無線電數據中檢測出潛在的目標信號,是實現認知電子戰感知技術的第一步。傳統信號窄帶檢測方法主要分為匹配濾波法[12-13]、循環平穩法[14]、特征值檢測法[15-18]和能量檢測法四大類。但是這些經典檢測方法重點關注的是信號存在性判定問題,大都未對信號參數估計進行研究,而全面準確的信號參數獲取對于后續盲處理是至關重要的。
近幾年隨著深度學習技術的飛速發展和巨大性能突破,將其引入寬帶信號檢測效果十分顯著。基本思路是以時頻圖作為輸入,預測信號在時頻圖上的邊界框和類型;再將預測的邊界框進行簡單的轉換,即可得到信號的起止時間、中心頻率、帶寬以及信號類別等參數。Yuan等在時頻圖上利用能量檢測方法獲取感興趣區域(regions of interest, RoI),然后利用多層卷積神經網絡(convolutional neural networks, CNN)組成的分類器對RoI進行識別以檢測Morse信號[19]。該方法的性能瓶頸主要在于能量檢測在信道環境復雜時魯棒性較差。Prasad等認為信號檢測任務復雜性低于通用目標檢測,因此采用了一個簡化的Faster R-CNN模型來從含干擾時頻圖中檢測Wi-Fi信號,并且對模型不同超參數進行了詳細討論和優化[20]。Zha等采用單階段目標檢測器從寬帶時頻圖中檢測多種調制類型的信號[21]。Li等采用YOLOv3針對寬帶時頻圖中檢測多調制類型信號開展了實驗驗證[22]。
隨著新體制信號的出現,信號帶寬范圍大,一次通聯涉及多種不同突發寬度、多頻點、多帶寬,如何應對時間頻域尺度差異較大的不同類型信號的檢測成為亟待解決的難題。
4.1.3 測向技術
空間信號波達方向(direction of arrival, DOA)估計,也稱為陣列測向,其主要目的是對空間某區域目標信源進行精確的測向。
經典的DOA估計方法,即模型驅動類方法,通過預先建立的陣列觀測數據與信號角度之間的數學模型,計算出相應準則下的信號方向。該類方法需要經過特征值分解、多維搜索、迭代運算等計算過程,會產生巨大的計算量,并且當預設模型與實際情況不匹配或存在較大偏差時,該類方法的性能將會出現急劇惡化甚至完全失效,難以滿足日益復雜的電磁環境下對測向準確性、實時性和穩健性的要求。
近年來,很多國內外研究者開始引入了機器學習技術,如支持向量回歸[23-24]、徑向基函數[25-26]、深度神經網絡[27-29]等來解決DOA估計問題。以機器學習為代表的數據驅動類方法能夠直接基于對數據的學習提取特征與入射角度之間的非線性映射關系,可表示為f(s)→θ′,對難以建模的復雜環境具有較強的適應性。同時,其在線測試過程能夠被硬件高效地并行實現,在計算效率方面也具備顯著優勢。但對該類方法的研究目前還處于探索階段,仍然面臨著很多問題,如問題條件理想化、先驗信息挖掘不充分、少樣本問題以及在線學習問題等。
4.1.4 信號識別技術
信號識別是指對接收到的電磁信號進行特征測量,識別信號規格或者信號樣式,具體包括雷達、通信信號的調制方式等。
目前,智能信號識別算法根據數據預處理階段所使用的信號表示技術可以劃分為基于序列表示、特征表示、圖像表示或它們的組合表示的智能信號識別四類方法。
序列表示是最直觀的信號表示,常用的方法是使用同相正交(inphase and quadrature, IQ)序列、幅度相位(amplitude and phase, AP)序列和快速傅里葉變換(fast Fourier transform, FFT)序列等表示信號。文獻[30]基于相同CNN和RadioML2016.10a[31]中的相同數據集研究了IQ序列、AP序列和FFT序列表示對識別性能的影響,實際應用中應根據具體的場景和信號特點進行綜合考慮以選擇合適的序列表示方法。
基于特征表示的智能信號識別算法由傳統的基于特征提取算法發展而來。它通過提取多個特征來表示接收信號,再輸入深度學習模型完成識別。常使用的特征有高階累積量、瞬時特征、循環統計量、小波變換特征和近似熵特征等。因為提取的特征數目通常小于接收信號的長度,故可以使用具有較少神經元的簡單神經網絡。但也存在以下幾點不足:一是信號特征的計算導致額外的計算復雜度;二是需要根據候選信號樣式選擇適當的特征,依賴于專業知識和經驗;三是提取信號的某些特征,可能丟失一些關鍵信息,并影響調制識別的性能。
基于圖像表示的智能信號識別算法是在數據預處理階段將接收信號轉換為星座圖、特征點圖像、模糊函數圖像、眼圖、譜相關函數圖像等,通過圖像識別來完成信號識別。
由于單一一種信號表示方式均存在片面性,很難僅利用某一種表示技術完整地表征信號全部特性。因此,現有研究中也有考慮使用多個特征、圖像或序列的組合來表示接收信號,作為深度學習模型的輸入用于信號智能識別。通過綜合運用多種信號表示,多種表示優勢互補,解決了單一表示對信號反映不完整的問題,可以提高識別的魯棒性和準確率。
4.1.5 個體識別技術
特定輻射源個體識別(specific emitter identification, SEI)技術,又稱輻射源指紋識別技術,是指對接收的電磁信號進行特征測量,并根據已有的先驗信息確定產生信號的輻射源的個體識別過程。現有SEI技術根據特征提取方式可以劃分為基于特征工程的輻射源個體識別技術與基于深度學習的輻射源個體識別技術[32]兩大類。人工設計指紋特征面臨的挑戰主要表現在兩個方面:一是特征設計函數復雜度較低導致指紋特征表征能力較弱;二是隨著加工工藝不斷進步,輻射源個體差異日益縮小,同時新體制輻射源信號日益復雜,導致SEI特征設計難度顯著增加[32]。
因此,研究人員提出采用深度學習技術代替人工設計指紋特征步驟,即在損失函數的約束下,通過不斷優化網絡結構參數,自動提取有效的指紋特征,并完成個體身份識別任務[32-33]。根據網絡輸入的數據格式不同,該類技術可以劃分為兩類,即基于原始IQ數據的指紋特征提取與基于信號變換域的指紋特征提取。基于原始IQ數據的指紋特征提取技術的優勢在于原始數據無信息丟失,可以為深度學習模型提供全部可用的信息,但卻同時帶來了冗余信息干擾訓練的問題。針對這一問題,部分學者首先將信號映射至變換域再輸入深度學習模型,以降低訓練難度,進而提高SEI系統識別準確率和魯棒性。
4.2.1 問題模型
判斷的目標是對感知模型輸出的信號基本參數、信號樣式等特征進行時間維度上建模,分析目標的行為規律,檢測是否異常并識別目標意圖,能夠為對抗策略生成與優化提供支撐。判斷模型的效用函數可表示為
(4)
判斷過程包括行為建模、異常檢測和意圖識別。其輸入為偵察感知模塊的輸出,包括信號識別結果、個體識別結果、信號方向、信號參數等。

在提取行為描述特征后,通過異常檢測計算fAD(·)進行判斷,根據經驗誤差設定閾值ρ判別是否為異常行為。
當檢測到目標信號波形或工作模式等的異常行為后,可以進一步分析并確定其對應的事件或意圖YIR,構建意圖識別函數fIR(·)與事件YIR作對應,即可得到意圖識別結果。
4.2.2 行為建模
行為建模是通過對特定輻射源的長期行為觀察、描述和統計分析,從數據中獲取目標的行為描述和規律特征。電磁目標行為是指目標面對任務需求及外界環境時做出的決策反應。通過建立電磁目標在信號參數和工作狀態等方面的行為模型,便于對后續的行為進行判別。
隨著智能化認知設備的發展,電磁目標行為分析相關的研究逐漸興起[34],相繼提出雷達行為[35]、電磁輻射源行為學[36]等相關概念。根據現有研究,電磁目標行為可分為個體行為和群體行為。個體行為通常表現為輻射源信號參數的變化、所搭載平臺運動規律的改變,以及環境因素等其他能夠引起個體行為發生反應并可被非合作單位識別的變化等,例如輻射源掃描方式的改變、電磁目標工作時間段的變化等;群體行為則需要注重空間相互關系的影響,包括電磁密度、電磁頻譜占用度的劃分,群體陣列的結構構成,以及任務事件的進程等。要建立龐大的行為知識體系,行為建模不僅要包含個體行為和群體行為,還要考慮時間粒度、空間粒度的劃分。目前關于電磁目標行為建模一般采用人工或機器學習的方法提取行為描述特征,也有采用多層級語義建模的方法[37],還有學者構建實時動態的頻譜行為知識圖譜,利用采集頻譜數據中提取的語義與知識進行建模[38]。通過行為建模來獲得電磁目標的內部決策機制,進而為后續干擾策略優化提供基礎參數。
4.2.3 異常檢測
異常檢測就是將被視為正常的活動定義與觀察到的事件進行比較,以識別顯著偏差的過程[39]。深度學習未發展之前,異常檢測分析主要基于統計的方法[39]。但隨著數據量呈指數型增長且參數靈活多變,過時的模型導致誤報率更高,文獻[40]證明基于統計的算法在檢測圖像和序列數據集上的異常值方面性能是次優的。而深度學習的方法可以學習大規模數據的深層特征,從而獲得良好的性能。
以標簽數據劃分,基于深度學習的異常檢測可分為有監督、無監督和半監督三類。有監督的異常檢測使用標注的正常和異常數據來訓練深度分類器,盡管相對于傳統方法性能有所提高,但數據類別不平衡,即正類標簽的總數遠遠多于負類標簽的總數的問題常常導致性能次優。此外,在電子戰領域的輻射源行為特征數據通常難以準確完善地標注,因此有監督的方法不如無監督或半監督的方法有效。無監督的異常檢測僅基于數據的內在分布特性來區分異常,大多采用聚類的方法。而半監督的異常檢測通常采用正類的單類標簽來分離異常,利用異常數據與正常數據的特征差異性,在模型訓練時學習正類數據特征,在測試時對包含有正常和異常的數據進行分類,進而識別出異常數據。
4.2.4 意圖識別
意圖識別[41]也被稱為目的識別,是通過分析目標的部分或所有行動,或者分析其行動導致的狀態或環境變化來識別意圖的任務,而行為預測更側重于通過分析歷史數據來預測未來的行為,這是兩個相關但不完全相同的概念。在認知電子戰中,既要考慮對方意圖具備的欺騙性、動態性以及對抗性等諸多特性,同時還要考慮意圖誤判的代價敏感性。識別對方意圖是一個由諸多細微信息綜合提煉、依靠經驗數據支持的推理分析和概率計算過程。
由于智能算法在處理復雜大數據的優越表現,意圖識別的研究已經逐漸從基于模板匹配、貝葉斯網絡[42]以及隱馬爾可夫模型等依靠領域專家知識的傳統方法轉為深度學習的方法。因為作戰意圖具有時間關聯性,目前意圖識別中深度學習的方法多采用門控循環單元、長短時記憶網絡等時間序列網絡模型。但是考慮到認知電子戰中決策的時效性,網絡模型的快速性同樣不可忽視。而且現有方法的參數選擇多從信號層面,環境建模較為理想化,要構建更為完善的意圖識別系統,還需要綜合考慮信號、時間、空間層面,甚至輿論層面的各種因素影響。最終通過不斷改進完善,在保證準確率和誤判代價的前提下,逐步發展為更具先進性的意圖預測[43]。
決策技術,即干擾決策,其目標是基于感知和判斷的結果實時生成最佳的干擾策略與波形。
4.3.1 問題模型
最佳干擾策略的關鍵是最佳干擾波形序列的生成,包括干擾樣式、干擾時刻、干擾能量等。在此基礎上,根據干擾目標不同狀態變化情況,對干擾效能進行評估,進而優化干擾策略,對后續的干擾資源調度進行引導,從而保證干擾持續有效。核心目標是基于可觀測參數向量[o(0),…,o(t)](如目標信號特征、干擾信號特征、接收機狀態、環境因素、任務目標等)、不可觀測參數向量[z(0),…,z(t)](如未知環境因素、未知輻射源狀態等)和控制參數向量[c(0),…,c(t-1)](如干擾信號j(t)生成參數、干擾模式、發射機參數、節點部署方式等)來確定控制參數向量c(t),使得效用函數U(t+1)最大,目標函數表示為

=ζ(o(0),…,o(t),c(0),…,c(t),z(0),…,z(t))
(5)
其中滿足條件的c(t)構成t時刻最佳干擾策略s(t)。
4.3.2 認知干擾策略生成
在傳統對抗過程中,獲取目標信號偵察信息后主要依靠從預設干擾策略庫中或憑借經驗制定干擾策略,選取預存儲的干擾波形進行對抗,而當目標先驗缺失、目標信號參數動態變化或出現新目標時,傳統基于“劇本”的對抗方式無法自適應地調整干擾策略以完成有效干擾,對抗效果將會被極大地削弱甚至完全失效。
現有的認知干擾重點是基于偵察中獲取的目標特征信息進行最優化干擾決策,其能夠適應數據庫中有類似波形對抗策略的未知目標對抗問題。
目前,認知干擾策略生成的主要方法是基于強化學習的決策方法。常用的強化學習算法主要包括動態規劃、時序差分學習、Q-Learning等[44]。但該類方法實現的前提是實時獲取并修正干擾獎勵函數,而對于快速變化的對抗場景,獎勵函數的定義本身就是一個難題。因此,該類方法目前只能針對特定緩慢變化目標的干擾任務,當目標信號參數快速變化時,仍然難以發揮作用。另外,對于多種已有波形組合或者是全新波形的對抗問題,一般性的推理和決策也難以找到最優的干擾波形。
認知干擾決策難題在于如何基于對威脅目標未知波形的認知實現實時高效對抗策略的優化。生成式深度學習技術[45-46]、零樣本學習技術[47]以及知識-數據聯合驅動學習技術[48]的興起為解決這個問題提供了新的思路。面對潛在未知目標波形,由于學習過程中數據樣本的缺失,需要融合領域知識進行聯合驅動,使系統具有對信號的“深度”理解能力,進而縮短對未知威脅的干擾反應時間, 提升電子戰系統干擾成功率。
4.3.3 在線效果評估
傳統電子戰不能實時評估干擾效果,感知—判斷—決策—行動環始終是“偵察—干擾”的開環模式,無法實現“偵察—干擾—偵察”的閉環模式。閉環對抗要實時獲取干擾效果信息,即要能夠做到基于干擾方的干擾效果評估。以雷達對抗為例,雷達在受到干擾后,在工作模式、行為特征、信號特征等方面會存在一定的變化,主要包括:工作模式切換如跟蹤模式受到干擾后會切換到搜索模式,或者采用一些抗干擾措施如頻率捷變、重頻抖動、功率管控等。通過工作模式、行為特征、信號特征等的變化能評估雷達受到干擾的效果。
目前,在線干擾效果評估是認知電子戰領域的研究難題。學術界的研究成果較少,其核心在于構建目標電子系統的狀態變化集、狀態變化集如何與干擾決策過程進行耦合,以及修正干擾目標獎勵函數并共同引導決策過程在線優化。
認知電子戰概念自提出以來,已經經歷了十多年的發展,但現有的系統距離真正意義上的“認知能力”還具有一定的差距,本節將闡述認知電子戰所面臨的挑戰與其關鍵技術發展方向。
雖然人工智能技術已經在計算機視覺、自然語言處理領域得到了廣泛應用,但是在與電子戰結合的過程中依舊面臨諸多挑戰,主要表現為開放性電磁環境帶來的變化引起的智能學習過程的非魯棒性。
一是未知目標。認知電子戰中的信號識別、個體識別、行為建模、意圖識別等環節都面臨著新增的未知目標的挑戰。一方面,隨著電子信息系統的數量與種類不斷增加,新的波形層出不窮,信號識別與個體識別等任務必須具有開集識別和新目標認知能力;另一方面,不同目標執行的任務多導致信號工作模式等更加多樣化,未知行為分析和意圖識別挑戰大。
二是未知環境。現代戰場的電磁空間斗爭激烈,多種電磁信號、干擾和噪聲相互交織。檢測、測向、信號識別、個體識別等環節均易受到復雜多變環境的影響,即復雜多變的電磁環境使平時積累的數據分布特性與模型應用時實時接收到的數據分布特性存在不同程度的差異,從而導致學習訓練模型失配,性能大幅度下降。
三是頻譜對抗。現實中大部分偵察活動面臨著干擾的挑戰。干擾技術旨在破壞或掩蓋原始信號,通常采用高功率、捷變頻等手段,使偵察系統難以檢測和區分所需的信號和干擾信號。現有列裝的設備大多依賴于時域或頻域分離信號。如何應對時頻混疊干擾信號的威脅,保證干擾條件下偵察系統的可靠性、穩定性、準確性(即擾中偵),已成為重中之重。
5.2.1 基于零樣本學習的信號與目標認知
如前文所述,認知電子戰的最大優勢在于可以針對未知目標進行分析識別,這一過程所涉及的關鍵技術為零樣本學習。
零樣本學習允許人工智能模型識別以前從未見過的目標或概念。與傳統的監督學習不同,模型從訓練實例中學習,只能在它所訓練的類別中對物體進行分類,零樣本允許人工智能模型使用語義屬性和關系來建模所學的目標。
在零樣本學習中,模型學習信號數據和特征語義信息之間的映射,如信號不同特征描述、信號屬性的層次和關系。根據這些語義屬性為新的未知目標預測一個標簽。因此,在認知電子戰關鍵技術研究中,面對潛在的未知目標與未知波形,需要融合關于輻射源信號領域知識進行語義建模與關聯,實現對未知波形的特征提取。
5.2.2 魯棒性學習推理
認知電子戰技術發展和系統研制離不開多樣化數據的支撐,這就要求研究人員以及工程師們高度重視電子戰數據工程問題。但是,現有研究揭示了以深度學習為代表的人工智能模型存在明顯的脆弱性[49-50],以對抗樣本為代表的攻擊技術將會制約未來智能化手段部署到電子戰裝備中的安全性。因此,認知電子戰模型的魯棒性和安全性不容忽視。近年來,世界各主要軍事強國在智能化電磁頻譜對抗樣本攻防領域的研究飛速發展[51-60]。
自2019年始,對抗樣本的研究成果開始應用于電磁信號領域。Sadeghi等首次在基于深度學習的無線信號調制識別任務中提出了一種白盒對抗攻擊方法和通用對抗攻擊方法[61]。結果表明對抗攻擊可以在極小的擾動下大大降低智能調制識別的分類性能,這給使用基于深度學習的識別算法帶來了重大的安全性問題。隨后,不同研究人員先后開展各類對抗樣本攻擊算法在調制識別、個體識別等領域的應用。2021年開始,研究人員開始結合真實物理場景,結合領域特有的知識,優化對抗樣本的生成算法,不斷增強對抗樣本對真實物理場景的適應能力。
綜上,現有認知電子戰關鍵技術中基于深度學習模型的各類方法由于缺乏可解釋性,極容易受到對抗樣本攻擊的威脅,給模型在復雜電磁環境下強對抗場景中的實際應用帶來嚴重安全隱患,亟待開展適應對抗樣本波形的魯棒性學習推理方法研究。
5.2.3 時頻混疊信號實時分離
在實際對抗過程中,當電子戰系統實施干擾時,由于干擾信號與目標時頻重疊,無法同步開展偵察,這就帶來兩個挑戰:一是無法實時偵測目標信號的變化從而及時做出反應,導致認知電子戰過程無法持續進行;二是干擾過程中無法偵察到目標信號的變化從而直接影響在線效果評估。因此,需要開展時頻混疊信號實時分離技術研究,為實現認知電子戰過程中的“干擾中偵察”以及在線效果評估提供實時不斷的目標數據。
5.2.4 分布式認知對抗技術
群體智能是一個受社會昆蟲群落集體行為啟發的概念,其中個體代理在本地相互作用以實現全球目標。這一概念已成功應用于各個領域,包括機器人、優化和決策。通過利用群體的集體智慧,可以實現卓越的性能并克服傳統集中式方法的局限性。在認知電子戰的背景下,群體智能可以增強其分布式感知和通信、自適應和彈性行為、合作干擾和欺騙、動態任務分配等能力,大幅提升系統適應性、彈性和有效性。
隨著人工智能理論的高速發展和不斷涌現,更加先進的機器學習算法和技術將會不斷出現,認知電子戰技術將逐漸成熟并進入應用,不斷提升電子戰在強對抗、快變化電磁環境下的敏捷性與整體作戰能力。