劉戎翔, 吳 琳, 謝智歌, 劉虹麟
(1. 國防大學聯合作戰學院, 北京 100091; 2. 陸軍防化學院, 北京 102205;3. 軍事科學院, 北京 100091; 4. 中國人民解放軍海軍參謀部, 北京 100036)
信息化戰爭條件下,制空權的爭奪顯得越發重要,指揮員需要在動態對抗的戰場環境下,實時對敵方防空體系進行綜合分析。隨著參戰力量及裝備類型的不斷增多,戰場節奏不斷加快,人類指揮員很難站在體系視角,直接從淺層的態勢信息直接獲得高層的認知結果,對敵方防空體系進行綜合評估。因此,迫切需要科學高效的防空體系態勢輔助分析工具,輔助指揮員揭開態勢“迷霧”,在決策速度上搶占先機。
當前防空體系態勢輔助分析主要存在以下3個方面的問題:一是針對體系進行分析的較少。傳統方法中,一般采用貝葉斯學習、規則庫、隱馬爾可夫模型進行空情態勢分析,開展意圖識別工作。隨著深度學習技術的不斷發展,研究人員利用卷積神經網絡、循環神經網絡等進行態勢分析,并取得了較好的效果。但是,當前的模型研究大多針對單個平臺的意圖識別,對敵方防空體系能力進行態勢分析的較少。二是分析結果難以滿足需求。傳統的防空體系包絡線不能完整反映防空體系能力,同時基于深度學習的態勢分析模型大多基于數值標簽對分析結果進行標注,標簽的可解釋性難以滿足指揮員態勢分析的需要。三是分析速度有待提高。通常,研究人員基于仿真實驗床進行防空體系分析,分析速度難以滿足輔助指揮員實時指揮決策的需要。
生成對抗網絡是目前深度學習領域中最熱門的研究方向之一,目前已經在圖像生成、圖像轉換、圖像-文本翻譯、異常檢測和定位等領域獲得了重大突破。生成對抗網絡包含生成器和判別器兩個部分,通過不斷地對抗訓練使模型逼近納什均衡。作為一種生成式模型,生成對抗網絡可以得到兩個數據集間的聯合概率分布,為體系分析提供了新的思路。
通常,人類指揮員在對防空體系進行分析時,會依據掌握的武器平臺數據、部署位置以及組網情況等態勢信息,在頭腦中形成一個關于體系強點與弱點的分布,類似一種利用戰場態勢數據分布擬合態勢認知結果數據分布的過程。生成對抗網絡可以在有標簽的條件下實現各類樣本間的相互轉換,與人類通過態勢進行聯想推斷的機理有相似之處。
因此,為解決當前防空體系態勢輔助分析中存在的問題,本文基于體系視角,將整個防空體系作為研究對象,構建防空體系態勢輔助分析模型;利用已有的仿真數據,將防空體系的當前態勢以及體系能力進行圖形化描述,提高模型的可解釋性;利用生成對抗網絡模擬指揮員的聯想推理過程,從態勢信息直接生成防空體系能力熱圖,大幅提升模型的分析速度,降低指揮員的認知負載,輔助指揮員進行態勢分析并快速決策。
指揮員在對防空體系進行分析時,需要綜合考慮防空體系中的武器裝備、部署位置、指揮關系、氣象條件等因素。這些因素間關聯關系復雜,且信息量巨大,不便于指揮員在快速變化的戰場環境中準確分析態勢、定下決心。為此,本文從體系視角,構建了防空體系態勢輔助分析模型,將底層高維的態勢信息轉化為中層低維的態勢認知產品,為指揮員提供直觀的分析結果(見圖1)。

圖1 模型應用場景示意圖Fig.1 Application scenario of the model
本文將整個防空體系作為一個研究對象,定義防空體系當前態勢信息為,人類指揮員的態勢認知結果為,則人類指揮員基于當前態勢信息進行防空體系態勢分析的過程可以抽象為=(),式中,(·)為一個映射函數,模擬了人類指揮員的抽象、推理過程。但是,由于直接從淺層態勢信息映射到高層認知結果過于復雜,(·)很難直接獲得,可以利用計算機輔助模型提供中間層結果,簡化人類指揮員的認知難度。因此,防空體系態勢輔助分析模型可以表示為
=′()
(1)
式中:′(·)為模擬人類指揮員的部分抽象、推理過程的映射函數。
為較準確地獲得′(·),需重點解決兩個問題:一是如何描述態勢信息及中間層認知結果,便于指揮員理解并具備可解釋性;二是如何選擇適當的模型,模擬人類指揮員的抽象推理過程。因此,本文的研究內容重點包含兩個方面,即防空體系特征的圖形化描述方法和基于生成對抗網絡的防空體系能力熱圖生成模型,總體流程如圖2所示。

圖2 模型總體流程圖Fig.2 Working process of the model
防空體系特征描述是防空態勢輔助分析的基礎,只有對防空體系特征進行合理描述,才能更加有利于模型進行防空態勢輔助分析。目前,研究人員通常采用向量化或圖形化兩種方式描述戰場態勢。向量化的態勢描述方法主要通過提取態勢特征指標,將各個指標拼接為一個1維向量,對當前態勢進行描述;圖形化的態勢描述方法主要通過將戰場態勢圖柵格化,可較好地描述各實體的位置關系。對比兩種方法,向量化的描述方法包含更多的態勢特征,但會丟失部分空間特征信息,如:相對位置、網絡連接關系等;圖形化的描述方法可以較準確地描述當前態勢的空間信息,且該種描述方法較向量化方法而言較容易解釋,便于人類指揮員理解。因此,本文綜合已有的向量化和圖形化態勢信息描述方法,提出一種多層的防空體系態勢信息圖形化描述方式,通過多個特征圖描述防空體系當前態勢以及防空體系能力。
令={,,,,,}。其中為戰場環境信息,包括地形、天氣、風向等特征信息;為實體能力范圍類信息,主要描述所有實體的探測范圍、打擊范圍等范圍信息;為實體能力指標類信息,如實體的反應時間、速度等信息;為實體位置信息;為實體類別信息;為實體網絡拓撲類信息,主要描述防空體系中各實體的組網情況。
利用多層的柵格化圖形進行描述,具體方法為:首先將待分析區域劃分為×個方格;然后,針對每一個特征層,利用數值對方格內的各類特征信息進行編碼,獲得能力矩陣;最后,將每個分別轉換為灰度圖并組合,獲得可以描述的多層灰度圖。部分描述結果如圖3所示。

圖3 部分特征圖形化描述結果Fig.3 Partial results of graphical feature
由于表示的是實體各類能力的范圍,其描述方法如下。

特征層直接利用待分析區域內的實體組網情況圖表示,如圖4所示。

圖4 實體組網情況特征圖Fig.4 Feature map of entity networks
此外,其余的各特征層直接利用每個方格內各特征信息進行描述,進行歸一化并轉換為灰度圖。所有特征圖的最終描述結果如圖5所示。

圖5 態勢信息圖形化描述結果示意Fig.5 Result of situation information graphical description
本文利用熱圖來描述防空體系對敵方飛行目標的攔截情況,用以表征防空體系的能力。相比常用的防空體系能力指標描述法而言,該種描述方式更便于指揮員掌握敵方防空體系能力強弱的空間分布,更有利于指揮員分析敵方防空體系的強點和弱點,進而快速開展指揮決策。防空體系的攔截情況可以通過仿真系統獲得。在獲得一個防空體系部署情況后,首先利用仿真系統進行大規模實驗,得到每次仿真實驗得到的攔截點分布情況;而后利用計算機圖像生成技術,將該部署情況的攔截點分布轉換為能力熱圖,用RGB模式的熱力圖表示,如圖6所示。

圖6 防空體系能力圖形化描述結果Fig.6 Result of air defense system capability graphical description
生成對抗網絡作為一種典型的生成模型,可以實現兩個特征空間數據的相互轉換,例如將一幅圖像轉換為特定的風格。該過程可以看作是對人類抽象、聯想、推理過程的模擬,與指揮員看到態勢信息后,抽象、推理得到防空體系能力的機理相近似。因此,本文在生成對抗網絡的基礎上,構建防空體系能力熱圖生成模型。以描述當前防空體系態勢的圖形化特征為輸入,經模型分析推理后,直接獲得防空體系能力熱圖,提供態勢認知的中間層產品,輔助人類指揮員進行態勢認知。
模型中,生成器主要用于防空體系能力熱圖的生成。生成器的輸入為圖形化描述的防空體系態勢,特征維度為××,為所有特征的數量;輸出為防空體系能力熱圖,即態勢認知的中間層結果,特征維度為××3。由于≠3,因此生成器首先需要對進行壓縮,然后再進行樣本生成。此外,本文采用帶有跳躍連接的編碼器-解碼器模型U-NET構造生成器,使模型在較高的層級可以共享低層級抽取的數據特征,防止低層級特征的丟失,進一步提高了輸出數據的質量和精度。因此,生成器的工作流程為:首先利用1×1的卷積核將壓縮至3維;然后將壓縮后的特征向量輸入U-NET模型中,先進行下采樣后進行上采樣;最終生成防空體系能力特征圖。
定義conv(kn, st, nu)為卷積核大小kn×kn,步長為st,卷積核數量為nu的卷積層;同理,定義deconv(kn, st, nu)為反卷積層。因此,本文生成器的結構可表示為
編碼器部分:conv(1,1,3)-conv(4,2,64)-conv(4,2,128)-conv(4,2,256)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)-conv(4,2,512)
解碼器部分:deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,512)-deconv(4,2,256)-deconv(4,2,128)-deconv(4,2,64)-deconv(4,2,3)
生成器的結構如圖7所示。

圖7 生成器結構圖Fig.7 Architecture of generator
從圖7中可以看出,編碼器部分低層級的特征(藍色表示)通過跳躍連接與解碼器中對應的高層級特征(紅色表示)拼合。此外,編碼器中,前8層采用Leaky-Relu激活函數,最后一層采用tanh激活函數;解碼器中,均采用Relu激活函數。生成器中,除第一層不采用批歸一化(batch-normalizion, BN)外,其余各層均采用BN處理。
判別器主要用于鑒別生成的是否由生成器生成。由于本文中需要在特定的條件下對應的,因此判別器的輸入為與對應的拼接,輸出為一個標量,用于判斷的真偽。判別器首先也將進行壓縮,而后與相對應的進行拼接,并送入一系列卷積層中進行判斷。
判別器的結構可表示為conv(1,1,3)-conv(4,2,64)-conv(4,2,128)-conv(4,2,256)-conv(4,1,512)-conv(4,1,1)。判別器的結構如圖8所示。

圖8 判別器結構圖Fig.8 Architecture of discriminator
判別器中,各層均采用Leaky-Relu激活函數,最后一層為sigmod層。除第一層外其余各層均采用BN處理。
模型的損失函數主要包含兩個部分:① 生成對抗網絡的損失函數L;② 生成器生成的和真實的之間的圖像損失函數L1。
生成對抗網絡的最終目標是通過不斷的訓練,提高生成器與判別器的能力,使得在判別器能夠較準確地判別樣本真偽的前提下,生成器生成的數據令判別器無法判別出數據的真偽,模型從整體上達到納什均衡。本文中,由于生成的與間存在對應關系,因此生成對抗網絡的損失函數構建參考條件生成對抗網絡(CGAN),其損失函數可表示為
L(,)=,[log(,)]+[log(1-(()))]
(2)
式中:前半部分為在真實樣本,的條件下,判別器的判別誤差;后半部分為在生成樣本,()的條件下,判別器的判別誤差。
因此,生成對抗網絡的目標函數可以看作

(3)
最終,模型的收斂條件為判斷模型整體是否達到納什均衡,即判別器的判別誤差逼近05。代表生成器生成的樣本愈發逼真,導致判別器無法準確判斷其真偽。
為進一步提高圖像生成的精度,除生成對抗網絡的損失函數L外,還需考慮目標圖像與生成圖像間的圖像損失函數L1,L1的設計基于常用的1損失函數,其定義為

(4)
將L與L1進行整合,得到模型整體的損失函數為

(5)
式中:、為損失函數的權值,可通過多次實驗尋找最優的權值組合。
本文模型基于TensorFlow構建,模型的訓練及測試在Python 3.6,i7-4790 CPU@3.6 GHz,32 GB內存,NVIDIA TITAN X配置的PC上進行。本文數據集通過武器裝備體系仿真實驗床獲得:首先利用想定生成工具自動生成3 000個以防空作戰為背景的想定,利用這些想定生成特征圖作為模型的輸入;然后,利用武器裝備體系仿真實驗床對防空體系的攔截情況進行仿真;最后,通過獲得的防空作戰攔截點生成熱圖,以表征防空體系的能力,作為模型的輸出。數據樣本劃分為訓練集和測試集兩個部分,其中訓練集為2 400條數據樣本,測試集為600條數據樣本。
實驗過程中,首先利用訓練集數據對模型進行訓練,而后利用測試集數據生成能力熱圖,并與仿真結果進行對比。實驗對比情況如圖9所示。

通過結果對比可以看出,本文提出的模型可以利用當前的防空體系態勢信息生成防空體系能力熱圖。利用歸一化的均方根誤差(normalized root mean square error, NRMSE)對比生成圖像與目標的差距,平均偏差為0.026 85,說明模型的生成結果與仿真平臺的實驗結果較為相似。
本節重點對不同損失函數條件下,模型的收斂情況進行分析。由生成對抗網絡的基本構造原理可知,通過對抗訓練,判別器的性能將變得越來越好,生成器也不斷能生成以假亂真的數據,使得判別器分辨不出真偽,即在訓練過程中,判別器的識別正確率先不斷上升,而后下降并不斷趨于0.5。實驗過程中,分別采用生成對抗網絡傳統的損失函數L和本文構建的損失函數G構建模型并進行實驗,獲得判別器的識別正確率變化情況如圖10所示。

圖10 判別器識別正確率變化情況對比Fig.10 Comparison of the accuracy of discriminator
通過圖10可以看到,采用G構建的模型在迭代40萬次后,最終能夠較好地收斂,而采用L構建的模型性能水平震蕩較嚴重,最終也無法獲得收斂。由此可見,在傳統生成對抗網絡損失函數的基礎上,添加1損失函數進行修正,可以較好地提高模型的收斂性能。
實驗過程中,為進一步檢驗模型性能水平,對比特征描述方法對模型性能的影響情況,本文構建了基于向量化特征和多層感知機的特征圖生成模型(V+MLP)、基于圖形化特征和多層感知機的特征圖生成模型(G+MLP),與本文所構建的模型(GAN+1)進行對比。利用計算機圖形學中常用的3個指標:NRMSE、峰值信噪比(peak signal to noise ratio, PSNR)以及結構相似性(structural similarity, SSIM),對3類模型的生成結果進行評估。其中,PSNR的單位為dB,PSNR和SSIM數值越大代表生成圖像的失真度越小。對比結果如表1所示。

表1 不同模型結果對比
由表1中結果可以看出,本文基于生成對抗網絡構建的模型性能顯著高于基于多層感知機構建的模型,3類指標至少提升34.1%。同時,對比V+MLP和G+MLP兩個模型可以發現,采用圖形化的特征描述方法可以有效提高模型生成圖像的質量。
此外,針對不同的損失函數權值、設置情況,對模型的性能進行對比,獲得結果如表2所示。

表2 不同參數條件下模型結果質量對比
由對比結果可以看出,當=1,=0時,模型僅采用L作為損失函數,模型的性能最差。而當=0,=100時,模型僅采用L1作為損失函數,模型的性能有所提升,但不如=1,=100時模型的水平。同時,當=1時,設置分別為100,1 000,10 000,發現模型的性能水平并沒有隨著的增大而持續增加。當=1 000時模型生成圖像的效果最好。各個參數設置情況下,生成圖像的情況如圖11所示。

圖11 不同參數條件下模型結果對比Fig.11 Comparison of result in different parameters
當前,戰爭復雜性不斷提升、戰爭節奏日益加快,指揮員愈發難以從繁雜的態勢信息中有效開展防空體系態勢分析,快速指揮決策。本文提出一種基于生成對抗網絡的防空體系態勢輔助分析模型,將防空體系態勢信息和體系能力利用圖形化的方法進行描述,更加便于指揮員進行理解分析。基于生成對抗網絡構建能力圖生成模型,模擬人類指揮員體系分析的過程,有效提高了所生成能力圖的準確性。與傳統基于仿真實驗的方法相比,本文方法速度更快,可以有效提高指揮員的決策速度。通過實驗對比表明,本文模型結果準確率較其他模型至少提高341%。下一步研究過程中,可以進一步探討態勢信息、能力特征的描述方法,對能力圖生成模型進行改進,使得模型能夠更好地對復雜體系進行分析,提高指揮員態勢分析效率和指揮自動化水平。