朱 豐,胡曉峰,吳 琳,賀筱媛,楊 璐
(1.國防大學,北京 100091;2.軍事科學院,北京 100091;3.解放軍91053部隊,北京 100070;4.空軍工程大學防空反導學院,西安 710051)
軍事領域中,戰場態勢評估(主要包括戰場態勢理解和預測兩個層次)是指揮員決策的先決條件,對于指揮員作出正確決策至關重要。而其中的態勢理解是重中之重,因為態勢理解是預測的前提,沒有深刻、準確、高效的態勢理解將無言預測,更談不上指揮決策。為了有效地進行戰場態勢理解,僅靠指揮員的個人能力已難以滿足要求,需要借助其他手段輔助指揮員來完成此項任務。當前,以人工智能為基礎的智能化處理技術是輔助指揮員進行戰場態勢理解最有效的手段之一[1]。
然而,隨著高新技術的不斷發展和進步,當今社會已步入了信息化大數據時代。戰場態勢中蘊含著大量的不確定因素和非線性復雜信息,具有很多涌現性特征,態勢數據也呈現出了典型的大數據“4V”特性[2-3]。此時,戰場態勢這個復雜系統更為復雜。而傳統基于線性理論的一些智能化戰場態勢理解方法已無法滿足當前的任務需求,致使指揮員以及目前的智能輔助決策系統都難以迅速給出可靠的結果,嚴重影響了作戰效果。可以發現,人工智能的研究水平,特別是能夠模擬指揮員思維模式,適用于大數據復雜系統的人工智能研究水平,成為了制約戰場態勢理解技術發展的瓶頸問題。因此,如何突破關鍵技術,實現信息化大數據時代下有效的戰場態勢智能化理解,亟需進一步探索研究。
眾所周知,智能主要包括計算智能、感知智能和認知智能,這三種智能體現了從低級到高級的層次。作為認知智能中的典型代表——深度學習,是2006年才提出的一個新研究領域[4-7],它起源于人工智能中的一種典型技術——人工神經網絡,本質上是模擬了人腦分析學習的過程,因而具備了多層感知的深度網絡模型。總的來講,深度學習具有強大的非線性處理能力,逐層理解、自動分析提取的結構,良好的“記憶”性質等獨特優勢,目前已被譽為最接近人腦的智能學習方法。它不僅在語音識別、圖像處理、視覺處理、自然語言處理等方面取得了突破性的進展,更在強烈依賴態勢感知和評估的自動駕駛、電腦游戲、圍棋等方面展現出超強的能力。因此,深度學習的提出可為突破大數據戰場態勢智能化理解中的關鍵問題提供寶貴的契機。
進一步分析,為了能使基于深度學習的戰場態勢理解結果能與指揮員的思維結果一致,就需要研究探討指揮員戰場態勢理解思維過程模擬方法,這是本文研究工作的初衷所在。從公開發表的文獻來看,目前態勢評估中指揮員的評估過程和技能并沒有明確的公認結論。文獻[8]研究分析了指揮員在戰場態勢評估時的一些應用框架,基于專家意見給出了三種針對不同目標的指揮員態勢評估方法步驟,這些方法各有側重,并沒有很好地達成一致。文獻[9]在分析了ATR-C框架的基礎上,提出了分層次的指揮員戰場態勢評估模型,并利用OTB(Onesaf Testbed Baseline)仿真測試環境展開了相關實驗,驗證了分層次評估模型的有效性。依據文獻[9]的結論并通過調研作戰時指揮員的思維情況,可以認為,指揮員進行戰場態勢評估通常是分層次、分階段的。其中的高級理解階段的模擬則需要利用認知智能特別是深度學習來完成。本文就此展開相關探索性工作,一是概述了戰場態勢評估的相關概念。二是分析了指揮員理解戰場態勢時的思維模式,以掌握指揮員戰場態勢理解的主要步驟。在此基礎上,結合深度學習,研究了基于深度學習的指揮員戰場態勢高級理解思維過程(以判斷敵方對我方可能的主攻方向為例)模擬方法,為開展戰場態勢智能評估分析、輔助決策等研究工作奠定重要基礎。
戰場態勢是指作戰雙方各要素(主要包括兵力部署情況、裝備情況、地理環境、天氣條件等等)的狀態、變化與發展趨勢[1]。那么,何為戰場態勢評估?美國國防部實驗室聯席理事會(Joint Directors Laboratory,JDL)提出了分層多級的戰場信息模型和相對公認的戰場態勢評估的定義。美國JDL模型中,將戰場態勢評估描述為:在戰場一級數據(即為對戰場上目標位置和身份等的估計)融合處理的基礎上,建立的關于作戰活動、事件、時間、位置和兵力要素等組織形式的一張多重視圖,它將所觀測到的戰斗力量分布與活動和戰場周圍環境、敵作戰意圖及敵機動性等有機地聯系起來,識別已發生的事件和計劃,得到對敵方兵力結構、部署、行動方向與路線的估計結果,指出敵軍的行為模式,推斷出敵軍的意圖,作出對當前戰場情景的合理解釋,即為戰場態勢理解,并對臨近時刻的態勢變化作出預測,即為戰場態勢預測,最終形成戰場綜合態勢圖,為指揮員進行決策提供有力的輔助支持,JDL態勢評估模型圖如圖1所示。可見,戰場態勢評估主要包括戰場態勢理解和預測兩大部分,其中的態勢理解是至關重要的環節。
經考證得知,通常指揮員都是分階段、分層次地進行戰場態勢理解,主要體現為:初級理解和高級理解2個步驟,如圖2所示。
依據這2個主要步驟,以戰場態勢理解中判斷敵方對我方可能的主攻方向為例,建立指揮員思維過程模型。
1)初級理解,即對于已完成位置、身份、關聯關系等的估計和數據的一致性融合而獲得的各個戰場目標信息,結合軍事領域相關知識和指揮員的經驗,通過一定的思考,將各個戰場目標進行抽象處理并聚合成一些作戰單元,并從空間分布角度展開研究,從而提煉為圖像矩陣,矩陣中的每個元素即為圖像的像素,通過區分不同像素值來區分各方的作戰單元及背景圖像,同時,劃定戰場中的感興趣區域U(半徑約為R),并選出U內的敵、我雙方不同作戰單元。
2)高級理解,即仍然要結合軍事領域相關知識和指揮員的經驗,通過一定的深入思考來判斷敵方集結區域,我方的重要目標所在位置,以及敵方的主要作戰方向。具體如下。
第1步,利用求解最優化模型獲得敵方的集結區域。一般而言,敵方集結區域是以某點為中心而開展,該集結中心到各個作戰實體的距離應盡可能小以更有利于通信和指揮。假設感興趣區域內敵方有N個作戰單元(假設敵方作戰單元與作戰實體的空間分布密度一致),對應坐標分別為,集結區域V,半徑為R0,中心坐標為(x0,y0),通過求解如下最優化問題來獲得(x0,y0),集結區域直徑與感興趣區域半徑大致相等。
第2步,利用求解最優化模型估計出我方的重要目標區域。一般而言,我方重要目標所在位置的臨近區域內實體數量最多,密度較大,以更有利于提高重要目標的有效生存率。假設感興趣區域內U我方有N'個作戰單元(假設我方作戰單元與作戰實體的空間分布密度一致),對應坐標分別為,,重要目標位置坐標為,臨近區域V'半徑為R'0,V'內含有M'個我方作戰單元,對應坐標分別為,通過求解如下最優化問題來獲得,即
第3步,將敵方作戰實體集結位置與我方重要目標所在位置連成趨勢線,即為敵方對我方可能的主攻方向,直線表達如下公式,方向為從,并以箭頭標出。
依據指揮員戰場態勢理解思維過程和深度學習運行原理[10],本文提出指揮員戰場態勢高級理解思維過程深度學習模擬方法。
以深度學習中經典的卷積神經網絡(Convolution Neural Network,CNN)為例[11],論述利用認知智能模擬指揮員戰場態勢高級理解思維過程。CNN具有強大的圖像處理、圖像信息提取等方面的優勢,更有利于分析戰場態勢圖像中各作戰單元的空間分布和相關特征,從而得出理解結果[12]。基于CNN的指揮員戰場態勢高級理解思維過程模擬方法運行的主要原理是,利用CNN網絡中以卷積函數為基礎的非線性表達能力,依據指揮員的主觀知識和經驗,通過擬合過程建立一個從態勢特征圖像矩陣到指揮員高級理解結果的非線性映射,以得到高級理解結果,從而達到模擬指揮員戰場態勢高級理解的目的,具體論述如下。事實上,這個擬合過程很復雜,具體復雜程度主要與指揮員進行態勢理解判別時的復雜程度密切相關。
假設戰場態勢圖像矩陣SA×B,該矩陣表示在戰場平面上南北LMkm寬、東西LNkm寬范圍內的敵我雙方各作戰單元地理分布情況,SA×B中共有A×B個元素,每個元素為圖像的像素,取值為[0,255]內的整數值,A為緯度方向上的像素個數,B為經度方向上的像素個數,可知
其中,DAkm、DBkm分別為緯度、經度分辨率。
對圖像矩陣SA×B進行綜合處理流程如圖4所示。
其中的歸一化預處理是為了適合深度學習網絡訓練需要統一單位量綱,具體如下。對圖像矩陣SA×B的所有元素,進行歸一化,處理過程如下公式
其中,
對圖像矩陣SA×B進行矩陣卷積運算,即
其中,Fcore為卷積核函數,通常為階矩陣,即
對卷積結果 S'A'×B'進行池化運算,即
值得注意的是:卷積核的個數以及卷積、池化運算次數與戰場態勢高級理解的復雜度密切相關。
指標標簽可通過計算敵方主攻方向直線的斜率,并將斜率值歸類到東、東南、南、西南、西、西北、北、東北這8個方向角度,從而設計出標簽,即,
{東、東南、南、西南、西、西北、北、東北}=
{00000001,00000010,00000100,00001000,
00010000,00100000,01000000,10000000}
輸出層分類器即邏輯分類,用sigmoid函數組(即8個sigmoid函數),每個sigmoid函數表達式為:
可利用0.5為分界值,當P(x)≥0.5時,標簽值為 1,當 P(x)<0.5 時,標簽值為 0。
假設一個戰場環境,首先,通過對戰場目標的抽象、聚合從而提煉獲得圖像矩陣,并節選出一個感興趣區域-1,如圖6所示。通過判斷得出敵我雙方相對位置為敵右我左,然后進行假設感興趣區域-1中敵、我雙方各有50個作戰單元(黃色代表我方、藍色代表敵方),我方、敵方作戰單元像素值分別為100、200,戰場背景像素值為0,利用式(1)~式(3)可得出敵方的集結區域、我方的重要目標區域以及敵方對我方的主攻方向,分別用藍色圓圈、紅色圓圈和帶箭頭的藍色直線標出,如圖7所示,可進一步得出敵方對我方的主攻方向為西北,因此,標簽寫為“00100000”。為更充分地表達樣本的選取情況,在戰場環境中再選出一個感興趣區域-2,如圖8所示,通過計算可得出相關標記(如圖9所示)以及此情況下敵方對我方的主攻方向為西南,標簽寫為“00001000”。由此,本文構造了帶標簽的訓練和測試樣本分別為60萬個和10萬個。
利用本文方法,首先對抽象成的圖像矩陣做歸一化處理,即得到預處理后的樣本數據集,并匹配上相應的標簽。再利用認知智能中深度學習方法進行訓練和測試,每次迭代中的卷積和池化運算為2組,第1、2組中卷積運算的卷積核分別為6、12個,誤差反向傳播算法用梯度下降法。圖10、圖11分別給出了訓練終止誤差、正確識別率隨迭代次數的變化曲線。從圖中可以看出,隨著迭代次數的不斷增加,訓練終止誤差不斷降低、正確識別率不斷提高,當訓練從1代到10代時,正確識別率從70.91%到75.72%,基本在70%多的數量級,誠然,這個結果與樣本數量、訓練中的迭代次數、卷積、池化運算次數等都有關,但已可以證明本文方法的有效性。
本文著眼于當今信息化時代大數據條件下的軍事需求,探索研究了基于深度學習的指揮員戰場態勢高級理解思維過程模擬方法。概述了戰場態勢評估(主要包括戰場態勢理解和預測)的相關概念;分析了指揮員理解戰場態勢的思維模式,以掌握指揮員理解戰場態勢時的主要步驟。在此基礎上,結合深度學習,提出了一種基于深度學習的指揮員戰場態勢高級理解思維過程(以判斷敵方對我方可能的主攻方向為例)模擬方法,針對方法中相關要素的設計問題,本文以CNN為例設計了帶標簽的樣本集構建流程、深度學習網絡的訓練流程等。仿真結果表明,本文方法模擬的正確率可達到75.72%,證明了本文方法的有效性。本文工作僅是對于基于深度學習的指揮員戰場態勢高級理解思維過程模擬方法的探索性研究,進一步的深入工作仍在開展,但也可為開展指揮員戰場態勢理解模擬方面的研究提供新的思路,為開展戰場態勢智能評估分析、輔助決策等研究工作奠定基礎。