曹朋飛 邸彥強 孟憲國 張陽



關鍵詞:虛擬兵力仿真;計算機生成兵力;模型建模;數字孿生
當前,虛擬兵力仿真已成為裝備建設、作戰研究、軍事訓練等領域,基于模擬仿真方法開展裝備論證、作戰運用、軍事訓練、裝備保障、試驗鑒定等活動的一項基礎性工作。平臺級實體虛擬兵力仿真的核心是對裝備平臺(單兵)動作、分隊行動和戰術運用的建模與仿真,構建平臺級實體虛擬兵力仿真系統,為開展對抗式模擬訓練條件建設、作戰實驗條件建設等提供有力支撐,為紅藍對抗條件下開展模擬訓練與推演提供保障,提升訓練、實驗的實戰化與真實感。
平臺級實體虛擬兵力仿真研究屬于典型的計算機生成兵力(Computer Generated Force,CGF)研究,研究對象為平臺級兵力實體及其作戰運用。因此,研究內容既涉及多種類型裝備的機理仿真,具有機、光、電、液等多學科多專業工程仿真特征,又涉及不同作戰行動的仿真,具有典型的戰術仿真特征。此外,還涉及戰術行動決策行為的仿真,需要智能仿真算法的支撐。虛擬兵力在人機對抗式模擬訓練中多采用LVC混合式仿真系統形態與模擬訓練系統互聯對抗,起到兵力補足以及作戰支撐的作用。基于此,以下分別對CGF系統及其仿真平臺、虛擬兵力實體建模方法,以及CGF在多態仿真系統構建中的應用和關鍵技術進行梳理和總結,為構建虛擬兵力模型體系以及虛擬兵力仿真系統奠定基礎。
1CGF系統及其仿真平臺
美軍于20世紀80年代開始對CGF相關技術進行研究,開發了一系列的CGF系統。ModSAF(Modular Semi-Automated
Forces)是其最早研發的CGF系統之一,主要用于輔助軍隊進行戰場訓練、試驗和測試,具有較強的擴展性。該系統可支持單兵、連排級作戰單元以及武器系統的模型建模,系統中CGF實體模型由物理模型和行為模型組成,物理模型基于動力學建模,行為模型采用有限狀態機(Finite State Machine,FSM),基于系統內任務(Task)的概念,完成作戰行動的仿真。
基于ModSAF的架構,美軍相繼研制了美軍近戰戰術訓練系統(Closed
Combat
TacticalTrainer, CCTT)的SAF和JSAF(Joint SAF).其中CCTT SAF是針對CCTT系統為虛擬戰場提供計算機生成的作戰實體或單元,與ModSAF相同,該SAF系統可支持平臺級和聚合級實體的仿真,同時采用FSM對實體行為建模,區別是其行為嚴格基于作戰規則集CIS建模且僅為CCTT系統服務,因此擴展性較差。JSAF采用任務和認知架構對其中的虛擬兵力進行建模,通過事件驅動行為過程,可對海陸空等多種兵力進行仿真模擬,具有良好的擴展性。
OneSAF集成了美軍已開發的不同系統中的SAF模型功能,是一個可重組的、新一代的CGF系統,可適應多種仿真層級,支持不同領域的建模與仿真。該系統盡可能考慮了建模與仿真領域的各種需求,采用異步增強FSM建模方法,可支持從單兵到旅級規模作戰兵力的仿真,是美軍CGF未來的發展方向。
以上CGF系統均屬于半自主兵力系統,該類CGF系統能夠描述底層的兵力行為,對于高層次的組織決策行為,需要真實操作人員通過人機接口協助完成。
相對于半自主兵力系統,美軍基于Agent的思想構建了一些自主兵力系統,如IFOR (Intelli-gent Forces)、CFOR(Command Forces)等。IF-OR是基于Soar體系結構所構建的智能兵力模型,主要為空軍戰術仿真建立了自動的智能A-gent。該系統基于規則和目標驅動,通過產生式規則實現態勢評估、行為規劃等智能行為建模。在該系統框架基礎上又分別設計了FWA-Soar和RWA-Soar系統,分別用于固定翼飛機和直升機作戰行為的仿真,在STOW(Syntactic Theater ofWar)計劃中取得成功應用。
CFOR項目與IFOR相同,同屬STOW計劃的一部分,該系統能夠抽象出具有指揮能力的實體來負責戰場的指揮控制,其指揮實體模型基于指揮控制仿真接口語言(Command and Control Simu-lation Interface Language,CCSIL)描述其指揮行為,可以實現與指揮有關的決策、規劃等認知過程,屬于完全自主的兵力,美軍CGF系統對比如表1所示。
在國內,北京航空航天大學研發了空中威脅CGF系統、地面威脅CGF系統以及通用型計算機生成兵力系統AST-CGF,構建了智能數字飛機模型、地面雷達模型、地對空導彈模型、高炮模型等。陸軍工程大學針對防空裝備、炮兵裝備構建了CGF系統,已成功應用于模擬訓練之中。此外還有裝甲兵工程研究所的裝甲兵CGF系統、軍事科學研究院的指揮決策CGF系統等。
除了CGF系統,還有許多成熟的商業化仿真平臺用于虛擬兵力開發和仿真,如STAGE、MAKVR-FORCES、MAXSIM、EADSIM、XSIM等,各仿真平臺的主要用途以及仿真層級如表2所示。
2虛擬兵力實體建模方法
虛擬兵力實體建模主要針對作戰實體及編隊在進攻、防御、抗擊等典型作戰行動中的行為模型進行建模以及對當前態勢下的行為決策模型進行建模,一是建立實體和編隊的戰術行動模型,二是建立面向不同戰場態勢的行動決策模型,最終實現紅藍雙方虛擬兵力模型的自主對抗。平臺級實體虛擬兵力模型的建模通常包含物理模型建模和行為模型建模,其中物理模型建模是指對實體的物理特性進行建模,為實體行為提供基礎支撐。行為模型建模是對實體的感知、推理、決策規劃以及學習等行為進行建模,其建模程度體現了CGF的智能性。
2.1實體物理模型建模
實體物理模型建模主要包含實體的機動模型、傳感器模型、通信模型、干擾與抗干擾模型、彈道模型、殺傷模型等模型建模,描述實體自身的物理特性,往往通過構建其數學模型進行建模。如實體的機動模型建模針對各裝備實體在不同地理環境下運動的過程進行建模,包含單個實體的機動過程、多實體編隊的形成與保持以及隊形變換等。根據應用場景不同,對實體物理模型分辨率的要求不同。對于作戰訓練,需要大量實體參與仿真,為了滿足其實時性,通常構建較為簡化的物理模型,即交戰級分辨率的仿真模型;對于裝備仿真試驗、裝備性能分析評估等,對實體分辨率要求較高,需與機、光、電、液等多學科多專業結合構建工程級分辨率仿真模型。因此建立兼容交戰和工程兩級分辨率的仿真模型框架,面對不同需求能夠自適應選擇適當的分辨率等級,以構建更加靈活的使用模式,是虛擬兵力建模與仿真的一個研究方向。
2.2實體行為模型建模
實體行為模型建模是對實體的智能行為進行建模,包含態勢感知、決策、規劃、記憶與學習以及協同等方面行為模型建模,是構建CGF的核心任務。CGF中實體的行為模型建模方法一直處于發展之中,與人工智能的發展聯系密切,如基于規則的有限狀態機、行為樹以及規則系統等建模方法,此類方法較為成熟且已應用于多種仿真系統,但該類方法基于已知的規則進行建模,存在規則建模有限性問題,無法處理規則之外的行為。
隨著人工智能的發展,將進化算法(Evolu-tionary Algorithms,EA)、群體智能優化算法(Swarm Intelligence Algorithm,SIA)、退火算法(Simulated Algorithm,SA)、爬山算法(HillClimbing,HC)等啟發式方法引入作戰行為模型建模與仿真。該類方法基于直觀或經驗建模,在預計時間內以求得最優行為決策,其實質上是一種貪心策略,其結果常常會陷入局部最優,且耗時較長。基于尋優思想的方法還包含線性規劃、動態規劃等可求得絕對最優解的算法和基于博弈論相關理論的博弈算法,由于此類算法計算量巨大,因此只適用于小規模問題,很少應用于工程中。此外將概率理論應用于CGF中的行為模型建模可對其不確定的知識的表達和推理過程進行建模,如CGF的決策過程等,貝葉斯網絡(Bayesian Net-works,BN)是該思想的典型方法。
基于Agent和多Agent的行為建模方法是CGF行為模型建模領域研究的熱點,該方法基于心智狀態BDI(Belief,Desire,Intention)對戰場智能體的綜合能力進行建模,旨在構建具備自治性、反應性、社會性和主動性的智能仿真實體,當前該方法還在發展中。與該方法相似的是國防科技大學提出的SCP(Sensor Controller Performer)模型,該模型依據控制論的思想從控制系統角度抽象出了實體的行為機構,使虛擬實體對象具備了一定的自主性和獨立性,可實現連續和較為復雜的行為。與基于Agent和多Agent的行為模型建模思想相比,SCP具有完整的概念定義、理論體系與方法論。在此基礎上,國防科技大學進一步提出了ESCP模型和GSCP模型,前者對單個實體中各組成部分的并發行為進行了優化,后者結合控制論和群體智能思想,使得該模型支持對群體兵力間的協同行為。
近兩年,隨著機器學習的迅猛發展,相關領域學者開始將強化學習應用于行為模型建模中并取得了一定的成果。如文獻[21]將MAXQ與傳統的行為樹相結合,對行為樹中的選擇節點進行了優化。將深度學習與強化學習相結合所形成深度強化學習算法應用于行為建模中以提高仿真實體的智能性是當前研究的熱點,典型的算法有DQN(Deep Q-Network)、DDPG (Deep DeterministicPolicy Gradient),A3C( Asynchronous
AdvantageActor-Critic)等。在文獻[22]中,作者對DDPG算法進行了優化,提出了MADDPG算法用于空戰策略生成方法,提升了空戰策略的智能化水平。針對虛擬兵力行為仿真過程中所遇到的不同問題,采取的建模方法也有所不同,對各種建模方法進行總結,如表3所示。
3計算機生成兵力在多態仿真系統構建中的應用與關鍵技術
計算機生成兵力在軍事訓練中有兩種典型應用,一是以構造式仿真系統形態,不同虛擬兵力間進行自主對抗,按照想定和作戰方案推演,主要用于指揮訓練和作戰實驗;二是以LVC混合式仿真系統形態,與模擬訓練系統互聯對抗,主要用于人機對抗式模擬訓練。對于后者,一是解決構造仿真模型和虛擬仿真模型間的互操作,二是實現虛擬兵力仿真系統與模擬訓練仿真系統的互聯互通,構建分布式的異構對抗訓練仿真系統。其中主要涉及分布式系統架構、各級模型間的互操作和系統互聯等關鍵技術。
3.1軍用仿真系統形態與分布式系統架構
軍用仿真系統形態可分為真實仿真、虛擬仿真和構造仿真,簡稱LVC(Live Virtual
Construc-tion),其中真實仿真(L)是作戰人員操作真實的裝備系統在逼真的訓練環境中進行仿真,如軍事演習;虛擬仿真(V)是作戰人員通過操作裝備模擬器進行仿真,如人在回路的模擬訓練;構造仿真(C)是虛擬人操作虛擬裝備在虛擬環境中進行訓練,如CGF系統。
在訓練仿真領域,早期的仿真系統多為針對某裝備技能訓練的模擬器系統。隨著軍事需求的發展,未來聯合作戰呈現出參戰力量多元、戰場空間多維和作戰行動多樣等特點,因此產生出“LC”“VC”“LVC”等多種形態架構的仿真系統以適應訓練的需要。如圖1所示,“LC”仿真系統形態架構為真實仿真與構造仿真相結合,如美軍在2016-201 8年度SLATE-ATD項目中,通過SLATE吊艙掛載到實裝飛機中實現虛擬兵力的注入,通過5G信號與虛擬兵力進行互連互操作,驗證了美軍現有戰斗機和模擬器加入LVC的能力,以評估SLATE對于空戰訓練的技術可行性、作戰適應性和經濟承受能力[26]。“VC”仿真系統形態架構為虛擬仿真與構造仿真相結合,如陸軍工程大學建設的旅級規模模擬訓練系統是典型的“VC”仿真系統形態。“LVC”仿真系統形態架構為真實仿真、虛擬仿真以及構造仿真三者相結合,基于LVC架構的仿真系統不受地理環境限制,能夠解決實裝訓練中經費、地域、演習頻率等問題。典型的應用有美軍的“紅旗”軍演、“北方利刃”(Northern Edge)、“虛擬旗”(Virtual Flag)等。
3.2面向服務的構造式仿真系統虛擬兵力對抗
傳統上,構造式仿真應用系統大多采用桌面軟件形式,與作戰指揮仿真系統、裝備論證仿真系統、仿真推演系統等關聯,開展完整的作戰仿真過程,如OneSAF、VR-FORCES、XSIM等虛兵仿真平臺都采用這種形式。隨著面向服務、業務中臺等思想和技術的發展,基于微服務的形式和軟件治理體系,基于云計算、容器的虛兵服務系統是當前的一個研究熱點。
面向服務的體系結構(Service-Oriented Ar-chitecture,SOA)能夠有效提高仿真系統的可擴展性,降低系統集成難度,提高仿真資源的可重用性,文獻[27]中李伯虎團隊首次提出了“仿真網格”,它是一種新型的分布協同仿真系統,該系統基于SOA思想將仿真資源服務化,形成了“云仿真”的雛形。文獻[28]基于“仿真網格”的研究成果,提出了一種基于云計算理念的網絡化建模與仿真平臺,即“云仿真”平臺,同時提出了“云仿真”模式,能夠為用戶提供各種建模與仿真服務,為后續研究打了基礎。文獻[29]中針對SaaS(Software as a Serv-ice)存在的弊端,提出了一種IaaS(Infrastructureas a Service)模式的“云訓練”,該模式采用“中心一終端”結構,以桌面云技術為依托,為用戶提供基礎軟硬件資源等訓練服務.為面向服務的虛兵服務系統提供了一種新思路。隨著微服務與容器等新技術的出現與發展,基于微服務的新型建模仿真架構具備更強的仿真資源互操作性、可重用性與可組合性,是構造式仿真系統未來的一個發展方向。
3.3VC形態的仿真系統兵力成體系仿真
VC形態的仿真系統在兵力成體系仿真中通常采用分布式架構,通過分布交互仿真技術將各虛擬仿真系統與構造仿真系統互聯起來,實現多態異構系統間的互通、互聯與互操作。目前,分布交互仿真體系結構主要有分布交互仿真技術體系(Dis-tributed Interactive Simulation,DIS)、建模與仿真高層體系(High Level Architecture,HLA)、試驗與訓練使能體系(Test and Training Enabling Ar-chitecture,TENA)以及多技術體系的混合體系。
DIS通過協議數據單元(Protocol Data Unit,PDU)實現了不同模型間的信息交換,解決網絡仿真研究計劃中各平臺級對象在互聯互操作上出現的問題。該體系結構簡單、易于實現,但該結構僅支持同類功能仿真應用間的互聯互操作,存在交互不完備、適應性較弱等缺陷。
基于DIS的缺陷,HLA為聯邦成員制定了標準的對象模型模板(Object
Model
Template,OMT),其聯邦成員間通過標準的接口進行互操作。HLA-OMT定義了聯邦對象模型(FederationObject Model,FOM)和成員對象模型(SimulationObject Model,SOM),采用聯邦執行數據交換格式(Data interchange format,DIF)作為交換標準,為聯邦成員提供了公共的數據約定。隨后基于該公共對象模型存在的問題進行改進,發展出基礎對象模型(Base Object Model,BOM)和HLA EvolvedModular OMT技術,提高了仿真模型的重用性和互操作性,使得HLA實現了應用層和底層支撐環境的分離、仿真系統即插即用以及按需進行聯邦的組合配置,但該體系不適用于對實時性要求較高的硬實時應用環境。
TENA是一種更加開放的技術體系,主要應用于裝備試驗和訓練領域等對實時性要求較高的硬實時應用環境。該體系采用邏輯靶場對象模型(Logical Range Object Model,LROM)實現了不同系統之間的模型互操作。LROM使用統一建模語言UML和TENA定義語言TDL對邏輯靶場的接口和協議進行封裝,為靶場中的各種訓練資源提供了公共的通信語言,提高了試驗和訓練領域資源的互操作性、重用性和可組合性。
多技術體系的混合體系結構憑借其良好的擴展性和靈活性已成為美軍構建LVC訓練環境的主要體系架構,該體系架構保持各系統中原有體系,通過公共對象模型和公共網關實現異構系統間的互聯、互通與互操作。如美軍“MC2002”演習中所用到的JLVC聯邦環境使用了DIS、HLA、TE-NA等多種技術體系,實現跨地域、跨機構模擬系統的互聯互操作。
3.4LVC形態仿真系統的孿生戰場環境構建
隨著網絡化、信息化、智能化的加速發展,將數字孿生與虛擬兵力相結合,應用于LVC仿真形態下的對抗式訓練中,構建基于LVC的孿生戰場環境進行紅藍對抗訓練是當前的一個研究熱點,其仿真架構如圖2所示。在該架構中,CGF有兩種應用形式,分別為CGF仿真平臺中的CGF實體和平臺級虛擬兵力系統,前者一方面起到兵力補足的作用,另一方面為平臺級虛擬兵力系統提供模型解算服務;后者提供兵力映射和裝備動作展示等功能,作為半實物模擬器和實裝的孿生虛兵系統,在統一戰場環境服務器、統一時鐘服務器和狀態同步服務器支撐下,其裝備動作狀態與半實物模擬器、實裝保持一致,能夠更好地展現對抗式訓練過程。
4結論
對于CGF系統與虛兵仿真平臺方面,第一,各研究單位相對獨立,研發了各自的CGF系統,但由于無統一標準,各CGF系統間無法交互或重用,限制了CGF系統與仿真平臺的發展;第二,系統中模型精準度不足,對模型的校核與驗證不夠充分,尚不能應用于實戰。基于此,一方面針對虛兵仿真相關標準進行研究,如實體模型標準以及系統間交互協議標準等;另一方面應整合現有資源,基于標準構建領域內通用CGF仿真平臺,平臺間能夠互聯互操作,最終用于實戰化推演。
對于虛兵模型建模方面,第一,平臺級實體物理模型構建應結合機、光、電、液等多學科多專業,確保模型的精準度與可靠性。在保證模型精準度與可靠性基礎上可根據應用環境不同,構建滿足工程級、交戰級等需求的多分辨率模型。第二,當前學者主要聚焦將機器學習方法應用于虛兵實體行為建模,以提高實體行為智能性,但對于作戰訓練,單純的機器學習方法所構建出的行為模型難以解釋,與作戰規則或真實作戰行為還有差距。采用多方法混合可較好地修正這個問題,如將深度強化學習算法應用于行為樹等可解釋的建模方法,在遵循作戰規則基礎上對其缺陷進行優化,構建可解釋、貼合實際作戰的虛兵實體行為模型。第三,應重視對虛兵模型的校核、驗證與驗收(VV&A),以確保模型的正確性與可靠性。
在應用方面,第一,將虛擬兵力仿真資源服務化,構建基于云計算、容器的虛兵服務系統,以提高系統仿真資源的可重用性與可組合性,同時滿足異地訓練需求,是當前研究的方向之一;第二,在多體系多兵種聯合作戰背景下,將數字孿生技術應用于虛擬兵力仿真,構建LVC形態的孿生戰場環境,并將其應用于作戰訓練是虛擬兵力仿真應用的另一個研究方向。