涂衛紅, 張建廷
(海軍研究院, 北京 102249)
在作戰體系對抗仿真實驗中,模擬的作戰層次是帶有一定戰術逼真度的戰役行動,通過交互式的離散事件模擬,探索面臨不確定戰場態勢時決策者的行為、網絡化兵力組織運用等方面的能力。為了實現作戰體系對抗的建模與仿真,多智能體(Multi-Agent,MA)的建模技術得到了廣泛的應用[1-3],該技術主要基于復雜適應理論發展起來的,在具體實現過程中從研究個體行為著手,將復雜系統劃分為多個Agent,每個Agent具有各自的模型、數據、規則和接口等,通過對Agent的行為及它們之間的交互關系進行刻畫,以自底向上的方式描述復雜系統的行為,進而獲得系統宏觀行為。在多智能體的作戰體系仿真推演應用領域,尤其是面向網絡中心戰的應用[4],國外已經相繼開發了OneSAF[5]、MANA[6]、SEAS[7]等系統,國內相關方向的研究和應用還處于起步階段,多停留在理論研究層面,存在理論和實踐脫節的問題[8]。
偵察預警系統的仿真,涉及眾多平臺武器系統,不僅包括岸、海、空、天的各型偵察兵力平臺,還包括各種預警探測、情報偵察、指揮控制、通信、數據融合處理等組成的電子信息系統,這些系統之間關系復雜、相互作用明顯、相互制約多、相互影響大,成為構建有效體系仿真實驗環境的主要難題。為此,本文從偵察預警體系仿真的需求出發,采用基于多智能體的建模與仿真方法,建立有效的物理和行為模型,為作戰仿真推演實現提供有效的方法支持。
偵察預警系統仿真的實現基礎是對體系進行有效的描述,描述的過程就是建模過程。偵察預警裝備實體是整個仿真的基本單元,通過建立各種偵察預警裝備的仿真模型和作戰環境、交互關系等模型,模擬作戰環境下裝備體系的能力和檢驗各個裝備對作戰的貢獻率,通過仿真結果輸出數據的統計和分析,最終得到體系的效能評估結果。偵察預警系統仿真的任務需求體現在以下三個方面。
1)過程模擬,既要模擬系統在物理域的變化規律,還要能夠刻畫信息域和認知域,反應作戰系統整體和不同層次的OODA環[9]過程。
2)行為模擬,偵察預警系統表現復雜,體現在兵力個體或多個實體之間的交互或它們的交互所表現出來的宏觀行為,反過來,全局行為又決定了個體進行決策、反應的環境,通過個體的簡單行為,構建復雜全局行為能力,仿真環境需要模擬這種行為關系。
3)物理模擬,對仿真中所需的兵力平臺模型、傳感器模型、網絡模型、信息流模型等進行仿真。
三者關系如圖1所示。
基于MA的建模與仿真的方法實現偵察預警系統仿真,采用相互之間具有復雜交互行為的自治實體對系統進行描述和抽象,建模的重難點可以歸結為兩個方面:體系模型和行為決策模型構建。
體系模型及架構分析主要在Agent仿真方法指導下,對體系中的實體、關系、環境和交互關系進行分析,針對體系層次的能力要求,按照作戰仿真的任務需求,基于效能評估指標和交互關系對體系中涉及的對象、作戰過程、行為關系等要素進行抽象,研究需求的模型類型、組合方法、組成結構關系,形成面向體系仿真需求的元模型,進而利用元模型的實例化,構建仿真實現所需的物理模型基礎。
決策行為模擬主要針對體系對抗仿真中作戰實體的決策行為表示,是信息域和認知域進行有效聯系的基礎,只有將信息優勢轉換為決策優勢才能反映信息化條件下體系對抗的特點,而作戰實體的決策行為表示是所有作戰仿真中需要解決的一個難點。為此必須在仿真中解決Agent的行為描述和行為組合方法,能夠更加自然地表示和快速組合Agent行為。同時,作戰體系對抗模擬中,實體數量規模龐大、實體行為復雜,Agent種類多、交互復雜,需要大規模的計算與仿真。因此,設計合理的Agent行為方案(Course of action,COA)[10]決策模型,提高仿真運行效率至關重要。
通過上述分析,偵察預警系統仿真環境的構建需要解決兩個方面的問題。一是采用多智能體方法,研究多智能體的模型結構設計,包括作戰實體單元的傳感器模塊、通信模塊、行為模塊等模型的組合方法、關聯方法,構建合理的作戰實體結構,保障系統中仿真單元具備目標性和自主行為能力;二是研究系統的決策行為模型,通過有限的狀態變量和態勢事件約束、匹配,依據Agent仿真中活動執行順序進程,對偵察預警相關的信息處理、威脅判斷、決策行動等作戰復雜決策行為過程進行模擬實現。
智能體(Agent)模型在仿真中感知并選擇性地接收環境信息(感應器),根據規則分析做出相應反應的行為(決策器),并根據反饋調整自己的行為和規則(執行器),基于Agent的仿真要素包括任務分配、行為協調及通信、交互機制[11]。體系中的模型組件應當包含物理域組件、信息域組件和認知域組件,根據Agent的基本組成結構:感受器、決策器和執行器,設計偵察預警Agent的物理域組件為感受器和執行器,信息域組件包含信息處理模塊和通信模塊,認知域模塊主要包含決策器。
根據以上分析,結合偵察預警系統的特點,構建仿真系統中的Agent結構模型,如圖2所示。
偵察預警Agent模型的各個模塊的功能設計如下。
1)感受器模塊。依據所搭載的傳感器模塊,對戰場其他實體發出的可探測信號進行偵察,實時感知戰場態勢,并將信息發送到信息處理模塊。
2)信息處理模塊。將感受器傳來的信息,例如目標的點跡、軌跡等信息進行融合處理后,得到情報數據,將情報數據輸出到實體的決策器模塊,或者發送信息到外部通信網絡連接的其他實體節點。3)決策器模塊。對戰場態勢信息(自身獲取或外部傳入)按照戰術表,進行信息的接收、條件判斷匹配和行為方案輸出過程,產生Agent下一步的行動方案。若Agent是指揮節點,則輸出方案為指控命令,若Agent是非指揮節點,則輸出方案為戰術動作。
4)執行器模塊。執行器是Agent的行為輸出模塊,它接收決策器送來的決策信息,并輸出相應的基本戰術動作(如偵察、跟蹤、機動)或協同動作(指揮命令、其他節點的行動方案)。
5)通信節點。與外部通信網絡連接的通信終端模塊,可以設置的網絡類型有廣播終端、點對點終端、移動自組網終端和TCP/IP終端。當節點間有通信鏈路,并處于同一通信模式下時,節點間經由通信網絡進行信息傳輸。
在上述通用偵察預警Agent模型的基礎上,根據仿真中不同的偵察平臺,配置相應的模型參數和功能,例如,不同的傳感器單元、機動能力、作戰空間、通信節點、鏈路連接關系等,生成體系仿真的不同類型Agent實體,進而可以實現體系仿真運行。
作戰體系的對抗性和動態性特征主要依賴于網絡化組織中的各兵力Agent個體行為反應以及相互間的交互實現,各兵力Agent作為網絡中的節點,以通信網絡為基礎,相互之間傳輸戰場態勢信息、指揮控制信息,并依賴于這些信息進行戰術觸發,例如,對特定目標、區域進行特定信號類型的偵察,偵察兵力對目標主動進行跟蹤、定位等。為了在體系仿真中實現偵察預警行為的實施,建立Agent的行為決策模型,本文采用基于戰術表的方法,實現Agent的自行為和交互。
在進行戰術行為決策時,根據戰術表驅動Agent的行為主要遵循“刺激——反應”模式,一般采用“IF<條件>THEN<行為>”的方法來表示,即在滿足一定條件時,Agent做出相應的動作。偵察預警兵力Agent的個體行為是整個作戰仿真系統演化的基礎,Agent通常在受到一定外部條件“刺激”后,在一定的條件約束下完成相應的任務,它的行為要受到必要的限制,以達成對真實作戰過程的模擬,這種限制行為的約束條件在本文中以通用戰術表的形式體現。為了提高仿真的效率,采用兩類戰術表來表示整個仿真過程的戰術行為,分別是作戰指揮Agent戰術表和平臺Agent戰術表。
作戰指揮Agent戰術表,主要用于搭載了作戰指揮任務的Agent節點上,根據戰場態勢(敵情、我情和環境等)控制其他Agent執行戰術任務,是整個戰場態勢的全局決策者和控制者。平臺Agent戰術表與作戰指揮Agent戰術表不同的是在輸出行為控制條件過程中,其戰術行為控制只對自身起作用。
戰術表的主要處理流程分為三個階段:1)輸入觸發條件;2)戰術使用限制條件;3)輸出行為控制條件。此外,對于同一戰術表中,設計多個不同的應對戰術,通過決策輸出檢查,對各個戰術最后依據優先級順序進行判定,選擇優先級高的作為本次戰術輸出。戰術表的實現流程如圖3所示。
在仿真過程中,當有平臺傳感器獲取目標信息(運動或軌跡)后,信息在網絡中傳輸到指定的節點,該節點就會觸發戰術響應,輸入觸發的條件主要分為三類:
1)目標軌跡類型,分為太空、空中、陸地、水面和水下;
2)威脅分類,主要是目標的敵我屬性,包括友方、敵方、中立和未知;
3)軌跡戰術識別,目標的平臺屬性類型,例如戰斗機、水面艦船等。
當輸入信息滿足戰術觸發條件后,就要判斷戰術使用的限制條件進行檢查,主要有以下4類:
1)時間使用限制,包括開始、結束時間限制,想定設計階段的限制;
2)信息不確定性限制,表示目標信息來源的誤差,例如目標信息中的位置判定不確定區域、速度不確定值等;
3)目標運動限制,指目標的速度、相對航向在一定范圍時,戰術才有效;
4)使用位置限制,指目標與戰術實施平臺的相對距離、方位,或位于指定區域時,戰術才能夠執行。
對于平臺Agent戰術表,主要有:
1)跟蹤探測類型,指目標體現出來的可以被探測的信號類型,例如通信、電磁、紅外等,用于指定所使用的跟蹤傳感器;
2)平臺當前狀態,指戰術觸發時平臺的狀態,例如巡邏、行駛、被引導等;
3)戰術行為控制,指平臺對當前目標執行特定任務,例如報告軌跡,電子戰攻擊和激活傳感器等;
4)機動行為控制,指平臺向著目標進行自引導,實施規避,設定規避速度和距離控制等。
對于作戰指揮Agent戰術表,主要有:
1)跟蹤探測類型,與平臺Agent戰術表一致;
2)戰術行為控制,戰術響應方式,控制被指揮平臺對目標進行查證、定位、跟蹤、搜索、監視等任務;
3)機動行為控制,根據目標平臺運動介質,進行合理的規避距離、高度控制,以及執行任務過程中的盤旋、機動方式等進行控制;
4)探測能力要求,執行任務的平臺應當至少滿足一種探測能力,執行或的邏輯運算關系,同時,可以對平臺的分類識別能力進行指定,這樣可以實現對目標使用不同平臺不同傳感器同步查證的目的。
綜上,戰術表的本質是感知戰場態勢,然后將感知到的戰場態勢與規定的戰術條件進行匹配,根據匹配結果做出決策的一種靈活的、自動的作戰規則集合,戰術表的作用流程如圖4所示,其中的觸發戰術判斷采用本節戰術表設計方法和圖3所示流程方法。
本文介紹的偵察預警系統模型,采用C++語言開發的多Agent偵察預警仿真模塊,已經集成到某海上對抗仿真系統中,對文中所提出的多智能體模型和戰術決策模型進行仿真驗證。以海上紅藍雙方對抗過程為例,Agent模型包括衛星、艦船、偵察預警飛機以及其上搭載的傳感器及通信模塊等,其中整個偵察預警戰術響應按圖4所示流程進行判斷和戰術觸發。
通過紅藍雙方編隊及空中兵力的偵察預警活動推演,驗證本文方法設計的多智能體系統的仿真有效性,想定中,紅方按照由遠及近、由粗到細對目標進行發現、查證和跟蹤識別等戰術響應。作戰仿真中的紅方對藍方的自動偵察預警行動效果如圖5所示,當紅方發現目標后,按照設定的戰術,自動觸發相應作戰實體的偵察預警行為。圖6為整個仿真過程中衛星和艦載無人機發現目標隨時間的次數分布。
仿真初始階段,由發現距離遠但精度低的偵察平臺(衛星、預警機等)發現目標,然后將信息共享,觸發戰術響應,引導探測距離近但精度高的平臺(戰術偵察機、無人機等)進行抵近查證、跟蹤和監視,圖6的結果中0到40小時的目標發現主要由衛星等遠距離偵察平臺實施,而整個仿真的后續階段偵察任務主要由探測精度高的近距離偵察平臺負責,仿真中所設計的多智能體能夠有效進行協同偵察和戰術觸發,并且正確觸發各種敵情態勢下的偵察預警戰術,實現了對作戰體系對抗推演和實兵演示驗證等應用的支撐。
本文詳細描述了采用多智能體的偵察預警系統的建模和仿真方法,主要面向作戰對抗推演應用。研究了偵察預警實體單元的Agent建模方法,通過多模塊組合設計方法,抽象出偵察預警的通用模型,其他不同的實體建模可以依據此模型進行定制和修改;提出基于戰術表驅動的決策行為模型,實現了Agent的決策行為表示,通過有限的狀態變量和態勢事件約束、匹配,依據Agent仿真中活動執行順序進程,對偵察預警相關的信息處理、威脅判斷、決策行動等作戰復雜決策行為過程進行了模擬實現,設計的戰術表通用性強,計算簡單,仿真運行效率高。但本文設計的智能體的行為決策屬于容易實現的條件觸發方法,具體應用中需要大量的作戰條令、專家經驗庫等支撐,后期研究可以考慮引入人工智能等方法,增強Agent的智能化和逼真性。