高 飛
(北京西三環(huán)中路19號 北京 100841)
現(xiàn)代艦船的指控系統(tǒng)具有戰(zhàn)場信息一體化、戰(zhàn)場作戰(zhàn)節(jié)奏快、戰(zhàn)場更加非線性等特點,其作戰(zhàn)指揮復雜,難度大,是一個復雜的大系統(tǒng),智能體(Agent)是分布式人工智能研究的一個重要分支,其目標是將復雜的大系統(tǒng)分解成彼此相互通信、協(xié)調(diào)、易于管理的小系統(tǒng)[1]。此外Agent還具有適應性、自主性、靈活性、協(xié)作性的特點。將多Agent(MAS)技術引入指控系統(tǒng),可以大大提高指揮系統(tǒng)的整體效能,為指控決策系統(tǒng)的改進提供有效的途徑。
MAS是由多個可執(zhí)行網(wǎng)絡計算的Agent組成的集合。每個Agent被認為是一個物理的或抽象的實體[2~3]。在網(wǎng)絡中,每個 Agent都是自治的,能作用于環(huán)境和自身,能對環(huán)境的變化做出反應,并能與其它Agent通信、交互,彼此協(xié)同工作,完成共同任務。MAS具有的自治性、分布性、協(xié)調(diào)性等特點,并具有自組織能力、自學習能力和推理能力,有利于構建具有較強的魯棒性和可靠性的協(xié)同指揮控制系統(tǒng)。智能體間的通信、合作、互解、協(xié)調(diào)、調(diào)度、管理及控制,可以很好地體現(xiàn)指控系統(tǒng)對體系結構、功能及行為特征的技術要求。其結構如圖1所示。

圖1 Agent與MAS結構圖
在智能體的劃分中,粒度的選擇是第一步,粒度過大和過小都會造成問題。粒度小,系統(tǒng)中Agent數(shù)目太多,其組織與控制復雜度就會增加,通信負載重,運行效率低;粒度大,系統(tǒng)不僅靈活性差,而且降低了系統(tǒng)的并行性。粒度選擇適當,系統(tǒng)結構簡單,管理和控制容易,靈活性和適應性也增強。
智能體劃分過程基本分為6個階段[4~5],在邏輯上形成一條流水線:1)抓住目標,將最初的系統(tǒng)定義轉(zhuǎn)化為結構化、層次化的系統(tǒng)目標。2)應用用例,根據(jù)最初的系統(tǒng)說明創(chuàng)建用例圖和順序圖。用例圖表示了系統(tǒng)中不同角色之間的邏輯交互路徑。順序圖用來確定系統(tǒng)中角色之間必須傳遞的最小數(shù)量的消息。3)提煉角色,建立負責完成第一步中定義的目標的角色。通常每個目標分別由一個角色來完成,但是一些相關的目標也可能映射到同一個角色。和角色一起建立一個任務集合,定義角色如何來實現(xiàn)目標。任務定義為狀態(tài)圖。4)建立主體類[6],在主體類圖中把角色映射到主體類。5)用協(xié)作圖和活動圖表示主體間的交互。6)利用活動圖和狀態(tài)圖表示主體內(nèi)部的處理過程。
基于以上的分析,按照艦船指控系統(tǒng)體系結構,其智能體可劃分為三類:管理類Agent、通信服務 Agent、業(yè)務類 Agent[7~8]。每一類還有細分類別,其細分方法如圖2所示。

圖2 艦船指控系統(tǒng)Agent劃分方法
·界面Agent:負責提供界面友好的人機交互系統(tǒng)。當用戶需要獲取決策生成方案時,能夠主動提供服務,友好地顯示給用戶。
·用戶Agent:用于記錄軟件登錄時的用戶信息。
·權限控制Agent:根據(jù)用戶登錄軟件時的身份控制對數(shù)據(jù)訪問的存取權限。
·綜合管理Agent:是系統(tǒng)的核心,負責管理調(diào)度其他Agent主體的行為,負責啟動或掛起某個Agent的工作過程,并在規(guī)則庫中保存多個Agent個體之間可能的協(xié)作方式。
·信息接收Agent:負責接收上級、友鄰、警戒雷達、搜索雷達等發(fā)送的信息。
·信息預處理Agent:主要完成數(shù)據(jù)抽取功能。由于戰(zhàn)術指揮系統(tǒng)中情報數(shù)據(jù)量大,且這些數(shù)據(jù)中可能含有虛警信息、錯誤數(shù)據(jù)、噪聲等,因此需要進行去偽存真,等對經(jīng)過信息預處理的數(shù)據(jù)進行信息融合處理。
·信息融合Agent:結合傳感器特性、地理位置信息等對經(jīng)過信息預處理的數(shù)據(jù)進行信息融合處理。
·態(tài)勢處理Agent:自動感知外部環(huán)境變化,實時顯示戰(zhàn)場統(tǒng)一態(tài)勢,為指揮員決策提供參考。
·威脅估計Agent:負責戰(zhàn)術指揮控制系統(tǒng)中目標威脅估計判斷,自動感知外部環(huán)境的變化,根據(jù)相應的模型算法調(diào)整目標威脅度。
·目標分配Agent:負責根據(jù)保衛(wèi)目標、空情數(shù)據(jù)、陣地配置信息等,結合登陸席位信息調(diào)用相應知識庫、數(shù)據(jù)庫、推理機,自動生成目標分配方案。
·數(shù)據(jù)分發(fā)Agent:負責對信息融合處理之后的數(shù)據(jù)按照一定的規(guī)則進行推理,并向相應節(jié)點分發(fā)數(shù)據(jù)。
·通信服務Agent:通信服務Agent負責處理各類Agent通信信息,為系統(tǒng)中的Agent提供和外界交互的統(tǒng)一接口以及交換信息和知識的途徑。
基于MAS技術的指控系統(tǒng),整個作戰(zhàn)過程是連續(xù)的、動態(tài)實時變化的,各模塊之間相互協(xié)調(diào)共同完成指揮決策任務。基于MAS的指控系統(tǒng)可以根據(jù)不同指揮員的特點產(chǎn)生具有個性化的目標分配方案,綜合管理Agent根據(jù)協(xié)商策略、原則等形成最終的指揮決策建議,輔助指揮員進行正確指揮。工作流程如下:
1)系統(tǒng)運行初始化時,各類Agent都向綜合管理Agent進行注冊,將自己的有關信息(名字、地址、能力等)向綜合管理 Agent登記[9]。
2)信息接收Agent實時接收各類目標信息,由信息預處理Agent根據(jù)規(guī)則(如距離、速度等判據(jù))對數(shù)據(jù)進行初步的處理,信息融合Agent對于處理之后的信息作融合處理,形成最終的戰(zhàn)場情報信息。
3)態(tài)勢處理Agent根據(jù)信息融合Agent處理之后的信息,結合陣地配置Agent產(chǎn)生的陣地配置信息、保衛(wèi)目標、敵軍信息等實時并動態(tài)地顯示戰(zhàn)場綜合態(tài)勢信息,根據(jù)自身的知識庫、約束等去推理判斷,推斷出敵軍的主攻方向。
4)威脅估計Agent自動感知戰(zhàn)場的態(tài)勢變化(目標信息、配置信息),結合指揮員的偏好、具體指控原則進行推理與自學習,給出目標威脅度信息。
5)目標分配Agent利用威脅估計Agent產(chǎn)生的威脅度信息、態(tài)勢處理Agent產(chǎn)生的戰(zhàn)場綜合態(tài)勢信息結合具體指揮員的指揮偏好,按照指控中目標分配原則等進行推理,產(chǎn)生分配方案。在每次的決策過程中都對指揮員的指揮偏好進行自學習。如果存在兩個指揮員,同時存在的兩個目標分配Agent將根據(jù)他們的不同用戶身份按照指揮作戰(zhàn)中的約束與規(guī)則進行協(xié)商決策。
通常,一個作戰(zhàn)任務可由如下多元組描述:
Task=<ID,Agents,subtasks,supertasks,arriv?al_time,starttime,endtime,quality,duration,cost,utility,condition>。
其中,ID是作戰(zhàn)任務的序號,它是唯一的編碼;Agents是任務涉及到的智體,subtasks是子結點任務;supertasks是戰(zhàn)術總?cè)蝿眨籥rrival_time是任務到達的時間;starttime是任務的最早開始時間;end?time是任務的最遲完成時間;quality任務涉及的數(shù)量;duration是任務涉及的周期和階段;cost是任務涉及的成本;utility是任務涉及的效用;condition是任務完成的約束條件。
描述智能體集合和具有的領域知識如下:
假定編隊多指揮Agent系統(tǒng)中有作戰(zhàn)智能體集合A={a1,a2,…,an},ai表示第i個指揮或協(xié)同智能體。
Ki={Ki1,Ki2,…,Kim}表示第i個資源智能體在某一方面所具有的能力(如探測性、打擊等)。
KA=∪i=1…nKi表示所有資源智能體具有的能力。
當有任務T需要完成時,解決它需要用到的能力為KT={KT1,KT2,…,KTs}時,有分解過程:
1)當KT∈Ki且 ai∈A時,任務T能被單一的指揮Agent解決,而不需要分解。
2)當 KT∈KA但對于所有的 ai∈A,不能得到KT∈Ki,則任務T必須分解,需要協(xié)同,或滿足如下條件時必須協(xié)同交由協(xié)同控制Agent進行協(xié)同。
(1)1個Agent無法完成任務,必須協(xié)同作業(yè)合作完成,如時間、資源等約束無法獨立完成。
(2)1個Agent能完成任務但耗費高,效用低,有其它Agent協(xié)同能減低成本提高效用。
3)當需協(xié)作時,則將協(xié)作任務交由協(xié)同控制Agent根據(jù)任務所缺能力來尋求最佳協(xié)同作戰(zhàn)單元。
4)與協(xié)同單元進行交互協(xié)商,友鄰同意協(xié)同后并根據(jù)一定的完成任務的約束評價協(xié)同效益,制定協(xié)作計劃。否則將協(xié)作需求經(jīng)指揮Agent報告上級,由上級調(diào)整計劃或?qū)嵭忻顝娭茍?zhí)行。
5)實時監(jiān)控任務的執(zhí)行,檢測任務協(xié)同執(zhí)行中是否有火力、頻譜等沖突的出現(xiàn),并提供消解策略。
任務分解和協(xié)同計劃完成后進行任務分配與執(zhí)行,明確任務之間的約束關系,以表的方式存儲在系統(tǒng)數(shù)據(jù)庫中,進行指揮決策過程的學習,并實時根據(jù)戰(zhàn)場態(tài)勢和作戰(zhàn)命令實時進行任務調(diào)整。
結合艦船指揮控制結構和MAS系統(tǒng)特性[10~11],為適應現(xiàn)代海戰(zhàn)場態(tài)勢的多變性,及時應對各種變化,給出基于多Agent的指控系統(tǒng)結構如圖3所示,其主要模塊功能如下。

圖3 基于多Agent的指控系統(tǒng)結構
1)通信模塊通信模塊主要是負責CA與外部的通信聯(lián)絡,如指揮命令的上傳下達、同級協(xié)同、戰(zhàn)場信息共享等;
2)感知模塊主要感知戰(zhàn)場環(huán)境的變化;人機接口負責作戰(zhàn)決心和新作戰(zhàn)計劃,情報等信息的錄入和人干預作戰(zhàn)過程,并將以上結果傳給信息處理模塊和規(guī)劃決策模塊。
3)信息處理模塊信息處理模塊接收來自感知模塊及通信模塊傳來的信息,包括語音指揮信號、戰(zhàn)場態(tài)勢等其他戰(zhàn)場信息,然后將其進行融合、分類處理,使用時空對準、航跡互聯(lián)、證據(jù)理論等傳統(tǒng)融合算法和現(xiàn)代神經(jīng)網(wǎng)絡、模糊理論、支持向量機、聚類分析等現(xiàn)代信息處理方法,得出各類信息的屬性。如果是一般的信息就送到態(tài)勢評估模塊,如果是特殊的信息,如戰(zhàn)場情況發(fā)生劇變,有戰(zhàn)機可乘,需要馬上采取突擊行動,則將信息送往緊急反應模塊。
4)態(tài)勢評估模塊態(tài)勢評估模塊接收從信息處理模塊傳來的信息,并接合知識庫中的世界模型,主要是外部敵我Agent及作戰(zhàn)海情氣象等情況,如對方的作戰(zhàn)特點,作戰(zhàn)地區(qū)的地理特點等,然后根據(jù)這些戰(zhàn)場信息進行海情、任務、敵我情況判斷分析,并將結果送入規(guī)劃決策模塊。
5)應急反應模塊應急有兩種情況:一種是必須馬上采取行動,即使推理也是采取知識庫中的簡單經(jīng)驗知識;另外一種情況指雖然是緊急情況,但還不至于要立即采取作戰(zhàn)行動,只是要修改原有作戰(zhàn)決策,如上級派來支援部隊,或是下級接收到作戰(zhàn)任務后的上報計劃,則應融合這些情況而重新進行部署和決策。當然更多的情況是兩種情形并行處理,一方面采取行動,另一方面重新規(guī)劃。
6)知識庫知識庫是進行推理的知識來源,它包括對世界的認識模型,即作戰(zhàn)地理氣候環(huán)境、作戰(zhàn)對手情況等,還包括戰(zhàn)術規(guī)則庫和經(jīng)驗知識庫;戰(zhàn)術規(guī)則用來進行戰(zhàn)術推理,而經(jīng)驗知識用于處理緊急戰(zhàn)場情況。同時知識庫還隨作戰(zhàn)次數(shù)、經(jīng)驗的增加而不斷更新[12]。
7)規(guī)劃決策模塊決策模塊是指揮Agent的核心,它根據(jù)態(tài)勢評估結果并結合知識庫中的戰(zhàn)術規(guī)則進行作戰(zhàn)規(guī)劃,生成作戰(zhàn)決策,產(chǎn)生作戰(zhàn)行動。在作戰(zhàn)過程中時常保持對作戰(zhàn)行動的跟蹤,看決策是否有效。如果情況發(fā)生變化,則立即重新進行決策。另外,決策模塊還接收由應急模塊傳來的信息,如下級指揮員的決策計劃等,決策模塊會融合這些信息重新決策。每一次決策情況又可傳入學習模塊,以更新知識庫。
整個指揮Agent可以適應不同級別指揮結構,如編隊級、單艦級甚至部門級,下級嚴格服從上級命令。對于專門針對指揮控制部門,不影響傳感器武器系統(tǒng)的只需更改知識庫,以適應不同級別任務。根據(jù)任務需求,可使系統(tǒng)降功能或以不同方式重組重構,適應不同需要的情況下提高系統(tǒng)靈活性。防空、協(xié)同突擊、協(xié)同護航、協(xié)同保障等任務涉及的兵力編成、所需知識、所使用的傳感器和武器等資源不同,對此只需更新知識庫,便可靈活性地以不同的資源進行面向任務的資源重組。
根據(jù)指控控制系統(tǒng)的需求,將多Agent技術引入指控控制系統(tǒng)。通過多Agent技術在指控控制系統(tǒng)中的應用,使戰(zhàn)術級指揮控制系統(tǒng)指揮決策智能化,改變以往指揮系統(tǒng)的串行工作模式,為以后的指揮系統(tǒng)總體設計開辟出一條新思路,大大提高系統(tǒng)設計的效率和質(zhì)量,對提高我國陸軍防空指控系統(tǒng)的性能、功能起到極為重要的作用。應用多智能體技術構建智能艦船指揮控制系統(tǒng)為提高協(xié)同作戰(zhàn)能力提供有效的技術途徑。研究結合作戰(zhàn)過程和編隊作戰(zhàn)樣式中的戰(zhàn)術規(guī)則來設計艦艇編隊指控系統(tǒng),并考慮在低通信量和無通信情況下的自協(xié)同作戰(zhàn)、沖突情況下的沖突檢測和消解策略,將能更好地適應未來復雜電磁環(huán)境下的網(wǎng)絡化戰(zhàn)爭。
參考文獻
[1]Xu J H,Zhang W,Shi C Y.A Structure-oriented Method for Agent Organization Formation[C]//Proc of Conference on Intelligence Information Processing.PSEI,2000.
[2]Michael Wooldridge.多Agent系統(tǒng)引論[M].北京:電子工業(yè)出版社,2003.
[3]張路青,許宏泉,詹廣平.人工智能在信息化戰(zhàn)場的應用探析[J].艦船電子工程,2009,29(6):13-16.
[4]Wooldridge M.Jennings Nicholas Cooperative Problem Solving[J].Journal of Logic and Computation,1999,9(4):563-592.
[5]李曉寧,于洪敏,張華才.面向群體作戰(zhàn)的多Agent合作策略[J].武器裝備自動化,2007,26(6):1-2.
[6]張航義.基于Agent的CGF行為建模技術研究[J].計算機仿真,2003,20(8):79-81.
[7]孫志勇.多Agent系統(tǒng)體系結構及建模方法研究[D].合肥:合肥工業(yè)大學,2004.
[8]Otto Shehory. Architectural Properties of Multi-Agent Systems,Technical Report CMU-RI-TR-98-28[C]//Carnegie Mellon Software Engineering Institute,December 1998.
[9]程飛.潛艇指控系統(tǒng)人機交互技術發(fā)展分析[J].火力與指揮控制,2013,38(5):5-9
[10]舒谷生,蔣偉進.基于Agent的可視化交互界面及應用研究[J].湖南城市學院學報(自然科學版),2004,13(2):69-73
[11]程飛,高貴朋.潛艇指控系統(tǒng)智能化應用研究[J].火力與指揮控制,2014,39(5):1-5.
[12]劉強,薛惠鋒.基于Multi-Agent的智能指控系統(tǒng)建模[J].火力與指揮控制,2008,33(6):91-93,97.