陸戰Agent自主協作機制模型研究

2011-07-16 07:38:30韓月敏李衛平劉玉濤劉永鋒

指揮控制與仿真 2011年4期

關鍵詞：信息

韓月敏，李衛平，劉玉濤，劉永鋒

（石家莊陸軍指揮學院，河北石家莊 050084）

陸軍作戰是典型的復雜系統[1]。陸戰 Agent是陸軍作戰復雜系統 ABMS核心的基礎要素。友方陸戰Agent之間的協作機制是陸軍作戰復雜系統演化運行的關鍵支撐之一。陸戰Agent之間的協作可歸納為自主協作和上級統一組織協作兩種模式。文獻[2]對上級統一組織的協作機制模型進行了研究，而對陸戰Agent自主協作機制模型的專門研究還很鮮見。陸戰Agent自主協作，雖與一般 Agent系統中的協作模式相同，但由于陸軍作戰的特殊性，必須研究符合陸軍作戰特點的陸戰Agent自主協作機制模型。

1 陸戰Agent自主協作方法

陸戰Agent自主協作是同級的陸戰Agent在自身沒有能力完成任務時，發出臨時協作請求，再根據對方陸戰Agent的回應情況，進行協作任務的分配。其自主協作過程可抽象簡化為“分析作戰任務—形成協作團隊—生成任務計劃—執行監控任務”等四個階段。其中，形成協作團隊是關鍵環節，并且陸戰Agent自主協作的雙方是一種對等關系。因此，其協作方法應該采用合同網協議[3]。

1.1 合同網協議的作戰應用分析

合同網協議作為一個基于市場運行機制的協作方法，可以成功地解決一個任務在多個Agent之間的分配問題，但將其應用于陸戰Agent自主協作，還存在以下5個問題：

1）合同網協議不符合陸戰高時效、近實時的作戰特點。合同網協議采用廣播通信方式進行任務招標，一方面會造成系統的通信量過大，另一方面會加重管理Agent對每個投標評價擇優的決策負擔。因此，難以滿足陸軍作戰高時效、近實時的要求。

2）合同網協議不能完全反映陸戰Agent協作配合的主動性。合同網協議中的合同Agent只能被動地接受管理 Agent發布的任務信息，不能完全反映陸戰Agent協作配合的主動性。

3）合同網協議基于市場協作的描述方式及運行機制不適用于作戰領域。合同網協議的任務分配過程是運用經濟行為中的“招標－投標－中標－簽約”機制，以標值為紐帶的Agent之間的協商過程。這種基于市場協作的描述方式及運行機制，不符合作戰領域的實際。

4）合同網協議缺乏對陸戰Agent作戰能力動態變化的考慮。合同網協議只考慮了Agent的靜態能力，很難反映作戰過程中陸戰 Agent作戰能力的動態變化。

5）合同網協議對協作任務失效的處置不符合戰場實際。合同網協議對任務失效情況的處置方法是重新發布任務，以尋求新的合作者。這種方法不符合陸戰場作戰任務不可重復及高時效性的實際。

1.2 合同網協議的改進思路

針對以上問題，本文提出以下5條改進思路：

1）針對合同網協議信息交互量大的問題，用黑板代替廣播的通信模式，作戰任務信息由協作請求者發布到黑板上，系統中的協作參與者自行感知相關任務信息。

2）針對合同網協議不能反映陸戰Agent協作配合主動性的問題，引入陸戰Agent主動感知特性，用能力參數值來衡量協作參與者當前的負載和資源狀況。協作參與者通過計算自身的感知系數來確定是否響應協作請求者的作戰任務信息。

3）針對合同網協議基于市場協作的描述方式及運行機制不適用于作戰領域的問題，對合同網協議進行重新描述，使其符合作戰領域的特殊要求，具體描述如表1和表2所示。

表1 合同網協議作戰應用階段描述

表2 合同網協議作戰應用角色描述

4）針對合同網協議缺乏對陸戰Agent作戰能力動態變化考慮的問題，引入評估模型，定期對各陸戰Agent進行評估，及時更新其作戰能力狀況，以作為參與作戰協作的依據。

5）針對合同網協議對協作任務失效處置不符合戰場實際的問題，為防止作戰任務分配過程中出現任務失效情況，在陸戰Agent執行作戰任務過程中，如果出現突發情況需要調整甚至放棄協作任務時，不能簡單地中止或調整其正在執行的作戰任務，必須制定相應的規則，指導陸戰Agent處置突發情況。

1.3 改進合同網協議的實現方法

根據合同網協議的改進思路，引入心智參數的概念，對其協作準備、協作請求、發送任務承諾、協作成員優選等各個階段進行改進。

1.3.1陸戰Agent心智參數

1）感知度

定義1 感知度：協作參與陸戰Agentj對于協作請求者發布作戰任務的響應程度，稱為陸戰Agentj的感知度，記為Prej。

協作參與者的感知度由其自身可用資源狀況，以及其當前的忙閑程度決定：

其中，Resj表示陸戰Agentj本身所具有的可用資源量；Idlej表示陸戰Agentj的忙閑度，以衡量自身任務量的繁重程度。P1、P2是資源和忙閑度的權值，可根據實際情況設置。

定義2 感知閾：允許協作參與者陸戰Agentj獲取作戰任務感知度的最小值，稱為陸戰Agentj的感知閾，記為PreThj。

當Prej≤PreThj時，則禁止協作陸戰Agentj響應任何作戰任務信息。

2）能力度

定義3 能力度：協作參與陸戰Agentj能夠順利完成任務的作戰能力，稱為陸戰Agentj的能力度，記為Capj。

協作參與陸戰Agentj的能力度主要由主觀能力度R1和客觀能力度R2兩部分組成。

主觀能力度R1是依據協作參與陸戰Agentj主觀條件所建立的能力度，主要取決于對協作參與陸戰Agentj的指揮控制能力 C、訓練水平 L、士氣狀態 S的分析和評價。

客觀能力度R2是依據協作參與陸戰Agentj客觀條件所建立的能力度，主要取決于對協作參與陸戰Agentj的武器裝備性能W、綜合能力F及作戰環境條件 E（表示作戰環境對于作戰效能的影響）的分析和評估。

能力度Capj可表示如下：

其中，Capj、R1、R2、C、L、S、、W、F、α、β、ω1、ω2、ω3、μ1、μ2、μ3的取值范圍均為[0，1]之間的實數，表示權重系數，并且α+β＝1，ω1+ω2+ω3＝1，μ1+μ2+μ3＝1 。

陸戰Agent的能力度是協作請求者選擇協作伙伴的主要指標之一，是一個動態變量，受多個因素影響。在協作參與者完成一個任務后，需要對其能力度重新進行評估。

3）能力度修正值ξ

為了體現陸戰Agent執行不同任務時所表現出的不同作戰能力，可依據任務類型，定義相應的修正值，以保證能力度較好地刻畫其相應的作戰能力。ξ的值域范圍為[0，1]。

4）熟悉度

定義4 陸戰Agentj成功完成陸戰Agenti交給作戰任務的次數與陸戰Agenti委托作戰任務的總次數之比，稱為陸戰Agenti對陸戰Agentj的熟悉度，記為Fri（i,j）。

其中，Nij表示陸戰 Agentj成功完成陸戰 Agenti交給任務的次數；Ni表示陸戰Agenti委托任務的總次數。

熟悉度也是協作請求者選擇協作伙伴的重要指標之一。對于同一作戰任務，在能力度相當的情況下，協作請求陸戰Agent更傾向于選擇熟悉度較高的協作參與陸戰Agent。

5）協作承諾閾

定義5 協作參與陸戰Agentj在同一時刻能夠發送的最多作戰任務承諾數，稱為陸戰Agentj的協作承諾閾，記為Thdj。

設置協作承諾閾的目的是為了限制協作參與者對作戰任務的盲目參與，保證協作參與者的每個承諾都是有效的。承諾閾的大小與協作參與者的感知度相關，并隨著感知度的變化而變化。

6）協作承諾數

定義6 協作參與陸戰Agentj當前發送的所有作戰任務承諾總數，稱為協作承諾數，記為Tamj。

當Tamj＜Thdj時，協作參與者可響應黑板上的協作任務信息。

1.3.2協作準備

協作準備包括對待分配任務的分析與分解、制定作戰任務信息表等工作。作戰任務信息表主要包括協作請求者、作戰任務描述、作戰任務約束條件以及作戰任務參與、完成時限等信息。

1.3.3協作請求

協作請求的方法是協作請求者將作戰任務信息發布到黑板上，并且在作戰任務信息中設置截止時間參數。當到達截止時間時，任務信息失效，黑板系統自動刪除作戰任務信息。同時協作參與陸戰Agent根據自身感知度的大小，判斷能否從黑板獲取作戰任務信息，從而參與協作。

協作請求的工作流程如圖1所示。

圖1 協作請求工作流程

1.3.4任務承諾

協作參與陸戰Agent接收到黑板上的作戰任務信息后，即進入了任務承諾階段。任務承諾的主要工作包括協作參與陸戰Agent對協作子任務的評估及向協作請求者發出任務承諾。

為了限制陸戰Agent象傳統合同網協議中的合同者那樣盲目參與，避免由于協作參與者自身能力不足，而造成承諾失敗的問題，從節約系統資源，減輕陸戰Agent負擔，加快系統執行效率的角度出發，對合同網協議作如下改進：

1）為每個協作參與者設置一個協作參與閾值，即每個協作參與者能夠進行任務承諾的最大值，其大小與陸戰Agent的感知度相關聯。當感知度降低時，協作參與閾值也同時降低，表示陸戰Agent并行執行任務的能力降低，反之亦然。

2）當協作參與者有能力執行作戰任務時，設置評估函數對作戰任務進行排序，從中選出自己最有把握的作戰任務，按照一定的規則形成任務承諾信息發送給協作請求者。

1.3.5優選最佳協作參與者

優選最佳協作參與者就是按照某種策略，從眾多參與者中選擇合適的協作伙伴。總的原則是能更好地完成作戰任務的各個子目標，在對協作參與陸戰Agent優選時，需要考察其綜合能力，如完成作戰任務的質量、能力度、熟悉度、感知度等，以保證作戰任務總體效果能達到最佳。這些因素有些是無法準確量化的，因此，應該采用基于模糊綜合評判的優選策略。

2 陸戰Agent自主協作功能結構

根據陸戰Agent的內部結構[4]和合同網協議的改進思路，可得到陸戰Agent自主協作功能結構，主要由任務處理器、知識庫、協作處理器和通信處理器等組成，如圖2所示。

圖2 陸戰Agent自主協作功能結構

3 陸戰Agent自主協作框架

在改進的合同網協議中，協作請求陸戰Agent和協作參與陸戰Agent分別承擔合同網協議中管理者和合同者的角色。在陸軍作戰過程中，上級陸戰 Agent主要負責管理所有陸戰Agent的相關信息，并在作戰的不同階段向陸戰Agent分配作戰任務或打擊目標，其所關注的重點是對戰場的整體協調和控制，不參與具體的自主協作控制；而協作請求陸戰Agent依據上級陸戰Agent下達的作戰任務或戰場空間臨時出現的突發情況，利用改進合同網協議，自主向其他陸戰Agent發出作戰任務協作請求，尋求協作伙伴；協作參與陸戰Agent則負責響應作戰任務請求信息，以及作戰任務的協作執行。

因此，陸戰Agent自主協作框架可由兩個層次構成。第一個層次是從上級陸戰Agent獲取本級任務，如果陸戰Agent不能獨立完成則轉到第二個層次。在第二個層次上，本級陸戰Agent是任務的分配方，并自動成為協作請求者，通過黑板向其他陸戰Agent發出協作請求。得到協作請求信息的其他陸戰Agent都可成為作戰任務的接受方，并自動成為協作參與者，如圖3所示。

圖3 陸戰Agent自主協作框架

4 陸戰Agent自主協作策略

4.1 自主協作請求策略

陸戰Agent自主協作請求策略是以黑板作為中間媒介，協作參與者根據自身類型、資源及負載狀況而參與作戰任務的協作。通過設置感知度Pre與感知閾值PreTh兩個參數來限制協作參與者的協作參與，即當Pre＞PreTh時，允許協作參與者從黑板獲取請求協作任務信息，以此減少任務的發送范圍，提高效率。

4.2 自主協作承諾策略

陸戰Agent的自主協作承諾策略，依據其自身的負載和資源狀況，為每個協作參與陸戰Agent設置一個協作參與閾值Thd，表示每個陸戰Agent能同時參與協作任務的個數，以保證協作參與者每次的任務承諾都有效。而參與協作閾值與陸戰Agent自身感知度相關。

1）當協作參與陸戰Agent接到協作任務后，將此時協作參與陸戰Agent已經發送的任務承諾值TAm與其當前感知度下的協作參與閾值Thd進行比較，如果TAm＜Thd，則禁止響應協作請求。

2）協作承諾值的調整

①向協作請求者發送任務承諾后：TAm＝TAm+1

②承諾被拒絕時：TAm＝TAm-1

③承諾被選中的陸戰Agent成為子任務的執行者時：TAm＝TAm-1，Pre＝Pre-Δpre，Thd=Thd-ΔThd；

④任務完成時：Pre＝Pre+Δpre，Thd=Thd+ΔThd。

4.3 自主協作團隊優選策略

基于模糊綜合評判的評估策略，協作請求者根據作戰任務分配的特征和協商目標確定影響協作團隊優選的因素評價集，利用模糊綜合評判的結果對潛在的協作參與者做出評價，進而挑選出最佳的協作任務執行者。

模糊綜合評判是應用模糊關系合成的原理，由多個因素來綜合評判事物隸屬等級的方法。通常包含確定因素集、確定評價集、確定各因素的權重、單因素模糊評判和模糊綜合評判等5個基本步驟。

各因素的權重用來反映其對評判對象影響的重要程度，因素ui的權重記為iη，且有

單因素模糊評判旨在建立因素集與評價集之間的一種模糊關系，如第i個因素的評價結果可記為：

其中，rij為因素iu產生結果vj的隸屬度。

5 陸戰Agent自主協作流程

陸戰Agent自主協作流程如圖4所示。

圖4 陸戰Agent自主協作流程

5.1 作戰任務識別

作戰任務識別的主要工作是對上級陸戰Agent授予的作戰任務按一定的規則或需求，分解成多個協作子任務，并將這些協作子任務按照一定的格式生成作戰任務信息表，發送到黑板上，以尋求協作。

其協作子任務信息表中每個子任務的內容為：

其中：

AgentID表示協作請求陸戰Agent標識。

TaskID表示子任務標識。

TaskType表示協作子任務類型，參與者按任務類型修正自身能力度，用于對任務的期望評估。

Priority表示任務優先度，用于標識當前任務的重要程度。

TaskDescription表示對子任務的簡要描述。

ExpireTime表示協作請求者接收協作參與者發出任務承諾的截止時限。

Address表示協作請求陸戰Agent物理地址，用以實現與協作陸戰Agent之間的通信交互。

TaskRestriction表示協作請求陸戰 Agent提出完成任務的約束條件，包括對協作參與者完成任務的代價約束、資源約束和質量約束等。TaskRestriction={Cost、ξCap、Quality、Pre}，其中 Cost表示完成任務的代價；ξCap表示協作參與陸戰Agent依據作戰任務類型修正后的作戰能力參數；Quality表示任務預計能達到的效果；Pre表示協作參與陸戰Agent的感知度。

5.2 形成協作團隊

形成協作團隊的過程是基于改進合同網協議，陸戰Agent之間進行交互協商的過程，其工作流程如下：

1）協作參與者從黑板感知協作任務信息

當滿足以下條件時，允許陸戰Agent參與協作：

① 感知度大于感知閾值：Pre＞PreTh

② 已發出的任務承諾數小于協作參與閾值：TAm＜Thd。

這兩種情況表示陸戰Agent當前有能力參與到作戰任務的協作之中，允許其感知黑板的協作任務信息。

2）協作期望評估

為保證陸戰Agent所承諾的任務都是最有把握完成的作戰任務，設置一個協作參與評估函數Par(i,j,t)，表示協作參與陸戰Agentj對于協作請求陸戰Agenti發布的任務t進行的協作期望評估。期望值越高，表示完成的可能性就越大。

其中，1λ、2λ和3λ是能力度、感知度、熟悉度在協作參與評估函數中所占的權值，并且λ1+λ2+λ3＝ 1 。

同時，根據任務t的類型參數及其對應的能力修正參數 ξ，修正陸戰 Agent的作戰能力，用于對每個子任務的評估。多個子任務按照評估值進行排序，陸戰Agent依據排序后任務序列，選擇最能勝任的任務。

最后協作參與陸戰Agent根據協作任務信息，結合知識庫中的戰斗規則、戰斗范例以及各種評估方法模型，對協作任務進行解算，按TaskRestriction規定的格式，生成任務承諾信息，在截止時限前提交給協作請求者。

3）協作團隊優選

在基于改進合同網協議的自主協作中，最佳協作參與陸戰Agent的選擇，依賴于對其完成協作任務質量的承諾、所付出的代價、自身能力、感知度及其他陸戰Agent的信任度等因素的評估。

利用模糊綜合評判法選擇協作參與陸戰Agent的影響因素集為{承諾值，完成代價，能力度，感知度}，這些因素對應的權重可依據經驗數據設定，例如可設為{0.4，0.2，0.2，0.2}，評價值集為[0，1]。

由此可對所有協作參與陸戰Agent進行評判，通過對評判結果排序，選出最大值所對應的陸戰Agent，作為協作伙伴。

4）形成協作團隊

協作請求陸戰Agent在達到任務截止時限后，確定所有子任務的協作伙伴，形成協作團隊。并且將協作團隊所有陸戰Agent的相關信息，按照一定的格式，發送給協作團隊中的每個成員，以方便協作參與陸戰Agent之間的通信交互，以及在出現突發事件時，能及時通知其他成員。其協作團隊成員信息的格式如表3所示。

表3 協作團隊成員信息表

5.3 形成任務計劃

協作團隊生成后，可采用一種節點規劃和通用部分全局規劃（GPGP：Generalized Partial Global Planning）[5]的方法形成一個全局決心方案。協作團隊中的所有成員均按照此決心方案，執行相關的作戰任務。

節點規劃是協作問題求解的重要思想，可以看作是多個規劃問題的復合。首先，各陸戰Agent建立其內部規劃和決策模塊共同作用，形成各自任務計劃。然后，陸戰 Agent相互交換各自的本地規劃，利用GPGP協調機理建立全局的具有時間、空間等約束關系的決心方案。

5.4 任務執行與監控

在形成作戰任務計劃后，各陸戰Agent按總體計劃執行任務。在協作任務執行過程中，一方面，由于戰場態勢瞬息萬變，如果出現突發情況，導致必須中止當前的作戰任務；另一方面，由于陸戰Agent權威性和受控性的特點，如果陸戰Agent接到上級命令，要求其立刻執行某項任務，則陸戰Agent會立即放棄正在進行的所有任務，而去執行上級新的命令。這兩種情況都會造成協作關系的失效。因此，需要定義相應的規則，以方便團隊內的所有協作伙伴能及時處理，避免不必要的損失。

表4中列舉了一些簡單的事件規則，由于戰場的復雜性，需要對規則進行不斷的補充和修改。

任務執行完成后，需要綜合考慮陸戰Agent在作戰任務執行期間的戰損情況、士氣、指揮等因素，從而實現對所有協作成員能力的動態評估，具體可根據實際能力情況更新模型。

6 陸戰Agent自主協作實施步驟

首先假設：

陸戰Agentq：為協作請求者；

P：為所有協作參與者的集合，P={陸戰Agent1，陸戰Agent2，…，陸戰Agentm}；

T：為協作請求者陸戰 Agentq提交的所有協作任務集，T={T1，T2，…，Tn}；

表4 陸戰Agent事件處理規則

TIDk：為協作任務Tk的標識；

PIDj：為協作參與者陸戰Agentj的標識；

Prej：為協作參與者陸戰Agentj的感知度；

PreThj：為協作參與者陸戰Agentj的感知閾值；

Tamj：為協作參與者陸戰Agentj當前發送參與協作任務承諾數；

Thdj：為協作參與者陸戰Agentj的參與閾值；

Parjk：為協作參與者陸戰Agentj關于協作任務Tk的協作期望值；

Qjk：為協作參與者陸戰Agentj承諾完成協作任務Tk的效果；

Costjk：為協作參與者陸戰 Agentj完成協作任務Tk的戰損和消耗；

Resjk：為協作參與者陸戰Agentj完成協作任務Tk的可用資源；

Capjk：為協作參與者陸戰Agentj完成協作任務Tk的作戰能力度；

CadTIDk：為協作任務Tk的候選參與協作者集，CadTIDk={ cadk1，cadk2，…，cadkv}；

Bestk：為協作任務Tk的最佳協作者；

BestTeam：為最后形成的協作團隊；

ExpireTime：為協作請求者陸戰Agentq接收協作任務承諾的截止時刻；

SendPromises：為協作參與者陸戰 Agentj向協作請求者陸戰Agentq發送關于協作任務Tk的承諾函數，SendPromises（Qjk，Costjk，Resjk，Capjk，TIDk，PIDj）；

ReceivePromises：為協作請求者陸戰Agentq接收協作任務承諾函數，ReceivePromises（Qjk，Costjk，Resjk，Capjk，TIDk，PIDj）；

Selectbest（CadTIDk）：根據模糊綜合評判法為協作任務Tk選擇最優協作參與者函數；

SendMember：為協作請求者陸戰 Agentq向協作參與者陸戰Agentj發送關于其成為Tk的協作成員信息函數，SendMember（PIDj，TIDk）。

那么，陸戰Agent自主協作實施步驟如下：

1）陸戰 Agentq向黑板提交任務集合 T={T1，T2，…，Tn}

2）所有協作參與者陸戰 Agentjj=1,2,…，m 同時對協作任務進行評估，對自身最能勝任的協作任務進行承諾：

①判斷感知度和協作參與閾值是否滿足任務讀取條件：

3）陸戰Agentq為每一個協作任務接收承諾信息，形成候選參與協作者集：

4）根據模糊綜合評判法為每個協作任務優選協作者，形成團隊：

5）發布協作團隊成員信息：

6）協作團隊修正感知度，協作成員按照內部規劃，形成協作任務計劃。

7）按GPGP方法生成任務總體計劃。

8）按任務總體計劃執行，任務執行中按事件規則處理突發事件。

9）如果異常執行步驟（10），否則執行步驟11）。

10）按異常處理規則處理。

11）任務結束，修正能力度、感知度。

12）結束。

7 結束語

本文通過對合同網協議應用于陸戰Agent自主協作所存在問題的分析，提出了改進合同網協議的思路和方法，在此基礎上，探討了陸戰Agent自主協作機制模型的功能結構、框架、策略、流程和實施步驟，為陸軍作戰復雜系統的ABMS奠定了基礎。

[1]Andrew Ilachinski.Land Warfare and Complexity.Part I:MathematicalBackgorundandTechnicalSourcebook[DB/OL].CenterforNavalAnalyses,1996[2009-03-10].http://w ww.cna.org.

[2]韓月敏,劉非平,劉麗巧,等. 陸戰Agent協作機制模型研究[J].指揮控制與仿真, 2009,31(6):6-10.

[3]Smith R.G. The Contract Net Protocol: High-Level Conation Communication and Control in distributed problem solver [J]. IEEE Transactions on Computer, 1980,29(12):1104-1113.

[4]韓月敏,彭海,張金榮,等. 陸軍作戰復雜系統 ABMS機理研究[J].指揮控制與仿真, 2011,33(2):1-4.

[5]韓祥蘭,張剛,劉仰光.通用模糊綜合評判工具的研究與應用[J].計算機應用與軟件,2010,27(2):187-190.