趙蕊蕊, 于海躍, 游雅倩, 張 濤, 陶 敏, 姜 江
(國防科技大學系統工程學院, 湖南 長沙 410073)
人工智能技術的迅速發展使得智能化的網絡信息體系成為軍事領域的重要變革趨勢,未來戰爭逐漸呈現出無人化和智能化的特征[1]。近年來,各國高度重視無人裝備的相關研究,單體無人裝備的性能大幅提升,但其完成任務的能力始終有限,無人集群協同作戰應運而生。無人集群最初由無人飛行器發展而來[2],是群體智能與無人系統相結合的產物[1]。其概念可描述為:無人集群是由一定數量的智能和非智能無人裝備,以單平臺裝備的作戰能力、自主協同技術和集群控制算法為基礎,以平臺之間的自組網通信為支撐,圍繞任務目標,模擬自然界生物集群形成的具有功能分布化、行為涌現性特征的作戰體系[1,3-4]。目前,無人集群大致可分為無人機集群、地面無人車集群、水面無人艇集群、水下無人潛航器集群以及上述無人裝備的跨域聯合[5]。上述同構或異構無人集群通過個體之間的自主協同實現作戰能力涌現,達到“1+1>2”的效果,成為未來戰場中的顛覆性力量。無人集群自主協同是指在無人參與或人工監測下,具備一定自主性的集群個體既能夠獨立地完成給定任務,又能夠自發地交互協同完成群體任務[6-7]。實現自主協同是構建無人集群的根本目的,也是其最終發展目標。近年來,世界各主要軍事強國面向自主協同的無人集群開展了大量的研究項目,內容集中于無人裝備平臺技術研發、集群自主協同技術探索、作戰樣式設計以及相關演示驗證等方面。但在整體上,無人集群的研究仍處于技術探索和發展融合階段,為驗證能否滿足理想的作戰需求,還需要進行大量的試驗評估工作。
試驗評估是試驗鑒定的重要環節,裝備試驗評估是在科學組織試驗的基礎上,依據對試驗所得數據的綜合分析,得到裝備性能、作戰效能、適用性等方面的正確評價結論,為確定裝備是否滿足研制要求和使用需求提供依據。無人集群的試驗評估是其從作戰概念走向實際應用的重要橋梁,對于檢驗無人集群發展水平、指導無人集群實戰化應用具有重要意義。在概念界定上,無人集群試驗評估尚無統一定義。梁曉龍等[1]在已有研究和實踐基礎上認為,無人集群試驗評估是通過提供科學規范的評估過程、方法,以及置信度高、適應性廣的評估模型,得到對集群自主協同能力、系統健壯性和作戰效能等的量化評價?;谠撜J識,本文將現階段的無人集群試驗評估描述為:基于高置信度的評估指標和模型,實現對無人集群自主協同特征的有效描述,以明確試驗數據需求并完成數據獲取與綜合分析,達到對無人集群的性能、作戰效能及潛在的作戰適用性、體系適用性等進行評價的目的,為無人集群是否滿足研制要求和使用需求提供依據。
區別于傳統的裝備系統,自主協同的無人集群執行任務時具有鮮明的系統涌現性特點,整個集群在作戰過程中需要對瞬息萬變的作戰環境做出動態的智能決策和協同調整。因此,無人集群試驗評估存在著評估指標設計難、評估模型要求高等特點[8],傳統試驗評估理論已難以適用。針對這一現實問題,本文在對國內外無人集群試驗評估規劃和項目實踐現狀進行總結的基礎上,重點對評估指標設計和評估方法選取兩個關鍵技術環節的研究進行了系統地分析和梳理,為后續無人集群試驗評估工作提供借鑒。
本文結構組織如下:第1節介紹國內外在無人集群試驗評估規劃和項目實踐方面的研究現狀;第2節在對已有無人集群評估研究中使用的指標進行梳理和分析的基礎上,進一步對各無人集群關鍵技術涉及的評價指標進行了描述總結,給出了對各關鍵技術能力進行評估的指標設計思路;第3節按照具體含義和計算方式將無人集群評估指標分為基礎指標和綜合指標,并分類介紹了無人集群試驗評估方法;第4節對本文內容進行總結。
目前,世界主要軍事強國針對無人集群相關概念、技術與應用展開了頂層規劃探索和大量的試驗研究項目,把握國內外無人集群試驗評估研究的最新進展,對于指導相關領域的發展規劃具有重要意義。本節將對國內外無人集群試驗評估規劃和項目實踐現狀進行總結。綜合來講,美國對無人集群的試驗評估研究處于領跑地位,國內則尚處于起步探索階段。
在無人系統發展相關的頂層規劃方面,美國國防部分別于2000年、2002年和2005年發布了3版無人機路線圖,其中2005年8月發布的《無人機系統路線圖2005-2030》[9]沿用至今。該路線圖將無人機自主等級劃分為1至10級,包括單機自主、多機自主和集群自主3個層面,預計2025年后無人機將具備最高等級的集群能力。美國陸軍、空軍和海軍相繼在2010年4月、2016年5月和2018年3月分別發布了《無人機系統路線圖2010-2035》[10]《小型無人機系統飛行規劃2016-2036》[11]和《海軍無人戰略路線圖》。其中,空軍發布的規劃從戰略層面肯定了小型無人機系統的前景和價值,對“蜂群”“編組”“忠誠僚機”3種集群作戰概念進行了闡述,從側面印證了無人機集群發展的重要性[12]。隨后,美國國防部在2018年8月發布的《無人系統綜合路線圖2017-2042》[13]中強調無人系統應聚焦全域作戰,并指出無人系統的集群能力是需要近遠期發展的關鍵技術之一。2017年,美國國防部高級研究計劃局(Defense Advanced Research Projects Agency, DARPA)提出實現無人集群完全自主協同作戰的高級愿景——“馬賽克戰”的概念[14]。隨后,美國戰略與預算評估中心在2020年發布報告《馬賽克戰:利用人工智能和自主系統實施決策中心戰》[15],把人工智能輔助作戰決策與指揮控制、人機/集群智能協同和自主作戰作為支撐新的制勝機理和作戰概念的核心技術。
我國針對無人系統發展建設的頂層規劃工作起步稍晚。2017年,國務院印發了《新一代人工智能發展規劃》[16],在規劃中列出的8項基礎理論中,有多項與集群智能直接相關,包括混合增強智能理論、群體智能理論、自主協同控制與優化決策理論等。2019年,國防部刊發的《加速推進軍事智能化》評論[17]中,把智能集群戰、人機協同作戰等列為智能化戰爭的基石。2020年1月,中國科學院大數據挖掘與知識管理重點實驗室發布了《2019年人工智能發展白皮書》[18],所列的取得較大突破且在各界引起較大關注的8項人工智能關鍵技術包括群體智能技術和自主無人系統技術。2021年11月,中國電子技術標準化研究院等27家單位發布了《智能無人集群系統發展白皮書》[19],對無人集群的發展需求、趨勢、未來愿景、國內外發展現狀、關鍵技術以及技術標準體系等進行了闡述。
在無人集群試驗鑒定方面,美國早在2011年就率先制定了無人自主系統試驗鑒定體系結構框架,該框架面向5類作戰空間的自主系統,關注7類自主性支撐技術,內容涵蓋基于OODA(observation, orientation, decision, action)環的混合仿真試驗環境、5類自主系統評價指標和4層試驗類型[20]。結合經驗認知與實踐積累,美國認為無人集群自主性技術給傳統試驗鑒定與評估帶來的挑戰包括[1,20]:技術方面,無人集群通過個體間的自組織和自同步,實現面向不確定威脅的自主態勢認知和自適應決策,會涌現出學習、合作等復雜社會行為,已有的試驗鑒定技術難以適應這些特點;算法方面,常用的深度學習等人工智能算法內部空間規模巨大且具有黑箱特性,不具有可解釋性;自主性技術的嵌入和發展給跨域無人集群聯合試驗鑒定帶來挑戰。針對這些挑戰,美軍近年來致力于多路布局、一體推進[20],從多渠道持續投資無人自主系統試驗鑒定項目;美國國防部積極組織召開試驗鑒定相關研討會,宣傳其在自主性及試驗鑒定方面的需求,以牽引各方研究力量突破所需的關鍵技術,并對工業部門和大學開展的自主性試驗鑒定項目的成熟成果進行采購;試驗資源管理中心和DARPA則以建立無人自主集群集成試驗床作為相關項目的重要目標。
我國裝備試驗鑒定標準的總體框架包括縱向和橫向兩個維度,縱向上分為通用層、專用層和型號層3個層次,分別對應試驗鑒定的共性需求、個性化需求和具體的裝備型號;橫向上則分為基礎類、過程類、技術類和保障條件類4類標準。蔣平等[2]初步探索了無人集群作戰試驗的設計框架和流程,依次包括作戰任務分析、評估指標體系構建、影響因素分析、試驗活動設計等。但是目前,我國關于無人集群試驗評估的頂層設計和規范性理論框架探索仍處于空白階段。
除了開展具有指導意義和探索性的頂層規劃研究,世界各國近年來注重開展無人集群項目實踐,通過試驗評估驗證理論成果的可行性和有效性。美國從2008年開始,就陸續資助軍地相關單位開展無人集群自主協同作戰研究,試驗內容涉及性能試驗和作戰試驗;我國目前主要進行了不同規模的飛行試驗,仍以性能試驗為主。
國外近些年開展的部分無人集群試驗項目匯總如表1所示[21-27],研究范圍涵蓋無人機集群、水面無人艇集群、無人水下機器人集群、海上跨域無人集群等。
表1所列內容表明,各國開展的無人集群研究項目所涉及內容主要包括集群協同作戰樣式設計驗證、集群自主協同技術研究驗證以及無人裝備平臺技術研發驗證等。其中,美國開展無人集群相關試驗項目數量多且研究較早,試驗內容從無人集群性能試驗逐漸走向較成熟的作戰試驗,目前已經進行了較復雜環境下的作戰任務研究,包括核生化區域、復雜的城市環境和海底環境等。另外,美國在多項項目研究中都關注無人裝備自主協同的實現,且注重系統及技術之間的集成,提升體系整體效能。試驗空間方面,美國在提升單個無人裝備性能和自主能力的基礎上,注重多域裝備的研發和協同試驗研究。同時,美國開展的典型項目持續周期較長,一個項目具有多個研究階段,每個階段都有一定的主要技術突破點,研究內容具有持續性和系列性。除美國以外的其他國家所開展的研究項目數量有限且起步較晚,但近幾年在逐漸加大相關試驗的研究力度。
近年來,我國開展的無人集群相關試驗研究項目以無人集群飛行試驗為主,目前公開的主要項目和試驗研究如表2所示。由表2內容可知,我國已公開的無人集群相關試驗研究起步較晚,時間集中在2018年之后。試驗內容仍然以性能試驗為主,主要集中于集群平臺技術研究、編隊隊形設計、集群關鍵技術的研究和驗證等,其中集群關鍵技術主要關注了基本的編隊集結、隊形保持和變換、協同避障和目標跟蹤等。試驗任務由簡單的偵察監視、編隊集結逐漸向集群圍捕、對地察打等較復雜的任務方向發展。試驗空間逐漸趨于多樣化,但大多是針對同一任務空間中無人裝備的性能和技術研究,跨域協同研究較少。總體上而言,我國目前的無人集群試驗項目還處于比較初步的研究階段,需要進一步開展更加復雜任務環境中的試驗研究。

表2 國內無人集群試驗評估項目實踐匯總
總體上而言,美國在無人集群試驗評估規劃和項目實踐方面均積累了大量具有指導意義的成果,處于領跑地位。我國目前在無人集群試驗評估領域則尚處于起步探索階段,與美國相比,還面臨著以下一些挑戰。
(1) 無人集群試驗評估頂層設計尚不明確。無人集群依靠自組網實現復雜交互,進而完成復雜多樣的任務,具有鮮明的自主協同性和系統涌現性,傳統裝備系統的試驗評估理論體系、框架標準和試驗環境已難以適用。美國近20多年來陸續發布了一系列具有較高權威性的無人集群領域發展規劃和新式作戰概念,重視試驗評估相關標準規范的研究,已初步建立相關標準體系。同時,早在10多年前,美國就已經率先制定了無人自主系統試驗鑒定結構框架,明確了試驗環境、評價指標類型、試驗類型等,為無人集群試驗評估工作奠定了堅實的基礎。而我國相關研究起步較晚,在無人集群試驗評估頂層設計方面與美國差距還比較大,暫時仍處于跟跑研究階段,相關單位提出了智能無人集群系統標準化工作建議[19],但還未出現相關研究成果。明確無人集群試驗評估基本要素和流程、制定具有統籌指導作用的無人集群試驗評估框架標準是亟待解決的問題。
(2) 無人集群試驗評估項目實踐比較有限。裝備體系的試驗評估內容包括性能試驗、作戰試驗和在役考核,其中作戰試驗評估需要在近似真實的作戰環境中開展,是檢驗無人集群能否能夠投入實際作戰任務的前提。美國開展無人集群試驗評估項目實踐時以所提新式作戰概念為指引,試驗統籌規劃、技術運用較為成熟,且注重對多渠道研究力量的融合,形成了較完整的研究和發展體系。同時,美國已經進行了較復雜環境下的試驗項目,試驗內容涵蓋性能試驗和作戰試驗。然而,由于我國無人集群試驗評估頂層設計尚不明確,相關項目實踐研究沒有形成清晰的體系化特點;項目中涉及到的集群任務和環境也都相對簡單,試驗內容仍以性能試驗為主,還未開展無人集群作戰試驗評估工作。
綜合來看,我國無人集群類智能化裝備體系的試驗評估規劃和理論方法研究尚不成熟,將阻礙無人集群技術的規范性驗證以及實戰化應用。從試驗評估過程看,評估指標選取和評估方法確定是兩個關鍵環節,對得到高置信度的試驗評估結果、生成試驗鑒定最終結論而言有著重要意義。因此,本文將對已有無人集群研究中涉及到的評估指標和評估方法進行詳細的梳理和總結。
評估指標的確定是試驗評估工作的首要和基礎環節,決定著最終評估結論的合理性和有效性,如何設計合理的評估指標,實現對無人集群的自主協同性和群體涌現性的有效描述,是目前無人集群評估研究領域需要重點關注的難題。在已有的無人集群自主協同關鍵技術的探索研究中,一般會使用一些描述無人裝備自身性能、算法有效性的指標進行模型構建、算法設計和仿真試驗驗證等?;诖?本節將首先對已有的無人集群評估研究涉及到的指標進行梳理,得到對無人集群綜合評估指標的分析總結。在此基礎上,對各關鍵技術研究涉及的技術指標進行分類描述,給出各項關鍵技術能力指標的設計思路。
近年來,國內外學者關注的無人集群評估內容包括支撐技術、作戰能力和作戰效能等[8,46-67],如圖1所示。支撐技術評估是集群性能試驗階段的關注點,作戰能力和作戰效能評估則是集群作戰試驗階段的重要工作?,F有研究中,討論較多的是無人集群支撐技術和作戰效能的評估。支撐技術評估研究內容涵蓋較廣,主要是算法設計等軟技術;作戰效能評估研究著重從整體效能出發,而作戰能力評估研究則覆蓋面較單一,以集群偵察能力評估為主。同時,作戰能力通常作為作戰效能評估的一個中間過渡指標,體現出兩者之間的相互關系??傮w而言,目前無人集群評估研究內容比較分散。

圖1 無人集群評估研究關注內容Fig.1 Research focus of unmanned swarm evaluation
基于現有研究的上述特點和問題,本文基于OODA環理論從感知、分析、決策和行動4個方面,分類梳理上述評估研究中使用的評估指標,最終結果如表3所示。第3列內容中加粗顯示的為中間過渡指標,其余均為底層指標。

表3 無人集群綜合評估指標體系梳理
表3表明,目前針對無人集群“行動”環節開展的評估研究眾多,包括協同能力、編隊集結能力、組隊能力、攻擊能力、通信能力等,其中編隊集結能力的評估指標比較全面,針對通信能力的相關研究也較多、評估指標選取具有較大共識。對于無人集群“感知”環節中的態勢感知能力,從完備性、準確性、連續性、時效性等方面構建評估指標體系是較公認的思路。針對無人集群“分析”環節的評估研究還比較有限。針對“決策”環節的相關能力,已有研究則會使用航跡規劃、任務分配等關鍵技術能力進行衡量。
同時,綜合分析各評估文獻和表3所列內容發現,已有研究在評估指標選取方面存在如下特點和問題:
(1) 3種不同評估內容研究中存在一些通用的指標,主要包括無人集群的基礎能力指標和基本性能指標;而同一評估內容在指標選取上卻可能有所差別,比如文獻[8]和文獻[46]中生存能力的衡量指標、文獻[46]和文獻[64]中的通信能力衡量指標均不完全一致。
(2) 在指標名稱方面,不同文獻對一些相同或近似含義指標的名稱描述不一致,比如文獻[46]中的數據傳輸速率與文獻[47]中的數據包傳送率、文獻[61]中的攻擊能力與文獻[64]中的打擊能力。
(3) 在底層指標可量化性方面,支撐技術評估研究中的底層指標最為規范,基本能夠直接獲得具體取值;在作戰能力評估文獻中,存在少數底層指標難以直接量化;在作戰效能評估中,難以直接量化的底層指標則較多。相關文獻示例計算部分,均直接給出底層指標取值而未考慮實際應用中的指標值計算問題。
(4) 關于評估指標體系構建方法,除文獻[8]和文獻[59]按照無人集群中包含的作戰節點功能類型分類分析得到評估指標體系,研究人員主要借助層次分析(analytic hierarchy process, AHP)法和ADC(availability, dependability, capacity)法,結合頭腦風暴的思想構建指標體系。以作戰效能評估為例,一般先確定若干集群能力,將其作為二級指標,再基于指標之間相互獨立的假設得到層層遞進的樹形指標體系,較容易出現指標之間的相關性強、不易量化、指標不全面等問題。
關鍵技術能力是針對“決策”和“行動”環節進行評估時常用的綜合評估指標或中間過渡指標,針對現有研究在評估指標選取方面存在的指標名稱不一致、指標選取主觀性強、底層指標不易量化等問題,本節著重對無人集群關鍵技術能力指標進行分析和設計。
由于任務執行環境、無人系統平臺本身復雜多樣的特點,無人集群自主協同控制問題具有較大挑戰性,是近年來學術界的研究熱點[68]。總體上,實現無人集群自主協同需要關注的關鍵技術包括集群任務分配、集群路徑規劃、協同編隊控制和集群組網通信。其中,任務分配、路徑規劃和編隊控制技術解決的是集群執行任務的過程中所涉及的規劃決策和指揮控制問題,組網通信技術則是實現集群個體間協同的基礎。本節主要面向以上4項關鍵技術能力進行指標梳理和評估指標體系設計。
2.2.1 集群任務分配
無人集群任務分配是指在滿足資源、平臺及時間等的約束條件下,建立集群個體與任務或任務集合之間的映射關系,并確定個體執行任務的時序,目的是以最小的執行代價獲得最大的任務收益,是一類復雜的組合優化問題[68-70]。集群任務分配問題的研究成果豐富,一般的解決思路是:將任務分配收益作為目標函數,考慮資源能耗、任務時序、任務類型等約束條件構建數學模型。常用的模型包括:多旅行商問題[71-72]、多維多選擇背包問題[73]、混合整數線性規劃問題[74]、指派問題[75]、車輛路徑問題[76]等。在此基礎上,采用合適的算法求解模型,目前有集中式和分布式兩種求解思路。
分析相關文獻發現,任務分配研究中使用的指標主要體現在問題模型的目標函數、約束條件以及算法評價三部分[70-80]。其中,目標函數和算法評價兩部分的指標結合可直接用于評估任務分配算法的性能。而任務分配模型中使用的約束條件主要包括集群個體自身性能約束、資源約束和協同約束3大類,如圖2所示。任務協同考慮的是集群個體數量與任務數量之間的關系;時間協同約束則考慮集群內個體到達任務區域的時間和任務執行時間等,以保證任務有序執行。

圖2 任務分配約束條件涉及指標Fig.2 Indexes involved in task allocation constraints
綜合梳理任務分配研究文獻中涉及的指標,得到的任務分配能力評估指標選取思路如表4所示。

表4 無人集群任務分配能力評估指標
2.2.2 集群路徑規劃
無人集群路徑規劃是集群協同執行任務的關鍵,指根據集群所處環境態勢信息及要完成的任務或任務序列信息,考慮集群內個體在時間、空間和任務上的協同問題、個體之間及個體與環境之間的碰撞避免問題等,在使集群性能最優化的前提下得到集群個體從當前位置至目標位置的最佳路徑[68]。進行協同路徑規劃過程中涉及到的關鍵技術包括地形獲取及建模、威脅及代價建模、路徑規劃算法選擇以及路徑平滑處理等[81]。
與集群任務規劃問題類似,路徑規劃本質上也是一個復雜的多目標優化問題[82]。類似地,路徑規劃研究文獻中所使用的指標在大多數情況下也體現在問題模型的目標函數、約束條件以及算法評價三部分[76,83-88]。但路徑規劃問題中的目標函數和約束條件并不像任務分配問題中那么規范和明確,有時直接與算法參數融合,比如文獻[89-91]中均是將路徑長度、障礙威脅、飛行高度、油耗、俯仰角等作為適應度函數的一部分來判斷粒子優劣,而不是直接作為約束條件。路徑規劃過程中考慮的約束條件大致可以分為集群個體自身性能約束、環境約束和集群協同約束3類[81-82],如圖3所示。綜合梳理路徑規劃研究文獻中涉及的指標,可得到如表5所示的指標選取思路。

圖3 路徑規劃約束條件涉及指標Fig.3 Indexes involved in path planning constraints

表5 無人集群路徑規劃能力評估指標
2.2.3 協同編隊控制
無人集群協同編隊控制是指無人集群在執行任務過程中,使集群形成并保持一定的幾何構型,以適應平臺性能、環境和任務等需求的技術[68,92]。編隊控制研究的主要問題包括:編隊生成、編隊保持和編隊動態重構[92-93]。與路徑規劃類似,在進行編隊控制研究時,需要綜合考慮集群個體間及集群與環境之間的碰撞避免問題。編隊控制技術的一般研究思路是:確定集群個體并對其建模;明確研究目標,選定合適的編隊控制方式;結合個體性能和環境信息,利用數學原理及控制理論設計個體控制律和編隊控制律,實現具體的控制算法,并證明算法收斂性和穩定性等[93]。
目前,無人集群編隊控制方式一般可分為領航跟隨法、虛擬結構法、人工勢場法、基于行為的方法和基于一致性的方法[93-95]。其中,領航跟隨法和虛擬結構法屬于集中式控制結構,其他方法屬于分布式控制結構。采用不同的編隊控制方式,編隊生成、保持和重構過程不同,集群個體之間的信息交互方式也有所區別,單一的控制方法很難適應復雜多變的任務環境。因此,許多學者將不同方法結合,提出了一些改進的編隊控制方法[96-97]。
通過分析一些編隊控制研究文獻中所使用的評價指標[93,97-102],可得當評估無人集群編隊控制算法性能或者編隊控制能力時,可采用的指標選取方式如表6所示。

表6 無人集群編隊控制能力評估指標
2.2.4 集群組網通信
無人集群組網通信技術是保證集群執行任務時涉及的控制指令、偵察圖像、飛行狀態等信息在相應傳輸鏈路中實時高效傳輸的手段,是集群進行信息交互、順利協同完成任務的基礎[103]。在進行相關研究時,首先要確定集群通信網絡架構。架構分為基于基礎設施的架構和基于自組網的架構,后者具有分布式、節點高速移動、自組織性、拓撲結構動態變化等特點[104-106]。在此基礎上,進一步關注集群網絡拓撲結構和路由協議設計。在研究集群網絡拓撲結構時,將集群內個體視為網絡節點,將個體之間的交互視為網絡的邊,涉及到拓撲結構優化、關鍵節點識別、網絡結構性能評估等研究[3,106-111]。整體上,無人集群組網通信研究所涉及的主要評價指標如圖4所示[3,106,112-114]。

圖4 無人集群組網通信能力評價指標Fig.4 Evaluation indexes of networking communication capability of unmanned swarm
圖4所示結果可直接作為相應研究的指標體系。比如,通信網絡拓撲結構評價指標可選用節點度、介數中心性、最大連通系數等網絡結構參數,彈性、韌性和魯棒性是對集群網絡結構性能的綜合衡量。在目前的研究中,集群結構彈性與韌性的含義相同,均是衡量集群在受到干擾的情況下,能否盡快恢復至特定狀態的能力[107-110];魯棒性則反映了集群在失去部分無人機后仍能保持功能并完成任務的能力[111]。
評估指標的選取和構建是無人集群試驗評估工作的重要基礎和關鍵,但目前無人集群綜合評估研究內容零散,還存在著指標名稱不一致、指標選取主觀性強、底層指標不易量化、指標體系構建結果與無人集群特點不契合等亟待解決的問題。而在無人集群關鍵技術研究中,不同文獻使用的指標類似且指標名稱描述較為一致,即具有較高共識,各項指標也比較容易理解和量化,能直觀有效地反映出關鍵技術模型和求解算法的性能。本文基于已有評估研究,分類梳理了無人集群綜合評估指標,并基于關鍵技術研究,提出了面向無人集群關鍵技術能力的評估指標設計思路,對未來相關領域的評估指標構建及指標規范性等研究工作具有一定借鑒意義。
無人集群試驗評估過程中的另一個重要部分是選定適當的評估方法,利用獲取的試驗數據計算出評估指標的值或指標體系的層層聚合結果。第2節所介紹的研究指標包括兩類:一類是可以直接測量計算、具有實際物理含義的指標,稱為基礎指標,比如表3中的底層指標、第2.2節各表中列出的指標;另一類是無法直接測量和計算、具有派生含義的指標,稱為綜合指標,比如表3中的評估內容與中間指標。本節將結合現有研究,對基礎指標和綜合指標的評估方法分別進行介紹。
基礎指標值的評估方法可分為數理統計方法和非統計方法。非統計方法進一步根據評估數據來源的不同,分為等效折算法、模型評估法、經驗評估法和不確定性數據評估方法,基礎指標評估方法如圖5所示。

圖5 基礎指標評估方法Fig.5 Evaluation methods of basic indexes
3.1.1 數理統計方法
數理統計方法是最基礎、最常用、最嚴格的方法,其基本原理是將需要評估的基礎指標表示為隨機變量或者隨機變量的數字特征,如均值、方差、標準差等。通過多次試驗獲得的數據,采用數理統計方法對該數字特征的值進行估計及檢驗,從而得到基礎指標的評估結果。采用數理統計方法評估基礎指標值的關鍵在于合理構建隨機量,并進行科學的統計估計(包括點估計和區間估計),以及假設檢驗過程。
數理統計方法應用眾多。比如,文獻[46]采用多個樣本點數據的平均值計算整個編隊的末端位置/姿態/速度誤差、航跡誤差等;文獻[57]中的目標數量完備性、離散屬性準確性、最長航跡段比、時效性等基礎指標均采用多樣本的平均值或比值直接求取;文獻[64]中的協同規避能力、協同攻擊能力分別采用平均值和求和得到;無人集群關鍵技術研究文獻中,在計算路徑長度、結果穩定性、編隊位置/速度誤差、隊形結構差異等評價指標值時,一般會直接采用統計估計的方法根據試驗數據求取。
3.1.2 非統計方法
無人裝備本身以及無人集群所處的任務環境復雜,由于人類認知的局限性,有些試驗數據的分布特征難以確定,無法科學合理地采用數理統計方法。此外,試驗數據的獲取、傳輸、分析等過程伴隨著多種不確定性。因此,需要采用等效折算法、模型評估法、經驗評估法等非統計方法評估基礎指標值。
等效折算法是指在改變應力的情況下進行試驗,獲得無法直接獲取的無人裝備基礎性能指標值,例如無人機的抗寒性指標。等效折算的數據可能有多種來源,比如應力加速(非標準條件下)試驗數據、各種類型的仿真試驗數據、相似裝備的試驗數據等。這些數據隱含著裝備在標準條件下的性能,但是需要對獲得數據的試驗條件、試驗精度等進行折算。在等效折算過程中,需要考慮折算結果的置信度。
模型評估法是指利用經典的或者已經經過驗證的經驗模型計算基礎指標值。這是在目前研究中被廣泛應用的一種方法,常用的經典模型包括歐氏距離公式、信息熵、網絡結構參數計算公式等。比如,文獻[46]根據歐氏距離公式給定末端位置/姿態/速度誤差等;文獻[57]采用圓的面積公式計算區域覆蓋率;文獻[55]和文獻[59]中的部署熵和信息熵的計算則均來自于香農所提的信息熵公式。模型評估法得到的結果客觀、可量化,但是在構建計算模型時一般需要簡化無人裝備自身性能和試驗環境,得到的基礎指標值與真實情況可能存在一定差距。
經驗評估法是指由領域專家依據個人經驗直接給出基礎指標的評估值。這種方法的主觀性最強,對領域專家知識和經驗的要求較高,一般情況下,需要依據多名專家的主觀評估結果進行進一步處理和計算,以盡量消除基礎指標值的隨機性。
不確定性數據處理方法是指針對無人集群試驗數據存在的模糊性、灰色性、隨機性、未確知性等多種不確定性,利用模糊數學、灰色系統理論、可能性理論、區間分析等方法確定基礎指標值。比如,文獻[8]針對無法精確獲取指標值的情況,使用不確定性集合評估每個基礎指標。
綜合指標的值通常需要兩個或兩個以上基礎指標聚合得到,一般評估思路為:深入分析綜合指標的含義,有針對性地構建評估指標體系;然后,利用適當方法獲得基礎指標值,給出基礎指標及中間指標的權重;最后,使用合適的評估方法將指標體系從下至上層層聚合,得到綜合指標的評估值。
目前,綜合指標評估方法有很多,本文根據各方法的內部機理和本質,將其分為經驗驅動方法、數據驅動方法、模型驅動方法和不確定性處理方法[115],如圖6所示。最底層加粗顯示的為目前無人集群評估文獻中已經使用的方法,未加粗的是理論上可行但還未被應用到無人集群評估研究中的方法。

圖6 綜合指標評估方法Fig.6 Evaluation methods of comprehensive indexes
3.2.1 經驗驅動方法
經驗驅動的評估方法屬于傳統方法,是指以人的主觀經驗或專業知識為主要依據的方法,常見的有專家經驗法、AHP和模糊綜合評價法。其中,專家經驗法的主觀性最強,一般可以采用德爾菲法、頭腦風暴法等具體操作方式。
AHP的核心思想是將復雜問題層層分解,然后借助人的主觀經驗,利用兩兩比較的方式確定每一層各元素之間的相對重要性[115-116]。AHP能夠將主觀的思維過程數學化,思想簡單、步驟簡潔、易于理解,在無人集群評估研究中應用廣泛;其不足之處在于,確定判斷矩陣的過程受人的主觀因素影響較大,且要求同層指標之間相互獨立,在實際情況中較難實現。文獻[8]將AHP評估結果用作與所提方法進行對比的基礎。文獻[56]和文獻[57]基于群AHP提出了一種區間變權求取策略。文獻[61]則使用AHP確定各層指標的權重,是評估研究中比較常用的一種應用方式。
模糊綜合評價法是一種以模糊數學為基礎,應用模糊關系合成原理,從多個因素對被評價事物隸屬等級情況進行綜合性評價的方法。模糊綜合評價法主要用于處理那些難以用簡單的好與不好評價的事物,且該事物的評價指標難以進行定量化的評估。文獻[117]在已有的無人集群網絡結構魯棒性評估結果基礎上,利用模糊綜合評價法對不同集群網絡結構的魯棒性進行對比尋優。
目前,經驗驅動的綜合指標評估方法在無人集群評估研究中常被用作多方案對比尋優分析。在4類評估方法中,經驗驅動方法的主觀性最強,但其能夠有效利用專家已有經驗和知識,具有較好的解釋性和靈活性。由于無人集群試驗評估中涉及的指標體系涵蓋范圍通常比較廣泛,很難保證各個指標都能通過試驗獲得具體量化值,對于一些不易量化的指標,經驗驅動方法依然是比較合理、有效的評估方法。
3.2.2 數據驅動方法
數據驅動的評估方法在大數據和人工智能技術基礎上發展而來,是指利用無人集群試驗過程中產生的海量數據,通過對歷史數據的處理和學習,建立指標輸入與輸出之間的非線性模型。當獲得新的指標輸入值時,該模型可以直接算出最終評價結果。這類方法包括神經網絡、支持向量機等[115]。
神經網絡方法是一種機器學習算法,具有強大的擬合表示能力。利用神經網絡進行無人集群綜合指標評估主要有兩種思路:一是利用神經網絡對作戰過程中采集到的圖像進行處理和分析,得到對作戰效能或作戰能力的評估結果,例如文獻[63]的研究;二是將底層指標值或已計算出的中間指標值作為輸入,將未知綜合指標值作為輸出,通過已有的大量歷史試驗數據訓練出最優的神經網絡評估模型。當有新的輸入數據時,可直接計算對應的綜合指標評估結果。神經網絡方法功能強大,能夠自主學習與調整;但是神經網絡隱藏層的設置是較難解決的問題,而且當指標體系更新時,需要重新進行模型訓練工作。
支持向量機是一種廣義線性分類器,其主要思想是在求解空間或者利用核函數轉化后的高維空間中尋找一個能夠實現樣本最優分類的超平面,用于解決分類或者回歸預測問題。支持向量機具有完備的數學理論基礎,同樣是機器學習領域的研究熱點,在小樣本情況下性能表現良好。利用支持向量機解決綜合指標評估問題的思路與神經網絡類似,在體系效能評估中應用較多,但目前無人集群評估文獻中還未涉及。
近年來,以數據為核心的評估方法研究逐漸增多,這也將是未來的主流研究[116]。無人集群本身具有智能化和交互涌現性的特點,在日常檢測和試驗過程中會產生大量數據,神經網絡等數據驅動方法能夠有效利用這些數據開展具有洞見性的評估工作,將成為不可或缺的智能化試驗評估手段。同時,機器學習領域已有的數據驅動算法可以為無人集群試驗評估模式提供啟發性的幫助。
3.2.3 數學模型驅動方法
數學模型驅動的評估方法,是以數學模型為基礎的方法,是指根據評估指標的含義及其相互關系,建立求解綜合指標的函數表達式,即數學評估模型。典型的數學模型驅動方法包括ADC法、數據包絡分析(data envelopment analysis, DEA)法和指數法等。
ADC法由美國工業界武器系統咨詢委員會在1965年提出,以有效性、可信性和能力3個要素為驅動來分析影響因素并評估作戰效能等綜合指標E=ADC。ADC法分析問題全面,思路清晰,最終得到的是無人集群作戰效能這類綜合評估值的評估結果。但是ADC法對使用者的要求較高,需要確定無人集群在執行任務過程中可能會出現的幾種狀態以及處于某種狀態的概率。另外,該方法對于瞬息萬變的戰場環境沒有自適應能力。文獻[65]采用仿真數據,基于ADC法對無人集群的協同作戰效能進行評估,并完成了不同方案的對比分析。
DEA法是運籌學、經濟學與統計學交叉研究的一個新領域,根據多指標投入、多指標產出,利用線性規劃的方法,對具有可比性的同類型單位進行相對有效性評估。DEA法的客觀性強,主要用于多案尋優分析問題中的綜合指標值計算。文獻[52]引入了11個投入指標和7個產出指標,基于DEA法對已有多無人偵察機編配方案的相對有效性進行科學評估后給出了優化建議。
數學模型驅動方法提供了比較成熟的評估框架和流程,能夠快速得到綜合指標的評估值,也常被用作多種可行方案的對比分析。由于無人集群評估涉及的指標范圍較廣,數學模型驅動的評估方法不僅能夠給評估指標體系的構建提供一定思路,還能夠科學計算綜合指標評估值,將是無人集群試驗評估初步探索研究中的重要方法。
3.2.4 不確定性處理方法
不確定性處理方法是指在評估指標聚合計算過程中,能夠有效處理由于試驗平臺本身、數據采集手段、人類認知有限等因素帶來的底層輸入指標取值不確定的評估方法。目前,評估決策領域常用的可以有效融合不確定性數據的方法包括貝葉斯網絡和證據推理規則(evidential reasoning rule, ER Rule)。
貝葉斯網絡是一個有向無環圖,節點表示評估指標,有向邊表示節點之間的作用關系,條件概率和先驗概率分別用于量化表達有父節點的邊和無父節點的邊的關系強度[116]?;谪惾~斯公式和全概率公式,貝葉斯網絡具有強大的推理能力,可在得到綜合指標評估值的同時,幫助直觀地分析各項基礎指標的影響程度,而且能夠圖形化描述并有效處理多源不確定性信息,適用于不確定環境下的無人集群特點。文獻[8]利用貝葉斯網絡解決戰場環境及任務執行過程中存在的不確定性因素,構建了無人機編隊作戰效能評估模型,并采用K2算法和最大似然估計分別進行結構和參數學習。
ER Rule由楊劍波等[118]在完善Dempster-Shafer理論的基礎上提出,與貝葉斯網絡相比,ER Rule構成了一個通用的聯合概率推理過程,能夠處理更多類型的不確定性信息。使用ER Rule時,需要首先確定各評估指標的評估等級及參考值,從而能夠結合專家經驗或歷史數據。同時,最終評估結果一般用不確定形式表達,便于進行更深入的分析和決策。文獻[58]結合無人機集群態勢感知過程中面臨的強不確定性,基于ER Rule提出一種考慮擾動的評估方法,通過仿真試驗驗證了所提方法在不確定性表達和集群環境適應性研究方面的有效性。
無人集群系統平臺本身、無人集群所面臨的作戰環境等都存在著多種不確定性,人們在試驗評估過程中的知識和經驗也比較有限,因此無人集群試驗評估工作需要重點關注評估指標取值具有不確定性的問題。除上述已有應用研究,不確定性處理方法還能夠解決無人集群試驗評估指標取值類型多樣(比如區間值和精確值共存)以及評估指標之間的相關性無法輕易忽略等問題。
對于基礎指標,大多數已有研究都是采用數理統計和構建合理數學模型的方法進行評估計算。其中,無人集群評估文獻中,采用數學模型計算基礎指標值的研究較多;而在關鍵技術研究中,多數指標值直接由仿真試驗輸出得到??傮w上而言,集群關鍵技術研究中基礎指標的計算都比較簡單,即比較容易實現量化,集群評估研究中基礎指標的評估方法則稍復雜些。
已有研究針對綜合指標所使用評估方法的特點、數據和適用情景進行了總結,結果如表7所示。其中,AHP法和ADC法的應用最為廣泛,前者仍然是確定指標權重的常用方法,能夠減少對專家知識的依賴性,并使評估結果更加合理??傮w而言,雖然目前研究中使用的無人集群綜合指標評估方法類型較為廣泛,但是每種方法的應用數量還不多,大多數研究將主要創新點體現在研究問題分析、評估指標體系構建和底層指標量化計算研究中。另外,無人集群在任務執行的過程中是個不斷移動和變化的整體,一般需要動態地得到作戰能力和作戰效能的評估結果,才能支持實時動態的決策,實現整個集群的自適應重組,目前該領域的研究還處于空白狀態。

表7 常用評估方法總結
4類綜合指標評估方法分別提供了一種特殊的評估計算范式和流程,無人集群具有典型的自主協同性和系統涌現性,明確評估的目標和角度是確定具體評估方法的基礎。綜合來看,由于無人集群試驗評估指標數量較多、類型豐富,試驗中產生的數據量比較大,數據驅動的智能化評估方法將成為未來研究和實際應用中的主流。其基于已有數據進行學習和訓練,無需考慮指標之間的關聯關系,而且得到的模型能夠直接用于后續類似的試驗場景中。但是,數據驅動方法需要一定數量的歷史數據,這就需要先借助其他3類方法獲得相應的評估結論。經驗驅動方法和數學模型驅動方法是比較傳統的評估方法,原理和計算過程簡單,適用于初期的無人集群試驗評估。不確定性處理方法則可看作是對其進行泛化處理,能夠處理確定性數據和不確定性數據混合的情況,融合底層數據的不確定性,從而使基于試驗評估的決策工作更加符合實際。總之,數據驅動方法與其他3類方法結合是比較合理的評估模式。
為了促進我國面向無人集群類智能裝備系統試驗評估的理論發展,加速無人集群相關研究成果向實戰化應用邁進,本文首先總結了國內外開展的無人集群試驗評估規劃和項目實踐成果,對我國相關試驗評估工作處于初步探索階段的現狀進行了分析。然后,從感知、分析、決策和行動4個方面分類梳理了無人集群綜合評估指標,進而分析了目前無人集群評估研究中指標選取的特點和存在的問題,并針對集群任務分配、路徑規劃、編隊控制和組網通信4項關鍵技術能力,提出了對應能力評估指標的設計思路。最后,按照指標含義及計算方式,將其分為基礎指標和綜合指標,分類介紹了相應的評估方法,并總結了常用方法的特點和適用場景等。
總體而言,針對無人集群試驗評估,美國已經在相關領域開展了充分的理論框架探索和試驗項目,經驗積累充足;我國則還需要在無人集群試驗評估規范性理論制度研究、體系化項目統籌、標準式評估指標構建和評估方法選取等多方面進行探索和努力。本文研究對后續無人集群試驗評估中的指標體系構建和評估方法研究工作具有一定的參考意義。