許瑞明
(軍事科學院評估論證研究中心,北京 100091)
無人機以其諸多優勢已成為戰場上的新寵,無人機集群作戰已經或即將成為未來的重要作戰方式。美軍《2016—2036 年小型無人機系統飛行規劃》把“蜂群”作戰作為小型無人機的4種作戰運用方式之一,提出了小型無人機“蜂群”協同作戰構想,開發了包括小精靈(Gremlins)、灰山鶉(Perdix)、低成本無人機集群技術(LOCUST)等多個無人機集群作戰項目[1-2]。近期無人機集群在敘利亞戰爭、也門戰爭中的表現已反映出無人機集群作戰所具有的充分潛力。
智能技術是包括無人機在內的各類無人系統的重要技術支撐,無人機及其集群能自主判斷、決策和行動,靠的是智能的支持。目前,集群智能研究已成為學界的一大熱門研究領域,研究成果不勝枚舉。但對于無人機集群來講,其智能的生成模式及其應用實現途徑等智能生成樣式問題還缺乏聯系實際的探索和系統歸納,該問題的回答可為無人機集群未來作戰的力量編成、作戰運用設計提供基礎支撐,也可為無人機集群智能生成技術研發提供需求指引。
無人機集群是由多個無人機組成的空中無人機集群及其地面站共同形成的完成特定任務的有機整體。集群中的無人機可以是同構的,也可以是異構的;集群中的無人機數量少可以數架,多可以成百上千架。
無人機集群是一種物理表象,其智能的生成有2種:一種是群體智能的涌現性體現,如群體內部的自洽或自治;另一種是由更高的智能體賦予,如人的干預、地面或集群內部的中心節點干預等。
關于群體智能的涌現性體現,較早的研究來自對自然界中蜜蜂、螞蟻等昆蟲群體行為的觀察。這些昆蟲個體的智能并不高,看起來并沒有集中的指揮,但它們卻能協同工作,依靠群體的能力,發揮出超出個體的宏觀層面上的智能,這種生物通過協作表現出的宏觀智能行為特征被稱為群體智能(swarm intelligence)[3-5]。國內外學者借鑒各類生物群體智能涌現機理開發了一系列群體智能優化算法,成果頗豐。自1991年開始,國內外學者相繼提出了蟻群優化算法、粒子群優化算法、人工蜂群算法、人工魚群算法、狼群算法等群體智能優化算法,并持續加以改進[6-7]。
從智能生成主體視角看,群體智能的涌現性體現可歸類于分布式智能生成,由更高的智能體賦予智能可歸類于集中式智能生成。參考分布式智能的多Agent系統和分布式問題求解兩大研究方向[8],可將群體智能的涌現性體現區分為仿生行為式智能生成和功能分布式智能生成2種生成模式。仿生行為式智能生成是指無人機個體直接模仿生物個體簡單智能行為,通過無人機個體間交互涌現出無人機集群整體層次智能的一種模式。功能分布式智能生成是指把智能生成任務分解為多個子任務賦予各個無人機個體,通過協同求解生成集群智能的一種模式。概括起來,無人機集群智能的生成模式可區分為集中式、仿生行為式和功能分布式3種。
智能生成還有一種理解是通過大量樣本訓練提升任務的完成能力,本文并未涉及這一范疇,主要有2點考慮:一是該范疇研究視角與本文不同;二是該范疇內容極其豐富,需要專門撰文研究分析。
對于無人機集群來講,集中式智能生成主要應用于戰前的任務規劃和戰中的任務再規劃。
智能應用于戰前任務規劃主要體現在任務分解與調度、任務資源分配、航路規劃等幾個環節,其應用實現的主體為地面站。
任務分解與調度模糊空間大,應由軍事人員和機器協同完成。其中軍事人員提供任務分解和調度知識、對機器提供的任務分解和調度方案作修改調整和確認;機器基于任務分解和調度知識,依靠推理工具給出任務分解和調度方案。層次任務網絡(hierarchical task network,HTN)是一種基于分層抽象和領域知識的智能規劃技術,其主要思想是利用領域知識遞歸地將復雜抽象的任務進行逐層分解,直到可以通過執行規劃動作就能完成的原子任務為止[9]。以層次任務網絡為規劃器,結合框架等知識表示手段,可有效實現任務分解和調度的有限智能推理。
任務資源分配以機器為主完成,軍事人員對機器提供的分配方案作局部調整和最終確認。當任務資源分配問題比較簡單時,傳統優化方法如線性規劃、整數規劃等可用于任務資源分配。但在影響因素多、分配關系復雜情況下,傳統優化方法往往不夠有效。自然計算領域中的大多數方法是任務資源分配的有效方法。自然計算(nature-inspired computation)是各類相關自然科學和計算機科學相互交叉而產生的研究領域。自然計算方法包括進化計算算法、生物啟發計算算法、群體智能優化算法等[10-11]。
航路規劃應基本以機器為主完成,軍事人員對機器提供的航路規劃方案作個別調整和最終確認。無人機航路規劃是指依據具體任務明確飛行約束條件,尋找從起點到終點的最優或較優的可行航路。優化準則和約束條件與具體任務有關。通常,航路規劃選擇路線最安全、油耗最少、路線最短、時間最短等其中一個或數個作為優化準則。線路安全需要考慮地形起伏、惡劣天氣、障礙物、火力、探測、干擾等威脅因素。約束條件通常包括性能約束和任務約束。性能約束如最高最低飛行高度、最高最低飛行速度、最大偏航角、最大爬升/下降角、最小轉彎半徑、最小航路段長度等約束。任務約束如禁飛區、時域協同、空域協同、進入任務區方向等約束。航路規劃算法多種多樣,還沒有統一的分類標準。目前公認比較有效的算法是啟發式優化算法,主要指自然計算領域中的遺傳算法、神經網絡算法、蟻群算法、粒子群優化算法、模擬退火法等。
智能應用于戰中任務再規劃主要體現在任務調整和航路再規劃2個環節,其應用實現的主體既可以是地面站,也可以是空中無人機集群中某個擔負中心節點角色的無人機。
任務調整和航路再規劃除了可采用戰前任務規劃所用智能算法外,在地面站還可采用平行系統方法實現智能效果。
平行系統方法是一種新穎的輔助決策方法,它構建與現實系統對應的一個或多個虛擬或理想的人工系統,將實際系統與人工系統相互連接,對二者之間的行為進行對比和分析,完成對各自未來的狀況的“借鑒”和“預估”,完成對實際系統的管理與控制[12]。以平行系統理論為指導,中山大學陳龍等專家提出了平行無人系統的概念和框架,對平行無人系統的建模、平行學習、平行規劃、平行控制等關鍵技術進行了研究,并設計了平行駕駛驗證平臺和平行機器人驗證平臺,驗證了平行無人系統框架的可行性[13]。
借鑒平行系統思想,參考平行無人系統和平行機群[14]設計,一種平行無人機集群系統架構如圖1所示。圖1中,人工空中無人機集群、地面控制平臺、空地通信部件、指控小組屬于地面站的組成部分;實際空中無人機集群和人工空中無人機集群對應于平行系統中的實際系統和人工系統;地面控制平臺執行實際空中無人機集群的態勢顯示與控制;指控小組控制地面控制平臺和人工空中無人機集群的運行,通過地面控制平臺實現對實際空中無人機集群的指揮控制。地面控制平臺通過空地通信部件與實際空中無人機集群實現雙向信息交流;人工空中無人機集群單向接收空中無人機集群的信息;人工空中無人機集群與地面控制平臺直接互聯,實現雙向信息交流。

圖1 一種平行無人機集群系統架構Fig.1 A parallel UAV cluster system architecture
基于上述平行系統架構,無人機集群地面站智能生成機理本質上可歸納為通過優化實現智能效果。人工空中無人機集群與實際空中無人機集群平行執行,人工空中無人機集群從實際空中無人機集群定期接收戰場態勢信息,從地面控制平臺實時獲取指控信息,針對戰場態勢新變化生成任務分配和航路規劃新方案,并通過快速仿真實驗實現方案對比,得到任務分配和航路規劃新的優化方案,并將新的優化方案傳到地面指控平臺。指控小組依據新的優化方案做出指控決策。
需要強調的一點是:平行系統方法成立的前提條件是地空通信延遲與地面計算能力滿足任務調整和航路再規劃時限性要求。
借鑒生物群智能涌現機理,可以將成本相對低廉、功能相對簡單的多個無人機組成無人機集群,通過無人機間、無人機與環境間的交互實現無人機集群的智能涌現以完成復雜的作戰任務。仿生行為式智能生成主要可用于陌生環境下航路搜索、攻擊與優化,以及集群隊形控制2個方向。
(1) 個體能力要求
如果無人機集群僅僅局限于模仿生物集群的搜索與簡單攻擊行為,則其個體能力可以相對簡單,一般有以下幾個方面:一是機動能力滿足動力學運動學要求;二是具有識別目標(如螞蟻識別食物、狼識別獵物)的能力;三是個體間的簡單通信能力;四是具有攻擊小型目標的能力。
滿足這些功能要求的無人機可以做得比較廉價,因而可以大量配備。
(2) 行動過程與規則
以無人機集群搜索打擊劫持人質的匪徒為例。
數名匪徒將多名群眾劫持為人質于一內部結構未知的建筑物內,匪徒與人質處于建筑物內部何處不得而知。建筑物各個大門被匪徒關閉,有部分窗戶破損可以進出微型無人機。無人機集群的任務是從出發地隱蔽接近建筑物,然后找到破損窗戶,從破損窗戶進入建筑物,尋找到達匪徒所在位置的通道,并擊斃或制服全部匪徒。
行動過程如下:
第1步:輸入任務指令和參數。任務指令:擊斃或制服匪徒;參數:匪徒識別特征,匪徒所處建筑物的位置、外觀。
第2步:隱蔽接近建筑物。無人機集群根據指令,自主飛行到建筑物附近隱蔽集結。
第3步:搜索破損窗戶。各搜索無人機圍繞建筑物按一定搜索策略(如平行搜索)進行搜索,發現破損窗戶或到達指定時間后報告搜索情況。
第4步:搜索目標和可行飛行通道。各搜索無人機隨機選擇從多個破損窗戶中的一個進入建筑物,并在建筑物內各個房間隨機搜索,發現目標或到達指定時間后報告搜索情況。期間,為避免重復搜索,搜索無人機與鄰近無人機交換已搜索區域的信息。
第5步:對目標攻擊。攻擊無人機根據搜索無人機提供的通道信息,選擇優化路徑,飛行至目標區域,對目標實施攻擊。
第6步:返回。完成攻擊的無人機在集結處集中,到達規定的時間后集體返回到出發地。
行動規則如下:
路徑選擇。如果多于一條無人機進出通道,則選擇路徑短、暴露時間少的一條。
目標在多處時攻擊無人機的選擇。各攻擊無人機按照各處目標數量占比隨機選擇一處目標。
攻擊目標選擇。攻擊無人機到達目標區后,隨機選擇一個目標進行攻擊,后續攻擊無人機在未被選擇目標中隨機選擇一個目標進行攻擊。
(3) 特點分析
仿生行為式智能生成有如下特點:
1) 無人機個體功能簡單,因而廉價,可以大量制造。
2) 尋優是可靠的。因為群體中個體數量眾多,部分個體失效并不影響整體尋優的效果。
3) 可以并行執行任務。盡管存在冗余,單位效率不高,但由于個體眾多,因此可以并行執行任務,如多個個體同時執行搜索任務。
4) 群體尋優效率不高。因為存在冗余,又沒有中央控制,其尋優的資源分配并不是高度有序的,重復作業現象廣泛存在,因而尋優的效率是不高的。
無人機集群隊形控制是仿生行為式智能生成應用的另一個重要方向。
關于集群隊形控制,大體上可區分為局部規則控制法、長機—僚機法、人工勢場法、虛擬結構法、一致性控制法等[4,15-16]。其中,局部規則控制法是完全采用仿生行為式智能生成的方法。局部規則控制法基于個體對鄰近個體的局部感知,在簡單規則支持下實現對集群整體隊形的智能控制。
鳥群行為機制對于無人機集群編隊協調自主控制具有很多借鑒意義。①二者所受到的環境干擾因素(比如強光照,厚云層以及不穩定氣流等) 基本相同,鳥群系統中的集群運動機制對于這類特性環境噪聲的抗干擾性恰恰也是設計無人機集群系統協調控制算法所需要的;②任務環境均要求二者只能在運動中進行交互;③二者在任務需求上均需要實現在避免個體發生碰撞的基礎上,嘗試與鄰居個體保持接近,同時與其速度一致[17]。
Reynolds在對鳥群運動研究的基礎上,于1986年提出Boid模型,該模型內個體可感知周圍一定范圍內鄰近個體的飛行信息,并遵從3種基本行為準則—聚集(cohesion)、分離(separation) 和對齊(alignment),指導其做出下一步的飛行決策。基于Boid模型及相關擴展研究成果所構建的規則,無人機集群能夠完成隊形保持、避障等基本動作,實現集群隊形基于簡單規則的有限智能控制。對于集群隊形切換、縮放、旋轉等復雜動作,還需要在無人機個體獲取指控信息條件下,采用特定的隊形切換、縮放、旋轉算法才能實現。
功能分布式智能生成主要可用于信息融合、威脅判斷、任務調整與航路再規劃等方向。
信息融合是人們通過對空間分布的多源信息——各種傳感器的時空采樣,對所關心的目標進行檢測、關聯(相關)、跟蹤、估計和綜合等多級多功能處理,以更高的精度、較高的概率或置信度得到人們所需要的目標狀態和身份估計,以及完整、及時的態勢評估,為指揮員提供有用的決策信息。信息融合可采用多種智能方法,如貝葉斯推理方法、Dempster-Shafer方法、模糊集合理論、聚類分析方法、專家系統方法、人工神經網絡方法等[18]。
無人機集群的信息融合采用分布式的信息融合結構,其融合任務由多個個體平臺按照預先約定規則共同協作完成。如對運動目標的信息融合,大多數無人機個體完成局部估計,擔負融合中心任務的少數個體基于局部估計完成全局估計。信息融合的任何單個個體平臺都不具備獨立完成信息融合任務的能力,但將各個個體平臺通過有限的通信聯絡組織起來,就可以完成較為復雜的信息融合任務,實現了基于分布式問題求解的智能涌現。
威脅判斷可采用與信息融合類似算法或更簡單的算法實現。威脅判斷結論需要軍事人員的最后確認。
無人機集群任務調整與航路再規劃可采用任務資源分配、航路規劃所用的啟發式優化算法,如果時效性不滿足要求,可通過適當放寬算法收斂條件來解決。此外,無人機集群任務調整與航路再規劃還需在線分布式實現。參與任務調整與航路再規劃的各個無人機在計算時要反復與其他個體交互規劃過程信息和結果信息。為此,無人機集群任務調整與航路再規劃宜采用異步并行推進策略[19]。
無人機集群智能的生成模式及其應用實現途徑等智能生成樣式問題研究是無人機集群作戰力量編成確定和作戰運用設計的基礎支撐。從智能生成的主體及其相互關系視角看,無人機集群智能的生成模式可歸結為集中式、仿生行為式和功能分布式3種。
無人機集群智能生成方法廣泛多樣,傳統優化方法可用但適應面比較窄,自然計算領域的大多數方法是無人機集群智能的有效生成方法;平行系統方法是一種新穎的輔助決策方法,能在一定條件下應用于地面站對空中無人機集群的任務調整和航路再規劃;仿生行為智能生成方法有望用于陌生環境下航路搜索攻擊與優化、集群隊形保持和避障的有限智能控制。