謝偉,陶浩*,龔俊斌,羅威,尹逢川,梁曉龍
1 中國艦船研究設計中心,湖北 武漢 430064
2 空軍工程大學 空管領航學院,陜西 西安 710051
近年來,隨著電子信息、智能控制等技術的快速發展以及在軍事上的不斷應用,軍用無人系統的性能得到躍升,但仍受限于單體能力而難以形成規模化作戰能力。無人系統集群、協同作戰是解決此問題的重要途徑,也是無人系統裝備技術發展的重點。美、英、法等主要軍事強國正將其作為提升裝備體系整體作戰效能的重要抓手之一,通過不斷增加經費投入,加快新概念、新技術的演示驗證工作來推進實戰化應用,并已初見成效。
無人系統集群大致可以分為無人機 (UAV)集群,水面無人艇 (USV) 集群和無人水下機器人(UUV)集群。其中,無人機集群技術發展得最迅速,在發展思路、技術途徑等方面呈現出百花齊放的態勢。1980 年代,美、俄等國就已重視水下無人裝備的運用。近10 年來,這些國家加快了水下無人系統集群技術的驗證,以及小規模應用。目前,美國海軍已完成了執行反潛探測任務的無人水下機器人集群技術的演示驗證,已實現在深海、淺海的大范圍反潛探測。不僅如此,在水面無人系統方面,美國海軍也已開始探索集群作戰,以突破執行使命任務的技術瓶頸,最終于2016 年實現了水面無人艇集群自主執行目標探測與識別、跟蹤、巡邏等任務。
跨域異構無人系統集群指的是無人機、水面無人艇、無人水下機器人等不同類型的無人系統在空中、水面、水下等不同作戰域之間的協同控制。截至目前,美、英、法等國重點驗證了無人系統間跨域協同通信和指控能力,并均已取得一定的進展。
目前,雖然尚無法全面準確地判斷無人系統集群在未來海戰、空戰中的定位,但隨著技術的不斷進步,無人系統集群將逐步由概念走向實裝應用,其所呈現出的應用場景也將越來越來清晰。因此,加快我國在無人系統集群及其協同作戰方面的研究,對于探索未來戰爭模式、裝備應用落地以及推動海軍武器裝備創新發展都具有重要意義。
首先,本文將系統回顧國內外無人機集群、水面無人艇集群、無人水下機器人集群和跨域無人系統集群的發展現狀;然后,全面論述無人系統集群的共性關鍵技術研究進展,并著重分析各項關鍵技術的主要研究思路、代表性算法及其研究趨勢,期望能夠為海上無人系統集群技術研究提供有益的參考和借鑒。
無人機集群是由一定數量的單一功能或者多功能無人駕駛飛行器組成的空中移動系統,其以交感網絡為基礎,具有整體作戰能力涌現和行為可測、可控、可用的特點。在無人系統集群類型方面,無人機集群研究得最多,理念也最成熟[1]。
無人機集群概念最早于1990 年代末由美國率先提出。在美國國防部國防先期研究計劃局(DARPA)和海軍研究辦公室(ONR)等單位的支持下,開展了無人機集群作戰概念的探索和原理技術驗證。2016 年5 月,美國空軍發布了《2016~2036 年小型無人機系統飛行規劃》,在規劃中,闡述了4 種集群作戰概念:“蜂群”(亦即“集群”)、“編組”、“忠誠僚機”和“誘餌”。根據發展戰略,實施了大量研究項目,其中包括如下幾個典型的項目:
1) “小精靈”(Gremlin)低成本無人機項目。
2015 年8 月項目啟動,根據研究目標,無人機可快速換裝情報、監視和偵察(ISR)等傳感器模塊,并可選用非動能有效載荷。無人機通過C130 運輸機搭載至敵方前沿陣地,發射后實施穿插滲透,執行ISR 任務,任務完成后可回收和重復使用。
2) “低成本無人機集群技術”(low-cost UAV swarming technology, LOCUST) 項目。
該項目設想在陸地或艦船上釋放大量小型無人機,通過自適應組網、自治與協同,執行偵察、監視或者對陸及對海攻擊任務。2016 年4 月,在陸上演示了30 s 內連續發射30 架“郊狼”(Coyote)無人機和編組飛行的試驗。
3) “山鶉”(Perdix)微型無人機機載高速發射演示項目。
2017 年1 月, 美 國 海 軍 公 布 了3 架F/A-18F“超級大黃蜂”戰斗機以0.6 Mach 速度投放103 架“山鶉”無人機的演示結果。
4) “進攻性蜂群使能戰術”(offensive swarmenabled tactics, OFFSET)項目。
該項目于2017 年1 月啟動,旨在開發和測試用于無人系統集群的體系架構、博弈軟件以及用于分布式機器人的系統與算法,發展可以控制集群的原型系統。
根據國內有關報道,在無人機集群技術研究領域,國防科大、空軍工程大學等軍內院校開展了基礎理論研究、作戰仿真實驗和無人機編隊飛行演示驗證。復旦大學、南京航空航天大學等高校開展了無人機集群編隊、協同規劃技術的研究,并取得了一定的研究成果。在原型系統研發方面,航天三院開展了一定數量的無人機半實物仿真實驗,驗證了集群技術原理; 中國電科集團電科院、清華大學和泊松科技公司合作,于2016 年11 月在珠海航展上公布了67 架規模的無人機集群編隊飛行原理驗證測試結果,2017 年6 月,該團隊還進行了119 架固定翼無人機集群的飛行試驗,演示了密集彈射起飛、空中集結、多目標分組、編隊合圍、集群行動等動作概念,2018 年5 月,完成了200 架無人機集群飛行演示驗證[2]。
1980 年代,美國率先提出了海上無人系統集群的概念。海上無人系統集群是指通過智能化的指揮、協同控制和信息交互,將水面無人艇集群、無人水下機器人集群進行有機集成。水面無人艇集群作為重要一環,現已得到高度重視及廣泛研究。
近10 年內,國內外對水面無人艇集群作戰進行了一些試驗驗證。例如,在2014 年8 月,美國海軍研究辦公室在弗吉尼亞州詹姆斯河開展了13 艘水面無人艇集群協同搜索、圍捕的試驗,驗證了“分散與數據自動融合系統”(decentralized and autonomous data fusion service, DADFS)和“機器人智能感知系統控制體系架構”(control architecturefor robotic agent command and sensing,CARACaS)這兩個軟件在實現水面無人艇集群協同完成任務分解和自主決策方面的有效性。由于上述系統在目標識別、攔截等方面還需要人工輔助,所以僅實現了半自主的無人協同作戰。2016 年10 月,美國海軍研究辦公室還開展了4 艇協同對海面目標自主察打跟蹤的試驗,并取得了成功,這標志著美國成為了首個實現水面無人艇集群自主作戰的國家; 2018 年1 月,中國華中科技大學實現了4 艘水面無人艇組網,并進行了協同勘探、巡邏緝私、物資投送、污染清理等試驗;同年5 月,云洲智能公司使用56 艘水面無人艇,驗證了航跡規劃、編隊控制、集群內部沖突解脫算法的有效性。綜上所述,在水面無人艇集群方面,我國相關研究的起步較晚,目前實現的水面無人艇集群協同控制與智能化程度距國際先進水平尚有一定的差距。
無人水下機器人從1960 年代開始逐步發展。近些年,大型化、綜合化和多任務作戰能力成為了美、俄兩國無人水下機器人發展的主要方向。在無人水下機器人集群領域,其他國家也競相投入力量開展相應研究,在軍用和民用方面得到了初步應用到了初步應用[3]。
2008~2009 年,歐盟的GREX 項目驗證了在有限通信條件下的編隊航行。2010 年,美國國防先期研究計劃局開始研發“分布式敏捷反潛系統”(distributed agile submarine hunting, DASH),探索利用無人系統集群實施反潛探測,并于2015年7 月在菲律賓海域由40 艘無人水下機器組成的“海底星座”網絡成功實施了大范圍反潛探測演示驗證。2006 年,美國海軍研究辦公室提出了“近海水下持續監視網”(persistent littoral undersea surveillance network,PLUSNet)項目,旨在利用“俄亥俄”級戰略核潛艇搭載無人水下機器集群以加強潛艇對近海環境的反潛探測能力,2013 年9 月,項目完成了5 個節點的水下網絡初步測試,2015 年,成功完成各項海上測試,目前已小規模部署進行作戰評估。2016 年,英國在“無人戰士”(unmanned warrior)軍演中進行了無人水下機器集群作戰演示。此外,美海軍在“分布式偵察與探測的協作自主性”(cooperative autonomy for distributed reconnaissance and exploration,CADRE)系統研究項目的協同框架下開展并驗證了無人水下機器集群掃雷任務。目前,我國在無人水下機器集群研究方面仍處于編隊航行、協同作戰概念探索及水下組網通信等關鍵技術研究階段,例如,哈爾濱工程大學進行了6~9 艘小型無人水下機器群組的中繼通信、動態組網、航行控制、群組指控、相對導航等試驗。
無人機、水面無人艇和無人水下機器人集群技術的進步為跨域海上無人系統集群的發展奠定了基礎,這些技術可用于無人系統的協同偵察、快速強力突擊、全域集群瀕海對抗、精準高效保障等任務[4]。目前,在跨域海上無人系統集群作戰方面,主要有美、英、法幾個國家通過演習進行了作戰概念驗證,重點驗證跨域通信和指控能力,并在近幾年不斷取得突破。具體驗證項目如表1 所示。
由表1 可見,國外美、英、法這幾個國家已在跨域無人系統集群協同作戰領域開展了卓有成效的研究工作,從多個角度驗證了集群協同作戰概念的可行性,初步解決了與無人系統集群、協同作戰密切相關的集群發射回收、編隊機動、自主控制與任務管理、信息共享、跨域通信指控等關鍵技術問題,有望在未來十年內加速發展并形成規模化作戰能力。
目前,無人系統集群正朝著自主化、協同化、多樣化的方向發展。未來,無人系統集群必須能夠與有人系統無縫集成,且擁有很強的自主行為能力及自主控制能力,以便在瞬息萬變的環境下能夠獨立或協同完成復雜任務。結合國內外研究現狀,分析得到未來海上無人系統集群技術將呈現如下發展趨勢:

表1 國外海上跨域無人系統集群典型項目Table 1 Typical demonstration projects of cross-domain swarm operations of marine unmanned vehicle
1) 作戰任務由執行相對簡單的偵察監視任務向主流作戰任務方向發展。
當前,無人系統集群執行的主要任務基本上還是以傳統的ISR 任務為主,隨著技術日漸成熟,未來將逐漸向需要更強決策控制能力、可壓制敵防空系統及縱深突防攻擊等復雜任務方面擴展。
2) 集群控制由簡單遙控、程控方式向人機智能融合的交互控制方式轉變,并逐步向全自主控制方式發展。
有別于有人裝備,無人系統的控制水平是實現無人操控和執行各種任務的關鍵。當前,無人系統集群智能化水平還較低,各平臺控制方式主要以簡單的遙控和預編程控制為主。隨著無人系統智能化水平的提高,未來其控制方式將向更先進的人機交互和全自主控制方向發展,以適應復雜、動態、對抗、不確定的真實作戰環境下的作戰任務要求。
3) 體系結構由專用化、單一化向通用化、標準化、互操作方向發展。
互操作技術可提高無人系統集群執行作戰任務時的協同作戰能力。美軍已著手研究通用控制技術,使無人系統能夠在控制、通信、數據、數據鏈等方面達到更高的互操作性。通用化將使無人系統集群的可維護性和集成性更便捷,快速融入現有的有人作戰體系,從而提高體系作戰能力。
無人系統集群是以集群智能控制算法和協同感知、協同任務規劃及高效低成本平臺技術為基礎,圍繞任務目標,形成以無中心、群控制、高涌現等為特征的整體作戰群組。由于無人系統集群可執行的任務復雜多樣,自適應環境,對抗交換成本低,抗毀性高,直接通信量小,具有顛覆未來戰爭樣式的潛力,所以美軍將其列為實現第3 次抵消戰略的顛覆性技術之一。然而,若要形成作戰能力,無人系統集群需要具備通信自組網、協同態勢感知、任務分配、航跡規劃、編隊控制和虛擬測試這些關鍵技術。
靈活、高速和可靠的通信網絡是實現無人系統集群實時信息交互傳輸的基礎,而網絡分簇和拓撲結構優化是現有研究的主要方面。
網絡分簇通過網絡結構分層來提高網絡通信效率,算法一般包括最低ID、最高節點度、基于權重的分簇等。在傳統方法的基礎上,有學者提出了可避免將能量低的無人機選為簇首的基于能量的權重分簇算法。文獻[5]提出了CB-MAC 協議,該協議對簇的形成過程進行了定義,更適用于集群通信。
網絡拓撲結構優化主要解決通信網絡連通性的問題。在此基礎上,優化通信功率,降低內部干擾,提高網絡抗毀傷能力,分別包括基于位置、方向、鄰居節點和最短路徑的拓撲控制算法等。文獻[6]給出了一種基于學習自動機的拓撲控制協 議(learning based topology control mechanism,LBLATC),該協議的特點是,每個傳感器節點的學習自動機利用相鄰傳感器節點的學習自動機產生的增強信號來選擇合適的節點傳輸范圍。文獻[7]給出了2 種基于位置輔助的網格拓撲控制算法, 也稱貪婪基跟蹤(greedy basis pursuit, GBP)算法,該算法的設計目標旨在有效減少保持全局網絡連通性所需的活動節點數。為了解決傳統網絡拓撲控制忽略網絡容量的問題,文獻[8]給出了綜合平衡網絡容量和網絡傳輸能耗的網絡拓撲控制算法。文獻[9]給出了節能拓撲控制算法(energy efficient topology control algorithm, EETCA),該算法可以移除具有高丟包率的鏈路,求解得到符合網絡傳輸能耗約束的最優拓撲,以降低節點的能量消耗。
與傳統的無人機集群通信相比,跨域無人系統集群自組網有其自身特點:
1) 不同域的信道容量和延遲存在差異。信號傳遞介質不同,傳遞信息的距離、速率、帶寬、容量和延遲也會有較大的不同,而空中通信網絡在上述各方面都比水下通信網絡表現優異。采用水聲通信技術的水下通信網絡雖然傳輸距離可達到數十公里,但其傳輸的可用帶寬被限制在20 Hz的低頻范圍內,傳輸速率有限(約每秒幾十千比特),帶寬和速率遠遠低于空中射頻通信。
2) 不同域的節點移動速度差異使拓撲結構呈現高頻動態變化。移動速度由高到低分別為無人機、水面無人艇和無人水下機器人,由于這3 種平臺的移動速度不匹配,集群之間和集群內部通信拓撲的變化會更頻繁。
3) 跨域無人系統的狀態多樣性[10]。同一時刻,跨域無人系統內可能會同時執行搜索、干擾、跟蹤和攻擊任務,這也就需要通信網絡能夠智能調配資源以支持低延時和高并發需求的任務,例如實時決策、協同感知等。
綜上所述,面對基于海上跨域無人系統集群作戰的新場景,未來通信網絡拓撲可以從如下方面展開研究:通信拓撲構建、跨域通信時中繼節點選擇、同域中繼節點選擇、通信拓撲隨平臺運動自適應變化、隨任務變化的通信資源智能分配、通信拓撲抗毀傷評估等。
無人系統集群感知信息具有的多源性、異構性、多維和動態性特點,使各類傳感器的數據適配和分布式多平臺感知信息的融合過程變得異常復雜[11-12]。有鑒于無人系統航行過程中多傳感器之間存在信息沖突的問題,文獻[13]改進了傳統的D-S 證據理論,使用加權方法來調整不同證據的可信度,利用Dempster 證據組合規則實現了目標信息的融合。在多水面無人艇集群的協同數據關聯方面,文獻[14]基于卡爾曼濾波分析設計了有效數據的融合算法,減小了通信時延;在水面無人艇多傳感器協同導航方面,文獻[15]采用自適應信息共享因子聯合濾波器(AISFF)實現數據融合;在分布式多平臺數據融合方面,文獻[16]利用Dempster 證據組合規則衡量多源信息分析,證明了該方法可以有效處理信息融合過程中不同信息源置信度沖突的問題。
隨著人工智能技術和計算機硬件性能的提高,國內有學者將神經網絡和模糊理論應用到數據融合技術中。例如,文獻[17]提出將自適應模糊神經網絡和卡爾曼濾波器應用到目標跟蹤系統的融合算法中,通過自適應調整跟蹤參數,較好地解決了目標丟失的問題; 文獻[18]提出了一種結合樣條逼近理論和神經網絡原理的融合算法,通過權值修正迭代及快速確定權值,達到了增加運算速度和計算精度的目的。
海上無人系統集群的任務分配是指在滿足環境和作戰單元約束的條件下,為各作戰單元分配任務并確定任務時序。任務分配按照協同控制架構可以分為2 種類型——集中式和分布式[19]。
2.3.1 集中式任務分配
經典的集中式任務分配模型包括:多旅行商問題(multiple traveling salesman problem, MTSP)、車輛路徑問題(vehicle routing problem, VRP)、多選擇背包問題(multiple choice knapsack problem,MCKP)、混合線性整數規劃(mixed integer linear programming, MILP)[20]、動態網絡流優化(dynamic network flow optimization, DNFO)[21]、處理器資源分配(multiple processors resource allocation, CMTAP)等。海上無人系統集群平臺數量多、異構特性突出、任務類型豐富,這些特點使描述分配問題變得更復雜,增加了求解空間。在求解集中式分配模型方面,典型的求解算法包括最優方法和啟發式方法。而最優方法還有圖論法、約束規劃法、整數規劃法、窮舉法,這其中的整數規劃法又發展出了矩陣作業法、單純性法、匈牙利法、分支定界法、混合整數規劃算法等。雖然最優方法可對模型精確求解,且求得的解是全局最優解,但缺點是用時長,實時性不高。
啟發式求解方法分為3 大類:列表算法、聚類算法、智能算法。其中,列表算法是基于優先權函數對任務處理次序進行排列,然后分發給各成員[22];聚類算法是將任務作為一個簇聚類,通過滿足任務簇與系統成員的數量達到一致[23]來實現分配,這兩種算法有一定的應用。相比聚類算法,智能類算法的應用較為普遍,尤其以遺傳算法、粒子群算法、蟻群算法的應用居多。智能類算法通常健壯性較強,既適合于分布式計算機制,也可與多類其他算法相結合,但其缺乏嚴謹的數學基礎,沒有對應和深刻的且具有普遍意義的理論分析,對其機理的數學解釋也薄弱,缺乏規范化和針對算法優化性能的評價準則。盡管如此,這些方法及其改進算法依然被廣泛應用到了無人系統集群任務的分配中。
2.3.2 分布式任務分配
分布式任務分配的典型模型主要包括多智能體決策理論、市場機制(合同網/競拍)、分布式馬爾科夫、分布式約束等。其中,多Agent 理論[24]被廣泛應用于機器人領域。隨著應用樣式的多樣化,多Agent 理論還衍生出了很多分支,如圖1 所示。

圖1 分布式任務分配模型及方法Fig. 1 Distributed tasking model and method
針對智能體與不確定因素之間的矛盾,已有的常用算法包括博弈論方法[25]、分布式馬爾科夫法[26]、分布式貝葉斯方法[27]等。分布式約束可以形式化為一個約束網,網中變量有各自的離散值域,且各自的約束相互聯系,求解過程是求出變量的某個組合,使所有約束值相加獲得極值[28]。分布式約束也可以被視為多Agent 理論的分支應用。類市場機制方法是多無人機任務分配中被廣泛應用的一種分布式方法,其核心功能是防止沖突,而對每個問題的求解則采用通信協商的方式。合同網算法[29]由發布者和競標者兩個角色,由“招標—投標—中標—確認”4 個交互階段組成。而拍賣算法[30]則是將要拍賣的物品用公開競價的方式轉賣給應價最高者,一次拍賣過程主要由參與方、拍賣品、收益函數和應價策略等要素組成。此外,拍賣算法的演化算法也逐漸受到廣泛重視,例如,一致性包算法(consensus-based bundle algorithm, CBBA)[31]。
航跡規劃是完成作戰任務的關鍵步驟。從出發點到任務開始執行點的航跡、巡邏航跡以及跟蹤圍捕的航跡均屬航跡規劃的范疇。根據作戰任務規劃,協同無人機、水面無人艇、無人水下機器人的航跡需要考慮諸多約束和狀態變化,例如,平臺的機動性能、保持平臺間的通信拓撲、速度匹配、環境威脅、航程、航跡沖突、成員的動態進入退出、由巡邏轉入跟蹤時的狀態切換等。
為此,國內外學者積極展開研究,取得了大量的不同任務場景下無人系統集群航跡規劃的研究成果,涉及的主要問題如下:
1) 環境模型:建立無人系統集群規劃空間的數學模型;
2) 航跡表達:表示規劃后出現的航跡的方法;
3) 航跡優化:最短和最安全的航跡和航程規劃及其規劃所需的最短時間,也即路徑搜索算法優化問題;
4) 時間和空間的精準協同:一些任務需要無人平臺在指定時間內以特定方位?俯仰角到達目標點的附近,也即航速和航跡精準控制問題;
5) 規劃空間內的航跡沖突消解:由于無人平臺數量多,預先規劃的航跡有一定概率會發生沖突,需要局部調整航跡或者航速,也即沖突解脫問題;
6) 航跡規劃動態調整:在實際海域有可能出現無法航行的區域,需要隨時調整,目標點的位置也可能發生新的變化,因此需要根據新出現的情況迅速重新規劃以調整航跡,也即在線航跡快速規劃問題。
文獻[32]設計了層次化的多無人機協同模型,通過Dubins 曲線航跡規劃、碰撞回避和路跡長度協調這3 個階段來實現多無人機時空協同。文獻[33-34]采用有約束的網絡圖環境模型,該模型可將航向約束轉化為特定網絡節點的連通性約束,可以解決網絡圖中的空間協同規劃問題。此外,文獻[35]提出的人工勢場算法也是一種有效的無人系統集群協同航跡規劃方法。該算法規劃速度快、安全性高,適合于協同規劃,但由于存在斥力和引力相等的靜止點,故會導致算法停滯,規劃失敗。
A*算法是一種經典的算法,但并行性差、實時性不高,對于無人系統集群的航跡規劃并不適合,而規劃速度快、并行性佳、易協同、可收斂到最優的智能算法則適合用于求解無人系統集群協同的航跡規劃,故得到了廣泛研究。此外,利用群智能算法還可將無人系統集群的協同目標分配和航跡規劃通過類似算法結構進行統一處理[36]。然而,智能算法也存在缺點,它沒有明確的基因表示的定義,求得的最優解不是唯一的,存在沖突和違背約束,因而也可能導致規劃和協同失敗。
文獻[37-38]提出采用遺傳算法和差分進化算法規劃單機和多機的協同飛行航跡,此后大量航跡規劃的研究都是圍繞改進差分進化算法來展開的。例如,多種群小生境進化算法[39]、平行進化算法[40]、量子遺傳算法[41],以及將免疫機制與遺傳算法相結合的算法[42]等。這些算法證明了利用物種進化機制和并行尋優可以較快地搜索到解空間的最優位置,獲得多條可行的協同航跡。此外,進化理論不受空間結構的限制,適合處理三維甚至多維空間中的航跡規劃問題[39-40,43]。
從在線規劃的角度來看,實時動態的航跡規劃思想已獲廣泛認同。例如,有效擴展的馬爾科夫決策方法(Markov decision process,MDP)[44-46]和增強學習方法(reinforcement learning, RL)[47-50]已被廣泛應用于航跡在線規劃應用中,該方法利用狀態轉移逐步進行區域探索和預測,通過學習提高平臺處理復雜、未知和不確定環境的能力,它不僅要考慮當前階段航跡擴展的即時效應,還要考慮對后續繼續決策產生的影響,故適合于實時航跡的重新規劃求解。然而,該方法要處理的狀態轉移模型復雜,可能導致“維數災難”、規劃性能嚴重下降,故僅限于單平臺的在線規劃,難以有效處理集群協同的問題。
海上無人系統集群是通過自組織網絡連接構成的分布式智能群體,由若干同構或者異構的智能無人平臺(智能體)組成。在協同執行某項任務時,需要編隊構型保持相對穩定,以實現不同平臺間的協調運動(例如固定隊形、協同跟蹤、協同圍捕等)和穩定的通信連接。為此,使用的主要方法如下:領航者?跟隨者法、基于行為法、人工勢場法、虛擬結構法和基于強化學習的編隊控制方法等。
領導者?跟隨者法是采用指定編隊系統中的某個智能體作為編隊的領航者,而其他智能體為跟隨者,并以一定的相對位置或者姿態跟蹤編隊的領航者。該方法實質上是將編隊控制問題直接轉化為跟隨者跟蹤領航者的方向與位置的問題[51-52]。
基于行為法的基本思想是定義一組無人系統集群的期望行為(例如駛向與駛離目標、障礙檢測與避碰、隊形保持與變換等),并將每個智能體的運動視為一系列行為的加權組合。在使用該編隊控制法時,智能體的行為控制器通過接收控制指令和艇載或機載傳感器檢測到的周邊環境信息來輸出相應的行為,從而實現集群整體的協同控制。在基于行為的智能控制方法的應用研究方面,文獻[53]詳盡地研究了多空間飛行器編隊的飛行問題,并分析了編隊收斂性與誤差的影響;文獻[54]對此控制方法進行了深入分析和形式化表達研究,提出了最近鄰協調思想。總體上,該方法對于解決具體問題通常極為有效,但也存在缺陷,例如,它很難對行為進行數學分析,且編隊隊形難以保持。
人工勢場法是在集群控制中引入勢能場概念,由勢函數模擬影響集群中個體行為的內、外作用,個體在勢函數的作用下采取行動,通過這種方法實現對集群的控制[55]。在人工勢場法的智能控制應用方面,文獻[56]在實驗室環境下構建了一種低成本的人工智能集群控制演示驗證系統,以機動的自組織探測集群為驗證對象,對基于此方法的自組織控制策略進行了演示驗證。
虛擬結構法的基本思想是將多智能體的編隊視為虛擬的剛性結構,每個智能體又被視為剛性結構上一個相對位置固定的點,當編隊移動時,智能體跟蹤剛體上的虛擬點運動。與領航者?跟隨者方法有所不同,虛擬結構法通常無需真實存在的領航者(可以存在虛擬領航者),編隊中各平臺形成期望的剛體形狀,且一般以跟蹤偏差作為反饋來實現期望的隊形。在虛擬結構法的智能控制應用方面,文獻[57]提出了一種結合此方法的輸出反饋協同控制方法,實現了一組具有有限感知范圍的獨輪式移動機器人完成期望的編隊跟蹤任務;文獻[58]提出利用圖剛度求解非平面多智能體編隊控制問題的方法,各智能體由分布式控制律協同形成編隊隊形;文獻[59]建立了多無人機虛擬剛體模型,由遙控手柄實時給出無人機編隊的飛行軌跡,各無人機則根據事先設計的隊形庫來保持隊形,并可在幾種隊形間切換。
綜上所述,傳統的大部分編隊控制方法通常需要平臺和擾動的精確模型來進行控制率設計,但模型通常具有復雜、時變、非線性的特點,加之傳感器誤差、環境擾動等隨機因素的影響,通常難以精確建模,因此嚴重限制了傳統分析方法的適用范圍。
強化學習方法作為替代方法正越來越多地受到關注,因為此方法采用無模型方法來解決上文所述矛盾。在強化學習方法方面,文獻[60]針對連續狀態空間中固定翼無人機編隊協同控制問題,提出了基于深度強化學習的協調控制算法;文獻[61]使用強化學習方法,解決了異構無人機編隊軌跡跟蹤問題;文獻[62]的研究團隊相繼發布了多項有關集群協同控制的研究成果,其提出的是一種將強化學習和集群控制相結合的混合系統,并通過仿真和實驗驗證了系統的可擴展性及有效性。該混合系統由低層集群控制器和高層RL 模塊組成,這種二者結合的方式,使系統能夠在保持網絡拓撲和連通性的同時規避集群外部的威脅風險。混合系統中的RL 模塊采用Q 學習算法,并通過共享Q 表的方式來實現分布式合作學習。
無人系統集群協同作戰可廣泛應用于編隊護航、搜索巡邏、區域控制和平戰結合的信息保障等軍民用任務。歐美一些國家正在積極推進無人系統集群演示驗證試驗,以加快推進技術的實戰化應用。由于當前無人系統集群的關鍵技術尚未成熟,因此需要開展大量的測試驗證和優化。但是,海上試驗環境復雜,試驗成本高,長期利用無人系統集群實裝測試并不現實。其中,實裝測試面臨的一些“痛點”問題包括:
1) 代價大:需要大量的人力物力保障和針對不同的測試項目搭建的試驗場景設施;
2) 風險高:存在無人裝備頻繁布放回收風險、碰撞風險、惡劣海況和異常情況下設備損壞傾覆風險;
3) 周期長:需要合適的天氣和環境條件;
4) 算法優化效率低,試驗次數有限。
同時,無人系統集群實裝測試也面臨本身難以克服的“難點”問題。
1) 無法測試算法邊界:無人系統裝備在交付之前需要摸清平臺在各種極限工況下的適應能力,但是對于實裝過程中的危險場景和危險操縱行為進行測試的風險太大;
2) 可重復性差:算法可靠性評估要求對一種場景進行多次重復測試,在實際環境測試過程中,場景不斷變化,風浪流的干擾和動態船舶的行為狀態每次都會不一樣;
3) 測試場景不夠充分:實裝測試場景非常有限,無法評估算法的適應性;
4) 測試數據有限:因為當前無人系統集群算法中應用了許多人工智能技術,需要比真實環境中更多的測試數據以對算法進行訓練優化,而真實試驗中的樣本始終是小數據。
綜合上述問題,可見虛擬測試技術對于加快無人系統集群算法迭代和促進集群作戰能力的形成具有重要意義。
文獻[63]在國內最早提出了平行系統理論,這是一種面向復雜系統進行管理和控制的仿真、計算和分析方法。文獻[64]提出了一種測試和試驗無人車對復雜交通場景的理解和行駛決策能力的方法,使無人車具有在人類專家指導下自動自我升級的認知機制,對構建和測試其他人工智能系統具有重要的啟發意義。文獻[65]系統歸納總結了自動駕駛汽車測試場景的要素種類、數據處理方法、虛擬測試方法、測試平臺和虛擬測試的關鍵技術要點。文獻[66]對測試公開可用的駕駛數據集和虛擬測試環境下的自動駕駛算法做了綜述分析。文獻[67]提出一種多層次平行交互的水面無人艇自主航行能力測試技術,采用多域融合、混合映射、虛實結合和科學評估的平行交互測試方法,針對水面無人艇的自主感知、自主規劃、自主避碰和自主控制這些能力的設計評估模型,從安全性、快速性和準確性方面對水面無人艇各自的自主航行能力進行了測試評估,為水面無人艇自主航行能力測試提供了新思路。
本文分別概述了無人機、水面無人艇、無人水下機器人集群和海上跨域無人系統集群的國內外發展現狀,分析了無人系統集群未來發展應用的方向,系統梳理了無人系統集群所需的6 大關鍵技術、相關算法的研究情況及其發展趨勢,旨在為海上無人系統集群應用和技術研究提供一定的支撐。
無人作戰裝備體系中,無人機具有航程遠、滯空時間長,分布式部署、全方位覆蓋和成本低、效率高等特點,可以承擔諸多任務,例如,可長時間滯空遂行遠程警戒、目標指示、中繼制導、打擊效果評估和熱點區域持續監視等;無人水下機器人具有隱蔽性、安靜性和使用靈活的特點,是在敵方基地前沿、關鍵水道、重點海區等區域執行水聲探測任務的理想裝備之一;無人艇在大型海上編隊外圍伴隨航行,不僅可以作為編隊的新型反潛力量,也可以作為水下與空中探測感知網絡之間的中繼節點,為海、空、潛立體偵察探測提供基礎。多個無人裝備組成的海上無人系統集群通過利用不同無人裝備的特長而優勢互補,采用群體協同作戰的方式可以克服單個平臺載荷能力有限的缺陷,極大地增強無人作戰體系的威力,拓展海軍體系作戰能力邊界,為未來海上作戰提供更靈活多樣的新型作戰樣式。可以預見,未來海上無人系統集群將在要地防御作戰、伴隨機動作戰、關鍵區域布控作戰和飽和式攻擊作戰中發揮重要作用。