孟中祥,劉時圓,呂珍斌
(中國船舶重慶前衛科技集團有限公司,重慶 401120)
自主式水下機器人(簡稱 AUV)可以應用于海洋中的多種任務場景,但單個AUV容錯率低、作業效率不高,將多個AUV有機地組成一個整體,應用基于智能體的集群控制技術,執行任務時相比于單個AUV執行有著無與倫比的優勢。
集群控制關鍵特點[1]可以歸納為如下3點:
1) 核心控制思想是協作協調。個體之間保持通訊交互、協作協調完成任務。
2) 控制方式是分布式控制。只能與鄰居進行信息交互,而不能與非鄰居的智能體建立通訊關系。
3) 不同的個體對某一確定的物理量,如位置或速度達成一致。
集群控制的研究可歸納為一致性問題和覆蓋控制問題 2類基本問題[2]。“一致”意味著聚合,即所有智能體的狀態最終將收斂到一個共同的目標狀態;而“覆蓋”意味著分散,即所有智能體的狀態要盡量散開以獲得良好的空間覆蓋效果并且互不干擾。當AUV集群編隊航行時要考慮位置、速度的一致性問題,內部的相對運動則需要考慮避碰規劃的覆蓋控制問題。
在水雷戰術中,水雷布防可以視為覆蓋控制問題,多AUV掃雷可以視為一致性控制問題。本文結合集群控制技術的發展現狀,介紹了集群控制理論的主要研究內容和多AUV技術集群控制技術現狀,對AUV集群技術的未來發展給出了建議,對行業未來的影響進行了展望。
集群控制技術發展源于大量無人機飛行技術。技術人員幻想無人機可以像生物系統的鳥群一樣實現無人機自主集群。法國動物學家 Grasse基于白蟻筑巢行為[3],提出了共識自主性(stigmergy)概念:即不需要通過集中規劃和直接通信,通過個體間的間接協調就可以完成復雜的智能活動。
集群控制技術相對于傳統的多個體協同控制最大的特點有4個方面:1)數量級,集群一般指幾十到上百個個體;2)成本,集群內的個體成本造價低廉,允許系統承受損失,可大膽使用;3)技術優勢,對智能傳感、環境感知、分析判斷、網絡通信、自主決策的技術要求極高;4)環境適應性,自主集群對復雜的突發狀況可以進行復雜的協作、動態調整和自愈組合。
美國致力于打造無人裝備自主集群系統,美國國防高級研究計劃局2005年在集群高風險/高回報概念驗證中將自主控制等級分為10級,包括單機自主(遙控引導,實時故障診斷、故障自修復和環境適應性、航路重新規劃)、多機自主(多機協調、多機戰術重規劃、多機戰術目標)、集群自主(分布式控制、群組戰略目標、全自主集群),指出全自主集群是自主控制的最高等級[4]。2016年,美國空軍對蜂群、編組、忠誠僚機3種集群作戰概念進行了闡述[5]。
北京航空航天大學仿生自主飛行系統研究組10余年來,通過借鑒雁群、鴿群、鳥群、狼群、蜂群、蟻群的共識自主性集群智慧,采用分布式策略設計了無人機集群自主控制方法和技術,進行了無人機集群編隊、目標分配、目標跟蹤、集群圍捕等任務的飛行試驗驗證[6]。國內無人機燈光秀表演正熱,如2018年2月珠海春晚無人機特技飛行,2018年8月長沙橘子洲頭777架無人機燈光表演。但以上集群表演主要用了高精度的定位技術,距離復雜環境下的集群控制技術還有很大差距??偟膩碚f,集群控制理論研究和技術應用發展火熱,但其技術條件還遠未成熟,具有相當大的技術空白和不對稱發展的前景。
利用集群系統進行作戰的主要技術優勢就是去中心化,任一個體故障都不影響群體能力,而且具有較低的決策門檻和政治風險,可用于滲透偵查、誘騙干擾、飽和攻擊、察打一體等任務。集群作戰的兵力補充方便,新的無人裝備要加入作戰系統時,只需要與周圍的無人機建立通訊就可以快速融入系統。
在集群作戰技術快速發展的趨勢之下,各國開始投資發展反集群作戰技術。2018年3月,美國陸軍在俄克拉何馬州西爾堡舉行了機動火力綜合試驗,利用高功率微波武器和高能激光武器擊落了 45架無人機集群[7]。反制措施包括:搗毀峰巢,即在投放區域外進行攔截,密集攔截,即采用彈炮融合和密集火力防空炮進行攔截、集群對抗;電磁癱瘓,即用定向能武器進行抗擊或電磁干擾、控制劫持等。
2016年 8月,美國國防部國防科學委員會發布了《人工智能與國家安全》,指出了人工智能技術是國家安全的顛覆性技術[8]。群體智能就是受自然界生物群體模式啟發的一種人工智能模式,集群的意思簡單來說就是模擬一大群行為相近的單位的行動[9]。
1987年,Reynolds等人對鳥類飛行行為進行了研究[10],提出了3條啟發類規則即避免碰撞、速度匹配、和保持聚集,建立了集群行為的Boids模型。1995年,Spector提出了改善swarm模型并進行了仿真,通過設定不同的權重系數,得到了豐富的控制效果[11]。現如今研究者們普遍達成共識,集群行為應該體現出組織結構的分布性、行為主體的簡單性、強適應性,如遇到危險時可以迅速做出集體逃避動作。
集群的運動方法有2種:第1種是平均行動向量的算法,即先規定每個單位有一個視野范圍,每個單位的移動方向,都是它自己視野范圍內的平均移動量;第2種是勢能函數法,即通過模擬物理學中分子間的力的關系,通過引力或者斥力來移動,對于集群和分布式的理解可以簡單而明了。集群可以理解為一個業務部署到多個服務器上,而分布式則是一個任務分拆成多個子任務,可以認為集群是物理形態,而分布式是工作方式。
集群控制需要圖論基礎,任意一個智能體都與它周圍的鄰居智能體通過相應的連接拓撲實現通訊交互,抽象為數學語言就是一個拓撲圖。拓撲圖清晰具體地反映了智能體之間的通訊交互關系,任何控制協議都必須按照其規定的圖拓撲結構進行分布式控制,每個節點的控制協議只允許依賴于關于該節點及其在圖中的鄰居節點的信息[12]。
集群控制一般都需要領航者,原因在于當需要做出地圖的尋路算法時,需要一個隊長來做出尋路和判斷的算法,這樣可以大幅度減少計算量[13]。當一個個體不能工作時,其它個體檢測不到其信號會自動填補其位置,如果有新的集群要加入,只需要和邊界的無人機建立通信即可,這種簡單的功能在集群尺度上表現出了自愈的能力[14]。集群智能的核心概念是共識主動性[15],正如同蟻群中的個體都沒有建造的基因和計劃,但通過識別其余個體的信息素共同完成了巢穴建造。
從控制理論的角度來說,控制集群的行為就是用正反饋和負反饋 2個最基本的內在要素來促使系統應對外界的變化,正反饋對應于快速性,負反饋對應于穩定性。然后通過博弈論[16]、神經網絡[17]等方法來對個體行為模式的復雜性進行訓練以達到研究者的目標,從而最終達成集群的群體智能行為。
集群內個體的局部運動規則是預先定義好了的,學者們提出了間接控制的方法[18],即通過對集群中加入可控個體,間接進行外部控制。鑒于現實世界中存在領導者,受此啟發,很多學者都提出了領導者或者虛擬領導者角色,即領航者[19]。領航者是一類特殊的智能體,其它智能體都盡可能地跟隨領航者,按領導者的性質可劃分為真實領導者和虛擬領導者。前者跟蹤的領導者是真實的目標,這種方法主要應用于移動傳感器網絡和分布式跟蹤問題中。而后者跟蹤領導者是預定參考運動模型,文獻[20]研究了具有多個領導者的包含控制問題,文獻[21]研究了具有參數不確定性的網絡化拉格朗日系統的分布式包含控制問題,提出了與分布式自適應控制算法結合的分布式滑模估計器。以上研究方法對集群控制中領航者的設計和研究方法進行了介紹,并從不同的方面進行了部分擴展,在分布式結構方面進行了挖掘,提升了系統的魯棒性。
在集群控制算法的研究中,收斂速度是衡量一致性控制算法性能的重要指標,研究有限時間一致性問題具有重要的現實意義。文獻[22]提出了2個分布式控制協議使得一階多智能體系統在有限時間內達到一致,將此一致性協議擴展應用到多智能體系統的編隊控制中。文獻[23]研究了多智能體系統的有限時間一致性問題,用 Lyapunov函數為每個智能體構建了全局非線性一致性協議,并且對于任意的初始條件系統均能在有限時間內達到一致。文獻[24]以滑模變結構理論研究了多機器人系統有限時間跟蹤一致性問題,該方法對輸入擾動具有魯棒性。以上研究從不同的方面給出了控制時域內、有限時間內收斂這一關鍵技術指標,為設計集群控制方法給出了有力的支撐。
在通信方面,各個智能體實際應用時只能獲得部分信息甚至得不到對方的信息。為此,研究者們引入了基于狀態觀測器的方法,文獻[25]針對多智能體系統設計了觀測器,奠定了多智能體系統觀測器設計的基礎。文獻[26]研究了一階多智能體系統的領導者跟隨一致性問題,引進了觀測器來估計領導者的速度,并構造了一個通用的Lyapunov函數分析了系統的穩定性。基于觀測器的估計方法不依賴于實時傳感器信息,且以上研究缺少數據融合算法,單一狀態估計器信息難以保證狀態信息的可靠度。
集群系統以一個行為目標來規劃運動方式,也就是說控制的結果可以用一個目標函數來表示,因此可以用最優控制的方法來進行控制器設計。最優控制的研究方法有線性二次調節法(Linear Quadratic Regulator,LQR)、模型預測控制(Model Predictive Control,MPC)、微分博弈(Differential Games)、自適應動態規劃(Adaptive Dynamic Programming,ADP)等。在以上方法中LQR適用于線性系統,設計過程是離線的;MPC是在線算法需要連續采樣和實時預測;微分博弈是最優控制與博弈論的結合,可得到集群系統的納什均衡,但是會引入“維數災難”問題;ADP最優化方法是利用如神經網絡的方式來逼近動態規劃中的性能指標函數以達到最優,可以看出上述方法各有優缺點,現如今的研究趨勢是組合各種先進的控制算法進行研究。文獻[27]提出了基于神經網絡的自適應方法,通過神經網絡近似系統的動力學方程,利用自身及其鄰居之間的相對狀態信息為各個智能體設計出了自適應神經網絡控制器。文獻[28]將一致性和最優性理論結合在一起考慮,將自適應動態規劃與微分博弈結合解決了一般線性多智能體系統的一致最優控制問題。以上研究方法在解決單一優化目標時考慮到了一致性的問題,使用的神經網絡、博弈等方法各有其優劣性,值得進一步地深入研究。
在避碰任務規劃方面,文獻[29]利用計算幾何中的維諾圖理論,將任務環境劃分成多個互不重疊的維諾單元,通過 K-均值聚類算法連續迭代生成質心維諾劃分,并設計相應的分布式覆蓋控制器,智能體只在自己的維諾單元內移動,從而避免碰撞。文獻[30]設計了一個分布式梯度優化算法,驅動每個智能體朝著最大化目標函數的方向移動,驅動器避開障礙物等多種情況。人工勢能函數[31]使得每個智能體遇到障礙物和鄰居智能體時能夠產生排斥力,迫使智能體分散開來,覆蓋整個任務環境。類似的方法還有虛擬力算法[32]、反蜂擁模型區域覆蓋算法[33]。這些方法的最大特點是利用虛擬的吸引力和排斥力來設計分布式控制器。計算機領域的研究者還從信息論的角度提出了區域最優覆蓋算法[34]。
以上集群控制方法都存在各自的局限性和優點,依靠單一控制方法來進行集群控制結果是不理想的。將人工智能法和勢能函數法進行結合,是目前集群智能控制研究的趨勢,目前文獻研究的都是針對初始條件的集群環境,外部干預控制和集群控制完善也是一個重要的課題,各種先進的控制算法的發展也可以提高群智能行為模式,學科結合和學科交叉也可以提供技術解決方案。
AUV 在執行任務過程中,往往是沿著預先規劃好的路徑前進的,應用于任務規劃主要有人工勢場法、匹配法和圖形搜索法等。人工勢場法是在AUV的目標位置周圍定義一個虛擬的引力場,而在障礙物周圍則定義一個虛擬的斥力場,引力場和斥力場會對場中的AUV產生引力和斥力作用從而決定AUV的運動[35]。匹配法[36]將當前的狀態與過去相比較,找到最接近的狀態,就可得到一條新的路徑,按照有無碰撞發生,將區域劃分為自由空間和限制空間,在自由空間內再根據某一準則確定最優路徑。圖形搜索法[37]可用于多AUV的掃雷任務,該算法根據各AUV的起點和終點來為其畫一個橢圓,橢圓里面的區域就是相應AUV所要執行任務的區域,再根據這個區域里面各個水雷的位置,對單個 AUV采取一定的優化算法來求取最短的路徑。文獻[38]利用進化算法來對多 AUV的路徑進行優化設計。文獻[39]提出了一種基于交通規則的多機器人避碰規劃。該方法根據交通規則來解決機器人之間的協調避碰問題。文獻[40]提出了一種基于協商和意愿強度的避碰規劃,該方法通過定義機器人行為意愿強度來解決機器人多種行為的綜合問題。文獻[41]討論了在受到環境約束條件下,如何安全地形成所希望的編隊形狀。文獻[42]采用虛擬領隊的方法對多機器人編隊的協調控制進行研究:虛擬領隊用來控制整個隊伍前進的方向,隊伍中的各個機器人成員之間均定義了人工勢場,以確保它們之間保持安全的距離。以上方法針對 AUV的集群運動控制探討了多種情況,使用的研究方式新穎,技術可行性較高,具有很高的參考價值。
通過通信,系統中的各AUV就可以了解其它AUV的意圖、目標和動作以及當前環境狀態、自身所處整體的位置等信息,從而進行有效的磋商,協作完成任務。通信技術是AUV集群控制的關鍵技術之一,文獻[43]開發了網絡通信協議用于多AUV協調定位和通信。通過測量AUV間的信號延遲和互換各自的定位地圖來實現AUV間的相互定位。文獻[44]提出了一種自主式水下系統網絡,網絡中的每個節點都可作為一個單獨的路由器,網絡的拓撲形狀隨著 AUV數量的增加或減少而發生改變。以上研究方法考慮了實際通信系統中的復雜性和不可控因素,使得通信系統的魯棒性得到了提升。
AUV在軍事上一個重要的用途是利用其攜帶的主動式聲吶對水雷進行探測直至清除。文獻[45]提出將多個AUV組成的編隊用于水下掃雷。整個AUV群體由一領隊進行集中協調,以覆蓋最大的掃雷區域。當某一AUV在掃雷任務中“犧牲”后,領隊將對剩下的任務進行重新分配。文獻[46]提出了一種基于生物行為的智能控制系統并將其應用到多AUV的協調控制中。中科院沈陽自動化研究所在仿生機器人研究上面也取得了一些突破[47]。以上研究成果在水雷戰上都具有相當大的應用前景,直接給出了AUV掃雷軍事用途的軍事應用前景和技戰術指導,值得水雷行業技術人員和行業領軍者們關注。本文所綜述的各種先進的魯棒控制[48]、動態控制[49]、最優控制算法[50]、通信方案[51]等都可以為技術應用提供解決方案,具有相當大的發展前景。若能進行立項,使得更多行業內從業人員具備研究條件,對該控制方法進行深度的挖掘,相信可以給行業的發展帶來顛覆性的改變,帶來新的關注焦點和認知轉變。
無人自主系統式人工智能的重要應用,已經成為國家重大戰略,集群控制技術的發展不能僅僅停留在理論研究上面,未來的發展應該結合產業現狀,對未來的發展建議有:
1)借鑒軍事強國技術研發模式及無人機集群作戰樣式,舉辦AUV集群大賽,將其納入裝備體系整體規劃,提高多AUV集群系統在復雜環境下的實際執行任務能力和抗干擾能力,加強系統間的對抗演練,提高系統的作戰能力。
2)探索未來水下裝備智能集群作戰概念,重視軍民融合,以作戰任務需求出發,重視先進控制算法和理論,重視平臺、通信、計算、有效載荷協調發展,統籌規劃多AUV系統發展。
3)著眼交叉學科的技術發展,關注突破顛覆性技術,重視生物學、控制論、人工智能、機器人學科等學科交叉的前沿技術研究。
4)注重國防安全應用研究,確定出無人機、無人車、無人艇、無人潛航器等跨域無人平臺構成的無人體系。在民用方面,了解用戶需求,促進技術發展和應用轉化,不可讓先進的控制方法研究停留在理論層面,應該在實用進程中展現其生命力。