劉 偉,李大衛,戴洪德,李 飛
(海軍航空大學,山東 煙臺 264000)
多機器人系統(又稱機器人集群系統)的協同控制問題受到廣泛的關注。這主要是因為單體機器人的載荷及其能力有限,無法完成更為復雜的任務[1-4]。不同機器人可以攜帶不同的任務載荷,通過相互協調配合,共同完成復雜的任務,其可廣泛應用在軍事、交通或者服務等多個領域[2]。其中,機器人集群的編隊控制問題是該系統協同控制中的一個關鍵技術點。有關編隊控制的研究成果,主要的編隊控制方法可以分為如下幾類:跟隨領航者法、虛擬結構法、基于行為控制法和人工勢場法[5]。通常為了解決某些實際問題,也會將如上幾類方法組合使用。
隨著研究的深入,研究重點也從編隊控制轉移到考慮實際應用限制因素和改善控制品質等方面。尤其是在機器人集群系統中,機器人數量急劇增多的情況下,由于通信距離受限制,或者移動過程中受到障礙物遮擋,單個機器人難以獲取所有機器人的信息,因此,傳統的集中式編隊控制方式,已經難以適應集群系統的應用需求[5]。取而代之的是設計分布式的編隊控制器,通過局部的信息交互,實現整個集群系統的編隊行為。
近年來,多智能體協同控制理論蓬勃發展。其中一致性控制問題受到廣泛關注[6-8]。所謂一致性控制,即是智能體系統,通過通信網絡交互,基于分布式的設計框架,設計非集中式的控制協議,進一步從宏觀上表現為一個群體的行為同步[9-13]。多智能體系統的一致性協同控制內涵,由于其與機器人集群系統的任務需求相契合,其理論在近幾年被應用到無人系統的編隊控制中[14-16]。需要指出的是,這些文獻中,關于無人系統之間的通信拓撲是假設為無向的。而在實際應用中,機器人的通信可能會因為故障而只能接收,或者因為不同的個體發射功率不一樣,導致通信結構是單向的,從而使得拓撲結構為非對稱的有向圖,該類型的拓撲結構可將無向拓撲視為其一個特殊情況。
另外,機器人在編隊行進中,安全是需要考慮的重要因素。如何使單個機器人系統有效躲避障礙物,得到了大量的研究結果。其中,人工勢場方法廣泛應用于航跡規劃[17]以及無人機避障[18-20]。
因此,針對機器人個體數量眾多的機器人集群系統,在有向通信拓撲結構的條件下,設計分布式控制器的同時考慮機器人編隊的避障問題,更具有實際意義。為了解決這一問題,本文針對機器人系統集群系統,將機器人之間的通信拓撲建模為非對稱的有向拓撲圖,設計分布式機器人的編隊控制器,并利用多智能體系統一致性理論研究系統編隊形成的條件。
本文假設機器人集群系統包含N個機器人,單個機器人具有如下的系統運動學模型
(1)
pi∈R2,vi∈R2,ui∈R2分別是第i個機器人的二維狀態(位置和速度)和控制輸入。進一步可將系統寫成如下的形式
(2)


定義1.如果由多機器人組成的機器人集群系統滿足如下的條件:
則稱系統實現了期望的編隊隊形h。其中,Δij=hi-hj表示兩兩機器人相互之間的相對速度和位置。
在機器人集群系統中,由于機器人的數量較多,單個機器人無法獲取全部機器人信息。因此,本文采用圖論中的有向圖來描述系統內機器人之間的信息交互關系,如圖1所示。

圖1 機器人之間的有向通信拓撲圖

設計的分布式編隊控制器為
(3)
aij為A的元素;K∈R2×2是反饋矩陣;c>0表示狀態參數相互之間的耦合強度;hi為機器人i的編隊隊形描述,如1.2節所述。
根據鄰接矩陣A的定義可知,每個機器人無法知曉所有機器人的狀態信息,僅能夠同自己的鄰居之間進行信息交流。鄰居的定義可以是一定通信距離范圍內機器人,也可以定義為同一個通信群組里面的機器人。aij≠0,表示機器人i和機器人j為鄰居關系,反之則aij=0。由此可以看出,本文構建的控制器是分布式的。
根據前面設計的控制器,可以到的整個集群系統的閉環運動學方程為
(4)

根據機器人編隊的定義1,引入如下的變量替換ei(t)=xi(t)-hi,i=1,2,…,N。根據ei(t)的定義可以得出結論:如果ei(t)→ej(t),?i,j∈N,也就是如果變量ei(t)(i=1,2,…,N)能夠達成一致,則定義1中的條件滿足,即編隊達成期望的編隊隊形[21]。
進一步,構建如下的編隊偏差變量ξi(t)=ei(t)-ei+1(t),i=1,2,…,N-1,由其定義可知,如果變量ξi(t)→0,t→∞,則ei(t)→ej(t),?i,j∈N,且有
根據2.2節的描述,令E=[-1N-1,IN-1]∈R(N-1)×N,F=[0N-1,IN-1],可以將式(4)寫成如下形式
(5)
R=ELF。由文獻[21-23]可知,當機器人之間的通信拓撲圖包含一個有向生成樹時,矩陣R的特征值的實部均大于0。

定理1.機器人集群系統能夠實現編隊隊形h,如果存在一個c和一個正定對稱矩陣P2使得如下不等式成立:
ATP2+P2A-cαP2BBTP2<0
(6)
其中,P1滿足如下條件的正定矩陣
P1R+RTP1>αP1
(7)
R=ELF,0<α<2min{Re(λ(R))},Re(λ(R))為矩陣R特征值的實部,且反饋矩陣可以設計為K=BTP2。
證明:構建如下的李雅普諾夫函數
V=ξT(P1?P2)ξ
(8)
P2滿足不等式(6),P1為一個滿足如下的條件的正定矩陣
P1(R)+(R)TP1>αP1
(9)
0<α<2min{Re(λ(R))},R=ELF。
令K=BTP2,則有
ξT(P1?P2)(IN-1?A-cR?BK)ξ=
ξT[P1?(ATP2+P2A)-c(RTP1+
P1R)?P2BBTP2]ξ
(10)
因為P1R+RTP1>αP1,則
(11)
由式(6)可知
ATP2+P2A-cαP2BBTP2<0
(12)
進而
(13)

在前一節的控制律設計中,僅考慮了機器人編隊形成條件。考慮到實際應用條件,需要進一步考慮機器人運動時避障問題。因此,需要在控制器(3)基礎上引入避障的控制。本文利用人工勢場函數方法,設計機器人避障控制項。
機器人i和障礙物o之間的距離lio為
(14)
Pi和(xi,yj)分別為機器人i的位置和坐標,Po和(xo,yo)分別為障礙物所在位置和坐標。
給出如下的人工勢場函數
(15)
參數k為機器人之間的斥力系數;Uio為障礙物對機器人產生的排斥力場;lo,max為機器人距離障礙物的安全距離。
由人工勢場函數的定義可以看出,當機器人之間距離lij大于安全距離lmax時,機器人之間不會因為勢場函數發生作用,而當lij小于安全距離lmax時,勢場函數發生排斥作用。
由此可得作用在機器人i上的合力為合勢場的負梯度,為
(16)
機器人i的避障控制器uico為
uico=Fi
由此可得具有避障功能的機器人i的控制器為
(xi(t)-hi)]+uico
(17)
假設有4個機器人組成集群系統,機器人的在二維平面運動,令機器人集群系統期望的隊形是一個邊長為100的正方形,速度為0.01,故期望的編隊可表示為:hi(t)=[0,0.01,0,0.01]T,h2(t)=[100,0.01,0,0.01]T,h3(t)=[100,0.01,100,0.01]T,h4(t)=[0,0.01,100,0.01]T。機器人之間的通信拓撲結構如圖2所示。

圖2 機器集群的通信拓撲圖
由圖2可以看出,各機器人無法獲取全部4個機器人的信息。例如,3號機器人僅能夠獲取2號機器人的信息。該通信拓撲圖對應的拉普拉斯矩陣L為
設置機器人避障的安全距離為100,障礙物的位置在(400,300),得到仿真結果分別如圖3~圖6所示。
圖3和圖4分別為所有機器人在x和y方向上的位置和速度隨時間變化情況。由圖3和圖4可以看出,當機器人運動到障礙物之前,約在仿真時間為25 s時,機器人之間的速度趨于相同,編隊相對距離保持不變,即形成了編隊。而當遇到障礙物時,約在仿真時間35 s 時,其速度和編隊相對距離發生變化,從而躲避障礙物,此時編隊隊形被破壞,如圖3和圖4所示。當越過障礙物后,約在仿真時間80 s時,機器人編隊再次形成。在前文分析中,定義的編隊誤差向量ξ(t)隨時間變化趨勢如圖5所示。在x和y方向上,誤差向量逐漸趨于0,由此可以看出機器人完成了編隊。而當遇到障礙物時,約在仿真時間35 s附近,編隊誤差不再為0。出現這種情況的原因是,編隊在躲避障礙物,此時編隊隊形被破壞。當越過障礙物后,約在仿真時間80 s時,機器人編隊再次形成。

圖3 機器人的位置曲線

圖4 機器人速度曲線

圖5 編隊誤差變量ξ(t)變化曲線
在圖6中畫出了機器人集群系統完成編隊并在遇到障礙物進行避障的過程。圓形的圓心位置為障礙物的位置(400,300),根據仿真設置要求,編隊對障礙物的安全距離為100。在仿真開始不久,完成了期望的編隊隊形。而當遇見障礙物時,機器人的編隊隊形被破壞,各機器人躲避障礙物,如圖6所示。這是由于避障的優先級要高,因此在越過障礙物后,機器人編隊隊形再次形成。由圖6中的機器人運動軌跡可以看出,機器人運動軌跡沒有同障礙物的安全線交聯,這表明機器人編隊可以有效躲避障礙物。

圖6 機器人集群系統編隊形成及避障
本文利用多智能體一致性理論研究了機器人集群系統的編隊控制問題,構建了分布式的編隊控制律,得到了機器人實現編隊的充分性條件。同時,利用人工勢場函數方法設計避障控制器,最后用數值模型進行了仿真驗證。在進行避障的過程中,機器人隊形遭到破壞。下一步,將繼續研究如何控制機器人在行進避障過程中使得編隊隊形保持不變。