李潔,師五喜,李寶全
(天津工業大學 控制科學與工程學院, 天津 300387)
當面對高并行性和高實時性的任務時,多機器人能更好地克服單個機器人的功能缺陷和執行效率低的不足,多機器人系統編隊問題因其廣泛的潛在應用價值引起了學者們的廣泛關注。編隊控制是一個典型的多機器人協調問題[1],基于行為的方法[2]控制精度較低,基于人工勢場的方法[3]容易陷入局部最小陷阱中,基于虛擬結構的方法[4]通過圖論理論把多機器人系統視為剛體,因此任一機器人出現故障都會導致編隊失敗。由于領航-跟隨方法[5-6]容易實現,目前得到了比較廣泛的研究。文獻[7]在領航-跟隨編隊問題中用圖論方法來表示機器人之間的通信。文獻[8]設計了一種能夠以任何平滑的領航者軌跡實現編隊跟蹤控制方法。文獻[9]提出了一種利用模型預測控制(model predictive control)和自適應終端滑模控制(adaptive terminal sliding mode control)技術的輪式移動機器人編隊復合控制策略。文獻[10]在兩個不同的自適應耦合增益基礎上設計了一種僅依賴于相對狀態信息和智能體自身的一般動力學的自適應算法。在文獻[11]中,基于領航-跟隨者的神經網絡自適應觀測器將受約束的誤差動力學轉化為新的二階歐拉-拉格朗日無約束的誤差動力學。但這些領航-跟隨編隊控制方法都是基于機器人動力學模型設計的。而與動力學控制方法相比,基于運動學模型的控制方法可以降低對機器人的硬件要求,所以此方法也是目前的一個研究熱點。文獻[12]提出了基于運動學模型具有路徑參數同步和干擾抑制的編隊系統分布式控制。文獻[13]提出了一種基于具有飽和角速度和區間內有界線速度的單循環模型的獨輪車運動學模型的新型滑模控制。文獻[14] 在領航-跟隨策略中,基于每個跟隨者未知領航者的完整狀態的假設,提出了一種利用機器人間協調誤差的分布式編隊控制策略。
然而,以上編隊控制方法僅僅保證了跟蹤誤差的漸近收斂。為了獲得更快的收斂速度,文獻[15]提出了有限時間收斂方法。應用此方法,文獻[16] 利用添加功率積分器法和反步技術研制出一組能夠保證閉環系統有限時間穩定的齊次控制器。文獻[17]為了保持領航-跟隨輪式移動機器人系統,提出了基于降低剛度的矩陣估計器和控制器保證在有限時間內收斂,并且可以在代理的局部坐標系內實現。然而,有限時間控制中存在收斂時間依賴于初始條件的問題,而文獻[18]提出的固定時間控制方法是解決此問題的有效方法。文獻[19]將現有的固定時間控制方法推廣到具有死區輸入和輸出約束的非嚴格反饋系統中。文獻[20]解決了一種不確定鏈式非完整系統的固定時間控制問題。文獻[21]在反步遞歸設計技術的基礎上,設計了一種結構簡單的自適應模糊固定時間控制器。但是,這些固定時間控制方法并未應用到多移動機器人編隊控制中。
本文提出了基于運動學模型的固定時間編隊控制方法。該方法應用領航-跟隨法將全局編隊任務轉化為局部跟蹤問題。利用反步法技巧設計了固定時間控制器來實現軌跡跟蹤。文中證明了該方法可使機器人系統所有信號有界,且使跟蹤誤差在固定時間收斂。實驗結果驗證了本文方法的有效性。
多機器人系統由n個機器人和一個動態虛擬領航者組成。n+1個機器人之間的通信可以用一個無向圖G=(N,E,A)來描述,其中N={0,1,···,n}為機器人集,E?N×N為邊緣集,為鄰接矩陣。當(i,j)∈E時,aij>0,否則aij=0。動態虛擬機器人R0確定整個多機器人系統的運動軌跡,不跟蹤任何機器人,其余n個機器人Ri(i=1,2,···,n)以固定的距離 λi、角度 φi跟蹤其給定的領航者Rj(j=0,1,···,n-1),形成n對領航-跟隨子結構。
假設1[7]至少有一個機器人跟蹤動態虛擬機器人R0。
在世界坐標系XOY中,引入的虛擬領航機器人Rdj、領航機器人Rj和跟隨機器人Ri的位姿分別為,線速度分別用vdj、vj、vi來表示,角速度分別用 ωdj、 ωj、ωi來表示。其位置關系如圖1 所示。

圖1 領航-跟隨者結構模型Fig. 1 Leader-follower structure model
假設2領航機器人與虛擬領航機器人姿態一致。
則機器人Rdj、Rj之間的位置關系可表示為
式中: φi為領航機器人和虛擬領航機器人的距離,λi所在線段與領航機器人速度方向之間的角度。
領航機器人的運動學模型為
結合式(1)、(2)可得
跟隨機器人運動學模型為
假設3[22]機器人Ri滿足以下速度約束:0 <其中vmax、ωmax為常數。
假設4[23]領航機器人的vj、ωj及其一階導數是有界的,即有界。
引理1[18,24]對于系統
存在正實數μ1,μ2>0,ξ1∈(1,+∞),ξ2∈(0,1)和連續可微正定函數V(x),有
則該系統是全局固定時間穩定的且收斂時間Ts滿足
引理2[25]若γ1>1,則以下不等式成立:
若γ2<1,則以下不等式成立:
n個機器人系統編隊控制的目標是使機器人之間保持一定編隊同時跟蹤給定軌跡。由1.1 節可知,給定軌跡由動態虛擬機器人R0確定,n個機器人Ri(i=1,2,···,n)以固定的距離 λi、角度 φi跟蹤其給定的領航者Rj(j=0,1,···,n-1),從而形成n對領航-跟隨子結構,這樣將編隊問題轉換成局部軌跡跟蹤問題。而本節的控制目標是使機器人Ri以固定的距離 λi、角度 φi跟蹤領航者Rj。為此引入虛擬領航機器人Rdj,將機器人Ri、Rj的跟蹤問題轉化為跟隨機器人Ri與虛擬領航機器人Rdj軌跡跟蹤問題。Ri、Rdj的誤差定義為
利用反步法技巧引入虛擬輸入 αi,根據式(4)有
結合式(3)、(5)、(6)可得
取李雅普諾夫函數為
對式(8)求導并代入式(7)得
設計虛擬輸入 αi,使得滿足
其中k1i,k2i,k3i,k4i>0 ,β1>1,0 <β2<1。
由式(10)、(11)可得線速度和虛擬輸入:
其中
將式(10)、(11)代入式(9)可得
其中p1=min{k1i,k3i},p2=min{k2i,k4i}。由引理2,式(16)還可以寫成
由式(17)得,xe、ye有界,由引理1 知跟蹤誤差xe、ye固定時間收斂。當xe、ye收斂到零時,由式(3)、(14)和(15)得,由于機器人Rdj運動學模型可以寫為
其中k5i,k6i>0。
定理1對于領航-跟隨子系統,控制輸入式(12)、(19)可使閉環系統的所有信號有界,且跟蹤誤差在固定時間內收斂,其收斂時間Ti滿足
其中a1、a2為常數。
證明取李雅普諾夫函數為
對式(20)求導并代入式(16)得
將式(19)代入式(21),可得
其中p3=min{k1i,k3i,k5i},p4=min{k2i,k4i,k6i}。由引理2、式(22)得
由此可得xe、ye、e是有界的。
將式(14)和式(15)求導得
由假設3、假設4 和式(25)、(26),可以得到mx、my、m˙x、m˙y有界。式(13) 對時間求導,代入式(12)得
以下把領航-跟隨子結構模型推廣到n個機器人的編隊控制。在實現領航-跟隨子結構軌跡跟蹤后,基于圖論知識確定機器人之間的領航-跟隨關系就可以實現機器人編隊。無向圖中的節點為動態虛擬機器人R0和n個機器人,無向圖的邊表示兩個機器人間的跟蹤關系。(i,j)∈E表示機器人Ri以固定的距離 λi、角度 φi跟蹤跟隨機器人Rj,此時,取ai j=1。鄰接矩陣A為
鄰接矩陣表示了機器人之間的相互聯系,其中每一行表示一個跟隨者,每一列表示它的候選領航者。如果第i行在第j列中有一個非零項,則機器人Ri跟隨機器人Rj。由于動態虛擬機器人R0沒有跟隨任何機器人,因此第1 行中全為零。n對領航者和跟隨者中,兩個關鍵參數 λi和 φi決定了機器人子系統的幾何形狀,進而確定編隊隊形。當隊形變化時,只需改變A, λi, φi的對應值。本文基于領航-跟隨法將多機器人編隊控制轉化為多個領航-跟隨子結構軌跡跟蹤問題,根據定理1,每個領航-跟隨子結構都存收斂時間的上界Ti,多機器人系統編隊控制的收斂時間上界T為T=max{Ti},i∈N,且與控制律的參數有關。
為了驗證所設計控制器的有效性,在本節中,給出了數值仿真來驗證從上一節得出的理論結果。考慮10 個機器人(R1,R2,R3,R4,R5,R6,R7,R8,R9,R10)和一個虛擬領航者R0,編隊隊形如圖2 所示。

圖2 機器人無向拓撲連接圖Fig. 2 Undirected topology connection diagram of robots
為了直觀地表示隊形,為每一個跟隨機器人Ri引入的虛擬機器人Rdj未在圖2 中體現。由圖2可得
期望軌跡定義為動態虛擬領航者R0,v0=1 m/s,ω0=0.1 rad/s。為了驗證本文方法的跟蹤性能不依賴于初始位置,給出了不同的初始位置下的仿真結果,記兩個初始位置為(X1,Y1, θ1) 、(X2,Y2, θ2)。初始位置和編隊期望距離及角度(λi,φi)如表1 所示。控制律的參數如表2 所示。由2.2 節的討論和表2 可得仿真系統的收斂時間上界為機器人R2跟隨R1的收斂時間上界45 s。仿真結果如圖3~圖8 所示。根據仿真圖3、4 可以得出,控制器可滿足編隊的要求,跟蹤效果顯著。圖5、6為機器人速度。如圖7、8 所示,在初始位置變化時,控制器都可以在30 s 左右實現編隊,該仿真結果符合上文討論的系統收斂時間上界。

表1 機器人初始位姿和編隊參數表Table 1 Initial pose and formation parameters of the robot

表2 固定時間控制參數表Table 2 Parameters of fixed-time control

圖3 初始位置為(X1, Y1, θ1)固定時間控制機器人軌跡Fig. 3 Trajectories of fixed-time control with(X1, Y1, θ1)

圖4 初始位置為(X2, Y2, θ2)固定時間控制機器人軌跡Fig. 4 Trajectories of fixed-time control with(X2, Y2, θ2)

圖5 固定時間控制機器人線速度Fig. 5 Robots’ linear velocity of fixed-time control

圖6 固定時間控制機器人角速度Fig. 6 Robots’ angle velocity of fixed-time control

圖7 固定時間控制的誤差xeFig. 7 Error xe of fixed-time control

圖8 固定時間控制的誤差yeFig. 8 Error ye of fixed-time control
為了比較控制律的有效性,給出有限時間控制律:

表3 有限時間控制參數表Table 3 Parameters of finite-time control
控制律與固定時間控制律采用相同的期望軌跡和初始位置。該實驗可以實現不同初始值下機器人的編隊軌跡,為了比較系統收斂時間的變化,只給出圖9 和圖10 所示的編隊誤差,當機器人初始位置發生變化時,收斂時間從20 s 變化到25 s左右。而本文控制器的系統收斂時間相對固定。


圖9 有限時間控制的誤差xeFig. 9 Error xe of finite-time control

圖10 有限時間控制的誤差yeFig. 10 Error ye of finite-time control
實驗平臺為Turtlebot3 Waffle Pi,如圖11 所示。為了驗證本文所設計控制方法的有效性,在本節中,考慮3 個Turtlebot3(R1,R2,R3)和一個虛擬領航者R0,編隊隊形如圖12 所示。為了直觀地表示隊形,為每一個跟隨機器人Ri引入的虛擬機器人Rdj未在圖12 中體現。由圖12 可得鄰接矩陣為

圖11 Turtlebot3 Waffle Pi 機器人Fig. 11 Turtlebot3 Waffle Pi robots

圖12 機器人無向拓撲連接圖Fig. 12 Undirected topology connection diagram of robots
期望軌跡由動態虛擬領航者R0確定,選取v0=0.075 m/s,ω0=0.05 rad/s。初始位置和編隊期望距離及角度(λi,φi)如表4 所示,圖13 為實驗環境。控制器的參數選取如表5所示。由2.2 節和表5 可以獲得的系統收斂時間上界為機器人R1跟蹤R0的收斂時間上界240 s。實驗結果如圖14~圖19 所示,其中圖14、15為不同初始值下機器人的編隊軌跡,圖16、17為機器人速度,圖18、19 為編隊誤差。本文的控制算法是基于理想狀態的運動學模型設計的,未考慮機器人自身的機械結構、載重等因素,且由圖13 可得本實驗環境中不可避免出側滑等情況,本文雖然在運動學模型中未考慮以上不確定性,但通過實驗結果可以看出,對側滑等不確定性有較強的魯棒性,在初始位置變化時,本文所提出的方法仍然可以在120 s 內實現編隊,該仿真結果符合上文討論的系統收斂時間上界。

表4 機器人初始位姿和編隊參數表Table 4 Initial pose and formation parameters of the robot

表5 固定時間控制參數表Table 5 Parameters of fixed-time control

圖13 實驗環境Fig. 13 Experimental environment

圖14 初始位置為(X1, Y1, θ1)固定時間控制機器人軌跡Fig. 14 Trajectories of fixed time control with(X1, Y1, θ1)

圖15 初始位置為(X2, Y2, θ2)固定時間控制機器人軌跡Fig. 15 Trajectories of fixed-time control with(X2, Y2, θ2)

圖16 固定時間控制機器人線速度Fig. 16 Robots’ linear velocity of fixed-time control

圖17 固定時間控制機器人角速度Fig. 17 Robots’ angle velocity of fixed-time control

圖18 固定時間控制的誤差xeFig. 18 Error xe of fixed-time control

圖19 固定時間控制的誤差yeFig. 19 Error ye of fixed-time control
下面再對本文方法和有限時間控制方法進行實驗對比,參數選取如表6 所示。期望軌跡和初始位置的選取和以上固定時間控制相同。該實驗可以實現不同初始值下機器人的編隊軌跡,為了比較系統收斂時間的變化,只給出圖20、圖21 所示的編隊誤差,當機器人初始位置發生變化時,收斂時間從80 s 變化到120 s,系統的收斂速度顯然受到初始位置的影響,而從實驗結果可知本文方法系統的收斂速度不受初始值影響。

表6 有限時間控制參數表Table 6 Parameters of finite-time control

圖20 有限時間控制的誤差xeFig. 20 Error xe of finite-time control

圖21 有限時間控制的誤差yeFig. 21 Error ye of finite-time control
本文提出一種固定時間編隊控制方法。該方法參照領航-跟隨策略,利用反步法技巧基于運動學模型的設計固定時間控制器來實現軌跡跟蹤,進而實現編隊控制。仿真結果表明,本文控制方法對初始位置不同的多機器人系統收斂時間基本一致,控制器很好地消除初始值對系統性能的影響。