張 華,楊 艷,肖斯斯
(重慶理工大學(xué) 理學(xué)院, 重慶 400054)
螢火蟲(chóng)閃爍、魚(yú)群覓食、候鳥(niǎo)編隊(duì)飛行等動(dòng)物集群運(yùn)動(dòng)是自然界和人類(lèi)社會(huì)中的常見(jiàn)現(xiàn)象。集群運(yùn)動(dòng)作為組織高效、能耗最低的自組織行為[1],已引起國(guó)內(nèi)外學(xué)者的廣泛關(guān)注。而多智能體系統(tǒng)的協(xié)調(diào)與編隊(duì)控制是研究熱點(diǎn)之一,控制目的是設(shè)計(jì)一組控制器使得智能體系統(tǒng)形成或保持穩(wěn)定的幾何形狀[2]。目前,多智能體系統(tǒng)的協(xié)調(diào)與編隊(duì)控制被廣泛應(yīng)用于無(wú)人機(jī)(UAV)[3]和航天器的編隊(duì)控制[4]、協(xié)同機(jī)器人[5]、傳感器網(wǎng)絡(luò)[6]等領(lǐng)域。其中,圓形編隊(duì)問(wèn)題研究是該領(lǐng)域的一個(gè)重要分支[7],在現(xiàn)實(shí)生活中具有廣泛應(yīng)用,如目標(biāo)跟蹤[8]、環(huán)球?qū)Ш絒9]、誘捕[10]等。
在過(guò)去的幾十年中,學(xué)者們一直致力研究群體生物的遷移和聚集行為,以及衍生行為(包括避障、覓食和目標(biāo)跟蹤)。考慮到運(yùn)動(dòng)模式約束,圓形編隊(duì)問(wèn)題具有普遍性和廣闊的工程應(yīng)用前景,其中涉及環(huán)動(dòng)力學(xué)的研究近年來(lái)受到了大量關(guān)注。例如,Sepulchre等[11]考慮了完全耦合的網(wǎng)絡(luò)結(jié)構(gòu)的平面粒子模型,粒子以恒定速度移動(dòng),通過(guò)應(yīng)用基于勢(shì)函數(shù)的控制律來(lái)實(shí)現(xiàn)圓周運(yùn)動(dòng),并利用轉(zhuǎn)向控制律改變其相位;Sepulchre等[12]進(jìn)一步將其推廣到一般通信拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu);Jain等[13]進(jìn)一步研究了相位同步和平衡的圓形編隊(duì)問(wèn)題。同步意味著每個(gè)智能體與其他智能體在相同時(shí)間方向上移動(dòng)時(shí)的情況[14]。平衡的圓形編隊(duì)意味著所有智能體相對(duì)于固定中心移動(dòng)時(shí)的情況,該中心代表智能體的平均位置[15-16]。Jain假設(shè)每個(gè)智能體最初圍繞具有不同半徑和不同中心的單個(gè)圓移動(dòng)的情況下,智能體在圍繞公共圓的集體圓形運(yùn)動(dòng)中具有穩(wěn)定性[17],并進(jìn)一步利用有界勢(shì)函數(shù)分析了軌跡約束區(qū)域[18-19]。
需要注意,上述文獻(xiàn)中的所有模型都基于多智能體系統(tǒng)中所有智能體的速度是常數(shù)且相等。而具有非恒同速度的智能體系統(tǒng)的運(yùn)動(dòng)協(xié)調(diào)問(wèn)題更具有復(fù)雜性和挑戰(zhàn)性,在無(wú)人機(jī)應(yīng)用方面更具實(shí)際意義。鑒于此,Allgower等[20]研究了具有不同固定速度的智能體的圓形編隊(duì)控制問(wèn)題,并分析了編隊(duì)的螺旋運(yùn)動(dòng)特性。但以上模型中的智能體都圍繞公圓運(yùn)動(dòng)。近幾年,Liu等[21]提出了一種新的控制器,通過(guò)為每個(gè)智能體定義一個(gè)虛擬中心,使得智能體漸近收斂到覆蓋區(qū)域上的質(zhì)心Voronoi劃分。Sun等[22]針對(duì)一組具有不同勻速約束的單環(huán)形智能體,設(shè)計(jì)并實(shí)現(xiàn)了幾種不同的編隊(duì)方法。Chen等[23]提出了一種控制方法,使編隊(duì)飛行器收斂于以中心為時(shí)變參考的圓形運(yùn)動(dòng)。
上述討論均基于系統(tǒng)的初始角頻率一致的情況,而本文重點(diǎn)針對(duì)具有非恒同速度的智能體系統(tǒng)提出了2種編隊(duì)方法,即基于位置方法和基于位移方法[24],能夠使智能體系統(tǒng)的運(yùn)動(dòng)軌跡漸近穩(wěn)定于圓形隊(duì)形,其中智能體的初始狀態(tài)(角頻率、相位、位置狀態(tài))是隨機(jī)、不同的,從理論上證明了如何形成期望的軌跡。本文的主要貢獻(xiàn)包括:第一,給出了作用于相位上以通過(guò)控制智能體的方向來(lái)實(shí)現(xiàn)期望的圓形隊(duì)形的2種方法,即基于位置方法和基于位移方法,其中隊(duì)形的排列通過(guò)圓心來(lái)定義;第二,確定拉普拉斯相勢(shì),利用其梯度定義相位控制,并協(xié)調(diào)了相位控制與編隊(duì)控制之間的穩(wěn)定性,進(jìn)而使得智能體實(shí)現(xiàn)相位同步或相位平衡;第三,研究的多智能體系統(tǒng)的初始角頻率是隨機(jī)且不一致的,設(shè)計(jì)反饋控制器作用于角頻率,使得角頻率漸近一致且收斂到指定的值。

設(shè)第k個(gè)智能體的動(dòng)力學(xué)方程為

(1)
其中:復(fù)數(shù)rk=xk+iyk∈Z表示第k個(gè)智能體的位置;θk為其相位;vk為其線(xiàn)速度;wk∈R為其角頻率。記w=[w1,w2,…,wN]T∈RN。當(dāng)wk>0時(shí),智能體沿順時(shí)針?lè)较蛐D(zhuǎn);當(dāng)wk<0時(shí),智能體沿逆時(shí)針?lè)较蛐D(zhuǎn)[20]。uk∈R和μk∈R分別為作用在第k個(gè)智能體的反饋控制器,分別控制其運(yùn)動(dòng)方向和角頻率。
對(duì)于具有非恒同速度的智能體,如果控制器uk=μk=0,wk=w0(w0是一個(gè)非零常數(shù)),則所有智能體做圓周運(yùn)動(dòng),旋轉(zhuǎn)半徑為ρk=vk/|w0|,旋轉(zhuǎn)方向由w0的正負(fù)決定。定義智能體沿順時(shí)針?lè)较蜻\(yùn)動(dòng),則w0>0。第k個(gè)智能體的中心為ck=rk+iρkeiθk。智能體的編隊(duì)形狀將用中心位置ck定義,記c=[c1,c2,…,cN]T。
在實(shí)際應(yīng)用中需要同時(shí)控制智能體系統(tǒng)的隊(duì)形和運(yùn)動(dòng)航向,這需要隊(duì)形控制與相位控制相結(jié)合,其目的是同時(shí)控制智能體的相位并實(shí)現(xiàn)編隊(duì)隊(duì)形。在本文中將控制器uk分為2部分:

(2)

基于有限通訊網(wǎng)絡(luò)結(jié)構(gòu)對(duì)應(yīng)的拉普拉斯矩陣,定義系統(tǒng)(1)的拉普拉斯相勢(shì)為[1]

(3)



(4)
其中:w0為期望角頻率;K>0是一個(gè)常數(shù)。
為實(shí)現(xiàn)期望的角頻率,使得具有不同初始角頻率的智能體以期望的角頻率運(yùn)動(dòng),設(shè)計(jì)一個(gè)控制器μk作用于角頻率,則有

(5)
針對(duì)任意初始狀態(tài)具有非恒同速度的多智能體系統(tǒng)編隊(duì)控制問(wèn)題,討論將一組智能體繞公圓運(yùn)動(dòng)的結(jié)果擴(kuò)展到穩(wěn)定的非公圓隊(duì)形。通過(guò)基于位置方法和基于位移方法來(lái)設(shè)計(jì)智能體的編隊(duì)控制器。


(6)
其中,λ>0。
定理1考慮N個(gè)具有非恒同速度的多智能體系統(tǒng)(1)。在控制器(4)、(5)和(6)的同時(shí)作用下,當(dāng)K<0時(shí),智能體的頻率w(t)收斂于期望頻率,并實(shí)現(xiàn)相位同步。此外,位置r(t)的所有解收斂于圓周運(yùn)動(dòng),并實(shí)現(xiàn)了期望的隊(duì)形。
證明定義Lyapunov函數(shù)

(7)
則V1沿系統(tǒng)(1)的軌線(xiàn)關(guān)于時(shí)間的導(dǎo)數(shù)為

(8)



O1(r,θ,w)={r,θ,w|uk=0;wk=w0}
(9)


(10)


定理2考慮K>0個(gè)具有非恒同速度的智能體系統(tǒng)(1),在控制器(4)、(5)和(6)的同時(shí)作用下,當(dāng)K>0時(shí),智能體的頻率w(t)收斂于期望頻率,并實(shí)現(xiàn)相位平衡;位置r(t)的所有解收斂于圓周運(yùn)動(dòng),并實(shí)現(xiàn)期望的隊(duì)形排列。
證明定義Lyapunov函數(shù)

(11)
式(11)沿系統(tǒng)(2)的時(shí)間導(dǎo)數(shù)為

(12)
O2={(r,θ,w)|uk=0,wk-w0=0}
(13)

注1定理1和定理2的目的是使得一組具有非恒同巡航速度的智能體在任意初始狀態(tài)的無(wú)序運(yùn)動(dòng)情況下穩(wěn)定到一個(gè)單一固定中心的圓周運(yùn)動(dòng),其中各自的圓心互不相同。在結(jié)果中,每個(gè)智能體的軌跡都圍繞單個(gè)的中心運(yùn)動(dòng),這確定了所需要的運(yùn)動(dòng)形狀。此外,基于位置方法的控制策略沒(méi)有使用智能體之間的耦合通訊關(guān)系,每個(gè)智能體不使用其他智能體相關(guān)的期望位置信息。但是這種隊(duì)形定義方式需要智能體獲得自己在全局坐標(biāo)系下的位置,因此對(duì)傳感器測(cè)量能力要求較高。


(14)

定理3考慮N個(gè)具有非恒同速度的智能體系統(tǒng)(1)。在控制器(4)、(5)和(14)的同時(shí)作用下,當(dāng)K<0時(shí),智能體的頻率w(t)收斂于期望頻率,并實(shí)現(xiàn)相位同步;位置r(t)的所有解收斂于圓周運(yùn)動(dòng),并實(shí)現(xiàn)期望的隊(duì)形排列。
證明定義Lyapunov函數(shù)

(15)
V3沿動(dòng)力學(xué)系統(tǒng)(1)的時(shí)間上的導(dǎo)數(shù)為


O3(r,θ,w)={r,θ,w|uk=0;wk=w0}
(16)


(17)

定理4考慮N個(gè)具有非恒同速度的智能體系統(tǒng)(1),在控制器(4)、(5)和(14)的同時(shí)作用下,當(dāng)K>0時(shí),智能體的頻率w(t)收斂于期望頻率,并實(shí)現(xiàn)相位同步;位置r(t)的所有解收斂于圓周運(yùn)動(dòng),并實(shí)現(xiàn)期望的隊(duì)形排列。
證明定義Lyapunov函數(shù)

(18)
V4沿動(dòng)力學(xué)系統(tǒng)(1)的時(shí)間上的導(dǎo)數(shù)為


O4(r,θ,w)={r,θ,w|uk=0;wk=w0}
(19)

注2與基于位置方法不同的是,基于位移方法只需要每個(gè)智能體在局部坐標(biāo)系下可以實(shí)時(shí)獲得自己與其鄰居的位移。當(dāng)所有智能體與其鄰居之間的當(dāng)前位移達(dá)到期望位移時(shí),多智能體系統(tǒng)實(shí)現(xiàn)了期望隊(duì)形。該控制原理僅要求智能體獲得在局部坐標(biāo)下與其相鄰智能體之間的位移,故智能體之間的通訊滿(mǎn)足連通條件即可。
注3式(9)、(13)、(16)和(19)分別定義了系統(tǒng)解的不變集。這4個(gè)不變集看起來(lái)類(lèi)似,實(shí)際是不同的。O1和O3包含的是同步的相位解,O2和O4包含的是平衡的相位解。此外,O1和O2包含的位置r(t)解是基于位置方法下智能體的運(yùn)動(dòng)軌跡,O3和O4包含的位置r(t)解是基于位移方法下智能體的運(yùn)動(dòng)軌跡。
在模擬過(guò)程中,多智能體系統(tǒng)由5個(gè)智能體組成,每個(gè)智能體的初始參數(shù)設(shè)置如表1所示。

表1 系統(tǒng)初始參數(shù)設(shè)置


圖1 能體系統(tǒng)通訊拓?fù)鋱D
首先考慮基于位置的情況,結(jié)合控制律(4),(5),(6),在圖2中,(a)顯示了耦合強(qiáng)度K=-1.5時(shí)多智能體系統(tǒng)在600 s的時(shí)間內(nèi)繞著期望中心運(yùn)動(dòng)的運(yùn)動(dòng)軌跡,(b)顯示了在585.2~600 s時(shí)間段內(nèi)智能體的運(yùn)動(dòng)軌跡,在該時(shí)間段內(nèi)智能體運(yùn)動(dòng)了4個(gè)周期,此時(shí)智能體的運(yùn)動(dòng)圓心分別為(5.008 1,1.992),(5.005 7,5.998 3),(5.009 6,9.990 7),(5.018 4,13.974 7),(5.006 5,17.989),漸近收斂到期望圓心,由此可驗(yàn)證定理1中多智能體系統(tǒng)實(shí)現(xiàn)了基于位置方法的編隊(duì)形狀的穩(wěn)定性。圖3顯示了定理1中耦合強(qiáng)度K=-1.5智能體系統(tǒng)的頻率收斂于期望頻率。圖4顯示了耦合強(qiáng)度K=-1.5時(shí)勢(shì)函數(shù)收斂到最小值,K=1.5時(shí)勢(shì)函數(shù)收斂到最大值,由此可以驗(yàn)證,定理1和定理2中的相位收斂于同步狀態(tài)或平衡狀態(tài)。

圖2 K=-1.5時(shí)多智能體系統(tǒng)運(yùn)動(dòng)軌跡

圖3 K=-1.5時(shí)角頻率與時(shí)間關(guān)系


圖5 基于位移方法下K=-1.5時(shí)多智能體系統(tǒng)運(yùn)動(dòng)軌跡

圖6 K=-1.5時(shí)角頻率與時(shí)間關(guān)系

圖7 基于位移方法下勢(shì)函數(shù)曲線(xiàn)
對(duì)基于位置方法和基于位移方法的模擬結(jié)果進(jìn)行對(duì)比,定義的期望中心一致,但智能體的運(yùn)動(dòng)狀態(tài)軌跡顯示,圖2中5個(gè)智能體的圓心分別漸近收斂到如下位置:(4.990 8,17.976 7),(4.966 0,1.952 0),(4.972 6,9.994 6),(4.978 5,6.015 5),(4.980 3,1.996 8);而圖5中的5個(gè)智能體的圓心收斂到期望的自身與其鄰居的相對(duì)位移,分別為(-0.000 1,4.000 0),(0.000 1,4.000 1),(-0.000 3,3.999 8),(0.000 3,4.000 2)。存在差異性的原因是2種方法的控制原理不同,主要在于基于位置方法下的智能體在運(yùn)動(dòng)時(shí)能夠感知自身的期望中心位置,因?yàn)橥ㄓ嵰笫谦@得自己在全局坐標(biāo)系下的位置;基于位移方法中智能體需要感知自身與其鄰居之間的相對(duì)中心位置,進(jìn)而實(shí)現(xiàn)編隊(duì)。
1) 要實(shí)現(xiàn)期望的編隊(duì)運(yùn)動(dòng)需要智能體的相位達(dá)到同步或平衡。通過(guò)拉普拉斯勢(shì)函數(shù)實(shí)現(xiàn)對(duì)智能體群線(xiàn)性動(dòng)量的控制。在相位同步過(guò)程中智能體群線(xiàn)性動(dòng)量達(dá)到全局最小值;在相位達(dá)到平衡過(guò)程中智能體群線(xiàn)性動(dòng)量達(dá)到全局最大值。
2) 多智能體系統(tǒng)能以指定的角頻率實(shí)現(xiàn)期望的編隊(duì)隊(duì)形。重點(diǎn)分析了如何利用2種方法設(shè)計(jì)編隊(duì)控制器,其原理是通過(guò)智能體之間的測(cè)量方式和能力確定不同的幾何形狀。論證結(jié)果表明智能體實(shí)現(xiàn)所需的形狀與穩(wěn)定的圓周運(yùn)動(dòng),且角頻率漸近一致收斂到指定值。
3) 數(shù)值模擬結(jié)果截取的最后4個(gè)周期運(yùn)動(dòng)軌跡表明該組智能體運(yùn)動(dòng)軌跡的穩(wěn)定性,還表明系統(tǒng)的初始狀態(tài)和參數(shù)都會(huì)影響系統(tǒng)的收斂速度。未來(lái)研究將以此為切入點(diǎn),分析討論收斂速度和各參數(shù)之間的關(guān)系。