唐朝君
(重慶理工大學 理學院, 重慶 400054)
由于當前多智能體系統在分布式傳感器網絡、編隊控制、信息融合和蜂擁等問題中的廣泛應用,對多智能體系統的研究吸引了不同領域研究學者的廣泛關注。一致性是多智能體系統協調控制研究的基礎,也是多智能體系統研究中最重要和最基本的一個問題。一致性是指通過設計恰當的分布式控制協議,使系統中的智能體就某些關鍵的量趨于一致。根據系統中是否有領導智能體,可以將一致性分為兩類,即無領導的一致性和領導跟隨一致性。
1995年,Vicsek等[1]提出了一個簡單卻十分有趣的離散時間多智能體系統模型,通過仿真演示了系統中所有的智能體最終以共同的方向前進。2003年,Jadbabaie等[2]利用矩陣理論和代數圖論的方法首次給出了Vicsek模型的理論解釋。Olfati-Saber和Murray[3]對連續時間多智能體系統的一致性研究做了開創性的工作,分別研究了固定和切換網絡拓撲下的一致性問題,以及帶有單一時滯的一致性問題。隨后,Ren等[4]研究了更為一般的網絡拓撲,給出了系統解決一致性所需的最弱的拓撲條件。隨著一致性問題研究的不斷深入,發展了一系列的重要的子課題,主要包括具有通信時滯的一致性、帶有測量噪聲的一致性、有限時間一致性、基于時間觸發機制的一致性和隨機網絡拓撲下的一致性問題等,具體參見文獻[5]。
在實際應用中,絕大多數的物理系統本質上都是非線性系統。因此,對非線性多智能體系統一致性的研究具有重要意義。近年來,對非線性多智能體系統一致性的研究得到了一些有趣的結果。受同步理論的啟發,文獻[6-7]在一致性協議中引入了非線性函數來描述智能體內在的非線性動態。針對有向網絡拓撲,提出了廣義代數連通度的概念,并用其得到了一致性的充分條件。文獻[8-9]利用牽制控制(pinning control)研究了二階非線性多智能體系統的領導-跟隨一致性問題。文獻[10]研究了非線性多智能體系統的有限時間一致性問題。文獻[11]研究了非線性多智能體系統的包含控制問題。
在現有大多數對一致性問題研究的文獻中, 所給出的一致性協議中都需要用到網絡拓撲所對應的Laplacian 矩陣特征值的信息, 這是一個全局的信息,因此這些控制協議并非嚴格意義的分布式控制協議。為了解決這個問題,一些研究學者提出了基于自適應的控制協議。目前,對基于自適應控制協議的一致性的研究已經得到了一些有趣結果[12-15]。另外,文獻[6-11]中都是假設系統中的智能體具有相同的非線性動態,而對具有不同本質非線性動態多智能體系統一致性的研究還鮮有報道。基于非線性動態的參數化分解,Yu等[16]對具有不同本質非線性動態多智能體系統提出了一種基于自適應的控制協議來追蹤同樣具有未知非線性動態的領導智能體。受文獻[16]的啟發,本文研究具有不同本質非線性動態多智能體系統的一致性問題。與文獻[16]相比,本文的創新之處主要體現在兩個方面:① 本文研究的是無領導的一致性問題,適用于更為一般的多智能體系統;② 文獻[16]只研究了無向網絡拓撲,本文分別研究了無向和有向網絡拓撲。值得注意的是,有向網絡拓撲更加符合實際應用,而無向網絡拓撲可視為有向網絡拓撲的特例。
考慮由n個智能體構成的多智能體系統。智能體i的動力學模型為
(1)
式中:xi∈R是智能體i的狀態;ui(t)∈R是智能體i的控制輸入;fi(xi,t)∈R是智能體i自身動力學的非線性函數。
假設非線性函數fi(xi,t)滿足如下Lipschitz條件:
|fi(xi,t)-fi(xj,t)|≤l|xi-xj|
(2)
式中:xi,xj∈R;l>0為正常數。上述條件用于保證系統(1)解的存在性和唯一性。本文研究具有不同非線性動態的多智能體系統一致性問題,即對每個智能體設計分布式的控制協議ui,使所有智能體的狀態趨于一致。具體問題由如下定義給出:
定義1若系統(1)的解在任意初始條件下滿足
則稱多智能體系統(1)解決一致性問題。
本文利用有向圖來描述系統中智能體之間的拓撲結構。有向圖G由一個頂點集V和邊集E組成,其中V={1,2,…,n},頂點i表示智能體i,E={(i,j)|i,j∈V}。若智能體i能接收到智能體j的信息,則(j,i)∈E,否則(j,i)?E。若(j,i)∈E, 則稱頂點j是頂點i的鄰居或者智能體j是智能體i的鄰居。從vi1到vik的一條路徑是由一系列不同的頂點vi1,vi2,…,vik構成,并且這些頂點滿足(vij,vij+1)∈E,j=1,2,…,k-1。如果從G中任一頂點到另外一頂點都有路徑存在,則稱G是強連通的;如果G中至少有一個頂點到其他頂點都有路徑存在,則稱G包含生成樹。對于有向圖G,如果(i,j)∈E蘊含著(j,i)∈E,那么稱G是無向圖;若無向圖G包含生成樹,則稱G是連通的。

圖G的Laplacian矩陣L=[lij]∈Rn×n定義為

Laplacian矩陣在一致性問題的研究中具有非常重要的作用, 它具有下面的性質[4]:
引理1 0是L的特征值, 1n=(1,1,…,1)T∈Rn是對應的特征向量,其他非零特征值的實部全部大于0;0是L代數簡單的特征值當且僅當圖G包含生成樹。

本節給出分布式的控制協議,使系統(1)能解決一致性問題。假設非線性動態fi(xi,t)可進行線性參數化:
式中:φi(xi,t)∈Rm為已知的基函數向量,θi∈Rm為未知的常數參數向量。
注1本文假設智能體的非線性動態可以進行線性參數化。線性參數化的模型在經典的自適應控制中已經被廣泛研究[17-18]。文獻[16,19-21]對線性參數化的多智能體系統進行了研究。
使用如下的分布式控制協議:
(3)
首先研究固定拓撲的情形,此時系統的通信拓撲保持不變。利用協議(3),系統(1)可以寫成下面的向量形式:
(4)
定理1假設系統的通信拓撲G連通。利用協議(3), 系統(1)解決一致性問題。

則


G是連通的無向圖,則L是對稱陣,而且存在正交陣U=(u1,u2,…,un)∈Rn×n,使得
UTLU=diag{λ1,λ2,…,λn}

eTLe=eTUdiag{λ1,λ2,…,λn}UTe=

對于有向網絡拓撲, 容易得到下面的結論:
定理2假設系統的通信拓撲G是平衡圖且包含生成樹。利用協議(3),系統(1)解決一致性問題。
證明使用定理1證明中的記號。注意到
由于G是平衡圖且包含生成樹, 由引理2可得

在實際應用中,由于障礙物的存在或者個體之間的相互影響,系統中的通信拓撲往往是時變的,因此研究時變拓撲下的一致性問題更具有實際意義。設P={G1,G2,…,Gs}為系統所有可能通信拓撲的集合, 其中m<+∞。為了描述時變拓撲, 定義分段定常切換信號:σ(t):[0,+∞)→J={1,2,…,s}。因此, 時刻t時系統的通信拓撲為Gσ(t),簡記為Gσ。此時,系統(4)變為
(5)
定理3假設系統的通信拓撲Gi,?i∈J連通。利用協議(3),系統(1)解決一致性問題。

與定理1的證明方法相同,可得
注意到Gσ為連通的無向圖,可得
eTLσe≥λ2(Lσ)eTe

本小節給出2個實例來驗證本文理論結果的正確性。考慮1個含有5個智能體的多智能體系統,智能體i的非線性動態可以參數化為
fi(xi,t)=[xisint,xicost]θi,i=1,2,…,5


例1設系統的通信拓撲如圖1所示。為方便起見, 設圖中每條邊的權值均為1。智能體的初始位置隨機地選取為x(0)=(2,1,3,5,8)T和x(0)=(1,5,2,4,3)T,在協議(3)的作用下,智能體的狀態隨時間的變化曲線如圖2、3所示。顯然,智能體的狀態隨著時間的變化趨于一致,與定理1的結論相符。

圖1 系統的通信拓撲G1

圖2 智能體的狀態曲線1

圖3 智能體的狀態曲線2
例2設系統的通信拓撲如圖4所示。為方便起見, 設圖中每條邊的權值均為1。顯然G2是平衡圖且包含生成樹。智能體的初始位置隨機地選取為x(0)=(2,1,3,5,8)T和x(0)=(1,5,2,4,3)T。在協議(3)的作用下,智能體的狀態隨時間的變化曲線如圖5、6所示。顯然,智能體的狀態隨著時間的變化趨于一致,與定理2的結論相符。

圖4 系統的通信拓撲G2

圖5 智能體的狀態曲線3

圖6 智能體的狀態曲線4
針對具有未知和不同非線性動態的多智能體系統,基于非線性動態的線性參數化分解的方法,給出了基于自適應的一致性控制協議。利用代數圖論、矩陣理論和Lyapunov的方法進行穩定性分析。對于無向拓撲,當通信拓撲連通時,所給的協議解決一致性問題;對于有向拓撲,當系統的通信拓撲是平衡圖且包含生成樹時,所給的協議解決一致性問題;對于切換網絡拓撲,當系統所有可能的通信拓撲連通時,所給的協議解決一致性問題。最后通過仿真實例驗證了理論結果的正確性和有效性。