羅俊芝 詹 環 張雪飛 閔祥娟
(陸軍裝甲兵學院基礎部 北京 100072)
多智能體系統(Multi-agent systems)是指由大量局部相互作用的簡單個體(稱為Agent)組成的復雜系統[1]。多智能體系統有廣泛的應用背景,其理論運用到了車輛編隊、無人機協調飛行、物流供應鏈系統控制等實際問題。尤其是隨著科學技術的發展,多智能體系統的應用研究變得日益重要,近些年來成為控制界學者的關注的焦點[2~11]。
一致性控制問題是多智能體系統研究的重要方面,所謂一致性控制是指基于多智能體系統中個體之間有限的信息交換,設計一致性協議,使得所有智能體的某一個狀態量或是所有狀態量趨于相等,即使得智能體之間能夠達到協調一致性,最終完成復雜任務。如Wen G H[2]針對具有無向連通拓撲結構的多智能體系統,假設每個Agent 的狀態方程為連續線性模型,研究了系統的分布式一致性控制問題。Liu S[3]則針對有向拓撲結構的智能體系統,考慮了帶有虛擬的Leader Agent情形,設計了含有時滯的一致性控制協議,給出了多智能體系統的一致性控制的條件。Zhang J[4]利用滑??刂茖Ψ蔷€性多智能體系統一致性控制問題進行了研究。Li Z K 等[5]考慮了系統在有向拓撲結構下,分析了在帶有界輸入下的分布式一致性跟蹤問題。Shen Q K 等[6]研究了固定拓撲結構下的多智能體系統的自適應一致性控制問題。
注意到文獻[2~6]研究中,智能體之間采用的是固定拓撲結構,但是在實際問題中,如車輛編隊控制問題,車輛的相對位置關系可能隨時間的演變發生變化,從而各智能體之間的拓撲結構相應也會發生;再比如,在移動機器人進行通訊過程中,由于網絡的故障造成信息傳遞丟失,多智能體系統的網絡拓撲結構也可能發生變化,因此具有時變拓撲結構的多智能體系統的研究引起了人們的關注。目前有些文獻對此問題也進行了研究,如Hu J P[7]在研究了在拓撲結構是時變的情形下,系統有Leader領導下多智能體系統的跟蹤控制問題,Porfri M[8]分別針對無向定拓撲和有向定拓撲兩種情形給出了保證系統幾乎必然一致的充分條件,Sun Y G[9]研究了在有向拓撲結構下的多智能體系統的的一致性問題,其中系統的拓撲結分為固定有向拓撲和可變有向拓撲情形。邵俊倩等[10]研究了在變拓撲網絡結構下的多無人機系統的一致性控制問題。林敏等[11]研究了時變拓撲結構下的多無人機領航跟隨一致性和軌跡跟蹤問題。Xue D 等[12]研究了多智能體系統在隨機切換拓撲結構下的編隊控制問題。
上述文獻中,假定系統的拓撲結構是變化的,這種假定符合實際問題的情況,本文也考慮到實際問題中各智能體之間的拓撲結構的變化,并假設各拓撲結構的切換符合馬爾可夫過程,且設計了依賴于切換拓撲的一致性協議,給出系統的一致性控制的條件。與文獻[7~12]不同的是,本文給出的一致性條件與拓撲結構的鄰接矩陣的特征值有關,設計了與系統切換拓撲結構切換的轉移概率相關的一致性協議,并且通過理論和數值仿真可以證明在此一致性協議下推導得到的系統一致性條件,能夠使多智能體的狀態能夠趨于一致。
假設多智能體系統含有N個智能體,以每個智能體為節點,該系統可以抽象為包含N個節點的有向加權圖G(V,ε,A) ,其中V={v1,v2,…vN},ε?V×V,代表圖中任意兩個節點vi,vj的有向邊,鄰接矩陣為A=[aij],其中aij≥0,如果aij=0,說明節點vi到vj沒有邊連接。如果aij=aji,則該圖為無向圖。L=[cij]表示鄰接矩陣對應的Laplace 矩陣。
本文考慮智能體之間的拓撲結構為無向圖。
假設多智能體系統的第i個Agent的動態模型為

設計的一致性控制協議形式如式(2):

其中Kσ為控制器的增益,c為各智能體之間的耦合系數,aij(k)為鄰接矩陣的元素,反映了智能體之間在時刻k時信息交互情況。
下面基于時變拓撲結構下研究多智能體系統的一致性控制問題,首先拓撲結構的變化滿足如下的假設。





下面將針對多智能系統(1),進行數值模擬仿真,具體的系統參數取值如下:

假設由6 個Agent 組成的多智能體系統,即N=6,其動態拓撲結構圖在如下四種情形(圖1-圖4)之間進行切換,且各拓撲結構對應的轉移概率矩陣為


圖1 拓撲結構1

圖2 拓撲結構2

圖3 拓撲結構3

圖4 拓撲結構4
利用Matlab工具,求解條件(6),進一步求得
P1=[0.9082 0.1146;0.1146 0.9049];P2=[0.9082 0.1146;0.1146 0.9049];
P3=[0.9158 0.1071;0.1071 0.9123];P4=[0.9079 0.1149;0.1149 0.9046]。K1=[-0.5042 0.6807];K2=[-0.4989 0.6735];K3=[-0.5039 0.6802];K4=[-0.5022 0.6779]。
取c=0.5 ,e(0)=[1,2,1,2,3,5,3,0.2,0.3,0.6,5,4],進行仿真得到切換信號曲線和誤差系統曲線如圖5和圖6。

圖5 多智能體系統的拓撲切換信號

圖6 多智能體系統的狀態曲線
結論:從仿真圖形5和圖形6可以看出,在系統的拓撲結構變化的情況下,通過設計與拓撲結構相關的一致性協議,多智能體誤差系統的狀態曲線趨于穩定,即各智能體的狀態變量趨于一致,這說明了本文所提出的控制方案的有效性。
本文針對多智能體系統,研究了系統的一致性控制問題。通過設計依賴于諸節點的時變的拓撲結構的一致性協議,且假定了該時變的拓撲結構的變化符合馬爾可夫過程,利用了隨機穩定性理論,給出了系統達到一致的充分條件,并給出了一致性協議的具體表達形式,借助Matlab 軟件,對系統進行了仿真,驗證了所提方案的有效性。