劉自理, 嚴衛生, 張守旭
(西北工業大學 航海學院, 陜西 西安 710072)
由于在編隊控制[1-2]、目標跟蹤[3]、覆蓋控制[4]、姿態控制[5]等領域的廣泛應用,近年來多智能體系統的協同輸出調節問題得到了越來越多的關注。
多智能體系統的協同控制問題可根據系統內有無領導者分為均勻一致性問題[6]和主從跟蹤一致性問題[7]。本文研究的協同輸出調節問題屬于主從跟蹤一致性問題,該問題的解決需要達成2個條件:①保證閉環多智能體系統的穩定性;②確保輸出信號與外部信號之間的追蹤誤差趨近于零。該外部信號可代表外部輸入或者外部干擾,由外部系統(即領導者系統)產生。經典的多智能體系統輸出調節問題最初由Davison、Francis等[8-9]提出,但其控制器要求多智能體系統內的每個智能體不僅需要獲知自身狀態信息而且需要獲知外部系統的狀態變量信息。針對部分跟隨者無法直接獲知外部系統狀態變量的多智能體系統,Huang等[7]提出了分布式協同控制算法以解決多智能體系統輸出調節問題,該項研究可被看作經典輸出調節問題的延伸。隨后,文獻 [10-12] 對多智能體系統協同輸出調節問題進行了一系列擴展性研究,但是這些研究中多數沒有考慮多智能體通信網絡中的時延現象或者假設時延為固定時延。
事實上,大多數的多智能體系統都基于無線網絡進行通信,因此在智能體通信過程中不可避免地會產生通信時延[13],文獻[14]的研究對象為含有通信時延的多智能體系統,但解決的是無領導者的多智能體系統一致性問題,文獻[15]研究了具有離散時間時延多智能體系統的輸出調節問題,但其關注的是固定時延。由于每個智能體所處的外部環境和通信目標是時變的,智能體通信過程中發生的時延一般也為時變的。文獻[16]研究了時變通信時延的多智能體一致性問題,但其關注的是平均一致性問題。由于多智能體通信網絡中時變時延的存在,各智能體控制器將會無規律地異步更新鄰居節點的狀態信息,這將為分布式反饋控制算法設計增加難度,從而給多智能體系統協同輸出調節問題的解決帶來極大困難,這是本文所面臨的第一個難點。
另外,在智能體通信過程中,產生時變通信時延的同時數據丟失現象也將隨機出現[17],這將導致多智能體系統通信網絡的拓撲結構動態地發生變化,從而給多智能體閉環控制系統的穩定性分析和跟蹤誤差的收斂性分析造成極大困難。文獻[18]研究了通信網絡中存在數據丟包的多智能體一致性問題,但其關注的是平均一致性問題。文獻[11,19-21]研究了動態網絡拓撲下的多智能體輸出調節問題,但并未討論數據丟包和通信時延同時存在時的一致性問題。文獻[22]對多智能體系統動態網絡拓撲下存在時延現象的輸出調節問題進行了研究,但其關注的是固定時延。目前已發表文獻中,對通信網絡中同時存在數據包丟失和時變時延現象的多智能體系統協同輸出調節問題的研究成果較少,這也是本文所面臨的第二個難點。
基于上述研究現狀分析,本文主要研究動態網絡拓撲下具有時變通信時延的多智能體系統協同輸出調節問題。本文通過引入隊列機制,將時變時延多智能體系統轉化為具有固定時延和隨機數據丟包的多智能體系統,隨后設計出相應的狀態觀測器,進而提出分布式測量輸出反饋控制算法。該算法能有效解決隨機數據丟包和時變通信時延同時存在情況下的多智能體輸出調節問題。針對不穩定和穩定外部系統,分別給出了解決多智能體系統輸出調節問題需要滿足的條件。

若有向圖G中存在一個邊序列(v1,v2),(v2,v3),…,(vk-1,vk),則稱vk由v1可達。若有向圖G中的每一個智能體都由vi可達,則稱圖G中至少包含一個以vi為根的生成樹。
考慮引入文獻 [15] 中的隊列機制來處理多智能體通信過程中伴隨的時變時延現象。
假設G內的所有智能體時鐘同步并且數據包都以h為周期向外發送。令τ(dmin<τ 在t∈[kh,kh+τ)內,當有數據包到達vi的接收器時,vi將檢查該數據包的時間戳,若該數據包在kh時刻被發送,則vi將其放入隊列中,否則該數據包將被丟棄;在t=kh+τ時刻,vi將利用接收器隊列中的數據更新其控制輸入;在t∈[kh+τ,(k+1)h)內,所有到達vi的數據均被看為過時信息而被丟棄。通過引入隊列機制,在每個周期內G內的所有智能體都將在t=kh+τ時刻同步更新控制輸入。 假設1通信網絡中,任意2個智能體的通信與其他智能體無關;獨立同分布的時變通信時延服從均勻分布U[0,dmax],其中dmax為最大通信時延;隨機丟包過程服從伯努利分布。 一般情況下,固定拓撲下無時延的線性離散多智能體系統中的跟隨者系統可表示為如下形式: 式中,i=1,…,n,xi∈Rp,ui∈Rq,ei∈Rc,υ∈Rd分別表示第i個智能體系統的狀態,控制輸入,追蹤誤差和外部信號;Ai∈Rp×p,Bi∈Rp×q,Ei∈Rp×d,Ci∈Rc×p,Di∈Rc×q和Fi∈Rc×d均為常數矩陣;ymi∈Rcm表示第i個智能體的測量輸出,其中,角標中的m表示此變量為測量值,i指代第i個智能體;Cmi∈Rcm×p,Dmi∈Rcm×q,Fmi∈Rcm×d。 外部信號υ可以表示外部輸入或外部干擾,它可由如下外部系統產生 υ(k+1)=Sυ(k) 式中,S∈Rd×d為常數矩陣。 為保證信息傳輸的時效性,假設本文研究的多智能體系統中只有鄰居節點之間才有數據傳輸,并且各智能體不對外轉發其所接收的各項信息。因此,若智能體vj是智能體vi的鄰居節點,則vi只能將vj的狀態信息作為vi自身的控制輸入,而不能作為中繼器將vj的信息轉發給其他智能體vk。由于不能保證每個跟隨者的鄰居節點集合中都包含有領導者,為保證無法接收外部信號的跟隨者也能實現對領導者的跟蹤控制,可考慮設計如下分布式測量輸出反饋控制算法 在隊列機制下,針對通信網絡中存在隨機數據丟失和時變通信時延的多智能體系統,考慮描述跟隨者系統如(1)式所示 (1) 外部系統如(2)式所示 υ((k+1)h)=Sυ(kh) (2) (1)式和(2)式共同構成了本文研究的動態網絡拓撲環境下具有時變通信時延的多智能體系統,該系統包含n+1個多智能體,其中,(1)式表示跟隨者系統,(2)式表示領導者系統。 在隊列機制下,設計外部系統狀態變量的動態觀測器如下 (3) 針對智能體不能直接測量自身狀態信息的情況,設計自身狀態變量動態觀測器如下 (4) 因此,結合(3)式和(4)式可設計分布式測量輸出反饋控制算法如(5)式所示 (5) 結合(1)~(5)式可得智能體vi的閉環控制系統如下所示 令 (6) 式中,In?S表示單位矩陣In與矩陣S的克羅內克積,1n表示元素為1的n維列向量。 Al(k)= 定義1 給定多智能體系統(6),若存在分布式測量輸出反饋控制算法(5)使得離散時間閉環多智能體系統滿足: 1) 當外界輸入為零時,閉環多智能體系統漸進穩定; 則表明動態網絡拓撲環境下多智能體系統的協同輸出控制問題可被反饋控制算法(5)解決。 在保證一般性的前提下,首先給出解決多智能體協同輸出調節問題的標準假設條件: 假設2外部系統的系統矩陣S的所有特征值的模均不小于1。 假設3(Ai,Bi) 是可鎮定的,i=1,…,n。 假設4(Cmi,Ai) 是可觀測的,i=1,…,n。 定理1若假設1~5同時成立,令增益矩陣Ki1和Li分別滿足假設3和假設4,當且僅當參數φ(k)和Ki2在每個周期內同時滿足以下2個條件: 1) 2) 矩陣方程 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 有解(Xi,Ki2); 則稱反饋控制算法(5)可以解決動態網絡拓撲環境下存在時變通信時延的多智能體系統(6)的協同輸出調節問題。 證明: 令 則可得 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 綜上可得,在假設1~5同時成立的前提下,當且僅當參數φ(k)和Ki2在每個周期內均滿足定理1的2個條件時,反饋控制算法(5)可以解決動態網絡拓撲環境下存在時變通信時延的多智能體系統協同輸出調節問題。 假設6外部系統的系統矩陣S的所有特征值的模均小于1。 定理2若假設1和假設3~6同時成立,令增益矩陣Ki1和Li分別滿足假設3和假設4,當且僅當參數φ(k)在每個周期內均滿足 則稱反饋控制算法(5)可以解決動態網絡拓撲環境下存在時變通信時延的多智能體系統(6)的協同輸出調節問題。 證明: 同理定理1的證明過程可得,若選取滿足假設3和假設4的增益矩陣Ki1和Li,當且僅當參數φ(k)在每個周期內均滿足 綜上可得,在假設1和假設3~6同時成立的前提下,當且僅當存在參數φ(k),使得定理2中給出的條件在每個周期內均成立,則測量輸出反饋控制算法(5)可以解決動態網絡拓撲環境下存在時變通信時延的多智能體系統協同輸出調節問題。 本節以如下多智能體系統為例進行仿真分析。 假設跟蹤者系統如下所示 其領導者系統為如下形式 若轉換為(1)式和(2)式所示形式,可得 令Ki1=[-1.5,-0.5],Li=[-1.5,-3]T。顯然,假設3和假設4成立。 本節所研究的多智能體系統中存在5個多智能體,其中節點0代表領導者,節點1~4代表跟隨者。初始時刻的多智能體網絡拓撲如圖1所示,此拓撲結構中存在以0節點為根的有向生成樹。 圖1 初始網絡拓撲 由于多智能體系統在通信過程中存在隨機的數據丟包,多智能體的通信網絡在[kh,kh+τ]內的不同時刻會具有不同形式的拓撲結構,在某些特定時刻其網絡拓撲結構中將不再存在生成樹,如圖2所示。 圖2 數據丟包時的網絡拓撲集合 圖3 期望網絡拓撲 從圖3a)中可得: 圖4 外部系統不穩定時跟隨者的追蹤誤差 由定理2可知,分布式測量測量輸出反饋控制算法(5)可以解決動態網絡拓撲環境下存在時變通信時延的多智能體協同輸出調節問題,仿真結果如圖5所示。 圖5 外部系統穩定時跟隨者的追蹤誤差 由圖4和圖5可得,針對不穩定和穩定的外部系統,測量輸出反饋控制算法(5)均可使得其所有跟隨者的跟蹤誤差漸進趨向于零,動態網絡拓撲環境下存在時變通信時延的多智能體系統協同輸出調節問題可以被有效解決。 本文研究了動態網絡拓撲下具有時變通信時延的多智能體系統協同輸出調節問題。主要得到以下3項結論:①基于隊列機制,設計了新的分布式測量輸出反饋控制算法以解決具有隨機數據丟包和時變通信時延的多智能體系統協同輸出調節問題;②在標準假設成立的前提下,針對不穩定外部系統,給出了動態網絡拓撲下具有時變通信時延的多智能體系統協同輸出調節問題的解決條件;③在標準假設成立的前提下,針對穩定外部系統,給出了動態網絡拓撲下具有時變通信時延的多智能體系統協同輸出調節問題的解決條件。仿真分析驗證了本文所提出的測量輸出反饋控制算法能夠有效解決具有通信時延和數據丟失的多智能體系統協同輸出調節問題。另外,在基于隊列機制的多智能體系統協同輸出調節問題中,隊列時間的取值十分重要,因此,最優隊列時間問題將是未來工作的重心之一。1.3 系統描述








2 主要結論














3 仿真結果與分析








4 結 論