基于二層鄰居信息的多智能體系統編隊控制

2017-10-21 08:20:06柴運，熊濤

計算機應用 2017年8期

關鍵詞：一致性智能信息

柴運，熊濤

(南京郵電大學自動化學院，南京 210023)

(*通信作者電子郵箱chaiyun_nupt@163.com)

基于二層鄰居信息的多智能體系統編隊控制

柴運*，熊濤

(南京郵電大學自動化學院，南京 210023)

(*通信作者電子郵箱chaiyun_nupt@163.com)

為了加快多智能體編隊控制過程中的狀態收斂，提出基于多跳式網絡技術的編隊控制方法。首先將多智能體系統(MAS)中的每個智能體之間的相對速度偏移引入到控制協議中，然后引入每個智能體與標準位移之間的位置偏移，最后將多跳式網絡技術應用在已定的通信拓撲之中，更多的機體信息被傳遞，每一個智能體能夠聯系上的鄰居數量更多。利用一個六智能體系統的編隊仿真進行驗證，仿真結果表明所提出的編隊控制方法可以使得多智能體系統形成指定隊形，并且與沒有引入多跳式網絡技術的控制方法相比，其狀態收斂所需時間減少了約10 s，收斂效率更高。

二階一致性；矩陣分析；多智能體系統；編隊控制；二層鄰居信息

0 引言

多智能體系統(Multi-Agent System, MAS)被廣泛應用于飛船探測、災難調查、網絡傳感器等實際生活中，也因此多智能體的分布式控制在近年來一直是研究熱點。在對于多智能體分布式控制的研究中，一個最核心的問題就是如何利用好自身和近鄰智能體的信息來設計分布式控制策略，使得智能體的所有狀態可以達到一致，即大家所熟知的一致性問題。依據不同的控制目標可以將控制多智能體的方法分為兩類:第一類的控制目標是使MAS的位置收斂到一個常值[1-2]；第二類[3]是使MAS的位置和速度都收斂到一個常值(這個常值一般都不為零)。依據控制對象可以分為一階[4-6]和二階模型[7-8]兩類。國內的研究人員在針對多智能體編隊的控制問題上，常常考慮到現實應用中的一些限制條件，其中主要有MAS在編隊過程中的拓撲結構的變換需求以及智能體之間的通信時延和輸入時延等[9-12]。其中：文獻[9]研究了在固定拓撲和變換拓撲結構下，具有通信時延的MAS的H∞一致性問題；文獻[10]考慮到在現實應用中通信時延可能只是隨機出現，所以討論了隨機時延下的智能體一致性問題；文獻[11]分別設計了線性控制器和非線性控制器使得MAS能夠達到加權平均一致性；文獻[12]利用廣義Nyquist判據推導出使得系統達到一致的充分條件。進行一致性設計的過程中，有效的控制算法可以有效提升系統的一致性性能，而收斂速度是判斷一致性協議性能優劣的重要參數，經過多年的研究，已經有一些常見方法可以提高系統的收斂速度。第一種方法是在拓撲結構改變的情況下，將方程平均一致的收斂速度界離散更新，以此得到收斂時間的上界[13-14]；第二種方法是通過對局部的節點進行預測來提高收斂速度[15-16]；第三種方法則是徹底推翻以前的控制方法，重新設計新的控制方法來提高收斂速度。第四種方法是通過對加權矩陣進行優化來加速一致性協議[17-19]。

本文通過引入絕對位置和相對速度以及二層鄰居信息來設計二階一致性協議，并在此基礎上設計了多智能體的編隊控制方法。本文提出的一致性控制方法可以使多個智能體的狀態最終達到到預置的常值，而且與文獻[8]中的二階一致性控制協議相比，本文的編隊控制方法實現編隊控制的時間更短。該控制方法既不實質改變MAS的通信拓撲，又提高了狀態收斂速度，進而優化了一致性表現性能。最后對基于改進一致性協議的編隊控制方法進行了仿真，結果也表明本文提出的控制方法更加高效。

1 一致性問題陳述

考慮有m個智能體在一個平面上移動，編號為1,2,…,m。本文假設每個智能體的機械結構都是相同的，并且每個智能體的動力學模型都可以描述為：

(1)

其中：ri∈IRm，vi∈IRm分別表示智能體的位移和速度；ui∈IRm是控制律。

在有向圖(N,ε)中的m個節點分別代表m個智能體[20]。這里N表示有限非空點集；ε∈N2是有序節點對，表示邊。如果節點υi到節點υj存在一條有向邊，那么υi就是這條有向邊的父節點，υj就是這條有向邊的子節點。在有向圖中，有向路徑就是(υi1,υi2),(υi2,υi3),…這樣的有序邊的序列。其中υij∈N。如果有向圖不同節點之間都存在一條有向路徑，有向圖就是強連通的。有向樹是有向圖中所有的有向連接邊形成的。如果一個圖存在由圖的子集組成的樹，則稱該圖存在一個(有向)生成樹。

針對本文中的智能體動力學模型，所提出的一致性協議基于智能體自身的狀態信息和它近鄰智能體傳遞過來的相關位置速度信息，使得位移和速度可以和期望的位移和速度達到一致，即：

為了推導控制方法漸近穩定所需滿足的條件，下面給出推導過程中所需要的兩個引理：

引理2 令Re(·)和lm(·)分別表示一個數字的實部和虛部，并且一個矩陣的特征值有如下形式：

這里λ,μ∈C。如果α≥0,Re(μ)<0,并且

那么就有Re(λ±)<0。

s1=γ2(A2-B2)+2ABγ2i

s3=γ2(A2-B2)+4A+(2ABγ2+4B)i

想要|s1|>|s3|,就有：

自然可以得到：

8Aγ2(A2+B2)+16(A2+B2)<0

再通過簡單的轉換，可以得到：

2 一致性協議

文獻[8]提出的一致性協議如下：

(2)

很明顯可以看出上面的一致性協議僅僅考慮了絕對速度偏移和相對位置偏移，這樣并沒有充分利用智能體自身的狀態信息。為了提高收斂速度以及編隊效率，在不實際改變MAS網絡拓撲的前提下，本文將二層鄰居信息引入到一致性協議中，并且考慮標準位置偏移和相對速度偏移，提出一種改進的一致性協議：

(3)

A和L是原通信拓撲圖的虛擬矩陣和拉普拉斯矩陣，有：

(4)

(5)

(6)

對協議(3)進行簡單的變換，可以得到：

(7)

(8)

這里通過求解det(λI2n-Σ)=0得到Σ的特征值：

(9)

由于：

(10)

通過比較式(9)和式(10)，式(9)可以轉變為下面的方程：

det((λ2+αλ+β)+γλui)

可以進一步得到：

λ2+αλ+β=γλμi

λ2+(α-γμi)λ+β=0

因此矩陣Σ的特征值如下：

上式結果表明矩陣Σ的特征值λi±與μi密切相關。

基于引理1和2，下面給出一致性協議(7)達到狀態一致的充分條件。

定理1 一致性協議(7)可以使得ri→rj→rd，vi→vj→vd，?i,即位移和速度都可以漸進地趨近給定的追蹤值的條件是多智能體的通信拓撲有生成樹，并且滿足：

3 多智能體編隊控制

為了將一致性協議(7)應用在多智能體編隊控制上，需要對式(7)進行變形，目的在于使MAS可以實現：ri-rj→δid和vi→vj→vd。不同于一般的編隊控制，編隊依賴于智能體之間的位置信息交換，使得智能體間的相對位移達到期望位移，這里δid表示的是智能體i與標準位移之間的期望絕對位移，也意味著智能體編隊依賴的是自身的位置信息，這樣既降低了編隊收到通信因素影響的可能，又減輕了智能體的負荷。這里令δi∈IRm,是一個常數。控制輸入設計為：

(11)

這樣將一致性協議(7)變形后，就得到了基于絕對位移、絕對速度以及相對速度的多智能體編隊控制輸入，這樣充分利用智能體自身的狀態信息達到編隊飛行的目的，提高MAS編隊控制的效率。

4 仿真與分析

4.1 一致性仿真

將本文提出的改進的一致性協議應用在兩自由度的含有六個智能體的MAS中。原系統的通信拓撲圖如圖1所示。

圖1 六個智能體的拓撲圖Fig. 1 Topology of six Agents

將“二層鄰居”的虛擬通信結構加入到通信拓撲圖中，每個智能體獲得的狀態信息更加豐富，鄰居智能體集中的機體數量更加龐大，此時的系統通信拓撲圖如圖2所示。

圖2 加入二層鄰居信息之后的拓撲圖Fig. 2 Topology with second-order information

相應的原圖1的拉普拉斯矩陣為：

一致性協議(7)的仿真結果由圖3和圖4給出。圖3、4中的仿真結果表明，隨著時間的推進，六智能體系統中的所有機體的位移與標準位移之間的誤差趨近于零，以及所有的機體的速度與標準速度之間的誤差趨近于零。這就標示著所有機體的位移可以追隨給定的標準位移，可以形成并維持指定的編隊隊形。

仿真結果表明本文改進的一致性協議(7)可以使得每個智能體的狀態趨于一致，收斂到給定的追蹤值，這也意味著形成編隊隊形之后，六智能體系統可以保持給定的速度，維持指定隊形前進。即：

圖3 智能體位置誤差Fig. 3 Location error of Agents

圖4 智能體的速度一致性Fig. 4 Speed consistency of Agents

4.2 編隊仿真

要基于本文改進的一致性算法設計編隊控制就需要對一致性協議(7)進行變形，使得MAS在實際編隊飛行時可以避免碰撞，并且可以保持隊形。為了突顯本文編隊控制方法的優勢，分別對文獻[8]中基于式(2)的編隊控制和本文中基于式(11)的編隊控制進行仿真。

首先為了將一致性協議(2)應用到多智能體編隊控制中，需要對式(2)進行簡單變形，在控制律(2)中引入智能體之間的相對位移，在編隊飛行時避免碰觸，并且以此來確定編隊隊形，變形結果如下：

接下來對上面的由控制律(2)演變而來的編隊控制方法進行仿真實驗，并且設置vd=(3,2)。圖5和圖6分別表示的是智能體在編隊飛行過程中X和Y軸方向上的速度。從圖中可以看出，從控制律(2)變形而來的控制方法可以使得六智能體在編隊飛行時，當時間到達接近18 s時，智能體系統在X軸方向上的速度收斂并將保持在3 m/s，在Y軸方向上的速度會收斂并且保持在2 m/s，收斂到給定的標準值。

圖5 X方向上智能體的速度變化(文獻[8]方法)Fig. 5 Speed variation of Agents at X direction (method of literature [8])

然后將本文中的編隊控制策略(11)應用到六智能體編隊飛行中，與上面的仿真實驗一致，設置vd=(3,2),圖7、8是此編隊控制方法的仿真實驗結果。從圖可以看到，無論是在X軸方向上面的速度Vx,還是在Y軸方向上面的速度Vy,都在接近8 s時趨近于設定的期望速度vd=(3,2),并且此后會保持這個期望速度繼續編隊飛行。

圖6 Y方向上智能體的速度變化(文獻[8]方法)Fig. 6 Speed variation of Agents at Y direction (method of literature [8])

圖7 X方向上智能體的速度變化(本文方法)Fig. 7 Speed variation of Agents at X direction (the proposed method)

圖8 Y方向上智能體的速度變化(本文方法)Fig. 8 Speed variation of Agents at Y direction (the proposed method)

通過圖5～8這四個仿真結果的兩兩對比，從時間消耗上面分析，以控制律(2)演變而來的編隊控制方法控制的智能體系統的速度收斂并保持期望值的時間是18 s，而以本文的編隊控制方法(11)所需的時間是8 s，由此可以簡單得出結論，本文中的編隊控制方法的收斂速度更快，編隊效率更高。

下面進行六智能體系統在編隊過程中的位置仿真，首先給出編隊控制方法(11)中的智能體與標準位移之間的期望位移差：δ1d=(-4,6)，δ2d=(-2,-3)，δ3d=(2,-3)，δ4d=(4,0)，δ5d=(2,3)，δ6d=(-2,3)。在仿真實驗中，以智能體1為基準，以其他智能體與智能體1之間的位移差為輸出，得到的仿真結果如圖9所示；圖10表示的是六個智能體編隊飛行軌跡。通過這兩個仿真結果可以清晰看出六智能體之間的相對位置漸漸趨于穩定，將在收斂到期望值之后按照預置的智能體之間的相對位移保持編隊隊形繼續飛行。

圖9 智能體1與其他智能體的相對距離Fig. 9 Relative distance between Agent 1 and others

圖10 編隊軌跡Fig. 10 Formation trajectory

5 結語

本文主要研究了在不改變實際給定的通信拓撲的情況下，努力提高MAS收斂速度，提高多智能體編隊表現性能。在原本的一致性協議基礎上引入了標準位置偏移和相對速度偏移，并且將二層鄰居信息融入到一致性協議之中，充分利用信息交互提高收斂效率。仿真實驗的結果表明本文改進的一致性協議比原協議有更高的收斂速度，并且基于此協議的編隊控制方法能使智能體系統更快地達到期望編隊隊形，這在現實應用中有很大意義。

References)

[1] CHOPRA N, SPONG M W. Passivity-based control of multi-Agent systems [M]// Advances in Robot Control: From Everyday Physics to Human-Like Movements. Berlin: Springer-Verlag, 2006: 107-134.

[2] CHUNG S-J, SLOTINE J-J E. Cooperative robot control and concurrent synchronization of lagrangian systems [J]. IEEE Transactions on Robotics, 2009, 25(3): 686-700.

[3] WANG H. Flocking of networked uncertain Euler-Lagrange systems on directed graphs [J]. Automatica, 2013, 49(9): 2774-2779.

[4] OLFATISABER R, MURRAY R M. Consensus problems in networks of Agents with switching topology and time-delays [J]. IEEE Transactions on Automatic Control, 2004, 49(9): 1520-1533.

[5] OLFATI-SABER R, FAX J A, MURRAY R M. Consensus and cooperation in networked multi-Agent systems[J]. Proceedings of the IEEE, 2007, 95(1): 215-233.

[6] REN W. Multi-vehicle consensus with a time-varying reference state [J]. Systems & Control Letters, 2007, 56(7/8): 474-483.

[7] CAO M, XIAO F, WANG L. Event-based second-order consensus control for multi-Agent systems via synchronous periodic event detection [J]. IEEE Transactions on Automatic Control, 2015, 60(9): 2452-2457.

[8] JIE Q, JIANG G. A simple second-order consensus and formation control for multi-vehicle systems [C]// Proceedings of the 2014 33rd Chinese Control Conference. Piscataway, NJ: IEEE, 2014: 1333-1337.

[9] 劉學良,胥布工.具有多個通信時延的多智能體系統分布式H∞一致性控制[J].控制與決策,2012,27(4):494-500. (LIU X L, XU B G. DistributedH∞consensus control for multiple-Agent systems with communication delays[J]. Control and Decision, 2012, 27(4):494-500.)

[10] 宗鑫,崔艷.具有隨機通信時延的二階多智能體系統的一致性控制[J].計算機應用,2015,35(5):1358-1360. (ZONG X, CUI Y. Consensus of the second-order multi-Agent systems with random time-delays [J]. Journal of Computer Applications, 2015, 35(5): 1358-1360.)

[11] 俞輝,蹇繼貴,王永驥.多智能體時滯網絡的加權平均一致性[J].控制與決策,2007,22(5):558-561. (XU H, JIAN J G, WANG Y J. Weighted average-consensus for networks of multi-Agent with time-delays [J]. Control and Decision, 2007, 22(5):558-561.)

[12] 楊洪勇,張嗣瀛.離散時間系統的多智能體的一致性[J].控制與決策,2009,24(3):413-416. (YANG H Y, ZHANG S Y. Consensus of multi-Agent system with discrete-time [J]. Control and Decision, 2009, 24(3): 413-416.)

[13] OLSHEVSKY A, TSITSIKLIS J N. Convergence rates in distributed consensus and averaging [C]// Proceedings of the 2006 45th IEEE Conference on Decision and Control. Piscataway, NJ: IEEE, 2007: 3387-3392.

[14] ANGELI D, BLIMAN PIERRE-ALEXANDRE. Convergence speed of distributed consensus and topology of the associated information spread [C]// Proceedings of the 2007 46th IEEE Conference on Decision and Control. Piscataway, NJ: IEEE, 2007: 300-305.

[15] AYSAL T C, ORESHKIN B N, COATES M J. Accelerated distrib-uted average consensus via localized node state prediction [J].

IEEE Transactions on Signal Processing, 2009, 57(4): 1563-1576.

[16] ZHANG H-T, CHEN M Z Q, STAN G-B. Fast consensus via predictive pinning control [J]. IEEE Transactions on Circuits & Systems I: Regular Papers, 2011, 58(9): 2247-2258.

[17] XIAO L, BOYD S. Fast linear iterations for distributed averaging [J]. Systems & Control Letters, 2004, 53(1): 65-78.

[18] XIAO L, BOYD S, LALL S. A scheme for robust distributed sensor fusion based on average consensus [C]// IPSN 2005: Proceedings of the Fourth International Symposium on Information Processing in Sensor Networks. Piscataway, NJ: IEEE, 2005: 63-70.

[19] BOYD S, GHOSH A, PRABHAKAR B, et al. Randomized gossip algorithms [J]. IEEE Transactions on Information Theory, Special issue of IEEE Transactions on Information Theory and IEEE ACM Transactions on Networking, 2006, 52(6): 2508-2530.

[20] GODSIL C, ROYLE G. Algebraic Graph Theory [M]. Berlin: Springer-Verlag, 1975: 298.

[21] REN W, BEARD R W. Consensus seeking in multiagent systems under dynamically changing interaction topologies [J]. IEEE Transactions on Automatic Control, 2005, 50(5): 655-661.

[22] HORN R A, JOHNSON C R. Matrix analysis [J]. Graduate Texts in Mathematics, 2005, 169(8): 1-17.

This work is partially supported by the Natural Science Foundation of Nanjing University of Posts and Telecommunications (NY214075).

CHAIYun, born in 1992, M. S. candidate. His research interests include formation of Agents, formation of UAVs with time-delays.

XIONGTao, born in 1991, M. S. candidate. His research interests include nonlinear control, formation of UAVs.

Second-orderinformationbasedformationcontrolinmulti-Agentsystem

CHAI Yun*, XIONG Tao

(CollegeofAutomation,NanjingUniversityofPostsandTelecommunications,NanjingJiangsu210023，China)

In order to speed up the state convergence in the multi-Agent formation control process, a formation control method based on multi-hop network technology was proposed. Firstly, the relative velocity deviation between Agents of Multi-Agent System (MAS) was introduced into the control protocol. Then, the absolute displacement deviation between Agents and the standard displacement was introduced. Finally, the multi-hop network technology was applied in the communication topology, so more information was passed around and each Agent enlarges its “available” neighborhood. A six-Agent formation control example was used to verify the proposed protocol. The simulation results show that the proposed control method can make the system build up the specified formation; and the time required for state convergence is reduced by nearly 10 seconds compared with the control method that does not take into account multi-hop network technology, which verifies that the proposed method is more efficient.

second-order consensus; matrix analysis; Multi-Agent System (MAS); formation control; second-order neighbor information

TP18

2017- 01- 24;

2017- 03- 06。

南京郵電大學自然科學基金資助項目(NY214075)。

柴運(1992—)，男，江蘇南京人，碩士研究生，主要研究方向：多智能體編隊飛行、通信延遲下的多無人機編隊飛行；熊濤(1991—)，男，江蘇南京人，碩士研究生，主要研究方向：非線性控制、無人機編隊。

1001- 9081(2017)08- 2264- 06

10.11772/j.issn.1001- 9081.2017.08.2264