李淼,陳智隆,杜明晶
(1.中國空空導彈研究院,河南洛陽,471003;2.麥吉爾大學計算機科學學院,加拿大蒙特利爾,H;3.江蘇師范大學計算機科學與技術學院,江蘇徐州,221116)
在現實世界中,動物及人類經常通過有規律的編隊行為進行集體性的協作活動,單只個體之間的合作能夠大幅度提高搜索效率及覆蓋的面積,同時能極大的降低個體單獨行動所受到攻擊的可能性。在生態系統中,魚鳥群、群居野獸在遷徙、捕獵時通常會根據風向或獵殺環境形成一個相應的編隊,整個編隊在移動時可以視為一體。學者通過鳥類編隊飛行展開研究,并將編隊隊形應用于飛機編隊的仿真與試驗,通過類似的研究證明,適當的編隊在飛行時能夠顯著減少能量的消耗,對多個智能體及其環境組成的系統進行編隊系統能夠發揮出單個個體所不具有的價值與優勢。
隨著科技發展,電子、計算機等科技的進步,多智能體協同控制[1]的研究取得了很大的進步,通過多智能體之間的協同控制實現多智能體行為的智能化,進而完成復雜任務,其應用價值已經拓展到仿真生物領域、人工智能領域、傳統工業領域、現代通信與控制領域等個學科中。現實生活中,智能體協同進行復雜重復性的勞動,諸如掃地機器人等智能化設備已經越來越多的走進了我們的生活;軍事上可以使用多智能體協同完成危險的任務,例如排雷和拆彈,以及通過無人機去實現偵察,代替傳統意義上需要人來完成的任務[2]。目前,無人機、機器人、衛星及導彈等被協同應用的個體已經成為學術界相關領域的研究重點。
由于多智能體有自治、自學習、自組織等能力,編隊控制吸引了很多學者的研究[3]。在執行任務的過程中,一群機器人被要求因具體的任務從而形成某種合適的隊形[4]。根據不同的任務要求,國內外研究者提出了很多典型的控制方法,隨著網絡技術和智能體技術的發展成熟和廣泛應用,平臺協調控制已經成為多智能體研究中的熱點問題[5],而分布式人工智能的發展形成了應用于多智能體的一致性理論[6]。本文的多智能體編隊即基于分布式隊形控制中的圖論法進行控制研究。
在實際編隊中,“共享”在整體之間的信息傳遞中十分重要,只有在掌握其他成員的狀態信息后,控制器才會發出相應的控制指令。但智能體之間難免存在通信受限,如通信距離受限,通信時滯,通信中斷等問題。
將多智能體看成一種近似二階微分的運動形態,即其運動狀態表示為:

其中,i為智能體的編號,xi為智能體的位置信息,vi為智能體的速度信息,ui為控制輸入。多智能體之間通過傳感器(如雷達)來探測周圍目標從而獲取狀態信息。在其編隊過程中,由于通信距離受限,各個目標所能感受到的其它目標隨著時間的改變也是不同的,如圖1(左)所示。計劃形成的穩定狀態如圖1(右)所示。

圖1
基于上述考慮,可定義通信受限的多智能體一致性協議如下:

其中i,j代表多智能體,下標d表示期望的運動狀態即v˙d表示期望速度的導數,h表示在期望隊形中的相對位置。當多智能體如圖1(右)的隊形所示達到穩定狀態時,定義h=[0,0;-2,2;-4,4;-6,6;-2,-2;-4,-4;-6,-6],由于此時h只是表示相對隊形,所以此坐標中h的數值的定義和智能體的實際位置無關,只與他們的相對位置有關。通過對為三個控制參數的調整,能夠使每個智能體更快的向位置收斂或更快的向速度收斂。當智能體達到一致性時,即i,j之間保持了隊形要求的相對位置。即i,j保持了同樣的速度,即第i個智能體達到了要求的速度vd,ui=v˙d即u達到了速度要求的變化量v˙d,此時編隊達到了穩定狀態[8]。
將圖1(右)中圓點視為大小不同的穩定狀態下的多智能體,設每個多智能體的通信范圍d為15,其目標隊形及初始位置如表1所示。
將表1中目標隊形和初始位置利用Matlab軟件模擬,在通信距離受限的情況下,存在多智能體不能夠獲得全局信息的情況,如圖2所示,其中紅色外圈表示其通信范圍,藍色的圈表示智能體的初始位置,所以需要根據周圍的智能體的信息來獲得通訊。當編隊達到穩定后,不能保證每個智能體同時獲得全局信息,但每個智能體都能夠獲得周圍的信息,這時能夠靠分布式的信息交換和控制實現編隊。

圖2 初始通信范圍及列隊后通信范圍示意

表1 目標隊形及初始位置示意表
通信距離受限時智能體編隊為整體的運動軌跡如圖3(左)所示,其中左側紅色小圈為智能體初始位置,紅色大圈為左上角的智能體對應的通信范圍,藍色線為其行駛軌跡,最后的紅色*為最終的隊形,紅色大圈為通信范圍。
選取相鄰的1號、2號智能體為觀測對象,其橫向速度的收斂曲線由圖3(右)所示,可以看出兩個智能體最終速度收斂于一穩定的數值。可知最后其收斂于一個規則的隊形,驗證了一致性協議可用,說明該一致性協議可以保證最終達到共速。

圖3
以無人機控制為例,在實際控制中由于通信帶寬的限制以及復雜電子環境下對飛行器電子靜默和隱身的要求,網絡中一般采用相鄰局部通信的分布式控制。而在實際執行任務中,編隊中的無人機被擊落或故障引發的通信中斷等問題也會發生,所以本章節將以通信中斷后多智能體為連通圖的中斷問題進行研究。
設編隊坐標為h=[0,0;-2,2;-4,4;-6,6;-2,-2;-4,-4;-6,-6],分別對應編號1-7號,由于紅色智能體(2號)失聯,所以重新定義的對隊形目標矩陣為h=[0,0;-2,2;-2,2;-4,4;-2,-2;-4,-4;-6,-6]。當2號智能體中斷通信或者被擊中事,3號機依然可以檢測到1號機的位置,7架飛機構成的是一個連通圖,設定通信中斷前隊形如圖4(左)所示,通信中斷后采取補位策略,即2號機中斷后的目標隊形如圖4(右)所示,在這種情況下可以直接重整隊形。

圖4
圖5(左)中紅色星號為智能體在通信中斷時的隊形和通信中斷后重整的隊形。圖5(右)則為最后的實際隊形,當通信中斷為連通圖時,可以通過改變目標隊形的方法直接重整隊形,從而實現補位策略。

圖5
本節將對非連通圖兩種情況進行編隊通信。當通信范圍小而要求的隊形控制距離較長時,如當2號機被擊落時,1號機將和3號機失聯,從而無法構成連通圖。在這種情況下,本文將采用兩種策略:(1)中斷后通過預測直接重整隊形。適用于僅有少量智能體(無人機)被擊中或失聯的情況下;(2)中斷后通過預測先集中,后重整隊形。
通訊中斷后,智能體通過預測控制來實現追蹤和重整,而在分布式控制中,由于無法獲得其動態性能等條件,傳統意義上的預測控制難以實現,所以本項目引入時間序列的預測方法—ARIMA模型來進行預測。
ARIMA模型全稱為自回歸移動平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名時間序列預測方法。其過程示意圖如圖6所示。

圖6 ARIMA過程示意圖
在編隊過程中,如果發生了通信中斷,如智能體突然檢測到通信中斷或者無人機突然感知到周圍無人機被擊中產生火光等作為一個中斷信號,那么智能體將對其軌跡經行預測,在重整編隊中,引入虛擬智能體,當作其依然存在,直到編隊恢復正常。
中斷后,智能體通過預測直接進行重整隊形,當僅有非1號的單一智能體失聯時,能夠通過預測方法來實現重排,初始隊形如圖7所示。

圖7 初始編隊示意圖
仿真過程中采用的速度為:
橫向速度:vd1=0.3-0.001t;
縱向速度vd2=0.3+0.001t;
通信中斷后,通過預測的方法得到通信中斷的智能體的軌跡,由于2號機并不受控制,只能通過控制剩余的智能體實現整個圖重新連通,如圖8所示,通過預測使其重新構成連通圖,讓3,4號補2,3號的位置,當達到連通圖時即可實現任意編隊,其中紅色三角為通信中斷前的隊形,紅色星號為通信中斷后重排的隊形,藍色線條為預測軌跡。在這種條件下,通過預測失聯智能體的軌跡,從而實現將整個智能體群重新連通從而實現隊形重整。

圖8 單個智能體失連中斷后的重排策略
當多個智能體發生失聯時,通過預測軌跡并修改目標隊形有時并不能實現重排,所以我們采取先集中,后重排的策略。即當發生失聯時,通過預測其他無人機的軌跡來輔助實現集中,之后再重整隊形。如圖9所示,圖中兩個智能體發生通信中斷,即開始設定h=[0,0;-2,2;-4,4;-6,6;-2,-2;-4,-4;-6,-6],集中過程中設定h=[0,0;0,0;0,0;0,0;0,0;0,0;0,0],最終隊形h=[0,0;-2,2;-4,4;-2,-2;-4,-4]。圖中紅色三角形為通信中斷前的隊形,紅色為預測軌跡,藍色為實際軌跡,紅色為集中策略實現的集中點,紅色星號為最終隊形。由此可證,能夠通過先集中再編隊這種策略來實現重排。

圖9 多個智能體中斷后通過預測先集中示意圖
綜上,多智能體通訊中斷后為非連通圖的隊形重整能夠通過兩種策略來實現通信,如圖10所示。

圖10 兩種策略流程圖
本文就三種類型的多智能體失聯下重新編隊的方法進行了研究,對基于一致性理論的方法進行了試驗和證明。
但在實際情況中,通信受限的條件要比理論中的更復雜,通信范圍,通信質量的好壞也有可能是時變的,而在這種情況下如何證明全局漸近穩定也是十分必要的。而在智能體之中出現通信中斷時,中斷信號的判定也影響著編隊穩定。多智能體群中的隊形切換方法和變換方法還需要進一步研究,即如何選取一個更優的策略使得智能體在最短時間內形成指定的編隊隊形。對于不同隊形的要求不同的初始條件還沒有穩定性的相關證明。不同的環境,不同的智能體之間的個體差異也廣泛存在,所以相關理論還需要更多的發展。同時,基于一致性理論的方法的穩定性和魯棒性有待進一步研究[10]。