張旭 賈磊磊 李玲
[摘要]多機器人追捕一逃跑問題一直是人工智能研究的一個典型問題。當存在多個機器人時,他們可以通過實時通信和協商來提高追捕效率,即機器人協調合作問題。因此,多機器人圍捕問題具有一定的代表性,已成為目前研究多個智能體合作與協調系統的理想研究平臺。本文通過對多機器人圍捕問題的研究與分析,采用模糊控制的圍捕協調策略,成功的完成了圍捕任務。
[關鍵詞]多機器人;圍捕;模糊控制;協調策略
0引言
近年來,多機器人系統研究因其自身的復雜性和并行性,以及廣泛的應用領域,受到越來越多專家和學者的關注。多機器人協調與對抗是多機器人系統研究中的基本問題,而多機器人圍捕問題是多機器人系統研究的一個典型問題。隨著機器人技術的不斷發展。多機器人系統的研究成果已經廣泛應用于工業、航天、軍事和民用服務業等各個領域。多機器人圍捕是指在多機器人追捕過程中,不僅要順利完成追逃任務,同時在特定的條件下保持一定的追捕隊形實現最終的一種“包圍”狀態Ⅲ。能夠有效應用于多機器人圍捕問題的協調策略,經過簡化后同樣能夠適用于一般的追捕任務。因此,本文主要針對多機器人圍捕問題的協調策略進行分析研究,更加具有典型的意義。
本文主要討論的多機器人圍捕問題是基于局部信息感知的,即在追捕過程中,雙方并不能完全感知周圍的所有信息。因為在實際應用中,追逃雙方往往不能完全探測到周圍的復雜地形以及對抗雙方的實時位置信息。
1基于虛擬力預測的逃逸機器人策略
文中主要討論多機器人圍捕單機器人的策略分析問題,對于單個逃逸者而言,在速度固定的情況下,需要躲避所有的追捕者以防止被圍捕,因此只需要討論對抗策略,不涉及自身的協調問題。根據圖1分析可知,距離逃逸者最近的追捕者pk對逃逸者的威脅最大,反之距離越遠的追捕者對逃逸者的威脅越小。根據每個追捕者與逃跑者的位置距離的遠近,設置反比例權系數,對于逃逸者當前的虛擬目標點預測計算如圖1所示。
根據傳感器反饋的位置信息,找出距離逃逸者最遠的追捕者i,其距離逃逸者的距離設為depi,令它對逃逸者的威脅系數設為λd,即距離最大的追捕者相對于逃逸者的反矢量距離,則其他追捕者對逃逸者的威脅分別取為(仿真中令λd=3):
(1)
(2)
則求得逃逸者到虛擬目標的矢量為:
(3)
由式(3)結合當前逃逸者的位置可得到逃逸者的虛擬目標點pgoal。若最終無法找到合適的逃逸者的虛擬目標點,即沒有可以選擇的可行方向,或者逃逸機器人與每個追捕機器人之間的距離均小于某一確定閾值時,則圍捕任務結束。
2基于模糊控制的追捕機器人協調策略
模糊集合理論的概念是L.A.Zadeh教授在1965年在Information&Control雜志中首次提出,隨后得到了不斷的擴展與完善,逐漸由數學領域應用推廣到工業及信息等領域的應用。模糊邏輯控制就是在模糊集合的應用與發展中提出的一個新的分析方法及控制策略。
在本文中。假設一共有三個圍捕機器人。通過模糊邏輯進行分析,對每一個追捕機器人的每一步運動方向及夾角進行控制,通過實時在線檢測。每一步確定距離逃逸者最近的追捕機器人為pk,距離最近的追捕機器人在追捕過程中直接奔向逃跑者的下一步的虛擬目標點。此時對于追捕機器人pk而言,其每一步的追捕效率是最高的。對于其它兩個距離逃逸者較遠的追捕機器人,采用模糊邏輯控制,來確定其每一步的運動方向。即對于除pk以外的兩個追捕機器人,輸入為每一個追捕機器人與pk的夾角大小,輸出為追捕機器人的追捕運動的方向角。以逃跑機器人為中心,實時檢測任意一個追捕機器人與pk的夾角大小θ1(θ1是指追捕機器人與p。之間較小的小于180~的夾角)。將θ1量化為三個論域(0°,90°),(60°,120°),(90°,180°),并按照一定的隸屬度關系使論域與模糊變量{?。╯),中(M),大(L)}湘對應。
進一步的,通過解模糊來確定兩個追捕機器人每一步的運動方向及夾角θ2。將θ2量化為三個論域:(擴大與pk夾角即反向旋轉60°),(不旋轉即保持原有運動方向)和(縮小與pk夾角即正向旋轉60°),并按照一定的隸屬度關系使該論域與模糊變量的三個語言取值{F,Z,N}相對應。
三個追捕者最終的運動狀態為追上逃跑者,同時呈120°夾角包圍逃跑者的狀態,此時追捕任務結束。
模糊控制規則如下:
規則1:if θ1 is S then θ2 is F;
規則2:if θ1 is M then θ2 is Z;
規則3:if θ1 is L then θ2 is N……
3確定障礙物環境中機器人運動方向
本文仿真環境為mobotsim軟件,該軟件包含傳感器信息,可以自由定義傳感器個數。本文在分析研究過程中,選擇傳感器的個數為三個,設定傳感器的有效范圍為三米。當傳感器的當前測量返回值為3時,說明此傳感器探測到障礙物的距離為3m或當前狀態下障礙物相距相對較遠沒有探測到障礙物,因此默認3m以外的障礙物對機器人的影響忽略不計。
根據當前追捕機器人與逃逸機器人分別的傳感器輸入測量值的大小,按照一定的比例,對避障行為與追逃雙方根據圍捕策略確定的運動方向進行矢量和計算,最后確定各個追逃機器人的每一步的最終運動方向,
根據“木桶原理”,對于任意一個機器人的三個傳感器輸入值,找出其最小值設為λmin,λmin∈(0,3m)。根據λmin值的大小,進而分別確定圍捕任務時目標策略與避障策略的權系數ω1和ω2,其中ω1+ω2=1。當λmin∈(0,1)時,ω1取值為0.2,ω2取值為0.8;當λmin∈[1,2]時,ω1取值為0.4,ω2取值為0.6;當λmin∈(2,3)時,ω1取值為0.8,ω2取值為0.2。設任意時刻機器人根據目標選擇運動方向的轉角為θF,避障策略的轉角為θZ,則機器人每一步最終的運動方向角θ為:
θ=ω1θF-ω2θZ (4)
4設置追捕者優先級
在圍捕過程中,若追捕機器人追捕速度遠大于逃逸者的速度,或者多個機器人運動到障礙物較復雜且距離較近區域時,根據當前的策略選擇運動方向后,由于追捕機器人之間的互相影響,可能會導致兩個追捕者停滯運動而導致最終的圍捕失敗的結果。由于傳感器的感應范圍限制在0到3m之間,因此當機器人的運動速度過大時,可能會造成雙方位置距離較小的狀態,或是此時若兩邊存在類似對稱的障礙物,則可能陷入局部極小永遠無法繼續運動。而且,當機器人的速度過大時,對仿真的有效性驗證也有影響,且在一定程度上會影響避障和路徑選擇策略的效果。因此本文在仿真時選擇比較接近的追逃機器人速度,即盡量保證追捕者與逃逸者在速度上不存在優劣,以便更加直觀有效的對追逃協調策略的性能進行驗證。
同時,在多機器人圍捕過程中,對追捕機器人分別設置優先級別,設RI>R2>R3(1、2、3為仿真中機器人的編號),即1號追捕機器人優先級最高,3號優先級最小。若是出現了上述可能的陷入局部運動失敗的情況,根據優先級判斷,優先級別高的機器人根據當前策略繼續前進,優先級別較低的機器人稍作停頓,等待下一周期策略選擇后再繼續運動,這樣就能夠在不影響策略整體效果的情況下及時的轉化僵局保證圍捕任務的順利進行。
5仿真實驗
本文的仿真環境為mobotsim移動機器人仿真軟件,仿真環境為用網格表示的二維坐標平面,其中一個單位網格表示實際lm的距離。除初始位置不同外,各個機器人的其它性能參數均相同,即追捕機器人與逃逸機器人分別具有相同的傳感器探測范圍,大小體積相等。
基于模糊控制的多機器人圍捕仿真結果如圖3所示。由圖可知,仿真結果達到了良好的協調圍捕效果,同時驗證了本文中所研究圍捕策略的有效性及穩定性。
[責任編輯:楊玉潔]