
如今,無人機表演已成為一種備受歡迎的“大型燈光秀”。在表演中,成百上千架無人機按照編程設定好的路徑飛行,在天空中共同勾勒出復雜絢麗的形狀和圖案。當一切按計劃進行時,無人機表演場面頗為壯觀,然而,一旦有一架或多架無人機出現故障則可能會對地面觀眾構成嚴重威脅,比如近期在美國佛羅里達、紐約等地發生的事故。
無人機表演事故的發生讓人們意識到在“多智能體系統”中保障安全依然面臨挑戰。多智能體系統由多個相互協調、協作并經過計算機編程的智能體組成,常見的比如無人機、機器人和自動駕駛汽車等。
如今,美國麻省理工學院的工程師團隊開發出一種針對多智能體系統的訓練方法,能夠確保這些系統即便在擁擠復雜的環境中也能安全運行。研究人員發現,利用這種方法訓練少量智能體后,它們學到的安全邊界和控制策略可以自動擴展應用到更多的智能體上,進而提高整個系統的安全性。

在實際演示過程中,該團隊訓練了幾架微型無人機成功完成不同任務,比如在飛行過程中同時變換位置并降落在移動的機器人上面。在模擬實驗里,同樣的程序在幾架無人機上訓練后,可以復制并擴展到數千架無人機,使大規模系統能夠安全地完成任務。
“對于任何需要多智能體協作的應用場景,比如搜索救援無人機、倉庫機器人以及自動駕駛汽車等,這種方法都有望成為行業標準。這就像是構筑了一道‘安全屏障’,能讓每個智能體在執行任務的同時保障安全。”麻省理工學院航空航天學副教授范楚楚表示。
在設計多智能體系統的安全機制時,研究人員通常需要考慮每個智能體相對于系統中其他智能體的潛在運動路徑,這種兩兩之間的路徑規劃不僅耗時且計算成本高昂。即便如此,也無法完全確保安全。
“在無人機表演中,每架無人機都被預先設定好了特定軌跡,包括一系列路徑和時間點,然后它們就‘閉上眼睛’按照這個計劃飛行。由于它們只知道需要自己的既定路徑,一旦發生意外情況就不知道該如何進行調整。”這項研究的主要作者張宋元(音譯)指出。
與傳統方法不同,麻省理工學院團隊嘗試開發一種新的方法,先訓練少量智能體安全運行,然后讓這種安全策略能有效擴展到系統中的所有智能體。更關鍵的是,這種方法不再為單個智能體規劃具體路徑,而是讓它們能夠持續‘繪制’自己的安全邊界(即一旦超出就可能不安全的區域邊界)。這樣一來,智能體只要始終處于安全邊界范圍內,就可以選擇任意路徑完成任務。
從某種程度上來說,團隊提出的這種方法和人們在日常生活中直觀地導航周圍環境很相似。“想象一下,你身處一個人很多的購物中心,為了安全行走且不撞到別人,你通常只會留意自己周圍數米范圍內的人,而不會去關注相距更遠的人,我們的研究采用的就是類似的局部方法。”蘇奧斯瑞解釋道。
在這項新研究中,團隊提出了一種名為“GCBF+”的方法,即“圖控制屏障函數”。在機器人技術領域,屏障函數是一個數學概念,用于計算安全邊界,一旦智能體越過這個邊界就很可能變得不安全。在多智能體系統中,由于智能體的移動,對于任何一個智能體而言,其安全區域隨時都可能發生變化。
通常情況下,設計人員在計算多智能體系統中某個智能體的屏障函數時,需要考慮它與系統中所有其他智能體的潛在路徑和交互情況。但麻省理工學院團隊的方法不同,他們只計算少數智能體的安全區域,而且計算方式足夠精確,能夠反映系統中更多智能體的動態變化。
“計算出少數智能體的屏障函數后,我們可以將其復制并應用到每個智能體上,這樣就能快速得到適用于系統中任意數量智能體的安全區域圖。”蘇奧斯瑞表示。
在計算智能體的屏障函數時,團隊首先考慮了智能體的“感知半徑”,即根據其傳感器能夠觀察到的環境范圍。就像在購物中心的例子里,研究人員假設智能體只需關注其感知半徑內的其他智能體,就能保證安全并避免碰撞。
接下來,團隊利用計算機模型模擬智能體的特定機械能力和限制,設計出一個“控制器”,也就是一組關于智能體及其相似個體應該如何移動的指令。然后,他們讓多個智能體按照特定軌跡移動并進行模擬,記錄它們之間是否發生碰撞或其他交互情況。
“有了這些軌跡數據,我們就能計算出一些最小化的規則,比如當前控制器中出現了多少次安全違規情況,然后據此更新控制器,提高安全性。”張宋元表示。
通過這種方式,控制器可以被編程到智能體中,讓智能體在即時環境中感知其他智能體信息,持續繪制自己的安全區域,并在安全區內移動來完成任務。
“我們的控制器具有實時反應能力。它不會提前規劃好固定路徑,而是不斷收集無人機的行進方向、速度,以及其他無人機的速度等信息,利用這些信息實時生成計劃,并且每次都會重新規劃路徑。所以,一旦環境發生變化,它能夠迅速響應調整,確保安全。”范楚楚表示。
團隊在一個由8架微型四旋翼無人機組成的系統中對GCBF+方法進行了演示。這些無人機的任務是在空中飛行并變換位置。如果無人機直接沿最短路徑直線飛行,肯定會相撞,但在經過團隊方法訓練后,無人機能夠在飛行過程中實時調整,相互避讓,始終保持在各自的安全區域內,成功在空中完成了位置切換。
類似地,團隊還讓無人機飛行并降落在特定的輪式機器人上,這個機器人持續繞著大圈行駛,無人機在降落過程中也能避免相互碰撞。
“使用我們的框架,只需要告訴無人機它們的目的地,而不是整個無碰撞的路徑軌跡,無人機就能自己找出如何到達目的地而不發生碰撞。”范楚楚表示。她設想,這種方法可以應用到任何多智能體系統中來保障安全,比如無人機表演、倉庫機器人、自動駕駛汽車以及無人機配送系統等。