999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于沖突避讓的多智能體有效旁路規(guī)劃

2025-07-28 00:00:00劉春玲裴萌韶
計算機(jī)應(yīng)用研究 2025年7期
關(guān)鍵詞:旁路關(guān)鍵沖突

關(guān)鍵詞:基于沖突搜索;狹窄路段;有效旁路;多智能體路徑規(guī)劃;臨時等待位置;次優(yōu)路徑中圖分類號:TP242 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-3695(2025)07-024-2103-06doi:10.19734/j.issn.1001-3695.2024.11.0469

Abstract:Tosolvetheproblemthatmultipleagents innarrowenvironmentcannotavoidtheconflictonkeychannels,which leads to thelow eficiencyof multi-agent path finding,this paper proposed an effective bypassplanning algorithm basedon fieldofviewconflictsearch.Intheupperlayerof theconflict-basedsearchalgorithmframework,thefieldofviewrepresented thecommunicationrangeof theagent.Byscanning the multi-value decision diagramof allagents inthecommunicationrange of theagent,thealgorithm determinedwhether therewasacompetion forsharedresources betweentheagents,leading to conflicts.Themulti-valueddecisionbacktrackingconflictavoidance strategyresolvedtheconflictsbetween multipleagentson thecriticalchannel.Byscanning the multi-valueddecision diagram,theagentobstructingthecritical channelcould find the suboptimalpathorthetemporarywaiting positionasaneffetivebypasstoavoidthecollsion.Theresultsofdifferentscaleand structure maptestshow thatmuli-valued decision backtracking conflictavoidance strategycan effectivelyreducetheoccurrenceof conflictbetwenagents.Intherandom-64-64-10and maze-128-128-10mapenviroments,theaveragesuccessrateof pathfinding for multiple agents improves by 10% and 15.2% ,respectively,compared with CBS-BP,proving that this algorithm effectively avoids conflicts and increases pathfinding success rates.

Key words:conflict-based search;narrowsection;efectivebypass;multi-agentpath planning;temporary waiting position; suboptimal path

0 引言

多智能體路徑規(guī)劃(multi-agentpath finding,MAPF)作為智能體領(lǐng)域的研究熱點,受到國內(nèi)外學(xué)者廣泛關(guān)注[1-3]。近幾年,移動智能體在各行各業(yè)得到了廣泛應(yīng)用,例如自動物流倉儲系統(tǒng)[4.5]、自動駕駛汽車[6、搜索營救[7]等。

MAPF主要目的是保證多個智能體在躲避環(huán)境中的靜態(tài)障礙物的基礎(chǔ)上,互相不發(fā)生碰撞,且都能找到一條從不同起始點到各自目標(biāo)點的最優(yōu)路徑。由于其NP-hard[8]的復(fù)雜性,多個智能體在尋路過程中,隨著智能體數(shù)量的增加,或路徑規(guī)劃場景較復(fù)雜時,求解空間激增,擴(kuò)展節(jié)點較多,導(dǎo)致智能體之間的沖突加劇,路徑求解效率低。近年來,由于基于沖突搜索(conflict-basedsearch,CBS)算法的兩層結(jié)構(gòu)更容易與各種算法結(jié)合,所以提出了很多關(guān)于CBS算法的改進(jìn)算法解決MAPF問題,包括層次合成的CBS算法(hierarchicalcompositionCBS,HCCBS)[9]、彈性的 ECBS 算法(flexible ECBS,F(xiàn)ECBS)[1]、自適應(yīng)特定于agent的次優(yōu)CBS算法(adaptiveagent-specific suboptimal bounding approach,ABS-ECBS)[11]、顯示估計的 CBS 算法(explicit estimation CBS,EECBS)[12]等。

A* 算法是尋找最優(yōu)路徑的經(jīng)典算法[13]。溫惠英等人[14]通過在 A* 算法中引入負(fù)載因子,使規(guī)劃路徑避開擁堵點,實現(xiàn)道路負(fù)載均衡。在多智能體路徑規(guī)劃的眾多問題中,智能體之間沖突的檢測與解決是一個主要問題。宣志瑋等人[1在CBS的上層算法 A* 基礎(chǔ)上作出改進(jìn),但當(dāng)場景較大時,沖突數(shù)量驟增,拓展節(jié)點隨之增多,增加了A*算法的計算量,導(dǎo)致路徑求解效率很低[16]。王卓然等人[17]提出了一種基于神經(jīng)網(wǎng)絡(luò)的RankNet算法對沖突進(jìn)行選擇,但其只提高了CBS選擇沖突的效率,沒有實現(xiàn)兩個智能體路徑信息互享,無法避免沖突的發(fā)生。文獻(xiàn)[18\~20]通過在多值決策圖的基礎(chǔ)上加入互斥傳播來獲取成對智能體的可達(dá)性信息,以此來檢測智能體之間的沖突。在此基礎(chǔ)上,文獻(xiàn)[21,22]提出沖突優(yōu)先級來提高智能體之間的沖突消解效率。

在MAPF中如果只是對沖突選擇和沖突消解進(jìn)行改進(jìn),而不是從根本上規(guī)避沖突的發(fā)生,會導(dǎo)致擴(kuò)展節(jié)點增多,求解空間激增,智能體尋路效率低下。楊鄒等人[23]引入跳點搜索結(jié)合沖突概率反饋,減少機(jī)器人之間的沖突,但狹窄環(huán)境下的沖突不能得到有效減少。而狹窄空間下的沖突不能得到有效解決,會增加智能體之間的局部沖突,甚至導(dǎo)致死鎖,使智能體尋路效率低,找不到目標(biāo)點。本文針對狹窄空間下多個智能體需要通過關(guān)鍵通道才能找到最優(yōu)路徑,導(dǎo)致智能之間發(fā)生局部沖突的概率增加這個問題,提出了基于視場的沖突搜索有效旁路規(guī)劃(effective bypassplanning for conflict search based on field ofview,EBPCS-FOV)算法。通過視場實現(xiàn)智能體之間的通信,為占據(jù)關(guān)鍵通道的智能體搜索有效旁路來確保其他智能體通過關(guān)鍵通道時沒有阻礙,保證其順利通過,進(jìn)而提高智能體尋路效率。

1 問題定義

1.1 多智能體路徑規(guī)劃

MAPF問題可以被定義為 n 個智能體在無向圖 ξG=(ξV,E) 中尋找一條無碰撞的路徑,其中 V 是頂點集合, E 是連接頂點之間邊的集合。每個智能體都有各自的起始位置和目標(biāo)位置。在每個時間步,智能體可以移動到?jīng)]有障礙物的位置或在原地等待,且其需要在不發(fā)生任何碰撞的基礎(chǔ)上從起始位置到達(dá)目標(biāo)位置。

1.2 狹窄環(huán)境定義

狹窄環(huán)境是路徑規(guī)劃領(lǐng)域常見的地形,當(dāng)多個智能體都需要通過狹窄的關(guān)鍵通道才能找到最優(yōu)路徑時,就會導(dǎo)致智能體之間發(fā)生局部沖突的概率大幅增加,降低智能體尋路效率。

圖1表示關(guān)鍵通道上的兩種沖突類型,虛線框部分表示關(guān)鍵通道。圖1(a)所示三個智能體都必須經(jīng)過此通道才是到達(dá)目標(biāo)點的最優(yōu)路徑;圖1(b)所示智能體1的目標(biāo)點占據(jù)了關(guān)鍵通道,阻礙其他智能體通往終點。這兩種情況都會導(dǎo)致局部沖突加劇,智能體尋路效率低下。

圖1關(guān)鍵通道沖突 Fig.1Critical channel conflicts

2基于視場的沖突搜索旁路規(guī)劃算法

多個智能體路徑規(guī)劃過程中,經(jīng)常需要通過狹窄環(huán)境下的關(guān)鍵通道,這會造成阻塞,導(dǎo)致智能體之間局部沖突加劇,算法搜索效率低。圖2是幾種典型的關(guān)鍵通道上的沖突,這幾類沖突若不能檢測并解決,可能會因為算法搜索時間過長導(dǎo)致尋路失敗。

當(dāng)兩個智能體同時間段經(jīng)過同一走廊,朝著相反方向前進(jìn)時就會發(fā)生走廊沖突;兩個智能體的起始點和目標(biāo)點互換,即同一時間段走相反的路徑,就會發(fā)生交換沖突;距離目標(biāo)較遠(yuǎn)的智能體需要經(jīng)過距離目標(biāo)較近智能體的目標(biāo)點才能到達(dá)自已的目標(biāo)點時,就會發(fā)生目標(biāo)沖突,其中,圖2(c)表示有旁路可選的情況,圖2(d)表示無旁路可選,只能找臨時停靠點的情況。

圖2典型沖突 Fig.2Typical conflicts

2.1基于沖突搜索算法框架

CBS是一種兩級路徑搜索算法,下層進(jìn)行路徑搜索,為智能體尋找最優(yōu)路徑。若多個智能體的最優(yōu)路徑互相沖突,則調(diào)用上層算法,構(gòu)建二叉約束樹(constrainttree,CT),通過添加約束條件解決沖突。

在CBS算法中, Nsol 中包含了所有智能體的路徑集合,Nconf 中包含了 Nsol 的全部沖突。元組 ai,aj,v,t 表示智能體ai 和 aj 在 Φt 時刻位于同一個頂點 處,如果智能體 ai 在 χt 時刻的約束條件是 ai,v,t ,代表其在 χt 時刻占據(jù)頂點 ,以此避免沖突。如圖3所示,智能體1、2的最短路徑在 t=1 時刻都占據(jù)b1頂點,因此通過添加約束對CT節(jié)點進(jìn)行擴(kuò)展,避免發(fā)生沖突。如圖4所示,分別為兩個智能體制定約束條件,實現(xiàn)兩個智能體最優(yōu)無沖突路徑的規(guī)劃。

圖3路徑?jīng)_突示例Fig.3Example of a path conflict

2.2關(guān)鍵通道沖突檢測策略

針對多智能體在狹窄環(huán)境關(guān)鍵通道上的沖突,CBS算法通過二叉樹分支進(jìn)行沖突檢測,當(dāng)二叉樹規(guī)模龐大時,智能體尋路效率低下。針對該問題,本文提出基于視場的多值決策沖突檢測策略。用多值決策圖(multi-valuedecisiondiagram,MDD)表示智能體所有可行的路徑集合,在MDD基礎(chǔ)上引人視場表示智能體通信范圍,實現(xiàn)智能體之間的通信,減少沖突的數(shù)量,避免二叉樹分支,可以有效提高算法的求解效率。

2.2.1路徑存儲策略

傳統(tǒng)CBS算法解決的沖突是從 Nconf 中隨機(jī)選的,不能識別出智能體之間的所有沖突,可能面臨兩個智能體之間有源源不斷沖突出現(xiàn)的問題,因此在CBS的基礎(chǔ)上引入MDD。

MDD是一個有向無環(huán)圖,圖中每一個節(jié)點代表智能體在柵格圖中可行的節(jié)點。柵格圖中每個智能體都有自己的MDD,一個智能體的MDD就代表該智能體在滿足約束條件下所有可能的路徑集合。

智能體可行節(jié)點的探索采用以智能體當(dāng)前位置為中心,上、下、左、右四個方向的四領(lǐng)域搜索策略。如圖5所示,以智能體1為中心,箭頭代表智能體1搜索可行節(jié)點的四個方向。圖6展示了智能體通往目標(biāo)點的所有可行節(jié)點,其中智能體1的目標(biāo)位置占據(jù)了關(guān)鍵通道,導(dǎo)致智能體2、3無法到達(dá)目標(biāo)點,所以圖中MDD1在到達(dá)目標(biāo)點之后依舊進(jìn)行了可行節(jié)點的探索,以確保智能體2、3可以到達(dá)目標(biāo)點。

圖5四領(lǐng)域搜索
圖6智能體的MDDFig.6MDD of the agent

算法1是以MDD形式存儲每個智能體路徑的偽代碼。

算法1 MDD存儲智能體路徑

a)創(chuàng)建根節(jié)點。首先,通過調(diào)用MDDNode類創(chuàng)建根節(jié)點。根節(jié)點-root包含了問題地圖、智能體的目標(biāo)和起始狀態(tài)信息。

b)初始化數(shù)據(jù)結(jié)構(gòu)。使用self.-nodes存儲所有節(jié)點,將根節(jié)點-root添加到-nodes中。同時,使用MDDQueue類管理待處理的節(jié)點,將根節(jié)點添加到frontier中。

c)循環(huán)擴(kuò)展節(jié)點。使用while循環(huán)處理frontier中的節(jié)點,直到frontier為空為止。

d)時間步排序。每次從frontier中取出一個節(jié)點cur-node,并根據(jù)時間步進(jìn)行排序,以時間步較小的節(jié)點優(yōu)先。

e)判斷時間步是否超過最大時間成本。如果當(dāng)前節(jié)點的時間步超過了預(yù)設(shè)的最大成本-cost,則返回true,表示構(gòu)建過程需要提前終止。

f)達(dá)到目標(biāo)時間步。如果當(dāng)前節(jié)點的時間步等于-costcur,則進(jìn)行目標(biāo)測試。如果當(dāng)前節(jié)點滿足目標(biāo)測試條件-node.goal,則將該節(jié)點標(biāo)記為-test,并調(diào)用-goal-nodebuild-children-descendant(cur-node)構(gòu)建其后代節(jié)點。

g)擴(kuò)展節(jié)點。對當(dāng)前節(jié)點cur-node進(jìn)行擴(kuò)展,生成其可能的后繼節(jié)點expanded-nodes。

h)處理擴(kuò)展節(jié)點。從上、下、左、右四個維度遍歷,除去障礙物,遍歷擴(kuò)展得到的每個節(jié)點node。

如果self.-nodes中已包含該節(jié)點node,則將當(dāng)前節(jié)點cur-node添加為其父節(jié)點;

否則,將該節(jié)點node添加到frontier中,并將其加入self.-nodes。

i)返回結(jié)果。如果成功找到滿足條件的路徑,則返回true;否則,

返回1。

其中,時間步表示智能體到達(dá)目標(biāo)點需要的時間長度;最大時間成本表示智能體到達(dá)目標(biāo)點需要的最大時間長度;MDDQueue類是以隊列的形式遍歷frontier中存儲的節(jié)點;目標(biāo)測試條件-node.goal是當(dāng)智能體到達(dá)目標(biāo)節(jié)點的時間步長與-costcur表示到達(dá)目標(biāo)點需要的時間步長相等時,說明智能體順利到達(dá)目標(biāo)點,即通過測試。擴(kuò)展節(jié)點是為了讓到達(dá)目標(biāo)點但擋在關(guān)鍵通道上的智能體尋找臨時??奎c時遍歷的。

2.2.2智能體通信策略

在狹窄環(huán)境中,不是所有的沖突都是點沖突,如圖6中的陰影部分,智能體1與2、3之間如果不能實現(xiàn)通信,就會增加智能體的尋路代價,甚至尋路失敗。對此,在MDD的基礎(chǔ)上引用視場來模擬智能體可以觀察到的環(huán)境范圍,智能體的視場大小決定了智能體的通信范圍和感知能力。

視場采用以智能體為中心的 5×5 正方形區(qū)域,在感知范圍內(nèi),掃描到有其他智能體存在,就遍歷感知范圍內(nèi)所有智能體的MDD,實現(xiàn)通信范圍內(nèi)智能體之間信息共享。圖7中各個顏色的框代表相同顏色智能體的通信范圍。在 t=0 時刻,智能體1、2在對方的通信范圍內(nèi),可以實現(xiàn)通信,但不能與智能體3實現(xiàn)通信,但當(dāng)智能體3與1、2都需要通過圖中用紅色方框表示的關(guān)鍵區(qū)域時(見電子版),可以確保它們之間實現(xiàn)通信。

圖7視場 Fig.7Fieldof view

2.3多值決策回溯沖突規(guī)避策略

為盡量減少狹窄環(huán)境下關(guān)鍵通道中智能體之間沖突數(shù)量,提出了多值決策回溯沖突規(guī)避策略。若智能體有其他可選路徑,則為其搜索一條不影響其他智能體最優(yōu)路徑的有效旁路,且該有效旁路為最優(yōu)或次優(yōu)路徑;若智能體無其他路徑可選,則為關(guān)鍵通道上的智能體選擇臨時??奎c,使所有智能體都能到達(dá)目標(biāo)點。

2.3.1次優(yōu)路徑的選取策略

狹窄環(huán)境下智能體在經(jīng)過關(guān)鍵通道時會發(fā)生沖突,為了規(guī)避此沖突,需要在不影響其他智能體最優(yōu)路徑的前提下,判斷發(fā)生沖突的智能體是否有其他最優(yōu)路徑可行,若沒有,要在保證避免沖突的前提下為智能體尋找一個次優(yōu)路徑。

通過遍歷發(fā)生沖突智能體的MDD節(jié)點,觀察是否有其他最優(yōu)路徑,若沒有,選擇一條次優(yōu)路徑。圖8所示為圖2(c)的MDD,從圖中深色區(qū)域可以看出智能體1、2的最優(yōu)路徑是重合的,且智能體1在到達(dá)目標(biāo)點d3之后停在了智能體2通往目標(biāo)點的關(guān)鍵通道上,遍歷兩個智能體的MDD,發(fā)現(xiàn)智能體1沒有其他最優(yōu)路徑,即為智能體2找到一條次優(yōu)路徑,兩個智能體都可以順利到達(dá)目標(biāo)點。

2.3.2臨時停靠點的選取策略

狹窄環(huán)境下,關(guān)鍵通道中發(fā)生沖突的智能體可能沒有其他次優(yōu)路徑,如果不能規(guī)避這種沖突,可能會導(dǎo)致死鎖,智能體最終因超時尋路失敗。因此,在不影響其他智能體最優(yōu)路徑的前提下,需要為擋在關(guān)鍵通道上的智能體搜索一個不影響其他智能體路徑的臨時??奎c,以保證所有智能體都能順利到達(dá)目標(biāo)點。

圖2(d)中兩個智能體的MDD如圖9所示。兩個智能體的最短路徑都要經(jīng)過b2-c2-d2這三個節(jié)點,智能體1到目標(biāo)點d2后擋住了智能體2前往目標(biāo)點e2的唯一通道,遍歷兩個智能體的MDD,如圖9(a)所示,兩個智能體都沒有到達(dá)目標(biāo)點的其他路徑,即需要遍歷智能體1的MDD節(jié)點,為智能體1找一個臨時停靠點進(jìn)行避讓,停靠時間由智能體2通過關(guān)鍵通道的時間決定。首先彈出節(jié)點a2,在時間段[0,1]上智能體1和2之間存在lt;1,2,[a2,b2],[0,1]gt;沖突,a2節(jié)點舍棄,繼而彈出c1節(jié)點,c1節(jié)點對智能體2的最優(yōu)路徑?jīng)]有影響,選定c2節(jié)點作為智能體1的臨時??奎c,重新為智能體1規(guī)劃路徑。如圖9(b)所示,智能體1在 t=2 時刻在臨時??奎cc1處進(jìn)行避讓,讓智能體2優(yōu)先通過節(jié)點c2,完成兩個智能體的路徑規(guī)劃。

2.3.3避免死鎖的等待策略

狹窄環(huán)境下,關(guān)鍵通道作為智能體到達(dá)目標(biāo)點的唯一通道,如果多個智能體同時通過且目標(biāo)點位于相反的位置,智能體之間容易產(chǎn)生死鎖。為了規(guī)避這種沖突,讓其中一個智能體執(zhí)行等待策略。在保證一個智能體按原先規(guī)劃好的最優(yōu)路徑行駛的前提下,其他智能體等待爭奪共享資源的時間步長,如果等待時間超過了這個時間閾值,就給全部智能體重新規(guī)劃路徑。

發(fā)生沖突的智能體在關(guān)鍵通道中無其他可選路徑和臨時??奎c可以躲避,如圖2(a)所示的沖突。通過掃描圖中智能體的MDD,如圖10所示,深色節(jié)點a1-b1-c1-d1是兩個智能體通往目標(biāo)的必經(jīng)之路,這段資源就是兩個智能體的共享資源。智能體在時間 t=1,2,3,4 這四個時間步進(jìn)行共享資源的爭奪,解決辦法就是讓智能體1在 t=0 時刻在a2處等待爭奪資源時間步長,即智能體1在等到 t=5 時刻才可以開始前往目標(biāo)點。

圖10智能體的MDDFig.10MDD of the agent

2.3.4實驗示例及有效旁路規(guī)劃算法

圖11是一個多智能體路徑規(guī)劃示例,在 5×5 的柵格圖中,深色區(qū)域為障礙物,標(biāo)有數(shù)字的圓圈代表智能體的起始位置,相同顏色的圓圈分別代表智能體的目標(biāo)位置。

t=0 時,智能體1、2、3分別位于起始位置d1、d0、a3,智能體2的目標(biāo)位置c3擋住了智能體1通往目標(biāo)位置d3的唯一通道,所以在 t=1 時,智能體2向右行駛了一格到了e0位置。t=3,t=4 時智能體1、2分別擋住了智能體3通往目標(biāo)點的唯一通路,所以在時間段[3,4],智能體3在臨時停靠點b1處等待, t=5 時,智能體1和2通過關(guān)鍵位置b0,完成所有智能體的路徑規(guī)劃。

圖11智能體路徑規(guī)劃示例Fig.11Example of agent path planning

為了對多值決策沖突規(guī)避策略中智能體如何尋找有效旁路有更直觀的了解,用算法2進(jìn)行補(bǔ)充說明。

算法2有效旁路規(guī)劃

a)get-paths中存儲了智能體的路徑集合,get-cost記錄智能體尋找到的最優(yōu)路徑代價,使用detect-collision判斷兩個智能體是否有共享資源的競爭;

如果成功找到路徑,返回true,否則,進(jìn)入下一步判斷。

b)掃描frontier,從智能體在經(jīng)過共享資源時間步之前的擴(kuò)展節(jié)點中搜索其他可選節(jié)點,判斷智能體是否有可替代的最優(yōu)路徑,即-cost相同的路徑;

如果成功找到路徑,返回true,

否則,判斷共享資源時間步之前的擴(kuò)展節(jié)點是否有后續(xù)節(jié)點,可以使智能體到達(dá)目標(biāo)點;

如果成功找到路徑,返回true,

否則,判斷共享資源時間步之前的擴(kuò)展節(jié)點是否有不影響另一個智能體前進(jìn)的節(jié)點,供智能體暫時躲避;

如果成功找到路徑,返回true,

否則,判斷共享資源時間步之間的擴(kuò)展節(jié)點是否有不影響另一個智能體前進(jìn)的節(jié)點,供智能體暫時躲避;

如果成功找到路徑,返回true,否則,智能體智能原地等待共享資源時間步長度的時間步長;

如果成功找到路徑,返回true,否則,為智能體重新規(guī)劃;

若找到,則跳轉(zhuǎn)至步驟c);否則,跳轉(zhuǎn)至步驟d)。

c)搜索結(jié)束,為智能體成功找到無沖突路徑。

d)搜索結(jié)束,尋路失敗。

其中,最優(yōu)路徑代價表示智能體到達(dá)目標(biāo)點的最優(yōu)路徑所經(jīng)過的柵格數(shù)量;當(dāng)兩個智能體在同一時間經(jīng)過同一路徑,這段路徑就稱為共享資源;共享資源時間步表示一個智能體經(jīng)過這段共享資源需要的時間步長;-cost表示智能體到達(dá)目標(biāo)點的最優(yōu)路徑所需要的路徑代價。

3實驗仿真與分析

為了驗證所提算法的有效性,實驗采用不同類型的地圖進(jìn)行性能測試。仿真實驗在 IntelB CoreTM i5-8300H CPU @ (202.30GHz,8GB 的PC機(jī)上以Python程序運行。選用的地圖為四連通的二維柵格地圖,其中柵格單元的大小剛好被單個智能體占用。假設(shè)智能體保持一個單位時間運行一個柵格勻速運動,規(guī)定運行時間為 10min ,超出運行時間為尋路失敗。

3.1固定任務(wù)的多個智能體路徑求解

第一部分實驗采用 10×10 的四聯(lián)通柵格地圖,如圖12所示,圓形代表智能體起始位置,方框代表智能體終點位置,共包含了10個智能體,陰影區(qū)域代表障礙物,空白區(qū)域代表智能體運行通道。從圖中可以看出,智能體2、5、7的目標(biāo)位置停留在關(guān)鍵通道上,智能體9、10必須要經(jīng)過唯一的關(guān)鍵通道才能到達(dá)目標(biāo)點。在這種情況下,隨著關(guān)鍵通道上智能體數(shù)量的增加,智能體之間的沖突會逐漸加劇。

在圖12所示的地圖上,將本文算法EBPCS-FOV與CBS、CBS-BP進(jìn)行了對比。當(dāng)沒有智能體2、5時,結(jié)果如表1所示,本文算法加入視場實現(xiàn)智能體7、8之間的通信,可以更快實現(xiàn)約束,找到最優(yōu)路徑。加入智能體2之后,智能體2的目標(biāo)位置占據(jù)了智能體1到達(dá)目標(biāo)點的關(guān)鍵通道,從表2看出,本文在通信的基礎(chǔ)上,為關(guān)鍵通道上的智能體找到臨時??奎c,減少了CT分支和運行時間。加入智能體5之后,智能體5的目標(biāo)點在智能體3、4通往目標(biāo)點的關(guān)鍵通道上,且智能體3、4需要交換順序才能到達(dá)各自的目標(biāo)點,加劇了智能體之間的沖突,運行結(jié)果如表3所示。本文通過引入臨時??奎c和等待策略實現(xiàn)了多智能體路徑規(guī)劃,CBS-BP與CBS均不能在規(guī)定時間內(nèi)完成所有智能體的路徑規(guī)劃。本文算法通過視場實現(xiàn)了智能體之間的通信,避免智能體探索無效路徑,減少了路徑代價;加入臨時??奎c和等待策略,減少了智能體之間沖突的發(fā)生,使CT數(shù)減少,縮短了運行時間。

表1占據(jù)1個關(guān)鍵通道的求解結(jié)果

Tab.1Solution results of occupying1 key channel
表3占據(jù)3個關(guān)鍵通道的求解結(jié)果
表2占據(jù)2個關(guān)鍵通道的求解結(jié)果Tab.3Solution results of occupying3 key channels

其中,運行時間表示智能體找到最優(yōu)路徑的時間;CT數(shù)表示智能體尋路時的二叉樹分支數(shù);路徑代價表示智能體從起始點到目標(biāo)點經(jīng)過的柵格數(shù)量。

3.2基準(zhǔn)環(huán)境下多個智能體路徑求解

為了驗證復(fù)雜環(huán)境下EBPCS-FOV的有效性,采用基準(zhǔn)地圖[24]進(jìn)行了進(jìn)一步實驗。如圖13所示,分別采用maze-128-128-10迷宮地圖和random-64-64-10隨機(jī)地圖,對不同數(shù)量的智能體,進(jìn)行25次不同起始點到目標(biāo)點的路徑搜索并取平均值,分別使用CBS-BP和EBPCS-FOV算法進(jìn)行測試。

在圖14(a)的實驗地圖中,共采用了6組實驗數(shù)據(jù),可以看出,智能體隨機(jī)分布在地圖各處。當(dāng)智能體數(shù)量較少時,智能體之間發(fā)生的沖突數(shù)量較少,智能體尋路運行時間和產(chǎn)生的CT分支數(shù)也都比較少,尋路成功率高。隨著智能體數(shù)量的增加,EBPCS-FOV通過視場實現(xiàn)智能體之間的通信,并加入有效旁路以及臨時??奎c策略為狹窄環(huán)境下關(guān)鍵通道中的智能體找到有效的旁路,有效減少了智能體之間沖突數(shù)量,避免CT分支,提高了智能體尋路的成功率。如圖15所示,random-64-64-10和maze-128-128-10地圖中平均成功率相較于CBS-BP分別提高了 10% 和 15.2% ,相較于CBS分別提高了 15.3% 和26.4% ,如圖16(a)17(a)所示,減少了CT分支數(shù)和運行時間。

圖13(b)所示的地圖中,共設(shè)置了5組實驗數(shù)據(jù),圖14(b)為智能體在地圖中運行的結(jié)果。從圖16(b)17(b)可以看出,智能體數(shù)量較少時,CBS-BP和EBPCS-FOV的運行時間和CT分支數(shù)沒有太大的區(qū)別,當(dāng)智能體數(shù)量超過20個時,EBPCS-FOV所提出的有效旁路以及避讓策略可以有效減少CT分支數(shù)和運行時間,智能體之間的沖突有效解決使得成功率也有所提升。

4結(jié)束語

在狹窄路段環(huán)境中,多個智能體無法規(guī)避關(guān)鍵通道上的沖突,導(dǎo)致智能體尋路效率低,提出了基于視場的沖突搜索有效旁路規(guī)劃算法。在MDD基礎(chǔ)上引入視場實現(xiàn)智能體之間的通信,通過MDD為阻礙關(guān)鍵通道的智能體找到次優(yōu)路徑或臨時等待位置作為有效的旁路進(jìn)行避讓,提高了狹窄環(huán)境下多個智能體在關(guān)鍵通道中的尋路效率,可用于多個智能體在復(fù)雜環(huán)境下運送貨物的場景。未來將考慮在實際應(yīng)用場景中進(jìn)行多智能體路徑規(guī)劃的研究。

參考文獻(xiàn):

[1]王子晗,童向榮.基于沖突搜索的多智能體路徑規(guī)劃研究進(jìn)展 [J].計算機(jī)科學(xué),2023,50(6):358-368.(Wang Zihan,Tong Xiangrong.Research progress of multi-agent path finding based on conflict-based search algorithms [J]. Computer Science,2023, 50(6):358-368.)

[2]Wen Licheng,Liu Yong,Li Hongliang. CL-MAPF:multi-agent path finding for car-like robots with kinematic and spatiotemporal constraints[J].Robotics and Autonomous Systems,2022,150: 103997.

[3]LamE,Le Bodic P,Harabor D,etal.Branch-and-cut-and-price for multi-agent path finding[J].Computers amp; Operations Research,2022,144:105809.

[4]Li Jiaoyang,TinkaA,Kiesel S,etal.Lifelong multi-agent path findinginlarge-scalewarehouses[C]//ProcofAAAIConferenceon Artificial Intelligence.2021:11272-11281.

[5]Hu Hongtao,Yang Xurui,Xiao Shichang,et al.Anti-conflict AGV path planning in automated container terminals based on multi-agent reinforcement learning[J].International Journal of Production Research,2023,61(1):65-80.

[6]Yin Hesheng,Pei Shuo,Xu Lei,et al.Review of research on multirobot visual simultaneous localization and mapping[J].Journal of Mechanical Engineering,2022,58(11):11-36.

[7]Jiao Lei,Peng Zhihong,Xi Lele,et al.Multi-agent coverage path planning via proximity interaction and cooperation [J]. IEEE Sensors Journal,2022,22(6):6196-6207.

[8]Zhang Han,Yao Mingze,Liu Ziang,et al.A hierarchical approach tomulti-agent path finding[C]//Proc of International Symposium on Combinatorial Search.2021:209-211.

[9]LeeH,MotesJ,Morales M,et al.Parallel hierarchical composition conflict-based search for optimal multi-agent pathfinding[J].IEEE Robotics and Automation Letters,2021,6(4):7001-7008.

[10]Chan SH,Li Jiaoyang,Gange G,et al.ECBS with flex distribution for bounded-suboptimal multi-agent path finding[C]//Proc of International Symposium on Combinatorial Search,2021:159-161.

[11]Rahman M,Alam M A,Islam M M,et al.An adaptive agent-specific sub-optimal bounding approach for multi-agent path finding [J]. IEEEAccess,2022,10:22226-22237.

[12]Li Jiaoyang,Ruml W,Koenig S.EECBS:a bounded-suboptimal search formulti-agentpath finding[C]//Procof AAAI Conference onArtificial Intelligence.2021:12353-12362.

[13]戴天倫,李博涵,臧亞磊,等.PORP:面向無人駕駛的路徑規(guī)劃 并行優(yōu)化策略[J].浙江大學(xué)學(xué)報:工學(xué)版,2022,56(2):329- 337.(Dai Tianlun,Li Bohan, Zang Yalei,etal.PORP:paralel optimization strategy of route planning for self-driving vehicles [J]. Joumal of Zhejiang University:Engineering Science,2022, 56(2):329-337.)

[14]溫惠英,元昱青,林譯峰.考慮道路負(fù)載均衡的碼頭多AGV無 沖突路徑規(guī)劃[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2023, 51(10): 1-10.(Wen Huiying,Yuan Yuqing,Lin Yifeng. Conflictfree path planning for multi-AGVs in automated terminals considering road load balancing[J].Journal of South China University of Technology:Natural Science Edition,2023,51(10):1-10.)

[15]宣志瑋,毛劍琳,張凱翔.CBS框架下面向復(fù)雜地圖的低拓展度 A* 算法[J].電子學(xué)報,2022,50(8):1943-1950.(Xuan Zhiwei,Mao Jianlin,Zhang Kaixiang.Low-expansion A* algorithm based on CBS framework for complex map[J].Acta Electronica Sinica,2022,50(8):1943-1950.)

[16]遲勝凱,謝永芳,陳曉方,等.基于障礙物代價勢場的移動機(jī)器 人避障算法[J].北京航空航天大學(xué)學(xué)報,2022,48(11):2289- 2303.(Chi Shengkai, Xie Yongfang, Chen Xiaofang,et al. Obstacle avoidance method of mobile robot based on obstacle cost potential field [J]. Journal of Beijing University of Aeronautics and Astronautics,2022,48(11): 2289-20303.)

[17]王卓然,文家燕,謝廣明,等.基于改進(jìn)CBS算法的多智能體路 徑規(guī)劃[J].智能系統(tǒng)學(xué)報,2023,18(6):1336-1343.(Wang Zhuoran,Wen Jiayan,Xie Guangming,et al.Multi-agent path planning based on improved CBS algorithm[J]. CAAl Trans on Inteligent Systems,2023,18(6):1336-1343.)

[18]岳榮康,丁行,江海,等.基于互斥鎖傳播的多智能體路徑規(guī)劃 算法[J].計算機(jī)工程,2023,49(12):103-110,120.(Yue Rongkang,Ding Hang,Jiang Hai,et al.Multi-agent pathfinding algorithm based on mutex propagation[J].Computer Engineering, 2023,49(12):103-110,120.)

[19]Li Jiaoyang,Harabor D, Stuckey PJ,et al.Pairwise symmetryreasoning for multi-agentpath findingsearch[J].Artificial Inteligence,2021,301:103574.

[20] Zhang Han,Li Jiaoyang,Surynek P,et al. Multi-agent path finding with mutex propagation[J].Artificial Intelligence,2022,311:103766.

[21]張洪琳,吳耀華,胡金昌,等.一種基于改進(jìn)沖突搜索的多機(jī)器 人路徑規(guī)劃算法[J].控制與決策,2023,38(5):1327-1335. (Zhang Honglin,Wu Yaohua,Hu Jinchang,et al.A multi-robot path finding algorithm based on improved conflict search[J].Control and Decision,2023,38(5):1327-1335.)

[22]閆星宇,王妮婭,毛劍琳,等.基于沖突優(yōu)先級變次優(yōu)因子的 EECBS 多機(jī)器人路徑規(guī)劃[J].系統(tǒng)仿真學(xué)報,2024,36(11): 2662-2673.(Yan Xingyu,Wang Niya,Mao Jianlin,et al. EECBS multi-robot path planning based on conflict priority changing suboptimal factor[J].Journal of System Simulation,2024,36(11): 2662-2673.)

[23]楊鄒,毛劍琳,李大焱,等.基于沖突概率反饋的CBS分層多機(jī) 器人路徑規(guī)劃[J/OL].計算機(jī)集成制造系統(tǒng).(2023-07-31). https://kns.cnki.net/kcms/detail/11.5946.TP.20230728.1657. 004.html.(Yang Zou,Mao Jianlin,Li Dayan,et al.CBS hierarchical multi-robot path planning based on conflict probability feedback [J/OL]. Computer Integrated Manufacturing Systems.(2023- 07-31).https://kns.cnki. net/kcms/detail/11.5946.TP. 20230728.1657.004.html.)

[24] Stern R,Sturtevant N,F(xiàn)elner A,et al.Multi-agent pathfinding:definitions,variants,and benchmarks [C]//Proc of International Symposium on Combinatorial Search. 2019: 151-158.

猜你喜歡
旁路關(guān)鍵沖突
消除閱讀沖突,提升學(xué)生的思維能力
罪惡感視域下農(nóng)村文化反哺的動力分析
理論觀察(2025年7期)2025-08-06 00:00:00
換流站“換芯”保障張北柔直工程可靠運行
如何實現(xiàn)柔直換流閥運行可靠性提升
開展夜間帶電作業(yè)守護(hù)萬家清
高考考好是關(guān)鍵
獲勝關(guān)鍵
NBA特刊(2014年7期)2014-04-29 00:44:03
生意無大小,關(guān)鍵是怎么做?
中國商人(2013年1期)2013-12-04 08:52:52
主站蜘蛛池模板: 91丝袜在线观看| 免费人成视频在线观看网站| 成人小视频网| 亚洲精品国产自在现线最新| 老司机久久99久久精品播放| 成人va亚洲va欧美天堂| 亚洲国产成人超福利久久精品| 欧美成人一区午夜福利在线| 啦啦啦网站在线观看a毛片| 伊人AV天堂| 日本黄色a视频| 国内精品久久久久鸭| 亚洲国产系列| 亚洲人成网站观看在线观看| 六月婷婷激情综合| 亚洲视频免| 国产在线日本| 日韩在线视频网站| 国产99视频精品免费视频7| 国产极品粉嫩小泬免费看| 国产精品无码在线看| 久青草国产高清在线视频| 高清国产va日韩亚洲免费午夜电影| 国产欧美视频综合二区| 亚洲国产一区在线观看| 伊人色综合久久天天| 91精品日韩人妻无码久久| 成人国产精品网站在线看| 亚洲国产理论片在线播放| 国产主播在线一区| 国产成人精品一区二区三区| 天天摸夜夜操| 女人av社区男人的天堂| 91福利在线看| 99热6这里只有精品| 青青草原国产一区二区| 亚洲AV一二三区无码AV蜜桃| 天天综合网色中文字幕| 99精品在线视频观看| 欧美日本二区| 成人欧美在线观看| 国产一区在线视频观看| 尤物精品视频一区二区三区| 色综合综合网| 伊人网址在线| 精品少妇人妻一区二区| 精品国产电影久久九九| 欧美在线导航| 在线观看欧美国产| 99中文字幕亚洲一区二区| h视频在线观看网站| 国产99免费视频| 国产女人18水真多毛片18精品| 亚洲精品国产乱码不卡| 欧美无专区| 91久久大香线蕉| 成人午夜视频网站| 亚洲成人精品在线| 亚洲性影院| 精品一区二区三区无码视频无码| 一级毛片在线播放免费观看| 黄色成年视频| 天堂中文在线资源| 日本91在线| 国产色婷婷视频在线观看| 日本一本正道综合久久dvd| 欧美在线伊人| 日本午夜视频在线观看| 亚洲无码37.| 91毛片网| 992tv国产人成在线观看| 国产精品亚洲欧美日韩久久| 久久久无码人妻精品无码| www.日韩三级| 日本成人精品视频| 色亚洲激情综合精品无码视频| 97青草最新免费精品视频| 久久久精品国产SM调教网站| 久久久成年黄色视频| 性视频一区| 亚洲第一色视频| 浮力影院国产第一页|