摘 要:鑒于傳統(tǒng)的智能優(yōu)化算法(intelligent optimization algorithm,IOA)不能很好解決插值平滑的機(jī)器人路徑規(guī)劃(robot path planning,RPP)問(wèn)題,以及最近提出的海洋捕食者算法(marine predators algorithm,MPA)的優(yōu)勢(shì)和不足,提出了一種改進(jìn)的MPA,即提升信息交流的MPA(interchange enhanced MPA,IEMPA),用于解決RPP。首先提出一種融合趨向全局最優(yōu)的反向?qū)W習(xí)策略用于隨機(jī)選擇一個(gè)捕食者的位置更新,以便降低陷于局部最優(yōu)的概率;然后提出了一種三階段最優(yōu)引導(dǎo)最差策略來(lái)強(qiáng)化最差個(gè)體以便提升整個(gè)群體和提高搜索能力;隨后,提出一種信息共享策略用于捕食前期以進(jìn)一步提高算法的搜索能力;最后將IEMPA用于插值平滑的RPP中。大量的多場(chǎng)景RPP問(wèn)題的優(yōu)化實(shí)驗(yàn)結(jié)果表明,與MPA等優(yōu)秀算法相比,IEMPA搜索能力更強(qiáng)、精度更高、收斂速度更快,能更好地處理RPP,可應(yīng)用到在其他復(fù)雜優(yōu)化問(wèn)題上。
關(guān)鍵詞:優(yōu)化方法; 智能優(yōu)化算法; 海洋捕食者算法; 插值; 機(jī)器人路徑規(guī)劃
中圖分類(lèi)號(hào):TP301.6
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2023)07-024-2082-08
doi:10.19734/j.issn.1001-3695.2022.10.0509
Robot path planning based on improved marine predators algorithm and interpolation smoothing
Zhang Bei1, Min Huasong1, Zhang Xinming2
(1.Institute of Robotics amp; Intelligent Systems, Wuhan University of Science amp; Technology, Wuhan 430081, China; 2.College of Computer amp; Information Engineering, Henan Normal University, Xinxiang Henan 453007, China)
Abstract:As the traditional IOAs couldn’t deal with interpolation smoothing RPP problems well and MPA proposed recently had advantages and disadvantages, this paper proposed an improved MPA, named IEMPA, to solve RPP. Firstly, this algorithm used a global best opposition learning strategy to update the position of a predator selected randomly, so as to reduce the probability of falling into local optima. Then it proposed a three-stage best guiding worst strategy to strengthen the worst individual in order to improve the whole group and the search ability. Then, it applied an information sharing strategy in an early preying phase to further improve the search ability. Finally, this paper integrated IEMPA and interpolation smoothing strategy into RPP. A large number of optimization experiments on classical functions and multi-scene RPP problems show that IEMPA has stronger search ability, higher accuracy and faster convergence than MPA and other excellent algorithms, and it can cope with RPP better and will be applied to other complex optimization problems.
Key words:optimization method; intelligent optimization algorithms; marine predators algorithm; interpolation; robot route planning
0 引言
隨著社會(huì)的發(fā)展,大量的移動(dòng)機(jī)器人被應(yīng)用,替代或協(xié)助人類(lèi)完成很多危險(xiǎn)或人類(lèi)難以完成的工作等。機(jī)器人路徑規(guī)劃是一種受多種因素影響而難以求解的問(wèn)題,故在特定的環(huán)境下找到更為高效和安全的方法具有較強(qiáng)的實(shí)際意義。
機(jī)器人路徑規(guī)劃(RPP)研究的主要目的是在環(huán)境地圖中搜索出一條從起點(diǎn)到終點(diǎn)距離最短的安全無(wú)碰撞路徑[1]。這里強(qiáng)調(diào)三個(gè)方面:安全性強(qiáng)、平滑度高和距離最短。傳統(tǒng)的路徑規(guī)劃算法有A*算法和人工勢(shì)場(chǎng)法等[1]。盡管這些算法被廣泛地用于解決RPP問(wèn)題,但它們?cè)跒镽PP提供有效解決方案的同時(shí)也存在著各自比較明顯的缺點(diǎn)。如A*算法在對(duì)較大場(chǎng)景進(jìn)行路徑規(guī)劃時(shí)存在多冗余點(diǎn)和拐點(diǎn)、計(jì)算量大和內(nèi)存消耗嚴(yán)重等問(wèn)題;人工勢(shì)場(chǎng)法缺乏全局信息,容易陷入局部最優(yōu),且在障礙物不規(guī)則的情況下計(jì)算量大,有時(shí)無(wú)法計(jì)算。為了克服以上方法的不足,國(guó)內(nèi)外許多學(xué)者對(duì)此進(jìn)行了全方位的研究,提出了不少的路徑規(guī)劃方法。其中智能優(yōu)化算法(IOA)由于其簡(jiǎn)單性、靈活性和無(wú)須太多優(yōu)化問(wèn)題的信息等優(yōu)點(diǎn)在諸多領(lǐng)域得到廣泛的應(yīng)用。因此,許多基于IOA的路徑規(guī)范方法被提出。目前基于IOA的路徑規(guī)劃方法,依據(jù)路徑規(guī)劃模型主要分為如下三類(lèi):
a)場(chǎng)景網(wǎng)格化路徑規(guī)劃[2,3]。這種方法首先將機(jī)器人環(huán)境網(wǎng)格化,如此構(gòu)建二維柵格的0-1矩陣,模擬表示實(shí)際機(jī)器人移動(dòng)環(huán)境,如圖1(a)所示。設(shè)定為1值的柵格為障礙物所占據(jù)的區(qū)域,0值的柵格為移動(dòng)機(jī)器人允許越過(guò)的區(qū)域,以左下角為原點(diǎn),然后建立路徑中尋優(yōu)約束條件和適應(yīng)度函數(shù);最后確定候選解為起點(diǎn)經(jīng)0值柵格到終點(diǎn)的一系列編號(hào),并將IOA運(yùn)用到路徑規(guī)劃中。在這種情況下,大多數(shù)要求IOA是離散算法。目前國(guó)內(nèi)外這類(lèi)方法的研究最為普遍,且以蟻群算法為主。故這類(lèi)方法是相對(duì)成熟的,且因在柵格化的過(guò)程中已經(jīng)對(duì)障礙物進(jìn)行了處理,在目標(biāo)函數(shù)中處理這種約束比較簡(jiǎn)單。這類(lèi)方法的缺點(diǎn)是對(duì)于連續(xù)域的IOA一般要進(jìn)行離散化處理,且還需要去重算子等,如此會(huì)破壞IOA的黑箱,使得IOA的易用性變差;另外,柵格大小難以確定,因?yàn)樗鼪Q定了平滑度和搜索精度。
b)坐標(biāo)系轉(zhuǎn)換路徑規(guī)劃[4,5]。這種方法首先進(jìn)行坐標(biāo)系轉(zhuǎn)換。將坐標(biāo)系O-XY中起點(diǎn)A與終點(diǎn)B的連線(xiàn)設(shè)為x軸,構(gòu)建坐標(biāo)系o-xy,然后將坐標(biāo)系O-XY中的點(diǎn)變換到o-xy中。用m條平行線(xiàn)簇將AB線(xiàn)段平均分為m+1段,如圖1(b)所示。在每條平行線(xiàn)上隨機(jī)產(chǎn)生一個(gè)點(diǎn),可以構(gòu)造一條完整的路徑,則一條路徑上的所有節(jié)點(diǎn)作為一個(gè)IOA的編碼。通過(guò)坐標(biāo)變換方程,可以將移動(dòng)RPP問(wèn)題轉(zhuǎn)換為對(duì)這一集合點(diǎn)的變量?jī)?yōu)化過(guò)程,如此可將優(yōu)化維度降低一半,但仍需要考慮路徑規(guī)劃中的三個(gè)主要方面,即路徑長(zhǎng)度、安全度和平滑度。此方法的優(yōu)點(diǎn)是優(yōu)化維度降低、優(yōu)化計(jì)算復(fù)雜度降低和能夠處理一些規(guī)則圓形障礙物和不規(guī)則障礙物的規(guī)劃問(wèn)題以及可以不改變IOA內(nèi)部結(jié)構(gòu);其缺點(diǎn)是需要坐標(biāo)系變換、平滑度單獨(dú)處理,若可控點(diǎn)m較多,則對(duì)IOA的要求更高。
c)控點(diǎn)間插值路徑規(guī)劃[6,7]。這種方法是采用插值方法在控制點(diǎn)之間插入多個(gè)點(diǎn),一方面減少優(yōu)化過(guò)程的維度,另一方面也通過(guò)插值方法獲得路徑平滑度。它將障礙物抽象成一個(gè)圓并采用約束方法來(lái)處理路徑安全度的問(wèn)題,這也許會(huì)造成不規(guī)則的障礙物占用大量空間的問(wèn)題,如圖1(c)所示。與方法a)相比,這種方法不會(huì)破壞IOA的黑箱,也就是說(shuō)一個(gè)IOA幾乎不加任何改動(dòng)就可以運(yùn)用到插值平滑的路徑規(guī)劃上,也無(wú)須對(duì)環(huán)境格式化和坐標(biāo)系轉(zhuǎn)換,如此簡(jiǎn)化了應(yīng)用操作。另外由于采用插值平滑方法,在實(shí)施IOA時(shí)可以不考慮平滑問(wèn)題,由插值方法間接實(shí)現(xiàn)。劉景森等人[6]提出了一種改進(jìn)蝙蝠算法和三次樣條插值的RPP方法;Ghafil等人[7]將動(dòng)態(tài)差分退火算法與Spline插值法結(jié)合用于RPP中。但這種路徑規(guī)劃問(wèn)題是一個(gè)非常復(fù)雜的優(yōu)化問(wèn)題,對(duì)IOA的搜索能力要求更高。
雖然三種方法各有優(yōu)勢(shì)和不足,其中第一種方法目前國(guó)內(nèi)外研究較多,而后兩種方法,尤其是基于IOA控點(diǎn)間插值的路徑規(guī)劃方法,國(guó)內(nèi)外研究報(bào)道較少,因此本文的研究具有較強(qiáng)的理論和實(shí)際意義。
海洋捕食者算法(MPA)是由Faramarzi等人[8]在2020年提出的一種新型IOA,受啟發(fā)于海洋捕食者的捕食行為。在MPA中,每個(gè)捕食者充當(dāng)搜索個(gè)體,而它的位置作為一個(gè)候選解,每個(gè)捕食者通過(guò)捕食算子和消除個(gè)體聚集算子來(lái)更新其位置,最終獲取獵物(最優(yōu)結(jié)果)。與現(xiàn)有的IOA相比,MPA[8]具有獨(dú)特的搜索機(jī)制,在解決許多經(jīng)典的優(yōu)化問(wèn)題上優(yōu)勢(shì)明顯;但在解決一些復(fù)雜優(yōu)化問(wèn)題上仍然存在搜索能力不足和搜索精度低等缺陷。另外,MPA提出的時(shí)間較短,有許多地方值得研究。針對(duì)MPA在解決RPP問(wèn)題時(shí)存在搜索能力不足和搜索精度低等問(wèn)題,提出了一種改進(jìn)的MPA,即提升信息交流的MPA(IEMPA)。
1 海洋捕食者算法
海洋捕食者算法主要模擬了海洋生物的捕食行為。在MPA中,捕食者與獵物是相對(duì)的,一類(lèi)捕食者可能是另一類(lèi)捕食者的獵物,所以MPA的種群個(gè)體都以獵物表示,當(dāng)一頭獵物捕獲到它的獵物時(shí),它就升為捕食者,其位置為當(dāng)前的最優(yōu)解。MPA主要由兩大算子組成,即捕食和消除個(gè)體聚集。其中,捕食算子分三個(gè)階段實(shí)行。具體描述如下:參數(shù)初始化和獵物種群隨機(jī)初始化。獵物數(shù)為N的群體,在一個(gè)D維空間中隨機(jī)初始化它們的位置如式(1)所示。在計(jì)算每個(gè)個(gè)體的適應(yīng)度值后,確定個(gè)體歷史最優(yōu)位置矩陣P并挑選出最優(yōu)個(gè)體,即捕食者,它的位置為E,保存E和P。
其中:Xi為第i個(gè)獵物的隨機(jī)初始化位置,i∈(1, N);LB和UB代表搜索空間的上界向量和下界向量;R為D維隨機(jī)向量,其每個(gè)分量值為均勻分布在[0,1]的隨機(jī)數(shù);代表向量中逐個(gè)分量相乘運(yùn)算。
1.1 捕食算子
在捕食過(guò)程中將整個(gè)搜索過(guò)程等分為三個(gè)階段,各占整個(gè)搜索階段的三分之一。
a)初期,探索階段。該階段假定獵物與捕食者之間的速度比很高,在速度上捕食者快于獵物。此階段發(fā)生在迭代總數(shù)的前三分之一處,此階段更新獵物的位置如式(2)所示。
其中:Pi為第i個(gè)獵物的歷史最優(yōu)位置;RB為布朗游走的D維隨機(jī)向量,其每個(gè)分量取正態(tài)分布的隨機(jī)數(shù);p為參數(shù),取值為0.5。
b)中期,探索與開(kāi)采轉(zhuǎn)換階段。該階段發(fā)生在整個(gè)迭代次數(shù)三分之一到三分之二之間,捕食者和獵物以幾乎相同的速度移動(dòng)。在該階段,獵物使用Lévy游走,捕食者使用布朗游走,前者有利于開(kāi)采,后者有利于探索。在此階段中,一半種群(i=1,2,…,N/2)使用式(3)進(jìn)行位置更新,另一半(i=N/2+1,N/2+2,…,N)使用式(4)進(jìn)行位置更新。
其中:RL為L(zhǎng)évy分布生成的D維隨機(jī)向量;cf為動(dòng)態(tài)調(diào)整參數(shù),其取值隨迭代次數(shù)動(dòng)態(tài)發(fā)生變化,如式(5)所示。
其中:T為最大迭代次數(shù);t為當(dāng)前迭代次數(shù)。
c)后期,開(kāi)采階段。發(fā)生在最后三分之一的迭代中,該階段獵物與捕食者之間的速度比很低,在速度上捕食者慢于獵物,捕食者使用Lévy游走,其數(shù)學(xué)模型為
1.2 消除個(gè)體聚集算子
在海洋中,魚(yú)類(lèi)經(jīng)常會(huì)在渦流或者魚(yú)類(lèi)聚集裝置(FAD)下產(chǎn)生集聚現(xiàn)象,該現(xiàn)象對(duì)應(yīng)著算法陷于局部最優(yōu)點(diǎn)的情況。為了考慮這類(lèi)環(huán)境因素的影響以避開(kāi)局部點(diǎn),MPA實(shí)施阻止這類(lèi)魚(yú)聚集現(xiàn)象發(fā)生的策略,其表達(dá)式如下:
其中:X為當(dāng)前種群每個(gè)個(gè)體更新后的位置矩陣;fFADs為對(duì)優(yōu)化過(guò)程產(chǎn)生影響的參數(shù),取值為0.2;U為包含0和1的矩陣;r為均勻分布在[0,1]的隨機(jī)數(shù);R為[0,1]隨機(jī)數(shù)矩陣;P1和P2代表兩個(gè)完全不同的歷史最優(yōu)位置集組成的矩陣;LB和UB代表搜索空間的上界矩陣和下界矩陣,分別由N個(gè)LB和UB重復(fù)構(gòu)成。所有矩陣大小相同為N×D。
在更新獵物的位置后,對(duì)每頭獵物的新位置進(jìn)行邊界控制并計(jì)算適宜度值(ffit),最后用貪心選擇更新個(gè)體歷史最優(yōu)位置矩陣P和精英個(gè)體位置E,貪心選擇如式(8)所示。
算法1 MPA偽代碼
設(shè)置參數(shù)fFADs和p等的值;
隨機(jī)初始化種群每個(gè)獵物的位置;
計(jì)算適應(yīng)度值,確定個(gè)體歷史最優(yōu)位置矩陣P和精英個(gè)體位置E;
for t=1 to T do
for i=1 to N do
執(zhí)行捕食算子更新獵物位置;
新位置邊界控制,計(jì)算適應(yīng)度值,采用貪心選擇更新P和E;
end for
執(zhí)行消除個(gè)體聚集算子更新獵物的位置;
for i=1 to N do
新位置邊界控制,計(jì)算適應(yīng)度值,采用貪心選擇更新P和E;
end for
end for
輸出最優(yōu)解E。
根據(jù)以上描述和算法1可知,MPA具有以下優(yōu)點(diǎn):
a)具有獨(dú)特的新解產(chǎn)生機(jī)制,例如在一個(gè)算法中采用了六種更新方程等,具有較好的種群多樣性。
b)具有一定的信息引導(dǎo),在式(2)~(4)(6)和(7)右邊都包含了個(gè)體歷史最優(yōu)位置,在一定程度上實(shí)現(xiàn)了最優(yōu)個(gè)體的信息引導(dǎo)獵物搜索。
c)有較強(qiáng)的局部搜索能力,在捕食算子中包含引導(dǎo)每頭獵物的最優(yōu)個(gè)體,最優(yōu)個(gè)體的引導(dǎo)使MPA在整個(gè)迭代過(guò)程中朝著好的方向發(fā)展。
d)具有較強(qiáng)的全局搜索能力,在演化早期階段,布朗游走向量的各分量值較大,這有助于擴(kuò)大搜索范圍;消除個(gè)體聚集算子避免算法陷于局部最優(yōu);MPA包含一些不同分布的隨機(jī)矩陣和隨機(jī)向量(R,RB,RL),進(jìn)一步增強(qiáng)了種群多樣性,有利于探索。
e)各個(gè)算子分工明確,MPA包括兩個(gè)算子,尤其是捕食算子明確劃分了不同階段使用不同的位置更新方式,充分發(fā)揮布朗游走和Lévy游走的優(yōu)勢(shì),使得探索與開(kāi)采動(dòng)態(tài)轉(zhuǎn)換,如此在解決一些復(fù)雜的優(yōu)化問(wèn)題上優(yōu)勢(shì)明顯。
MPA雖然有較多優(yōu)勢(shì),但在解決諸如RPP復(fù)雜的優(yōu)化問(wèn)題時(shí)仍然存在一些不足:a)MPA在捕食算子中,雖然實(shí)現(xiàn)了一定的信息利用,但這種信息使用也僅存在于當(dāng)前個(gè)體與最優(yōu)個(gè)體之間,只有最優(yōu)個(gè)體用于引導(dǎo)其他個(gè)體,而其他個(gè)體之間無(wú)交流,這使得信息共享程度低,導(dǎo)致MPA在解決一類(lèi)復(fù)雜優(yōu)化問(wèn)題時(shí)搜索能力不足;b)雖然MPA采用了兩個(gè)算子從總體上平衡探索與開(kāi)采,但對(duì)于一些優(yōu)化問(wèn)題來(lái)說(shuō),這種平衡會(huì)被破壞,導(dǎo)致搜索精度不高和收斂慢。
因此國(guó)外學(xué)者提出了一些MPA的改進(jìn)算法,并擴(kuò)展其應(yīng)用范圍。這些改進(jìn)主要包括三個(gè)方面:a)參數(shù)調(diào)整方案的修改,例如Houssein[9]提出了一種改進(jìn)的MPA(IMPA),將參數(shù)cf的指數(shù)動(dòng)態(tài)調(diào)整方案修改成正弦指數(shù)動(dòng)態(tài)調(diào)整方案以便更好地平衡探索與開(kāi)采;b)位置更新方程的修改,例如Sadiq等人[10]將原更新方程改變成含有一個(gè)非線(xiàn)性參數(shù)的更新方程,提出了一種非線(xiàn)性的MPA(nonlinear MPA,NMPA)有效解決電力分配問(wèn)題;c)與其他算法混合,例如Houssein等人[11]將灰狼優(yōu)化算法(grey wolf optimizer,GWO)和反向?qū)W習(xí)(opposition based learning,OBL)融合到MPA中,得到一種MPA混合算法(hybrid MPA with GWO and OBL,HMPAGO),提升了MPA的性能。雖然這些MPA的改進(jìn)算法在不同程度上改善了MPA的優(yōu)化性能或擴(kuò)展其應(yīng)用,然而它們?cè)诮鉀Q復(fù)雜優(yōu)化問(wèn)題時(shí)仍存在搜索能力不足等缺陷;此外,沒(méi)有關(guān)于MPA在移動(dòng)RPP復(fù)雜優(yōu)化問(wèn)題應(yīng)用方面的研究報(bào)道。綜上所述,對(duì)MPA的研究非常必要和有實(shí)際意義。
2 改進(jìn)的海洋捕食者算法
2.1 融合趨向全局最優(yōu)反向?qū)W習(xí)策略
反向?qū)W習(xí)策略已被廣泛應(yīng)用于IOA中[12],例如針對(duì)蝙蝠算法存在的早熟收斂等問(wèn)題,劉景森等人[6]提出一種反向?qū)W習(xí)、正切隨機(jī)探索和動(dòng)態(tài)擾動(dòng)的蝙蝠算法;Houssein等人[11]將反向?qū)W習(xí)和灰狼優(yōu)化算法融入到MPA中,得到一種混合算法以解決MPA存在的一些問(wèn)題。本文提出一種隨機(jī)個(gè)體全局最優(yōu)反向?qū)W習(xí)策略,如式(9)所示。
Xr=LB+(UB-E)(9)
其中:Xr表示隨機(jī)選擇一個(gè)獵物的新位置。
從式(9)可以看出,與文獻(xiàn)[6,11]采用的反向?qū)W習(xí)策略相比,本文提出的隨機(jī)個(gè)體反向?qū)W習(xí)策略有如下特點(diǎn):
a)作用的對(duì)象不一樣。前者作用群體中的所有個(gè)體,而后者僅作用在當(dāng)前群體中隨機(jī)選擇的一個(gè)個(gè)體,因此前者的計(jì)算復(fù)雜度O(N)要高于后者O(1)。
b)執(zhí)行反向?qū)W習(xí)的解不同。前者采用一般反向?qū)W習(xí),即當(dāng)前解的反向解作為當(dāng)前個(gè)體的新位置,而本文的反向?qū)W習(xí)將當(dāng)前全局最優(yōu)解的反向解作為隨機(jī)選擇個(gè)體的新位置。
c)執(zhí)行時(shí)間段不同,前者在整個(gè)迭代過(guò)程中都使用了反向?qū)W習(xí),而后者僅僅在迭代的前半階段使用,這既有利于搜索前期避免算法陷于局部最優(yōu),又不妨礙后期的收斂速度。
為了提高算法開(kāi)采能力,受文獻(xiàn)[13]的啟示,隨機(jī)選擇個(gè)體在迭代后期使用趨向最優(yōu)學(xué)習(xí)策略,如式(10)所示。
Xr,j(t+1)=Ek(t)(10)
其中:Xr,j代表隨機(jī)選擇的獵物位置第j維的值;Ek表示當(dāng)前全局最優(yōu)個(gè)體位置隨機(jī)選擇的第k維的值。
這種趨向最優(yōu)學(xué)習(xí)策略基于當(dāng)前種群的全局最優(yōu)個(gè)體的位置來(lái)更新隨機(jī)個(gè)體的位置,新位置趨向全局最優(yōu)點(diǎn),故此策略能夠加快收斂和提高搜索精度。與文獻(xiàn)[13]中的趨優(yōu)學(xué)習(xí)相比,趨向最優(yōu)學(xué)習(xí)策略有如下特點(diǎn):a)前者需要一個(gè)趨優(yōu)概率參數(shù)來(lái)決定是否執(zhí)行趨優(yōu)學(xué)習(xí),而后者無(wú)參數(shù),可操作性強(qiáng);b)前者作用于整個(gè)迭代過(guò)程,而后者僅僅作用于迭代的后半階段,充分發(fā)揮了它的局部搜索優(yōu)勢(shì);c)前者與Lévy配合使用,而后者與反向?qū)W習(xí)策略配合使用。將隨機(jī)反向?qū)W習(xí)融入到趨向最優(yōu)學(xué)習(xí)策略如算法2所示。
算法2 融合趨向全局最優(yōu)的反向?qū)W習(xí)策略
確定最差獵物;
在當(dāng)前種群中,除最差獵物外,隨機(jī)選擇一個(gè)獵物;
if tlt;T/2
采用式(9)更新隨機(jī)選擇獵物的位置;
else
for j=1 to D do
隨機(jī)選擇一個(gè)維度標(biāo)號(hào)k;
采用式(10)更新隨機(jī)選擇獵物的位置第j維值;
end for
end if
輸出更新后的隨機(jī)選擇獵物的位置。
從算法2可以看出,前期采用反向?qū)W習(xí),后期采用趨向全局最優(yōu)學(xué)習(xí)策略,有利于避免陷于局部最優(yōu)和提高收斂速度,也有利于平衡探索與開(kāi)采能力。
2.2 信息共享策略
在MPA的捕食算子中僅有最優(yōu)個(gè)體與當(dāng)前個(gè)體進(jìn)行信息交流產(chǎn)生新解,且在一些隨機(jī)因素的影響下共享信息,共享程度較低。因此,為了增強(qiáng)個(gè)體之間的信息共享程度,提高全局搜索能力,除了隨機(jī)個(gè)體和最差個(gè)體外,在整個(gè)搜索過(guò)程的前三分之一中,在其他個(gè)體的位置更新上采用一種信息共享策略,其數(shù)學(xué)模型如式(11)所示。
其中:Pm和Pn分別是從當(dāng)前種群中隨機(jī)選擇的兩個(gè)獵物的歷史最優(yōu)位置,且m≠n≠i;fr為正弦模型的縮放因子[14]。
從式(11)可以看出,種群中的一半個(gè)體采用隨機(jī)選擇的兩個(gè)歷史最優(yōu)位置進(jìn)行差分,這種隨機(jī)差分變異策略作用在群中許多個(gè)體上,能使種群內(nèi)個(gè)體之間達(dá)到信息共享。而另一半個(gè)體除了采用兩個(gè)隨機(jī)個(gè)體的歷史最優(yōu)位置差分,還增加了最優(yōu)個(gè)體與當(dāng)前個(gè)體歷史最優(yōu)位置之間的差分,既增加了全局最優(yōu)個(gè)體的引導(dǎo),又增加了解的多樣性。對(duì)比式(2),式(11)中的fr替換了參數(shù)p,以避免參數(shù)的調(diào)整;另外,fr采用正弦模型有利于搜索個(gè)體跳出局部最優(yōu)點(diǎn)及較好地平衡探索與開(kāi)采[14]。綜上所述,信息共享策略在前期主要用來(lái)增強(qiáng)種群的多樣性,以提高全局搜索能力。
2.3 三階段最優(yōu)引導(dǎo)最差策略
為了進(jìn)一步提高算法的整體性能,針對(duì)最差個(gè)體,提出了一種三階段最優(yōu)引導(dǎo)最差策略。如此有別于其他個(gè)體的更新方式,使最差個(gè)體的搜索能力大幅度提高。因?yàn)樽畈顐€(gè)體會(huì)對(duì)整個(gè)種群有影響,所以提升最差個(gè)體搜索能力也就提升了整個(gè)種群的搜索能力。其數(shù)學(xué)模型如下:
其中:Xw為最差個(gè)體更新后的位置;Pw為其歷史最優(yōu)位置。
從式(13)看出,在最差個(gè)體原有位置的基礎(chǔ)上,添加了最優(yōu)個(gè)體與最差個(gè)體的位置差分,可以保證最差個(gè)體在最優(yōu)個(gè)體的引導(dǎo)下向著最優(yōu)方向趨近,強(qiáng)化最差個(gè)體的搜索能力。同時(shí)在不同的階段下,其差分值受到(2R-1)、(0.5+0.5×rand)和fr縮放因子的擾動(dòng),如此縮放最差個(gè)體的搜索范圍,以強(qiáng)化最差個(gè)體的不同搜索能力。在初期,差分向量的每維都受到一個(gè)-1~1的隨機(jī)數(shù)擾動(dòng),在搜索空間中能夠搜索到不同的位置,強(qiáng)化全局搜索能力;在后期,采用規(guī)律的正弦模型的縮放因子,能夠提高最差個(gè)體的局部搜索能力。在中期差分向量的每一維都采用相同的0.5~1的隨機(jī)數(shù)縮放因子,如此有利于探索向著開(kāi)采過(guò)渡。因此,三階段最優(yōu)引導(dǎo)最差策略能夠有效地提升最差個(gè)體,減少其對(duì)整個(gè)種群的拖累作用。
2.4 IEMPA的總流程
IEMPA采用信息共享策略、融合趨向全局最優(yōu)的反向?qū)W習(xí)策略和三階段最優(yōu)者引導(dǎo)最差者策略強(qiáng)化種群信息利用,從而提高了MPA的搜索能力。其偽代碼如算法3所示。
算法3 IEMPA偽代碼
設(shè)置參數(shù)fFADs和p等的值;
隨機(jī)初始化種群每頭獵物的位置;
計(jì)算適應(yīng)度值,確定個(gè)體歷史最優(yōu)位置矩陣P和精英個(gè)體位置E;
for t=1 to T do
確定最差個(gè)體和隨機(jī)選擇個(gè)體;
for i=1 to N do
對(duì)于最差個(gè)體采用式(13)更新其位置;
對(duì)于隨機(jī)選擇的個(gè)體采用算法2更新其位置;
//對(duì)于其他個(gè)體
if t≤T/3
采用信息共享策略更新獵物的位置;
else if tgt;T/3且t≤2T/3
采用原算法中式(2)和(3)更新位置;
else
采用原算法中的式(4)更新位置;
end if
新位置邊界控制,計(jì)算適應(yīng)度值,采用貪心選擇更新P和E;
end for
執(zhí)行阻止魚(yú)聚集現(xiàn)象發(fā)生的算子更新獵物的位置;
for i=1 to N do
新位置邊界控制,計(jì)算適應(yīng)度值,采用貪心選擇更新P和E;
end for
end for
輸出最優(yōu)解E。
由算法4可知,IEMPA采用了三種新的位置更新方式替代原算法中某些位置更新方式。相比原來(lái)的位置更新方式,這三種新的更新方式簡(jiǎn)單、計(jì)算復(fù)雜度低。
3 IEMPA應(yīng)用到機(jī)器人路徑規(guī)劃上
正如前文所述,基于IOA的控點(diǎn)間插值路徑規(guī)劃方法有許多優(yōu)勢(shì),本文僅討論IEMPA的控點(diǎn)間插值路徑規(guī)劃。圖1(c)顯示此RPP方法的示意圖,圖中起點(diǎn)和終點(diǎn)分別用方形和星形表示,障礙物用圓表示。RPP要求確定一條連接起點(diǎn)(x0,y0)和終點(diǎn)(xn+1,yn+1)的路徑{(x0,y0),(x1,y1),(x2,y2),…,(xn,yn),(xn+1,yn+1)},使決策目標(biāo)最優(yōu)。其中,(x1,y1),(x2,y2),…,(xn,yn)為待優(yōu)化的控制點(diǎn)坐標(biāo)。控制點(diǎn)數(shù)n決定了RPP的維度。為了降維和使路徑更加平滑,引入插值方法,在本文采用樣條(spline)插值法。即在每次迭代中,在控制點(diǎn)兩兩間用spline插值法插入100個(gè)點(diǎn)。RPP的決策目標(biāo)是以帶約束的線(xiàn)路長(zhǎng)度作為目標(biāo)函數(shù),并引入懲罰函數(shù)法構(gòu)建規(guī)避障礙物約束,以便機(jī)器人避開(kāi)障礙物,這樣的數(shù)學(xué)模型為
其中:v(k)為避障約束函數(shù);r(k)為第k個(gè)障礙物的半徑;(ak,bk)為第k個(gè)障礙物的圓心坐標(biāo);m為障礙物個(gè)數(shù);ε為懲罰系數(shù),在本文設(shè)置為100。將一個(gè)IEMPA運(yùn)用到RPP中的主要步驟為:a)確定目標(biāo)函數(shù),以式(14)作為目標(biāo)函數(shù);b)確定優(yōu)化問(wèn)題的類(lèi)型,最小極值問(wèn)題,即求式(14)的最小值對(duì)應(yīng)的決策變量;c)確定決策變量及其維度,將起點(diǎn)到終點(diǎn)之間n個(gè)控制點(diǎn)的坐標(biāo),包括橫坐標(biāo)和縱坐標(biāo)作為決策變量,本文中n=3,則優(yōu)化問(wèn)題的維度為2n;d)確定每個(gè)決策變量的取值范圍,即邊界,這n個(gè)點(diǎn)坐標(biāo)對(duì)應(yīng)的上限和下限;e)輸入以上參數(shù)到IEMPA中;f)運(yùn)行IEMPA;g)輸出最小值所對(duì)應(yīng)的坐標(biāo)。
4 實(shí)驗(yàn)結(jié)果與分析
4.1 實(shí)驗(yàn)環(huán)境與評(píng)價(jià)標(biāo)準(zhǔn)
為了驗(yàn)證IEMPA的性能,將IEMPA用于經(jīng)典函數(shù)和多個(gè)場(chǎng)景移動(dòng)機(jī)器人路徑規(guī)劃的大量?jī)?yōu)化實(shí)驗(yàn)。為了能說(shuō)明問(wèn)題,本文從大量的經(jīng)典函數(shù)[15]中挑選出八個(gè)難以?xún)?yōu)化的函數(shù)作為示例加以討論,包括單峰函數(shù)(f1~f3:Schwefel 2.21、Schwefel 2.22和Zakharov)和多峰函數(shù)(f4~f8:Generalized Schaffer、Lévy、Schwefel2.26、Cosinemixture和Himmelblau)兩類(lèi)。為了能夠凸顯IEMPA處理路徑規(guī)劃問(wèn)題的能力,以12個(gè)不同場(chǎng)景的路徑規(guī)劃為示例進(jìn)行分析,如圖2所示,因?yàn)?個(gè)或者2個(gè)場(chǎng)景下的實(shí)驗(yàn)結(jié)果并不能說(shuō)明一個(gè)IOA的優(yōu)勢(shì)所在。圖3給出了4個(gè)場(chǎng)景下的目標(biāo)函數(shù)值在二維情況下(即一個(gè)控制點(diǎn))的分布情況。從圖2可以看出,場(chǎng)景1只有1個(gè)障礙物,比較簡(jiǎn)單。雖然如此,但從圖3(a)可以看出,場(chǎng)景1的優(yōu)化問(wèn)題是一個(gè)多峰、非線(xiàn)性和復(fù)雜的優(yōu)化問(wèn)題,優(yōu)化難度較高;隨著障礙物的增加,對(duì)應(yīng)問(wèn)題的優(yōu)化難度增加,如圖3(d)所示,它對(duì)應(yīng)含有4個(gè)障礙物的場(chǎng)景6目標(biāo)函數(shù)分布情況。場(chǎng)景12含有12個(gè)障礙物如圖2(l)所示,場(chǎng)景非常復(fù)雜,對(duì)應(yīng)更復(fù)雜的優(yōu)化問(wèn)題。所以對(duì)于移動(dòng)RPP問(wèn)題,尋找一個(gè)搜索能力更強(qiáng)的IOA是非常重要和必需的。
本文的實(shí)驗(yàn)環(huán)境采用主頻3.4 GHz的Intel?CoreTM i7-3770 CPU和8 GB內(nèi)存的PC機(jī),操作系統(tǒng)采用64位的Windows 10。用于統(tǒng)計(jì)分析的軟件是IBM SPSS Statistics 24,編程語(yǔ)言采用MATLAB2014A。由于IOA每次運(yùn)行結(jié)果不一樣,本文采用均值(mean)、方差(std)、排名(rank)、平均排名和總排名等標(biāo)準(zhǔn)來(lái)評(píng)價(jià)一個(gè)IOA的優(yōu)化性能好壞[16]。
4.2 對(duì)比算法簡(jiǎn)介
為了全面評(píng)價(jià)IEMPA的表現(xiàn),包括優(yōu)化性能、運(yùn)行時(shí)間和收斂性能等,選擇了最先進(jìn)的算法作為其對(duì)比算法,簡(jiǎn)單的描述如表1所示。它們包括MPA[8]及其改進(jìn)算法IMPA[9]、NMPA[10]和HMPAGO[11],也包括其他最新的優(yōu)秀算法PTRBA[6]、MESSA(multi-strategy ensemble salp swarm algorithm) [5]、ILFPSO(improved Lévy flight particle swarm optimization)[13]和HGWOA (hybrid grew wolf optimization with artificial bee colony algorithm)[17]。ILFPSO是PSO的變體,而PSO是經(jīng)典IOA的代表,是最為流行算法之一。HGWOA和HMPAGO都是混合算法,前者是人工蜂群(ABC)算法與GWO的混合算法,后者是MPA與GWO的混合算法,且它與IEMPA都采用了反向?qū)W習(xí)策略;PTRBA和MESSA是擅長(zhǎng)于處理RPP問(wèn)題的優(yōu)秀算法。在這些對(duì)比算法中既有同類(lèi)算法的代表,也有與本文采用部分類(lèi)似策略的算法代表,還有混合算法和最新算法的代表。這些對(duì)比算法具有極強(qiáng)的代表性和可比性。
為了公平比較,所有算法的公共參數(shù)設(shè)置相同:獨(dú)立運(yùn)行次數(shù)為30,最大函數(shù)評(píng)價(jià)次數(shù)(Mnef)在經(jīng)典函數(shù)上為50 000,根據(jù)文獻(xiàn)[7]的公共參數(shù)最佳設(shè)置建議,在路徑規(guī)劃問(wèn)題上為20 000。算法的不同參數(shù)設(shè)置將導(dǎo)致不同的實(shí)驗(yàn)結(jié)果,因此對(duì)比算法的其他參數(shù)設(shè)置是根據(jù)相應(yīng)參考文獻(xiàn)中的最佳推薦進(jìn)行設(shè)置的。在所有數(shù)據(jù)表中,最優(yōu)者以粗體顯示。
4.3 與其不完全算法對(duì)比分析
為了驗(yàn)證每個(gè)改進(jìn)算法對(duì)IEMPA性能的貢獻(xiàn),將IEMPA與其不完全算法在30維經(jīng)典函數(shù)和路徑規(guī)劃上進(jìn)行實(shí)驗(yàn)。不完全算法的描述如下:IEMPAwi為無(wú)信息共享策略的IEMPA,IEMPAww為無(wú)三段最優(yōu)引導(dǎo)最差策略的IEMPA,IEMPAwo為無(wú)趨向全局最優(yōu)反向?qū)W習(xí)策略的IEMPA。為了簡(jiǎn)潔說(shuō)明問(wèn)題,挑選了四個(gè)優(yōu)化問(wèn)題作為示例討論,它們是f5、f8、p10和p11。表2給出了IEMPA與其不完全算法的實(shí)驗(yàn)結(jié)果。
由表2可知,IEMPA優(yōu)于所有四個(gè)對(duì)比算法,IEMPA、IEMPAwi、IEMPAww、IEMPAwo和MPA的平均排名值分別是1、2.75、3、3和5,MPA排名最后,其性能最差,說(shuō)明本文對(duì)MPA的所有改進(jìn)是有效的。IEMPA排名第一,在五個(gè)算法中獲得了最好的優(yōu)化性能,表明本文每處改進(jìn)缺一不可。在兩個(gè)經(jīng)典函數(shù)上,在三個(gè)不完全算法中,IEMPAwi排名靠前,IEMPAwo排名最后,說(shuō)明信息共享策略對(duì)IEMPA的貢獻(xiàn)最小,而融合趨向全局最優(yōu)反向?qū)W習(xí)策略貢獻(xiàn)最大。在兩個(gè)路徑規(guī)劃問(wèn)題上剛好相反,信息共享策略對(duì)IEMPA的貢獻(xiàn)最大,而融合趨向全局最優(yōu)反向?qū)W習(xí)策略貢獻(xiàn)最小,說(shuō)明不同的策略在不同的優(yōu)化問(wèn)題上發(fā)揮的作用不同,嵌入多個(gè)不同問(wèn)題有效的策略可以提高改進(jìn)算法的普適性,即能夠有效解決更多不同類(lèi)型的優(yōu)化問(wèn)題。
4.4 與最先進(jìn)算法的優(yōu)化性能對(duì)比分析
為了驗(yàn)證IEMPA的有效性,將其在經(jīng)典的30維函數(shù)上進(jìn)行實(shí)驗(yàn),并與最先進(jìn)算法對(duì)比。表3列出了IEMPA與這些對(duì)比算法的實(shí)驗(yàn)結(jié)果。為了證明IEMPA在路徑規(guī)劃中的性能,將其應(yīng)用到12個(gè)路徑規(guī)劃問(wèn)題中。IEMPA獲得的最優(yōu)路徑如圖2(a)~(l)所示,九種算法獲得的均值和方差如表4所示。
由表3可知,在八個(gè)經(jīng)典函數(shù)上,IEMPA的平均排名值為1.00,總排名第一,而MPA、IMPA、NMPA和HMPAGO的平均排名值分別為5.50、5.13、3.75和6.13,其總體排名分別為7、5、2和8。這表明除HMPAGO外,IMPA和NMPA提升了MPA的性能,而IEMPA提升MPA的性能幅度更大,它提升了MPA的搜索精度,在所有八個(gè)函數(shù)上幾乎都獲得了理想的目標(biāo)函數(shù)值。另外,HMPAGO雖然是MPA與GWO的混合算法,從理論上其性能應(yīng)該比單一算法的性能好,但實(shí)際結(jié)果并沒(méi)有證明這一點(diǎn),說(shuō)明這種混合在經(jīng)典函數(shù)上是不成功的。在三個(gè)單峰函數(shù)上,IEMPA都排名第一,說(shuō)明IEMPA具有更強(qiáng)的局部搜索能力。這得益于MPA自身開(kāi)采能力強(qiáng)、趨向全局最優(yōu)學(xué)習(xí)策略和三階段最優(yōu)引導(dǎo)最差策略等。在多峰函數(shù)上,IEMPA的均值和方差在所有五個(gè)函數(shù)上均優(yōu)于其對(duì)比算法的均值和方差,顯然,信息共享策略使得IEMPA具有更強(qiáng)全局搜索能力。總體排名順序是IEMPA、 NMPA、HGWOA、MESSA、IMPA、ILFPSO、MPA、HMPAGO和PTRBA。顯然,與最先進(jìn)的算法相比,IEMPA獲得了最好的優(yōu)化性能,再次說(shuō)明本文的三種改進(jìn)和融合是有效的,與MPA改進(jìn)算法相比,IEMPA獲得了更強(qiáng)的搜索能力。
雖然路徑規(guī)劃問(wèn)題是復(fù)雜的優(yōu)化問(wèn)題,但從表4可以看出,在所有12個(gè)路徑規(guī)劃問(wèn)題上,IEMPA都排名第一,以絕對(duì)的優(yōu)勢(shì)壓倒其他八個(gè)對(duì)比算法,而MPA的平均排名值為4.00,總排名第3,再次證明IEMPA提升了MPA的搜索能力,所提出的改進(jìn)策略和融合到MPA的方法是有效的。在性能上,MPA及其改進(jìn)算法(IEMPA、IMPA、NMPA和HMPAGO)優(yōu)于其他算法(PTRBA、HGWOA、ILFPSO和MESSA),說(shuō)明MPA及其改進(jìn)算法在處理RPP問(wèn)題上更有優(yōu)勢(shì)。
總之,IEMPA不管在經(jīng)典函數(shù)上還是在RPP上都優(yōu)于對(duì)比算法,表明IEMPA具有更強(qiáng)的競(jìng)爭(zhēng)性和普適性。
4.5 運(yùn)行時(shí)間對(duì)比分析
為了討論IEMPA的運(yùn)行時(shí)間,直接采用4.4節(jié)的實(shí)驗(yàn)。本節(jié)僅記錄IEMPA及其對(duì)比算法在八個(gè)30維經(jīng)典函數(shù)上的運(yùn)行時(shí)間,它們?cè)讵?dú)立運(yùn)行30次獲得的平均運(yùn)行時(shí)間如圖4所示,時(shí)間單位為s。從圖4可以看出,IEMPA的耗時(shí)比MPA、IMPA、NMPA和HMPAGO的耗時(shí)少,且在九個(gè)算法中的耗時(shí)也是最少的。按耗時(shí)的升序排名,IEMPA排名第一,隨后是ILFPSO,耗時(shí)最多的是PTRBA。IEMPA的耗時(shí)(0.41 s)分別是ILFPSO(0.51 s)、MESSA(0.52 s)、HGWOA(0.58 s)、IMPA(0.95s)、MPA(0.96 s)、HMPAGO(0.98 s)、NMPA(0.99 s)和PTRBA(1.43 s)耗時(shí)的80.39%、78.85%、70.69%、43.16%、42.71%、41.84%、41.41%和20.27%。限于篇幅,本節(jié)僅討論與MPA相比IEMPA耗時(shí)少的原因。主要原因是:a)本文提出的改進(jìn)策略都是替代策略,不是添加策略,即用本文提出的更新策略替換原來(lái)的更新策略,沒(méi)有增加額外的計(jì)算;b)雖然引入了三種新的位置更新方式,但任何更新方程都比MPA的更新方程簡(jiǎn)單;c)在本文所提算法中,將Lévy中西伽馬值的計(jì)算放到迭代之前,也降低了計(jì)算復(fù)雜度。
4.6 收斂性對(duì)比分析
為了驗(yàn)證IEMPA的收斂性能,將其在路徑規(guī)劃上進(jìn)行收斂性能實(shí)驗(yàn)。為了更加簡(jiǎn)潔地說(shuō)明問(wèn)題,選擇了四個(gè)具有代表性的優(yōu)化問(wèn)題進(jìn)行示例分析,它們是p6、p7、p8和p11。圖5展示了IEMPA和表1中對(duì)比算法的收斂曲線(xiàn)。其中,橫軸表示目標(biāo)函數(shù)評(píng)價(jià)次數(shù),縱軸表示算法獲得的實(shí)際最優(yōu)值與九個(gè)算法獲得最優(yōu)值之間誤差的平均值。從圖5可以看出,在p6、p7和p11上, IEMPA的收斂速度最快,具有明顯的優(yōu)勢(shì)。雖然在p8上的收斂速度稍慢,但I(xiàn)EMPA均快于對(duì)比算法,并且IEMPA在四個(gè)規(guī)劃問(wèn)題上的收斂速度均明顯快于MPA的收斂速度。與MPA相比,不管是在四個(gè)障礙物或者五個(gè)障礙物還是七個(gè)障礙物的場(chǎng)景下,IEMPA均獲得了更優(yōu)秀的收斂性能。再次證明本文的改進(jìn)策略是有效可行的,加快了MPA的收斂速度,增強(qiáng)了MPA的搜索能力,也較好地平衡了探索和開(kāi)采。
4.7 Wilcoxon符號(hào)秩檢驗(yàn)
為了驗(yàn)證IEMPA與對(duì)比算法在性能上的顯著性差異,本節(jié)對(duì)IEMPA與對(duì)比算法的實(shí)驗(yàn)結(jié)果進(jìn)行差異性統(tǒng)計(jì)分析。Wilcoxon符號(hào)秩檢驗(yàn)是一種非參數(shù)統(tǒng)計(jì)檢驗(yàn)[14],旨在檢驗(yàn)兩組樣本之間的顯著差異,用于反映兩種算法性能之間差異的顯著性。本節(jié)采用此方法檢驗(yàn)IEMPA對(duì)比算法之間的顯著性。當(dāng)IEMPA的性能優(yōu)于對(duì)比算法時(shí),其秩為正;性能劣于對(duì)比算法時(shí),其秩為負(fù);性能與對(duì)比算法持平時(shí),對(duì)應(yīng)的秩平分。表5列出了IEMPA與對(duì)比算法在8個(gè)經(jīng)典函數(shù)和12個(gè)路徑規(guī)劃問(wèn)題上的Wilcoxon符號(hào)秩檢驗(yàn)結(jié)果,顯著性水平值設(shè)置為0.05。其中,p為實(shí)際顯著性水平值,R+和R-分別表示正秩和負(fù)秩?!皀/w/t/l”分別表示在n個(gè)函數(shù)上IEMPA優(yōu)于對(duì)比算法w次,等于對(duì)比算法t次,劣于對(duì)比算法l次。如果p值小于0.05,則表明IEMPA與對(duì)比算法性能之間有顯著性差異;相反,IEMPA與對(duì)比算法性能無(wú)差異。從表5可以看出,在20個(gè)問(wèn)題上,IEMPA優(yōu)于NMPA、HGWOA、MESSA、IMPA、ILFPSO、MPA、HMPAGO和PTRBA的個(gè)數(shù)分別為16、19、18、20、20、20、20和20,并且IEMPA與所有對(duì)比算法相比p值均小于0.05,表明IEMPA顯著優(yōu)于八個(gè)對(duì)比算法中的任何一種。
5 結(jié)束語(yǔ)
針對(duì)MPA在解決RPP時(shí)存在搜索能力不足、收斂速度慢和搜索精度低的問(wèn)題,提出了一種改進(jìn)的MPA,即提升信息交流的MPA(IEMPA)。a)提出一種融合趨向最優(yōu)的反向?qū)W習(xí)策略用于隨機(jī)個(gè)體的位置更新,以避免算法陷于局部最優(yōu)和提高算法收斂速度及搜索精度;b)提出了一種三階段最優(yōu)引導(dǎo)最差策略用于最差個(gè)體的位置更新,利用最優(yōu)個(gè)體引導(dǎo)最差個(gè)體搜索,強(qiáng)化最差個(gè)體的搜索能力提升整個(gè)群體;c)提出一種信息共享策略用于捕食算子的前期搜索,通過(guò)個(gè)體之間的信息共享達(dá)到在保證MPA良好開(kāi)采能力的同時(shí)增強(qiáng)其全局搜索能力的目的。在8個(gè)30維經(jīng)典函數(shù)和12個(gè)RPP問(wèn)題上的實(shí)驗(yàn)結(jié)果表明,與MPA等先進(jìn)的優(yōu)化算法相比,IEMPA具有更好的優(yōu)化性能,證明本文的改進(jìn)是有效的。但是,IEMPA還存在一些不足,盡管IEMPA無(wú)論在8個(gè)經(jīng)典函數(shù)上還是在12個(gè)路徑規(guī)劃問(wèn)題上都優(yōu)于對(duì)比算法,但還有很多地方需要進(jìn)一步探討。例如在路徑規(guī)劃中,本文選擇樣條插值方法,那么其他插值方法效果如何?還有插值參數(shù),插值點(diǎn)選擇100,則其他取值還需要討論和分析,等等。另外,因MPA是最近提出的算法,許多方面還需要進(jìn)一步研究和完善。
參考文獻(xiàn):
[1]王梓強(qiáng),胡曉光,李曉筱,等.移動(dòng)機(jī)器人全局路徑規(guī)劃算法綜述[J].計(jì)算機(jī)科學(xué),2021,48(10):19-29.(Wang Ziqiang, Hu Xiaoguang, Li Xiaoxiao, et al. Overview of global path planning algorithms for mobile robots[J].Computer Science,2021,48(10):19-29.)
[2]Miao Changwei, Chen Guangzhu, Yan Chengliang, et al. Path planning optimization of indoor mobile robot based on adaptive ant colony algorithm[J].Computers amp; Industrial Engineering,2021,156(6):107230.
[3]劉志強(qiáng),何麗,袁亮,等.采用改進(jìn)灰狼算法的移動(dòng)機(jī)器人路徑規(guī)劃[J].西安交通大學(xué)學(xué)報(bào),2022,56(10):49-60.(Liu Zhiqiang, He Li, Yuan Liang, et al. Path planning of mobile robot based on TGWO algorithm[J].Journal of Xi’an Jiaotong University,2022,56(10):49-60.)
[4]Xu Feiyi, Li Haolun, Pun Chiman, et al. A new global best guided artificial bee colony algorithm with application in robot path planning[J].Applied Soft Computing,2020,88(3):106037.
[5]王秋萍,王彥軍,戴芳.多策略集成的樽海鞘群算法的機(jī)器人路徑規(guī)劃[J].電子學(xué)報(bào),2020,48(11):2101-2113.(Wang Qiuping, Wang Yanjun, Dai Fang. Multi-strategy ensemble salp swarm algorithm for robot path planning[J].Acta Electronica Sinica,2020,48(11):2101-2113.)
[6]劉景森,吉宏遠(yuǎn),李煜.基于改進(jìn)蝙蝠算法和三次樣條插值的機(jī)器人路徑規(guī)劃[J].自動(dòng)化學(xué)報(bào),2021,47(7):1710-1719.(Liu Jingsen, Ji Hongyuan, Li Yu. Robot path planning based on improved bat algorithm and cubic spline interpolation[J].Acta Automatica Sinica,2021,47(7):1710-1719.)
[7]Ghafil H N, Jarmai K. Dynamic differential annealed optimization: new metaheuristic optimization algorithm for engineer applications[J].Applied Soft Computing,2020,93(8):106392.
[8]Faramarzi A, Heidarinejad M, Mirjalili S, et al. Marine predators algorithm: a nature-inspired metaheuristic[J].Expert Systems with Applications,2020,152(8):113377.
[9]Houssein E H, Hassaballah M, Ibrahim I E, et al. An automatic arrhythmia classification model based on improved marine predators algorithm and convolutions neural networks[J].Expert Systems with Applications,2022,187(1):115936.
[10]Sadiq A S, Dehkordi A A, Mirjalili S, et al. Nonlinear marine predator algorithm: a cost-effective optimizer for fair power allocation in NOMA-VLC-B5G networks[J].Expert Systems with Applications,2022,203(10):117395.
[11]Houssein E H, Mahdy M A, Fathy A, et al. A modified Marine predator algorithm based on opposition based learning for tracking the global MPP of shaded PV system[J].Expert Systems with Applications,2021,183(11):115253.
[12]張貝,閔華松,張新明.強(qiáng)化信息交流的堆優(yōu)化算法及其機(jī)器人路徑規(guī)劃[J].計(jì)算機(jī)應(yīng)用研究,2022,39(10):2935-2942.(Zhang Bei, Min Huasong, Zhang Xinming. Information interchange strengthened heap-based optimizer and its application to robot path planning[J].Application Research of Computers,2022,39(10):2935-2942.)
[13]張新明,王霞,涂強(qiáng),等.趨優(yōu)算子和Levy Flight混合的粒子群優(yōu)化算法[J].電子科技大學(xué)學(xué)報(bào),2018,47(3):421-429.(Zhang Xinming, Wang Xia, Tu Qiang, et al. Particle swarm optimization algorithm based on combining global-best operator and Levy Flight[J].Journal of University of Electronic Science and Technology of China,2018,47(3):421-429.)
[14]張新明,溫少晨,劉尚旺.差分?jǐn)_動(dòng)的堆優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用,2022,42(8):2519-2527.(Zhang Xinming, Wen Shaochen, Liu Shangwang. Differential disturbance heap-based optimizer[J].Journal of Computer Applications,2022,42(8):2519-2527.)
[15]Sun Yongjun, Wang Xilu, Chen Yahuan, et al. A modified whale optimization algorithm for large-scale global optimization problems[J].Expert Systems with Applications,2018,114(12):563-577.
[16]張新明,楊方圓,劉國(guó)奇.多策略的郊狼優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用研究,2022,39(4):1124-1131.(Zhang Xinming, Yang Fang-yuan, Liu Guoqi. Multi-strategy coyote optimization algorithm[J].Application Research of Computers,2022,39(4):1124-1131.)
[17]張新明,王霞,康強(qiáng),等.GWO與ABC的混合優(yōu)化算法及其聚類(lèi)優(yōu)化[J].電子學(xué)報(bào),2018,46(10):2430-2442.(Zhang Xinming, Wang Xia, Kang Qiang, et al. Hybrid grey wolf optimizer with artificial bee colony and its application to clustering optimization[J].Acta Electronica Sinica,2018,46(10):2430-2442.)