














摘 要:鑒于狼群算法在單目標優化問題上的優越表現,結合狼群的生物習性將其運用到多目標優化問題上,提出一種精英引導和信息交互的多目標狼群算法(MOWPA-EGII)。首先,提出精英引導策略,利用外部檔案中的精英狼和當前子種群的頭狼共同引導種群移動,讓人工狼均勻地分布在整個搜索空間,增強算法的全局搜索能力;其次,設計信息交互機制,模擬狼群捕獵過程中的信息傳遞,具有不同優勢的個體可以相互傳遞信息,保證狼群的捕獵效率,提高算法勘探Pareto最優解的能力;最后,加入變異算子,擾動人工狼的移動方向,讓算法跳出局部最優,增強算法的局部搜索能力。為了驗證MOWPA-EGII的有效性,將其與5種經典算法和10種新近算法進行比較,結果表明MOWPA-EGII擁有良好的收斂性和多樣性,證明了所提算法具有較好的優化性能。
關鍵詞:狼群算法; 多目標優化; 精英引導; 信息交互; 變異算子
中圖分類號:TP18 文獻標志碼:A
文章編號:1001-3695(2024)08-022-2404-08
doi:10.19734/j.issn.1001-3695.2023.12.0587
Multi-objective wolf pack algorithm with elite guidance and information interaction
Chen Fujun1a,1b, Wu Runxiu1a,1b, Xiao Renbin2, Wang Hui1a,1b, Zhao Jia1a,1b
(1. a.School of Information Engineering, b.Nanchang Key Laboratory of IoT Perception & Collaborative Computing for Smart City, Nanchang Institute of Technology, Nanchang 330099, China; 2.School of Artificial Intelligence & Automation, Huazhong University of Science & Techno-logy, Wuhan 430074, China)
Abstract:In consideration of the superior performance of the wolf pack algorithm on single-objective optimization problems, combining with the biological habits of wolves to apply it to multi-objective optimization problems, this paper proposed a multi-objective wolf pack algorithm with elite guidance and information interaction(MOWPA-EGII) . Firstly, MOWPA-EGII proposed an elite guidance strategy, using the elite wolf in the external file and the head wolf of the current sub-population to jointly guide the population movement, so that the artificial wolves uniformly distributed in the whole search space, and the strategy enhanced the global search ability of the algorithm; Secondly, it designed the information interaction mechanism to simulate the information transfer in the wolf hunting process, so that individuals with different advantages could transfer information to each other to ensure the hunting efficiency of the wolves and improved the ability of the algorithm to explore the optimal solution of the Pareto; Finally, it added the mutation operator to perturb the moving direction of the artificial wolves, so as to let the algorithm jump out of the local optimum and enhance the local search ability of the algorithm. In order to verify the effectiveness of MOWPA-EGII, comparing it with 5 classical algorithms and 10 recent algorithms, and the results show that MOWPA-EGII possesses good convergence and diversity, which proves that the present algorithm has a better optimization performance.
Key words:wolf pack algorithm; multi-objective optimization; elite guidance; information interaction; variational operator
0 引言
目前工程應用中存在大量需要同時優化多個目標的問題,這些問題被稱為多目標優化問題(multi-objective optimization problem,MOP)[1]。MOP中不同的目標之間相互沖突或競爭,即改善一個目標會導致其余的幾個目標退化,這使得難以找到全局最優解。因此,需要對各個目標進行權衡,找到一組非劣解的集合,即Pareto最優解集[2]。
在處理多目標優化問題時,盡管有混合整數線性規劃法、ε約束法和凸優化法等[3],但這些方法通常需要目標函數滿足一些特定的條件,而且這些數學優化方法面對復雜MOP時往往無法建立精確的數學表達式,即使建立了精確表達式計算的代價也十分昂貴。為了解決這類問題,出現了許多受生物啟發的多目標進化算法(multi-objective evolutionary algorithm,MOEA)[4]。Coello等人[5]提出多目標粒子群算法(multi-objective particle swarm optimization,MOPSO),通過不斷更新粒子的速度和位置以及最優解的信息,尋找Pareto最優解集,從而解決多目標優化問題。Hedayatzadeh等人[6]提出多目標人工蜂群算法(multi-objective artificial bee colony,MOABC),模擬蜜蜂的搜索和交流行為,將優秀的解信息傳遞給其他個體,使整個種群逐步向全局最優解靠近。Cheng等人[7]提出一種基于分解的多目標蟻群算法(multi-objective ant colony optimization based on decomposition,MoACO/D),利用切比雪夫法將一個大問題分解為多個子問題,并將蟻群分解為多個重疊的子種群,每個子種群分別對應一個子問題進行尋優,同時維護聚合信息素軌跡和聚合啟發式矩陣。Deb等人[8]提出基于參考點的非支配排序方法的多目標進化優化算法(evolutionary many-objective optimization algorithm using reference point based nondominated sorting approach,NSGA-Ⅲ),利用參考點引導非支配個體尋優,更好地反映個體在多目標函數下的性能,并使用快速非支配排序和特殊擁擠度距離來維護種群的多樣性。Yang等人[9]提出了多目標螢火蟲算法(multi-objective firefly algorithm,MOFA),模擬自然界中螢火蟲的發光行為和相互作用,通過優化搜索過程來搜索多個目標解的集合。Mirjalili等人[10]提出了多目標灰狼算法(multi-objective grey wolf optimizer,MOGWO),模擬灰狼群體的追逐和領導行為,將問題的解空間映射為灰狼個體的搜索空間,領導者引領狼群進行位置更新,尋找Pareto最優解。這些經典的多目標優化算法,因其創造性設計和優異性能在多目標優化領域穩步發展,為解決工程中的MOP提供了很多思路,也激勵了新算法的誕生。
吳虎勝等人[11]通過分析狼群的捕獵與分工,提出了一種新的狼群算法(wolf pack algorithm,WPA)。該算法由于在全局搜索和局部開發上具有較強的能力,被廣泛應用于各種工程實踐。如:張鴻運等人[12]利用狼群算法解決多無人機協同任務規劃問題;徐祐民等人[13]利用狼群算法優化支持向量神經網絡;She等人[14]利用改進的狼群算法提高求解高度非線性黑箱函數結構可靠度問題的精度和效率;賈光耀等人[15]利用改進的狼群算法提出一種交通子區邊界控制方案。此外還應用于最大熵圖像分割問題、路徑規劃問題和船舶避碰問題等。上述算法在各自的工程應用中都取得了較好的優化結果,充分體現了狼群算法較好的全局收斂性和計算魯棒性,以及在函數優化領域表現出廣闊的應用前景。雖然狼群算法在處理單目標優化問題上的發展與應用非常成熟,但在處理多目標優化問題上卻很少表現。鑒于狼群算法在單目標優化問題上的突出表現,它在多目標優化問題上豐富與發展就非常有意義,于是有學者將狼群算法應用到多目標優化領域中。如:荀洪凱等人[16]提出一種多目標啟發式狼群算法用于解決不相關并行機分批調度問題;陶翼飛等人[17]將多目標狼群算法應用于機場行李導入問題;李小川等人[18]提出了一種文化狼群算法用于解決多目標帶時間窗的車輛路徑問題。上述算法為狼群算法求解多目標優化問題提供了解決方案,優化結果較好,但它們都是用于解決離散問題,并不能用于解決連續優化問題。為此,對于狼群算法在多目標連續優化問題上的應用,本文結合狼群的生物習性提出一種精英引導和信息交互的多目標狼群算法(multi-objective wolf pack algorithm based on elite guidance and information interaction,MOWPA-EGII)。MOWPA-EGII具有如下特點:a)精英引導[19]策略,子種群中的頭狼和檔案中的精英狼共同引導人工狼,可以擴大種群搜索范圍,防止算法陷入局部最優;b)信息交互機制,模擬捕獵過程中的信息傳遞,人工狼之間進行信息交互,讓優良信息在種群中傳遞,保證算法搜索效率的同時維持種群多樣性;c)變異算子[20],前期可以減弱人工狼對頭狼的盲目跟從,后期增強算法的局部搜索能力。在上述三種策略的相互作用下,避免了算法在尋優過程中陷入局部最優,增強了算法的勘探能力,提高了算法的收斂性和分布性。
1 相關基礎知識
1.1 多目標優化問題
對于一個具有n個決策變量和m個目標的多目標優化函數,以最小化問題為例,可建立多目標優化問題的模型:
min y=F(x)=(f1(x),f2(x),…,fm(x))
s.t.gi(X)≤0 i=1,…,p
hj(X)=0 j=1,…,q
x=(x1,x2,…,xn)∈X∈Rny=(y1,y2,…,ym)∈Y∈Rm(1)
其中:x表示決策向量;X表示n維決策空間;y表示目標向量,Y表示m維目標空間;g*(X)表示有p個不等式約束;h(X)表示有q個等式約束。對于xi,xj∈X,若xj的目標函數都不大于且至少存在一個小于xi的目標函數,則xi Pareto支配xj,記為xixj。若x*∈X且x*不受任意個體xi支配,則稱x*為非支配個體。決策空間中所有非支配個體的集合稱為Pareto最優解集(Pareto set,PS),該解集構成目標空間中的Pareto前沿(Pareto front,PF)。
1.2 狼群算法
狼群算法是模擬自然界中狼群捕食行為而提出的一種新的群智能算法。該算法模擬狼群捕獵并抽象出三種行為:游走行為、召喚行為和圍攻行為。狼群中有明確的分工,探狼負責游走探尋獵物,猛狼負責圍攻捕獵,頭狼負責決策指揮。按照“強者生存”的機制,保證種群的生存與發展。
WPA的規則和行為描述如下:
a)頭狼產生規則:將目標空間中適應度值最優的人工狼視為頭狼。頭狼不參與人工狼的捕食行為,直至更加優秀的人工狼取代它。若存在適應度值相同的頭狼則隨機選擇一匹人工狼為頭狼。
b)游走行為:探狼i在解空間Xi=(x1,x2,x3,…,xN)中進行游走,選擇其探索的h個方向中獵物氣味濃度Yip最大的方向前進,重復游走行為,直至探狼i感知的氣味濃度Yi優于頭狼Ylead,或者游走次數T>Tmax。探狼i的游走位置更新公式如下:
xpid=xid+stepda×sin(2π×p/h)(2)
其中:xid為探狼i在d(d=1,2,3,…,D)為空間中的初始位置,stepda為游走步長,h∈[hmin,hmax]且為整數,p(p=1,2,3,…,h),xpid為第p個方向上的空間位置。
c)召喚行為:游走之后,頭狼會召喚N-S-1匹猛狼,猛狼i收到頭狼的召喚會迅速按照向頭狼奔襲。猛狼i的奔襲公式如下:
xk+1id=xkid+stepdb×gkd-xkid|gkd-xkid|(3)
其中:xkid為猛狼i在第k次迭代時的空間位置;gkd為第k次迭代頭狼的空間位置;stepdb為奔襲步長。
在奔襲的過程中,猛狼i若未能取代頭狼,則會繼續奔襲,直至它們之間的距離d<dnear,此時轉入圍攻行為。頭狼與猛狼之間的距離判定如下:
dnear=1D·ω·∑Dd=1|maxd-mind|(4)
其中:ω為距離判定因子;mind和maxd為第d個維度變量的下界和上界。
d)圍攻行為:在頭狼召喚,猛狼奔襲后,把頭狼位置視為獵物位置,狼群進行捕獵。圍攻的位置更新公式如下:
xk+1id=xkid+λ×stepdc×|gkd-xkid|(5)
其中:λ∈[-1,1]的隨機數;stepdc為人工狼的圍攻步長。
e)三種步長之間的關系:探狼的游走步長stepda、猛狼的奔襲步長stepdb以及人工狼的攻擊步長stepdc,在d為空間中的關系如下:
stepda=stepdb2=2×stepdc=|maxd-mind|S(6)
其中:S為步長因子,表示人工狼在搜尋獵物過程的精細程度。
f)更新機制:采用“強者生存”的更新機制,保證種群的生存與發展。將適應度值較差的R匹人工狼進行淘汰,然后再隨機生成R匹人工狼,其中,R∈[N/2γ,N/γ]且為整數,γ為種群的更新比例因子。
2 精英引導和信息交互的多目標狼群算法
WPA雖然在單目標優化問題上表現出良好的收斂性和計算魯棒性,但應用于求解多目標優化問題時還存在如下問題:a)人工狼和頭狼易出現聚集現象;由于WPA本質是頭狼引導人工狼朝其所在的方向進行搜索,在求解多目標優化問題時人工狼和頭狼易聚集在某一區域,使算法陷入局部最優;b)種群中的優良信息易流失;WPA在狼群捕獵過程中未涉及內部的信息交互,易使種群中的優良信息無法傳遞,最終導致種群優良信息流失和多樣性較差;c)種群進化停滯;隨著種群的不斷進化,個體之間的差異逐漸變小,使得種群進化停滯。針對上述問題,本文提出一種精英引導和信息交互的多目標狼群算法(MOWPA-EGII)。
2.1 精英引導策略
WPA中人工狼會向當前種群的頭狼學習,在求解單目標優化問題時,這種學習方式會加速算法收斂,快速尋找到最優解,但在求解多目標優化問題時,種群的快速收斂往往會導致算法陷入局部最優,出現人工狼和頭狼聚集現象,即問題a)。通過分析發現,出現這種聚集現象是由于WPA在執行圍攻行為和召喚行為后人工狼總會直線朝頭狼所在方向移動,最終導致算法陷入局部最優。針對于此,提出一種精英引導策略:首先,種群通過快速非支配排序[21]選出非支配等級為1的人工狼為頭狼,將頭狼所支配的人工狼劃分為一個子種群,面對多匹頭狼支配同一人工狼問題,按照歐氏距離就近分配;其次,引入外部檔案,讓外部檔案中的精英狼和當前子種群的頭狼共同引導狼群前進捕獵,讓狼群前期均勻分布在搜索空間,防止產生聚集現象,增強算法的全局搜索能力。經過精英引導策略改進后,召喚行為中式(3)更新為
xk+1id=xkid+ω1×stepdb×gkSub-xkid|gkSub-xkid|+ω2×stepdb×gkElite-xkid|gkElite-xkid|(7)
圍攻行為中式(5)更新為
xk+1id=xkid+ω3×λ×stepdc×|gkSub-xkid|+
ω4×λ×stepdc×|gkElite-xkid|(8)
其中:gkSub為子種群中的頭狼,gkElite為外部檔案中任意一匹精英狼,ω1,ω2∈[0,1]且∑2i=1ωi=1,ω3,ω4∈[0,1]且∑4i=3ωi=1;其余變量含義和式(3)(5)中一致。
為了驗證提出的精英引導策略的有效性,對采用精英引導策略前后的實驗結果進行比較。圖1展示了算法采用頭狼引導策略和精英引導策略,獲得ZDT1問題的Pareto前沿,圖中紅色圓圈表示算法求得的Pareto前沿,黑色線條表示ZDT1的真實Pareto前沿(見電子版)。圖1(a)為初始種群;(b)為采用頭狼引導策略的算法在ZDT1問題上迭代20次的Pareto前沿;(c)為采用精英引導策略的算法在ZDT1問題上迭代20次的Pareto前沿。由圖1可知,采用頭狼引導策略時種群出現了嚴重的聚集現象,通過觀察發現算法得到前沿主要集中在真實Pareto前沿的左半部分,算法的收斂性與分布性較差;采用精英引導策略后,種群中的聚集現象得到了較大改善,算法得到的前沿較為均勻地分布在真實Pareto前沿上,該策略雖然在增加全局搜索能力時犧牲了一定的精細搜索能力,但種群的分布性得到了較大的改善。
2.2 信息交互機制
在生物界中,狼群會使用嗅覺和視覺來追蹤獵物的位置,一旦發現獵物,它們會發出特定的叫聲向同伴傳遞信息,其他狼會迅速向其靠攏。狼群會一起追逐獵物,相互合作,采取不同的位置來包圍獵物,阻止獵物逃跑,最終在狼群的相互協作與信息傳遞下成功捕獵。基于這一生物學原理,本文在狼群算法的基礎上設計信息交互機制。WPA的每一次迭代視為一次捕獵,但狼群實際并未捕獲到獵物,即沒有尋找到最優解,也就不存在“強者生存,弱者淘汰”。事實上,算法的每次迭代是向獵物靠近的過程,狼群中不同的個體會相互傳遞信息,最終捕獲到獵物。所以針對問題b),重視不同個體相互傳遞的優勢信息,設計信息交互機制。該機制可以讓優良信息在種群中傳遞,防止因為淘汰造成的優良信息流失,維護了種群多樣性。狼群的信息交互如下:
xk+1id=xkid+t×rand×(xk(n-i+1)d-xkid)+α×ε(9)
其中:i∈[1,N]且為整數。t為抖動因子,取值為式(10)。rand∈[0,1]。xk(n-i+1)d為狼群中編號n-i+1的人工狼。α×ε為擾動項,α是擾動步長因子,α∈[0,1],ε是服從高斯分布、均勻分布或其他分布中提取的隨機數向量。α×ε擾動項,一方面,可以防止t=1時導致學習與被學習人工狼之間過于相似,陷入局部最優;另一方面,可以擴大搜索范圍。
t=rand×(ubb-1)+1 rand≤0.5rand×(-1+ubb)-ubbrand>0.5(10)
其中:ubb=1.5-(k-1)×1.5/Maxit,k為迭代次數,Maxit為最大迭代次數,rand∈[0,1]。
以二目標為例,圖2展示了采用信息交互機制的模型簡化圖,黑球為人工狼,紅球為頭狼,白球為移動后可能的位置。在學習和被學習人工狼相同的情況下,當不加入抖動因子和擾動項時,搜索后可能位于線段AB上的某一點C;當加入抖動因子和擾動項時,在抖動因子的作用下,點C可能會位于線段AB上方E點或線段AB下方的D點。在擾動項的作用下,點C可能會出現在以C為圓心的橙色圓內的某一點F,點D和E擾動后的可能位置如圖所示(見電子版)。由圖2可以看出,搜索范圍顯著增大,在保留各人工狼優良信息的同時有效提升算法探索到真實Pareto前沿的概率。
按照上述更新式(9),會產生與原種群P大小N一樣的新種群Q,將新舊種群合并,然后按照快速非支配排序,先選擇前n個非支配層Zi(i=1,2,3,…)的人工狼,使得Z1+Z2+Z3+…+Zn<N,當Z1+Z2+Z3+…+Zn+Zn+1>N,對于第Zn+1層的人工狼進行擁擠度距離排序,選擇擁擠度大的前N-(Z1+Z2+…+Zn)匹人工狼。這樣可以很好保留人工狼身上的優良信息,避免優秀人工狼被淘汰,從而增加搜索效率。
2.3 變異算子
針對問題c),隨著種群的不斷進化,人工狼之間的差異逐漸變小,種群中可用信息變少,這時會使種群進化停滯。此時,通常會引入變異算子,變異算子是對種群的父代個體進行隨機變化來形成子代,其目的是保持種群的多樣性和避免過早收斂。因此本文加入單維選擇變異算子,人工狼i每次進行完游走行為、召喚行為和圍攻行為后,按照一種隨迭代次數動態遞減的變異概率Pm隨機對人工狼i的某一維進行變異,這里Pm=1-k/Maxit,若選中第d維分量,變異可定義為
xd′i=rand×(ud-ld)+ud rand≤Pmxdirand>Pm(11)
其中:d為人工狼i的第d維分量;ud和ld分別為人工狼i第d維分量的上限和下限;k為迭代次數;Maxit為最大迭代次數,式中的ud和ld定義如下:
ud=xdi+(1-kMaxit)×(u-l)
ld=xdi-(1-kMaxit)×(u-l)(12)
通過對變異前后進行比較,若xd′i支配xdi則進行替換;若xdi支配xd′i則不進行替換;若xdi和xd′i互不支配,是否替換判斷如下:
xdi=xd′i rand≤0.5xdirand>0.5(13)
算法前期,迭代次數k較小,可以使人工狼有較大的位置波動,變異算子和精英引導策略相互作用,可以減弱人工狼對于頭狼的盲目跟從,使人工狼較為均勻地搜索決策空間,增強算法的全局搜索能力,改善種群的分布性,有效避免種群進化停滯,維護種群的多樣性;算法后期,人工狼之間的差異變小,即種群通過非支配排序后非支配等級都為1,種群中的人工狼都變為頭狼,精英引導策略會失效。此時變異算子隨著迭代次數k增大,可以使人工狼有較小的位置波動,該算子使人工狼注重局部搜索,使變異后產生的新解以更大的概率逼近真實的Pareto前沿,保證了算法的收斂性。
2.4 算法流程
輸入:決策變量的維度D;區間為[U,L];種群的大小N;最大迭代次數Maxit;最大游走次數Tmax;距離判定因子ω;步長因子S。
輸出:Pareto最優解集。
結合前文描述的多個策略,給出MOWPA-EGII算法步驟。
a)種群和參數初始化。初始化決策變量的維度D,區間為[U,L],種群的大小N,最大迭代次數Maxit,最大游走次數Tmax,距離判定因子ω,步長因子S,生成N匹人工狼xi。
b)計算每匹人工狼的適應度值。
c)對種群進行預處理。找到位于非支配等級為1的頭狼各自所支配的人工狼,每匹頭狼和它支配的人工狼劃為一個子種群,并將非支配等級為1的人工狼存于外部檔案。
d)游走行為。對于除頭狼外的人工狼按照式(2)執行游走行為,直至人工狼在解空間中的位置優于支配它的頭狼,或達到最大游走次數T>Tmax,則轉步驟e)。
e)召喚行為。頭狼發起召喚,人工狼按照式(7)進行奔襲,若在奔襲的過程中人工狼在解空間中的位置優于其所在子種群的頭狼,則取代該頭狼,替代它并發起召喚行為;若劣于其所在子種群的頭狼,人工狼繼續奔襲,直至d<dnear,則轉步驟f)。
f)圍攻行為。人工狼按照式(8)對獵物發起攻擊。
g)種群變異。對執行完上述三種行為的人工狼按照式(11)進行變異,若變異后的人工狼,支配變異前的人工狼,則進行替換;若互不支配,則按照式(13)判斷是否替換;否則不進行替換。
h)外部檔案的更新與維護。將種群中的精英解存入外部檔案,若檔案的大小超過規定的大小N,則先對檔案進行去重,然后按照擁擠度距離進行刪除。
i)判斷是否達到最大迭代次數Maxit,若達到則轉至步驟j),否則轉至步驟c)。
j)輸出Pareto最優解集。
2.5 算法時間復雜度分析
N為種群大小,NA為外部檔案大小,m為目標空間維數。WPA中游走、召喚和圍攻行為以及更新機制都是串行,所以WPA的時間復雜度近似為O(N)。MOWPA-EGII基于狼群算法,對N匹人工狼在m個目標空間進行預處理,確定支配關系、存寫檔案和劃分子種群,此過程通過快速非支配排序并行處理,故間復雜度近似為O(m×NlogN)。精英引導策略,對N匹人工狼執行式(7)(8),時間復雜度為O(N)。信息交互機制,對2N匹人工狼進行快速非支配排序,對超過種群大小N的個體按照擁擠距離淘汰,時間復雜度為O(2Nlog2N)+O(m×N)。變異算子,對N匹人工狼的某一維度進行變異,時間復雜度為O(N)。檔案維護,采用擁擠距離對檔案進行維護,NA的大小通常與種群大小N相等,最大時間復雜度為O(m×2N),綜上,MOWPA-EGII的時間復雜度為O(mNlogN)。
3 實驗結果與分析
3.1 多目標測試函數集
多目標測試函數集選擇。為了驗證MOWPA-EGII的有效性,本文選取了15個基準MOP測試函數,測試MOWPA-EGII面對不同類型MOP問題時算法的性能。測試函數集包括5個2-目標ZDT系列的測試函數,3個3-目標Viennet系列測試函數,以及7個3-目標DTLZ系列測試函數。多目標測試函數集的特征和性質如表1所示。
3.2 性能指標
性能指標選擇。反世代距離IGD(inverted generational distance),反映真實Pareto前沿到算法得到的近似Pareto前沿的距離。通過計算真實Pareto前沿和近似Pareto前沿之間的距離可以反映一個算法收斂性和多樣性。一般情況下,某算法的IGD值越小說明該算法獲得的Pareto前沿收斂性和多樣性越好。IGD可以通過式(14)計算得到。
IGD(X,P*)=min∑x*∈P*d(x*,X)|P*|(14)
其中:P*表示真實Pareto前沿上均勻分布的點集,|P*|表示P*內真實點集的個數,d(x*,X)表示x*∈P*的解到X中解的最小歐氏距離。
3.3 信息交互機制的有效性分析
信息交互機制比強者生存機制具有更好的尋優效率和算法多樣性,是因為強者生存機制是直接淘汰種群中較差的R匹人工狼,然后再隨機生存R匹人工狼,這種隨機很有可能使種群的優良信息流失,使種群進化變得緩慢和多樣性缺失,最終會導致算法在目標空間中的分布為圖3(b)所示狀況。信息交互機制不會直接淘汰,而是按照式(9)重新生成和原種群大小相等的新種群,最后在目標空間中按照擁擠距離[21]淘汰,最終種群的分布狀況會和圖3(a)類似。因此信息交互機制可以較好地保持種群多樣性。圖3中Z1和Z2為非支配序后的非支配等級。
算法的多樣性和尋優效率驗證如下:實驗將采用信息交互機制的算法命名為A,采用強者生存機制的算法命名為B,其他策略保持不變,畫出算法A和B的IGD隨迭代次數增加的收斂曲線圖。選擇不同Pareto前沿特征測試函數,凹形:ZDT2(二目標)和DTLZ2(三目標),不連續:ZDT3(二目標)和DTLZ7(三目標),混合:Viennet2。為了防止偶然性,在算法運行30次結果中,每間隔10迭代次數取一次IGD的平均值,總共取30組數據。算法隨迭代次數增加IGD收斂曲線變化,如圖4所示。從圖4(a)可得出:算法A在ZDT2和ZDT3上迭代到80次左右IGD趨于平穩,而算法B在迭代到120次左右IGD趨于平穩,算法A比B收斂速度快且精度更高;從圖4(b)可得出:算法A在迭代約180次時IGD趨于0.24左右,而算法B在迭代200次后IGD仍然有較大的波動,說明算法A比B收斂速度快且穩定;從圖4(c)可得出:算法A和B在DTLZ2和DTLZ7上,雖然在迭代到大約50次后IGD都趨于穩定,但算法A的精度比B高。綜上所述,算法采用信息交互機制能夠較好地保留種群中的優良信息,取得了更快的收斂速度和更好的IGD值,說明算法采用信息交互機制可以擁有更好的多樣性與尋優效率。
3.4 與經典多目標優化算法比較
為了測試MOWPA-EGII算法的性能,本節將MOWPA-EGII與5種經典多目標優化算法在ZDT、Viennet和DTLZ系列函數上進行比較,比較算法包括MOEA/D[22]、MOPSO[5]、NSGA-Ⅱ[21]、PSEA-Ⅱ[23]以及MOFA[9]。除MOFA算法參數取自原文獻,其余算法參數與實驗數據均來自PlatEMO平臺,版本為PlatEMO4.1,如表2所示。表3給出了5種經典算法和MOWPA-EGII獲得的IGD的平均值(mean)和標準差(std),每種算法最優值的總數(total),Friedman檢驗對各個算法進行秩(ranking)排名,以及各個多目標優化算法的最終排名(final rank)。其中,Friedman檢驗的秩均值越小表示算法的性能越好,表3中加黑數據為每種算法在同一種測試函數上的最優結果。為了保證實驗的公平性,每種算法的種群規模設置為100,外部檔案設置為100,對二目標測試函數評估10 000次,三目標測試函數評估20 000。為了防止偶然性的出現,對每個測試函數在每個算法獨立運行30次取IGD均值。
根據表3,對算法的綜合性能進行評估,在15個測試函數上,MOWPA-EGII取得9次最好的優化結果,MOEA/D和NSGA-Ⅱ取得1次最好的優化結果,PSEA-Ⅱ取得4次最好的優化結果,MOPSO和MOFA未取得最好的優化結果。其中,MOWP-EGII在ZDT系列測試函數上全部占優,Viennet3、DTLZ3、DTLZ6和DTLZ7優化結果占優;在Viennet1和Viennet2測試函數上雖然未取得最好的優化結果,但與優化結果最好的算法屬于同一個數量級并且相差較小;在DTLZ2、DTLZ4和DTLZ5與取得最優結果的算法屬于同一個數量級;在DTLZ1上優化結果較差。根據表3,所有算法的均值和方差結果表明MOWPA-EGII比其他5種經典算法具有更好的IGD性能。從Friedman檢驗結果可以看出,MOWPA-EGII的秩均值最小,NSGA-Ⅱ的秩均值次之,MOFA的秩均值最大,本文算法穩定性更好。綜合上述分析,MOWPA-EGII的最優值總數(total)、秩均值(ranking)和最終排名(final rank)均位列第一,所以本文算法與其他5種經典多目標優化算法對比,表現出更好的優化結果,在收斂性和分布性上具有較好的性能,在不同的測試問題上具有更強的穩定性。為了直觀地表現出MOWPA-EGII的性能,表4列出各算法在6個典型的測試函數上的Pareto前沿擬合圖,二目標選取了Pareto前沿特征為連續(ZDT2)和非連續(ZDT3),三目標選取了Pareto前沿特征為混合(Viennet2)、面(DTLZ2)、線(DTLZ6)和非連續(DTLZ7)。擬合圖中紅色圓圈代表各算法求解到的Pareto前沿,黑灰色的點線和面表示該測試函數的真實Pareto前沿面。從表4中可以看出,MOWPA-EGII在二目標測試函數上收斂性和分布性具有較大的優勢,在三目標測試函數上也具有較強的競爭力。
3.5 與新興多目標優化算法比較
為了進一步測試MOWPA-EGII性能,本節將MOWPA-EGII與9種新興算法作比較,比較算法包括:CAMOEA[24]、FLEA[25]、MOEADDYTS[26]、RPDNSGAII[27]、RVEAiGNG[28]、ToP[29]、NSGAII-SDR[30]、MOEAPSL[31]、CFMOFA[32]、HVFA-M[19],除CFMOFA和HVFA-M算法參數取自原文獻,其余比較算法的參數和實驗數據均來自PlatEMO平臺,版本為PlatEMO4.1,算法的參數設置如表5所示。
本節測試函數選擇如表6所示,評價指標、種群大小、外部檔案大小和測試函數評估次數的設置上與3.3節相同。為了保證公平性,所有算法獨立運行30次取IGD的均值。
根據表6可知,MOWPA-EGII在15個測試函數上取得7次最好的優化結果,CAMOEA取得4次最好優化結果,RPDNSGAII和RVEAiGNG分別取得2次最好的優化結果,TOP、NSGAIISDR、MOEAPSL、CFMOFA、HVFA-M、FLEA和MOEADDYTS未取得最好優化結果。
其中,MOWPA-EGII在ZDT系列測試函數、DTLZ3和DTLZ6上取得了最好的優化結果;在Viennet1、Viennet2、Viennet3、DTLZ2、DTLZ4、DTLZ5和DTLZ7上雖然未取得最好的優化結果,但與優化結果最好的算法屬于同一數量級,且相差較小;在DTLZ1上的優化結果較差。根據表6,所有算法的均值和方差結果表明,MOWPA-EGII比其他10種新興算法具有更好的IGD性能。從Friedman檢驗結果可以看出,MOWPA-EGII的秩平均值最小,CAMOEA秩均值次之,FLEA的秩均值最大,本算法穩定性更好。綜合上述分析,MOWPA-EGII的最優值總數(total)、秩均值(ranking)和最終排名(final rank)均位列第一,所以本文算法與其他10種新興多目標優化算法對比,表現出更好的優化結果,體現出其在求解MOPs時有較好的收斂性、多樣性和穩定性。
綜上,MOWPA-EGII在面對多數測試函數時,在收斂性和分布性上表現較好,獲得較好Pareto前沿擬合效果,表現出較強的競爭力,是一種可靠的多目標優化算法。
4 結束語
優化問題在計算機領域一直是研究熱點之一,本文鑒于狼群算法在求解單目標優化問題時的優越性,將狼群算法應用于多目標優化問題,提出一種精英引導和信息交互的多目標狼群算法(MOWPA-EGII)。MOWPA-EGII提出精英引導策略,通過快速非支配排序,選出非支配等級為1的人工狼視為頭狼并存入外部檔案,再將每匹頭狼所支配的人工狼劃為同一個子種群,人工狼在支配它的頭狼和外部檔案中的精英狼共同引導下在解空間中進行搜索,能夠有效防止算法陷入局部最優;設計信息交互的機制,模擬狼群捕獵過程中的信息交流并向獵物一次次靠近的過程,該更新機制凸顯人工狼個體之間的優勢差異,它們可以相互學習,防止種群中的優良信息流失,保持種群的多樣性;加入變異算子,能夠有效幫助種群跳出局部,增強局部搜索的能力。將MOWPA-EGII與5種經典算法和10種新興算法比較,通過在多目標領域的測試函數上作對比,并將實驗結果進行Friedman檢驗,證明了MOWPA-RGII是解決多目標優化問題的一種行之有效的方法。然而在實驗過程中發現,在處理多模態問題時,與其他算法對比略失競爭力。未來將進一步提高算法在多模態問題上的優化能力,并將算法應用于高維超多目標優化問題[33,34]和實際的工程應用[35]當中。
參考文獻:
[1]Hua Yicun, Liu Qiqi, Hao Kuangrong, et al. A survey of evolutio-nary algorithms for multi-objective optimization problems with irregular Pareto fronts[J]. IEEE/CAA Journal of Automatica Sinica, 2021, 8(2): 303-318.
[2]Wang Liping, Pan Xiaotian, Shen Xiao, et al. Balancing convergence and diversity in resource allocation strategy for decomposition-based multi-objective evolutionary algorithm[J]. Applied Soft Computing, 2021, 100: 106968.
[3]劉佳, 王先甲. 系統工程優化決策理論及其發展戰略[J]. 系統工程理論與實踐, 2020, 40(8): 1945-1960. (Liu Jia, Wang Xianjia. The development of optimization and decision theory in systems engineering[J]. Systems Engineering-Theory & Practice, 2020, 40(8): 1945-1960.)
[4]胡智勇, 于千城, 王之賜, 等. 基于多目標優化的聯邦學習進化算法[J]. 計算機應用研究, 2024, 41(2):415-420,437. (Hu Zhiyong, Yu Qiancheng, Wang Zhici, et al. Federated learning evolutionary algorithm based on multi-objective optimization[J]. Application Research of Computers, 2024, 41(2) :415-420,437.)
[5]Coello C A C, Pulido G T, Lechuga M S. Handling multiple objectives with particle swarm optimization[J]. IEEE Trans on Evolutionary Computation, 2004, 8(3): 256-279.
[6]Hedayatzadeh R, Hasanizadeh B, Akbari R, et al. A multi-objective artificial bee colony for optimizing multi-objective problems[C]//Proc of the 3rd International Conference on Advanced Computer Theory and Engineering. Piscataway,NJ:IEEE Press, 2010: 275-281.
[7]Cheng Jixang, Zhang Gexiang, Li Zhidan, et al. Multi-objective ant colony optimization based on decomposition for bi-objective traveling salesman problems[J]. Soft Computing, 2012, 16: 597-614.
[8]Deb K, Jain H. An evolutionary many-objective optimization algorithm using reference-point-based nondominated sorting approach, part I: solving problems with box constraints[J]. IEEE Trans on Evolutio-nary Computation, 2013, 18(4): 577-601.
[9]Yang Xinshe. Multiobjective firefly algorithm for continuous optimization[J]. Engineering with Computers, 2013, 29: 175-184.
[10]Mirjalili S, Saremi S, Mirjalili S M, et al. Multi-objective grey wolf optimizer: a novel algorithm for multi-criterion optimization[J]. Expert Systems With Applications, 2016, 47: 106-119.
[11]吳虎勝, 張鳳鳴, 吳廬山. 一種新的群體智能算法-狼群算法[J]. 系統工程與電子技術, 2013, 35(11): 2430-2438. (Wu Husheng, Zhang Fengming, Wu Lushan. New swam intelligence algorithm-wolf pack algorithm[J]. Systems Engineering and Electronics, 2013, 35(11): 2430-2438.)
[12]張鴻運, 王磊, 張旭,等. 考慮子系統執行能力的多無人機協同任務規劃[J]. 系統工程與電子技術, 2023, 45(1): 127-138. (Zhang Hongyun, Wang Lei, Zhang Xu, et al. Multi-UAV cooperative mission planning considering subsystem execution capability[J]. Systems Engineering and Electronics, 2023, 45(1): 127-138.)
[13]徐祐民, 陳秀梅, 彭寶營, 等. 變負載直驅力矩電機位置誤差預測模型研究[J]. 傳感器與微系統, 2024, 43(1): 69-71,83. (Xu Youmin, Chen Xiumei, Peng Baoying, et al. Position error prediction models for variable load direct drive torque motors[J]. Transducer and Microsystem Technologies, 2024, 43(1): 69-71,83.)
[14]She Aiqing, Wang Linjun, Li Jiahao, et al. Structural reliability analysis based on improved wolf pack algorithm AK-SS[J].Structures, 2023,57: 105289.
[15]賈光耀, 閆飛, 張添翼. 改進狼群算法的交通子區迭代學習邊界控制方法[J]. 計算機應用研究, 2023, 40(9): 2775-2780. (Jia Guangyao, Yan Fei, Zhang Tianyi. Iterative learning boundary control method for traffic subregion based on improved wolf pack algorithm[J]. Application Research of Computers, 2023, 40(9): 2775-2780.)
[16]荀洪凱, 陶翼飛, 張源, 等. 多目標啟發式狼群算法求解不相關并行機分批調度問題[J]. 信息與控制, 2023, 52(1): 93-103,114. (Xun Hongkai, Tao Yifei, Zhang Yuan, et al. Multi-objective heuristic wolf pack algorithm for unrelated parallel machine batch Scheduling problem[J]. Information and Control, 2023, 52(1): 93-103,114.)
[17]陶翼飛, 丁小鵬, 羅俊斌, 等. 基于多目標狼群算法的機場行李導入系統仿真優化研究[J/OL]. 系統仿真學報. (2024-02-01) . https://doi. org/10.16182/j. issn1004731x. joss.23-0437. (Tao Yifei, Ding Xiaopeng, Luo Junbin, et al. Research on simulation optimization of airport baggage import system based on multi-objective wolf pack algorithm[J/OL]. Journal of System Simulation. (2024-02-01) . https://doi.org/10.16182/j. issn1004731x.joss. 23-0437.)
[18]李小川, 劉媛華, 王影歌. 求解多目標帶時間窗VRP的文化狼群算法[J]. 計算機應用研究, 2020, 37(4): 1025-1029. (Li Xiaochuan, Liu Yuanhua, Wang Yingge. Cultural wolf pack algorithm for solving multi-objective VRP with time window[J]. Application Research of Computers, 2020, 37(4): 1025-1029.)
[19]趙嘉, 陳丹丹, 肖人彬, 等. 一種基于最大最小策略和非均勻變異的螢火蟲算法[J]. 智能系統學報, 2021, 17(1): 116-130. (Zhao Jia, Chen Danan, Xiao Renbin, et al. A heterogeneous variation firefly algorithm with maximin strategy[J]. CAAI Trans on Intelligent Systems, 2021, 17(1): 116-130.)
[20]Zhao Jia, Chen Wenping, Xiao Renbing, et al. Firefly algorithm based on self-learning for multi-peak optization problem[J]. Frontiers of Information Technology & Electronic Engineering, 2021, 22(10): 1311-1334.
[21]Kalyanmoy D. A fast and elitist multi-objective genetic algorithm: NSGA-Ⅱ[J]. IEEE Trans on Evolutionary Computation, 2002, 6(2): 182-197.
[22]Qi Yutao, Ma Xiaoliang, Liu Fang, et al. MOEA/D with adaptive weight adjustment[J]. Evolutionary Computation, 2014, 22(2): 231-264.
[23]Gadhvi B, Savsani V, Patel V. Multi-objective optimization of vehicle passive suspension system using NSGA-II, SPEA2 and PESA-II[J]. Procedia Technology, 2016, 23: 361-368.
[24]Hua Yicun, Jin Yaochu, Hao Kuangrong. A clustering-based adaptive evolutionary algorithm for multiobjective optimization with irregular Pareto fronts[J]. IEEE Trans on Cybernetics, 2018, 49(7): 2758-2770.
[25]Li Lianghao, He Cheng, Cheng Ran, et al. A fast sampling based evolutionary algorithm for million-dimensional multiobjective optimization[J]. Swarm and Evolutionary Computation, 2022, 75: 101181.
[26]Sun Lei, Li Ke. Adaptive operator selection based on dynamic Thompson sampling for MOEA/D[C]//Proc of International Conference on Pa-rallel Problem Solving from Nature. Cham: Springer, 2020: 271-284.
[27]Elarbi M, Bechikh S, Gupta A, et al. A new decomposition-based NSGA-Ⅱ for many-objective optimization[J]. IEEE Trans on Systems Man and Cybernetics: Systems, 2017, 48(7): 1191-1210.
[28]Liu Qiqi,Jin Yaochu,Heiderich M,et al. An adaptive reference vector-guided evolutionary algorithm using growing neural gas for many-objective optimization of irregular problems[J]. IEEE Trans on Cybernetics, 2020, 52(5): 2698-2711.
[29]Liu Zhizhong, Wang Yong. Handling constrained multiobjective optimization problems with constraints in both the decision and objective spaces[J]. IEEE Trans on Evolutionary Computation, 2019, 23(5): 870-884.
[30]Tian Ye, Cheng Ran, Zhang Xingyi, et al. A strengthened dominance relation considering convergence and diversity for evolutionary many-objective optimization[J]. IEEE Trans on Evolutionary Computation, 2018, 23(2): 331-345.
[31]Tian Ye, Lu Chang, Zhang Xingyi, et al. Solving large-scale multiobjective optimization problems with sparse optimal solutions via unsupervised neural networks[J]. IEEE Trans on Cybernetics, 2020, 51(6): 3115-3128.
[32]Lyu Li, Zhao Jia, Wang Jiayuan, et al. Multi-objective firefly algorithm based on compensation factor and elite learning[J]. Future Generation Computer Systems, 2019, 91: 37-47.
[33]肖人彬, 李貴, 陳峙臻. 進化超多目標優化研究進展及展望[J]. 控制與決策, 2023, 38(7): 1761-1788. (Xiao Renbin, Li Gui, Chen Zhizhen. Research progress and prospect of evolutionary many-objective optimization[J]. Control and Decision, 2023, 38(7): 1761-1788.)
[34]趙嘉, 謝智峰, 呂莉,等. 深度學習螢火蟲算法[J]. 電子學報, 2018, 46(11): 2633-2641. (Zhao Jia, Xie Zhifeng, Lyu li, et al. Firefly algorithm with deep learning[J]. Acta Electronica Sinica, 2018, 46(11): 2633-2641.)
[35]肖人彬, 馮振輝, 王甲海. 群體智能的概念辨析與研究進展及應用分析[J]. 南昌工程學院學報, 2022, 41(1): 1-21. (Xiao Renbin, Feng Zhenhui, Wang Jiahai. Collective intelligence: conception research progress and application analyses[J]. Journal of Nanchang Institute of Technology, 2022, 41(1): 1-21.)