基于多策略改進灰狼算法的多無人機三維路徑規劃

2024-02-22 00:00:00許子俍胡濤劉凱越安樂寧楊思為

航空兵器 2024年6期

摘要：""""" 多無人機三維路徑規劃旨在滿足約束且規避威脅的基礎上給出各個無人機到自身目標合理可行的飛行路徑。針對當前元啟發式算法在求解多約束、多威脅三維空間路徑規劃時搜索速度慢、規劃路徑質量差的問題，提出一種基于多策略改進灰狼優化算法的路徑規劃方法。使用數字高程模型完成三維空間環境建模，結合飛行場景建立包含長度、威脅、高度、平滑多因素綜合評價函數。通過復合混沌序列和準反向學習策略優化初始種群，基于迭代階段上層狼對種群收斂的關鍵影響，使用精英狼凸透鏡反射學習策略提升算法規避局部最優解能力。仿真實驗表明，多策略改進灰狼優化算法綜合評價函數統計結果的最優值、平均值、最差值三項指標相較原算法分別提升了6.1%， 5.1%和13.3%，驗證了本文方法在多約束、多威脅的三維空間路徑規劃問題求解時的有效性。

關鍵詞："""" 多無人機；三維路徑規劃；灰狼優化算法；復合混沌序列；準反向學習；精英狼凸透鏡反射學習

中圖分類號：nbsp;""""" TJ760

文獻標識碼：""" A

文章編號："""" 1673-5048（2024）06-0086-08

DOI： 10.12132/ISSN.1673-5048.2024.0080

0 引" 言

伴隨科技快速進步，無人機（Unmanned Aerial Vehicle， UAV）憑借其在復雜和危險環境中的工作能力而在軍事領域備受關注。多無人機路徑規劃是多無人機任務規劃系統的重點環節之一，其目的是當多無人機在三維空間中飛行時，可以在滿足相應約束條件及不與障礙物碰撞的前提下，以盡可能小的成本代價為每架無人機找到一條飛往各自目標的最優路徑^［1^］。

當前，三維路徑規劃方法已取得許多研究成果，傳統路徑規劃方法有A*算法^［2^］、快速探索隨機樹算法^［3^］、人工勢場法^［4^］、 Dijkstra算法^［5^］等，該類方法由于需要大量計算時間和資源，對于地形變化較多、障礙類型多樣的戰場環境而言大多難以適用。元啟發式算法是仿照自然行為的群智能算法，具有計算速度快、計算邏輯簡單、算法靈活性強的特點，正被越來越多地應用于解決復雜空間中的多無人機三維路徑規劃問題。典型元啟發式算法有粒子群算法^［6^］（Particle Swarm Optimization， PSO）、蟻群算法^［7^］（Ant Colony Optimization， ACO）、遺傳算法^［8^］（Genetic Algorithm， GA）、麻雀算法^［9^］（Sparrow Search Algorithm， SSA）等。例如， Shao等^［10^］提出一種改進PSO的多無人機三維路徑規劃方法，通過引入Logistic混沌映射和自適應線性變化系數提升算法性能，實驗表明，該方法不僅加快了收斂速度，同時提高了解的最優性。 Ali等^［11^］將ACO與差分進化算法融合，提出一種適用于山脈環境多機協同路徑規劃的最大最小蟻群算法，結果表明算法魯棒性及跳出局部最優能力得到提升。鄧灝等^［12^］通過引入貪婪算子、策略選擇閾值方式動態調整變異概率，提出一種基于改進GA的多無人機搜索路徑規劃方法。王玲玲等^［13^］提出一種基于改進SSA的實時路徑規劃方法，通過分別優化初始種群分布和迭代過程提升了算法的收斂精度和速度。

上述研究表明元啟發式算法在解決多無人機路徑規劃問題具有很大的應用潛力和改進空間。灰狼優化算法^［14^］（Grey Wolf Optimization， GWO）是由Mirjalili等于2014年提出的一種仿照自然界中灰狼群捕獵行為的元啟發式算法。相較于其他啟發式算法， GWO具有結構簡單、參數較少、易于實現的優點，目前已被應用于解決頻譜感知^［15^］、工程設計^［16^］、疾病診斷^［17^］等多類問題。然而，標準GWO在求解多約束、多威脅三維空間路徑規劃時存在搜索速度慢、易陷入局部最優解、規劃路徑質量差的不足。為此，在使用數字高程模型（Digital Elevation Model， DEM）建模及構建多目標評價函數的基礎上，本文在標準GWO中引入復合混沌序列、準反向學習和精英狼凸透鏡反射學習策略，提出一種多策略改進灰狼優化算法（Multi-Strategy Improved Gray Wolf Optimization， MSIGWO）。同時，將MSIGWO與多種元啟發式算法進行對比實驗，結果表明所提算法能夠得到更優的UAV飛行路徑規劃。

1 三維路徑規劃模型

1.1 問題描述

本文考慮戰場環境下，多UAV協同執行多個地面目標的路徑規劃問題，設定各UAV在任務分配完畢后從指定基地起飛，穿過戰場中心區域前往敵方陣地目標點完成各自任務，任務區域內存在多處威脅源和山峰組成的禁飛區域，考慮UAV為躲避威脅源和隨地形起伏的飛行高度變化。

使用DEM完成三維空間環境建模，該模型由原始數字地形模型和等效威脅地形模型組成。原始數字地形模型如下：

h1（x， y）=sin（y+a）+b·sinx+

c·cos（d·x2+y2）+e·cosy+

f·sin（g·x2+y2）（1）

式中： x， y為水平面的投影坐標， h1（x， y）表示對應水平面投影坐標的高度； a， b， c， d， e， f， g為系數，通過調節系數值可以改變地形。

威脅地形等效模型如下：

h2（x， y）=∑ki=1h（i）·exp－x－xoixsi2－y－yoiysi2（2）

式中： x， y為水平面的投影坐標， h2（x， y）為x， y對應的山峰高度； h（i）表示山峰i的最高點高度； xoi， yoi為山峰i最高點對應的水平面投影坐標； xsi， ysi表示山峰i沿x軸和y軸坡度相關的變量，當高度確定時， xsi， ysi越小則山峰越陡峭。

將上面兩種地形結合，即可構建一個路徑規劃的基礎三維空間模型：

h（x， y）=max（h1（x， y）， h2（x， y））（3）

為合理簡化問題，聚焦研究目標，在三維空間環境建模中將UAV等效為一個質點。對于一條已規劃的路徑， UAV從起點開始經一系列路徑點后到達目標， Lkij={xkij， ykij， zkij}表示無人機Vi執行目標Tj的路徑點集合中的第k個路徑點的坐標。

1.2 約束條件及評價函數

為有效評判路徑規劃結果優劣，考慮UAV三維空間實際飛行場景和相關約束條件，本文三維路徑規劃評價函數由四部分組成：路徑長度代價、路徑威脅代價、路徑高度代價、路徑平滑代價。

（1）路徑長度代價。經過路徑規劃得到的UAV路徑距離越短，反映出UAV燃料消耗和飛行時長越少，因此將UAV路徑距離作為評價函數指標之一，表示為

F1（Pathij）=∑n-1k=1LkijL^{k + 1}ij（4）

式中： LkijL^k+1ij表示無人機Vi執行目標Tj中第k個路徑點和第k+1個路徑點間的歐氏距離； n表示無人機Vi執行目標Tj的路徑點總數。

（2）路徑威脅代價。考慮到實際飛行過程中， UAV因控制精度、定位誤差等因素導致實際路徑與規劃路徑間存在一定偏差，因此規劃出的路徑不僅要避開障礙物和威脅源，還應留有適當強制安全冗余距離。如圖1所示， Om為第m個威脅源的中心點； Rm為對應的威脅半徑； Z為強制安全冗余距離； E為脫離威脅距離； D^k+1k為路徑LkijL^k+1ij到威脅源的距離。當UAV位于威脅源的威脅半徑或強制安全冗余距離內時，即視為損毀；當UAV介于強制安全冗余距離之外和脫離威脅距離之內時，設定威脅代價與D^k+1k負相關；當UAV位于脫離威脅距離之外時，視為無威脅代價。路徑威脅代價表示如下：

F2（Pathij）=∑n－1k=1∑Mm=1Bk（LkijL^k+1ij）（5）

Bk（LkijL^k+1ij）=0， D^k+1kgt;Rm+Z+ERm+Z+E－D^k+1k， Zlt;D^k+1k－Rm≤Z+E∞， D^k+1k≤Rm+Z（6）

式中： Bk（LkijL^k+1ij）表示第k個路徑點和第k+1個路徑點間的威脅代價； M為任務區域內的威脅源總數。

（3）路徑高度代價。在作戰任務過程中， UAV飛行高度通常被限制在一定范圍之內，例如偵察任務中UAV不應超過相機指定分辨率最大高度，同時，為躲避地面輕武器并避免隨地形反復調整飛行高度， UAV不應低于設定最低高度。如圖2所示， Hmax和Hmin分別為最大高度和最低高度，則路徑高度代價如下：

F3Pathij=Hij－（Hmax+Hmin）2， Hmin≤Hij≤Hmax∞， else" （7）

（4）路徑平滑代價。由于UAV轉向和爬升時會增加機體控制難度、加速油量消耗，因此路徑規劃傾向于同

等情況下讓UAV飛行軌跡保持平穩。設定路徑平滑代價包括轉向代價和爬升代價，如圖3所示，轉向角度θij為兩個連續路徑段LkijL^k+1ij和L^k+1ijL^k+2ij在水平面投影的夾角； L^k+1^′ijL^k+2^′ij為UAV從第k+1個路徑點到第k+2個路徑點的路徑在水平面上投影； δij為UAV該段路徑的爬升角度。根據UAV性能約束，設定θij和δij分別不得超過最大轉向角θmax和最大爬升角δmax。

取Z為沿Z軸正向的單位向量，根據圖3所示，轉向角度θij可表示為

θkij=arctanL^k^′ijL^k+1^′ij·L^k+1^′ijL^k+2^′ijL^k+1^′ijL^k+2^′ij·L^k+1^′ijL^k+2^′ij（8）

爬升角度δij可表示為

δkij=arctanZ^k+1ij－ZkijL^k^′ijL^k+1^′ij（9）

路徑平滑代價可表示為

F4（Pathij）=ω1∑n－2k=1θkij+ω2∑n－1k=1δkij－δ^k^－1ij（10）

式中： ω1和ω2分別表示轉向代價和爬升代價的權重。

綜上所述，每架UAV的路徑規劃評價函數如下：

Fall（Pathij）=λ1·F1（Pathij）+λ2·F2（Pathij）+

λ3·F3（Pathij）+λ4·F4（Pathij）（11）

式中： λ1， λ2， λ3， λ4分別為路徑長度代價、路徑威脅代價、路徑高度代價、路徑平滑代價的權重。

2 MSIGWO算法設計

2.1 標準GWO

GWO的仿生原理為：在大自然中，灰狼群內部具有嚴密的等級制度，其中：最強壯的狼王α擁有絕對領導權；其次為β 狼，負責傳達狼王的命令；之后為δ狼，主要負責放哨、看護等事項；其余的狼為下層狼，負責接受上層狼的指揮領導。在GWO中，每只灰狼代表一個潛在解，在迭代過程中，上下層的狼會隨著各自的強壯程度（適應度值）進行競爭和替代。

模擬灰狼群的狩獵過程， GWO的主要內容可以分為四個部分：

（1）初始化階段。在該階段中，狼群個體隨機分布，通過計算各個灰狼的適應度值并按照由優到劣的順序排列，將前三的個體依次指定為α狼、 β狼和δ狼，其所處位置分別定義為Xα， Xβ和Xδ，其余個體統一定義為下層狼。

（2）包圍獵物。在狩獵時，將灰狼圍捕獵物的行為模擬為

X（t+1）=Xp（t）－A·D（12）

D=C·Xp（t）－X（t）（13）

式中： X（t+1）為更新后灰狼的位置； Xp（t）為當前獵物的位置； D為當前灰狼與獵物的距離； t為當前的迭代次數。系數A和C用于控制灰狼在搜索空間中的移動，其中， A決定灰狼是向獵物靠近還是遠離，當Agt;1時灰狼個體遠離獵物，為全局搜索階段，反之為局部搜索階段； C的作用是有助于增強算法的多樣性。系數A和C分別表示為

A=2a·r1－a（14）

a=2－2tT（15）

C=2r2（16）

式中： a為從2線性遞減至0的收斂因子； r1和r2為區間［0， 1］上的隨機變量。

（3）追捕獵物。在大自然中，灰狼群是通過狼王α的指示對獵物進行包圍、追捕和攻擊的。然而，在優化問題中，由于獵物（全局最優解）的位置是未知的，僅憑借狼王α的位置Xα是無法精準找到獵物的位置。因此，為了更多獲取獵物的位置信息，需要保留上一次迭代中上層狼的位置信息，用于下一次迭代時估計獵物位置，當迭代結束時，輸出狼王α的位置作為最優解的位置。灰狼個體的更新公式如下：

X（t+1）=（X1+X2+X3）3（17）

X1=Xα（t）－A1·Dα， Dα=|C1·Xα（t）－X（t）|（18）

X2=Xβ（t）－A2·Dβ， Dβ=|C2·Xβ（t）－X（t）|（19）

X3=Xδ（t）－A3·Dδ， Dδ=|C3·Xδ（t）－X（t）|（20）

式中： X1， X2， X3分別為灰狼個體受α狼、 β狼和δ狼影響移動的步長。

2.2 基于復合混沌序列和準反向學習的種群初始化

作為元啟發式算法， GWO初始分布對于算法優化求解速度和質量有很大影響，然而GWO在種群初始化階段使用的隨機策略有可能產生較為集中或者分散的初始灰狼群，這兩種情況都不利于算法求解。作為一種隨機性、敏感性和確定性的混合序列，混沌序列在保證隨機性的同時可避免種群中個體重復，因此常被應用于優化種群初始分布，然而大多數應用都只局限于引入簡單的混沌序列，但是由于不同的混沌序列存在不同的特性，如最常用的Logistic序列對初始值敏感，生成的隨機數在兩端分布較多，一定程度限制了混沌序列在改善初始種群分布時實際效果。基于上述分析，本文在MSIGWO初始化階段引入融合Logistic序列和Tent序列的復合混沌序列Logistic－Tent，數學表達式如下：

xi+1=

rxi（1－xi）+（4－r）xi2mod1， xilt;0.5， r∈（0， 4）

rxi（1－xi）+（4－r）（1－xi）2mod1， xi≥0.5， r∈（0， 4）" （21）

該混沌序列融合了Logistic序列的復雜混沌動力學特性和Tent序列更快的迭代速度。圖4為10 000次混沌值分布統計，相較于單一的Logistic序列， Logistic－Tent序列產生的隨機數在［0， 1］區間內分布更加均勻。

為更好地提升初始種群生成質量，本文在使用Logistic－Tent混沌序列的基礎上進一步引入準反向學習策略。準反向學習表示如下：

Xqo（t）=randLB+UB2， Xo（t）（22）

Xo（t）=LB+UB－X（t）（23）

式中： X（t）為當前解； Xo（t）為反向學習后的解； Xqo（t）為準反向學習解； LB和UB分別為解空間的下界和上界。如圖5所示，可看到準反向學習在反向學習基礎上做了進一步隨機化操作，相較于反向學習每次產生的映射為一個確定值，準反向學習產生的映射Xqo（t）在解空間上下界中間值和反向學習映射Xo（t）之間隨機分布。研究表明，在尋找全局最優解時，添加了隨機性的準反向解比反向解更加有效^［18^］。

2.3 基于精英狼凸透鏡反射學習的種群迭代

由算法原理可知，參數A對于協調GWO全局搜索和局部尋優的能力具有關鍵影響，其值與a相關聯，因參數A隨著迭代次數的增加而減小，所以伴隨迭代次數增大， GWO更多地由全局搜索逐漸轉變為局部尋優，由于灰狼群中的下層狼個體通過追尋上層α狼、 β狼和δ狼的位置實現對獵物的包圍，此時若上層α狼、 β狼和δ狼位于局部最優解附近，則很容易導致GWO陷入局部最優解。針對此問題，本文在迭代階段引入基于凸透鏡成像原理的精英狼反向學習策略。

假設在解空間中有高度h的個體P，其在X軸上的投影為XP，選擇（LB+UB）/2的位置為基點O并放置焦距為F的凸透鏡，個體P經凸透鏡得到一個高度h*的倒像P*，此時P*在X軸上的投影XP*即為反向個體，成像方式如圖6所示。

XP與其反向個體XP*間的關系如下：

（UB+LB）/2－XPXP*－（UB+LB）/2=η （24）

η=hh*（25）

式中： η作為伸縮因子，表示凸透鏡中物與像的比例對應關系。為提升MSIGWO在解空間中搜索的能力，將η設置為隨算法迭代非線性遞減，以使得MSIGWO的反向個體在迭代前期可以獲得較大的生成范圍，提高搜索能力；在迭代后期獲得較小的生成范圍，提高局部尋優能力。

η=ηmax－（ηmax－ηmin）·（t/tmax）2（26）

式中： ηmax和ηmin分別為最大伸縮因子和最小伸縮因子。

將式（24）進行變化可得反向個體XP*的表達式：

XP*=UB+LB2+UB+LB2η－XPη（27）

將式（27）推廣至D維搜索空間可得

XP*j=UjB+LjB2+UjB+LjB2η－Xjη（28）

由于GWO算法中的上層狼在算法收斂階段指引整個種群更新且為迭代中的歷史最優前三解，所以上層狼的更新機制是避免GWO陷入局部最優的關鍵。本文將 α狼、 β狼和δ狼定義為精英狼，在每次迭代過程中使用式（28）生成精英狼的反向個體，采用貪婪機制對上層狼進行擇優篩選替代。

2.4 MSIGWO算法流程

本文提出的基于MSIGWO的三維路徑規劃算法流程如圖7所示。

步驟1：導入地形數據，依據式（3）生成DEM數字地形圖，設定式（11）中評價函數的各參數值；

步驟2：使用Logistic－Tent混沌序列生成初始種群，在此基礎上生成準反向學習初始種群；計算每個個體的適應度值，使用貪婪機制完成初始種群擇優替代，確定α 狼、 β狼和δ狼；

步驟3：依據式（14）～（16）完成參數a， A以及C的更新；

步驟4：依據式（28）生成α狼、 β狼和δ狼的凸透鏡反向個體，使用貪婪機制完成上層狼的擇優替換；

步驟5：依據式（17）～（20）更新灰狼群位置，計算適應度并更新α狼、 β狼和δ狼；

步驟6：檢測是否滿足終止條件，若未滿足則返回步驟3，若滿足則轉到步驟7；

步驟7：輸出最優值，算法結束。

2.5 MSIGWO算法的時間復雜度分析

設定種群規模為N，問題維度為D，迭代次數為M。在標準的GWO算法中，假設完成初始化階段所需時間為T1；根據式（17），個體更新每一維位置所需時間為T2；根據式（11），個體求解適應度值所需時間為f（D）。則標準GWO的時間復雜度為

TGWO=O（T1+MN（DT2+f（D）））=O（D+f（D））（29）

在本文的MSIGWO算法中，假設初始化階段引入的Logistic－Tent復合混沌序列生成初始種群所需時間為T3，在此基礎上進行準反向學習所需時間為T4；迭代階段種群執行精英狼凸透鏡反射學習所需時間為T5，采用貪婪機制進行篩選的時間為T6。則MSIGWO的時間復雜度為

TMSIGWO=O（T3+T4+M（NDT2+T5+T6+Nf（D））=O（D+f（D））（30）

綜上，與標準GWO相比， MSIGWO并未增加額外的時間復雜度，算法執行效率未下降。

3 仿真實驗

3.1 仿真參數設置

設定使用3架UAV分別執行三個目標的作戰任務， UAV起點和目標的位置如表1所示，威脅源的設置如表2所示。原始數字地形模型中的參數a， b， c， d， e， f， g分別設置為1， 0.2， 1， 0.6， 0.1， 0.1， 0.1，同時為增加地形復雜度，將威脅地形等效模型中的山峰數目設置為10，每個山峰對應的xoi， yoi， xsi， ysi四項參數為隨機產生，評價函數中的參數λ1， λ2， λ3， λ4分別設置為5， 1， 10， 1。約束條件設置如表3所示，凸透鏡反向學習中的參數ηmax和ηmin分別設置為10和1。

為說明MSIGWO算法性能，在相同地圖下利用GWO算法、小龍蝦優化算法^［19^］（Crayfish Optimization Algorithm， COA）、蜘蛛蜂優化算法^［20^］（Spider Wasp Optimizer， SWO）、光譜優化算法^［21^］（Light Spectrum Optimizer， LSO）和本文改進MSIGWO算法進行三維路徑規劃仿真對比實驗，種群規模大小設置為100，最大迭代次數設置為500。

3.2 仿真結果及分析

圖8～12分別為MSIGWO， GWO， COA， SWO， LSO算法的仿真結果。

從圖8～12中的三維及二維路徑規劃圖可以看出，相關算法均給出了各自路徑規劃結果且所規劃路徑都避開了戰場中的山峰和威脅源。從總成本及成本分布圖可知，在各算法路徑規劃方案中， MSIGWO給出的路徑規劃總成本最低。一方面， MSIGWO規劃方案路徑長度最短，使得路徑成本大大降低；另一方面，其所規劃路徑有效減少了UAV飛行時的高度變化和轉向調整，降低了高度成本和平滑成本。在三維路徑規劃圖中也可直觀看到， MSIGWO的UAV規劃路徑最短且較為平滑。

由于元啟發式算法具有隨機性，為更好地說明算法性能，保證結果的可靠性，將各算法重復運行100次，各算法評價函數統計結果如表4所示。

從表4中可以看出， MSIGWO在100次統計結果中的最優值和平均值均優于其他對比算法，最差值僅比SWO稍高，排名第二。相較于GWO， MSIGWO的最優值、平均值、最差值三項指標分別提升了6.1%， 5.1%和13.3%，這一方面得益于MSIGWO初始階段采用的復合混沌和準反向學習策略生成的初始種群更加均勻，減少了全局搜索階段時的無效搜索；另一方面，最差值在三項指標中提升幅度最大，也表明MSIGWO采用的精英狼凸透鏡反射策略對上層狼位置的重點調整優化，有效避免了算法在迭代階段陷入局部最優解。

4 結" 論

本文針對多無人機三維路徑規劃開展研究。首先，使用DEM構建了三維空間模型，結合約束條件、任務需求構建了多目標評價函數；其次，分析了GWO的基本原理，介紹了MSIGWO在算法初始化階段和迭代階段采取的改進策略；最后，使用MSIGWO與四種啟發式算法進行對比實驗，在包含長度代價、威脅代價、高度代價和平滑代價的綜合評價函數重復實驗統計結果中， MSIGWO所得路徑規劃方案的最優值、平均值、最差值三項指標相較原算法分別提升了6.1%， 5.1%和13.3%，驗證了MSIGWO可有效應用于路徑規劃問題求解。為更好模擬戰場環境，在后續研究中可進一步考慮移動障礙物、天氣變化等各類復雜情況對多無人機路徑規劃問題求解帶來的不同影響。

參考文獻：

［1］ Ricardo J A， Giacomossi L， Trentin J A F S， et al. Cooperative Threat Engagement Using Drone Swarms［J］. IEEE Access， 2023， 11： 9529-9546.

［2］王洪斌，尹鵬衡，鄭維，等. 基于改進的A*算法與動態窗口法的移動機器人路徑規劃［J］. 機器人， 2020， 42（3）： 346-353.

Wang Hongbin， Yin Pengheng， Zheng Wei， et al. Mobile Robot Path Planning Based on Improved A* Algorithm and Dynamic Window Method［J］. Robot， 2020， 42（3）： 346-353. （in Chinese）

［3］余敏，羅建軍，王明明，等. 一種改進 RRT* 結合四次樣條的協調路徑規劃方法［J］. 力學學報， 2020， 52（4）： 1024-1034.

Yu Min， Luo Jianjun， Wang Mingming， et al. Coordinated Path Planning by Integrating Improved RRT* and Quartic Spline［J］. Chinese Journal of Theoretical and Applied Mechanics， 2020， 52（4）： 1024-1034. （in Chinese）

［4］陳明強，馮樹娟，李奇峰. 基于改進人工勢場的物流無人機三維航跡規劃［J］. 無線電工程， 2023， 53（10）： 2352-2359.

Chen Mingqiang， Feng Shujuan， Li Qifeng. Three-Dimensional Trajectory Planning of Logistics UAV Based on Improved Artificial Potential Field［J］. Radio Engineering， 2023， 53（10）： 2352-2359.（in Chinese）

［5］姜辰凱，李智，盤書寶，等. 基于改進Dijkstra算法的AGVs無碰撞路徑規劃［J］. 計算機科學， 2020， 47（8）： 272-277.

Jiang Chenkai， Li Zhi， Pan Shubao， et al. Collision-Free Path Planning of AGVs Based on Improved Dijkstra Algorithm［J］. Computer Science， 2020， 47（8）： 272-277. （in Chinese）

［6］趙玉花，石永康. 改進粒子群算法的多無人機航跡優化［J］. 電光與控制， 2023， 30（5）： 29-33.

Zhao Yuhua， Shi Yongkang. Improved Particle Swarm Optimization Algorithm for Multi-UAV Flight Path Planning［J］. Electronics Optics amp; Control， 2023， 30（5）： 29-33.（in Chinese）

［7］宋阿妮，包賢哲. 精英擴散蟻群優化算法求解運輸無人機三維路徑規劃［J］. 計算機工程與科學， 2021， 43（10）： 1891-1900.

Song Ani， Bao Xianzhe. An Elite Diffusion Ant Colony Optimization Algorithm for Solving 3D Path Planning of Transportation UAV［J］. Computer Engineering amp; Science， 2021， 43（10）： 1891-1900.（in Chinese）

［8］ Cao Y， Wei W Y， Bai Y， et al. Multi-Base Multi-UAV Cooperative Reconnaissance Path Planning with Genetic Algorithm［J］. Cluster Computing， 2019， 22（S3）： 5175-5184.

［9］ Xue J K， Shen B. A Novel Swarm Intelligence Optimization Approach： Sparrow Search Algorithm［J］. Systems Science amp; Control Engineering， 2020， 8（1）： 22-34.

［10］ Shao S K， Peng Y， He C L， et al. Efficient Path Planning for UAV Formation via Comprehensively Improved Particle Swarm Optimization［J］. ISA Transactions， 2020， 97： 415-430.

［11］ Ali Z A， Han Z G， Di Z R. Path Planning of Multiple UAVs Using MMACO and DE Algorithm in Dynamic Environment［J］. Measurement and Control， 2023， 56（3/4）： 459-469.

［12］鄧灝，唐希浪，蔡忠義，等. 基于改進遺傳算法的多無人機搜索航路規劃［J］. 電光與控制， 2024， 31（4）： 12-17.

Deng Hao， Tang Xilang， Cai Zhongyi， et al. Multi-UAV Search Route Planning Based on Improved Genetic Algorithm［J］. Electronics Optics amp; Control， 2024， 31（4）： 12-17.（in Chinese）

［13］王玲玲，孫磊，丁光平，等. 基于改進麻雀搜索算法的無人機航路規劃研究［J］. 彈箭與制導學報， 2022， 42（6）： 55-60.

Wang Lingling， Sun Lei， Ding Guangping， et al. Research on UAV Route Planning Based on Improved Sparrow Search Algorithm［J］. Journal of Projectiles， Rockets， Missiles and Guidance， 2022， 42（6）： 55-60.（in Chinese）

［14］劉聰. 改進的灰狼優化算法及其應用研究［D］. 哈爾濱：哈爾濱師范大學， 2023.

Liu Cong. Improved Grey Wolf Optimization Algorithm and Its Application Research［D］.Harbin： Harbin Normal University， 2023. （in Chinese）

［15］余飛. 基于群智優化算法的頻譜感知和頻譜分配研究［D］. 南京：南京郵電大學， 2023.

Yu Fei. Research on Spectrum Sensing and Spectrum Allocation Based on Swarm Intelligence Optimization Algorithm［D］.Nanjing： Nanjing University of Posts and Telecommunications， 2023. （in Chinese）

［16］崔慶. 基于多目標灰狼算法的園區微電網綜合能源優化調度［J］. 電腦知識與技術， 2024， 20（4）： 16-18.

Cui Qing. Comprehensive Energy Optimization and Scheduling of Park Microgrid Based on Multi-Objective Grey Wolf Algorithm［J］. Computer Knowledge and Technology， 2024， 20（4）： 16-18.（in Chinese）

［17］穆曉霞，鄭李婧. 基于F-score和二進制灰狼優化的腫瘤基因選擇方法［J］. 南京師大學報：自然科學版， 2024， 47（1）： 111-120.

Mu Xiaoxia， Zheng Lijing. Tumor Gene Selection Based on F-score and Binary Grey Wolf Optimization［J］. Journal of Nanjing Normal University： Natural Science Edition， 2024， 47（1）： 111-120.（in Chinese）

［18］ Tizhoosh H R. Opposition-Based Learning： A New Scheme for Machine Intelligence［C］∥International Conference on Computational Intelligence for Modelling， Control and Automation and International Conference on Intelligent Agents， Web Technologies and Internet Commerce （CIMCA-IAWTIC'06）， 2005： 695-701.

［19］ Jia H M， Rao H H， Wen C S， et al. Crayfish Optimization Algorithm［J］. Artificial Intelligence Review， 2023， 56（S2）： 1919-1979.

［20］ Abdel-Basset M， Mohamed R， Jameel M， et al. Spider Wasp Optimizer： A Novel Meta-Heuristic Optimization Algorithm［J］. Artificial Intelligence Review， 2023， 56（10）： 11675-11738.

［21］ Abdel-Basset M， Mohamed R， Sallam K M， et al. Light Spectrum Optimizer： A Novel Physics-Inspired Metaheuristic Optimization Algorithm［J］. Mathematics， 2022， 10（19）： 3466.

Multi-Drone 3D Path Planning Based on Multi-Strategy

Improved Grey Wolf Algorithm

Xu Ziliang^{1， 2}， Hu Tao^1*， Liu Kaiyue1， An Lening1， Yang Siwei1

（1. University of Information Engineering， Zhengzhou 450000， China; 2. Unit 66389 of PLA， Zhengzhou 450000， China）

Abstract： Multiple UAV three-dimensional path planning aims to provide reasonable and feasible flight paths for each UAV to its target while satisfying constraints and avoiding threats. Addressing the issues of slow search speed and poor path quality of current metaheuristic algorithms in solving multi-constraint and multi-threat three-dimensional spatial path planning， a path planning method based on a multi-strategy improved grey wolf optimization algorithm is proposed. Digital elevation models are used to complete three-dimensional spatial environment modeling， and a comprehensive evaluation function incorporating factors such as length， threat， height， and smoothness is established based on the flight scenario. By optimizing the initial population using a composite chaotic sequence and quasi-reverse learning strategy， and considering the crucial impact of upper-level wolves on population convergence in iterative stages， the algorithm’s ability to avoid local optima is enhanced using the elite wolf convex lens reflection learning strategy. Simulation experiments show that the multi-strategy improved grey wolf optimization algorithm improves the optimal， average， and worst values of the comprehensive evaluation function statistics by 6.1%， 5.1%， and 13.3%， respectively， compared to the original algorithm. This validates the effectiveness of the proposed method in solving multi-constraint and multi-threat three-dimensional spatial path planning problems.

Key words：" multiple UAVs; three-dimensional path planning; grey wolf optimization algorithm; composite chaotic sequence; quasi-reverse learning; elite wolf convex lens reflection learning

航空兵器2024年6期

航空兵器的其它文章: 暴雨條件下低速飛行器氣動特性數值計算; 一種基于高精度數學地平的慣性/天文組合導航方案; 聯合LeNet和知識圖譜的鏈路建立行為識別方法; 基于傳感器攻擊的領導跟隨多旋翼蜂群驅離方法; 基于箔條彈掩護的察打一體無人機質心干擾策略; 基于任務評估反饋的異構無人機動態任務分配