








摘要:本文圍繞洪澇災害被困群眾快速搜索救援需求,針對傳統無人機覆蓋式搜索效率低、對移動目標搜索存在較大漏檢概率等問題,提出了基于多無人機的智能協同搜索方法,借助多無人機間的信息共享機制,實現快速準確地發現分散在不同位置的被困人員。
關鍵詞:洪澇;多無人機;協同搜索
引言
2021年的河南省鄭州市和2023年的河北省涿州市發生嚴重洪澇災害,在救援過程中,全國共有四十多支無人機隊伍參與了救援行動,包括搜尋被困人員、應急通信、照明、救生物資投放等,無人機在洪災救援過程中表現出了良好的應用前景。洪水災害發生后,對被困人員營救時間要求比較高,借助無人機高空開闊的視野,如何快速準確地發現被困在洪水中、屋頂、橋梁等位置的人員是能否成功實施營救的必要前提。
一、傳統無人機搜救策略存在的問題
當前,無人機在洪災救援中的應用仍存在依賴人工操作引導、單架無人機容易受到各種限制等問題,智能化救援程度相差甚遠。本文提出利用多無人機信息共享,運用分布式決策規劃各自搜索路徑,實現多架無人機對固定區域的精準回訪式搜索,能夠及時準確地發現被困人員。傳統的區域搜索策略多是行為式、編隊式的,基于某種設定好的行為,如“蛇形”“8字形”“回字形”(圖1),優化無人機初始位置、飛行方向和飛行時長,以實現對搜索區域的最大化覆蓋。傳統的區域搜索策略雖易于設計和執行,但存在著搜索效率低下、路徑固定易于攔截、缺少回訪機制,對于變化的環境適應性差[1]。
在為多無人機協同航路規劃選擇合適的規劃算法前,需要根據任務需求和特點,構建合適的環境模型。環境模型依據任務目標,可以進行多種設計,有傾向于航路規劃的人工勢場法,也有傾向于區域劃分的Voronoi圖法,還有易于與算法結合、泛用性更強的柵格法(圖2)。環境模型的構建是進行區域目標搜索的基礎,是設計路徑規劃算法的重要依據,本文采用了柵格法。
二、問題描述與數學模型
某市發生洪澇災害,某救援分隊負責對2000m×2000m范圍內的若干被困人員實施搜救,被困人員位置未知,部分落水人員會隨著水流緩慢移動。為了快速實現救援,現有5架偵察型無人機升空負責對人員實施搜索。無人機發現目標即認為該被困人員獲救,而該無人機可繼續執行搜索任務。本文研究目標為如何實時改變無人機的搜索路線,實現高效目標搜索。該問題的數學模型描述如下。
(一)搜索環境模型
為了簡化環境地圖,將任務區域進行柵格化。任務區域被劃分成M*N的離散網格地圖,dx與dy取無人機以平均平飛速度在一個采樣時間內的飛行距離(圖3)。
(二)無人機動作集
為了優化模型,假設無人機在搜索區域上空進行等高飛行,并將無人機簡化為二維空間內的帶航向角的質點。為了簡化空間,無人機受動力學約束每次可選擇左轉45度,右轉45度,并移動到鄰近的三個網格中心里。這保證了無人機航跡的可實現性(圖4)。
(三)搜索環境感知地圖模型
本項目采用目標存在概率地圖、不確定性地圖描述任務環境。目標存在概率地圖p(x,y,t)表示目標在柵格內存在的概率值。不確定性地圖η(x,y,t)描述了柵格內信息的不確定性。
1.目標存在概率地圖
利用先驗情報信息,使用高斯正態分布函數來構造目標存在概率,其中目標可能出現的位置為高斯分布峰值中心,初始時刻目標概率分布為:
p(x,y,0)=0.5+0.5×∑Nn=1Cn×e[-(x-xnta)2+(y-ynta)2]v2n]
式中,vn為目標概率峰值寬度;cn為目標存在概率峰值;(xta,yta)為目標可能出現的位置。目標存在概率地圖的探測更新過程實質上是無人機i在已知k-1時刻的柵格c的目標概率值pi,c,k-1的基礎上,再根據k時刻無人機i對于柵格c的探測結果Zi,c,k,來重新更新柵格c在k時刻的目標存在概率pi,c,k。依據貝葉斯原理來確定目標存在概率地圖的更新公式
Pi,c,k=p(Zi,c,k|δc,k=1)pi,c,k-1p(Zi,c,k|δc,k=1)pi,c,k-1+p(Zi,ck|δc,k=0)(1-pi,c,k-1)=
pdPi,c,k-1pdpi,c,k-1+pf(1-pi,c,k),c∈i,c,k,Zi,c,k=1
(1-pd)pi,c,k-1(1-pd)pi,c,k-1+(1-pf)(1-pi,c,k),c∈i,k,Zi,ck=0
Pi,c,k-1,ci,k
式中,i,k表示無人機i在k時刻的探測區域[2]。
2.不確定性地圖
在無人機未對柵格進行檢測時,無人機對于柵格內是否存在目標是不能確定的。網格c的不確定度為ηi,c,k∈[0,1],它描述了在k時刻無人機i對網格c的不確定程度。無人機對于網格c的不確定性的初始值為1,每次訪問網格的不確定性縮減一半。隨著訪問次數的增多,不確定性逐漸降低。
三、多無人機智能協同搜索算法
無人機根據環境信息和自身狀態,實時調整自身航向。多無人機協同搜索不僅要在盡量短的時間對整個區域進行覆蓋搜索,而且要盡快對疑似目標進行確認,進行精準搜索。
(一)搜索問題等效滾動時域決策問題建模
分布式滾動時域決策方法由無人機各自處理檢測區域信息,并通過通信網絡進行通信,交換環境信息,得到各自系統的最優決策。使用分布式結構,增強系統的魯棒性。當一架無人機發生故障時,不影響其他無人機系統的決策運動。
無人機協同搜索決策過程中,主要考慮以下三個方面:盡可能前往目標存在概率值較大的地方;盡可能前往不確定性較高的地方;盡可能耗費較少的飛行代價。根據要求,設計出3個決策項,引導無人機進行決策,搜索移動目標。
J=w1JA+w2JB-w3Jc
式中,w1,w2,w3為各個子目標的權重系數,調整子目標的權重系數,提高無人機搜索效率。目標搜索收益是指無人機在搜索過程中,所檢測柵格的目標存在概率值之和,引導無人機前往目標存在概率值較大的區域。
JA=∑Ni=1∑x,y∈Rnαi*(1-δ(x,y,t))p(x,y,t)
式中,JA表示無人機i在N個預測時域中,航跡經過所有柵格目標存在概率值之和;∈[0,1],表示衰減因子,衰減因子越大,表示我們對于未來的收益越看重;Rn表示無人機的探測范圍;p(x,y,t)表示無人機在(x,y)所在柵格的目標存在概率值;(x,y,t)為無人機是否認為該柵格存在目標,當目標所處柵格概率值大于p_max時,則認為移動目標被無人機鎖定,定義為:
δ(x,y,t)=1,p(x,y,t)>p_max0,其它
不確定值收益是指無人機在搜索過程中,所檢測柵格的不確定值之和,引導無人機前往不確定值較大的地方,以降低柵格的不確定值。
JB=∑Ni=1∑(x,y)∈Rni|ηi,c,k+1|
式中,JB表示無人機i在N個預測時域中,航跡經過所有的柵格的不確定值之和;ηi,c,k是指無人機i在k時刻探測區域柵格c的不確定值;Rni。
飛行收益是指無人機在飛行過程中所花費的飛行代價。無人機直飛的飛行代價小于轉彎的飛行代價,飛行代價定義為:
Jc=∑N-1i=1|Wi,c,k-Wi,c,k+1|
式中,Jc表示無人機在N個預測時域中,航向角變化值的絕對值之和;Wi,c,k表示無人機i在k時刻探測區域柵格c的航向角,從式中可知,無人機飛行過程中轉彎越多,飛行代價越高。
(二)協同進化遺傳算法
對無人機航向角進行編碼,左轉45度編碼為+1,直行編碼為0,右轉45度變為-1。可以使用[-1,0,1]組合成的序列表示無人機航向角的轉變,進而產生不同的路徑。例如,ф1=[-1,1,-1,……,0],ф2=[1,1,-1……,0]…為無人機初始種群航向角即初始染色體,本項目取目標函數J為適應度函數[3]。
四、仿真結果與分析
(一)仿真環境與參數設置
本實驗的仿真硬件環境為Intel(R)Core(TM)i7-10750HCPUPC機,編程環境Matlab2016b。假定無人機在2000m×2000m的正方形區域內進行協同搜索工作,如表1、表2所示。
在2000m×2000m的正方形區域內隨機生成5個移動人員的先驗位置,再對每個目標先驗位置以一定的方差生成移動車輛的真實位置。目標的參數約束如表3所示。
(二)覆蓋式搜索算法展示
無人機動力學參數和區域參數設置同上,若單次覆蓋仍有移動目標未被搜索到,無人機群會在完成單次覆蓋搜索后沿原路折返。其航跡計算如圖5所示,搜索效果如圖6所示。
(三)分布式協同搜索算法與覆蓋式搜索方法效率對比
本實驗使用輪盤賭法進行染色體的篩選,遺傳算法參數如下表4所示。
設置對比實驗,該組對比實驗分別為加入遺傳算法的無人機搜索策略和傳統覆蓋式的無人機搜索策略,進行50次蒙特卡羅仿真,每次仿真的兩組策略搜索的目標位置保持一致。設定實驗目標組中共包含五個需搜索的目標,進行50次仿真實驗并計算平均一組目標中的五個目標依次被發現時的時間大小[4]。由圖7可以看出覆蓋式搜索相比于分布式協同搜索算法發現目標所耗時間更長。
結語
本文針對無人機在未知區域對移動目標的協同搜索問題,提出了一種基于先驗信息的進化遺傳算法的多無人機協同搜索方法。結果顯示,相比于傳統覆蓋式搜索方式,無人機的搜索效率有很大改進,有效提升了多無人機協同搜索效率和質量,證明了該方法具有良好的目標搜索能力。
參考文獻
[1]邢冬靜.無人機集群作戰自主任務規劃方法研究[D].南京航空航天大學,2019.
[2]陳仔榮.無人機避障突防與協同搜索一體化規劃方法研究[D].國防科技大學,2017.
[3]楊春寧,杜黎明,李春.未知區域無人機協同搜索方法及效率分析[J].航空科學技術,2019(10):56-63.
[4]王自亮.基于隨機目標的多無人機協同搜索方法研究[D].廈門大學,2019.
作者簡介:張嘉祥(1986— ),男,漢族,河北石家莊人,研究生,研究方向:滅火救援。