張嘉玲 姜永超 李博宸 王成罡 宋 磊 黃 丹
由于水雷具有隱蔽性強、易布難除、效費比高等特點[1],反水雷任務當前面臨風險高、效率低、作業復雜等挑戰.在未來海戰中,為了保證作戰行動不被水雷威脅影響而貽誤戰機,快速性成為了反水雷作戰的第一要訣[2].與傳統大型獵掃雷艦艇相比,無人反水雷裝備具有零傷亡、機動強和成本低等諸多優勢[3],例如,探雷無人機快速掃描雷區并生成較清晰的水雷分布、滅雷無人艇搭載大型滅雷設備執行獵掃雷任務等.為充分發揮無人機、無人艇等海空異構裝備的能力優勢,有必要優化設計空海協同反水雷方案,完成對雷區的偵察和覆蓋,從而實現高效水雷清掃.
未來的無人反水雷作戰可為如下形式: 數艘無人機對重點水域進行偵察,獲取情報信息并回傳給指揮中心.結合回傳信息,指揮中心對潛在雷區進行識別,并派遣無人艇編組深入敵方雷區,應用滅雷具和前置式獵雷系統等武器進行滅雷作業.以上作戰樣式中,提升反水雷效率的關鍵是結合異構裝備能力屬性,合理對海空無人編組進行規劃部署,解決以快速性為主要指標的多智能體覆蓋問題.現有研究一般通過設計覆蓋成本函數劃分給定區域,并進行軌跡規劃驅動智能體至最優位置.CORTES 等首次在覆蓋問題中使用維諾分區法[4],并證明每個維諾單元的質心為最優傳感位置.在此基礎上,大量學者針對影響覆蓋控制的各種因素,如覆蓋區域特征[5]、智能體動力學模型[6]及特定任務需求[7-8]等展開研究.為充分發揮異構裝備能力優勢,如無人機的機動能力、無人艇的搭載能力等,有必要進一步研究異構多智能體的覆蓋問題.針對異構智能體覆蓋問題的研究考慮了智能體動力學[9-10]、能耗[11]、傳感能力[12-13]等屬性.此類研究根據異構智能體的性能差異,調整覆蓋成本中的代價函數及覆蓋的分區方式,以滿足不同任務需求.在反水雷任務中,提升掃滅雷效率是制勝的關鍵.因此,無人裝備的機動能力成為影響覆蓋規劃算法設計的關鍵因素.文獻[14-15]在算法的設計中考慮了智能體的個體能力差異,通過加法加權維諾圖調整各分區邊界,使智能體的主導區域大小與其能力屬性正相關,但文獻[15]中針對智能體編隊異構性的研究,集中在無人機與無人船的續航能力、靈活性、探測準確度等性能差異上,未能充分發揮編組內智能體的速度優勢進而提升覆蓋效率.面向反水雷任務,覆蓋問題中的智能體主導區域對應每艘無人艇被分配的滅雷區域,為了保證該過程的快速性,將無人艇的機動能力作為主導區域劃分的主要依據,提出了速度乘法加權維諾分區法,從而適配反水雷任務需求.
無人艇編組執行獵掃雷任務的前提是初步獲得水雷分布,該分布在覆蓋問題中對應區域內關鍵信息的密度函數.現有研究一般通過高斯估計[16]、貝葉斯估計[17]等算法,預測目標區域內的密度函數,從而實現環境信息建模.但以上算法難以平衡估計準確性、計算復雜度及估計時間等要素[18],無法直接應用于雷區偵察過程中的水雷分布估計.高斯過程回歸(GPR)算法是一種非參數貝葉斯機器學習方法,該方法能夠在考慮觀測噪聲的前提下,利用部分采樣數據預測未知函數,在多智能體覆蓋問題研究中有廣泛應用,現已被應用于規劃最大信息路徑、精準重構環境模型等任務[19],其中,文獻[20]依據GPR 算法的方差特性對高精度環境密度函數進行預測,為最優區域覆蓋提供了支撐.應用高斯過程回歸算法,根據無人機編組在偵察過程中獲取的采樣數據估計水雷分布密度函數,為無人艇編組的滅雷任務提供關鍵態勢信息.
結合以上分析,主要工作如下: 1)提出了一種海空協同反水雷策略,該策略中無人機編組用于快速掃描雷區,應用高斯過程回歸處理采樣數據,從而生成水雷分布.2)提出了基于速度差異乘法加權的最優覆蓋規劃算法,依據水雷分布進行雷區劃分,結合無人艇異構特性,以速度為權重設計代價函數,最優化雷區劃分方式.在欠驅動運動學模型約束下,設計軌跡跟蹤算法引導無人艇進行雷區覆蓋.3)在相同水雷分布場景下,仿真部分設置6 艘初始位置不同的無人艇對雷區進行覆蓋,并與傳統算法的覆蓋時間進行比較,驗證了所提出算法在提升反水雷效率方面的有效性.
結合典型無人反水雷作戰場景,提出基于無人機、艇協同的時間最優覆蓋規劃問題,并介紹解決該問題使用的高斯過程回歸及維諾分割算法.
圖1 所示的典型海空協同反水雷場景中,含潛在雷區的海域可用凸區域表示.由n 艘無人艇和m 架無人機構成作戰編組協同執行水雷清掃任務.假設潛在雷區有界,且水雷分布不會出現驟變,可用連續有界的密度函數來描述水雷分布情況,表示目標區域內任意點q 水雷出現的概率.

圖1 海空協同反水雷場景Fig.1 Sea-air coordination anti-mine scene

圖2 標準維諾圖Fig.2 Standard voronoi diagram
根據任務需求,無人機編組利用自身裝載的電磁探雷設備,根據給定路徑探測潛在埋雷區域.母船利用無人機編組收集到的疑似目標位置,結合信號強度評估D 內水雷概率密度分布.母船可將水雷分布信息共享至位置向量為的無人艇編組,并規劃其掃雷部署方案.
考慮無人艇編組的異構特性,其覆蓋效果可通過成本函數定量描述.根據覆蓋控制的任務目標、覆蓋過程中的約束以及密度函數,可定義成本函數如下:

表1 符號列表Table 1 Symbol list
介紹與無人艇編組在海上雷區覆蓋規劃與控制相關的基礎知識,具體包含GPR 和維諾分割兩類工具,分別用于估計水雷分布密度及目標雷區分割.
1.2.1 高斯過程回歸
環境的密度函數用于描述目標區域內某些固有屬性,如溫度、水雷分布等.這些信息在有限區域內一般不會出現驟變、無界等現象.因此,假設水雷分布密度函數在目標區域內有界連續,可用高斯過程回歸對其進行估計并生成水雷分布圖,以此作為雷區覆蓋的依據.將高斯過程的先驗表示為:
在高斯過程中,可以利用核函數生成相關系數矩陣來衡量任意兩點間的距離.所以,核函數決定了高斯過程的性質.高斯核函數是最常用的核函數之一,也被稱為徑向基函數(radial basis function,RBF),其基本形式如下:
1.2.2 維諾區域分割法
具體介紹水雷分布密度函數未知情況下的時間最優覆蓋規劃與控制方法.不同于傳統的維諾圖分割,考慮了不同無人艇的速度差異,并據此調整其對潛在雷區的主導區域,使無人艇到達區域內任意潛在滅雷位置的時間最短.
所提出的海空協同反水雷覆蓋算法流程如圖3所示,假設存在一艘母船作為指揮中心,m 架無人機根據預先規劃的路徑對海面上的目標區域D 進行偵察.偵察結束后,無人機將所得水雷分布信息共享,使用高斯過程回歸估計水雷分布,并以此為依據,規劃待命無人艇的部署方案.

圖3 海空協同時間最優覆蓋算法流程圖Fig.3 Flowchart of the time-optimal coverage algorithm in sea-air coordination

圖4 無人艇坐標示意圖Fig.4 Schematic diagram of unmanned ship vessel(USV)coordinates
結合無人艇的初始位置及速度,母船對待覆蓋區域進行加權維諾分割.在規劃過程中,無人艇結合設計的以時間為代價的全局成本函數梯度值,來判斷當下的覆蓋進程.若無人艇編組未到達最優位置,則迭代前述過程,直至每艘無人艇都移動至其主導區域的質心處.
假設點q 為凸區域D 內的隨機目標點.考慮到無人艇編組內部不同個體的最大速度差異,僅依據距離進行覆蓋區域的劃分并不能保證無人艇滅雷過程的快速性.因為提升滅雷效率的關鍵在于使隨機點q 被響應的時間最短.因此,為充分發揮無人艇的機動能力,速度快的無人艇應該負責監控更大的區域,從而提高整體滅雷效率.定義第i 艘無人艇運動到主導區域內任意點的時間是則在維諾分區的定義中,引入時間最優的邊界條件:
一般情況下,無人艇編組在目標區域的分布相對稀疏,因此,第i 艘無人艇在單位時間內可以到達的區域可用其最大速度vi近似:
前文提到,覆蓋效果的提升可以依靠降低其成本函數來實現.除了上述優化分區外,還需對成本函數中的位置代價函數進行最小化求解:
根據乘法加權的維諾分區法,在獲取雷區的概率密度分布后,對目標區域的最優覆蓋應以每個無人艇到達其主導區域內任意位置的時間是否最短來衡量.因此,在成本函數中考慮無人艇最大速度的差異,選用時間成本來代替位置成本,則有:
為了滿足無人艇最優覆蓋潛在雷區的目的,需要使用梯度下降法最小化式(9)中的時間成本.
其梯度表達式可以簡化為:
別是第i 艘無人艇加權乘法維諾區域的質量和質心.假設無人艇的單體積分動力學第i 艘無人艇基于時間代價的梯度下降控制器為:
為了方便后續的計算,在保證無人艇最大速度約束的情況下,對以上控制器進行簡化.式(11)中的控制器乘以增益則有:
以往關于覆蓋問題的研究一般假設被控對象在向目標點移動的過程中,可以產生任意方向的瞬時初速度.然而無人艇是一個欠驅動系統,難以產生橫向側移,進一步引入無人艇欠驅動運動模型,探究其對于作戰編組整體覆蓋效果的影響.
第i 艘無人艇運動學方程為:
為了求解跟蹤誤差,定義如下誤差方程:
通過仿真示例驗證所提出的算法對水雷分布的估計精度以及對雷區的覆蓋效果.仿真軟件為MATLAB 2019b,仿真平臺的處理器為Intel core i9,內存16 GB.具體實驗設置如下: 在坐標范圍的區域內,隨機分布4 枚水雷.設置6 艘待執行覆蓋任務的無人艇初始位置坐標如下:
所有無人艇除速度外其余配置相同,假設無人艇的最小速度為單位速度,則無人艇編組的最大速度可表示為此外,線速度和角速度的控制器增益
圖5 為水雷分布圖,其中,圖5(a)為設置的水雷分布參考值.圖中的顏色和高度漸變表示著水雷存在概率的變化,水雷出現概率和豎直方向高度成正比.

圖5 水雷分布圖Fig.5 Mine distribution map
假設無人機探測到的水雷分布如下:
圖5(b)為無人機將采樣數據通過高斯過程回歸算法建立的水雷分布圖.圖5(c)為GPR 估計誤差分布,其中,估計誤差最大值處,與真實值的差距僅為3.5%.因此,GPR 算法能根據采樣數據對水雷分布密度進行高精度離線估計.
在第2.3 節和第2.4 節中,分別推導了對潛在雷區考慮無人艇速度差異性的覆蓋,并引入了欠驅動運動學模型約束下的無人艇覆蓋控制器.為了證明該算法的有效性,設計了包含6 艘無人艇的滅雷編組在兩種不同覆蓋場景下的實驗.
為驗證所提出算法的有效性,對比了3 種覆蓋算法在速度差異無人船編組的應用性能.如圖6 所示,無人艇編組以相同初始位置形成3 種不同的覆蓋構型及運動路徑.圖6 中,顏色漸變的部分為3.1節GPR 算法估計的水雷分布密度.圖6(a)中,無人艇采用標準維諾分區進行區域覆蓋.圖6(b)中,以速度為權重的雷區分割算法充分利用了無人艇編組的機動性,無人艇的運動路徑也更加平滑.速度較快的無人艇3 所覆蓋的區域顯著大于速度較慢的無人艇1.在圖6(b)的基礎上,圖6(c)進一步考慮了無人艇欠驅動運動學模型的約束.相比于圖6(b)中運用全驅動運動學模型的軌跡,圖6(c)的無人艇運動軌跡存在轉彎半徑,更加契合實際應用場景.

圖6 無人艇覆蓋結果圖Fig.6 Coverage results of unmanned surface vessels
為驗證所提出算法在滅雷效率方面的優勢,對不同覆蓋方法所需時間進行統計.假設P 為水雷出現概率閾值,P 值越大說明此區域內水雷存在的概率越高.無人艇覆蓋目標為到達p>P 區域內的目標點.在給定區域內生成一定數量的目標點,計算無人艇從質心位置到達這些目標點的平均時間,結果如圖7所示.

圖7 覆蓋時間對比圖Fig.7 Comparison chart of coverage time
由圖7 可知,隨著P 值的增大,兩種覆蓋方法下無人艇到達目標點所需的時間整體上都呈下降趨勢.由表2 可知,所提出的時間最優覆蓋方法平均所需時間顯著低于標準覆蓋方法,說明該方法能夠充分利用無人艇編組的機動能力.此外,圖7 中的藍色曲線反映了時間最優覆蓋相比標準覆蓋的效率提升百分比.可見隨著P 值的增大,所提出方法的覆蓋效率提升效果也更明顯.
面向無人化反水雷的任務需求,提出了一種基于速度差異乘法加權的最優覆蓋規劃算法,利用高斯過程回歸進行水雷分布估計,在考慮無人艇編組的機動能力差異以及欠驅動特性的基礎上,設計速度乘法加權的時間最優覆蓋策略.仿真結果表明,所提方法在探雷階段可以較小估計誤差生成水雷分布態勢;在滅雷階段,通過時間最優覆蓋配置,無人艇可以在概率意義上最快訪問區域內任意水雷位置.相比于傳統覆蓋策略,所提出的方法充分發揮了異構裝備的機動能力,使滅雷效率大幅提升,可為未來的無人反水雷作戰提供策略支持.