王中, 溫志文, 蔡衛軍, 王佩
(1.中國船舶集團公司 第705研究所, 陜西 西安 710077; 2.西北工業大學 航天學院, 陜西 西安 710072)
隨著魚雷精確制導技術的日益發展,潛艇的防御能力面臨更加嚴峻的挑戰。主動防御手段已經成為潛艇防御的主要方式之一。潛艇發現來襲重型魚雷后發射反魚雷魚雷(anti-torpedo torpedo,ATT)實施攔截,同時采用機動規避策略進一步增大來襲重型魚雷的追蹤難度。這種攻防模式不同于以往雷艇之間的兩方對抗模式,變為三方相互追蹤-規避博弈模式。為了應對這種對抗模式,為ATT和潛艇設計可行的攔截制導律和規避策略迫在眉睫。三方攻防博弈場景涉及潛艇、ATT和來襲魚雷。
李博文[1]以機動目標攔截為背景,采用矩陣對策博弈理論設計了攔截-規避兩方博弈模式下的制導律。朱雅萌等[2]采用強化學習算法設計了機動博弈制導律提高飛行器的突防能力。蘇山等[3]針對二對一攔截問題基于微分對策理論設計了協同對抗博弈制導律。Talebi等[4]針對多攔一的反導突防博弈場景,設計了3種不同的攔截博弈策略。Faruqi[5]針對導彈三方追逃博弈問題進行了研究,設計了基于最優控制理論的三方制導律。Singh等[6]在研究目標-攻擊者-防御者的三方博弈問題時,采用微分對策理論來設計博弈制導律。Garcia等[7]將兩方攔截問題轉化為兩方零和博弈問題,基于模糊評估設計在線任務規劃的方法實現納什均衡問題的求解。
反魚雷魚雷作為一種新型的“硬殺傷”武器,逐漸成為水下攻防的研究重點之一。李宗吉等[8]采用變結構控制方法設計了縱向攔截導引律。Ye等[9]設計了基于變結構控制的反魚雷制導律。葉慧娟等[10]設計了雙滑??刂破?提高了命中精度和制導魯棒性。張銳等[11]設計了變指令周期最優滑模導引律,提高了攔截性能。孫振新等[12]建立了4種攔截模型,設計了不同距離下反魚雷魚雷的攔截策略。Wu等[13]建立了一個預先評估電磁發射反魚雷魚雷捕獲概率的分析模型。從上述反魚雷魚雷制導研究現狀可以看出,目前主動防御研究主要集中在反魚雷魚雷對目標魚雷的攔截導引律研究,尚未從潛艇、反魚雷魚雷、來襲魚雷三方攻防的角度開展博弈制導在水下攻防策略方面的應用研究。當前博弈制導研究主要集中在反導突防作戰領域,由于反導攔截場景中攔截彈采取預測碰撞攔截方式,攔截彈速度小于目標速度,目標受彈道形式影響機動能力有限,這些與水下攻防場景中潛艇、反魚雷魚雷、來襲魚雷的彈道、速度特性、機動特性相差較大,因此有必要開展水下攻防博弈策略研究。
本文以水下三方博弈對抗為背景,建立三方攻防的運動學模型,在考慮三方機動性能約束的條件下設計潛艇規避策略、ATT制導律,實現規避來襲魚雷并主動攔截來襲魚雷的防御模式。
三方攻防博弈問題可以看作2個兩方追逃問題,分別是來襲魚雷和潛艇的兩方追逃問題及ATT和來襲魚雷的兩方追逃問題。因此,首先針對兩方博弈問題建立運動建模。
首先在慣性坐標系中建立任意航行器的運動學方程為:
(1)
式中,變量為時間t的函數,xi,yi,zi分別為航行器i在慣性系中的位置;ui,vi,wi分別為航行器i在慣性系x方向,y方向,z方向的速度;axi,ayi,azi為航行器i在慣性系x方向,y方向,z方向的加速度。
考慮航行器之間的相對狀態,其相對運動可描述為
(2)
式中:xij,yij,zij分別為航行器i相對于航行器j在慣性系中x方向、y方向、z方向的相對位置;uij,vij,wij分別為航行器i相對于航行器j在慣性系中x方向、y方向、z方向相對速度;axij,ayij,azij分別為航行器i相對于航行器j在慣性系中x方向、y方向、z方向的相對加速度。
為方便使用最優控制理論進行研究,將上述建立的運動模型用矩陣的形式進行描述

(3)

同樣,可以把相對運動方程描述為

(4)

將兩者合起來,可以統一描述為
(5)

逃逸方實施規避通過改變Aj來實現,追蹤方實施攔截,通過Ai來實現。
一般非合作兩方博弈優化問題的性能指標函數如下

(6)
希望找出u1,u2,使得以下問題最優
(7)
對于兩方追逃問題來說,追蹤者希望找到最優控制u1在最小化末端脫靶量的同時盡可能減少能量消耗,而逃避者希望找到最優控制輸入u2最大化末端脫靶量的同時盡量減少能量消耗。兩方追逃問題轉化為兩方零和博弈問題,使用脫靶量和需用加速度來構造性能指標,為了獲得追逃雙方的最優博弈策略,將性能指標函數設計為

(8)



(9)
定義哈密頓函數為
(10)
式中,λ∈R6為協態向量。

(11)
終端條件為:
λ(tf)=SY12(tf)
(12)
(13)
將控制輸入構建為系統相對狀態的函數,假設λ為如下形式
λ=PY12+ξ
(14)
式中:P∈R6×6為矩陣黎卡提微分方程的解;ξ∈R6×1為矢量黎卡提微分方程的解。
因此
(15)
由λ表達式可得
(16)

(17)
由于方程(17)的解必須滿足所有的Y12,所以它必須滿足以下微分方程

根據兩方追逃博弈運動模型,假設潛艇為j=1,ATT為i=2,來襲魚雷為i=3,則相對運動由2個相對交戰運動模型描述。魚雷與潛艇的相對交戰運動學模型可表示為
(20)

ATT與來襲魚雷的相對交戰運動學模型可表示為

(21)

對于來襲魚雷和潛艇來說,建立微分博弈決策的性能指標J1為
(22)


對于ATT和來襲魚雷來說,建立微分博弈決策的性能指標J2為
(23)


通過上述指標設計,將三方博弈攻防問題轉化為2個雙邊極值問題即
(24)
這樣一來就變成了2個兩方追逃微分博弈制導問題,根據最優控制理論,可以定義2個哈密爾頓函數
(25)
根據最優解的必要條件,可以通過哈密爾頓函數相對輸入的一階偏導為0來獲得。
(26)
(27)
哈密爾頓算子的最優條件也可以得到如下關系
假設λ1,λ2可以看作是由系統相對狀態組成的函數,則λ1=P1Y31+ξ1和λ2=P2Y23+ξ2,這樣就可以得到三方追逃策略為
(30)
由(26)~(27)式可得到P1,P2。ξ1,ξ2可通過求解如(31)~(32)式的矩陣黎卡提方程、矢量黎卡提微分方程獲得。
式中,P1,P2稱為黎卡提矩陣;ξ1,ξ2稱為黎卡提矢量。
結合微分方程邊界條件P1(tf1)=S1,ξ1(tf1)=0,P2(tf2)=S2和ξ2(tf2)=0,可推導最優策略的解析表達式。

(33)
可得三方制導干擾項為
(34)

這樣根據(30)式可以獲得潛艇最優博弈規避策略解析表達式為

(35)
ATT的最優主動博弈攔截制導律的解析表達式為

(36)
魚雷的最優博弈攻擊制導律的解析表達式為
(37)

假設潛艇速度為12 m/s,最大轉彎角速度為1°/s,只在水平面內規避。ATT速度為25 m/s,最大轉彎角速度60°/s,來襲重型魚雷速度為30 m/s,最大轉彎角速度為35°/s。
仿真態勢設置:相對距離3 000 m,來襲魚雷航向角為120°,ATT航向角為30°,潛艇航向角為0°,潛艇初始深度200 m,來襲魚雷初始深度100 m。為了對比采用博弈策略的效果,假設ATT攔截命中重型魚雷后,并不終止仿真,三方繼續運行,來襲魚雷繼續攻擊直至命中潛艇或脫靶。
1) 條件1潛艇不采用博弈規避
潛艇不規避,來襲魚雷采用比例導引律打擊潛艇的仿真結果如圖1~2所示。

圖1 潛艇不采取博弈規避策略情況下兩方水下運動軌跡
圖1給出了潛艇不采取博弈規避策略下的潛艇和魚雷的水下運動軌跡。由圖2可以看出魚雷采用比例導引律進行攔截時67.25 s可以命中潛艇,脫靶量為0.76 m。

圖2 潛艇不采取博弈規避策略情況下魚雷脫靶量
2) 條件2:潛艇采用博弈規避策略
潛艇采取博弈規避策略,來襲魚雷采用比例導引律打擊潛艇的仿真結果如圖3~4所示。

圖3 潛艇采取博弈規避策略情況下兩方水下運動軌跡
圖3為潛艇采取博弈規避策略下的潛艇和魚雷的水下運動軌跡。由圖4可以看出魚雷在72.25 s可以命中潛艇,脫靶量為0.98 m。與情況1相比,潛艇采取規避后首次命中時間增加5 s,脫靶量增加27.5%,但由于機動能力相差近90倍,脫靶量仍然較低,僅靠潛艇規避很難保證自身安全。

圖4 潛艇采取博弈規避策略情況下魚雷脫靶量
3) 條件3:潛艇發現來襲魚雷后發射ATT,然后進行博弈規避
潛艇采取博弈規避策略,并釋放采用博弈制導律的ATT對來襲魚雷進行攔截,來襲魚雷采用比例導引律打擊潛艇的仿真結果如圖5~6所示。

圖5 潛艇采取博弈策略情況下三方水下運動軌跡
圖5為潛艇、ATT采取博弈策略,重型魚雷采用比例制導律時三方水下運動軌跡。由圖6可以看出魚雷在72.25 s命中潛艇,脫靶量為0.98 m。ATT在52.55 s,命中魚雷,脫靶量為0.63 m。由結果可知ATT命中魚雷的時間早于魚雷命中潛艇時間,且提前19.75 s,能夠有效地保護潛艇的安全。

圖6 潛艇采取博弈策略下魚雷和ATT脫靶量
表1對工況一的3個條件進行性能對比,由條件2和條件1可知潛艇采用博弈規避策略后增加了魚雷脫靶量,證明所設計潛艇的博弈規避策略有助于提高潛艇的防御能力。由條件3和條件2可知潛艇發射ATT后采用博弈規避策略,ATT在來襲魚雷命中潛艇前可有效對其進行攔截,證明了本文所設計ATT博弈制導律的有效性。

表1 工況一 3種條件的性能對比
4) 條件4:考慮潛艇、來襲魚雷、ATT測量值存在過程噪聲,假設相對距離測量誤差服從±2 %的正態分布,相對速度測量誤差服從±1 m/s的正態分布。針對條件1,2,3分別仿真100次,3種條件下考慮過程噪聲影響的性能對比如圖7和表2所示。

表2 工況一 蒙特卡洛仿真3種條件的性能對比

圖7 工況一3種條件下魚雷攔截脫靶量累計分布概率圖
由圖7和表2中條件1和條件2的脫靶量統計性能可以看出,潛艇采用博弈規避策略后,增大了魚雷攔截脫靶量,增加約18.7%。由圖7和表2中條件2和條件3的脫靶量統計性能對比可以看出,由于魚雷采用比例導引不會對ATT攔截進行規避,所以2種條件下總體來看潛艇博弈機動的效果基本相同,符合邏輯。
1) 條件1:潛艇不采用博弈規避
潛艇不規避,來襲魚雷采用博弈導引律打擊潛艇的仿真結果如圖8~9所示。

圖8 潛艇不采取博弈規避而魚雷采用博弈制導律時兩方水下運動軌跡
圖8~9為潛艇不采取博弈規避策略而來襲魚雷采用博弈制導律時潛艇和魚雷的水下運動軌跡。由圖9可以看出魚雷在67.25 s可以命中潛艇,脫靶量為0.20 m。

圖9 潛艇不采取博弈規避而魚雷采用博弈制導律時魚雷脫靶量
2) 條件2:潛艇作博弈規避
潛艇采取博弈規避策略,來襲魚雷采用博弈導引律打擊潛艇的仿真結果如圖10~11所示。

圖10 潛艇與來襲魚雷兩方均采取博弈策略時兩方水下運動軌跡
圖10~11為潛艇與來襲魚雷兩方采取博弈策略時的潛艇和魚雷的水下運動軌跡。由圖11可看出魚雷在72.20 s可以命中潛艇,脫靶量為0.44 m。與條件1相比,潛艇采取規避后首次命中時間增加4.95 s,脫靶量增加120%,但由于機動能力相差90倍,脫靶量仍然較低,僅靠潛艇自身規避很難保證自身安全。

圖11 潛艇與來襲魚雷兩方均采取博弈策略時魚雷脫靶量
3) 條件3:潛艇、來襲魚雷、ATT三方均采用博弈對抗策略
潛艇采取博弈規避策略,并釋放ATT對來襲魚雷進行博弈攔截,來襲魚雷采用博弈策略規避ATT同時打擊潛艇的仿真結果如圖12~13所示。

圖12 三方均采取博弈策略時三方水下運動軌跡
圖12為三方均采取博弈策略時三方水下運動軌跡。由圖13可以看出魚雷在77.45 s命中潛艇,脫靶量為0.83 m。ATT在53.80 s可命中魚雷,脫靶量為1.25 m,與條件2相比,魚雷為了躲避ATT首次命中脫靶量進一步增大到0.83 m。而ATT命中魚雷的時間早于魚雷命中潛艇時間,且提前23.65 s,能夠有效地保護潛艇的安全。

圖13 三方均采取博弈策略時魚雷脫靶量
表3對工況二的3個條件進行性能對比,由條件2和條件1可知,即使在來襲魚雷也采用博弈制導律進行攻擊的前提下,潛艇采用博弈規避策略后仍增加了魚雷脫靶量,證明所設計的潛艇博弈規避策略可更加智能地適應攻防態勢。由條件3和條件2可知,即使在來襲魚雷也采用博弈制導律進行攻擊的前提下,潛艇發射ATT后采用博弈規避策略,ATT在來襲魚雷命中潛艇前可有效對其進行攔截,證明了本文所設計ATT博弈制導律可適應攻防態勢對潛艇進行保護。從表1、表3中ATT攔截結果對比可以看出,來襲魚雷采取博弈策略后,通過規避增大了ATT的脫靶量約33%,同時也增大了對潛艇的打擊脫靶量約93%,證明了博弈策略的均衡性。

表3 工況二 3種條件的性能對比
4) 條件4:考慮潛艇、來襲魚雷、ATT測量值存在過程噪聲,假設相對距離測量誤差服從±2%的正態分布,相對速度測量誤差服從±1 m/s的正態分布。針對條件1,2,3分別仿真100次,3種條件下考慮過程噪聲影響的性能對比如表4所示。

表4 工況二 蒙特卡洛仿真3種條件的性能比
在考慮過程噪聲的情況下由表4、圖14中條件1和條件2的脫靶量統計性能可以看出,潛艇采用博弈規避策略后,增大了魚雷攔截脫靶量,增加約92.8%, 首次命中時間增加5.47 s。由表2、表4和圖15可看出,來襲魚雷采用博弈策略后,ATT攔截脫靶量增加了約18.2% 。由表4、圖14中條件2和條件3的脫靶量統計性能對比可以看出,由于魚雷為規避ATT的攔截,并未實現最優博弈導引律,導致對潛艇的打擊脫靶量增加約25.9%,由工況一、工況二條件4仿真結果可以看出,引入過程噪聲后,三方均不能實現最優博弈策略,但整體趨勢與無過程噪聲下結果一致,也從另一個側面證明了本文所設計三方博弈策略的合理性。

圖14 工況二 3種條件下魚雷攔截脫靶量累計分布概率圖

圖15 工況一、二ATT攔截脫靶量累計分布概率圖
本文針對典型態勢下水下攻防過程博弈策略展開研究。從三方攻防的角度出發,建立了描述三方攻防過程運動模型。將三方博弈問題拆分為2個雙方博弈追逃問題,設計了描述三方攻防博弈性能的目標函數,基于最優控制和微分博弈理論設計了主動防御的博弈策略和攻擊方的博弈制導律。通過水下攻防過程2種典型工況下的仿真試驗,驗證了本文設計博弈策略的有效性。