999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的突防控制博弈對象匹配方法

2022-08-05 02:34:18李士剛彭一洋
導航定位與授時 2022年4期
關鍵詞:模型

李士剛,彭一洋,程 笠

(1.海裝駐上海地區第六軍事代表室,上海 201109;2.上海航天控制技術研究所,上海 201109)

0 引言

遠程空面導彈在執行打擊敵縱深目標任務時,通常需要突破敵人的多層防空反導防御體系。面對日益先進的防空系統,提升空面導彈的突防能力對于提升作戰效能具有重要意義。基于追逃模型的突防策略是目前戰術武器突防技術領域的研究熱點,面對多枚空面導彈的攻擊,地面防空系統一般會發射多枚攔截彈對突防彈進行攔截,確定追逃參與方是實現該類突防策略的一個重要前提。因此,需要在突防開始前進行敵方攔截彈的攻擊目標匹配,確定各枚攔截彈的攔截目標,為空面導彈集群的協同突防提供支撐。

攔截彈攻擊目標匹配屬于目標意圖識別的研究范疇,傳統的目標意圖識別方法包括貝葉斯網絡、D-S證據理論、模版匹配以及模糊推理等。國內對態勢估計和目標意圖識別的研究起步較晚,但仍有許多學者針對意圖識別問題開展了相關研究,如文獻[4]利用直覺模糊函數表示貝葉斯網絡模型的各個節點及節點間的因果依賴關系,建立基于直覺模糊貝葉斯推理的識別模型,提出了一種基于直覺模糊集和貝葉斯網絡相結合的意圖識別方法,簡化了推理步驟,增強了意圖識別的可信度。隨著人工智能技術的發展,部分學者也將Agent理論、神經網絡及深度學習理論等應用于意圖識別研究。例如文獻[13]針對樣本不平衡情況下空中群組意圖識別問題,提出了一種基于注意力機制的雙向門控循環單元網絡空中群組意圖識別方法,將空中群組的狀態信息編碼成時序特征,利用先驗信息封裝成樣本標簽,通過雙向循環機制提取空中群組目標時序特征的深層信息,并利用注意力機制為深層信息分配權值。文獻[14]提出了一種面向目標意圖識別的深度學習模型,該模型基于棧式自編碼器(Stacked Autoencoder, SAE)算法,采用無監督預訓練和有監督訓練相結合的方式,實現對目標戰術意圖的智能識別。

國外針對意圖識別的研究起步較早,并且在理論框架研究和武器裝備應用方面均取得了很大的進展。理論框架研究方面,文獻[15]提出了一個解決完全可觀測、多Agent以及動作隨機性的生成式博弈框架;文獻[16]提出了可以對智能體行動不確定性進行建模的隨機意圖識別設計問題,從而對意圖識別設計問題進行了豐富和拓展;文獻[17]則將原問題拓展到規劃識別領域,提出規劃識別設計問題,即基于規劃庫重新設計問題域的可行行動集合,以提高識別過程中規劃的辨識度。武器裝備應用方面,世界主要軍事強國最早于20世紀50、60年代就開始研制和裝備各級別的指揮控制與態勢評估系統,包括美國的海軍戰術數據系統、法國的SENIT系列海軍戰術數據處理系統以及俄羅斯的CHFMA-3作戰情報指揮系統等。雖然公開信息未透露這些系統的技術細節,但是根據相關介紹和說明,這些情報處理及指揮決策系統在信息處理的基礎上,也都具備一定的戰場態勢分析和威脅分析能力,并且無一例外地強調了對戰場態勢、作戰意圖的分析和推理能力,強調通過自動化、智能化地對戰場態勢進行分析和評估,尤其重視對敵方作戰能力及戰術意圖的推理和預測能力。

目前的空中目標意圖識別研究主要集中在各級指揮系統對飛機類目標的意圖識別領域,通常將目標運動信息認為連續可知。而空面導彈在自主突防過程中,只能依靠彈上搭載的各類光學傳感器對攔截彈的發動機尾焰進行探測,以獲取攔截彈信息,但多數中遠程攔截彈均在被動段對目標進行攔截,導致空面導彈無法獲得完整的攔截彈飛行狀態信息。同時,與飛機類空中目標不同,攔截彈的飛行彈道與制導律、攔截目標狀態強相關,具備極強的時序特性。本文針對多枚巡航導彈協同突防時,進攻彈無法獲取攔截彈被動段飛行狀態的問題,統計并構建可擴充的攔截彈,攔截我方進攻彈的彈道軌跡庫?;陂L短時記憶網絡(Long Short-Term Memory, LSTM)構建軌跡預測模型,通過攔截彈預測軌跡和進攻彈軌跡確定預測命中點,基于預測命中點確定攔截彈攔截目標,實現我方導彈對博弈目標的準確匹配。

1 攔截彈道庫的生成

1.1 彈道構建方法

中遠程防空導彈從發射到命中目標大致分為初制導、中制導和末制導三個階段。其中初制導段通常采用固定的程序轉彎模型,使終端姿態角滿足到位角約束;中制導段采用參數較小的比例導引,模擬導彈在中制導段飛行時由外部因素導致的彈道誤差;末制導段采用修正比例導引制導律攻擊目標,確定上述特征參數后即可求解不同制導階段的飛行彈道,進而得到攔截彈的三自由度全段飛行彈道。

構建攔截彈彈道庫時,認為攔截彈為垂直發射,且在主動段做勻加速運動,巡航導彈在進入突防狀態前采用勻速直線的巡航飛行模式,構建三自由度彈道時認為彈道傾角與俯仰角相同?;谏鲜鰰r序與假設,通過選取不同的初制導終端到位角、制導律系數以及發動機工作時間,即可獲得不同參數下的三自由度攔截彈道,進而構建攔截彈道庫。

1.2 初制導段彈道

選取不同的初制導期望終端俯仰角,采用三角函數設計初制導姿態變化規律,即可獲得不同期望終端俯仰角下的初制導段彈道。三角函數型初制導段導引律如式(1)所示。

?=90-?
?()=(?,cos(),sin())
?()=90-?()

(1)

式中,?為期望終端俯仰角;?為初始角偏差;?()為程序轉彎模型;?()為當前時刻的俯仰角。

1.3 中/末制導段彈道

采用初制導結束時的導彈飛行參數作為中制導段的初始狀態,采用修正比例導引律作為中/末制導段的制導律。選取中制導段比例導引導航比小于2,獲得中制導段彈道;選取末制導段比例導引導航比大于2,獲得末制導段彈道。比例導引的彈道方程如式(2)所示。

(2)

2 基于LSTM的攔截彈意圖識別模型

2.1 LSTM

LSTM最初是由Hochreiter和Schemidhuber于1997年提出,是一種特殊的循環神經網絡(Recurrent Neural Network,RNN),能夠解決普通RNN在長序列訓練過程中存在的梯度消失和梯度爆炸問題。LSTM模型的結構示意圖如圖1所示。

圖1 LSTM的基本單元Fig.1 The basic unit of LSTM

在每個LSTM基本單元中包含3個門處理過程,分別是遺忘門、輸入門和輸出門。其中,遺忘門決定了要從上一單元的輸出中舍棄什么信息;輸入門決定了要在當前單元中保存什么新的信息;輸出門決定了下一個隱藏狀態的值。LSTM基本單元的更新過程如式(3)所示。

(3)

式中,、、、和、、、分別為輸入序列的權重系數和偏置參數,需要由訓練得到;為時刻的狀態序列;-1為上一個基本單元的輸出;為時刻保留的信息;(·)和tanh(·)為激活函數。

2.2 航跡預測模型

由于進攻彈只能獲取攔截彈主動段的彈道信息,因此本文選取導彈軌跡庫中發動機關機前一段時間的軌跡作為訓練樣本,對LSTM進行訓練,主要包含以下3個步驟:

(1)數據預處理

①數據歸一化

為了減少數據中極大值和極小值對神經網絡預測的影響,同時減小計算負擔,需要對導引頭測量信息進行歸一化處理,將神經網絡的輸入限制在[-1,1]之間,本文采用最值歸一化處理方法,如式(4)所示。

(4)

②劃分數據集

攔截彈道庫中包含了若干條攔截彈航跡,按照一定的比例將它們隨機劃分成訓練集和測試集。

(2)神經網絡模型設計

首先需要對循環神經網絡的權重值和偏置值進行初始化,然后需要明確輸入和輸出信息,接著需要確定循環神經網絡的層數和每層的神經元數目,最后根據實際情況選擇學習率、迭代次數、傳遞函數及訓練算法等。本文設計的循環神經網絡基本模型如下:

①利用前6個時刻的歷史航跡坐標預測第7個時刻的航跡坐標,取時刻、-1時刻、-2時刻、-3時刻、-4時刻、-5時刻、-6時刻目標點的、軸坐標位置為循環神經網絡的輸入,+1時刻目標點的、軸坐標位置為循環神經網絡的輸出;

③確定LSTM的學習率、迭代次數、激活函數(·)、隱含層傳遞函數(·)、輸出層傳遞函數(·)、訓練函數(·)和誤差函數(·)等。

(3)神經網絡訓練

①采用訓練集對LSTM進行訓練,得到可用于航跡預測的神經網絡模型;

②將測試集航跡作為訓練好的神經網絡輸入,得到航跡點在不同時刻的預測坐標,與測試集進行對比,測試神經網絡模型的預測性能。

2.3 攔截目標匹配流程

通過各枚進攻彈的紅外導引頭獲得的測角數據,能夠求解每一時刻攔截彈在三維空間中的坐標數據;將攔截彈的空間坐標作為航跡預測模型的輸入,即可獲得攔截彈的預測航跡;通過將攔截彈的預測航跡與進攻彈規劃航跡進行對比,獲得預測命中點;通過對比預測命中點脫靶量,即可確定攔截彈的攔截目標。具體步驟如下:

1)采用擴展卡爾曼濾波對含有噪聲的導引頭探測信息進行處理,得到當前時刻攔截彈三維空間中的坐標信息,并將其儲存起來,即可獲得攔截彈主動段的飛行軌跡,具體算法如下:

選取Singer模型為狀態模型,取時刻狀態變量為攔截彈位置與速度=[,,,,,],則系統離散狀態方程為

=-1-1+

(5)

式中,-1為狀態轉移矩陣;為狀態噪聲協方差矩陣;-1的表達式如下所示。

首先腳在一個不起眼的地方。此物件,位于人體的最下部,具有移動和支撐人體重量的兩大重要功能。它能進能退。進的時候,可快可慢。尤其關鍵時刻,踹你一腳,沒商量。那個得意勁,覺得自己仿佛就是大腦的主人;退的時候,可以凌霄輕步,閃轉騰挪,世故得讓人心有余悸。

(6)

(7)

式中,的具體表達式如文獻[19]所示;為機動頻率;為目標加速度方差。令為目標以最大加速度運動的概率,為目標勻速運動的概率,為先驗的目標最大加速度,則有

(8)

,=[,,,]為時刻第個導引頭的量測量,則量測方程為

,=,(,,)

(9)

擴展卡爾曼濾波算法如式(10)所示,通過融合上一時刻的狀態量與當前時刻的量測量,即可求得攔截彈當前時刻的三維空間坐標。

(10)

式中,為量測方程對狀態變量的雅可比矩陣。

2)將巡航彈導引頭得到的攔截彈運動軌跡={,,}作為神經網絡(·)的輸入,得到攔截彈的預測軌跡={,,},如式(11)所示。

{,,}=({,,})

(11)

3)根據攔截彈的預測軌跡和巡航彈的規劃軌跡求取預測命中點,依據攔截目標預測命中點最小原則,確定各攔截彈的攔截目標,如式(12)所示。

LJ,=min{{LJ,,XH,}},=1,2,…,

(12)

式中,LJ,為第枚攔截彈的預測攔截目標;{LJ,,XH,}為第枚攔截彈與第枚巡航彈的預測脫靶量;為巡航彈總數。

3 仿真驗證

本節采用數字仿真的形式對上述方法開展有效性驗證。設置仿真場景為3發攔截彈攔截3發進攻彈。進攻彈在同一高度飛行,各彈之間間距400m。其中,攔截彈1攔截進攻彈1,攔截彈2攔截進攻彈2,攔截彈3攔截進攻彈3。為便于理解,將進攻彈目標點定為坐標系原點,其中,巡航彈處于勻速直線運動狀態,仿真起始時刻發射攔截彈,攔截彈在主動段以10縱向加速度做加速運動。巡航彈運動參數如表1所示。

表1 巡航彈運動參數

通過設置不同的攔截彈終端到位角、比例導引律導航比以及發動機工作時間,得到攔截彈彈道數據庫,用于航跡預測模型的離線訓練,攔截彈的飛行條件設置如表2所示。

表2 攔截彈運動參數

3.1 航跡預測模型離線訓練

根據預測命中點的分布,可以將對應于彈道庫中的彈道分為八類,分別對應8個主動段飛行時間。設置線性整流函數(Rectified Linear Unit, ReLU)為激活函數,設置交叉熵函數為誤差函數,表達式如式(13)所示。

(13)

式中,()為真實分布;()為非真實分布。

設計LSTM結構的相關參數如表3所示。

表3 LSTM結構參數

受限于紅外導引頭的探測能力和協同探測機理,只能獲得主動段后期的攔截彈彈道信息。本文選擇主動段結束前5s的數據作為意圖識別時的軌跡輸入量,因此訓練過程中同樣采用對應時間段的軌跡對網絡進行訓練;同時,選擇彈道庫中的75%數據作為訓練集用于訓練網絡,剩余的25%數據作為測試集用于驗證網絡性能,網絡訓練和測試過程的參數設置如表4所示。

表4 訓練與測試參數

LSTM網絡訓練結果如圖2所示,3枚巡航彈對應的訓練結果正確率均為100%,滿足性能要求。

圖2 LSTM網絡訓練參數變化過程Fig.2 Changing process of LSTM network training parameter

3.2 攔截彈意圖識別仿真

3.2.1 單次仿真

設置巡航彈紅外導引頭的測角噪聲為高斯白噪聲,測角精度為0.1°,設置終端到位角為60°,末制導律導航比為4,攔截彈發動機工作時間為10s,將攔截彈主動段軌跡的最后5s作為航跡預測模型的輸入,則單次仿真結果如表5所示,進攻彈與攔截彈的彈道軌跡如圖3所示。

表5 意圖識別結構

圖3 攔截彈預測軌跡Fig.3 Interceptor predicted trajectory

可以看到,本文構建的航跡預測模型預測出的攔截彈攔截彈道對其實際的攔截目標具有較小的預測脫靶量,而對于非攔截目標的脫靶量則較大,匹配模型能夠正確匹配出攔截我方對應導彈的攔截彈。

3.2.2 蒙特卡羅仿真

在上述仿真條件下,進行100次蒙特卡羅仿真,三巡航彈意圖識別均成功的概率為100%,當減小3枚進攻彈之間的距離、增大紅外導引頭噪聲時,意圖識別成功率會出現不同程度的降低,其中,同時增大紅外導引頭噪聲、減小巡航彈之間的距離會導致匹配成功率明顯降低。其主要原因是紅外導引頭的噪聲增大了輸入神經網絡的攔截彈彈道的誤差,而進攻彈之間距離的減小使得不同攔截彈之間的射面更加接近,彈道更加靠近,增大了匹配難度,最終導致系統出現誤判。但當進攻彈之間的距離較大時,雖然導引頭噪聲使得攔截彈觀測彈道出現了誤差,但不同攔截彈之間的射面和彈道距離也都更遠,降低了系統判斷的難度。具體統計結果如表6所示。

表6 蒙特卡羅仿真結果

4 結論

本文以采用博弈理論設計協同突防方案時需要獲取攔截彈的攔截目標問題為背景,構建攔截彈典型彈道軌跡庫,基于LSTM訓練航跡預測網絡模型,利用多紅外導引頭探測攔截彈尾焰獲得的攔截彈主動段彈道信息,設計目標匹配算法,提出了基于深度學習的突防控制博弈對象匹配方法。算法分析與實驗結果表明:

1)對于多攔截彈攔截多巡航彈的典型場景,該算法能夠有效確定攔截彈的攔截目標,為后續巡航彈的突防提供支撐。

2)通過蒙特卡羅仿真分析巡航彈導引頭測量噪聲對識別精度的影響,說明該算法在測量信息存在一定測量誤差的情況下仍具備足夠的魯棒性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 最新亚洲人成网站在线观看| 人妻丰满熟妇αv无码| 亚洲第七页| 国产粉嫩粉嫩的18在线播放91| 色婷婷成人网| 91在线国内在线播放老师| 午夜精品久久久久久久无码软件 | 亚洲an第二区国产精品| 欧美国产中文| 99久久精品国产麻豆婷婷| 国产美女精品一区二区| 91无码人妻精品一区| 69国产精品视频免费| 亚洲天堂日韩在线| 精品久久久久成人码免费动漫 | 黄色一级视频欧美| 成人午夜福利视频| 人妻一区二区三区无码精品一区| 亚洲黄色激情网站| 亚洲熟女偷拍| 国产又爽又黄无遮挡免费观看| 99久久人妻精品免费二区| 亚洲天堂免费| 91精品视频播放| 国产乱人伦偷精品视频AAA| 在线国产毛片手机小视频 | 青青草国产免费国产| 4虎影视国产在线观看精品| 国产一区二区三区日韩精品| 亚洲国产午夜精华无码福利| 国产丝袜丝视频在线观看| 国产精品乱偷免费视频| 一区二区偷拍美女撒尿视频| 中文字幕在线一区二区在线| 亚洲欧洲日韩综合| 一级毛片不卡片免费观看| 久青草国产高清在线视频| 99这里只有精品在线| 亚洲人成人无码www| 欧美伊人色综合久久天天| 婷婷亚洲视频| 中文字幕色站| 欧美成人综合视频| 精品国产自在现线看久久| 国产欧美视频综合二区 | 久久久久久久久18禁秘| 亚洲欧美国产视频| 久996视频精品免费观看| 国产在线观看成人91| 丰满人妻中出白浆| 白浆免费视频国产精品视频| 成人在线视频一区| 亚洲欧美成人影院| 国产欧美成人不卡视频| 国产情精品嫩草影院88av| 草草影院国产第一页| 亚洲αv毛片| 欧美色视频日本| 亚洲日产2021三区在线| 精品自拍视频在线观看| 国产乱肥老妇精品视频| 亚洲国产精品久久久久秋霞影院| 欧美精品1区2区| 国产精品午夜电影| 色噜噜在线观看| 在线看片中文字幕| 欧美97色| 色噜噜在线观看| 欧美亚洲一二三区| 成人一级免费视频| www.91在线播放| 丁香综合在线| 欧美精品综合视频一区二区| 国产精品制服| 国产微拍一区| 男人的天堂久久精品激情| 啪啪永久免费av| 国产日本一线在线观看免费| www.狠狠| av色爱 天堂网| a级毛片在线免费观看| 亚洲第一视频网|