999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于遺傳模糊樹的海空對抗無人機智能決策模型

2022-11-19 06:53:32王玉佳余應福鄧博元
系統工程與電子技術 2022年12期
關鍵詞:智能

王玉佳, 方 偉,*, 徐 濤, 余應福, 鄧博元

(1. 海軍航空大學航空作戰勤務學院, 山東 煙臺 264001; 2. 海軍航空大學岸防兵學院, 山東 煙臺 264001)

0 引 言

隨著高新技術在武器裝備上的廣泛應用,軍用無人機已成為空中軍事力量的重要組成部分[1]。現代無人機具有續航時間長、飛行高度高、隱身效果好等特點,可長時間執行偵察、監控任務。在未來戰場中,無人機不再局限于傳統的偵察探測任務,其必將擔負對海攻擊、攔截導彈、空中格斗等多功能作戰任務[2]。

目前,無人機的自主智能化方向的發展是其在軍事應用上的研究熱點和難點,包括:無人機協同通信[3-5]、多無人機協同偵察任務分配[6]、無人機航跡規劃[7-8]、無人機智能定位[9]、無人機感知技術[10]、多無人機武器目標分配[11]、武器使用智能決策等。其中,基于無人機察打一體化的發展趨勢,無人機的武器自主決策能力成為無人機決戰海戰場的重要保障。

針對無人機的自主智能行為決策技術,國內外學者展開了大量的研究[12-16],目前強化學習中的遺傳算法(genetic algorithm,GA)是應用于智能行為決策中最熱門的技術之一[17]。文獻[18]利用GA來優化無人機基本戰術飛行動作的組合方式,以此得到更有利的動作決策。文獻[19]利用GA來優化無人機控制量:加速度、航跡俯仰角變化率、航跡偏轉角變化率,以此進行智能決策。這兩篇文獻充分利用了機器學習的準確性,但是忽視了決策問題的可解釋性。

美國控制專家Zadeh教授于1965年提出模糊集合理論[20],在此基礎上,模糊推理技術[21]應運而生。遺傳模糊系統(genetic fuzzy system,GFS)[22]是使用GA對模糊推理系統(fuzzy inference system,FIS)的規則[23]和隸屬度函數[24]進行編碼,形成GA可進行優化的染色體,通過一系列選擇、交叉、變異等進化操作,實現對模糊控制系統的自動設計和優化。GA的搜索優化能力保證決策的準確性,基于專家經驗的FIS兼顧了決策的可解釋性,GFS在眾多領域都有所應用[25-34]。文獻[24]采用GFS的思想得到進化式有規則的專家系統,用以解決無人機空戰決策問題。文獻[35]立足于兵棋推演,利用GA優化FIS的隸屬度函數參數得到推演關鍵點。文獻[36]利用遺傳模糊樹(genetic fuzzy tree, GFT)的思想對無人機編隊進行訓練以此解決對地打擊問題,該方法對GFS進行簡化,由于輸入與輸出的某些模糊子集無因果關系從而進行“分叉”處理,減少了FIS的規則數量,提高了決策的效率,但在進行具體實驗時,數據處理的方法以及實驗得到的最優染色體未能展示。

針對上述文獻中算法的優點與不足,為解決未來海戰場中,察打一體化無人機在執行偵察任務時,面對水面艦艇編隊火力打擊的武器智能決策問題,本文采用改進的GFT方法進行解決:首先梳理影響無人機武器決策諸多因素之間的因果關系,利用GFT的思想構建武器智能決策GFT框架;其次針對構造的GFT模型設計了一種新的參數編碼法——三模糊子集參數編碼法,用以解決GA中對隸屬度函數參數的編碼問題;然后針對無人機擔負的任務的特點構建訓練場景;在進行場景訓練時,采用單場景與創新性的組合場景相結合的訓練方式對最優個體進行篩選,將場景得分作為適應度函數的數值;最后將場景訓練的最優個體代入任務場景中進行模型有效性的實驗驗證,并將實驗結果與完全基于專家經驗建立的模糊推理樹[36](fuzzy inference tree,FIT)在任務中的表現進行對比,證明本文構建的無人機武器智能決策GFT模型的優越性和靈活性。

1 問題描述

本文針對性解決的問題是察打一體化無人機在海空對抗背景下執行偵察任務時的武器智能決策問題,所以對真實海空對抗環境進行簡化設置,將三維場景簡化為二維俯視圖,不考慮無人機飛行高度并假設無人機可自行改變姿態達到武器發射條件。其中,海空對抗雙方為水面艦艇編隊和無人機單機。

水面艦艇編隊,包括驅、護艦以及搭載艦載機的航空母艦。由于無人機實施偵察時為盡可能保存自身,不會選擇抵近偵察,因此編隊的火力攻擊武器不考慮密集陣火炮,而采用驅護艦的艦空導彈和艦載機的空空導彈。一旦無人機進入驅、護艦防空圈或者艦載機的巡邏區,水面艦艇編隊立即采取空中火力打擊。

無人機配備兩種防御系統,一是火力防御系統,裝配空空導彈;二是電子對抗防御系統,裝配空射誘餌彈。無人機在執行偵察任務時,按照任務前航路規劃制定的路線飛行,在面臨不同空中火力威脅時,自主作出武器決策進行防御,從而保存自身,完成偵察任務。武器決策內容包括:① 依據自身武器實力,對空中威脅進行武器類型的選擇;② 依據空中威脅情況,選擇對敵態度(武器數量選擇);③ 當武器類型確定為空射誘餌彈時,依據對抗局面的緊迫程度選擇誘餌彈的發射方式。

2 武器智能決策GFT

2.1 武器智能決策FIT

將空中威脅數、威脅距離、無人機空空導彈剩余量、無人機空射誘餌彈剩余量作為輸入,以此構建武器智能決策FIS。對其不存在因果關系的輸入輸出進行“分叉”,使之成為樹形結構的FIT。其中,對敵態度決策系統是獨立的FIS(簡稱為S1);武器選擇決策系統(簡稱為S2)與空射誘餌彈發射方式決策系統(簡稱為S3)構成FIT。S1、S2與S3共同構成武器智能決策FIT,如圖1所示。

圖1 武器智能決策FIT

S1輸入物理量為空中威脅數AN,包含模糊子集為“少、中、多”;輸出物理量為對敵態度AT,包含模糊子集“勇敢、正常、懦弱”。態度勇敢表示針對一個威脅發射1枚武器,態度正常表示發射2枚武器,態度懦弱表示發射3枚武器。在無人機單機只能裝載一定武器數量的前提下,發射武器數目越多,擊毀來襲導彈的成功概率越高;武器消耗量越大,面對后續威脅時,可使用武器越少。

S2輸入物理量為空空導彈剩余量KK、誘餌彈剩余量YE,包含模糊子集均為“少、中、多”;輸出物理量為發射武器類型WT,包含發射空空導彈和發射誘餌彈。發射相同數目的空空導彈和誘餌彈對抗來襲導彈,空空導彈的成功率高于誘餌彈,但空空導彈成本高,占空間體積大,載彈量少。

當S2輸出為發射誘餌彈時,決策進入S3。S3輸入物理量為空中威脅數(同S1中AN)和空中威脅距離DT,包含模糊子集分別為“少、中、多”和“遠、中、近”。設定當面臨多個導彈威脅時,以最近一枚導彈距無人機的距離為威脅距離。輸出物理量為誘餌彈發射方式Time,包含模糊子集為“低延遲、高延遲”。延遲是指從探測到敵襲導彈時至發射誘餌彈的時間間隔,高和低代表間隔時間長和短,不同的發射方式導致誘餌彈對空中威脅的干擾成功率不同。低延遲表示快速發射誘餌彈,此時來襲導彈與無人機的距離較遠,其干擾概率較低,但由于延遲時間短使得干擾失敗后有充足時間再次作出武器使用決策。高延遲表示在來襲導彈距無人機距離較近時發射誘餌彈,其干擾概率較高,但干擾失敗后,剩余時間不足以再次做出對抗決策。

2.2 武器智能決策GFT模型

武器智能決策FIT是無人機在面臨空中火力威脅,自主作出武器選擇決策的控制中樞。本文將知識庫中規則和隸屬度函數同時進行染色體編碼,利用遺傳優化找尋最優的武器智能決策FIT。遺傳優化過程包括規則和隸屬度函數編碼、選擇、交叉、突變、適應度函數求解以及最優個體選擇。

利用GA求得最優武器智能決策FIT的過程即武器智能決策GFT的工作過程,其工作原理如圖2所示。

圖2 武器智能決策GFT工作原理圖

2.2.1 規則編碼

本文采用匹茲堡方法[36]對規則進行編碼。規則表示形式為“IfA=1 AndB=1 ThenC=2”,用數字代替字母表示模糊子集的名稱,方便實現計算機進行規則編碼。S1、S2和S3規則編碼方式如表1~表3所示。

表1 S1規則編碼表

表2 S2中WT編碼表

表3 S3中Time編碼表

表1表示對S1的規則進行編碼,其中S1包含3條規則:“If AN=1 Then AT=m1” “If AN=2 Then AT=m2”和“If AN=3 Then AT=m3”,m1、m2、m3均可取1、2、3中任意一個編碼數。其中,AN和AT取數字1、2、3分別表示空中威脅數為“少、中、多”和對敵態度為“勇敢、正常、懦弱”。對S1的規則編碼實質上是對m1、m2、m3進行數字“1、2、3”的編碼。

表2表示對S2的規則進行編碼,其中S2包含9條規則:“If YE=1 And KK=1 Then WT=n11”,…“If YE=3 And KK=3 Then WT=n33”,n11,…,n33均可取1、2中任意一個編碼數。其中,KK和YE取數字“1、2、3”分別表示空空導彈剩余量和誘餌彈剩余量為“少、中、多”,WT取數字“1、2”表示武器選擇類型為“空空導彈、誘餌彈”。同理,對S2的規則編碼實質上是對n11,…,n33進行數字“1、2”的編碼。

S3與S2的規則表示形式相類似,表3包含S3的9條規則:“If AN=1 And DT=1 Then Time=o11”…“If AN=3 And DT=3 Then Time=o33”,o11,…,o33均可取1、2中任意一個編碼數。其中,AN的數字表示意義同S1,DT取數字“1、2、3”表示空中威脅距離為“遠、中、近”,Time取數字“1、2”表示誘餌彈發射方式為“低延遲、高延遲”。同理,對S3的規則編碼實質上是對o11,…,o33進行數字“1、2”的編碼。

因此,對S1、S2和S3這3個FIS共計21條規則的編碼組成了染色體編碼的前三部分,共計21位。

2.2.2 隸屬度函數的參數編碼

考慮到算法簡便性,隸屬度函數的形狀設置為三角形。本文對于輸入的模糊子集隸屬度函數參數進行編碼優化,而輸出的模糊子集則直接進行設定。S1、 S2、S3系統輸出物理量的模糊子集,具體形狀如圖3所示。

圖3 輸出變量的隸屬度函數

S1輸出一個介于1和3之間的精確數,將此數進行四舍五入得到的數字只有1、2、3,分別表示發射武器的數量為每個威脅發射1、2、3枚反擊彈。同理,將S2輸出的精確數進行四舍五入得到的數字為1或2,分別表示發射武器類型為空空導彈和誘餌彈。

S3輸出為一個介于1和2之間的精確數,用物理量Time表示。設定此時導彈到達無人機的時間為TT,等于導彈距無人機距離除上導彈速度,而在TT時間內,前1/5時間內為誘餌彈發射準備時間,后1/5時間發射誘餌彈會造成由于干擾時間太短導致的干擾效果很差的局面,所以延遲的時間選在中間3/5的時間段里。用Delay表示誘餌彈發射延遲時間,其公式如下:

(1)

得到的Delay的取值介于TT/5和4TT/5之間。

FIT中的5個輸入物理量,其模糊子集均為3個,且進行歸一化后的取值范圍皆為0到1。本文設計了一種三模糊子集參數編碼法,以S1中AN的隸屬度函數參數編碼為例,隸屬度函數的一般形狀和參數的一般位置如圖4所示。

圖4 輸入模糊子集隸屬度函數

使用五位編碼對3個模糊子集的5個隸屬度函數參數A1、A2、A3、A4和A5進行編碼。其中,A1、A2、A3、A4為模糊子集隸屬度函數與水平坐標軸交點的橫坐標,A5是第二個模糊子集頂點的橫坐標。由于5個參數皆為小數,為降低小數編碼在后續遺傳進化過程中的操縱復雜度,參數的編碼方式轉化為對其所在位置的左右移動進行編碼表示。首先設置5個參數的取值范圍和初始值,然后使用a1、a2、a3、a4和a5分別表示A1、A2、A3、A4和A5的位置移動情況。a1、a2、a3、a4和a5的取值為0到10的整數,不同取值代表不同的位置移動:5代表不移動,0代表向左移動至取值范圍的最左端,10代表向右移動至最右端。

對a1、a2、a3、a4、a5進行編碼時,必須考慮到A1

設定A1取值范圍為0至α,A4取值范圍為β至1。A1的初始值為取值范圍的中點α/2,同理A4的初始值為(1+β)/2,隨后對a1、a4隨機進行0至10之間的編碼,則

(2)

(3)

由于A5表示第二個模糊子集頂點的橫坐標,且第一、三個模糊子集頂點的橫坐標取值為0和1,故A5無法取0或者1。為保證編碼的精度,A5、A2、A3的取值范圍不宜設置過大。同時,參考圖4中3個模糊子集隸屬度函數的一般形狀和相對位置關系,設定A5取值范圍為α/2至(1+β)/2,A2取值范圍為α/4至(3β+1)/4,A3取值范圍為3α/4至(β+3)/4。A5、A2、A3的初始值為取值范圍的中點,對a5、a2、a3隨機進行0至10之間的編碼,則

(4)

(5)

(6)

特別的,當A5、A2、A3的取值超出A1至A4的范圍時,將對其數值進行重新設置。以A5為例,當取值大于A4時,

A5=A4-0.01

(7)

當A5的取值小于A1時,

A5=A1+0.01

(8)

這種設置方法不僅可以避免無效編碼導致的系統紊亂,提高后續迭代效率,并且保留了參數之間的大小關系,是一種創新的變量設置方法。

同理,可用b1、b2、b3、b4、b5和c1、c2、c3、c4、c5表示S2中KK和YE的模糊子集;d1、d2、d3、d4、d5和e1、e2、e3、e4、e5表示S3中DT和AN的模糊子集。因此,對5個輸入物理量的模糊子集隸屬度參數的編碼組成了染色體編碼后5部分,共計25位。綜上所述,染色體進行編碼的位數為46位。

2.2.3 種群進化方式和適應度函數

種群進化過程包括選擇、交叉和突變。本文選擇方式選用二元錦標賽法。交叉和突變的方法選用單點交叉和單點突變。由于染色體中包含不同含義的8個部分,所以不能僅僅對染色體中某一位進行交叉(突變),而是對染色體中8個部分同時進行交叉(突變),這樣才能保證種群的有效進化。

利用GA進行武器智能決策FIT的優化,需要設置合適的適應度函數。本文采取訓練場景計分的方式,其中,訓練場景根據無人機任務的特點制定。

依據水面艦艇和無人機武器系統實際作戰性能,同時為加強無人機面臨環境的嚴峻性,設計各類武器的單枚命中概率和干擾概率如下。

(1) 水面艦艇艦空導彈命中率為100%(無干擾情況下)。

(2) 無人機利用空空導彈攔截艦空導彈的命中率為75%(主要考慮艦空導彈的高速運動特點)。

(3) 無人機誘餌彈對艦空導彈的干擾概率范圍為25%至75%。其中,具體干擾概率值YR的影響因素主要考慮為誘餌彈發射時艦空導彈與無人機的距離,用誘餌彈發射延遲時間Delay作為衡量標準,YR與Delay呈線性相關,計算公式如下:

(9)

在訓練場景中,無人機根據武器智能決策FIT做出武器決策,通過作戰仿真得到作戰結果,作戰結果不同,最終的決策得分也不同。

為達到無人機打擊威脅、保存自身的目的,設定擊中一個空中威脅獎勵10分;一旦被任意一個威脅擊中則宣布任務失敗,扣除100分,未被擊中則宣布任務成功,獎勵100分。考慮到無人機在真實作戰場景中攜帶的空空導彈數量遠遠小于誘餌彈的數量,且空空導彈的制造成本遠遠高于誘餌彈的現實條件,采取使用一枚空空導彈扣除2分,使用誘餌彈不扣分的計分策略,鼓勵無人機在整個作戰過程中盡可能多的使用誘餌彈。計分情況表如表4所示。

表4 行動計分表

在實驗過程中,計算染色體在場景中得分情況時,每一個染色體均進行3次仿真實驗,3次仿真實驗的得分平均值作為染色體最終得分。

2.2.4 最優個體選擇

種群進化的過程即無人機在訓練場景進行訓練的過程。在進行場景訓練時,為使最優個體的篩選更具準確性,本文采取與傳統GA不同的選擇方式:每代種群進化后,將表現最優異的5個個體存儲于數據庫中,待進化完畢后,對數據庫中所有個體進行仿真從而選出表現最優者。場景訓練結束后,得到的數據庫命名為POP庫,將POP庫中所有個體按順序進行100次訓練場景的實驗仿真,其平均得分最高的個體即為最優個體。

訓練場景的設置只針對任務的單一特點,單場景訓練得到的最優個體往往不能滿足復雜的任務設定。本文設計了創新性的組合場景訓練方法,將單個訓練場景進行排列組合,依次進行仿真實驗,從而優化染色體多個特性。其具體實現方法為:對第一個訓練場景建立的POP庫中的染色體進行挑選,表現最優的前100個個體存儲至新的數據庫,定義為POPX庫;將POPX庫中的所有個體作為后續即將進行訓練的場景的初始種群,從而實現場景間種群的遺傳與進化。本文對無人機進行訓練時,采取單場景與組合場景相結合的訓練方法。

3 實驗與仿真

為驗證構建模型的有效性,設計實驗對無人機武器智能決策GFT的模型進行驗證。首先根據水面艦艇編隊的類型,構建無人機的任務場景;其次針對任務場景兵力特點構建訓練場景;然后在訓練場景中訓練無人機的武器使用決策能力,并選出最優的武器智能決策FIT;最后將武器智能決策FIT代入任務場景中進行仿真,分析無人機的任務成功率。無人機飛行速度設置為340 m/s,空中導彈速度設置為1 000 m/s。GA中種群數量設置為100個,迭代次數為30次,交叉概率為60%,突變概率為2.5%,α為0.4,β為0.6。

3.1 場景設置

根據水面艦艇編隊常見的“人”形隊,設置任務場景1和場景2,如圖5和圖6所示。

圖5 任務場景1

圖6 任務場景2

任務場景1中,無人機攜帶8枚空空導彈和16枚誘餌彈,按逆時針順序,依次通過水面艦艇A防空圈、艦載機巡邏區、水面艦艇B和C共同防空圈以及水面艦艇D的防空圈。艦載機巡邏區的長度為45 km,寬度為40 km,無人機進入巡邏區,將受到3枚空空導彈的攻擊。水面艦艇編隊的行動信息如表5所示。

表5 任務場景1的水面艦艇編隊行動信息表

任務場景2中,無人機攜帶相同數量武器按逆時針順序飛行。艦載機巡邏區的長度為30 km,寬度為40 km,無人機進入巡邏區,將受到一枚空空導彈的攻擊。水面艦艇編隊的行動信息如表6所示。

表6 任務場景2的水面艦艇編隊的行動信息表

針對任務場景1的特性,制定訓練場景1,訓練無人機在威脅數量具有連續性的情況下的決策能力。無人機攜帶8枚空空導彈和14枚誘餌彈,按順時針順序飛行。艦載機巡邏區的長度為32 km,寬度為15 km,無人機進入巡邏區,將受到4枚空空導彈的攻擊。訓練場景圖如圖7所示,水面艦艇編隊的行動信息如表7所示。

圖7 訓練場景1

表7 訓練場景1的水面艦艇編隊的行動信息表

針對任務場景2的特性,制定相比較訓練場景1較為復雜的訓練場景2,訓練無人機在威脅數量具有較大波動時的決策能力。將訓練場景1中艦船B防空圈半徑更改為15 km,發射導彈數量為4枚;艦船C防空圈半徑更改為10 km,發射導彈數量為1枚。無人機按逆時針順序飛行,進入巡邏區,將受到4枚空空導彈的攻擊。場景2其他條件設置與場景1相同。

由于無人機攜帶誘餌彈的數量明顯多于空空導彈,作為無人機空中使用武器的主體,誘餌彈的使用決策能力需要進行針對性的訓練。所以訓練場景3的設置思路為:無人機只攜帶誘餌彈,在不設置艦載機空中巡邏區的水面艦艇編隊中進行武器智能決策的訓練,無人機攜帶22枚誘餌彈,按順時針順序飛行。訓練場景如圖8所示,水面艦艇編隊的行動信息如表8所示。

圖8 訓練場景3

表8 訓練場景3的水面艦艇編隊的行動信息表

3.2 單場景訓練結果

當無人機完成訓練后,得到相應訓練場景的最優個體,將最優個體代入任務場景中進行仿真實驗:當得分大于100分時,認定此次仿真中,無人機任務成功;當得分小于0分時,設定任務失敗。由于任務場景中,設置空中威脅共計11枚導彈,其攻擊率為100%,而無人機攜帶的武器單枚最高攔截率為75%。一個空中威脅的導彈,無人機發射兩枚空空導彈進行攔截(兩個導彈互不影響),攔截概率為93.75%。按照最大概率計算,每一枚空中威脅導彈,無人機均發射兩枚空空導彈進行攔截,無人機攔截所有威脅均成功(任務成功率)的概率為93.75%的11次方,為49%,并且根據設定的載彈量,無人機無法攜帶22枚空空導彈,因此任務場景的實際成功率不足49%。為了使得算法驗證過程更加合理,設置訓練場景中的最優染色體在任務場景中使得無人機任務成功率高于49%的90%時,認為最優染色體在任務場景中表現是符合要求的,表現為優;否則為表現差,此時的成功率衡量標準為44%。

經過場景1~場景3訓練得出最優染色體,將其分別在任務場景中進行100次仿真實驗,得到任務成功率,如表9所示。

表9 單場景訓練結果表

3.3 組合場景訓練

通過上述實驗數據得出,只進行單場景訓練無法訓練出滿足復雜任務場景的優秀個體,本節采取創新性的組合場景訓練方法對無人機進行訓練。3個訓練場景中,由于訓練場景1是最基礎的訓練場景,所以進行組合場景訓練時,訓練場景1為第一個訓練的場景,后續進行訓練的訓練場景進行隨機選擇,最終得到最優個體及其在任務場景中的任務成功率如表10所示。

表10 組合場景訓練結果表

由表10的數據可得,經過場景1+2+3組合訓練后的最優染色體[2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 1, 2, 1, 2, 5, 5, 0, 8, 3, 9, 9, 8, 1, 3, 7, 7, 5, 2, 1, 2, 8, 6, 1, 2, 8, 5, 3, 9]在任務場景中成功率很高,表現優異,驗證了組合場景訓練這種訓練方式的有效性,同時證明了本文建立的無人機武器智能決策GFT是有效、可行并且正確的。

與此同時,經過場景1+3+2組合訓練的最優染色體在任務場景中成功率不高,比較實驗過程發現,實驗中訓練場景的內容相同但訓練順序不同。由此進行假設,組合場景訓練中訓練場景的順序對于訓練結果有影響,最佳的場景組合順序為先簡單后復雜。

3.4 組合場景訓練的順序性驗證

為驗證假設的正確與否,在訓練場景2的基礎上融合場景3的訓練特性創建更復雜的訓練場景4,既訓練無人機在威脅數量具有較大波動情況下的決策能力,又訓練誘餌彈的使用決策能力。其訓練場景圖與場景2相同。無人機攜帶12枚空空導彈和24枚誘餌彈,按逆時針順序飛行,水面艦艇A、B、C發射空空導彈數目為3、6、1枚,無人機進入巡邏區,將受到6枚空空導彈的攻擊,其余設置與訓練場景2相同。針對訓練場景4進行實驗得到任務成功率,如表11所示。

表11 訓練場景4相關實驗結果表

由表11的數據可得,經過場景1+4組合訓練后的最優染色體[2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 1, 2, 8, 5, 0, 8, 3, 8, 9, 8, 1, 3, 2, 7, 6, 2, 1, 6, 7, 5, 1, 2, 8, 1, 3, 9]在任務場景中成功率很高,表現優異,而經過場景4+1組合訓練的最優染色體在任務場景中成功率較低。此結果驗證了假設的正確性,說明最佳的場景訓練順序為先簡單后復雜。試分析原因,前一場景的優秀個體在繼承給后一場景進行訓練時,兩場景共同優化的特性沒有發生變化,而后一場景訓練的特殊特性得到進化,使得訓練得到的結果適應性更好。在進行1、4組合訓練時,先1后4的訓練順序使得優秀個體在繼承場景一優良特性的前提下,增加了面對復雜情況下的決策能力,而在進行先4后1組合訓練時,無人機面對威脅數目有劇烈波動時的決策能力被破壞,導致染色體性能下降。

3.5 對比實驗

本文構建的GFT對所有的規則和輸入物理量的隸屬度函數參數進行編碼優化,這樣設置的好處是GFT可以根據訓練場景的特性自行調整規則和隸屬度參數,而不是僅憑專家經驗進行設定。為了說明GFT的優越性,現將經過場景1+4組合訓練得到的最優個體與完全基于專家經驗建立的FIT進行任務場景仿真,得到任務場景得分對比圖,如圖9和圖10所示。專家根據經驗建立的FIT的染色體編碼為[1, 2, 3, 2, 1, 1, 2, 1, 1, 2, 2, 1, 1, 2, 2, 1, 1, 2, 1, 1, 2, 2, 5, 5, 7, 5, 3, 1, 8, 8, 5, 3, 7, 7, 5, 5, 1, 6, 7, 6, 5, 2, 8, 5, 3, 5]。其在任務場景1中的成功率為7%,在任務場景2中成功率為25%,均未達到成功率的標準值44%,表現均為差。實驗結果表明,GFT訓練出的最優個體在任務場景中的表現遠遠優于完全基于專家經驗的FIT,專家根據決策經驗得到的FIT不適用于設置的任務場景。由此可見,GFT相比一成不變的完全基于專家系統的FIT,雖然需要經過大量訓練才能得到,但是其可以根據訓練場景的特性自行調整FIT中規則和隸屬度參數,具有良好的靈活性。

圖9 任務場景1中的得分對比情況

圖10 任務場景2中的得分對比情況

4 結 論

本文采用GFT的思想,創建了無人機武器智能決策GFT,解決了察打一體化無人機在執行偵察任務時,面對水面艦艇編隊火力打擊時如何自主智能地做出武器決策的問題。本文設計的三模糊子集參數編碼設置法,解決了染色體中隸屬度函數參數的編碼問題,不僅操作簡單,避免了無效編碼導致的系統紊亂,并且保留了編碼特性,是一種創新的變量設置方法。文中通過組合場景的訓練方式,解決了只訓練單一特性的單場景的最優個體無法滿足復雜任務場景要求的問題,并且創新性的組合場景實驗方法實現了場景間種群的遺傳與進化,并且提出最佳的場景訓練順序為先簡單后復雜。將武器智能決策GFT與完全基于專家經驗的FIT進行實驗對比,發現武器智能決策GFT得到的最優個體在任務場景中的表現遠遠優于完全基于專家經驗的FIT,說明武器智能決策GFT具有很好的靈活性,進一步證明了GFT這種方法的優越性。

目前,對于實驗中發現的組合場景訓練順序性規律的原因尚未進行實驗驗證,下一步將會對此進行研究,并將其與組合場景訓練這種方法結合,創造出更高效的訓練方法。

猜你喜歡
智能
智能與自主
讓紙變得智能
一種智能微耕機的研發
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
智能制造·AI未來
商周刊(2018年18期)2018-09-21 09:14:46
爭渡智能石化
能源(2018年4期)2018-05-19 01:53:44
主站蜘蛛池模板: 99久久亚洲综合精品TS| 亚洲中文精品人人永久免费| 久久黄色小视频| 久久99热这里只有精品免费看| 免费A级毛片无码免费视频| 久夜色精品国产噜噜| 精品久久久久无码| 成年人视频一区二区| 久久精品娱乐亚洲领先| 久久人妻xunleige无码| 国产中文一区二区苍井空| 高潮毛片免费观看| 中文字幕在线日本| 亚洲综合网在线观看| 狠狠干欧美| 18禁影院亚洲专区| 2020国产精品视频| 九色国产在线| 国产成人精品高清不卡在线 | 国产成人久久综合一区| 操操操综合网| 中文字幕欧美日韩高清| 91福利免费| 中文字幕欧美日韩高清| 国产免费黄| 亚洲欧美日韩成人在线| 国产精品偷伦视频免费观看国产| 久久久久久久久18禁秘| 精品欧美一区二区三区在线| 波多野结衣久久精品| 蜜臀av性久久久久蜜臀aⅴ麻豆| 国产在线观看91精品| 免费a级毛片18以上观看精品| 欧美a√在线| 97青青青国产在线播放| 亚洲最大综合网| 亚洲丝袜第一页| 久久综合伊人77777| 久久婷婷国产综合尤物精品| 成人日韩精品| 免费大黄网站在线观看| 老色鬼久久亚洲AV综合| 亚洲黄网在线| 成人午夜亚洲影视在线观看| 国产精品久久久精品三级| 国产精品免费久久久久影院无码| 一区二区偷拍美女撒尿视频| 女人18毛片久久| 欧美天堂在线| 51国产偷自视频区视频手机观看| 亚洲二区视频| 最新日韩AV网址在线观看| 午夜电影在线观看国产1区| 亚洲欧美激情另类| 不卡的在线视频免费观看| 超级碰免费视频91| 免费看a级毛片| a级毛片在线免费| 小说 亚洲 无码 精品| 色精品视频| 91在线中文| 亚洲日本中文字幕天堂网| 手机在线看片不卡中文字幕| 老司机午夜精品网站在线观看| 日韩在线观看网站| 亚洲人成网线在线播放va| 无码又爽又刺激的高潮视频| 人妖无码第一页| 日本久久久久久免费网络| 99re热精品视频国产免费| 久久精品66| 91在线视频福利| 在线精品自拍| 国产午夜精品一区二区三| 亚洲无限乱码| 精品国产电影久久九九| 国产精品微拍| 国产成人91精品免费网址在线| 久久久久久尹人网香蕉| 国产自在线播放| 亚洲欧美自拍视频| 国产精品女人呻吟在线观看|