王曉丹, 向 前, 李 睿, 來(lái) 杰
(1.空軍工程大學(xué)防空反導(dǎo)學(xué)院, 西安, 710051; 2. 61932部隊(duì), 北京, 100089)
機(jī)器學(xué)習(xí)是人工智能的一個(gè)重要分支,被認(rèn)為是使計(jì)算機(jī)(機(jī)器)擁有智能的根本途徑。機(jī)器學(xué)習(xí)就是通過(guò)算法,使得計(jì)算機(jī)能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而能識(shí)別新的數(shù)據(jù)或做出預(yù)測(cè)。深度學(xué)習(xí)作為一種新的機(jī)器學(xué)習(xí)方法,是機(jī)器學(xué)習(xí)的一個(gè)重要分支,也是目前人工智能領(lǐng)域的研究熱點(diǎn)之一[1]。
使機(jī)器擁有智能,能夠像人一樣去感知、學(xué)習(xí)、記憶是人類一直追求的夢(mèng)想,人們希望通過(guò)模擬人腦神經(jīng)網(wǎng)絡(luò)的作用機(jī)理來(lái)復(fù)現(xiàn)人的智能。人工神經(jīng)網(wǎng)絡(luò)研究始于1943年神經(jīng)元M-P模型,到1958年Rosenblatt等人[2]提出單層感知器(Perceptron),神經(jīng)網(wǎng)絡(luò)的發(fā)展進(jìn)入了新的階段。隨著研究的深入,研究人員證明了單層感知器功能有限、無(wú)法解決“異或”問(wèn)題[3],因此,1969年Minsky和Papert在《感知器》一書(shū)出版后的很長(zhǎng)一段時(shí)間,神經(jīng)網(wǎng)絡(luò)的研究處于低迷期。
直到1982年Hopfield提出了連續(xù)和離散的Hopfield神經(jīng)網(wǎng)絡(luò)模型[4],并采用全連接神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)旅行商問(wèn)題求解。Hopfield網(wǎng)絡(luò)是一種循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN),具有聯(lián)想記憶功能。1985年Sejnowski和Hinton等設(shè)計(jì)出波爾茲曼機(jī)(boltzmann machine,BM)[5],BM具有較強(qiáng)的無(wú)監(jiān)督學(xué)習(xí)能力,可以從數(shù)據(jù)中學(xué)習(xí)到復(fù)雜的知識(shí)規(guī)則,但存在著訓(xùn)練和學(xué)習(xí)時(shí)間過(guò)長(zhǎng)的問(wèn)題。
1986年Hinton等[6]提出了多隱含層網(wǎng)絡(luò)結(jié)構(gòu),采用Sigmoid激活函數(shù),利用誤差反向傳播算法來(lái)訓(xùn)練模型,有效解決了非線性分類問(wèn)題。1989年Hornik等[7]證明了任何函數(shù)都可以被三層神經(jīng)網(wǎng)絡(luò)以任意精度逼近。LECUN等[8]設(shè)計(jì)了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)識(shí)別手寫字體,但訓(xùn)練模型需要大量時(shí)間,同時(shí),反向傳播算法被指出存在梯度消失問(wèn)題。由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練存在的容易過(guò)擬合、參數(shù)訓(xùn)練速度慢等問(wèn)題,其發(fā)展再次陷入低谷。
此后十多年,支持向量機(jī)(support vector machine,SVM)、最大熵方法(如邏輯回歸)、提升(boosting)方法等不同的淺層機(jī)器學(xué)習(xí)模型相繼被陸續(xù)提出,如,1995年SVM[9]的提出為解決有限樣本下的機(jī)器學(xué)習(xí)提供了有效的手段,SVM在解決高維數(shù)、非線性問(wèn)題等方面表現(xiàn)出了良好性能,從而獲得了廣泛的應(yīng)用。2006年,Hinton等[10]提出了自編碼器(auto-encoders,AE)以降低數(shù)據(jù)的維度,并用預(yù)訓(xùn)練的方式快速訓(xùn)練深度信念網(wǎng)絡(luò)(deep belief network,DBN)[11],來(lái)抑制梯度消失問(wèn)題。通過(guò)貪婪的逐層訓(xùn)練再進(jìn)行全局微調(diào),解決了網(wǎng)絡(luò)訓(xùn)練困難的問(wèn)題。Hinton等[10-11]提出:①多隱層神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到能刻畫數(shù)據(jù)本質(zhì)屬性的特征,對(duì)數(shù)據(jù)可視化和分類等任務(wù)有很大幫助;②可以借助于無(wú)監(jiān)督的“逐層預(yù)訓(xùn)練”和“精調(diào)”的兩階段策略,解決了深度學(xué)習(xí)中網(wǎng)絡(luò)參數(shù)訓(xùn)練的難題。
深度學(xué)習(xí)思想的提出是對(duì)傳統(tǒng)特征選擇與提取框架的突破。深度學(xué)習(xí)之所以被稱為“深度”,是相對(duì)于淺層學(xué)習(xí)而言。淺層學(xué)習(xí)模型的結(jié)構(gòu)基本上可以看成帶有一層隱層節(jié)點(diǎn)(如SVM、boosting)或沒(méi)有隱層節(jié)點(diǎn)(如邏輯回歸)的模型,而深度學(xué)習(xí)網(wǎng)絡(luò)是由多個(gè)單層非線性網(wǎng)絡(luò)疊加而成。淺層學(xué)習(xí)依靠人工經(jīng)驗(yàn)提取特征,學(xué)習(xí)后獲得的是沒(méi)有層次結(jié)構(gòu)的單層特征。深度學(xué)習(xí)通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動(dòng)地學(xué)習(xí)得到層次化的特征表示,從而更有利于分類或特征的可視化[11]。
隨著計(jì)算機(jī)處理速度和存儲(chǔ)能力的提高,使得深層神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和實(shí)現(xiàn)已逐漸成為可能。深層神經(jīng)網(wǎng)絡(luò)試圖模擬人腦的分層學(xué)習(xí)方法,通過(guò)組合低層特征(抽象程度低)形成更加抽象的高層特征表示、屬性類別。深度學(xué)習(xí)算法學(xué)習(xí)到的抽象特征表示在不同的機(jī)器學(xué)習(xí)應(yīng)用中表現(xiàn)出了優(yōu)越的效果。2012年,Hinton及其學(xué)生利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)將ImageNet圖像分類問(wèn)題的錯(cuò)誤率從26%降至15%[12]。同年,微軟和谷歌先后采用深度學(xué)習(xí)技術(shù)將語(yǔ)音識(shí)別錯(cuò)誤率降低至20%~30%[13]。2012年6月,《紐約時(shí)報(bào)》披露了谷歌的Google Brain項(xiàng)目,吸引了公眾的廣泛關(guān)注。深度神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型在語(yǔ)音識(shí)別和圖像識(shí)別等領(lǐng)域獲得了巨大的成功。2013年1月,百度宣布成立百度研究院,其第一個(gè)重點(diǎn)方向就是深度學(xué)習(xí)。2013年4月,《麻省理工學(xué)院技術(shù)評(píng)論》(MIT Technology Review)雜志將深度學(xué)習(xí)列為2013年十大突破性技術(shù)之首。至此,深度學(xué)習(xí)受到學(xué)術(shù)界、產(chǎn)業(yè)界、各國(guó)政府的高度重視,其發(fā)展進(jìn)入爆發(fā)期。
近年來(lái),隨著超大規(guī)模計(jì)算、大數(shù)據(jù)、智能芯片等技術(shù)快速發(fā)展,推動(dòng)了深度學(xué)習(xí)技術(shù)的不斷突破,深度學(xué)習(xí)已成為人工智領(lǐng)域的研究熱點(diǎn)和主流發(fā)展方向之一,深度學(xué)習(xí)也日益成為軍事智能化發(fā)展的技術(shù)基礎(chǔ)與研究熱點(diǎn),深度學(xué)習(xí)技術(shù)在軍事領(lǐng)域的應(yīng)用受到各國(guó)的廣泛重視。
以下將結(jié)合深度學(xué)習(xí)的最新發(fā)展,介紹目前主要的深度學(xué)習(xí)編程框架及其特點(diǎn),對(duì)深度學(xué)習(xí)在目標(biāo)識(shí)別、態(tài)勢(shì)感知、指揮決策等典型軍事領(lǐng)域的應(yīng)用進(jìn)行分析總結(jié),分析深度學(xué)習(xí)軍事應(yīng)用面臨的挑戰(zhàn),并展望未來(lái)可能的發(fā)展方向和趨勢(shì)。
深度學(xué)習(xí)受到學(xué)術(shù)界和產(chǎn)業(yè)界廣泛重視、得以迅速發(fā)展的原因,除了借助于理論層面的突破外,離不開(kāi)計(jì)算機(jī)硬件(計(jì)算機(jī)運(yùn)算能力的顯著提高)和軟件(開(kāi)源軟件的廣泛流行)兩個(gè)方面的快速發(fā)展。
一方面,深度學(xué)習(xí)的訓(xùn)練階段需要對(duì)大量數(shù)據(jù)進(jìn)行高密度的并行計(jì)算處理,傳統(tǒng)的中央處理器(central processing unit,CPU)很難勝任此類任務(wù),因此不斷有新的處理器被設(shè)計(jì)和制造,最具代表性的處理器包括Nvidia和AMD系列圖形處理器(graphics processing unit,GPU)、谷歌的張量處理單元(tensor processing unit,TPU)和華為的昇騰處理器等。在處理器的軟件支持方面,Nvidia率先推出了統(tǒng)一運(yùn)算設(shè)備框架(compute unified device architecture,CUDA),為其生產(chǎn)的GPU提供了一個(gè)高性能的運(yùn)算平臺(tái),在此基礎(chǔ)之上又開(kāi)發(fā)了深度神經(jīng)網(wǎng)絡(luò)的底層加速庫(kù)cuDNN,為上層開(kāi)源深度學(xué)習(xí)框架提供了高性能GPU加速。另外,AMD推出了開(kāi)放式軟件平臺(tái)(radeon open compute platform,ROCm)助力高性能計(jì)算和機(jī)器學(xué)習(xí),華為為其昇騰處理器開(kāi)發(fā)了神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu)(compute architecture for neural networks,CANN),目前這兩個(gè)運(yùn)算平臺(tái)正處在快速的發(fā)展階段。計(jì)算機(jī)領(lǐng)域的摩爾定律表明,在價(jià)格不變的情況下,集成電路上的元器件數(shù)目在18~24個(gè)月內(nèi)會(huì)翻一番[14],換言之,運(yùn)算性能也會(huì)翻一番,深度學(xué)習(xí)正是在這樣的算力變革中快速發(fā)展。
另一方面,近年來(lái),開(kāi)源軟件成為深度學(xué)習(xí)發(fā)展的主要推手,其支撐要素為廣泛流行的編程語(yǔ)言和高效的算法編程框架。適用于深度學(xué)習(xí)的主要編程語(yǔ)言有Python、Julia、MATLAB、C++等,其中由荷蘭的Guido van Rossum于1990年代初設(shè)計(jì)的Python具有良好的簡(jiǎn)潔性、易讀性和可擴(kuò)展性,是當(dāng)前最為流行的深度學(xué)習(xí)編程語(yǔ)言。開(kāi)源編程框架為實(shí)現(xiàn)深度學(xué)習(xí)模型提供了方便的應(yīng)用程序接口(application programming interface,API),國(guó)外框架主要有:FaceBook的PyTorch、Google的TensorFlow和Apache軟件基金會(huì)的MXNet等;國(guó)內(nèi)框架主要有:百度的飛槳(PaddlePaddle)、清華大學(xué)的計(jì)圖(Jittor)、華為的MindSpore和曠視科技的天元(MegEngine)等。神經(jīng)網(wǎng)絡(luò)的整個(gè)計(jì)算流程可以構(gòu)成一張計(jì)算圖,深度學(xué)習(xí)框架一般有靜態(tài)計(jì)算圖和動(dòng)態(tài)計(jì)算圖兩種模式,靜態(tài)計(jì)算圖是先搭建網(wǎng)絡(luò)后進(jìn)行計(jì)算的過(guò)程,該模式具有高效的計(jì)算能力,但是編程調(diào)式的靈活度不高,而動(dòng)態(tài)計(jì)算圖中網(wǎng)絡(luò)的構(gòu)建和計(jì)算同時(shí)進(jìn)行,具有靈活、易調(diào)節(jié)的特點(diǎn)。Tensorflow、PaddlePaddle、Jittor和MindSpore等支持兩種計(jì)算圖模式,在計(jì)算效率和易用性上具有較大的優(yōu)勢(shì)。目前主要的深度學(xué)習(xí)框架、特點(diǎn)、以及支持的語(yǔ)言等信息如表1所示。

表1 主要深度學(xué)習(xí)框架匯總

表1(續(xù))

表1(續(xù))
另外,為了增強(qiáng)各個(gè)框架之神經(jīng)網(wǎng)絡(luò)模型的互操作性,微軟和FaceBook于2017年推出了開(kāi)放神經(jīng)網(wǎng)絡(luò)交換(open neural network exchange,ONNX)標(biāo)準(zhǔn),它使得開(kāi)發(fā)者可以靈活地在各個(gè)框架之間切換以充分利用各個(gè)框架的優(yōu)化特性。正是借助于開(kāi)源軟件“人人參與,人人共享”的獨(dú)特優(yōu)勢(shì),深度學(xué)習(xí)中的復(fù)雜模型可以采用類似于搭積木一樣的模塊化實(shí)現(xiàn),縮短了模型實(shí)現(xiàn)和驗(yàn)證時(shí)間,提高了研究者對(duì)深度學(xué)習(xí)的研究熱情和成果轉(zhuǎn)化速度,促進(jìn)了深度學(xué)習(xí)的理論研究和理論到實(shí)際應(yīng)用的轉(zhuǎn)化。
深度學(xué)習(xí)為很多復(fù)雜問(wèn)題的解決提供了新的思路,由于其具有強(qiáng)大的特征表示和學(xué)習(xí)能力,在以目標(biāo)識(shí)別與檢測(cè)、態(tài)勢(shì)感知、智能指揮決策等為代表的軍事領(lǐng)域中取得了一系列應(yīng)用成果,并日益成為軍事領(lǐng)域智能化發(fā)展的技術(shù)基礎(chǔ)與研究熱點(diǎn)。
雷達(dá)目標(biāo)識(shí)別一直是軍事領(lǐng)域關(guān)注的重點(diǎn),隨著高分辨雷達(dá)技術(shù)的發(fā)展,目標(biāo)的高分辨一維距離像(high resolution range profile,HRRP)、合成孔徑雷達(dá)(synthetic aperture radar,SAR)圖像等已經(jīng)成為軍事目標(biāo)綜合識(shí)別的重要數(shù)據(jù)來(lái)源,傳統(tǒng)雷達(dá)目標(biāo)識(shí)別方法主要采用人工設(shè)計(jì)的特征提取算法提取目標(biāo)特征,目標(biāo)識(shí)別的性能依賴于提取特征的好壞,而采用深度學(xué)習(xí)方法則能自動(dòng)學(xué)習(xí)目標(biāo)數(shù)據(jù)的深層次抽象特征,能夠進(jìn)行更準(zhǔn)確、更穩(wěn)健的識(shí)別,從而受到廣泛的關(guān)注。表1為當(dāng)前主要的深度學(xué)習(xí)框架。
在基于HRRP的雷達(dá)目標(biāo)識(shí)別方面,BO.F等[15]提出一種新的矯正自編碼器Corrective AE,自動(dòng)提取HRRP抽象特征,實(shí)現(xiàn)了對(duì)目標(biāo)HRRP的高效識(shí)別。Pan等[16]采用t-SNE方法解決HRRP目標(biāo)識(shí)別中的訓(xùn)練數(shù)據(jù)不均衡問(wèn)題,利用判別式深層置信網(wǎng)絡(luò)提取訓(xùn)練數(shù)據(jù)中與類別無(wú)關(guān)的全局特征來(lái)提升小樣本條件下的HRRP分類性能。徐彬等[17]考慮HRRP樣本距離單元間的時(shí)序相關(guān)特性,提出了采用雙向長(zhǎng)短時(shí)記憶模型的HRRP目標(biāo)識(shí)別方法,提高了目標(biāo)識(shí)別性能。文獻(xiàn)[18]將5種彈道中段目標(biāo)HRRP轉(zhuǎn)化為0-1二值圖,并構(gòu)建了二維CNN對(duì)HRRP圖像進(jìn)行分類,充分利用圖像中蘊(yùn)含的目標(biāo)結(jié)構(gòu)信息提升了分類效果,但將HRRP轉(zhuǎn)化為圖像增加了計(jì)算量。Xiang等[19]在一維CNN中引入通道注意力,同時(shí)利用改進(jìn)的人工蜂群算法對(duì)一維CNN進(jìn)行剪枝,在保持對(duì)彈道中段目標(biāo)HRRP的高準(zhǔn)確識(shí)別率前提下大幅降低了模型的復(fù)雜度。
在基于SAR的雷達(dá)目標(biāo)識(shí)別方面,Geng等[20]采用卷積自編碼網(wǎng)絡(luò)逐層提取SAR圖像特征,利用標(biāo)簽樣本對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)優(yōu),通過(guò)進(jìn)行尺度變換減小SAR圖像斑點(diǎn)噪聲的影響,利用形態(tài)學(xué)平滑操作移除分類圖中的孤點(diǎn),提高了模型的魯棒性和泛化性能;Lin等[21]采用通過(guò)集成2個(gè)具有不同卷積核尺寸的卷積網(wǎng)絡(luò)獲取圖像的多尺度特征表示,克服梯度消失問(wèn)題,提高了SAR圖像識(shí)別性能。Shang等[22]在卷積神經(jīng)網(wǎng)絡(luò)中引入記憶單元,通過(guò)加入信息存儲(chǔ)單元記錄樣本的空間特征,并利用空間特征相似性推測(cè)未知樣本的類別,取得了較好的識(shí)別性能。Ding等[23]使用具有3個(gè)卷積層的CNN網(wǎng)絡(luò)從SAR目標(biāo)數(shù)據(jù)中提取豐富的特征。Chen等[24]提出一種全部由卷積層組成的CNN結(jié)構(gòu),用卷積層替換了全連接層,有效降低了整個(gè)模型的參數(shù)數(shù)量,抑制了過(guò)擬合問(wèn)題并取得了近99%的目標(biāo)識(shí)別準(zhǔn)確率。為實(shí)現(xiàn)存儲(chǔ)和計(jì)算資源受限條件下的高速目標(biāo)識(shí)別,基于輕量化模型的SAR目標(biāo)識(shí)別受到關(guān)注。Chen等[25]首先采用剪枝和自適應(yīng)結(jié)構(gòu)壓縮降低模型規(guī)模并提高訓(xùn)練和推斷速度,將權(quán)值進(jìn)行量化和編碼實(shí)現(xiàn)模型的進(jìn)一步壓縮,在不損失SAR目標(biāo)分類精度的情況下實(shí)現(xiàn)了40倍的模型規(guī)模下降和15倍的運(yùn)算量減少。
總的來(lái)說(shuō),深度學(xué)習(xí)算法在雷達(dá)目標(biāo)識(shí)別領(lǐng)域具有較多的應(yīng)用研究,尤其是在理想狀態(tài)下提高雷達(dá)目標(biāo)識(shí)別的速度、精度和自動(dòng)化效果上有了較大的進(jìn)步。但是,雷達(dá)目標(biāo)識(shí)別問(wèn)題是典型的非合作目標(biāo)識(shí)別問(wèn)題[26],目前的研究仍然無(wú)法解決非合作目標(biāo)識(shí)別問(wèn)題。上述深度學(xué)習(xí)方法一般使用的訓(xùn)練樣本是在高信噪比環(huán)境下獲得的,由于雷達(dá)探測(cè)距離較遠(yuǎn)和周圍環(huán)境復(fù)雜多變,實(shí)際獲取的雷達(dá)數(shù)據(jù)信噪比較低,造成了訓(xùn)練樣本與識(shí)別樣本的信噪比失配。另外,現(xiàn)實(shí)場(chǎng)景中雷達(dá)無(wú)法長(zhǎng)時(shí)間持續(xù)探測(cè)和追蹤目標(biāo),很難獲得健全穩(wěn)定的樣本。因此,非合作目標(biāo)識(shí)別問(wèn)題是雷達(dá)目標(biāo)識(shí)別急需解決的問(wèn)題,需要在信噪比失配和少量不完備樣本等條件下進(jìn)一步開(kāi)展研究。
現(xiàn)代戰(zhàn)場(chǎng)態(tài)勢(shì)具有顯著的大數(shù)據(jù)特征,傳統(tǒng)方法已不能滿足現(xiàn)代復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)的感知需求,深度學(xué)習(xí)技術(shù)為研究戰(zhàn)場(chǎng)態(tài)勢(shì)感知提供了智能化技術(shù)手段[27]。在對(duì)以往實(shí)戰(zhàn)數(shù)據(jù)、實(shí)兵對(duì)抗數(shù)據(jù)、靶場(chǎng)試驗(yàn)數(shù)據(jù)、兵棋推演數(shù)據(jù)等進(jìn)行態(tài)勢(shì)標(biāo)注的基礎(chǔ)上,將其作為訓(xùn)練數(shù)據(jù),對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,利用訓(xùn)練獲得的網(wǎng)絡(luò)模型可以實(shí)現(xiàn)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的理解。
朱豐等[28]在分析指揮員理解戰(zhàn)場(chǎng)態(tài)勢(shì)的思維模式的基礎(chǔ)上,采用深度學(xué)習(xí)方法進(jìn)行指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程模擬,實(shí)現(xiàn)了對(duì)復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)的有效感知。廖鷹等[29]針對(duì)聯(lián)合作戰(zhàn)條件下戰(zhàn)場(chǎng)態(tài)勢(shì)理解,建立了復(fù)合架構(gòu)的深度學(xué)習(xí)網(wǎng)絡(luò),進(jìn)行指揮員理解戰(zhàn)場(chǎng)態(tài)勢(shì)模式的模仿,基于兵棋演習(xí)數(shù)據(jù)實(shí)現(xiàn)了初步的戰(zhàn)場(chǎng)態(tài)勢(shì)優(yōu)劣判別。李高壘等[30]利用深度網(wǎng)絡(luò)模型對(duì)空戰(zhàn)訓(xùn)練數(shù)據(jù)進(jìn)行學(xué)習(xí),從數(shù)據(jù)中提取能夠刻畫作戰(zhàn)態(tài)勢(shì)本質(zhì)特點(diǎn)的特征量,實(shí)現(xiàn)了對(duì)空戰(zhàn)態(tài)勢(shì)的準(zhǔn)確評(píng)估。歐微等[31]提出一種基于棧式自編碼器的智能目標(biāo)意圖識(shí)別模型,通過(guò)將目標(biāo)狀態(tài)在多個(gè)時(shí)刻的時(shí)序特征和戰(zhàn)場(chǎng)環(huán)境、目標(biāo)屬性等信息統(tǒng)一編碼作為輸入,將軍事專家的知識(shí)經(jīng)驗(yàn)封裝為模式標(biāo)簽,模擬人的推理模式與認(rèn)知經(jīng)驗(yàn),實(shí)現(xiàn)了對(duì)目標(biāo)戰(zhàn)術(shù)意圖的智能識(shí)別。陶九陽(yáng)等[32]設(shè)計(jì)了二維網(wǎng)格上態(tài)勢(shì)要素機(jī)動(dòng)預(yù)測(cè)的案例,提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的戰(zhàn)場(chǎng)態(tài)勢(shì)要素趨勢(shì)預(yù)測(cè)方法。
針對(duì)作戰(zhàn)意圖識(shí)別方法難以有效提取情報(bào)信息本質(zhì)特征的問(wèn)題,Xue等[33]提出了一種基于全景卷積長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的空中目標(biāo)作戰(zhàn)意圖識(shí)別方法,該方法通過(guò)全景卷積層提取信息的松散耦合特征,通過(guò)時(shí)間序列池化層減少神經(jīng)網(wǎng)絡(luò)參數(shù),利用長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)完成時(shí)序特征提取與作戰(zhàn)意圖識(shí)別,有效提高了識(shí)別準(zhǔn)確率。Peng等[34]建立了戰(zhàn)場(chǎng)態(tài)勢(shì)感知模型,通過(guò)CNN實(shí)現(xiàn)了目標(biāo)類別概率預(yù)測(cè),為戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估奠定了基礎(chǔ)。
Ou等[35]構(gòu)建了基于棧式自編碼器的智能態(tài)勢(shì)評(píng)估模型,該模型首先對(duì)歷史戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)進(jìn)行歸一化、一致性檢查與數(shù)據(jù)降維,形成標(biāo)準(zhǔn)數(shù)據(jù)集,而后隨機(jī)抽取樣本,根據(jù)專家認(rèn)知經(jīng)驗(yàn)添加標(biāo)簽,然后利用無(wú)標(biāo)簽樣本對(duì)棧式自編碼器進(jìn)行預(yù)訓(xùn)練,再通過(guò)帶標(biāo)簽樣本進(jìn)行參數(shù)微調(diào)并完成模型的訓(xùn)練。Geraldes等[36]通過(guò)CNN對(duì)無(wú)人機(jī)拍攝圖像進(jìn)行抽象特征提取與預(yù)測(cè),提出了基于深度學(xué)習(xí)的無(wú)人機(jī)態(tài)勢(shì)感知模型,用以完成多人檢測(cè)與多動(dòng)作識(shí)別,為捕獲場(chǎng)景提供更多的上下文與態(tài)勢(shì)信息。Zhang等[37]分析了智能態(tài)勢(shì)感知所面臨的數(shù)據(jù)集稀缺、理解復(fù)雜等問(wèn)題,提出了基于戰(zhàn)爭(zhēng)游戲的智能態(tài)勢(shì)感知總體框架,該框架利用戰(zhàn)爭(zhēng)游戲推導(dǎo)出戰(zhàn)場(chǎng)形勢(shì),根據(jù)作戰(zhàn)規(guī)則與經(jīng)驗(yàn)知識(shí)賦予期望標(biāo)簽,而后通過(guò)訓(xùn)練CNN,減少期望標(biāo)簽與訓(xùn)練結(jié)果之間的誤差,實(shí)現(xiàn)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的理解。
由文獻(xiàn)可知,基于深度學(xué)習(xí)的方法在某些局部戰(zhàn)場(chǎng)態(tài)勢(shì)感知方面進(jìn)行了大量研究,大多通過(guò)仿真實(shí)驗(yàn)一定程度上驗(yàn)證了算法的有效性。但是戰(zhàn)場(chǎng)態(tài)勢(shì)瞬息萬(wàn)變,現(xiàn)有的基于深度學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)感知算法在應(yīng)對(duì)高時(shí)變、高動(dòng)態(tài)、強(qiáng)對(duì)抗條件下的全局戰(zhàn)場(chǎng)態(tài)勢(shì)感知問(wèn)題缺乏研究,同時(shí)現(xiàn)有的方法所用的戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)量小且特征維度有限,缺乏對(duì)真實(shí)戰(zhàn)場(chǎng)多源異構(gòu)數(shù)據(jù)的實(shí)時(shí)性處理和融合識(shí)別研究。
以AlphaGo、AlphaStar等為代表的人工智能應(yīng)用的成功,表明了深度學(xué)習(xí)技術(shù)在應(yīng)對(duì)實(shí)時(shí)對(duì)抗、不確定性推理等復(fù)雜動(dòng)態(tài)場(chǎng)景問(wèn)題的優(yōu)秀能力,深度學(xué)習(xí)在軍事智能輔助決策領(lǐng)域的應(yīng)用已經(jīng)受到廣泛的關(guān)注。
榮明等[38]采用價(jià)值網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)以及蒙特卡洛算法,構(gòu)建了戰(zhàn)略威懾智能指揮決策模型,實(shí)現(xiàn)了對(duì)威懾博弈樹(shù)的快速搜索。申生奇等[39]將深度學(xué)習(xí)用于指揮控制決策,提出了基于深度態(tài)勢(shì)匹配的輔助指揮控制決策方法,基于星際爭(zhēng)霸平臺(tái)與數(shù)據(jù)進(jìn)行了評(píng)估。周來(lái)等[40]將深度強(qiáng)化學(xué)習(xí)方法引入作戰(zhàn)輔助決策過(guò)程中,成功用于最佳行動(dòng)決策序列的搜索。王壯等[41]針對(duì)指控系統(tǒng)復(fù)雜性、非線性,態(tài)勢(shì)感知多源性、異構(gòu)性等問(wèn)題,采用深度強(qiáng)化學(xué)習(xí)技術(shù),基于價(jià)值-策略的自學(xué)習(xí)方法提升了智能體決策質(zhì)量。
Liu等[42]為解決無(wú)人機(jī)空戰(zhàn)決策問(wèn)題,提出一種基于深度強(qiáng)化學(xué)習(xí)的智能戰(zhàn)術(shù)決策方法,該方法結(jié)合Q學(xué)習(xí),采用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了動(dòng)作價(jià)值函數(shù)的精確擬合,避免了傳統(tǒng)強(qiáng)化學(xué)習(xí)方法導(dǎo)致的維數(shù)災(zāi)難。崔文華等[43]針對(duì)兵棋推演的自動(dòng)對(duì)抗問(wèn)題,提出了基于深度強(qiáng)化學(xué)習(xí)的決策方法框架,該框架立足多源層次化戰(zhàn)場(chǎng)態(tài)勢(shì)描述,提出了面向智能博弈的戰(zhàn)場(chǎng)態(tài)勢(shì)表示方法,同時(shí)將作戰(zhàn)指揮分層分域的原則與戰(zhàn)爭(zhēng)游戲的模塊化分層框架相結(jié)合,用于各決策智能體與戰(zhàn)場(chǎng)環(huán)境交互機(jī)制與對(duì)抗策略的產(chǎn)生。Runhild等[44]模擬了復(fù)雜戰(zhàn)場(chǎng)的智能博弈,驗(yàn)證了深度強(qiáng)化學(xué)習(xí)技術(shù)在給定戰(zhàn)場(chǎng)環(huán)境下尋找最優(yōu)決策的可行性。為克服傳統(tǒng)指揮控制系統(tǒng)對(duì)專家規(guī)則與決策模型的依賴,F(xiàn)u等[45]提出了基于深度強(qiáng)化學(xué)習(xí)的智能指揮系統(tǒng),為解決復(fù)雜場(chǎng)景動(dòng)態(tài)決策問(wèn)題,該系統(tǒng)立足數(shù)字戰(zhàn)場(chǎng),生成學(xué)習(xí)數(shù)據(jù),通過(guò)門控循環(huán)單元網(wǎng)絡(luò)提取時(shí)序特征,運(yùn)用注意機(jī)制選擇行動(dòng)對(duì)象,同時(shí)在無(wú)先驗(yàn)知識(shí)的情況下,基于近端策略優(yōu)化算法在固定和隨機(jī)策略場(chǎng)景下訓(xùn)練神經(jīng)網(wǎng)絡(luò),使決策更加靈活可靠。Li等[46]為優(yōu)化無(wú)人飛機(jī)在復(fù)雜環(huán)境下的自主攻擊決策,提出了基于深度強(qiáng)化學(xué)習(xí)的新型深度確定性策略梯度算法,用于無(wú)人機(jī)攻擊區(qū)域擬合,并通過(guò)仿真結(jié)果驗(yàn)證了算法能夠?qū)崟r(shí)判斷出最優(yōu)攻擊區(qū)域。為提升超視距空戰(zhàn)輔助決策能力,Hu等[47]提出了基于改進(jìn)深度Q網(wǎng)絡(luò)的超視距作戰(zhàn)空戰(zhàn)智能機(jī)動(dòng)規(guī)劃方法,建立了智能體與環(huán)境交互的機(jī)動(dòng)決策框架。
上述研究主要利用深度強(qiáng)化學(xué)習(xí)技術(shù),提出了解決指揮決策領(lǐng)域相關(guān)問(wèn)題的新思路,是對(duì)智能化指揮決策的初步探索。但是,指揮決策的復(fù)雜性,決定了基于深度強(qiáng)化學(xué)習(xí)的指揮決策研究仍然存在很多難題尚未解決,具體包括:
四組患者圍手術(shù)期資料見(jiàn)表2。典型病例見(jiàn)圖1。手術(shù)時(shí)間由A組至D組依次減少,A組的手術(shù)時(shí)間明顯長(zhǎng)于B、C、D組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),而B(niǎo)、C、D組間比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。術(shù)中失血量由A組至D組依次減少,A組的術(shù)中失血量明顯多于B、C、D組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),而B(niǎo)、C、D組間比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。
智能體抽象建模難。目前對(duì)于真實(shí)戰(zhàn)場(chǎng)的模擬仍然存在很多假設(shè)和簡(jiǎn)化,但戰(zhàn)爭(zhēng)是復(fù)雜的一體化對(duì)抗,很難將諸多的因素抽象為深度強(qiáng)化學(xué)習(xí)算法的輸入,做到既簡(jiǎn)化細(xì)節(jié),又保留博弈的本質(zhì)。
多價(jià)值目標(biāo)決策難。當(dāng)前,強(qiáng)化學(xué)習(xí)只能以輸贏作為決策目標(biāo),但是實(shí)際戰(zhàn)爭(zhēng)的目標(biāo)并不是單一的,除了輸贏,仍然還有其他評(píng)價(jià)目標(biāo),因此需要進(jìn)一步研究多價(jià)值目標(biāo)決策問(wèn)題。
多決策實(shí)體協(xié)同難。目前的指揮決策研究主要是通過(guò)構(gòu)建單獨(dú)的智能體解決單一的決策問(wèn)題,但如何在時(shí)間有限、資源有限的情況下解決資源分配、任務(wù)分配、沖突協(xié)調(diào)等多智能體協(xié)同問(wèn)題,仍需要進(jìn)一步開(kāi)展研究。
除上述軍事應(yīng)用領(lǐng)域外,深度學(xué)習(xí)技術(shù)憑借優(yōu)異的性能,正逐漸應(yīng)用于裝備故障診斷、材料缺陷檢測(cè)、作戰(zhàn)效能評(píng)估等領(lǐng)域。
在裝備故障診斷領(lǐng)域,深度學(xué)習(xí)技術(shù)被應(yīng)用于分析裝備振動(dòng)信號(hào)等狀態(tài)數(shù)據(jù),進(jìn)而判斷裝備內(nèi)部組件的狀況。鞠建波等[48]提出了一種基于DAE的裝備故障診斷方法,該方法通過(guò)DAE實(shí)現(xiàn)裝備故障的無(wú)監(jiān)督抽象特征提取,并根據(jù)樣本標(biāo)簽采用BP算法對(duì)網(wǎng)絡(luò)進(jìn)行有監(jiān)督的迭代微調(diào),提升了故障分類的準(zhǔn)確率。Xue等[49]提出了一種基于改進(jìn)深度信念的航空發(fā)動(dòng)機(jī)旋轉(zhuǎn)部件故障診斷方法,該方法通過(guò)引入自適應(yīng)參數(shù),實(shí)現(xiàn)了DBN學(xué)習(xí)速率隨誤差的自適應(yīng)調(diào)整。Sypa等[50]提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的液體火箭發(fā)動(dòng)機(jī)啟動(dòng)瞬態(tài)故障檢測(cè)與診斷方法,并采用某液體火箭點(diǎn)火實(shí)測(cè)數(shù)據(jù)進(jìn)行模型性能測(cè)試。
在材料缺陷檢測(cè)領(lǐng)域,深度學(xué)習(xí)技術(shù)通常被應(yīng)用于分析材料表面圖像,檢測(cè)斑點(diǎn)、凹坑、劃痕、缺損等缺陷。針對(duì)傳統(tǒng)檢測(cè)方法鋁材表面缺陷檢測(cè)率不高的問(wèn)題,向?qū)挼萚51]提出了基于改進(jìn)Faster RCNN(region-based CNN)的缺陷檢測(cè)方法,相較于原始Faster RCNN,該方法網(wǎng)絡(luò)中加入特征金字塔結(jié)構(gòu),增強(qiáng)小缺陷的特征提取能力,并使用感興趣區(qū)域校準(zhǔn)算法來(lái)代替粗糙的感興趣區(qū)域池化算法,獲得更加準(zhǔn)確的缺陷位置信息。針對(duì)缺陷樣本不足問(wèn)題,Gong等[52]提出了一種基于深度遷移學(xué)習(xí)的航空復(fù)合材料缺陷檢測(cè)模型,CNN被應(yīng)用于特征提取器與標(biāo)簽分類器,從輸入圖像中提取特征,并將其賦予正確的類別標(biāo)簽。曠可嘉[53]提出了基于單次檢測(cè)器(single shot multi-box detector,SSD)網(wǎng)絡(luò)模型用于航空發(fā)動(dòng)機(jī)缺陷的自動(dòng)檢測(cè),提出的SSD模型相較于R-CNN、Fast R-CNN和Faster R-CNN具有更高的檢測(cè)精度和速度。
在作戰(zhàn)效能評(píng)估領(lǐng)域,可以利用深度學(xué)習(xí)技術(shù)在特征提取、非線性函數(shù)映射等方面的優(yōu)點(diǎn),模擬人類思維對(duì)作戰(zhàn)方案、裝備體系作戰(zhàn)能力等進(jìn)行智能評(píng)估。任俊等[54]針對(duì)武器裝備體系效能評(píng)估在高維噪聲小樣本數(shù)據(jù)條件下準(zhǔn)確性不高的問(wèn)題,提出一種基于堆棧降噪自編碼與支持向量回歸機(jī)的混合模型,該模型比傳統(tǒng)支持向量回歸機(jī)等模型能夠更準(zhǔn)確地評(píng)估裝備效能。郭圣明等[55]針對(duì)傳統(tǒng)數(shù)據(jù)挖掘方法無(wú)法深入分析防空體系復(fù)雜關(guān)聯(lián)關(guān)系和體系能力涌現(xiàn)生成機(jī)理的問(wèn)題,提出一種基于強(qiáng)制自編碼神經(jīng)網(wǎng)絡(luò)的防空作戰(zhàn)體系能力回溯分析方法,可形式化描述防空體系能力指標(biāo)涌現(xiàn)過(guò)程,同時(shí)還賦予指標(biāo)體系相對(duì)明確的物理含義,有助于對(duì)指標(biāo)體系的深入認(rèn)知和管控。趙曉曉等[56]針對(duì)作戰(zhàn)任務(wù)規(guī)劃的合理性評(píng)估問(wèn)題,提出了融合專家系統(tǒng)的多層神經(jīng)網(wǎng)絡(luò)作戰(zhàn)任務(wù)規(guī)劃合理性智能分析模型,可準(zhǔn)確有效地評(píng)估作戰(zhàn)任務(wù)規(guī)劃的合理性。戚宗鋒等[57]將深度學(xué)習(xí)與傳統(tǒng)的層次分析法相結(jié)合,利用深度置信網(wǎng)絡(luò)實(shí)現(xiàn)了底層評(píng)估數(shù)據(jù)的分類與判定,解決了指標(biāo)體系的底層采樣數(shù)據(jù)容易出現(xiàn)的數(shù)據(jù)量大、缺乏統(tǒng)一標(biāo)度、指標(biāo)間權(quán)重難以確定等問(wèn)題,該模型在雷達(dá)偵察系統(tǒng)作戰(zhàn)能力評(píng)估問(wèn)題方面得到了有效驗(yàn)證。
深度學(xué)習(xí)在軍事領(lǐng)域的應(yīng)用受到世界各國(guó)的重視,國(guó)防部高級(jí)研究計(jì)劃局(defense advanced research projects agency,DARPA)于2007年啟動(dòng)了“深綠”(Deep Green)計(jì)劃,將人工智能引入作戰(zhàn)輔助決策,將智能和仿真嵌入指揮控制系統(tǒng);2009年DARPA進(jìn)一步啟動(dòng)了“深度學(xué)習(xí)”研究計(jì)劃,嘗試采用深度學(xué)習(xí)方法,從戰(zhàn)場(chǎng)獲取的大量無(wú)標(biāo)簽的聲音、視頻、傳感器和文本數(shù)據(jù)中抽取更多隱藏的有用特征,并將其用于模式識(shí)別和特征分類、挖掘關(guān)聯(lián)關(guān)系、監(jiān)測(cè)異常、描述事件的時(shí)間關(guān)系等;2016年,美國(guó)辛辛那提大學(xué)研發(fā)的人工智能程序Alpha AI操控F-15戰(zhàn)機(jī)在模擬空戰(zhàn)中擊敗了資深飛行員美國(guó)退役空軍上?;鳌だ?Gene Lee)駕駛的F-22戰(zhàn)機(jī)。近年來(lái)啟動(dòng)的“指揮官虛擬參謀”(CVS)項(xiàng)目、“指南針”(COMPASS)項(xiàng)目、“IKE項(xiàng)目”等,顯示了深度學(xué)習(xí)技術(shù)對(duì)指揮控制、軍事智能輔助決策等領(lǐng)域產(chǎn)生的巨大的影響。
由于探測(cè)手段的限制以及軍事目標(biāo)的高度保密特性、目標(biāo)特性的非合作性,大量數(shù)據(jù)樣本的獲取及標(biāo)注困難成為了目標(biāo)識(shí)別等應(yīng)用的重要問(wèn)題。通常,深度學(xué)習(xí)模型網(wǎng)絡(luò)層數(shù)深、模型復(fù)雜,在訓(xùn)練時(shí)需要大量的數(shù)據(jù),在小樣本條件下直接訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)會(huì)產(chǎn)生嚴(yán)重的過(guò)擬合問(wèn)題,從而導(dǎo)致網(wǎng)絡(luò)的泛化能力急劇下降,樣本量不足已成為制約深度學(xué)習(xí)方法在目標(biāo)識(shí)別中應(yīng)用的主要因素。
因此,針對(duì)軍事應(yīng)用問(wèn)題的特點(diǎn),解決小樣本條件下的深度學(xué)習(xí)至關(guān)重要,可基于現(xiàn)有數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)充和模型優(yōu)化等,如通過(guò)平移、加噪聲等方法對(duì)現(xiàn)有數(shù)據(jù)集進(jìn)行擴(kuò)充,也可采用VAE、GAN等深度學(xué)習(xí)技術(shù)進(jìn)行對(duì)抗學(xué)習(xí)來(lái)生成樣本;模型優(yōu)化方面,可利用遷移學(xué)習(xí)、度量學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等方法實(shí)現(xiàn)小樣本條件下的網(wǎng)絡(luò)模型優(yōu)化。
由于軍事領(lǐng)域問(wèn)題的復(fù)雜性、對(duì)抗性和特殊性,通過(guò)各類傳感器獲取的數(shù)據(jù)往往存在不完整性、不確定性、模糊性以及噪聲干擾嚴(yán)重等特點(diǎn),高質(zhì)量數(shù)據(jù)獲取困難。深度學(xué)習(xí)方法的成功源于大量高質(zhì)量的標(biāo)注數(shù)據(jù)作為支撐,因此,如何在信息不確定、不完備情況下,運(yùn)用深度學(xué)習(xí)技術(shù)消除軍事應(yīng)用問(wèn)題的不確定性,提升目標(biāo)識(shí)別、指揮決策等的準(zhǔn)確性、可靠性和魯棒性,值得進(jìn)一步深入研究。
同時(shí),深度學(xué)習(xí)為提取戰(zhàn)場(chǎng)大數(shù)據(jù)中隱藏的復(fù)雜特征、實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)自動(dòng)感知與理解提供了可能的手段,戰(zhàn)場(chǎng)大數(shù)據(jù)具有明顯的“不確定性、非線性、涌現(xiàn)性”等特性,如何利用深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)時(shí)域、空域、頻域、任務(wù)等不同域戰(zhàn)場(chǎng)大數(shù)據(jù)的特征提取與融合,實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)感知與理解,進(jìn)而消除“戰(zhàn)爭(zhēng)迷霧”,仍然面臨巨大的挑戰(zhàn)。深度學(xué)習(xí)、信息融合等技術(shù)的融合發(fā)展,將會(huì)為問(wèn)題的解決提供支撐。
現(xiàn)代戰(zhàn)爭(zhēng)節(jié)奏快、反應(yīng)時(shí)間短,處理時(shí)間存在的延時(shí)極有可能延誤戰(zhàn)機(jī)而導(dǎo)致嚴(yán)重后果。深度學(xué)習(xí)應(yīng)用于軍事領(lǐng)域問(wèn)題面臨著高性能、高實(shí)時(shí)性要求的挑戰(zhàn)。提高學(xué)習(xí)性能、提升學(xué)習(xí)速度是深度學(xué)習(xí)軍事應(yīng)用需解決的關(guān)鍵問(wèn)題,由于深度學(xué)習(xí)方法模型復(fù)雜、學(xué)習(xí)數(shù)據(jù)量大、優(yōu)化困難,通常需要較長(zhǎng)的模型訓(xùn)練時(shí)間,計(jì)算資源和存儲(chǔ)資源消耗巨大,因此,模型太大、訓(xùn)練時(shí)間太長(zhǎng)、資源高消耗的深度學(xué)習(xí)模型無(wú)法滿足實(shí)際問(wèn)題需求。
針對(duì)實(shí)際軍事應(yīng)用問(wèn)題的特點(diǎn)和需要,需要研究準(zhǔn)確性高、魯棒性強(qiáng)和泛化性能強(qiáng)的深度學(xué)習(xí)模型;針對(duì)深度學(xué)習(xí)模型計(jì)算和存儲(chǔ)資源消耗較大的問(wèn)題,研究并行計(jì)算方法以充分利用現(xiàn)有計(jì)算資源;針對(duì)模型太大的問(wèn)題,在保證準(zhǔn)確率的前提下,可以進(jìn)行模型壓縮,以及研究輕量化的深度網(wǎng)絡(luò)模型,采用如模型裁剪、權(quán)重稀疏化、權(quán)重量化等技術(shù)以大幅減少模型參數(shù),提高模型泛化性能,并實(shí)現(xiàn)網(wǎng)絡(luò)加速。
深度學(xué)習(xí)模型復(fù)雜、參數(shù)多,學(xué)習(xí)過(guò)程是一個(gè)黑盒學(xué)習(xí)過(guò)程,學(xué)習(xí)結(jié)果的可解釋性差,因此,深度學(xué)習(xí)軍事應(yīng)用同樣存在得出的學(xué)習(xí)結(jié)論可解釋性差、可理解性差的問(wèn)題。對(duì)于軍事指揮決策,由于決策者無(wú)法完全理解深度學(xué)習(xí)方法的決策過(guò)程,因此對(duì)學(xué)習(xí)獲得的決策結(jié)論可信度不足,從而影響了其在軍事指揮決策中作用的發(fā)揮。
進(jìn)一步加強(qiáng)深度學(xué)習(xí)工作機(jī)理可解釋性的研究,建立可解釋的深度學(xué)習(xí)模型和學(xué)習(xí)過(guò)程,對(duì)于實(shí)現(xiàn)智能化態(tài)勢(shì)感知、指揮決策等具有重要的意義??梢試L試將深度學(xué)習(xí)與擅長(zhǎng)邏輯推理的符號(hào)學(xué)習(xí)、存儲(chǔ)了知識(shí)的知識(shí)圖譜結(jié)合,將深度學(xué)習(xí)與具有可解釋性的學(xué)習(xí)算法如決策樹(shù)等進(jìn)行結(jié)合,使其既有深度學(xué)習(xí)強(qiáng)大的特征表達(dá)能力,又有一定的可解釋性。對(duì)于對(duì)抗性較強(qiáng)的動(dòng)態(tài)決策,可以嘗試將深度學(xué)習(xí)與博弈論結(jié)合來(lái)完成動(dòng)態(tài)決策性任務(wù)。
深度學(xué)習(xí)目前已成為人工智能領(lǐng)域的研究熱點(diǎn),隨著對(duì)深度學(xué)習(xí)研究的深入,其在諸多領(lǐng)域的應(yīng)用都取得了突破性進(jìn)展,深度學(xué)習(xí)技術(shù)的迅猛發(fā)展也為軍事領(lǐng)域問(wèn)題的解決提供了新的手段。由于軍事領(lǐng)域問(wèn)題自身的復(fù)雜性、對(duì)抗性等特點(diǎn),深度學(xué)習(xí)應(yīng)用于軍事領(lǐng)域仍然面臨著諸多挑戰(zhàn),本文分析總結(jié)了深度學(xué)習(xí)在目標(biāo)識(shí)別、態(tài)勢(shì)感知、指揮決策等領(lǐng)域的應(yīng)用及發(fā)展,分析深度學(xué)習(xí)軍事應(yīng)用存在的問(wèn)題與挑戰(zhàn),指出問(wèn)題解決的可能方向,下一步將在此方向進(jìn)行深入研究。