霍士偉 郭圣明 唐宇波
(1.國(guó)防大學(xué) 北京 100091)(2.國(guó)防科技大學(xué)信息通信學(xué)院 西安 710106)
隨著人工智能技術(shù)的快速發(fā)展和在軍事領(lǐng)域的廣泛運(yùn)用,作戰(zhàn)指揮方式由傳統(tǒng)的以指揮員決策向人機(jī)協(xié)同的智能作戰(zhàn)指揮方式轉(zhuǎn)變。其中,智能化戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估是實(shí)現(xiàn)智能化作戰(zhàn)指揮的基礎(chǔ)和關(guān)鍵,是科學(xué)完成兵力優(yōu)化、火力分配等指揮決策的前提[1]。
目前智能戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估方法主要有基于知識(shí)推理的評(píng)估方法和基于機(jī)器學(xué)習(xí)的評(píng)估方法。其中基于知識(shí)推理的評(píng)估方法主要包括基于模板匹配的方法[2]、案例推理的方法[3]、D-S 證據(jù)理論方法[4]、模糊邏輯方法[5]等。基于知識(shí)推理的方法能夠較好地處理戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估中信息的不確定性,但是普遍存在難以構(gòu)建完備的知識(shí)庫(kù)問(wèn)題,對(duì)具有高度非線性、涌現(xiàn)性的復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)難以有效評(píng)估,原因在于這類評(píng)估方法的知識(shí)表示大多是基于人的經(jīng)驗(yàn),推理過(guò)程有太多主觀因素,無(wú)法從戰(zhàn)場(chǎng)全局實(shí)現(xiàn)戰(zhàn)場(chǎng)態(tài)勢(shì)的自主表示和推理[6]。以神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)[8]為代表的機(jī)器學(xué)習(xí)評(píng)估方法能夠直接從大量戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)中學(xué)習(xí)規(guī)律,實(shí)現(xiàn)對(duì)復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)的表示和認(rèn)知,避免了構(gòu)建知識(shí)庫(kù)的復(fù)雜過(guò)程,同時(shí)避免了人的主觀因素影響。目前,基于機(jī)器學(xué)習(xí)的智能戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估成為當(dāng)前作戰(zhàn)指揮決策領(lǐng)域的研究熱點(diǎn),并取得了大量成果。但是,基于機(jī)器學(xué)習(xí)的評(píng)估方法需要大量標(biāo)記樣本數(shù)據(jù)來(lái)進(jìn)行模型訓(xùn)練,而在戰(zhàn)場(chǎng)環(huán)境下,要獲得充足的滿足模型訓(xùn)練要求的帶標(biāo)簽樣本數(shù)據(jù)是比較困難的。相對(duì)而言,我們能夠獲得較多的無(wú)標(biāo)記數(shù)據(jù),但是為這些數(shù)據(jù)添加標(biāo)簽則需要花費(fèi)大量的人力和時(shí)間。在這種情況下,直接將傳統(tǒng)機(jī)器學(xué)習(xí)方法用于戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估,會(huì)造成評(píng)估準(zhǔn)確性不高。因此,研究如何利用無(wú)標(biāo)簽樣本來(lái)輔助機(jī)器學(xué)習(xí)模型訓(xùn)練對(duì)基于機(jī)器學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估具有重要意義。
半監(jiān)督學(xué)習(xí)是一種可有效利用無(wú)標(biāo)簽樣本來(lái)輔助機(jī)器學(xué)習(xí)模型訓(xùn)練的方法,可有效提高標(biāo)記樣本不足條件下模型的精度和泛化性能[9]。其中自訓(xùn)練半監(jiān)督學(xué)習(xí)是一種簡(jiǎn)單且適應(yīng)性強(qiáng)的半監(jiān)督學(xué)習(xí)方法[10]。本文以自訓(xùn)練半監(jiān)督學(xué)習(xí)方法為模型整體訓(xùn)練框架,以適用于小樣本條件下分類的支持向量機(jī)模型為基礎(chǔ)分類器,提出了基于自訓(xùn)練半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型,為解決標(biāo)記樣本不足條件下的智能戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估問(wèn)題提供了思路。通過(guò)實(shí)驗(yàn),驗(yàn)證了該模型在戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估標(biāo)記樣本不足條件下的可行性和有效性。
自訓(xùn)練半監(jiān)督學(xué)習(xí)是一種簡(jiǎn)單且適應(yīng)性強(qiáng)的半監(jiān)督學(xué)習(xí)方法[10]。自訓(xùn)練半監(jiān)督學(xué)習(xí)方法首先利用現(xiàn)有的少量有標(biāo)簽樣本進(jìn)行監(jiān)督式學(xué)習(xí),然后將學(xué)習(xí)得到的分類模型對(duì)無(wú)標(biāo)簽樣本進(jìn)行分類預(yù)測(cè),也就是為無(wú)標(biāo)簽樣本添加偽標(biāo)簽,然后根據(jù)一定的偽標(biāo)簽選擇策略選擇偽標(biāo)簽準(zhǔn)確率較高的數(shù)據(jù)加入訓(xùn)練集重新訓(xùn)練分類模型。迭代上述過(guò)程,直到算法達(dá)到預(yù)定條件。自訓(xùn)練方法實(shí)現(xiàn)簡(jiǎn)單,適應(yīng)性強(qiáng),可廣泛用于各種領(lǐng)域標(biāo)記樣本不足的分類和預(yù)測(cè)場(chǎng)景。
本文結(jié)合自訓(xùn)練半監(jiān)督學(xué)習(xí)和支持向量機(jī)分類模型設(shè)計(jì)了戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型,如圖1所示。模型以小樣本條件下表現(xiàn)較好的支持向量機(jī)模型作為基分類器,以適用戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估中的初始標(biāo)記樣本較少的特點(diǎn)。針對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估過(guò)程中存在大量無(wú)標(biāo)簽樣本和少量帶標(biāo)簽樣本的情況,通過(guò)自訓(xùn)練的半監(jiān)督學(xué)習(xí)方法利用無(wú)標(biāo)簽樣本來(lái)對(duì)支持向量機(jī)模型進(jìn)行輔助訓(xùn)練來(lái)提高模型的準(zhǔn)確性和泛化性能。

圖1 基于自訓(xùn)練半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估思路
基于半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估基本流程如下。
1)對(duì)原始戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)進(jìn)行預(yù)處理,區(qū)分為有標(biāo)簽樣本和無(wú)標(biāo)簽樣本;
2)利用數(shù)據(jù)集中的有標(biāo)簽樣本作為訓(xùn)練集對(duì)支持向量機(jī)模型進(jìn)行訓(xùn)練,得到初始評(píng)估模型;
3)利用訓(xùn)練得到的初始評(píng)估模型對(duì)的無(wú)標(biāo)簽樣本進(jìn)行評(píng)估,評(píng)估結(jié)果作為樣本偽標(biāo)簽,根據(jù)一定的偽標(biāo)簽樣本選擇策略,從偽標(biāo)簽樣本中選擇樣本標(biāo)注準(zhǔn)確率高的樣本加入訓(xùn)練集,利用新訓(xùn)練集對(duì)支持向量機(jī)模型進(jìn)行重新訓(xùn)練;
4)重復(fù)上述訓(xùn)練模型、對(duì)無(wú)標(biāo)簽樣本添加偽標(biāo)簽、選擇偽標(biāo)簽樣本重新訓(xùn)練模型的過(guò)程,直到模型達(dá)到所需要求。
在基于半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型中,基學(xué)習(xí)器性能的好壞直接關(guān)系著整個(gè)模型的性能。由于戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估中初始帶標(biāo)簽樣本數(shù)據(jù)較少,而支持向量機(jī)模型可以很好地適用小樣本數(shù)據(jù)集的分類問(wèn)題,因此本文選擇支持向量機(jī)模型作為基分類器。
支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則對(duì)數(shù)據(jù)進(jìn)行分類,將原始數(shù)據(jù)通過(guò)核函數(shù)映射到高維空間中,然后采用線性超平面對(duì)數(shù)據(jù)進(jìn)行分類,解決了低維數(shù)據(jù)空間中線性不可分的問(wèn)題[11]。常用的核函數(shù)有常用的核函數(shù)主要有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、Sigmoid核函數(shù)。
SVM分類的建模和求解主要過(guò)程如下:對(duì)于樣本集 D={(x1,y1),(x2,y2),…,(xm,ym)},y∈{-1,1},對(duì)于線性可分問(wèn)題,可以通過(guò)線性方程劃分超平面:wtx+b=0,樣本中任意點(diǎn)到超平面距離為


在應(yīng)用支持向量機(jī)進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估時(shí),需要選取適當(dāng)?shù)暮撕瘮?shù)。核函數(shù)選擇一般通過(guò)實(shí)驗(yàn)比較的方法選擇分類效果最好的核函數(shù)。本文通過(guò)實(shí)驗(yàn)比較選擇線性核函數(shù)作為核函數(shù)。線性核函數(shù)是樣本特征在原始空間的內(nèi)積,參數(shù)少,且執(zhí)行速度快。
對(duì)于自訓(xùn)練半監(jiān)督學(xué)習(xí)來(lái)說(shuō),偽標(biāo)記樣本選擇策略是模型性能好壞的關(guān)鍵。偽標(biāo)記樣本選擇策略的目的是將無(wú)標(biāo)簽樣本中被正確標(biāo)記可能性較高的樣本選擇出來(lái)加入有標(biāo)簽樣本中構(gòu)成新的訓(xùn)練集,這樣才能夠進(jìn)一步提高模型的精度和泛化性能。如果將錯(cuò)誤標(biāo)記的偽標(biāo)簽樣本加入新的訓(xùn)練集,則可能造成模型性能的下降。本文采用基于馬氏距離的偽標(biāo)記樣本選擇策略[12]。偽標(biāo)記樣本選擇策略的主要過(guò)程如下。

結(jié)合上述基于支持向量機(jī)的戰(zhàn)場(chǎng)態(tài)勢(shì)分類模型和基于馬氏距離的偽標(biāo)簽樣本選擇策略,本節(jié)設(shè)計(jì)了基于自訓(xùn)練半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估算法,算法步驟如下。

本節(jié)利用文獻(xiàn)[13]提供的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估數(shù)據(jù)對(duì)第3節(jié)中的評(píng)估模型進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)硬件環(huán)境為Intel i3-4030U CPU,主頻1.9GHz,內(nèi)存4G,編程環(huán)境為Matlab2018a,并包括支持向量機(jī)算法的libsvm工具包。
實(shí)驗(yàn)數(shù)據(jù)共包括200條戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估數(shù)據(jù),輸入變量包括敵我兵力數(shù)量對(duì)比、敵我防御能力對(duì)比、敵我攻擊能力對(duì)比等7維特征,戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估等級(jí)為樣本標(biāo)簽,戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估等級(jí)包括絕對(duì)優(yōu)勢(shì)、優(yōu)勢(shì)、均勢(shì)、劣勢(shì)、絕對(duì)劣勢(shì)5個(gè)等級(jí)。為了適應(yīng)評(píng)估模型的要求,針對(duì)實(shí)驗(yàn)數(shù)據(jù)中的5種戰(zhàn)場(chǎng)態(tài)勢(shì)等級(jí)(絕對(duì)優(yōu)勢(shì)、優(yōu)勢(shì)、均勢(shì)、劣勢(shì)、絕對(duì)劣勢(shì)),分別設(shè)置對(duì)應(yīng)的5類標(biāo)簽值(1、2、3、4、5)。部分實(shí)驗(yàn)數(shù)據(jù)如表1所示。

表1 部分實(shí)驗(yàn)數(shù)據(jù)
原始驗(yàn)數(shù)據(jù)集為有標(biāo)簽的樣本集,為了支持本文的半監(jiān)督學(xué)習(xí)方法實(shí)驗(yàn)驗(yàn)證。從全部樣本中抽取x個(gè)樣本作為有標(biāo)簽訓(xùn)練樣本,抽取t個(gè)樣本作為測(cè)試樣本,抽取w個(gè)樣本為無(wú)標(biāo)簽訓(xùn)練樣本。為了對(duì)所提模型性能進(jìn)行比較分析,設(shè)置以下條件下的對(duì)比實(shí)驗(yàn):1)單獨(dú)的支持向量機(jī)評(píng)估模型使用有標(biāo)簽樣本進(jìn)行訓(xùn)練;2)利用本文提出的自訓(xùn)練半監(jiān)督學(xué)習(xí)的評(píng)估模型同時(shí)使用有標(biāo)簽樣本和無(wú)標(biāo)簽樣本進(jìn)行訓(xùn)練。另外,通過(guò)設(shè)置不同的實(shí)驗(yàn)條件(實(shí)驗(yàn)條件包括有標(biāo)簽樣本數(shù)x、無(wú)標(biāo)簽樣本數(shù)w和偽標(biāo)簽樣本選擇閾值θ),在不同實(shí)驗(yàn)條件下比較模型的性能。
針對(duì)不同實(shí)驗(yàn)條件進(jìn)行了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果如表2所示。由表中結(jié)果可以看出,在三種條件下,本文提出的基于半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型同時(shí)利用有標(biāo)簽和無(wú)標(biāo)簽樣本進(jìn)行訓(xùn)練,相對(duì)于只采用有標(biāo)簽樣本的支持向量機(jī)模型來(lái)說(shuō),在評(píng)估準(zhǔn)確率方面都有一定的提高。實(shí)驗(yàn)表明,在具有大量無(wú)標(biāo)簽樣本和少量有標(biāo)簽樣本條件下,通過(guò)自訓(xùn)練無(wú)監(jiān)督學(xué)習(xí)方法通過(guò)利用無(wú)標(biāo)簽樣本進(jìn)行輔助訓(xùn)練,可以提高模型的準(zhǔn)確率和泛化性能。

表2 實(shí)驗(yàn)結(jié)果
在基于自訓(xùn)練無(wú)監(jiān)督學(xué)習(xí)的空中目標(biāo)威脅評(píng)估算法中,樣本選擇閾值θ是一個(gè)重要參數(shù)。為了探討其取值規(guī)律,本節(jié)進(jìn)一步通過(guò)實(shí)驗(yàn)對(duì)其進(jìn)行分析。在x=40,t=48,w=88固定不變條件下,對(duì)θ分別取1~30進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表3所示。由表中結(jié)果可以看出,當(dāng)θ取值為17~22時(shí),模型評(píng)估準(zhǔn)確率最高,為79%;當(dāng)取值過(guò)大或過(guò)小時(shí),模型的準(zhǔn)確率都會(huì)下降。其中原因在于,當(dāng)樣本選擇閾值θ過(guò)大時(shí),會(huì)將過(guò)多的判斷錯(cuò)誤的偽標(biāo)簽數(shù)據(jù)加入新的訓(xùn)練集,而這些判斷錯(cuò)誤的偽標(biāo)簽樣本會(huì)造成模型準(zhǔn)確率的下降。當(dāng)樣本選擇閾值θ過(guò)小時(shí),能夠加入新訓(xùn)練集的偽標(biāo)簽樣本數(shù)量較少,同樣無(wú)法有效提高模型的準(zhǔn)確率。因此,在實(shí)際應(yīng)用中,要通過(guò)反復(fù)實(shí)驗(yàn)來(lái)確定合適的樣本選擇閾值取值范圍。

表3 樣本選擇閾值分析實(shí)驗(yàn)結(jié)果
為解決標(biāo)記樣本不足條件下基于機(jī)器學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估準(zhǔn)確率和泛化性能低的問(wèn)題,結(jié)合自訓(xùn)練半監(jiān)督學(xué)習(xí)和支持向量機(jī)模型提出了基于自訓(xùn)練半監(jiān)督學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型,設(shè)計(jì)了基于馬氏距離的偽標(biāo)記樣本選擇策略。實(shí)驗(yàn)表示,在標(biāo)記樣本不足條件下,本文提出的模型同時(shí)利用有標(biāo)簽和無(wú)標(biāo)簽樣本進(jìn)行訓(xùn)練,相對(duì)于只采用有標(biāo)簽樣本的支持向量機(jī)模1型來(lái)說(shuō),在評(píng)估準(zhǔn)確率方面都有較大的提高。為標(biāo)記樣本不足條件下的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估提供了新的解決思路。