殷小靜,胡曉峰,郭圣明,馬 駿,楊永利,3
(1.國防大學聯合作戰學院,北京 100091;2.解放軍96941部隊,北京 100085;3.解放軍65183部隊,遼寧 遼陽 111200)
戰爭是交戰雙方作戰體系之間的對抗。習主席指出:要以對作戰體系的貢獻率為評價標準,科學設計裝備需求和技術指標[1]。提出體系貢獻率的概念,旨在通過體系貢獻率評估回答體系組分對作戰體系的影響程度。體系貢獻率評估是體系建設和分析的重要內容,是研究作戰體系構建、優化體系結構、提高體系能力、引導體系演化和打擊敵方作戰體系的重要依據,是當前體系研究的熱點和難點[2]。體系是典型的復雜系統,組分的增、減、改等對體系效能的影響具有非線性、涌現性等特點[3],體系貢獻率評估指標應該是指揮員關心的體系級指標。傳統基于人工定義的體系基礎指標只能反映體系效能的一個側面且主觀性強,而直接根據任務指標來評估體系貢獻率又過于片面,不能體現體系變化的涌現性和非線性。因此,需要挖掘能夠表征體系效能涌現性的綜合特征指標,以作為體系貢獻率評估的指標。
深度學習(Deep Learning,DL)[4-5]具有良好的非線性表達能力,能夠很好地刻畫復雜系統內部特征。棧式稀疏自編碼網絡(Stacked Sparse AutoEncoder,SSAE)是一種可以實現高效編碼的人工神經網絡[6],經過加噪優化的棧式稀疏降噪自編碼網絡(Stacked Denoising AutoEncoder,SDAE)不僅具有較強的特征提取能力,而且具有很好的魯棒性。本文針對體系貢獻率評估的特點和要求,采用SDAE+Softmax 模型對體系效能涌現過程進行建模,并根據Softmax 分類器的機理,從體系基礎指標中挖掘分類類別的相對概率值,作為體系貢獻率評估的綜合特征指標。該指標能夠科學有效地反映體系效能的深層變化情況,為體系貢獻率評估提供了全
新的思路。
貢獻率是經濟領域常用的概念,既可以表示投資的收益率,又可以表示不同部門對總收益的貢獻程度。借鑒經濟領域“貢獻率”的定義,我軍創造性地提出了體系貢獻率的概念[2]:待評對象(焦點對象)對包含它的作戰體系完成作戰使命任務的影響程度的度量。體系貢獻率反映了評估要素(貢獻者)對作戰體系的貢獻程度,是評估要素在作戰體系中所發揮作用的一種度量。當前評估要素主要針對武器裝備,考慮到武器裝備必須在作戰中才能體現出作用[7],評估體系貢獻率是在衡量武器裝備對作戰體系的貢獻程度。
按照度量方法,體系貢獻率可以分為絕對貢獻率和相對貢獻率,分別對應基于增量的度量模型和基于比值的度量模型[8]。其中,基于增量的度量模型可能得出體系貢獻率為100%的不合理結果,適于評估同類裝備的體系貢獻率。目前武器裝備的貢獻模型常用相對貢獻率的概念模型[9]:

目前,從體系能力和體系效能的視角開展體系貢獻率研究評估最為普遍。能力是相對靜態的概念,而效能是相對動態的概念[10]。針對裝備在作戰應用中的貢獻情況,多以體系效能視角評估體系貢獻率。評估武器裝備對體系效能的貢獻率,最直接的角度是從作戰效果和完成任務使命的程度來衡量,例如導彈命中數量、是否摧毀敵方目標等。另外,OODA環數、OODA時長、對抗勢能等基于網絡化體系建模的指標,從不同側面衡量了體系效能的涌現性。但體系貢獻率具有層次性和涌現性,如果單純以是否完成使命任務作為衡量體系貢獻率的指標,可能組分變化前后都能或都不能完成使命任務,并不能說組分的變化對體系效能就沒有影響。因此,需要挖掘能夠衡量體系效能涌現性的綜合特征指標來衡量體系貢獻率。
傳統綜合特征指標的計算方法主要是通過基礎指標的加權計算,其隱含的假設是指標之間相互獨立,這顯然與網絡化作戰體系指標之間相互關聯的特點不匹配。隨著大數據和機器學習技術的發展,人們開始探索利用數據挖掘的方法得到綜合特征指標,例如文獻[11-12]依托作戰實驗數據分別基于重要性分析、社團分析方法與主成分分析法(PCA)相結合,挖掘體系效能的多個綜合特征指標。這種通過主成分分析法進行降維處理和指標聚合的思路,采用線性映射得到數據的低維結構,往往不能完備地表達體系的特征,會有信息丟失,而且得到的綜合特征指標是對作戰體系涌現能力某一方面的反映,雖然為體系貢獻率的評估提供了不同視角,但單個指標并不能表達體系涌現能力的整體影響。
作戰體系中組分系統具有非線性關聯和共同演化關系,使得體系貢獻率評估中面臨諸多非線性問題。深度學習具有良好的特征提取能力,可以對體系效能的非線性涌現過程進行建模,從而挖掘體系貢獻率評估指標。深度神經網絡模型作為“深層結構”,能夠有效揭示復雜輸入的內在規律,但是深度學習是一種通用的“黑箱”模型,其按網絡層次提取的特征具有不可解釋性,不能直接作為體系貢獻率評估的指標,需要定義新的綜合特征指標。根據Softmax模型基本原理:

即Softmax模型的輸出表征了不同類別之間的相對概率,為[0,1]區間的概率值,且輸出結果之和為1,可以將其解釋為類概率。因此,定義標簽xi的分類概率相對值為:

該概率可以表征輸入數據被分為標簽xi時的可能性。如果標簽xi代表作戰體系能否完成某任務,那么分類概率相對值越大,則輸入數據達到標簽xi的可能性越大,表明體系完成某任務的能力越強,進而可以用來作為量化體系效能的非線性變化。分類概率相對值作為一種概率表達形式,能夠很好地反映作戰效能涌現過程的不確定性,作為評估體系貢獻率的綜合特征指標更為科學有效。
為了得到可靠的分類概率相對值,首先需要構建具有較高準確性的體系效能評估模型,進而提取分類概率相對值作為體系貢獻率評估的非線性指標。棧式稀疏自編碼神經網絡SSAE結構簡單、容易訓練,被廣泛用于數據降維、數據分類等方面,本文采用加噪優化的棧式稀疏降噪自編碼網絡SDAE與Softmax分類器相結合構建體系效能評估模型。
SDAE模型具有良好的特征提取能力,加入去噪聲機制后,可以提高自編碼網絡的魯棒性,與分類器結合能夠較好地完成對輸入樣本的分類識別。構建SDAE+Softmax評估模型,首先將稀疏降噪自編碼網絡DAE進行堆疊,完成對輸入數據的特征提取任務,然后將提取的數據特征輸入到Softmax分類器中進行分類,基本結構如圖1所示。其中,特征提取網絡采用稀疏降噪自編碼網絡堆疊,具有良好的魯棒性和擬合能力。

圖1 SDAE+Softmax模型的基本結構
對于稀疏降噪自編碼器,輸入層數據需要先經過降噪處理再進行特征提取,代價函數為:

其中,JAE為重構誤差項,用于衡量重構數據與原始數據的差異,Ωsparse為稀疏約束項,用于約束隱含層節點激活量,利于提取重要的隱藏特征,Ωweight為權重正則項,防止權重過度擬合。訓練過程中通過最小化代價函數J(w,b)初始化網絡參數權值w和偏置b,即:

不同于傳統的淺層神經網絡,SDAE+Softmax評估模型是深層神經網絡,可以增減隱含層的堆疊數目,通過逐層提取特征表示復雜高維函數,提高分類識別的準確性。
深度神經網絡的訓練情況直接決定模型的效果,SDAE+Softmax評估模型的訓練分為兩個過程:無監督的預訓練和有監督的微調。將訓練樣本分為無標簽的訓練樣本和有標簽的訓練樣本,利用無標簽訓練樣本,通過無監督學習的方式訓練棧式稀疏降噪自編碼網絡,然后,利用有標簽訓練樣本對網絡參數進行微調。SDAE+Softmax模型的訓練流程如圖2所示。

圖2 SDAE+Softmax模型訓練流程圖
首先通過無監督的方式,采用逐層貪婪無監督算法逐層訓練堆疊降噪稀疏自編碼網絡,實現數據的高層特征提取。設置前向訓練中的迭代次數、稀疏參數等,隨機初始化權值w和偏置b,計算代價函數J(w,b),以反向傳播算法更新權值,編碼器的權值與對應解碼器的權值互為轉置。每次僅訓練一個隱含層的參數,即在訓練第l層時,其他網絡層參數保持不變,訓練完畢后其輸出作為下一層網絡的輸入,直至所有自編碼網絡預訓練完畢,得到特征提取網絡的所有連接參數。然后,將提取的特征輸入Softmax分類器,利用有標簽的訓練樣本進行有監督的訓練,對比分類結果與原數據標簽,對網絡進行微調,從而實現網絡優化,達到數據分類的目的。
本文基于Keras平臺搭建深度神經網絡模型,在處理器為i7-4790CPU@3.6GHz、顯卡為NVIDIATITAN X的計算機上進行模型的訓練和測試。依托體系仿真實驗床平臺,設計作戰想定,采集體系指標樣本數據。
以防空作戰為背景,構建紅藍對抗實驗想定。定義紅方作戰體系的指標參數,共386維。批量更改想定中紅藍對抗體系的參數,并多次運行想定,得到初始樣本集。將指標參數進行歸一化處理,其中167個指標作為模型的輸入數據,將紅方要點是否被摧毀為模型的輸出類別。運行想定得到數量為12 000的樣本集,將樣本集分為無標簽的訓練集、有標簽的驗證集和有標簽的測試集,數量分別為:8 000,2 000,2 000。
3.3.1 基本參數的確定
對于構建的SDAE+Softmax模型,首先需要確定模型的參數,包括決定模型結構的網絡層數、各網絡層節點數等結構參數,激活函數、稀疏懲罰、噪聲等級等調優參數,以及學習率、迭代次數、批尺寸等訓練參數。以基礎指標數據的維度作為輸入層節點數,即386維;根據對指標集進行社團劃分的經驗,可以劃分4~10個有意義的社團,因此,定義SDAE網絡輸出層節點數為10,Softmax分類器類別數量為2。設定SDAE+Softmax模型的主要參數如表1所示,并通過對比實驗確定模型中隱含層的結構。

表1 模型參數設置
3.3.2 隱含層參數的確定
為確定深度神經網絡中隱含層層數,通過實驗討論其選取問題。研究表明[13],當第1隱含層節點數大于輸入層節點數時,堆棧自編碼器可以提取較好的特征信息。節點數越多,網絡的學習能力越強,但節點數增多會增加計算量,并且影響網絡的泛化能力,造成過擬合的問題。另外,并非隱含層數越多,分類識別效果越好,因此,通過實驗決定隱含層的層數和結構。通常設定第1隱含層節點數大于等于輸入層節點數的兩倍,本文選擇隱含層結構分別為800-10(SDAE1)、800-80-10(SDAE2)、800-400-80-10(SDAE3)、800-400-200-80-10(SDAE4),利用訓練樣本集對4個模型進行訓練,并利用測試集得出分類準確率,實驗結果如表2。

表2 不同層數模型測試情況對比表
通過表2可以看出,隨著隱含層數的增加,3層隱含層模型的準確率高于2層隱含層模型,但隨著隱含層數的繼續增加,4層、5層隱含層模型的準確率卻在下降,也就是說,當隱含層數為3時,構建的模型可以更好地提取本數據集的特征并進行更好的分類。訓練過程中迭代次數與重構誤差的關系如圖3所示。

圖3 不同隱含層數的模型訓練情況
由圖3可以看出,隨著迭代次數的增加,SDAE模型的重構誤差逐漸減少,在迭代2 000次左右后趨于平緩,其中,隱含層數為3層的模型重構誤差最小,因此,構建隱含層數和節點數為800-80-10結構的神經網絡模型。同理,經過交叉實驗驗證,對比不同參數下模型的平均分類準確率,可確定模型的最優參數組合。學習率的大小可以直接影響神經網絡的收斂速度和尋優能力,將學習率設定為0.1;為保證模型的稀疏性,設定稀疏懲罰為0.05;為實現降噪功能,設定噪聲等級為0.2。
在機器學習中,常用的分類模型還有支持向量機(SVM)、隨機森林(RF)、樸素貝葉斯(NB)、多層感知機(MLP)以及PCA+Softmax 模型等,這些均屬于淺層結構模型。基于同一指標數據樣本,將SDAE+Softmax 模型、未加噪的SSAE+Softmax 模型以及常用的機器學習分類算法相比較,實驗結果如圖4 所示。

圖4 不同學習模型的測試情況
通過本文構建的SDAE+Softmax 模型與常用機器學習分類算法在樣本分類上的結果對比發現,SDAE+Softmax 集成模型的分類準確率最高,即體系效能評估的準確性最高,滿足可信性要求,也說明了深層神經網絡結構模型的分類效果要優于傳統淺層結構模型。SDAE+Softmax 模型與未加噪的SDAE+Softmax 集成模型相比準確率更高,驗證了加噪處理的有效性。因此,可以選擇SDAE+Softmax 模型作為體系效能評估模型,并提取模型的相對分類概率作為衡量體系效能非線性變化的指標。
根據作戰需要,選取某型預警雷達作為體系貢獻率評估的焦點裝備,在紅方作戰體系中添加某型預警雷達,紅方體系指標隨之改變。作戰效果體現為紅方重心是否被摧毀,如果被摧毀,則任務完成指標為0;反之為1。將添加某型預警雷達前后的體系指標分別輸入訓練好的SDAE+Softmax 模型,得到分類類別均為1,即紅方作戰體系不論是否添加某型預警雷達,均能完成某重心的防護任務。
對添加某型預警雷達前后的SDAE+Softmax 模型提取分類相對概率。添加某型預警雷達前,體系完成任務的相對概率為0.7 和0.3,相對值為0.4;添加某型預警雷達后,任務指標完成的相對概率為0.8 和0.2,相對值為0.6,因此,某型預警雷達對體系完成重心防護任務的貢獻率為33.33 %。根據Softmax 模型分類概率相對值的物理意義,說明添加預警雷達前后,紅方體系均能夠完成重心的防護任務,但該預警雷達的增加提高了任務完成的可能性。另外,通過分類概率相對值還可以計算出對任務完成貢獻率不高的焦點裝備,從而減少這類裝備的部署。
根據實驗結果可以看出:1)SDAE+Softmax 模型準確率很高,驗證了評估模型的有效性,也保證了體系效能貢獻率評估指標的準確性。2)SDAE+Softmax 模型評估的準確性高于傳統模型SSAE+Softmax 模型,說明了加噪處理的有效性。3)基于深度神經網絡的效能評估方法優于傳統機器學習方法,說明深度神經網絡具有較強的特征提取能力,也印證了作戰體系的非線性特點。4)從體系貢獻率評估應用來看,選取分類相對概率值作為評估體系效能貢獻率的綜合特征指標,能夠量化體系變化對作戰效能帶來的非線性影響,這是傳統體系效能貢獻率評估方法所做不到的。
深度學習通過多層神經網絡對體系效能涌現過程進行建模,不同于以往人工設計和線性擬合方法,依托作戰實驗數據可以從神經網絡模型中挖掘綜合特征指標。本文構建的SDAE+Softmax 模型具有較高的準確性,基于分類概率相對值的綜合特征指標,能夠有效衡量組分變化對體系的非線性影響,較傳統方法更為科學有效。