于博文,于 琳,呂 明,張 捷
(南京理工大學自動化學院,江蘇 南京 210094)
目標威脅評估是作戰決策過程中的重要步驟,隨著作戰理論與先進作戰裝備的發展,部隊戰斗力迅猛提升,使得現代戰爭呈現強對抗性、強時效性的特點,對敵方目標威脅評估方法也提出了更高的要求。目標威脅評估根據敵我雙方作戰資源的性能,我方防御資源的重要程度和敵我作戰策略等,對敵方目標的威脅程度進行定量估計,從而確定敵方目標的威脅程度[1]。對來襲目標進行準確的威脅評估,可為作戰火力分配、作戰資源調配、作戰方案優選提供有效的輔助支撐。威脅評估結果可以有效幫助作戰指揮人員了解戰場態勢,進而做出合理有效的作戰決策[2]。因此,開展威脅評估的技術研究具有重要的現實意義。
當前,目標威脅評估的主要研究內容集中在評估模型的構建和評估方法的效率提升,評估方法主要包括層次分析法、多屬性決策、人工神經網絡、模糊綜合評價法、灰色關聯等,其大體可以分為基于模型的計算方法和基于人工智能的推理方法[3-4]。文獻[4]提出了一種基于熵權法和模糊集對分析方法的目標威脅評估方法。文獻[5]提出了一種基于深度學習的目標威脅評估方法,通過對稱式的訓練方法逐層對隱含層進行預訓練,最后再對模型進行整體訓練。文獻[6-7]針對傳統評估方法主觀性較強的問題,提出了基于層次分析法與熵權法的空中目標威脅評估方法。文獻[8]將三角模糊函數與畢達哥拉斯猶豫模糊相結合,提出了基于畢達哥拉斯三角猶豫模糊信息集成算子的威脅評估方法。文獻[9]提出了基于可能性理論擴展灰關聯的空中目標動態威脅評估方法,以克服探測信息對目標威脅評估的影響。上述方法為威脅評估方法技術的推進起到了積極的作用,但仍有一些問題沒有得到解決,主要存在4個問題:①研究目標單一,人為主觀因素影響較大;②大多方法都是依賴于定量的數值信息,難以處理非數值信息,如定性分類信息;③模型缺乏可解釋性;④缺乏自適應能力,無法針對復雜的態勢信息建立評估模型。
基于上述分析,本文在自適應模糊神經推理系統(adaptive network based fuzzy inference system,ANFIS)[10]模型結構的基礎上提出一種具有混合數據輸入和多項式神經網絡(polynomial neural network,PNN)的ANFIS(ANFIS with mixed inputs and PNN,M-ANFIS-PNN)模型。針對混合屬性數據建模問題,文獻[11]提出了一種帶有分類數據輸入的ANFIS(ANFIS with categorical inputs,CANFIS)結構,但是其未考慮定性分類數據對模糊規則后件的影響。借鑒C-ANFIS中影響轉移矩陣的特性,在ANFIS模型的基礎上引入規則前件影響矩陣和規則后件影響矩陣,使定量數值數據和定性分類數據對規則前、后件參數同時產生影響;為了進一步提高模型的預測精度,將ANFIS的輸出層替換為PNN[12]結構;針對不同定性屬性對聚類分析的影響,通過信息熵對定性屬性進行加權,優化近鄰傳播(affinity propagation,AP)[13]聚類算法的相似度計算公式,提出一種基于熵權和高氏距離的AP(AP based on entropy weight and Gower distance,EGAP)聚類算法,對M-ANFIS-PNN模型的規則進行初始化,從而完成對M-ANFISPNN的結構進行辨識。同時,提出一種基于M-ANFISPNN模型的目標威脅評估方法,對來襲目標的威脅程度進行預估。最后,仿真實驗結果表明M-ANFIS-PNN模型相較于其他混合數據建模算法具有較高的可信度和較高的評估精度。
實際作戰過程中,目標威脅評估的主要影響因素包括:目標距離、目標速度、目標航向角、目標高度、目標類別、目標攻擊狀態、目標被毀傷狀態、目標指控能力等,其中包含定量數值信息和定性分類信息。針對d個來襲目標進行威脅評估,目標t d的特征信息A d記為A d={ai|i=1,2,…,n,n+1,…,n+m-1,N},其中有n個定量數值特征,m個定性分類特征,N=m+n。常用的目標威脅評估方法中,大多數方法僅對定量數值信息有效,難以處理包含定量數值信息與定性分類信息的混合屬性數據?;诖耍疚奶岢鲆环NM-ANFIS-PNN模型,根據態勢感知系統采集的來襲目標特征信息,以來襲目標狀態信息作為輸入,來襲目標威脅程度作為輸出,建立目標威脅評估模型。
傳統的ANFIS模型僅對數值類型輸入數據具有效果,當輸入信息是包含定性分類信息和定量數值信息的混合數據時,傳統的ANFIS模型無法對其進行有效的推理。假設,對某混合數據集進行推理模型建模,其中有兩個定量數值輸入信息和一個定性分類輸入信息,ANFIS的第l條規則表示為:R l:Ifx1isandx2isandx Cis,Then。其中,x1、x2屬于定量數值輸入信息;x C屬于定性分類輸入信息為模糊子集;y l為第l條規則的后件輸出。而規則Rl中的是無法直接進行計算的,因為x C屬于定性分類數據。
針對傳統的ANFIS模型無法有效處理包含定性分類信息和定量數值信息的混合屬性信息的問題,文獻[11]提出了C-ANFIS模型,在一定程度上解決了混合屬性信息的處理問題。但是,該模型僅將定性分類信息的影響作用于規則前件,沒有考慮定性分類信息對規則后件的影響。針對這一缺陷,本文在ANFIS模型結構的基礎上引入規則前件影響矩陣和規則后件影響矩陣。同時,為了進一步提高模型的準確性,將整個ANFIS的輸出層替換為PNN結構。PNN是一種自組織方法,以Kolmogorov-Gabor多項式為基礎的復雜非線性系統的辨識方法,其拓撲結構不是預先固定的,而是在學習過程中根據輸入變量、網絡結構和網絡參數逐步優化得到的,具有較強的非線性擬合能力,在處理稀少樣本數據建模、預測等方面具有一定的優勢[14-17]?;诖?,本文提出一種M-ANFIS-PNN模型,其主要結構包括模糊層、規則層、規范化層、定性分類信息編碼、前件影響矩陣A、前件混合激勵層、后件影響矩陣C、后件混合激勵層、PNN輸出層,M-ANFIS-PNN模型的結構如圖1所示。

圖1 M-ANFIS-PNN結構圖Fig.1 Structure diagram of M-ANFIS-PNN
各層輸出如下所示。
第1層:模糊層。該層中的神經元對輸入信息進行模糊化操作,每個神經元的輸出都是對規則的激勵強度。本文選取高斯函數作為隸屬度函數,各神經元的輸出可以表示為

式中:cij,σij為模糊規則的前件參數。
第2層:規則層。該層中的每個神經元將輸入信息進行累乘,并輸出其乘積。第l個神經元輸出的結果為第l條模糊規則的激勵強度w l:

第3層:規范化層。對各神經元的激勵強度進行歸一化。

第4層:前件混合激勵層。該層神經元計算混合數據對各規則的激勵強度。

式中:f l=SE·A l,SE為分類信息的獨熱編碼,A l為規則前件影響矩陣的第l列,f l為分類信息對第l條規則的激勵強度。
第5層:后件混合激勵層。計算各規則的輸出結果。

式中:p l=SE·C l,C l為規則后件影響矩陣的第l列,p l為分類信息對第l條規則的激勵影響。
第6層:輸出層。計算M-ANFIS-PNN的總輸出。為了進一步提高模型的準確性,將PNN結構作為輸出層,具體計算過程詳見文獻[18]。
ANFIS模型中基于網格劃分的聚類方法會隨著數據維度的增加導致聚類數量成幾何倍數增長[19],不可避免地導致維度災難,為了克服這一缺陷,本文提出EGAP聚類算法,用來對M-ANFIS-PNN模型進行結構辨識。AP聚類算法相對于其他聚類算法不需要預先指定聚類個數,具有較強的魯棒性和較高的精準度[20-21]。AP算法中樣本空間內各樣本的相似性是通過歐式距離計算的,若樣本信息中包含定性分類信息,AP算法就無法有效的對樣本進行聚類[22-23]。如果僅對樣本空間中的定量數值信息進行聚類,形成的模糊推理結構并不完備,忽略了樣本空間中定性分類信息對結構辨識的影響。Gower距離[24]可以計算定性分類信息之間的距離,但是其計算結果只有0和1,這就使得具有相同距離的樣本可能具有差異很大的屬性值,忽視了各定性屬性之間數據分布的差異性?;诖耍珽GAP算法將Gower距離和信息熵的概念引入到AP算法的相似度度量公式中,一方面充分利用AP算法的優勢,另一方面借助改進后的相似度度量公式有效描述混合屬性數據之間的相似性,使其可以有效對混合屬性數據進行聚類分析,體現出定性分類信息對模型結構辨識的影響。
根據文獻[25-26],定義樣本空間中點x i和點x j之間的Gower距離為

在聚類分析過程中定性屬性與定量屬性對相似度的影響不同,定性屬性作為目標對象的特殊特征,需要獨立處理,而定量屬性則更重視整體效應對相似度的影響[27-28],因此,EGAP算法中樣本點x i和x j之間的相似度s(i,j)的計算公式定義為

EGAP聚類算法的主要步驟如下。
步驟1確定阻尼系數λ、最大迭代次數maxiter、穩定次數conviter,初始化吸引度矩陣R和歸屬度矩陣MA。
步驟2通過式(7)~式(9)計算相似矩陣S,并設置偏向參數p,p=median(S),令相似矩陣S中s(k,k)=p。
步驟3通過式(10)~式(12)更新吸引度矩陣R和歸屬度矩陣A。


步驟4迭代更新吸引度矩陣R和歸屬度矩陣MA,直至聚類中心連續conviter次迭代沒有發生變化或達到最大迭代次數。
步驟5根據求解出的聚類中心對數據進行聚類。對于數據樣本點i,有

如果k=i,樣本點i為聚類中心;如果k≠i,樣本點i為以樣本點k為聚類中心的聚類集群成員。
M-ANFIS-PNN威脅評估模型的構建步驟如圖2所示。

圖2 M-ANFIS-PNN流程圖Fig.2 Flow chart of M-ANFIS-PNN
下面將對M-ANFIS-PNN模型的構建步驟進行詳細闡述:
步驟1將目標狀態信息數據集劃分為訓練數據集和測試數據集。
步驟2選取模糊函數對目標狀態屬性中的定量數值信息進行模糊化。通過EGAP算法對混合屬性數據進行結構辨識,根據聚類集群確定模糊規則的數量,同時確定隸屬度函數及其數量。
步驟3通過獨熱編碼方式對目標狀態信息數據集中的定性分類信息進行編碼。假設數據集中包含兩個定性分類變量目標類別C1和目標攻擊狀態C2,其中C1的候選值為武裝直升機、坦克、無后坐力炮,C2的候選值為一級攻擊狀態、二級攻擊狀態、三級攻擊狀態。
令C1=[C11,C12,C13]、C2=[C21,C22,C23],C1、C2定性分類變量的獨熱編碼SE如表1所示。

表1 C1,C2分類變量的獨熱編碼Table 1 1-out-of-n encoding of C1,C2 categorical variables
步驟4確定M-ANFIS模型的結構和模糊規則。通過對混合數據集的結構辨識得到L條模糊規則,其中第l條規則定義為R l:Ifx1isandx2isand…andx nisandx Cis SE,Thenx n+p l。其中,(x1,x2,…,x n)T為定量數值輸入信息;x C=為定性分類輸入信息。
步驟5確定與M-ANFIS相關的參數。在訓練數據集和測試數據集的基礎上,采用反向傳播算法計算步驟2的前件參數,采用最小二乘誤差法計算步驟4的后件參數、規則前件影響矩陣、規則后件影響矩陣。
步驟6確定與PNN相關的參數。將步驟5的輸出引入到PNN部分,將各層輸入兩兩交叉組合生成下一層參考模型,進一步拓展模型,參考模型一般采用非線性傳遞函數,參考模型的傳遞函數如下:

式中:A、B、C、D、E、F為多項式的系數;k為層數。若有L個輸入變量,將相應地生成個傳遞函數,各傳遞函數的參數通過最小二乘誤差法獲得。
步驟7選擇參考模型。選取Akaike信息準則[29]作為外部評價準則,其計算公式如下所示。

式中:f為參數的數量,q為樣本數量,SSR為估計輸出和實際輸出之間的殘差平方和。根據預先設定的各層模型保留個數,在測試集中以外部準則最小為原則進行模型優選,并將所有模型中最小外部準則值設為生成層的外部準則值。
步驟8評估外部標準。在參考模型優選的過程中,隨著模型復雜度的增加,外部準則值會呈現出先變小后增大的趨勢,當外部準則數值不再減少時,此時獲得的模型即為最優模型[30],自適應組織過程自動停止;如果外部準則值沒有獲得極小值,則重復步驟6~步驟8。
步驟9將來襲目標ti的狀態屬性A i輸入訓練后的M-ANFIS-PNN模型中,通過其對來襲目標的威脅程度進行定量估計。
本文的訓練數據與測試數據為自建數據集,針對陸戰中地面作戰單元和低空作戰單元的特點,按照文獻[5]的方法生成樣本數據集,其包含10個目標特征屬性:目標距離D、目標速度V、目標航向角CA、目標高度H、目標有效射程FR、目標加速度AC、目標類別C、目標攻擊狀態A、目標被毀傷狀態DS、目標指控能力CC,表2為目標特征屬性的取值范圍。

表2 目標特征屬性的取值范圍及屬性值Table 2 Value range and attribute value of the target characteristic attribute
以要地防御作戰為背景,根據作戰想定,指定某野戰部隊駐守某重要資源,在進行資源調度和火力分配前,按需對來襲目標進行威脅評估。通過自建數據集完成M-ANFISPNN威脅評估模型的訓練,使用訓練后的威脅評估推理模型對18個典型目標進行威脅程度R的定量估計,如圖3所示為典型目標示例圖,其評估結果如表3所示。

表3 來襲目標特征信息Table 3 Incoming target feature information

圖3 典型目標示例圖Fig.3 Typical target example diagram
由表3可知目標1的特征信息為

將目標1的特征信息輸入到M-ANFIS-PNN模糊推理機中,根據推理規則確定目標1的威脅程度估計值為0.994 1。目標1為裝甲作戰指揮車輛,具有較好的機動性,具有指揮周圍作戰單元進行協同作戰的能力,具有較強的指控能力,對我方整體防御作戰具有較大威脅。同理,目標2~目標7的威脅程度估計值分別為0.943 1、0.969 9、0.321 4、0.392 7、0.727 6、0.979 4。目 標2和 目標3處于近距離攻擊狀態,且目標3處于近距離定點攻擊,同時擁有較好的攻擊視野,所以目標3的威脅程度高于目標2,二者對我方防御目標具有較大威脅;目標4和目標5遭受到一定程度的毀傷,可能處于撤離狀態或陣地轉移狀態,目標5相對于目標4與防御目標具有較近的距離,且移動速度較低,同時目標5具有較大的射程更容易進入攻擊狀態,所以目標5的威脅程度高于目標4;目標6處于作戰支援狀態,以高速狀態向目標行進;目標7則處于低速低空攻擊狀態,可對地面作戰資源實現火力壓制,對防御目標和我方地面作戰資源具有很大的威脅。目標威脅程度:目標1>目標7>目標3>目標2>目標6>目標5>目標4,上述評估結果與文獻[3]和文獻[4]的評估結果一致,符合實際情況,可以看出本文所提出的M-ANFIS-PNN模型可以有效對來襲目標的威脅程度進行評估。
針對本文提出的M-ANFIS-PNN模型,從模型結構影響分析、結構辨識影響分析和其他幾種典型混合數據推理系統模型誤差對比分析來驗證本文所提出模型的性能。
初始參數設定:EGAP算法中阻尼因子λ設置為0.9、最大迭代次數為1 000,聚類中心連續10次不變為終止條件。M-ANFIS-PNN模型的訓練周期為500,學習率設置為0.01,規則前、后件影響矩陣為[0,1]區間內的隨機矩陣,采用反向傳播(back propagation,BP)算法和最小二乘估計(least squares estimation,LSE)混合方法進行參數修正。
實驗步驟:進行8組實驗,每組隨機從自建數據庫中抽取70%作為訓練集,抽取30%作為測試集。記錄每組測試集的相關系數R、均方誤差MSE、均方根誤差RMSE、誤差均值E-Mean和誤差標準差E-St D,以此來評價預測模型的性能。
2.2.1 模型結構影響分析
C-ANFIS算法僅考慮分類數據信息對規則前件參數的影響,并未考慮其對規則后件參數的影響;同時,PNN模型的特性可以有效提高模型的準確性。為了進一步提高模型的準確性和處理混合數據的能力,本文在ANFIS的基礎上引入規則前、后件參數影響矩陣和PNN結構。
這里通過自建數據集對M-ANFIS-PNN,C-ANFIS,M-ANFIS進行參數辨識,并對來襲目標的威脅程度進行預測。表4為進行8組實驗后,上述3種模型在訓練數據集、測試數據集和全部數據集中的性能表現,各性能指標取8組實驗的平均值。從表4可以看出,在ANFIS基礎上,增加規則前、后件影響矩陣得到的M-ANFIS模型相對于C-ANFIS模型具有更低的預測誤差;而在M-ANFIS基礎上引入PNN網絡結構則進一步降低了模型的預測誤差。圖4為這3種模型的訓練后的預測結果對比圖,可以看出M-ANFIS-PNN模型的預測精度高于C-ANFIS和M-ANFIS模型。綜上所述,本所提出的M-ANFIS-PNN模型相對于C-ANFIS具有更好的性能,有效地降低了模型的預測誤差。

圖4 C-ANFIS、M-ANFIS、M-ANFIS-PNN預測結果對比Fig.4 Comparison of prediction results of C-ANFIS,M-ANFIS,M-ANFIS-PNN

表4 C-ANFIS(C),M-ANFIS(M),M-ANFIS-PNN(M+PNN)算法性能對比Table 4 C-ANFIS(C),M-ANFIS(M),M-ANFIS-PNN(M+PNN)algorithm performance comparison
2.2.2 結構辨識影響分析
由于原ANFIS中網格劃分聚類方法在處理混合屬性數據上存在一定缺陷,本文針對此問題提出一種改進的AP聚類算法,用來對混合輸入數據進行聚類,生成M-ANFISPNN模型的初始規則,從而完成M-ANFIS-PNN模型的結構辨識。自建數據集中有6個數值類型特征,4個分類類型特征。利用AP算法和EGAP算法對數據集進行聚類操作,依據聚類結果對M-ANFIS-PNN模型的規則進行初始化。從數據集中隨機選取8組數據,進行性能對比,其中聚類數量對應著模型規則的數量,預測誤差反映不同結構辨識方法對模型預測精度的影響。AP算法與EGAP算法聚類結果如表5所示。AP算法的聚類數目平均值為35,由于AP算法中的相似度計算采用歐式距離,僅對數值信息有效,無法有效反應實際情況;EGAP算法的聚類數目平均值為14,由于引入熵權法改進的Gower距離代替歐式距離,可以有效處理混合屬性數據,聚類中心也明顯減少。從表5可以看出,兩種結構辨識方法的預測精度比較接近,但是EGAP方法生成的規則數目明顯較少。數據集聚類數目直接影響到M-ANFIS-PNN模型結構的初始規則數目,較少的規則數目可以有效降低模型中的規則參數,有效提高模型參數的辨識速度。

表5 不同結構辨識方法的性能對比Table 5 Performance comparison of different structure identification methods
2.2.3 模型誤差對比分析
為了驗證本文所提算法在混合屬性數據上的評估性能,選取C-ANFIS、F-ANFIS、N-ANFIS混合數據建模方法進行對比實驗[11]。其中F-ANFIS(F)、N-ANFIS(N)、C-ANFIS(C)、M-ANFIS-PNN(M)均采用EGAP算法進行結構辨識。在全部數據集中進行8組實驗,各性能指標為8組實驗結果的平均值,表6為上述4種建模方法的性能表現,通過各評價指標的對比結果可以看出,本文提出的M-ANFIS-PNN模型相對于其他模型具有較小的預測誤差,整體評估結果優于其他模型。

表6 各預測模型誤差對比Table 6 Error comparison of each prediction model
針對混合屬性信息的目標威脅評估問題,本文提出了一種基于M-ANFIS-PNN模型的目標威脅評估方法。針對現有威脅評估模型的局限性,提出M-ANFIS-PNN模型,在ANFIS的基礎上引入前件影響矩陣和后件影響矩陣,使輸入信息中的定性信息和定量信息共同作用于模糊規則的前件參數和后件參數,使評估模型具有處理混合屬性數據的能力;進一步將ANFIS的輸出層替換為PNN,依靠其自組織的特性提高模型的預測精度。同時,將熵權法改進的Gower距離作為EGAP算法的相似度度量,在M-ANFISPNN模型的結構辨識過程中使用EGAP算法,克服了原ANFIS模型無法處理混合數據的缺陷。實驗結果表明,本文提出的M-ANFIS-PNN模型可以有效處理混合屬性數據,具有較高的預測精度,可以有效完成目標威脅程度的定量評估,可為作戰指揮決策提供有效的輔助支持,也為進一步研究目標威脅評估提供了方法參考。
本文所提出的M-ANFIS-PNN的目標威脅評估方法,可以有效完成目標威脅程度的定量評估,但是在實際應用中仍存在一些局限有待改進:M-ANFIS-PNN模型需要大量數據樣本進行參數、結構辨識,若數據樣本不充足,會對威脅評估結果產生影響;參數的調整過程采用梯度下降法和最小二乘法,該混合學習方法具有較好的效果,但容易陷入局部最優。下一步研究工作的重點將從以上兩個問題開展,一方面改進模型以適應小樣本數據集,另一方面結合元啟發式算法對模型參數進行調整。