陳 鞭,伍友利,吳 鑫,甘躍鵬
(空軍工程大學,西安 710038)
紅外對抗是紅外空空導彈與目標相互博弈的一個過程。紅外對抗是高非線性、高復雜性問題,對其研究的關注點是在不同的對抗場景下,紅外導彈能否命中目標,即脫靶量是否滿足要求。但是紅外對抗中的影響因素眾多,包括導彈、目標、誘餌以及彈目相對態勢等方面,且存在很大的不確定性。對于這種超復雜的紅外對抗問題,雖然目前無法直接給出各影響因素與脫靶量之間的函數關系,但是仍然需要研究其之間的聯系,發現影響導彈抗干擾能力的一些規律。
關聯規則分析是數據挖掘中最活躍的研究方法之一,目的是在一個數據集中找出各項之間的關聯關系,而這種關系并沒有在數據中直接表現出來。文獻[3]利用關聯規則探索危險源原因,從而挖掘出導致危險源的不安全事件。文獻[4]采用關聯規則方法挖掘圖書館圖書流通數據,不僅幫助讀者找到不同學科知識之間的內在聯系,同時還有利于圖書館調整資源布局。文獻[5]使用關聯規則方法研究隧道管片滲漏與盾構掘進參數之間的關聯性,分析關鍵掘進參數滲漏原理。文獻[6]根據數據挖掘理論,挖掘出民航鳥擊事件中各屬性間的關系,從而發現導致鳥擊事件的相關因素。文獻[7]通過關聯規則方法對數據進行挖掘分析,根據得到的關聯規則強弱對紅外抗干擾評估指標體系進行約簡。同樣,關聯規則方法也可應用到紅外對抗問題中,但以上文獻中對于連續型因素都是直接根據經驗人為取值或劃分區間來進行離散化,未充分利用已有數據; 同時,對于挖掘出的關聯規則,直接作為最終規則使用,沒有對規則本身進行深入分析和篩選。
為此,本文將基于獲取的試驗數據,采用-Means聚類算法對連續因素離散化,預處理后用FP-Growth算法進行關聯規則挖掘,然后用和兩個指標對所得規則作進一步分析和篩選。
紅外對抗示意圖如圖1所示。紅外導彈打擊目標飛機時,飛機會投擲誘餌彈來干擾導彈,從而影響導彈的作戰效能。導彈、目標飛機、誘餌是紅外對抗過程中的三個主要因素,此外,還有彈目相對態勢、自然環境等。

圖1 紅外對抗示意圖Fig.1 Schematic diagram of infrared countermeasure
基于以上分析,本文確定的紅外對抗因素見表1。

表1 紅外對抗因素
其中,誘餌齊投數及方向取值:1表示單發左右交替投擲,即目標向左側投擲1枚誘餌,經過相應的組內時間間隔后,再向右側投擲1枚,然后經過組內時間間隔后,再向左側投擲1枚,如此循環,每次僅投擲1枚,直至這一組誘餌投完; 2表示單發左右同時投擲,即目標同時向兩側各投擲1枚誘餌,經過相應的組內時間間隔后,再同時向兩側各投擲1枚,如此循環,每次共投擲2枚,直至這一組誘餌投完; 3表示雙發同時左邊投擲,即目標向左側一次性投擲2枚誘餌,經過相應的組內時間間隔后,再向左側一次性投擲2枚,如此循環,每次投擲2枚,直至這一組誘餌投完; 4表示雙發同時右邊投擲,與3類似。
誘餌組數蘊含在因素的取值中,可由誘餌總數除以每組誘餌數得到,如誘餌總數為12枚,每組誘餌數為4枚,則有3組。一組投完后,經過相應的組間時間間隔,再接著投下一組,且每一組均按照選定的誘餌齊投數及方向投擲誘餌。組與組之間可能有交集:當組內時間間隔較大,而組間時間間隔較小時,一組誘餌可能還沒投擲完,就已經經過了相應的組間時間間隔,需要開始投擲下一組誘餌了,這種情況是可以的。因為在誘餌投擲器中,每組誘餌之間互不干涉,按照設定的程序各自獨立投放誘餌,每組的工作持續時間可能有“干涉”。
目標機動類型取值:1為無機動; 2為右轉彎機動; 3為左轉彎機動; 4為躍升機動; 5為俯沖機動。目標的每種機動類型數據,都是通過軟件生成的,已經包含了飛行速度、機動過載、飛行高度等因素值的設定,生成的機動數據直接裝訂到仿真系統中,試驗時直接選用。
誘餌投擲時刻、導彈水平進入角、彈目初始距離為連續型因素。導彈垂直進入角設為0°。
為了獲取大量數據,基于MATLAB2018和Visual Studio2010,開發了紅外對抗仿真平臺。仿真原理如圖2所示。在表1中,各因素取一個具體值后,構成一個水平組合,即一個具體的對抗場景。由拉丁超立方抽樣方法得到不同的水平組合,即可設置出覆蓋面廣的對抗場景進行仿真試驗,得到所需數據。

圖2 仿真原理圖Fig.2 Simulation schematic diagram
由于關聯規則方法無法處理連續型數值變量,為了將原始數據轉換為適合建模的格式,需要對數據進行離散化。而聚類算法可以充分利用已有數據對連續型因素進行離散化處理。
聚類分析是在沒有給出劃分類別的情況下,根據數據相似度進行樣本分組的一種方法。聚類模型可以建立在無類標記的數據上,是一種非監督的學習算法。聚類的輸入是一組未被標記的樣本,聚類根據數據自身的距離或相似度將其劃分為若干組,劃分的原則是組內樣本最小化而組間距離最大化。常用的聚類方法有劃分方法、層次分析法等,本文采用劃分方法中的-Means算法進行離散化處理。-Means聚類算法是典型的基于距離的非層次聚類算法,在最小化誤差函數的基礎上將數據劃分為預定的類數,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。則誘彈投擲時刻、導彈水平進入角、彈目初始距離聚類離散化后的結果如表2所示。

表2 連續型因素離散分組表
根據表1~2對數據進行預編號,如表3所示。表中共有41個編號,分別對應10個參數的不同項。其中,脫靶量是仿真結果,表示在對應輸入因素作用下,運行紅外對抗仿真系統所得導彈脫靶量。至此數據預處理完畢,可用于后續關聯規則挖掘。

表3 數據編號規則
關聯規則分析也稱為購物籃分析,最早是為發現超市銷售數據庫中不同商品之間的關聯關系,從而采取有效措施來增加超市整體利潤。常用的關聯規則方法有Apriori算法,該算法是通過連接產生候選項及其支持度,然后通過剪枝生成頻繁項集。但是,每次生成新的頻繁項集都要對數據庫進行一次完整掃描,當數據庫較大時,其效率低下。而FP-Growth算法(Frequent Pattern Growth Algorithm)通過構造頻繁模式樹將數據庫進行壓縮,極大地減少數據庫掃描次數,提高算法效率,非常適用于紅外對抗仿真大規模高維度數據挖掘。
關聯規則挖掘中通常使用的度量指標有支持度和置信度兩個,定義如下:
(1) 支持度
支持度表示因素組合項在整個數據記錄中發生的可能性,公式為

(1)
式中:(→)表示因素項發生的同時因素項發生,(,)為因素項{,}的頻數,()為數據庫所包含的記錄數。
(2) 置信度
置信度表示因素項發生的前提下因素項發生的可能性大小,公式為

(2)
置信度過低,則一般認為因素項發生的前提下因素項發生的可能性很小,說明該規則→可信度很低。
關聯規則挖掘就是要找出形如→的表達式,使其支持度、置信度都不小于最小支持度和最小置信度。FP-Growth算法的主要步驟為:首先,根據數據構造出FP樹; 然后,通過FP樹發現滿足最小支持度的所有頻繁項集; 最后,從提取的頻繁項集中找出滿足置信度要求的關聯規則。
基于預處理數據,為得到含有數據量比較少的因素的規則,最小支持度設為0.05,最小置信度設為0.65,通過FP-Growth算法,初步挖掘出關聯規則。
支持度指標受數據記錄總數影響,其度量性能較差,僅用支持度和置信度對關聯規則進行評價不夠全面,需要添加新指標來進一步過濾關聯規則。為此,引入(Kulczynski)和(Imbalance Ratio)兩個指標。和兩個度量指標與數據記錄總數無直接關聯,而是與因素項本身的個數有關,可度量出因素項之間相關性的強弱。當用支持度和置信度得到關聯規則后,因為支持度要考慮到數據記錄總數,這時可能會遺留一些實際上相關性弱的規則,如果與其他規則一起分析和使用,可能會產生矛盾或得到錯誤的結論。而由和兩個指標可過濾掉相關性不強的規則,使剩下的關聯規則更可靠,留下更感興趣的規則。
(1)指標
指標可以視為因素項集{,}之間置信度的平均值,即


(3)
若(,)<0.5,則因素項集{,}之間是負相關; 若(,)=0.5,則因素項集{,}之間無明顯關聯; 若(,)>0.5,則因素項集{,}之間是正相關; 且(,)值越接近0.5,因素項集{,}之間關聯越弱。
(2)指標
指標是度量因素集{,}間的不平衡程度,即



(4)
當(,)值接近0.5時,需要用指標進行二次判斷。若(,)值越接近0,則因素集{,}之間關聯越弱; 若(,)值越接近1,則因素集{,}之間關聯越強。
設置<04或>0.6,min=04,若04≤≤06,則判斷≥min。對于初步獲得的關聯規則,經過和指標評價后,共刪減掉69條關聯規則,得到最終規則。將最終規則分為脫靶量的規則和僅含對抗因素的規則。部分規則分別如表4~5所示。

表4 含脫靶量的關聯規則
表4為紅外對抗因素與導彈脫靶量之間的關聯規則,部分規則分析如下,其余不再贅述。
序號2:規則G1, I1→J1的支持度為30%,置信度為90%,表示導彈水平進入角在0°~60°、彈目初始距離在3~6 km時,脫靶量小于10 m的概率達到90%。此種態勢下彈目距離較近,導彈從尾后攻擊目標,目標飛機尾焰暴露在導引頭視場中,且輻射特征明顯。導彈能識別目標,不會輕易被誘餌誘偏,能穩定跟蹤目標,命中概率大,脫靶量較小。
序號12:規則F1, G2, I2→J3表示誘餌投擲組間間隔為0.2 s、導彈水平進入角在60°~110°、彈目初始距離在6~8 km時,脫靶量大于30 m的概率達到75%。此種態勢下彈目距離較遠,導彈側向攻擊目標,目標部分尾焰被機身遮蔽,且誘餌組間間隔取最小值0.2 s,誘餌能持續保持高輻射,對導彈產生強干擾。此時,導彈被誘偏后,需要較長時間才能再次定位,目標容易逃離導引頭視場,使導彈脫靶,產生很大的脫靶量。
序號13:規則D2, G2, H4→J2表示誘餌投擲時刻在1~2.5 s、導彈水平進入角在60°~110°、目標躍升機動時,脫靶量基本在10~30 m。此種態勢下導彈側向攻擊目標,目標部分尾焰被機身遮蔽,且目標躍升逃逸; 同時,當目標發現導彈后較早地投擲誘餌彈,導彈容易被誘偏,對抗場景十分復雜,對導彈造成很強的干擾,命中率很低,脫靶量一般比較大。
表5為紅外對抗因素之間的關聯規則,表示各對抗因素之間不易發現的關系。

表5 對抗因素之間的關聯規則
序號6:規則F1, B2→D2表示在單發誘餌兩邊同時投擲、組間時間間隔為0.2 s時,誘餌投擲時刻基本上取在1~2.5 s。序號10:規則B1, H3, I1→D1表示彈目初始距離在3~6 km、目標左轉彎機動、誘餌單發左右交替投擲時,誘餌投擲時刻基本上取在1 s以內。序號12:規則D1, E4, I1→B1表示彈目初始距離在3~6 km、誘餌投擲時刻在1 s以內、組內時間間隔為0.4 s時,誘餌投擲方式基本上選單發左右交替投擲。當然,所得各對抗因素之間的一般關系及其組合的效果,還需通過試驗結果進行驗證。
(1) FP-Growth算法可以挖掘出隱藏在紅外對抗因素和導彈脫靶量中的內在關系,為紅外彈的抗干擾評估和作戰使用提供參考。
(2)-Means聚類算法可對連續數據進行離散化處理,能充分利用已有數據,避免人為取值而影響挖掘效率和效果。
(3) 由過濾的69條規則可知,和兩個指標能對挖掘結果進行深度篩選。
文中主要考慮紅外導引頭的外部因素,對于其內部參數和相關算法等方面沒有進行深入分析。同時,獲取更真實的數據、選取合理的類別數、確定合適的篩選指標值,均需要慎重考慮。以上不足和問題都是后續的工作方向。