曹俊彬,邵 航,姜 坤,李俊杰,王正武,劉萬鎖
(空軍工程大學(xué) 航空機(jī)務(wù)士官學(xué)校,河南 信陽 464000)
習(xí)主席指出,當(dāng)今世界正經(jīng)歷百年未有之大變局[1]。縱觀全球,世界強(qiáng)國必是航空強(qiáng)國,航空強(qiáng)國必有航空領(lǐng)域國家戰(zhàn)略科技力量[2]。在大數(shù)據(jù)與人工智能時代,航空科技領(lǐng)域成為了大數(shù)據(jù)與人工智能技術(shù)落地應(yīng)用的重要行業(yè)領(lǐng)域[3]。同時,數(shù)據(jù)挖掘與人工智能技術(shù)也成為了賦能航空科技發(fā)展,保障航空質(zhì)量安全水平的有力技術(shù)支撐手段。
航空質(zhì)量控制,特別是軍用航空質(zhì)量控制,強(qiáng)調(diào)通過對機(jī)務(wù)人員上崗資質(zhì)、航空裝備完好狀態(tài)、航空裝備使用壽限等使用狀態(tài)層面進(jìn)行全面質(zhì)量管理,來全面提升航空質(zhì)量水平,保障航空質(zhì)量安全。
質(zhì)量缺陷與安全事故是同株異面的雙生花。航空質(zhì)量控制涉及與航空安全相關(guān)的人、機(jī)、料、管、環(huán)的方方面面。ISO9001標(biāo)準(zhǔn)指出:“質(zhì)量是一組固有特性滿足要求的程度”[4],質(zhì)量特性則是滿足某種要求的質(zhì)量水準(zhǔn)所表現(xiàn)出的某些固有特性[5]。而關(guān)鍵質(zhì)量特性則是“若超過規(guī)定的特性值要求,會直接影響到產(chǎn)品安全性、產(chǎn)品整體功能或者顧客對產(chǎn)品滿意程度的質(zhì)量特性[5]”。
探尋軍用航空器事故包含的關(guān)鍵質(zhì)量特性,就是通過對各種途徑采集到的關(guān)于航空器質(zhì)量安全保障的屬性值開展數(shù)據(jù)分析,將所采集到的屬性值數(shù)據(jù)根據(jù)業(yè)務(wù)流程特點(diǎn)分解到機(jī)務(wù)專業(yè)對于的人、機(jī)、料、管、環(huán)等層面,以及可以被標(biāo)記與識別的二級層面,進(jìn)而從預(yù)防軍用航空器事故發(fā)生的角度,開展全面質(zhì)量管理;這個過程就是尋找引致軍用航空器事故的關(guān)鍵質(zhì)量影響因素,以便在今后的工作中以更有效的航空質(zhì)量控制手段加以約束,從而使得航空質(zhì)量安全水平得到根本性的提升。
本研究將構(gòu)建一種軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型,以對內(nèi)和對外的兩種數(shù)據(jù)分析需求為牽引,以“從數(shù)據(jù)到情報(bào)”的信息層級躍遷為導(dǎo)向,組建不同功能模塊層次,最終輸出可供航空維修一線人員參考使用的軍用航空器事故關(guān)鍵質(zhì)量特性分析情報(bào),輔助航空裝備維修保障和質(zhì)量控制人員改善工作流程與作業(yè)方式,提高航空裝備的質(zhì)量安全水平。
該軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型滿足了我方對外和對內(nèi)兩個方面的數(shù)據(jù)分析需求,既有利于智能感知外軍航空兵器的建設(shè)與運(yùn)用情況,為我國安全態(tài)勢分析與外軍戰(zhàn)略企圖研判提供智力支持;又有利于智慧管理我軍航空兵器的維修與保障情況,為內(nèi)部質(zhì)量安全績效考核與裝備維護(hù)完好狀況掌控提供決策依據(jù)。
在數(shù)據(jù)挖掘系統(tǒng)模型的功能架構(gòu)上,采用4階3層的模式架構(gòu),即通過A層、B層和C層3個數(shù)據(jù)處理功能層的計(jì)算與處理,使得有關(guān)事故數(shù)據(jù)按照“數(shù)據(jù)→信息→知識→情報(bào)”[6]的信息層級躍升,最終提煉出軍航事故的關(guān)鍵質(zhì)量特性,形成可供決策與行動的航空質(zhì)量安全情報(bào)。其中,A層為數(shù)據(jù)收集與預(yù)處理層,該層從互聯(lián)網(wǎng)和內(nèi)部網(wǎng)這兩個相互物理隔離的網(wǎng)絡(luò)中,以人工智能方法和數(shù)據(jù)庫方法爬取信息、抽取字段、并組建標(biāo)準(zhǔn)化和字段化的事故檔案;B層為數(shù)據(jù)挖掘與知識發(fā)現(xiàn)層,該層集成了眾多先進(jìn)的機(jī)器學(xué)習(xí)算法,并提供了算法擴(kuò)展和二次開發(fā)的接口,做到了算法互通,以最前沿、最有效的機(jī)器學(xué)習(xí)算法對標(biāo)準(zhǔn)化字段化的軍航事故檔案開展數(shù)據(jù)挖掘和知識發(fā)現(xiàn);C層為數(shù)據(jù)可視化與情報(bào)分析層,該層集成了眾多先進(jìn)的可視化方案,以數(shù)據(jù)可視化的方式展示數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的成果,并促進(jìn)知識發(fā)現(xiàn)成果的可視化智能決策。將經(jīng)過數(shù)據(jù)挖掘得到的與關(guān)鍵質(zhì)量特性有關(guān)的情報(bào)成果,分解為航空質(zhì)量控制專業(yè)所關(guān)注的,如:人員資質(zhì)、完好狀態(tài)、使用壽限等層次的情報(bào)產(chǎn)品,分發(fā)給與之相關(guān)的機(jī)務(wù)保障部門使用,可以切實(shí)地提升航空裝備維護(hù)保障的質(zhì)量安全水平。軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型,如圖1所示。

圖1 軍航事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘系統(tǒng)模型
生成標(biāo)準(zhǔn)化、字段化的航空事故檔案是進(jìn)行下一步數(shù)據(jù)挖掘的前提與基礎(chǔ)。我們通過以外部網(wǎng)絡(luò)空間為主渠道的數(shù)據(jù)獲取方式,來獲得與我們所需的國際軍用航空器事故相關(guān)的文本、圖片、音頻、視頻等海量異構(gòu)的數(shù)據(jù)信息,通過網(wǎng)絡(luò)爬蟲和人工智能技術(shù)將這些信息轉(zhuǎn)化為標(biāo)準(zhǔn)化、字段化的航空事故檔案。如圖2所示,就展示了將網(wǎng)絡(luò)新聞文本轉(zhuǎn)換為標(biāo)準(zhǔn)化、字段化的事故檔案的過程。

圖2 外需版軍航事故檔案標(biāo)準(zhǔn)字段內(nèi)容的生成過程
通過自然語言處理模塊對新聞文本進(jìn)行分詞,并使用深度神經(jīng)網(wǎng)絡(luò)對分詞以后的特性語句(如包含時間、機(jī)型等信息的語句)進(jìn)行識別并自動填入檔案的字段。與此同時,(數(shù)據(jù)獲取與預(yù)處理模塊)經(jīng)過訓(xùn)練的高級深度神經(jīng)網(wǎng)絡(luò)還具備自動糾偏的功能。例如:在本例中,該墜機(jī)事件發(fā)生的真正時間是2019年3月31日(并非頁面時間2021-06-18),它由“3月份最后一天”和“2019年墜毀的第10架飛機(jī)”這兩個語句通過深度學(xué)習(xí)的邏輯分析整合而成。
根據(jù)數(shù)據(jù)挖掘系統(tǒng)的需求分析和結(jié)構(gòu)設(shè)計(jì),主要考慮從互聯(lián)網(wǎng)獲取的外軍軍航事故的進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)特性和任務(wù)實(shí)際,本文設(shè)計(jì)了如圖3所示的數(shù)據(jù)挖掘與知識發(fā)現(xiàn)層算法流程,該算法流程可以實(shí)現(xiàn)對外軍軍航事故的時間、空間和關(guān)聯(lián)規(guī)則層面的關(guān)鍵質(zhì)量特性的挖掘與分析。

圖3 軍航事故關(guān)鍵質(zhì)量特性數(shù)據(jù)挖的算法流程
所設(shè)計(jì)的算法流程目前擁有關(guān)鍵時間質(zhì)量特性、關(guān)鍵空間質(zhì)量特性以及關(guān)鍵關(guān)聯(lián)質(zhì)量特性3個數(shù)據(jù)挖掘子模塊,所設(shè)計(jì)的功能模塊和算法流程具有兼容性和開放性,并且留有二次開發(fā)的接口,在同一個系統(tǒng)平臺之下,可以整合利用不同的計(jì)算機(jī)語言所編寫的程序及軟件,且支持使用本系統(tǒng)的單位自行開發(fā)定制化的功能模塊。
本模塊基于對時間相關(guān)字段的統(tǒng)計(jì)分析和指標(biāo)計(jì)算,建立起關(guān)鍵時間質(zhì)量特性的分析框架,并為后續(xù)的時間序列分析和時間關(guān)聯(lián)分析等算法的加入做好了數(shù)據(jù)儲備。
首先,對標(biāo)準(zhǔn)化、字段化的事故檔案的日期、星期等與時間有關(guān)字段進(jìn)行計(jì)數(shù);然后,以合適的可視化方法進(jìn)行初步描述性統(tǒng)計(jì),以反映星期規(guī)律和季節(jié)規(guī)律等;最后,可以調(diào)用有關(guān)算法進(jìn)行時間序列分析,并對裝備失效和事故致因行為進(jìn)行早期預(yù)警。
為了更精確和更深入地定量分析墜機(jī)事件的安全態(tài)勢狀況,本文設(shè)計(jì)了依從時間序列統(tǒng)計(jì)的有傷率(Injury Ratio)、無傷率(Safety Ratio)和墜機(jī)風(fēng)險態(tài)勢指標(biāo)(Situation Ratio)3個量化指標(biāo),其定義式如下
(1)
式中:N表示數(shù)據(jù)集中墜機(jī)事件的總量;墜機(jī)事件被不重復(fù)也不遺漏地二分為有傷亡的墜機(jī)事件(其數(shù)量為Ninj)和無傷亡的墜機(jī)事件(其數(shù)量為Nsaf)。
最后,本模塊的挖掘結(jié)果,還可以作為時間序列分析等高級數(shù)據(jù)分析方法的數(shù)據(jù)輸入。
本模塊基于GIS系統(tǒng),聚焦軍航事故空間特性,使用GIS軟件內(nèi)置地學(xué)算法,對所提取的標(biāo)準(zhǔn)化、字段化的軍航事故檔案地理特性字段進(jìn)行可視化分析,包括但不限于計(jì)數(shù)分析、密度分析、堆疊分析、緩沖區(qū)分析等,進(jìn)而發(fā)現(xiàn)這些事故在地理空間上的規(guī)律,為輔助決策提供直接的空間分析依據(jù)。圖4是本研究擬啟用的關(guān)鍵空間質(zhì)量特性挖掘的GIS系統(tǒng)功能模塊。

圖4 關(guān)鍵空間質(zhì)量特性挖掘的GIS系統(tǒng)功能模塊
本模塊基于關(guān)聯(lián)規(guī)則開展數(shù)據(jù)挖掘,它被用于無監(jiān)督知識發(fā)現(xiàn),即搜索大量變量之間的有趣聯(lián)系[7]。Apriori算法[8]由美國學(xué)者Rakesh Agrawal和Ramakrishnan Srikant于1994年提出,該算法引入先驗(yàn)信念的概念來減少關(guān)聯(lián)規(guī)則的搜索空間[9]。將度量關(guān)聯(lián)規(guī)則有效性的計(jì)量指標(biāo)定義如下:
(1)X?Y的支持度(Support):定義為前項(xiàng)和后項(xiàng)在整個數(shù)據(jù)集中同時發(fā)生的頻率[10]。其中:N表示事務(wù)數(shù)據(jù)集的事務(wù)數(shù)總和,σ(Z) 表示表示事務(wù)集Z的頻數(shù),TX表示包含項(xiàng)目X的事務(wù)集,TY表示包含項(xiàng)目Y的事務(wù)集[10]
(2)
定義X自身的支持度為
(3)
(2)X?Y的置信度(Confidence):定義為支持度與前項(xiàng)頻率之比[10],即發(fā)生過X后,同時也會發(fā)生Y的概率,即
(4)
(3)X?Y的提升度(Lift):定義為置信度和后項(xiàng)頻率之比[10],即度量X與Y的之間的獨(dú)立性,代表了關(guān)聯(lián)強(qiáng)度和規(guī)則價值(一般地,Lift值大于1,規(guī)則才有價值[11]),即
(5)
(4)X?Y的出錯度(Conviction):定義為X出現(xiàn)而Y不出現(xiàn)的概率,意義在于度量規(guī)則預(yù)測錯誤的概率[12],即
(6)
本文搜集了從2002年11月至2021年1月共218個月被網(wǎng)絡(luò)媒體公開報(bào)道過的100起Y國空軍墜機(jī)事件,事件數(shù)據(jù)集涵蓋了根據(jù)我國軍機(jī)分類標(biāo)準(zhǔn)劃分的殲擊機(jī)、攻擊機(jī)、運(yùn)輸機(jī)、教練機(jī)、直升機(jī)和無人機(jī)共6個機(jī)種,涉及20個機(jī)型。按照表1的字段格式整理并錄入Excel 2016版本軟件,另存一份CSV UTF-8格式文件到本地以備用。查看整理后的部分?jǐn)?shù)據(jù)見表2。

表2 Y國空軍墜機(jī)事件數(shù)據(jù)集
根據(jù)對數(shù)據(jù)集星期字段的數(shù)據(jù)透視計(jì)數(shù)結(jié)果,繪制Y國空軍墜機(jī)事件星期分布的柱狀統(tǒng)計(jì),如圖5所示。

圖5 100起公開報(bào)道的Y國空軍墜機(jī)事件的星期維度分布
墜機(jī)事件發(fā)生的概率與飛機(jī)的出動強(qiáng)度和維修任務(wù)強(qiáng)度息息相關(guān),一般飛行日的事故概率較高,機(jī)械日的飛行事故概率較低。由圖5可知,近20年的歷史數(shù)據(jù)告訴我們:Y國空軍的墜機(jī)事件的分布并非均勻,也有自己的“生理期”[13]。Y國空軍在周一、周四和周末的墜機(jī)數(shù)量明顯低于平均水平,由此可以推測:Y國空軍大多數(shù)部隊(duì)的機(jī)械日是周一和周四,飛行日是周二、周三和周五,周末實(shí)行雙休制度。周三是兩個連續(xù)飛行日的第二日,飛行員和機(jī)務(wù)人員的身心疲勞度增加;且隨著累計(jì)飛行時間增加,飛機(jī)零部件的安全性能下降,根據(jù)軌跡交叉理論[14],當(dāng)諸多不安全因素發(fā)生交叉時,就會誘發(fā)安全事故。另外,按照周四至周六墜機(jī)數(shù)量的中值,周五墜機(jī)數(shù)量的期望值應(yīng)該為8.5架,但實(shí)際值卻是期望值的近3倍,這表明Y國空軍有在周五出動大機(jī)群執(zhí)行戰(zhàn)訓(xùn)任務(wù)的習(xí)慣。
根據(jù)時間質(zhì)量特性挖掘模塊設(shè)置的計(jì)算指標(biāo),對有傷率(Injury Ratio)、無傷率(Safety Ratio)和墜機(jī)風(fēng)險態(tài)勢指標(biāo)(Situation Ratio)3個量化指標(biāo)進(jìn)行計(jì)算和可視化展示,如圖6和圖7所示。

圖6 一周內(nèi)Y國空軍墜機(jī)有傷率與墜機(jī)無傷率分布

圖7 一周內(nèi)Y國空軍墜機(jī)有傷事件與墜機(jī)無傷事件數(shù)量之比
由圖5結(jié)合圖6和圖7可知,周三的墜機(jī)數(shù)量最多,但是周四的有傷率和墜機(jī)風(fēng)險態(tài)勢指標(biāo)最高,從航空安全的角度而言:周三周四的墜機(jī)概率最大,即“周三周四”效應(yīng)。周日墜機(jī)數(shù)量最少,但周一的無傷率最高,墜機(jī)風(fēng)險態(tài)勢指標(biāo)最低,從航空安全的角度而言:周日和周一的飛行任務(wù)最安全,即“一周之交”效應(yīng)。
基于與Quantum GIS 3.6.2版本軟件的數(shù)據(jù)接口,對數(shù)據(jù)集“所屬地區(qū)”(District字段)數(shù)據(jù)透視的計(jì)數(shù)結(jié)果進(jìn)行分檔填色地圖形式的地理可視化,圖例分級采用詹克斯自然最佳斷裂點(diǎn)分類(Jenks natural breaks,JNB)方法[15],得到圖8。

圖8 100起公開報(bào)道的Y國空軍墜機(jī)事件的地理分布注:所示的Y國版圖僅為該國的合法領(lǐng)土,不含存在爭議的地區(qū)。
墜機(jī)數(shù)量的烈度分布,與Y國空軍的訓(xùn)練計(jì)劃安排有關(guān),也在一定程度上反映了不同區(qū)域的戰(zhàn)機(jī)出動烈度,以及相關(guān)的空軍戰(zhàn)備資源儲備情況;在無法獲取外軍的訓(xùn)練手冊與訓(xùn)練計(jì)劃的情況下,通過墜機(jī)事件的數(shù)據(jù)挖掘可以一定程度地反推外軍組訓(xùn)施訓(xùn)的計(jì)劃與意圖。
由圖8可知,Y國空軍墜機(jī)事件發(fā)生最多的區(qū)域是位于Y國西北部的拉賈斯坦邦,是其對陣B國的戰(zhàn)略要沖,表明:在Y國高層的空軍戰(zhàn)略層面,最大的威脅與假想敵是B國;Y國空軍在應(yīng)對Z國的戰(zhàn)略方向上并沒有放松準(zhǔn)備,與Z國Z省西部直接毗鄰的喜馬偕爾邦,與Z國Z省南部直接毗鄰的阿薩姆邦,與Z國J省接壤的存在爭議的克什米爾地區(qū),以及直面Z國但被N國隔開的北方邦,這些地區(qū)的墜機(jī)烈度僅次于拉賈斯坦邦,且在墜機(jī)總數(shù)上超過了拉賈斯坦邦,對Z國西部的Z省和J省形成了半環(huán)形的針對之勢。
本研究使用基于R語言的算法集成,對數(shù)據(jù)集展開基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘,輸出關(guān)聯(lián)規(guī)則的熱力散點(diǎn)圖(如圖9所示)、分組矩陣圖(如圖10所示)和網(wǎng)絡(luò)結(jié)構(gòu)圖(如圖11所示)。

圖9 Y國空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的熱力散點(diǎn)圖注:parameter=list(support=0.2,confidence=0.2),找出對應(yīng)的70條關(guān)聯(lián)規(guī)則。

圖10 Y國空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的分組矩陣圖

圖11 Y國空軍墜機(jī)事件關(guān)聯(lián)規(guī)則的網(wǎng)絡(luò)結(jié)構(gòu)
具有高提升度的關(guān)聯(lián)規(guī)則呈現(xiàn)出“低支持度-高置信度”的特性,大部分規(guī)則的支持度在[0.2,0.3]以內(nèi);而置信度的分布則跨越[0.2,0.9],較為集中的高置信度區(qū)間是[0.7,0.9];提升度基本上都在1.2以上,表明所示的規(guī)則均是有意義的,且顏色越深價值越大。
分組矩陣圖以杰卡德距離[16](Jaccard Distance)來衡量不同規(guī)則之間的相似程度,并將共同點(diǎn)較多的規(guī)則聚合成類,以此體現(xiàn)聚類規(guī)則的分布情況[17]。圖中圓點(diǎn)的尺寸大小表示支持度的大小,圓點(diǎn)的顏色深淺表示提升度的大小。如圖10所示,先導(dǎo)(LHS)被聚為23類,后繼(RHS)被聚為10類(另有3個聚類因聚類效果不明顯,被程序自動刪除)。以規(guī)則的結(jié)果,即后繼(RHS)為線索,梳理高價值(lift>1.6)的規(guī)則群組,見表3。

表3 從分組矩陣圖提煉的高價值規(guī)則群組
具有高提升度的高價值規(guī)則被抽象為了6個群組,涉及墜機(jī)事件的機(jī)種、原產(chǎn)國、事故致因和事故結(jié)果的4個層面。為了進(jìn)一步分析重要的關(guān)聯(lián)規(guī)則及其因果關(guān)系,使用網(wǎng)絡(luò)結(jié)構(gòu)圖對關(guān)聯(lián)規(guī)則進(jìn)行可視化,如圖11所示。
網(wǎng)絡(luò)結(jié)構(gòu)圖表達(dá)了關(guān)聯(lián)規(guī)則的因果關(guān)系,展現(xiàn)出重要的關(guān)聯(lián)規(guī)則。箭頭源頭表示先導(dǎo),箭頭指向表示后繼[17],顏色的深淺表示提升度的大小,尺寸的大小表示支持度的大小。圖11所示的關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖譜中,主要呈現(xiàn)出“致死規(guī)則”和“幸存規(guī)則”兩種隱性知識。
“致死規(guī)則”是 {飛行員傷亡=有}?{原因=操作失誤,星期=星期五,時段=上午}, 翻譯為自然語言:“因人為操作失誤而導(dǎo)致的墜機(jī)事件,會很大概率上導(dǎo)致飛行員的傷亡。”飛行員因?yàn)椴僮魇д`而導(dǎo)致原本飛行姿態(tài)正常的戰(zhàn)機(jī)陷入險情,其背后可能隱藏著飛行員精神狀態(tài)不佳、應(yīng)急操作不熟、身體狀況抱恙等隱性原因。飛行員自身的應(yīng)急處置是守護(hù)自己與戰(zhàn)機(jī)安全的最后一道屏障,如果失守,所致的飛行事故必然是慘重的。此外,致死飛行事故大多發(fā)生在星期五上午,可能是某些Y國的體制因素導(dǎo)致飛行員在周五上午處于一周中生理與心理狀態(tài)的低谷,且周五上午飛機(jī)出動強(qiáng)度較大所致。
“幸存規(guī)則”是 {飛行員傷亡=無}?{機(jī)種=殲擊機(jī),原產(chǎn)國=蘇聯(lián),原因=機(jī)械故障}, 翻譯為自然語言:“駕駛蘇系殲擊機(jī)因機(jī)械故障而導(dǎo)致墜機(jī)的,往往不會發(fā)生飛行員傷亡。”,這條規(guī)則具有“意料之外,情理之中”的藝術(shù)性,但也是科學(xué)嚴(yán)謹(jǐn)?shù)摹R环矫妫琘國空軍保有的蘇系殲擊機(jī),如米格-21等,是上世紀(jì)50-70年代首飛的老舊機(jī)型,超齡服役、維護(hù)不佳、維修不力等因素使其本身就易發(fā)生機(jī)械故障;另一方面,蘇系殲擊機(jī)具有一定的可靠性,在發(fā)生機(jī)械故障后能給予飛行員一定的應(yīng)急處置時間,也給予了飛行員在最危急的關(guān)頭選擇彈射逃生的時間。
本文以Y國空軍墜機(jī)事件數(shù)據(jù)集為例,對構(gòu)建的軍用航空器事故關(guān)鍵質(zhì)量特性數(shù)據(jù)挖掘模型進(jìn)行了具體的技術(shù)測試,結(jié)果表明:該模型能夠很好地處理與分析來自國際互聯(lián)網(wǎng)的外軍軍航事故數(shù)據(jù),并從時間、空間、關(guān)聯(lián)三大維度來挖掘事故背后的關(guān)鍵質(zhì)量特性,能提取對我方有益的航空裝備情報(bào),特別是蘇系飛機(jī)維修保障裝備情報(bào);做到了以數(shù)據(jù)挖掘技術(shù)賦能航空裝備保障的智慧決策,為航空質(zhì)量安全水平提升提供了有力支撐。
本算例得到的關(guān)于軍航事故的關(guān)鍵因素與特性規(guī)律,還能被進(jìn)一步地細(xì)化分解。例如:與時間有關(guān)的關(guān)鍵因素和特性規(guī)律,可進(jìn)一步被分解到與機(jī)務(wù)保障日程相關(guān)的班組工單層面,并能與人、機(jī)、料、管、環(huán)的安全因素維度相關(guān)聯(lián),進(jìn)一步得出更加符合機(jī)務(wù)保障工作實(shí)際細(xì)節(jié)的具體影響因素;時間字段通過數(shù)據(jù)擴(kuò)展,可以關(guān)聯(lián)到具體任務(wù)和具體飛機(jī)所處的氣象環(huán)境,并與地理空間特性挖掘的結(jié)果相結(jié)合,得出引致軍航事故發(fā)生的外部環(huán)境質(zhì)量特性;通過關(guān)聯(lián)分析,將引致軍航事故發(fā)生的外部環(huán)境質(zhì)量特性與飛機(jī)本身固有的可引致軍航事故發(fā)生的內(nèi)部環(huán)境質(zhì)量特性(如:機(jī)型特有的機(jī)械結(jié)構(gòu)或維護(hù)環(huán)節(jié))相結(jié)合,得出相對完整的軍航事故關(guān)鍵質(zhì)量特性知識圖譜和關(guān)聯(lián)規(guī)則,為機(jī)務(wù)保障和維修管理提供班組級的智能化、定制化維修細(xì)節(jié)應(yīng)對方案。
本文提出了一種軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型,由2個主要的需求牽引型功能板塊和3個功能層次模塊所組成。以算例驗(yàn)證了本模型的可行性與可靠性,得到以下結(jié)論:
(1)以100起被公開報(bào)道的Y國空軍墜機(jī)事件數(shù)據(jù)集為算例基礎(chǔ),驗(yàn)證了模型的有效性,并提取出了時間、空間、關(guān)聯(lián)三大維度的規(guī)律,且具備被進(jìn)一步分解到航空機(jī)務(wù)各專業(yè)所關(guān)注的要素的潛質(zhì)。
(2)數(shù)據(jù)挖掘得到的關(guān)鍵質(zhì)量特征知識,會被向量化地存入系統(tǒng)內(nèi)置知識庫,具有可擴(kuò)展性和可復(fù)用性,能作為訓(xùn)練集數(shù)據(jù),對特定輸入情況下、未來潛在的軍航事故進(jìn)行預(yù)測與預(yù)警。
(3)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)通過挖掘與精煉,在內(nèi)置知識庫中積累為一個巨大的軍航事故關(guān)鍵質(zhì)量特性向量空間,這些質(zhì)量數(shù)據(jù)將成為未來基于數(shù)字孿生的軍航事故狀態(tài)監(jiān)測與質(zhì)量控制數(shù)據(jù)分析平臺的重要基礎(chǔ)。
所構(gòu)建的軍用航空器事故關(guān)鍵質(zhì)量特性的數(shù)據(jù)挖掘模型初步達(dá)到了設(shè)計(jì)的目標(biāo),下一階段還需要將封裝好的系統(tǒng)投入實(shí)際使用,以檢驗(yàn)其有效性,并通過運(yùn)行反饋,不斷迭代與完善,將會為未來基于數(shù)字孿生技術(shù)的數(shù)據(jù)挖掘與分析系統(tǒng)的研發(fā)提供良好的數(shù)據(jù)基礎(chǔ)與技術(shù)啟示。