劉莉雯
摘?要:QAR數(shù)據(jù)記載著飛機(jī)運(yùn)行中的上千種飛行參數(shù)數(shù)據(jù),涵蓋了飛機(jī)運(yùn)行的各個(gè)方面。但QAR數(shù)據(jù)的數(shù)量大、種類多,目前對QAR數(shù)據(jù)的認(rèn)識和應(yīng)用還很有限。隨著數(shù)據(jù)處理技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘方法被應(yīng)用到QAR數(shù)據(jù)處理中,取得了比較好的成果,為航空安全提供了有力支撐和保障。本文闡述了數(shù)據(jù)挖掘的基本原理,介紹了數(shù)據(jù)挖掘在飛機(jī)系統(tǒng)故障診斷、飛行品質(zhì)評估、飛機(jī)健康評估等方面的應(yīng)用,最后總結(jié)了數(shù)據(jù)挖掘所面臨的問題和挑戰(zhàn)。
關(guān)鍵詞:QAR數(shù)據(jù);數(shù)據(jù)挖掘;航空安全
中圖分類號:V247??文獻(xiàn)標(biāo)識碼:A
1?緒論
安全,是航空永恒的話題。近年來,隨著航空安全保障技術(shù)的發(fā)展,民航安全運(yùn)行平穩(wěn)可控,飛行事故的發(fā)生率較低,但飛行事故征候卻時(shí)有發(fā)生。
為了保障飛行安全,局方要求商業(yè)飛機(jī)安裝快速存取記錄器(Quick?Access?Recorder,簡稱QAR)。QAR可連續(xù)記錄飛機(jī)長達(dá)數(shù)百小時(shí)的原始飛行數(shù)據(jù),并且采集飛機(jī)的高度、速度、姿態(tài)、加速度等上千種飛行參數(shù),涵蓋了飛機(jī)運(yùn)行的各個(gè)方面。如何將QAR數(shù)據(jù)充分利用起來用起來,深入發(fā)掘其中有價(jià)值的信息,為飛行安全評估、飛行事故調(diào)查提供數(shù)據(jù)支持,為飛機(jī)維護(hù)工作提供決策依據(jù),是目前航空安全領(lǐng)域研究的熱點(diǎn)。數(shù)據(jù)挖掘是從海量數(shù)據(jù)中找出有價(jià)值信息的過程,并將這些有用信息歸納整理成結(jié)構(gòu)模式,為使用者進(jìn)行評價(jià)和決策的參考。隨著信息科技的飛速發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)廣泛應(yīng)用于工程設(shè)計(jì)和科學(xué)探索的各種領(lǐng)域,航空領(lǐng)域中QAR數(shù)據(jù)的數(shù)據(jù)處理就是它的一個(gè)典型應(yīng)用。
2?數(shù)據(jù)挖掘的原理
數(shù)據(jù)挖掘是從海量數(shù)據(jù)中找出有價(jià)值信息的過程,并將這些有用信息歸納整理成結(jié)構(gòu)模式,為使用者進(jìn)行評價(jià)和決策的參考。
2.1?數(shù)據(jù)挖掘的方法
(1)分類。通過在已經(jīng)分好類的訓(xùn)練集上運(yùn)用數(shù)據(jù)挖掘技術(shù)建立分類模型,將該模型用于數(shù)據(jù)分類。
(2)估值。與分類類似,但估值最終輸出的是連續(xù)型的數(shù)值。
(3)預(yù)測。通過分類或估值的訓(xùn)練得到的模型,如果經(jīng)檢驗(yàn)準(zhǔn)確率較高,則可將該模型用于對未知變量的預(yù)測。
(4)關(guān)聯(lián)規(guī)則。其目的是發(fā)現(xiàn)哪些事情總是一起發(fā)生。
(5)聚類。自動(dòng)尋找分組規(guī)則,判斷樣本間的相似性,把相似的樣本劃分在一起。[1]
2.2?數(shù)據(jù)挖掘流程
數(shù)據(jù)挖掘系統(tǒng)流程如圖1所示。首先,必須要對目標(biāo)有一個(gè)清晰明確的定義。然后,建立數(shù)據(jù)挖掘庫。QAR所記錄的飛行參數(shù)涉及多個(gè)部件和系統(tǒng),數(shù)據(jù)的感知、傳輸、存儲、譯碼的過程中,任一環(huán)節(jié)出現(xiàn)問題,都可能會造成數(shù)據(jù)失真。在建立數(shù)據(jù)庫時(shí),需要對數(shù)據(jù)進(jìn)行預(yù)處理:盡量補(bǔ)全缺失數(shù)據(jù),通過濾波平滑噪聲數(shù)據(jù),刪除孤立點(diǎn)等,將原始數(shù)據(jù)轉(zhuǎn)化為挖掘算法所接受的操作數(shù)據(jù)類型。同時(shí),由于QAR數(shù)據(jù)屬于多傳感器參數(shù)流數(shù)據(jù),有特征維度高、數(shù)據(jù)量大等特性,從幾千個(gè)飛行參數(shù)中找到對輸出結(jié)果影響最大的參數(shù),排除冗余,對數(shù)據(jù)進(jìn)行降維就很有必要。接下來就可以采用合理的挖掘算法,先用一部分?jǐn)?shù)據(jù)建立模型,再對這個(gè)模型進(jìn)行測試驗(yàn)證[2]。模型建立好之后,評價(jià)得到的結(jié)果,解釋模型的價(jià)值,最后將挖掘算法結(jié)果轉(zhuǎn)化為知識。
3?數(shù)據(jù)挖掘在QAR數(shù)據(jù)處理的應(yīng)用現(xiàn)狀
3.1?特征提取
由于QAR數(shù)據(jù)來自于不同系統(tǒng)的多個(gè)傳感器,具有維度多、時(shí)間長、數(shù)量大等特性,從海量數(shù)據(jù)中尋找到有效數(shù)據(jù)是應(yīng)用QAR數(shù)據(jù)的首要問題。
主成分分析法(Principal?Component?Analysis,PCA)基于最大方差理論,用少數(shù)幾個(gè)綜合指標(biāo)提取了原多個(gè)指標(biāo)主要成分的方差信息,去除原始飛參數(shù)據(jù)的冗余,降低數(shù)據(jù)維度,有效地找出數(shù)據(jù)中主成分,能夠有效實(shí)現(xiàn)飛行數(shù)據(jù)的特征提取[3]。但PCA忽略了方差較小方向的數(shù)據(jù)信息,也就是信息提取不完整;其次,它不能獲取不同樣本之間差異特征,而且對非線性數(shù)據(jù)特征提取的效果不是很理想。
為解決以上問題,奇異值分解、深度置信網(wǎng)絡(luò)[4]、卷積神經(jīng)網(wǎng)絡(luò)與長短時(shí)記憶網(wǎng)絡(luò)[5]等有監(jiān)督的學(xué)習(xí)方法也被用于QAR數(shù)據(jù)的特征提取,提高了特征提取的效率。
3.2?在飛行品質(zhì)監(jiān)控中的應(yīng)用
QAR數(shù)據(jù)最初的應(yīng)用就是飛行品質(zhì)監(jiān)控,保障飛行的安全。其在飛行品質(zhì)監(jiān)控中的應(yīng)用于超限分析和安全風(fēng)險(xiǎn)預(yù)測。
(1)超限分析:指對在飛行中QAR所記錄的參數(shù)超出監(jiān)控標(biāo)準(zhǔn)的不安全事件進(jìn)行分析[6]。目前航空公司普遍采用的基于QAR的超限分析方法為:篩選出超限事件所對應(yīng)的航班信息,隨后由專業(yè)人員對照航班信息判讀篩選。國內(nèi)一些航空公司,建立了以QAR數(shù)據(jù)解譯碼系統(tǒng)為基礎(chǔ)的云平臺,根據(jù)飛行超限事件中部分指標(biāo)的重要性不同賦予不同的權(quán)重,對飛行員駕駛等級進(jìn)行量化評定。或者結(jié)合飛行管理系統(tǒng)的航后管理功能,對超限事件涉及的機(jī)組人員進(jìn)行復(fù)訓(xùn),以保證飛行員的操作符合標(biāo)準(zhǔn),保障飛行安全。這樣做固然可以得到超限事件的統(tǒng)計(jì)結(jié)果,但人力成本巨大。為此,學(xué)術(shù)界嘗試基于數(shù)據(jù)挖掘用更智能的方式,如:黃金分割法等,對超限事件進(jìn)行判定,并基于離差最大化原理或聚類理論對飛行參數(shù)賦予不同的指標(biāo)權(quán)重,來構(gòu)建飛行安全評估模型[7][8]。
超限分析大多是飛行超限事件出現(xiàn)后以風(fēng)險(xiǎn)事故調(diào)查的形式展開。這就忽略了沒有超限但有風(fēng)險(xiǎn)傾向的飛行操作行為。
(2)風(fēng)險(xiǎn)行為識別:在現(xiàn)代運(yùn)輸航空中,大部分時(shí)間飛機(jī)都是在按照預(yù)先設(shè)定好的程序自動(dòng)飛行,飛行員主要起監(jiān)督作用。區(qū)別在于,當(dāng)外界環(huán)境變化時(shí),優(yōu)秀的飛行員總是能及時(shí)根據(jù)外界環(huán)境變量的變化,通過飛行操作,實(shí)現(xiàn)對飛行器的平穩(wěn)控制。為此,航空公司作開展了較多有風(fēng)險(xiǎn)傾向的操作行為識別與飛行品質(zhì)評估工作。基于海量QAR數(shù)據(jù)建立飛行風(fēng)險(xiǎn)分析平臺,用飛行風(fēng)險(xiǎn)系數(shù)來評價(jià)飛行員的駕駛行為級別。除了各大航空公司以外,學(xué)術(shù)界對于風(fēng)險(xiǎn)行為識別的討論主要集中在起飛和著陸飛行操作較密集的階段,通過隨機(jī)森林[9]、貝葉斯網(wǎng)絡(luò)、專家經(jīng)驗(yàn)數(shù)據(jù)庫等方法對特定動(dòng)作所表征的風(fēng)險(xiǎn)進(jìn)行討論數(shù)據(jù)。
3.3?在故障診斷中的應(yīng)用
故障診斷是查找設(shè)備或系統(tǒng)的故障的過程。對于飛機(jī)而言,故障診斷的難點(diǎn)在于從參數(shù)中提取反映系統(tǒng)運(yùn)行狀態(tài)的特征向量,對系統(tǒng)運(yùn)行狀態(tài)和異常情況作出判斷,建立系統(tǒng)故障模型,通過特征向量與標(biāo)準(zhǔn)值比較,診斷故障類型,推導(dǎo)故障成因。
QAR數(shù)據(jù)的故障診斷流程如圖2所示,首先需要建立數(shù)據(jù)庫信息,數(shù)據(jù)庫信息包括飛機(jī)QAR數(shù)據(jù)和時(shí)間、機(jī)場條件等其他相關(guān)因素。然后根據(jù)具體需要分析的對象,運(yùn)用知識庫中間的四類知識來進(jìn)行故障模式識別,最終對事件進(jìn)行評估[10]。
飛機(jī)是一個(gè)復(fù)雜系統(tǒng),飛機(jī)上某元件、子系統(tǒng)發(fā)生故障會影響其他部件或子系統(tǒng)也出現(xiàn)異常,呈現(xiàn)出極其復(fù)雜的故障亂象。在故障診斷過程中,面對海量故障信息,最關(guān)鍵的是構(gòu)建故障診斷知識庫。常采用數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則或聚類的方法,通過主成分分析、模糊理論、深度置信網(wǎng)絡(luò)等方法提取故障特征,再利用極限學(xué)習(xí)機(jī)、支持向量機(jī)、卷積神經(jīng)網(wǎng)絡(luò)算法等構(gòu)建故障診斷模型。
3.4?在飛機(jī)故障預(yù)測與健康管理中的應(yīng)用
故障預(yù)測與健康管理PHM(Prognostics?Health?Management)要求通過數(shù)據(jù)監(jiān)控與分析預(yù)測故障的發(fā)生。為了達(dá)到這個(gè)目標(biāo),首先必須對海量數(shù)據(jù)進(jìn)行分析。QAR完整記錄了飛機(jī)飛行過程中上千個(gè)參數(shù),對這些參數(shù)進(jìn)行深入分析,通過關(guān)聯(lián)規(guī)則挖掘出數(shù)據(jù)屬性的潛在聯(lián)系,建立故障預(yù)測模型,判斷飛機(jī)相應(yīng)部件的故障發(fā)生時(shí)間,為預(yù)防性維護(hù)提供決策支撐。故障預(yù)測與健康管理的難點(diǎn)在于健康模型怎么評價(jià),預(yù)測的模型如何創(chuàng)建。現(xiàn)在主流的方法是依據(jù)以往數(shù)據(jù)進(jìn)行分析,這類辦法實(shí)現(xiàn)簡單但精確度不高。另外,還有很多新方法應(yīng)用到了PHM當(dāng)中,也取得了比較好的效果,例如貝葉斯理論、時(shí)間序列分析法等[11]。
4?結(jié)語
自飛機(jī)加裝QAR了幾十年以來,國內(nèi)的航空公司累積了海量的QAR數(shù)據(jù),提高QAR數(shù)據(jù)利用率對于保障飛行安全有非常重要的意義。近年來數(shù)據(jù)挖掘技術(shù)飛速發(fā)展為深入分析、發(fā)掘QAR數(shù)據(jù)信息提供了新的思路。本文匯總了目前數(shù)據(jù)挖掘技術(shù)在QAR數(shù)據(jù)處理中的應(yīng)用。通過將數(shù)據(jù)分類、估值、聚類、發(fā)掘數(shù)據(jù)隱藏的關(guān)聯(lián),為進(jìn)行飛機(jī)系統(tǒng)故障診斷、飛行品質(zhì)評估、飛機(jī)健康評估等提供支持。然而現(xiàn)有的研究多側(cè)重于理論、方法層面,對飛行參數(shù)數(shù)據(jù)的挖掘利用還不夠,同時(shí)缺乏面向工程實(shí)際的體系化研究與應(yīng)用。
參考文獻(xiàn):
[1]張?jiān)?基于非營利性、數(shù)據(jù)挖掘和科學(xué)管理的高校財(cái)務(wù)分析、評價(jià)與管理研究:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2014.05:70.
[2]楊良斌.信息分析方法與實(shí)踐[M].東北師范大學(xué)出版社,2017.01:213.
[3]馮興杰,馮小榮,王艷華.基于核函數(shù)的PCA在QAR數(shù)據(jù)分析中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(14):207209.
[4]戴婧睿,吳奇,仁和,等.基于深度置信網(wǎng)絡(luò)的QAR飛行數(shù)據(jù)特征提取分析[J].電光與控制,2017,24(11):7882.
[5]張鵬,楊濤,等.基于CNNLSTM的QAR數(shù)據(jù)特征提取與預(yù)測[J].計(jì)算機(jī)應(yīng)用研究,2019,36(10):29582961.