韓靜茹
摘 要: 中國民航飛行品質監控基站匯集了大量快速存取記錄器( QAR,Quick Access Record)數據,雖然QAR數據具有很高的應用價值,但僅僅基于QAR數據進行分析,維度不夠豐富,而QAR數據包含敏感信息,因此不能利用傳統的拷貝方式,與其他數據進行融合。為解決此問題,本文提出利用虛擬融合技術,經過元數據倉庫構建和元數據關聯等過程,構建QAR數據與其他數據集的融合,以此作為底層數據源,在數據不做物理搬遷條件下,進行多源數據綜合分析,深度挖掘QAR等飛行數據的價值。經過實例驗證,在不復制拷貝的條件下,通過融合基站數據與不安全事件庫,進行關聯匹配分析,匹配結果正確。
關鍵詞: QAR;虛擬融合;飛行品質監控;元數據
1.引言
目前我國要求各運輸航空公司按照民航局《飛行品質監控(FOQA)實施與管理》咨詢通告開展本公司的飛行品質監控工作。[1]2017年,中國民航飛行品質監控基站正式運行,每日收集中國民航三千余架飛機的快速存取記錄器( QAR,Quick Access Record)數據,數據量巨大。QAR數據記錄了整個航段的各類飛行參數的數值,為航空器操作、維修和設計以及民航領域的安全管理提供數據和信息支持。
擁有如此龐大有價值的數據樣本,科研工作者以此為基礎,開展了民航安全、民航運行等各個領域的數據分析工作。目前,QAR數據的利用主要集中在三個方面: 一、飛機性能監控與機務維修。如利用QAR 數據進行航空器性能風險評估。[2]二、利用QAR 數據對飛行品質進行分析。局方基站工程師利用QAR數據開展了各類飛行品質統計分析,如地面滑行時間統計、起降機場風速風向分析、沖偏出跑道風險分析。三、事故調查中,利用QAR數據進行飛行仿真,更直觀的展現事故情形。雖然,QAR數據價值廣闊,利用QAR數據也已經開展了很多相關分析,但是限于QAR數據的特殊性,以上的應用分析研究僅僅依靠QAR單一數據源,數據分析維度單一。若想利用QAR數據進行更深層次的分析,勢必要融合多源數據,比如機組資源數據,運行數據、氣象數據、地質數據等等,而QAR數據相對敏感,不允許采用傳統拷貝復制的方式,與其他數據進行集成融合。
虛擬融合技術能夠很好的解決傳統數據融合物理遷移的問題。本研究引入元數據理念,經過倉庫構建和元數據關聯等過程,構建QAR數據與其他數據集的融合,以此作為底層數據源,在數據不做物理搬遷條件下,進行多源數據綜合分析,深度挖掘QAR等飛行數據的價值。
2.虛擬融合流程
122.1QAR工程值結構
QAR原始數據為二進制文件,經過譯碼軟件譯碼后,可以生成工程值文件,目前比較通用的譯碼軟件如AGS、AirFase,都可將QAR工程值存儲為CSV格式的文件,下圖所示為某架B737飛機的部分譯碼參數的CSV文件:
2.2虛擬融合
元數據(Metadata),又稱中介數據、中繼數據,為描述數據的數據(data about data),主要是描述數據屬性(property)的信息,用來支持如指示存儲位置、歷史數據、資源查找、文件記錄等功能。[3]元數據主要應用在數據倉庫的建立過程中,數據倉庫管理系統的重要組成部分,它描述哪些數據在數據倉庫中,幫助決策分析者對數據倉庫的內容定位;同時定義數據進入數據倉庫的方式,作為數據匯總、映射和清洗的指南。[4]而這些特性可以應用到虛擬融合場景。虛擬融合技術基于元數據理念,通過元數據倉庫構建、元數據關聯,構建數據的虛擬整合。
虛擬融合框架負責建立和存儲元數據模型和模型之間的關聯關系,在數據的分析應用過程中,根據元數據信息將查詢和計算分解,分解后的子查詢和計算下發到各個原始數據庫或文件管理服務器,利用原始本地資源進行計算和查詢,最后將計算和查詢結果在返回到虛擬融合框架,進行業務整合,最終將結果返回應用。整個流程數據始終沒有離開原始存儲位置,返回的中間值為計算結果而非原始記錄,從而保證數據安全的同時,進行了聯合查詢計算。
3.應用案例
1233.1案例概述
局方基站按照《運輸航空承運人飛行品質監控(FOQA)實施與管理》咨詢通告的要求,已經建立了飛行品質監控信息上報的工作程序[5]。每日收集的QAR數據,經過基站事件程序處理,觸發超限事件告警,理論上這些超限事件已經被各航空公司或機場經航安網上報,但實際存在漏報、瞞報的情況。因此局方基站觸發的5級超限事件需要和航安網上報事件進行對比匹配,如果匹配成功,則說明該事件已正常上報,如果匹配失敗,則表明可能存在漏報情況,應啟動事件核查程序。
選取局方基站觸發超限事件與航安網不安全事件庫進行匹配。同時,與CSV文件進行關聯,將超限時間前后5秒的監控參數值輸出。
3.2融合機理
實驗總共涉及三個數據源,如下:
1、QAR工程值文件:實驗選取全量參數CSV文件作為數據源之一。
2、局方基站超限事件庫:該事件庫為AGS系統采用的Sybase數據庫,存儲了AGS處理QAR原始數據生成的超限事件。
3、航安網不安全事件庫:該事件庫為Oracle數據庫,存儲了全民航上報的不安全事件。
QAR工程值文件命名規則為:飛機號 + FileNo + 譯碼日期,FileNo為AGS譯碼軟件譯碼后生產的唯一標識。因此與局方基站超限事件庫可通過飛機號與FileNo號關聯;局方基站超限事件庫與航安網不安全事件庫匹配原則為:飛機號相同,事件觸發時間與事件上報時間相差小于48小時。如滿足匹配原則,則視為匹配成功。
3.3結果展示
利用上述邏輯,對三個數據源數據進行融合,在此基礎上匹配查詢了2018年7月的接地俯仰角超限事件,查詢結果如下圖所示:
比對結果列表顯示8條數據,其中前4列顯示信息為局方基站超限事件庫,后三列為航安網不安全事件庫,根據飛機號和發生事件核對,匹配結果正確,但是存在兩條超限事件關聯同一條航安網事件的情況,這是由于兩個系統監控事件關注點不同,超限事件同一航班監控到兩條事件,而事件發生原因屬于文字描述,如果需要進一步精準對比則需利用文本挖掘進行匹配,但不屬于本課題關注點,在此不進行詳述。
點擊結果中某條數據,可以查看當前事件前后10分鐘的CSV明細數據,如下圖所示,顯示了無線電高度、垂直加速度、低速、空速等信息。
4.結束語
本文主要討論了一種基于虛擬融合技術的QAR應用分析模式,指出了在數據不做物理遷移的情況下,進行QAR數據與多源數據融合的思路,進而多維度的挖掘QAR數據的應用價值。通過事件對比案例,展示了融合后分析結果,驗證了虛擬融合框架對簡單數據運算的處理。但對于復雜模型的數據分析,算法可能存在無法有效拆分的情況,因此利用運算分解替代數據拷貝復制,無論從運算正確率還是運算效率上都需進一步驗證,可作為下一步研究的方向。
參考文獻
[1] 俞力玲. 中國民航飛行品質監控回顧與展望[J].航空安全,2012,8(140):51-53.
[2] 祁明亮、邵雪焱、池宏. QAR超限事件飛行操作風險診斷方法[J]北京航空航天大學學報 2011,10 (37):1207-1210.
[3] 吉文杰、夏小玲. 基于元數據的電子政務發布系統的設計與實現[J].計算機應用與軟件,2011,12(28):175-178.
[4] 余葉蘭. 基于銀行數據倉庫的元數據管理體系研究[J]. 湖北第二師范學院學報,2017,2(34),38-40.
[5] 中國民用航空局.飛行運行品質監控(FOQA)實施與管理(AC-121/135-FS-2012-45).2012.