(中國飛行試驗研究院,西安 710089)
航空飛行試驗工程大數據管理與應用思考
黨懷義
(中國飛行試驗研究院,西安710089)
飛行試驗是航空裝備研制的重要環節之一,形成和產生的工程數據具有明顯的大數據特征;傳統的以試驗測試數據為主的數據管理思想,難以保證試飛工程數據及其關系的完整性和準確性,無法全面表征飛行試驗全過程,不利于試飛數據的再利用;在分析航空飛行試驗復雜系統工程的有機組成及其工程大數據的本質特征和邏輯結構的基礎上,結合近年來在飛行試驗數據管理和處理研究中取得的技術成果和實踐經驗,提出了基于試飛工程全生命周期的航空飛行試驗工程大數據管理思想,以試驗對象為中心的一體化大數據采集和系統化大數據結構模型,和面向業務的基于SOA的分布式系統框架,便于建立一個綜合、全面、開放的試飛工程大數據管理和挖掘應用平臺,促進航空產品試飛數據處理效率的提升和試飛工程大數據在航空科研中的挖掘和廣泛應用,發揮試飛工程大數據的發展助推作用。
航空;飛行試驗工程;大數據;管理;應用研究
近年來,隨著信息技術的發展,大數據成為各行各業重點關注和研究的熱點問題,并且成為世界各國助推自身發展的強力催化劑,提升到國家戰略層面進行研究、發展和實施,大數據范式是科研的第四范式[1]。1980年,阿爾文·托夫勒[2]等人預知大數據時代即將到來,與當時信息化方興未艾所涉及的信息爆炸其內涵應該是相同的。大數據的定義較多,維基百科給出了大數據的定義:大數據是指利用常規的軟件工具獲取、管理和處理數據所耗時間超過可容忍時間的數據集。學界對此定義雖然討論和異議頗多,我認為這個定義從內涵上是非常準確的,能夠涵蓋不同行業的不同類型和不同應用需求的各種大數據,也說明大數據本身就是一個模糊而確定的概念。大與小是相對的,換言之,能快速地獲取、完整地管理和維護、高效地分析和處理的數據,都可以不認為其為大數據。因此,大數據是每個時代都有的,由于受限于那個時代的收集、管理和處理的工具與方法,總會有我們無法滿意地應對的大數據存在。英國信息專家維克托·邁爾-舍恩伯格在他的《大數據時代:生活、工作與思維的大變革》[3]一書中,也準確地詮釋了大數據的深刻內涵-大數據的核心是分析、處理和預測。人們對大數據的概念特征也莫衷一是,通常認為大數據具有數據量大(Volume)、數據種類多(Variety),要求處理的時效性高(Velocity)和數據有價值(Value),即4 V特征。維基百科的大數據的定義加上4 V的基本特征,有助于人們較為準確地理解大數據的基本概念。不同行業具有各異的數據基礎,所面臨的大數據屬性、概念及其處理方法則會迥異。航空飛行試驗大數據則是航空裝備與系統研制過程中的重要數據信息資源,不但具有典型的大數據特征,同時由于航空制造業本身的特點,飛行試驗大數據也是獨具特質。
航空飛行試驗是復雜的系統工程[4],涉及到設計、制造及試驗及用戶等眾多部門、環節、專業以及復雜過程;試驗周期長,一般占航空產品研制周期的1/2以上(約4~8年);試驗內容極為復雜,這是由飛機系統的復雜性所決定的;風險大,新品發生事故的概率高,常常出現機毀人亡的災難性事故;耗資巨大,一般占產品研制總經費的50%以上。圍繞航空裝備的飛行試驗研究所產生的數據具有典型的大數據特征,除了具有大數據的4 V特征之外,還具備以下特征:①精確性要求高(Veracity)。飛行試驗工程是科學研究工程,確保飛行試驗能夠安全可靠實施,試飛工程所采集獲取的數據是航空裝備產品鑒定/定型的根本依據,因此必須真實、精確、完整、可靠。②非結構化(Un-structure)。飛行試驗工程產生的數據中,大約有3%~5%的數據是結構化的數據,或者說這些數據可以結構化,能夠利用傳統的數據庫管理系統軟件進行管理、維護和處理應用,其余97%的數據是非結構化數據,無法結構化的數據,或者結構化后也無法利用傳統的方法進行分析處理的數據。③復雜性(Complexity)。航空工業素有“工業之花”之稱,裝備及其試驗的復雜性決定了試飛數據的復雜性。試飛數據表征了航空器及其系統的綜合工作狀態,其中夾雜了復雜多變的真實環境條件因素,蘊含著工程方法、專業機理和綜合復雜系統因素與系統狀態之間交互的復雜邏輯關系,以及人們無法通過觀察或測試手段去探測獲取的復雜工程模型,試飛數據的復雜程度是可想而知的。
圖1給出了飛行試驗工程數據所具有的4 V+UC的大數據屬性特征[5]。

圖1 試飛工程大數據的屬性特征
航空飛行試驗大數據與其他行業大數據一樣,由于其越來越復雜以及越來越大的規模而給管理與處理工作帶來了巨大的挑戰,而日益發展的航空裝備對試飛大數據的管理的廣度與應用的深度、功能的全面與多樣與處理效率等的需求則是越來越高。本文分析了航空飛行試驗大數據結構特點,結合近年來在航空飛行試驗大數據管理與應用實踐中所取得的研究成果,以及大數據行業技術的未來發展方向,針對性地提出了航空飛行試驗大數據管理與挖掘應用的一些思路。
航空飛行試驗工程數據即圍繞試驗對象,涵蓋飛行試驗工程全過程所形成的數據。圖2給出了航空飛行試驗工程數據的管理結構模型。

圖2 航空飛行試驗工程數據結構模型
航空產品的全生命周期應該包括設計、制造、試驗和保障4個關鍵環節,因此,航空產品飛行試驗工程數據應該是航空產品數據的重要組成部分之一。飛行試驗工程數據管理結構模型中,每一過程數據項實際上都是一個數據內容龐大、邏輯關系復雜、數據類型多樣、功能流程迥異的大數據關系模型,達到工程數據管理與試驗業務實現的統一。
飛行試驗工程大數據管理結構模型的設計需要把握飛行試驗業務特點,主要從以下3個方面考慮:
1)綜合傳統數據庫和現代數據倉庫的設計思想。
傳統數據庫解決的是業務自動化的問題,實現業務的聯機處理,而數據倉庫解決的是包括歷史數據在內的業務數據的綜合分析,實現業務的綜合決策。飛行試驗數據管理既要滿足型號試驗數據的統一管理和處理需要,同時需要對試驗數據進行客觀、持久的積累和管理,滿足對試驗任務的決策分析和試飛數據的溯源應用。一個型號的飛行試驗會持續多年數千架次,單架次產生的各類數據信息將近1 TB,飛行試驗數據更會伴隨著產品的生命周期而存在,數據管理滿足日常持續的試飛數據處理業務需要的同時,隨著試飛任務的不斷深入進行,也需要不斷抽取和提煉歷史綜合數據信息滿足試飛任務決策分析的需要,符合數據倉庫應具有的面向主題的、集成的、時變的、穩定的技術特征,兼顧了試飛業務需要和航空科研試飛數據挖掘需要[5]。
2)建立元數據接口標準,滿足龐大的試飛工程數據倉庫設計需要。
元數據(metadata)是關于數據的數據,提供關于信息資源或數據的一種結構化的數據,是對信息資源的結構化的描述[6]。一般采用XML語言作為元數據語言的基礎。其作用包括描述信息資源或數據本身的特征和屬性,規定數字化信息的組織,具有數據的定位、發現、評估和選擇等功能。元數據是數據倉庫的中心庫,是組織、管理和維護試飛工程數據管理模型的基礎紐帶,覆蓋試飛工程數據信息全生命周期。針對試飛工程數據信息特點,設計標準化的元數據接口,將繁雜的試飛工程數據信息有機地關聯聚合在一起,形成完整的試飛數據倉庫。

圖3 元數據與試飛工程數據管理結構模型
如圖3所示,在試飛工程數據管理結構模型中,所有的節點內部和節點之間,都是依靠飛行試驗元數據標準接口建立起關聯關系的,如同膠水一樣將所有數據信息及業務功能連接在一起。
3)以試驗對象為中心,設計一體化的試飛工程大數據管理模型。
每一個型號的飛行試驗實際上是產品研制過程的延續,而且試飛過程漫長,專業性強,技術復雜,業務流程環節緊扣。因此,試飛工程數據(Test Data Management)管理模型既要涵蓋試飛工程全過程,還需要與產品設計數據(Design Data Management)、制造數據(Manufacture Data Management)以及運行保障數據(Operation Data Management)進行對接,形成完整的、一致的、全生命周期的航空產品數據倉庫(Product Data Management),如圖4所示。試飛工程數據管理模型的一體化體現在兩個方面:一方面是與設計、制造及運保數據的一體化,建立產品全生命周期數據接口,維護產品數據的一致性、完整性關聯關系,便于產品的改進、改型、完善以及運行維護,確保產品試驗數據信息的可追溯性。另一方面是涵蓋試飛工程全過程的一體化,從試飛工程的規劃開始,到試驗設計、試驗實施、試驗保障和試驗總結,即涵蓋試飛工程全生命周期。

圖4 航空產品數據倉庫的構成
航空產品數據的生命周期不但需要覆蓋航空產品的生命周期,從科學研究的角度,航空產品數據是永久的科學資料檔案。數據的完整性和可溯源性也必須始終保持,能夠從產品的任何一個物理部件或邏輯屬性,貫穿到該部件在制造、試驗環節中的相關工程信息,反之亦然,這是航空產品本身的特性所決定。
大數據問題是一個復雜的問題,大數據的共性特征并沒有掩蓋不同的領域和行業內大數據本身的物理與邏輯應用特性,更加說明了大數據本身的復雜。航空飛行試驗大數據不僅規模大,而且數據的關聯性極強,因此必須系統性地針對試飛工程業務設計航空飛行試驗工程大數據系統架構,涵蓋試飛工程全過程,解決試驗大數據的完整性建模、管理、整合、共享、分析以及歸檔和挖掘應用集成問題。圖5為飛行試驗工程大數據系統架構。

圖5 飛行試驗工程大數據系統架構
飛行試驗工程大數據系統架構是管理和維護試飛工程全過程大數據信息完整性和可靠性的基礎架構,也是試飛工程的業務工作平臺架構,同時是飛行試驗工程管理與應用的一體化平臺,實現飛行試驗一體化過程的復雜數據信息的全面管理和應用,既保證了數據的完整有效性,又保證了數據靈活可用性。
邏輯上,數據層是系統架構的基礎層,每一類大數據與所對應的業務相匹配,同時各類大數據之間以試驗對象為紐帶相互關聯;服務層由面向服務的中間件集合組成,用于實現試驗大數據的管理和應用服務,也包括系統級的應用服務組件,如異構數據的管理與存儲服務、大數據的各類計算服務以及業務調度等服務,采用SOA架構,便于應用的擴展、實現和管理;頂層為面向用戶的接口層,面向航空行業設計、制造、試驗以及科學研究等各類用戶,可以采用B/S或者類B/S接口模式,實現用戶對一體化的試驗大數據的應用;而飛行試驗工程大數據管理與應用標準體系、飛行試驗工程大數據元數據接口標準則是支撐整個系統架構、維護試飛工程大數據的完整性和可靠性的重要紐帶,縱橫貫穿于飛行試驗工程大數據管理的方方面面。飛行試驗是一體復雜的系統工程,試驗數據的復雜性和精確性是尤其所具有的科學性所決定的,這也是試飛大數據的顯著特色,加之航空工業是一個國家的特殊行業,對因此試飛大數據的管理、處理與應用特點也會大有不同。
3.2.1 基于ALM的TDM
圖1可以看出,試飛工程大數據由少量的結構化數據和大量的非結構化數據組成,圖2可以看出,這兩者是一個有機的整體。圖6為試飛工程全生命周期數據采集過程的概要示意。

圖6 試飛工程數據采集過程
飛行試驗占航空產品研制周期1/3甚至更多,持續4~8年之久。飛機系統幾乎涉及到所有的工業專業,每一個專業的試驗和飛行試驗工程整體一樣,都需要經過試驗規劃、試驗設計、試驗實施、試驗結果、試驗總結等5個過程,試飛工程數據縱橫交錯,從深度和廣度上都需要一體化采集和系統化管理,這樣才能保證試驗數據的完整和全面,實際上就是基于ALM(應用生命周期)的TDM(試驗數據管理),這是唯一可能的、可實現的可靠與可用的技術實現方法。
3.2.2 有特色的非結構化大數據的采集管理
試飛工程大數據中,非結構化大數據占97以上。以我國新支線客機ARJ21-700飛行試驗為例,單架次測試參數1~1.5萬個,包括各類視頻數據在內,單架次數據總量50~100 GB,飛行試驗數據總量大約500 TB以上。
飛行試驗非結構化測試大數據的采集具有自主技術特色。①在滿足機載工程復雜環境技術要求的條件下,采用通用化的百兆、千兆網絡實現高速率海量試驗數據的采集和記錄,取代傳統的、低速率的、專用的PCM(脈沖碼調整)結構模式,同時借助先進的嵌入式處理器技術,將傳統單一記錄功能的記錄器擴展為具有數據同步、分路/分流、記錄、處理等綜合功能的嵌入式系統,實現數據處理功能前置,提高數據處理整體效率;②利用成熟的4 G無線通訊、光纖通訊等鏈路技術,取代傳統的無線電遙測,提高遙測傳輸帶寬,滿足高帶寬海量數據的遠程傳輸處理需要;③借用Hadoop大數據技術思想,如并行分片、并行存取、元數據特征等,解決在通用WinIntel系統架構平臺下,具有時序特征的非結構化試飛測試大數據的高效存儲、管理和備份問題,滿足試飛工程各業務部門通用化的數據訪問、處理、備份和管理應用需求。實際的飛行試驗工程中,開展了必要的技術探索和實踐,取得了一定的技術效果。
試飛工程大數據是反映試飛系統工程以及飛機系統各專業的特征數據,試飛工程是一個科學的系統工程,因此試飛工程大數據是真實的、科學的,并且具有很到的研究價值,這一點與通用的大數據特征是不同的。試飛工程大數據的處理與挖掘應以專業的發展需求為牽引推動和實施,包括專業的預先研究和技術創新。
3.3.1 提高試飛綜合效能的試飛實施數據處理挖掘
數據挖掘就是知識發現,利用現代的數學方法和原理,借助先進的信息技術手段,把埋藏在復雜數據信息之間的已知、未知或想知的知識、原理、模型等提煉出來。
以飛行試驗工程規劃與實施數據信息為主的數據處理挖掘任務,主要內容包括涵蓋試飛工程管理全過程,支持業務應用的數據管理與處理,以及提升綜合試飛效能的數據挖掘分析。圖7所示。

圖7 試飛綜合效能提升數據處理與挖掘
3.3.2 探索解決飛行器工程科學難題的專業數據挖掘
試飛工程大數據中,非結構化測試大數據經過分析處理,其數據結果是以時間為同步軸的參數歷程數據,反映了試飛員與飛機系統整體運行特征。參數之間的關系是非常復雜的,涵蓋了飛機總體、動力裝置、機載設備與系統等所有專業,參數之間的同步關系非常嚴格。在飛行試驗中,測試工程師利用各種技術手段,耗費巨資盡可能地把工程專業所需的各類參數測試記錄下來,實際上還有很多專業人員所需的參數無法直接測量得到,只能通過已知參數進行建模分析,最后得到飛機系統的試驗鑒定結論。由此可見,試飛測試數據具有很高的科學研究價值。圖7給出了飛機系統飛行試驗測試數據的示意圖。

圖8 飛機系統試驗測試數據
飛機系統各專業的數據挖掘研究以本專業科學理論和思想為基礎開展,國外航空發達國家開展此項研究工作的深度和廣度與其航空工業的發展水平相匹配,專業發展成就有目共睹,而我國針對飛行試驗測試數據的挖掘應用則處于初級階段,試驗數據的挖掘利用比率為個位數,因此迫切需要建立試驗數據的共享機制,確保數據安全的同時,為研究機構提供試驗數據廣泛應用,推動我國航空工業技術的發展。本文不再贅述。
飛行試驗是復雜的系統工程,同時又是一個集所有的工程專業的科學研究工程,飛行試驗工程的橫向管理實施與縱深專業研究所產生的試飛工程數據,除了有常規大數據的基本特點之外,還具有高價值、復雜性、非結構化的鮮明特征,因此,飛行試驗工程大數據的管理和處理應用所面臨的技術任務更為艱巨。上世紀末至今,飛行試驗工程數據的管理先后經過了C/S架構、B/S架構、混合架構,探索了基于SOA的云技術架構等[7],數據管理與處理應用并進,試飛測試大數據的管理效率與處理能力取得了較大發展,但是由于試飛工程涉及的環節多、數據信息復雜、持續周期長以及工程應用廣等問題交織,建立面向包括飛行試驗在內的航空科研應用的、一體化的試飛工程全生命周期大數據管理與應用體系一直是專業技術人員努力的目標。信息技術的飛速發展,為試飛工程大數據的一體化采集、系統化管理、專業化挖掘研究提供了技術基礎,而大數據價值與理念在試飛工程技術中的深入影響也為一體化的試飛工程大數據的設計實現提供了內動力,也是航空飛行試驗工程技術發展的需要。建立面向航空行業的試飛工程數據中心,實現寶貴的科研試飛數據的共享和深入應用,是大數據技術條件下推動航空技術飛速發展的引擎,是試飛工程技術人員不斷努力的技術方向。
[1] 李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域-大數據的研究現狀與科學思考[J].中國科學院院刊,2012(6):647-657
[2] 托夫勒.第三次浪潮[M].北京:中信出版社,2006.
[3] 維克多·邁爾-舍恩伯格.大數據時代[M].上海:浙江人民出版社,2012.
[4] 周自全.飛行試驗工程[M].北京:航空工業出版社.2010.12
[5] 黨懷義,典型大數據倉庫-飛行試驗數據倉庫設計[J].
[6] 孟小峰,慈 祥.大數據管理概念技術與挑戰[J].計算機研究與發展.2013,50(1):146-169.
[7] 基于WEB 的分布式試飛數據處理系統結構設計[J].計算機測量與控制. 2010.18(6):1452-1453
ApplicationStudyofFlightTestProjectBigDataManagementandMining
Dang Huaiyi
(Chinese Flight Test Establishment,Xi′an 710089,China)
Flight test is one of the important links of the development processing, its engineering data forming and producing have the outstanding characteristics of big data. The traditional test data management thought based on measurement data can hardly ensure the engineering data integrality and relation accuracy, is unable to show entirely the flight test processing, and has more disadvantages to reuse the data. On the basis of analysis of the organic constitutions of the flight test project, and its engineering data properties and logical structures, combining with the achievements and practice experiences in flight test data management and processing technology in the recent years, proposes series pivotal investigation results and thoughts in currently technique conditions: the thought about engineering data management covering the whole lifecycle of the flight test project; the big data structure model for the center of the flight object with integral collection and systematic management; the design method of the system frame based on SOA faced to professional operations. It enables to setup a comprehensive, overall and open flight test big data management and mining system platform, helping to improve the data processing efficiency in flight test, and to exert the engineering data widely using and mining to drive the aeronautics technical research.
aeronautics;flight test project;big data;management;application research
2017-04-30;
2017-05-26。
黨懷義(1967-),男,陜西合陽人,研究員,主要從事飛行試驗數據處理與軟件技術方向的研究。
1671-4598(2017)11-0299-04
10.16526/j.cnki.11-4762/tp.2017.11.076
TP273
A