(中國飛行試驗研究院,西安 710089)
近年來,隨著信息技術的發展,大數據成大數據已經成為世界各國持續發展、提升綜合競爭能力的強力助推劑,提升到國家戰略層面大力進行產業化研究、推動和發展,大數據范式已經成為科技發展的第四科研范式[1]。1980年,阿爾文?托夫勒等人預知大數據時代即將到來[2],與當時信息化方興未艾所涉及的信息爆炸其內涵應該是相同的。正如所料,人類已經由以IT(信息技術)為代表的信息技術時代轉為以DT(數據技術)為關注焦點的數據信息技術時代,大數據時代的核心是以大數據為基礎的大數據分析、處理和預測[3],數據已經成為企業組織最大的價值來源和最重要資產,數據模型是支撐全企業業務架構數字化平臺與全管理架構信息化平臺的重要基礎,該數據模型的組成結構、數據流向、邏輯關系、數據內容、數據狀態等,形成了數字孿生企業,以數字形式反映企業的業務全貌。因此,數據質量直接關系到基于數據的企業管理、業務決策、創新發展等工作的正常、準確開展,直接影響數據應用價值的發揮。航空飛行試驗是航空產品研制過程中的重要一環,而飛行試驗數據的形成過程及組成結構極為復雜,飛行試驗數據治理是確保試驗數據信息全面、完整、科學、準確的重要手段,也是開展以試驗大數據為基礎的航空技術發展研究的重要基礎,本文針對飛行試驗工程及航空技術研究發展應用需求,提出了一套完整的飛行試驗數據治理體系,對于以試驗大數據為基礎的數字化試飛、試驗大數據科研價值挖掘以及促使航空技術快速步入大數據科研范式的發展之路,具有非常重要和深遠的意義。
航空飛行試驗是航空產品由成品走向產品的最后一個環節,涉及到航空產品的設計、制造、試驗及使用等多個組織、環節、專業的綜合協同,試驗對象的研制本身是一個復雜的系統工程,而飛行試驗更是一個基于復雜對象的復雜系統工程[4]。如圖1所示。飛行試驗具有周期長、專業廣、難度大、工程復雜、風險高、耗資巨等特點,因此成為很多國家望航空制造業而卻步的最大障礙之一。在航空產品的規劃研制初期,針對航空產品功能、性能以及系列使用指標的飛行試驗即開始進行策劃,并進行早期設計。在航空產品研制過程中,飛行試驗是航空產品不斷驗證、完善、再驗證的循環過程,即使航空產品服務于用戶,飛行試驗的使命仍然在繼續,不僅為用戶提供更好、更全面的產品使用服務,同時利用基于歷史試驗數據的驗證試驗,開始了下一代航空產品的研究發展。

圖1 飛行試驗過程組成結構示意圖
航空產品飛行試驗工程數據即圍繞試驗對象,涵蓋飛行試驗工程全過程所形成的數據。航空產品飛行試驗工程數據是航空產品數據的不可分割的重要組成部分之一,不僅直接支撐航空產品的研制鑒定/定型,同時對產品的改進改型、模擬仿真、飛行員培訓、新技術探索與預先研究、專業工程建模與優化等潛在巨大的科研價值。試飛工程本身的特點,決定了試驗數據的本質特征,不但具有目前普遍認可的大數據特征之外,還具有精確性、復雜性、非結構化特征[5],以及本身所具有的科學性、系統性、時序性等顯著特點。實際上,對于航空飛行試驗來說,大數據問題一直存在,伴隨著人類對航空技術的不斷探索與解決問題的能力的不斷提升而交替發展。如圖2所示,試飛工程大數據的采集形成過程就是飛行試驗系統工程的復雜運行過程[6]。

圖2 航空產品試飛工程數據采集形成過程
飛行試驗數據是科學大數據,具有典型工業大數據特征,工信部研究報告《2017工業大數據白皮書》指出,工業大數據不僅具有大數據的特征,還具有價值性、實時性、準確性和閉環性的典型特征,以及業界普遍認為的集成性、預測性、科學性等特征,分別從內涵、屬性、用途、關系、來源等方面對工業大數據的特性進行了描述,工業大數據來源于工程實踐,又是工程實施、改進、完善和發展的重要基礎,所以對工業大數據的質量要求非常高。航空飛行試驗工程所形成的大數據更是如此。
多年的管理和應用研究表明,航空產品飛行試驗數據的質量評估特征主要有:
①完整性。覆蓋航空產品飛行試驗工程全過程(包括由于試驗過程中產品、試驗方法等不斷完善而反復進行試驗所產生的相對應版本的數據),完整、全面地表現試驗工程管理和試驗過程信息。
②準確性。客觀、真實地反映飛行試驗的全過程,盡量減少和避免人工或系統產生的錯誤、誤差等影響。
③規范性。存儲或記錄格式遵從規范。
④一致性。內涵或數據值無沖突。
⑤可追溯性。數據之間的關系明確,從試驗過程的開始,到試驗過程的結束,可由任何一個數據向前或向后進行工程關系的追溯。
而影響飛行試驗工程數據的質量特性的因素主要有以下幾個方面:
①試飛工程持續時間長,試驗場分布多,試驗數據形成時空跨度大。
②航空試驗涉及到管理和眾多工程專業,試驗內涵深、外延廣,數據形成過程及其組成復雜。
③試飛工程涉及的環節多、工作面廣,數據來源既有眾多的工程管理部門,還包括多個技術協同協作部門和人員,同時還有海量的工程測試數據,試驗數據采集來源廣。
④試飛工程試驗數據組成復雜,既有結構化數據,還要非結構化數據,更多大量的科學時序工程數據,而且很多類型的數據屬于專用類型,需要專業的數據處理軟件進行解析,數據類型非常之多。
⑤試驗數據量巨大,以大型客機C919為例,平均單架次各類試驗數據總量將近1TB,并且與試驗工程數據之間具有復雜的關聯關系。
要實現飛行試驗數據治理目標,需要針對飛行試驗數據的質量特性及其影響因素,全方位圍繞試飛工程業務,建立體系化的試驗數據治理方案。
數據是業務的核心,數據治理是伴隨數據的產生而存在的。而進入DT時代,數據治理問題隨著大數據發展而更為突出,越來越多的企業意識到數據治理的必要性、重要性和緊迫性,越來越希望通過進行數據治理來創造更多的業務價值。數據治理是確保數據的完整性、規范性、一致性的重要方法,確保以數據為核心的業務流程的準確執行和企業業務恰如其分的正確決策,解決困擾企業的信息孤島問題、數據質量問題、應用效率問題、數據安全問題等一系列問題,為建立現代智慧企業提供數據保障。。國外大型信息技術企業,從上世紀信息時代發展初期就意識到這一問題,持續投入巨大的人財物資源開展數據治理研究工作,IBM公司從1992年開始,形成了一整套完整的數據治理技術體系,發展出一系列用于數據治理的數據高附加值產品。近年來,數據治理及相關標準體系的研究也成為國內各行各業研究的熱點之一,我國數據治理技術發展取得了一定成績,在國際標準化工作組SC40/WG1(IT 治理工作組 )提出了《數據治理白皮書》國際標準研究報告,并獲得了認可,同意由中國國家委員會負責進行相關國際標準指南的編寫工作[7]。
《數據治理白皮書》給出了標準化的數據治理模型,如圖3所示。

圖3 標準的數據治理模型
白皮書給出了標準的數據治理模型由3個框架組成:原則、范圍和方法,即數據治理的三要素:數據治理的基本原則、數據治理的范圍以及數據治理實施評估方法,全面概括了數據治理的要素,描繪出了數據治理的基本思路和技術藍圖。
業界的數據治理標準(ISO38505-2)給出的數據治理基本過程如圖4所示。

圖4 標準的數據治理過程
數據治理過程就是圍繞涵蓋業務開展相關全過程的數據源,以符合專業應用的元數據/主數據標準規范為基礎,按照確定的業務流程和關系進行業務數據采集、管理和應用,覆蓋業務的全過程,擴展到業務數據的生命周期。參考標準的數據治理過程,針對飛行試驗工程特點,建立飛行試驗大數據治理體系。
圍繞飛行試驗大數據治理特性,針對影響飛行試驗大數據質量特性的諸多因素,利用先進的數據治理技術、理論、方法等體系思想,貫穿飛行試驗系統工程的全過程,建立飛行試驗大數據治理技術管理與應用體系,為飛行試驗工程技術的發展,乃至航空工業技術的發展提供數據基礎。飛行試驗大數據治理體系,通過將試飛工程業務流程、業務策略、業務標準、業務邏輯以及試飛工程組織管理體系進行有機、有效地設計、管理和實施,在試飛工程信息化業務系統中全面實現和執行,提升試驗大數據的質量特性。
飛行試驗大數據標準體系是開展飛行試驗大數據治理的重要技術保障,是支撐以試驗大數據為基礎的試飛工程業務及其數字化應用發展的重要基礎。飛行試驗的大數據標準體系組成結構如圖5所示。

圖5 飛行試驗大數據標準體系
飛行試驗的大數據標準體系由試飛大數據基礎標準、試飛大數據業務標準、試飛大數據平臺標準、試飛大數據管理標準、試飛大數據應用標準和試飛大數據安全標準等6部分組成,標準的范圍和內容涵蓋了飛行試驗大數據基本定義、產生、管理、存儲、安全、應用等生命周期全過程。
①試飛大數據基礎標準主要描述試飛大數據治理的基本要求、基本概念、基本術語、元數據等基礎標準,規范和統一試飛工程大數據的標準體系。
②試飛大數據業務標準圍繞試飛業務流程,按照大數據基礎標準的規范要求,針對試飛大數據的采集、預處理、二次處理/綜合處理、分析評估等業務數據進行規范。試飛大數據業務標準是試飛大數據治理標準體系的重要組成內容,以試驗對象數據為核心,按照飛行試驗鑒定/定型/適航技術要求,包括試驗任務的規劃、設計、仿真、驗證、執行與監控、分析與評估、報告與結論等全過程。
③試飛大數據平臺標準針對試飛大數據的技術產品和應用平臺進行規范。包括結構化/非結構化數據庫、智能分析工具、分析處理平臺、數據應用等方面。數據平臺是管理、維護大數據試飛業務關聯關系準確性、可靠性和一致性的基礎。主要包括平臺架構、存取方式、分析、處理等標準規范,還包括試飛業務內部及設計、制造和維修等外部之間進行數據交換的各類數據的接口規范。
④試飛大數據管理標準主要描述試飛大數據產生和形成的全過程管理要求,包括大數據的采集、存儲、傳輸、備份、再利用以及銷毀等全生命周期的規范要求。
⑤試飛大數據應用標準針對試飛業務內、外提供試飛大數據的應用和服務進行規范,包括技術、功能、開發、維護、管理等方面。也就是對于航空產品設計、制造、試驗和維修等不同用戶的數據集規范、應用范圍、管理要求等。
⑥試飛大數據安全標準是試飛大數據治理標準體系的支撐,貫穿于試飛大數據生命周期,主要包括試飛大數據安全和保密兩類。
針對影響飛行試驗工程數據的質量特性的諸多因素,涵蓋試飛業務流程全過程,從組織管理、業務流程、技術管理等多方面建立飛行試驗大數據的質量管控體系,達到飛行試驗大數據的完整性、準確性、規范性、一致性和可追溯性的質量管理目標。
試飛工程是航空產品研制系統工程的重要組成,試飛工程本身是一個復雜的系統工程,飛行試驗大數據治理則按照系統工程管理和運行的思想方法實施,與航空產品設計制造數據、運行維護數據形成完整的航空產品數據。圖6給出了試飛系統工程與試飛大數據治理業務流程。

圖6 試飛系統工程與飛行試驗大數據治理
在航空產品研制初期到產品樣機制造完成,逐步掌握、分解、深化產品功能、性能及其綜合指標需求,完善形成工程規劃,以此為基礎進行工程任務綜合方案設計。依照綜合方案,遵循產品試驗工程技術原理,逐步進行科目綜合試飛設計、仿真驗證、執行與監控、分析與評估,漸進擴展和不斷迭代循環、綜合評估,最終驗證和確認達到所有的試驗需求,形成結論報告。在試飛業務執行與管理過程中,數據信息是試飛系統工程運行過程中的核心,以完善的組織執行架構,嚴謹的業務管理流程,結合先進的技術與標準規范化的業務管理平臺,實現試飛工程數據治理的目標。飛行試驗大數據質量監控平臺如圖7所示。

圖7 飛行試驗大數據質量監控平臺
飛行試驗大數據質量監控平臺以試飛元數據及其元模型為基礎,建立數據質量度量規則及其執行引擎,對數據對象進行質量檢測與分析評估。
①數據質量度量規則能夠根據試飛數據質量特性分類定義相應的度量規則,數據質量分析提供依據。試飛數據質量度量規則根據試飛數據管理和技術要求進行定義。
②質量執行引擎執行質量度量規則進行數據質量檢查和分析,匯總并形成質量問題報告,為質量提升提供基礎。
③質量問題分析根據質量提升需求,根據質量核查中發現的問題進行分析,形成數據治理分析報告和質量提升報告,為數據質量改進提供基礎。
④綜合查詢統計可以實現對質量監控平臺下的所有信息進行綜合查詢和分析。
基于單一數據源的一體化試飛大數據管理與應用平臺是試飛大數據治理的技術保障,圍繞試驗對象數據,涵蓋試飛工程需求、規劃、設計、執行、評估、總結等全過程,建立包括飛行試驗工程管理數據與專業數據的一體化試驗大數據結構模型,充分利用先進的大數據技術,針對飛行試驗大數據結構特點及其應用需求,建立基于統一數據模型的試驗大數據全生命周期高效全面管理、智慧應用與維護體系和應用平臺,為航空產品設計、制造、試飛、運維和航空科學技術發展研究等所有用戶,提供可追溯、可查詢、可分析的完整、準確、可靠以及多粒度的試驗大數據高效服務。如圖8所示。

圖8 試飛工程一體化數據管理平臺
①試飛工程一體化試驗數據結構模型(FTDB)是試飛工程大數據治理的數據基礎,包括試飛工程管理數據結構模型,以試驗對象數據為中心的試驗規劃、設計、測試改裝、工程結果、評估結論等數據結構模型,建立和維護了完整、準確、可靠的試飛工程數據關聯關系,能夠實現試驗數據信息的追溯和延展,真實地反映試飛工程管理和實施的數據態勢。
②面向應用的服務中間件(SOA)是面向試飛工程應用,以試驗數據結構模型為基礎,實現試飛工程管理、規劃與設計、分析與評估等應用功能,按照標準化的中間件接口定義規范,可以實現功能組件擴充,滿足航空設計、制造、維護以及科研應用需要。
③面向業務應用的接口層(APP-UI)面向試驗大數據治理及應用相關不同用戶,實現試飛工程大數據準確性、可靠性、一致性的管理、維護和質量檢查,為航空產品設計、制造、試飛及科學研究提供試飛數據應用服務。
④飛行試驗數據管理應用標準和安全管理與控制,是支撐試飛工程大數據治理的技術保障,是實現試飛工程大數據規范化治理目標的基礎核心。
飛行試驗大數據是航空飛行試驗乃至航空產品研制過程所產生的重要資產,飛行試驗大數據治理的治理目標就是在復雜漫長的飛行試驗全過程中,確保飛行試驗數據的全面完整性、客觀準確性、存儲規范性、關系一致性和全周期可追溯性,達到以數據為中心的飛行試驗和航空技術發展科學應用的目的和要求。建立飛行試驗大數據治理體系,也就是從飛行試驗科學管理與實施的業務組織架構、業務執行流程、管理標準規范、系統平臺架構等多個維度對飛行試驗大數據的數據結構模型、數據標準體系、數據安全質量、數據應用系統以及數據全生命周期的各方面管理進行分析、建設和不斷改進的體系。本文針對飛行試驗業務與數據的特點,結合多年來在飛行試驗工程大數據管理與應用方面的業務實踐,以業內規范化的數據治理模型為參考,以飛行試驗大數據標準體系為基礎,以涵蓋試飛工程全過程、全業務流程的試飛數據質量監控系統和一體化的試飛大數據管理與應用為治理技術平臺,形成了一套比較完整和全面的飛行試驗大數據治理技術體系。該體系本質上是飛行試驗工程的數據表征,龐大且復雜,需要在工程中逐步建立和不斷完善。在多個型號中的初步應用實踐表明,既可保證試飛大數據的完整性和一致性,而且為以數據為中心的型號飛行試驗提供了高效的應用支撐,有效促進了飛行試驗效率提升,也為航空科學研究進入“大數據科研范式”奠定了堅實的數據基礎。