馮志軍 郭光超 劉宇昕 苗春林 趙鵬 李坤遠 杜俊鵬
(中國運載火箭技術研究院, 北京, 100076)
伴隨信息化時代的發展以及數據技術的提升, 數據越來越得到各行各業的重視。 然而由于數據標準建設相對滯后, 導致數據通用性與可用性不強, 難以開展數據的多維應用及交換共享。為提高數據使用效率、 深挖數據潛在價值, 各行業紛紛加大了對數據標準的重視程度。 航天科技集團有限公司也提出建立完善的基礎設施、 信息安全、 數據治理和標準規范保障體系要求, 在“一個CASC, 一套標準” 的原則下, 建設了航天卓越標準體系[1], 通過數字化與信息化標準子體系建設, 基本涵蓋了數據相關領域的標準范疇。
航天企業建立了各種標準子體系, 如產品標準體系[1]、 信息化標準體系[2]等, 但是尚未形成數據標準體系。 本文以中國運載火箭技術研究院實踐經驗為基礎, 從航天總體院角度, 圍繞航天企業信息化和現代化建設需求, 研究數據標準體系框架建設, 形成一整套 “研以致用” 的適用于企業業務場景的數據標準體系[3-4]。
a) 數字化形式。目前科研生產及經營管控工作過程中產生的數據大部分以數字化形式進行管理, 涉及結構化和非結構化2 種類型。 其中結構化多以dat、 txt、 excel、 數據模型以及數據庫等形式進行保存, 非結構化多以doc、 ppt、 pdf等文本文件形式進行保存。
b) 非數字化形式。航天企業檔案部門的歸檔文件多以紙質文件、 磁帶或磁盤等形式存在。以某單位檔案收藏為例, 收納了單位科研和經營管理活動的各種原始記錄, 現存的有紙質檔案、聲像檔案 (照片、 錄像帶、 電影膠片等), 這些歷史資料均需經數字化轉化后, 方可進行后續的加工、 存儲和管理等工作。
a) 數據分散管理, 難以實現統一管控
雖然當前建設了較多的信息系統, 但整體上還未能覆蓋所有業務領域, 大部分數據仍以文本文件形式分散保存; 同時各業務領域尚未構建數據標準, 數據難以實現統一集中管控, 導致數據查找困難, 不利于開展數據的交換共享。
b) 數據說明缺失, 難以實現數據應用
當前缺乏與數據分類、 采集、 存儲、 管理、共享等相關的頂層規章制度及標準, 導致數據采集后數據命名、 數據結構、 數據格式不統一, 難以理解數據真正含義; 另外, 當前數據采集大部分僅保留結果信息, 其他信息如量綱信息、 狀態信息、 環境條件信息等尚未與數據共同保存, 導致數據可讀性不夠, 使用性不高。
c) 數據管理標準不統一, 難以形成有效管理機制
各類數據采集后數據結構、 數據格式不統一,難以實現以統一的方法或工具來使用; 另外, 各業務領域結合自身業務需求開展各自信息系統建設, 建設標準和系統接口不統一, 未形成有效的管理機制, 為后續數據的采集和存儲管理、 關聯挖掘、 交換共享和分析應用帶來了挑戰。
a) 全面覆蓋性原則。建設的數據標準體系應能覆蓋全院各項業務領域、 業務活動, 能支撐全院各項數據工作的開展。
b) 先進適用性原則。結合院各項業務場景的數據需要, 吸收采納自主編制的數據標準應以前沿技術為依據, 避免出現不適應業務需求、 技術發展的現象。
c) 協調匹配性原則。國家上級標準與企業各級技術標準之間要相互協調、 邏輯一致, 避免相互矛盾。
d) 開放兼容性原則。應吸收采納現有與數據相關的國標、 國軍標、 行業標, 確保院數據標準在滿足院數據管理、 應用現狀的基礎上能夠與上級標準及行業標準進行對接。
全國信息技術標準化技術委員會大數據標準工作組和中國電子技術標準化研究院聯合發布了的《大數據標準化白皮書 (2020 版)》 及 《工業大數據白皮書 (2019 版)》[5-6], 從國家層面迭代完善形成了行業通用的大數據標準體系和工業領域的大數據標準體系。 航天企業應結合國家大數據體系,結合企業現狀和建設思路, 形成樹狀層次結構的航天企業數據標準體系初步框架, 如圖1 所示。

圖1 航天企業數據標準體系
“基礎共性類標準” 中, “數據基礎標準” 主要用于統一數據相關概念, 統一對數據的理解,支撐開展數據工作; “數據安全標準” 貫穿于數據生存周期的各個階段, 用于確保數據在各個環節安全可控。
“數據資產類標準” 中, “數據資產建設標準”用于對數據資源進行開發和利用, 形成有價值的數據資產的建設過程; “業務數據標準” 涵蓋數據資產建設過程所梳理出的相關業務領域數據標準。
“數據治理類標準” 中, “數據治理體系建設標準” 貫穿于數據生存周期的各個階段, 用于規范建設全院統一的數據治理體系; “數據質量與評估標準” 貫穿于數據生存周期的各個階段, 是數據實現高效分析、 應用、 服務的重要支撐。
“應用服務類標準” 中, “數據產品標準”圍繞數據產品開發, 從構建數據產品的生命周期入手進行規范; “數據平臺工具標準” 支撐數據應用, 對大數據平臺、 信息系統、 工具的開發過程進行規范。
針對航天企業科研生產、 經營管控業務, 充分結合現有的設計、 試驗、 制造、 人力、 財務、物資、 質量、 保障等數據管理、 應用的特點及現狀, 圍繞數據全生命周期質量提升、 數據綜合管理能力提升、 數據多維應用水平提升, 建立自頂至下的數據標準體系框架, 形成一整套 “研以致用” 的數據標準規范體系。
以數據標準體系為規劃指導, 全面開展企業亟需的數據標準的制修訂工作, 填補數據核心技術和管理標準, 統一企業的數據標準鏈路; 通過首次開展數據標準體系建設并實施, 推動企業科研生產數據管理有標可依, 推動企業數據綜合管理能力提升, 最終推動實現航天企業科研生產和經營管控的現代化轉型。
數據與科研生產、 經營管控的業務融合已成為當前數據專業發展的重要趨勢, 在驅動數據技術不斷創新的同時, 也必將對數據標準化工作提出新的要求。 面對新業態、 新模式下的新需求,需要緊密結合國內外數據技術、 產業發展動態,持續提煉梳理各應用領域數據標準需求, 并在現有標準體系的基礎上迭代更新, 保障數據標準對數據技術、 產業創新發展的持續推動作用。