田紅


摘要:在建設數字航天背景下,數字資源日益成為航天企業重要的戰略資源和核心資產。面對檔案管理對象的不斷擴展、資源類型的愈加復雜與資源集成共享的迫切需求,亟須制定一套標準統一的元數據方案。論文在闡述元數據方案構建必要性的基礎上,結合電子文件的流轉過程和航天檔案資源體系的特點對元數據進行了分析,提出了航天電子檔案元數據設計思路與描述方法。
關鍵詞:多源異構 航天電子檔案 元數據
隨著信息技術手段在航天設計、生產、制造等活動中的廣泛應用,電子公文、CAD圖紙、三維模型等電子文件急劇增長,電子文件歸檔勢在必行。面對多源異構的海量電子文件,如何確保不同系統、不同階段的數字資源特征得以描述、電子檔案管理過程得以記錄,是航天企業檔案部門面臨的一個重要課題。元數據作為描述文件背景、內容、結構及其管理過程的數據,是電子檔案真實性、完整性、可用性和安全性的重要保障。構建一套標準統一、兼容性強的元數據方案,對于實現電子檔案科學、規范、有序的管理具有重要的意義。
在建設數字航天背景下,數字資源日益成為航天企業重要的戰略資源和核心資產。構建科學合理的元數據方案是加強航天企業數據管理、規范電子檔案管理和實現資源交換共享的內在需求。
(一)航天企業數字化轉型的要求
當前,在建設數字航天背景下,航天企業科研生產數字化能力和經營管控數字化能力全面提升,不論是數字化建模、仿真、三維設計還是企業運營監控、戰略管理、智能預測等都依托于數字資源,數字資源已成為航天企業重要的戰略資源和核心資產。然而由于各類資源形成于不同的業務系統,因此缺乏數據存儲、管理和共享的統籌規劃,導致數據集成困難、交互復雜,在很大程度上影響了數據支撐科學決策的效能,因此加快推進以數據管理為核心的電子檔案管理,日漸成為航天企業數字化轉型的迫切需要。而實現多源數據的匯聚融合、互聯互通、交換共享,其首要前提就是要構建標準統一的元數據方案,明確航天電子檔案形成、交換、收集、移交、保管、利用等全過程元數據設計、捕獲、著錄的一般要求。
(二)電子檔案科學高效管理的要求
元數據是關于數字檔案資源描述的數據,也是數字檔案資源真實性和可讀性的重要保障。無論是傳統載體還是數字化的檔案資源,都需要對資源和數據的外部與內容特征等進行揭示和描述,才能進行有序化的組織。隨著企業協同產品研制、科研管理、經營、財務、人力、設備與物資等一系列信息化系統的應用,各類文本、視頻、音頻、圖像、二維圖紙、三維模型等海量異構分布的數字檔案資源呈指數級增加,其體量巨大、類別復雜、來源廣泛、管理要素多等特點進一步增加了管理難度。為確保不同系統、不同階段的電子檔案特征得以描述和記錄,亟須建立科學合理的元數據方案,為實現電子檔案規范、有序的管理提供依據。
(三)適應航天數字檔案館建設的要求
《“十四五”全國檔案事業發展規劃》明確指出“深入開展企業數字檔案館(室)建設,完成50家企業集團數字檔案館(室)建設試點”,航天企業緊跟新形勢、把握新機遇,全面啟動了航天數字檔案館建設。元數據標準作為數字檔案館標準體系建設的重要內容之一,不僅是數字檔案館實施的指導方針,也是其運行維護的重要依據。當前,航天企業關于元數據管理的頂層標準主要有《航天檔案數據采集規定》和《航天檔案數據元》,規定了航天檔案數據采集、描述的原則和要求,但這兩個標準已有十余年,其內容已不能滿足當前電子文件管理的新要求,無法為航天數字檔案館應用框架構建提供支撐,亟須建立一套完善、有效的元數據方案,為實現電子檔案在航天數字檔案館的統一管理、交換、共享提供指導。
電子檔案元數據方案構建的前提是分析電子文件流轉過程,明確元數據的構成,同時結合檔案資源體系構成,對通用和專用元數據進行整合、聚類,最終形成具有航天電子檔案資源分類和管理特點的元數據方案。
(一)基于電子文件流轉過程的元數據分析
元數據隨著業務活動、管理活動的開展而不斷產生、積累,元數據方案的構建首先要明確電子文件全生命周期的管理過程。在文件形成階段,由設計人員在業務系統中創建文件并送審,系統自動捕獲文件內容屬性、流轉等相關元數據,如文件編號、題名、編寫人、編制日期、簽名人等;文件審批結束后,電子文件經格式轉換進入電子檔案管理系統進行歸檔,電子檔案管理系統自動捕獲電子文件元數據信息,并由檔案人員對文件進行接收、分類、整理,增加檔案管理過程元數據,賦予文件特定的檔案標識,形成移交人、移交單位、立卷人、立卷日期、檔號等元數據;在存儲與處理階段,系統自動記錄電子檔案保管相關元數據,如格式信息、文件創建程序、電子文件狀態、存儲位置等;在利用階段,根據借閱利用流程,自動捕獲電子檔案利用申請、審批等元數據。電子文件全周期管理過程如圖1所示。
(二)面向航天檔案資源體系的元數據分類
航天檔案的類別眾多,包括文書、經營、科研、航天產品、民用產品、質量、基建、設備儀器等16個類目,電子文件類型主要為文本類、圖像類和聲像類。由于各類電子檔案的形成環境、技術特點和管理要求存在差異,其形成的元數據也各具特色,按照元數據的通用程度,可以將其分為通用元數據和專用元數據。通用元數據即各類電子檔案都具有且需要設置的元數據,例如文件編號、題名、編寫人、檔號、歸檔日期、格式信息、存儲位置等。專用元數據即各類檔案特有的元數據,例如航天產品檔案不僅涉及型號技術文件,還包括圖紙、光盤、三維模型等,其專用元數據包括型號名稱、型號代號、版本號、模型名稱、模型中間格式等;科研檔案專用元數據包括項目代號、子項代號、項目名稱、課題負責人、成果批準號等;照片檔案專用元數據包括單元號、單元名稱、拍攝時間、拍攝者、色彩空間、分辨率、內容描述等。
(三)航天電子檔案元數據方案的構建
元數據方案的設計既要考慮電子文件形成、歸檔、保管、利用過程元數據項的特點,又要考慮不同類別檔案元數據的通用性和特殊性,通過對同類性質元數據進行整合、聚類,將其分為內容屬性元數據、外部特征元數據、保存行為元數據、管理活動元數據和利用控制元數據五個維度,針對個別專業特點鮮明的檔案,每個維度下可增加專用元數據,最終形成電子檔案元數據體系。
內容屬性元數據用于對電子檔案基本屬性進行詳細、全面的記錄,便于電子檔案的檢索和利用,提高檔案資源的組織效率,例如文件編號、題名、頁數、密級等。外部特征元數據用于描述電子檔案管理過程的外觀信息,突出電子檔案的形成特點,為保管利用提供依據,如案卷名稱、立卷人、立卷日期、檔號等。保存行為元數據用于記錄電子檔案背景、結構、存儲等屬性信息,包括格式信息、計算機文件名、計算機文件大小等。管理活動元數據是記錄電子簽名等業務行為的元數據,包括簽名規則、簽名時間、簽名人、證書等。利用控制元數據是用于描述電子檔案授權利用的元數據,包括借閱申請人、借閱申請時間、借閱審批人等。結合上述設計思路,表1展示了以航天產品檔案為例的元數據方案。
(四)電子檔案元數據描述方法與要求
在構建元數據方案時,需要結合元數據捕獲、存儲、維護和利用過程,明確各個元數據項的設置規則,以便數據的統一收集、管理和利用。參考《文書類電子文件元數據方案》(DA/T 46—2009)等行業標準,結合航天電子檔案的特點,可以從編號、中文名稱、英文名稱、定義、約束性、數據類型、值域、信息來源、注釋等方面對元數據項進行描述。關于隨業務系統流轉的元數據,需明確元數據捕獲節點和捕獲要求。針對電子文件形成過程中產生的、業務系統自動生成且不可人工干預的內容屬性元數據、管理活動元數據,歸檔時由檔案管理系統自動捕獲元數據信息;針對電子文件歸檔和電子檔案管理過程中產生的、有值域要求的外部特征元數據,可通過預定義值域列表的方式,由移交、歸檔人員選擇著錄或手工著錄;針對存儲和利用過程產生的、系統自動記錄的保存行為元數據、利用控制元數據,由管理電子文件的系統自動捕獲。
在航天企業數字化轉型過程中,數字檔案資源急速增加,檔案利用需求不斷增強,對航天檔案工作緊密融入科研生產、經營管理等中心工作,不斷提升檔案信息資源管控能力提出更高要求。構建航天電子檔案元數據方案為多類型、多來源、多要素數字資源的科學描述、有序管理提供了統一規范,為航天企業電子檔案的集成交互、共享利用提供了依據。隨著航天數字檔案資源的快速增長、檔案管理與科研業務流程的深入融合,推動數據統一流轉、融合使用將是檔案部門面臨的新課題,航天電子檔案元數據方案也將在實踐中不斷豐富和完善。
參考文獻:
[1]李芳芳,吳玉龍,米捷,等.機關電子檔案元數據體系構建及元數據庫建設研究[J].檔案管理,2019(5):13-15.
[2]宋欣.貝葉檔案數字化建設中的元數據研究[J].浙江檔案,2021(3):27-30.
[3]羅婷予.面向智能資源發現服務的城市記憶資源元數據方案構建[J].圖書館建設,2021(5):98-106.
[4]郭留紅,高愛民,齊云飛,等.公路建設項目電子文件元數據標準構建研究[J].檔案管理,2022(3):65-67.
[5]謝鋒,徐悅,王磊.地方性建設電子檔案元數據方案構建——以蘇州市為例[J].檔案與建設,2022(8):58-61.
作者單位:北京空間飛行器總體設計部