

摘 要:電子檔案元數據管理方法與水平直接影響著保存電子檔案的真實性。為充分發揮出元數據的優勢,本文對電子檔案元數據管理方案進行深入分析,在明確管理系統技術架構、功能模塊、數據庫以及元數據管理設計的基礎上,對元數據管理方案展開對比與評價,希望為電子檔案元數據管理方案的實施提供科學參考與借鑒。
關鍵詞:電子檔案;元數據;數據庫;管理方案
前言
電子檔案具有十分重要的保存價值,是指實體檔案數字化過程中產生的一類文件,具有體積小、容量大、檢索便捷等特點。在實際應用過程中,元數據管理成為電子檔案有效保存應重點解決的問題。在大數據、云計算、互聯網等技術快速發展的背景下,有必要應用成本效益、工作效能、可操作性優良的元數據管理方案,以此實現電子檔案管理系統的優化。
1 電子檔案元數據管理系統設計
1.1 元數據管理原則
元數據的功能定位與模型描述是整合電子檔案資源、創建檔案利用服務的關鍵,在從整體角度分析電子檔案元數據這一核心系統時,首先,尊重檔案、尊重客觀、尊重元數據與整體間的有機聯系,以此保證元數據與檔案內容信息間的關系,可通過可視化、可理解的形式展現出來。其次,注重電子檔案不同生命階段中內容信息的著錄,堅持前端控制與全過程管理原則,實現檔案數字化管理系統有效運行。最后,注重元數據擴展性、互操作性、標準化功能的運用,使得元數據與電子檔案內容信息間構建起有效的邏輯關系,從而實現信息共享與數據交換。
1.2 系統技術架構
電子檔案元數據管理系統是以JAVA為開發語言、MYSQL為后臺數據庫系統、XML為系統配置技術,在JE22平臺上創建起來的,嚴格按照文檔一體化理念進行設計,各功能模塊、業務層獨立且協同工作,具有較強的互操作性與擴展性。前臺展現層、系統業務層、系統服務層、數據訪問層、數據存儲層構成了電子檔案元數據管理技術架構,強大的用戶展示、檔案數字化業務管理、系統開發服務、數據存儲與轉移功能,極大地提高了元數據的利用效率。系統技術架構如下圖所示[1 ]。
1.3 電子文件元數據管理設計
1.3.1 元數據生成。元數據生成主要是對元數據的值域以及潛在選項進行設置,最終形成確定的元數據內容。為避免轉換元數據格式時出現錯誤,采用統一軟件處理生產到匯交階段產生的元數據,并將確定元數據的內容保存到數據庫中。在移交文檔時應注意數據集名稱、形成時間、數據格式、專題類別的注釋,以此保證界限使工作能夠順利開展。
1.3.2 元數據捕獲。捕獲元數據需要按照國家與行業相應的標準進行,利用裝置自動采集與數據源對應的信息數據。首先,利用人工著錄、系統自動生成選擇數據庫中電子檔案元數據值域,然后導入相應的元數據,以此完成生產、匯交數據業務。其次,由于部分電子檔案元數據隱藏在運作環境中或是系統運行環境之外,一般采用人工著錄結合計算機的方式捕獲元數據,然后由系統自動標識出元數據的捕獲時間與地點,計算機自動捕獲方式的加入,極大地減小了人為誤差,保證了元數據與電子檔案內容信息的真實性與憑證性。最后,為進一步提高電子方案元數據的價值與質量,需要檢查元數據內容、邏輯等其他方面的內容,充分發揮出質量控制的作用。
1.3.3 元數據封裝。電子檔案元數據封裝是實現系統與檔案功能模塊數據交換、信息共享的關鍵。因此,將元數據封裝在電子檔案管理系統中才能實現數據交流功能。首先,按照檔案卷宗級、文件級、全宗級對元數據進行封裝,完整的數據封裝包可作為系統交換數據的基礎單元。其次,保證每一數據封裝包中含有一個基于XML結構的本級數據文件,并將若干個電子檔案元數據與一個基于XML結構的元數據文件封裝在一起,多個文件封裝包便形成了基于XML結構的案卷級數據文件,以此類推可獲得全宗級數據文件。最后,按照《DAT/48-2009基于XML的電子文件封裝規范》進行電子文檔元數據封裝操作,要求元數據封裝包應根據電子簽名、版本信息、格式描述等進行統一打包處理,以此保證技術架構在發生變化時,電子文檔仍可實現數據交流與文件共享。各級數據封裝包如下圖所示。
1.3.4 元數據維護。維護元數據的目的是持續電子檔案與元數據間的鏈接,避免因保管方法、檔案遷移影響電子檔案間關聯的穩定性與文件的完整性。一般情況下,元數據維護采用文本方式切入、嵌入元數據規范,同時結合屬性描述、編碼處理、加密處理等方式對文件進行封裝[2 ]。我國電子檔案安全保障策略具體指:封裝格式屬于電子文檔的利用、交換與保存以及其他相關形式,與硬件、軟件間不存在聯系。表明文檔一體化需要將數據融進抽象性行為中,以此形成有機統一體。封裝后的元數據與電子檔案的信息、結構、內容在邏輯層面上具有一定關聯,有利于保證元數據要素的有效性。
1.4 功能模塊設計
1.4.1 參數設置模塊。參數設置模塊功能的實現,應以檔案管理員、系統管理原用于參數管理權限為前提,從而參加到電子檔案元數據的領導、案卷、全宗、清理、刷新、緩存等功能的實現過程中。參數設置具體流程為:選擇參數設置模塊后,選擇添加或刪除參數,以此實現各功能。
1.4.2 歸檔收集與管理模塊。歸檔收集主要是利用數字化掃描的方式收集實體檔案,可分為文檔上傳、OA在線或離線導入、公文導入等多種實體文檔上傳方式。其中,文檔上傳是文檔目錄數據以及全文數據進行壓縮處理;OA在線或離線導入則是在電子檔案元數據管理系統運行與離線的環境中,由網絡向指定對象傳送電子文件;公文導入主要是在文檔上傳完成后進行,根據文檔的導入日期、檔案與數據類型等信息完成導入,實現電子檔案元數據的自動分類。完成歸檔收集工作之后,需要對電子文檔進行歸檔價值判斷、電子公文自動歸檔、數據維護與案卷調整等維護工作,及時剔除無價值的歸檔文件,以此保證電子檔案元數據管理成本效益與工作效能。
1.4.3 檔案查詢與管理模塊?!安樵儭弊鳛殡娮訖n案元數據管理系統的重要功能,對提高核心檔案業務數字化具有重要意義。檔案管理人員在登錄賬號來到用戶界面后,在指定位置處輸入文件編號、題名等信息便可自動搜索到相應的文件與項目。在此過程中,指令會傳輸到后臺數據庫層面,由數據庫判斷與查詢信息相符的文件,然后向檔案管理人員顯示包括文件責任者、日期、發文字號等信息的全文目錄。若為秘密文檔,則需要用戶輸入文件密級。針對檔案查詢的管理功能,具體分為專題分類與專題組織兩大部分,以此實現檔案管理人員新建文件名或專題檔案、刪除專題名或專題檔案、取消發布專題等業務。
1.4.4 檔案銷毀與利用模塊。檔案銷毀與利用一般在接收移交電子檔案之后進行。接收移交電子檔案采用脫離系統保管的方式進行檔案數據的備份,為后期制備多套檔案數據奠定堅實基礎。銷毀、利用電子檔案元數據,主要依據為:一,服務器空間。二,國家檔案法相關規定。三,機構的人力、物力、財力等條件與資源。銷毀后的電子檔案元數據將不會在管理系統中查詢到,檔案管理人員可根據需求選擇批量銷毀或是單件銷毀。檔案的利用要求管理人員獲得審批后,才能查閱到秘密級電子檔案元數據,秘密級權限到達審批時間點后便會自動結束,一般為24小時,以此全面保證系統的安全性,并有利于充分發揮電子檔案元數據的利用價值[3 ]。
1.5 數據庫設計
數據庫作為電子檔案元數據管理系統的重要支撐,在后臺運行中扮演著不可替代的角色。設計數據庫需要遵循層次分明、布局合理、結構規范、數據獨立、數據安全等原則,從而實現數字化管理系統高效、合理運營。在數據庫中,電子檔案元數據以及電子檔案內容信息會按照來源、檔號、電子簽名、形式特征、電子屬性、數字化屬性等進行合理劃分,并且元數據包含了各類信息數據的業務狀態、行為、實踐、依據與描述等,為數據庫描述、判斷元數據與電子檔案內容信息提供有力的支撐。因此,只有進一步規范數據庫設計,才能保證電子檔案元數據管理方案策略獲得有效憑證,實現后續電子檔案維護與利用有效性、真實性的提升。
2 電子檔案元數據管理方案對比
2.1 四種管理方法分析與對比
電子檔案元數據管理方法包括內封裝、半封裝、不封裝與特定封裝四種類型,四種管理方法的分析與對比結果如下所示:
第一,內封裝。VEO、Mets、Bueketsl等都屬于內封裝,通過“綁定”電子檔案內容信息與元數據而形成一個完整體,可將檔案內容信息轉換為64編碼后,與元數據一同封裝在XML結構中,或是將元數據直接封裝到不做編碼處理的檔案內容信息中。在計算機系統中,文本、影像、圖形等電子檔案在理論上均可以二進制儲存,內容信息經過編碼處理后封裝在XML結構中,但在執行效率上、工作效能等方面存在一定不足,還可能存在超時問題。將元數據封裝在檔案內容信息特定位置處的方法,其真實性與憑證性有待進一步校驗,并且許多常見的格式在嵌入數據過程中無法實現,需要對管理技術與開發工具進行更深層次的研究。
第二,半封裝。運用此種方法時,電子檔案內容信息無需編碼處理與單獨存儲,直接將電子檔案信息寫在元數據封裝包的存儲位置處,也就是將元數據看作單獨使用的XML結構。由于XML結構擁有單獨保存元數據封裝包的路徑,提出了電子檔案內容信息與元數據間的邏輯關系,需結合系統開發實際需求進行合理選擇。
第三,不封裝。不封裝與半封裝具有一定相似性,所管理的電子檔案元數據以結構形式存在數據庫中,且與內容信息間無需進行封裝處理,對電子檔案保存格式進行管理,便可增強二者間的邏輯關聯性。但是電子檔案長期保存的時間,以及電子檔案內容信息與元數據間的真實性、憑證性,有待進一步驗證[4 ]。
第四,特定封裝。此種電子檔案元數據管理方案需要驗證元數據與檔案內容信息的身份,以此保證電子檔案存儲的憑證價值。經過加密處理后的電子檔案元數據會以形態化的數據存儲在數據庫中,而電子檔案內容信息不用進行編碼處理,直接以非結構化形式獨立存在數據庫中,二者通過封裝字符產生有效關聯,在一定程度上實現了直接封裝電子檔案元數據與內容信息的目標,并且真實性與憑證性可通過驗證。
2.2 實施管理方案的策略
2.2.1 可行性評價。數字化檔案管理經過數十年的發展,各部門已經擁有電子檔案元數據管理方案的成熟做法與經驗。按照國家現行規范標準與工作文件,在設備轉型、存儲格式、圖像處理、質量檢查等工作上給出了明確的技術標準。因此,實施電子檔案元數據管理的機構應從人力資源、技術設備、硬件條件等方面全面考慮數字化業務運營的效率與質量,并作出科學合理的規劃與準備,切勿將電子檔案元數據管理看作單純的數據存儲工作。此外,企業與機構還應考慮到時代發展的需求,對實施數字化檔案管理業務進行全面的可行性與必要性評估,以此降低系統升級與轉型帶來的風險與壓力,充分發揮出電子檔案元數據管理方案策略的優勢與作用。
2.2.2 工作效能評價。在選擇電子檔案元數據管理方案時,一方面,保證元數據形態統一化。在將紙質檔案轉換成電子檔案過程中,為避免部分實體文檔在業務系統之外流轉,與數字化文檔形成混合系統,應對電子檔案元數據管理與儲存流程進行全面評估,以此保證系統運營效率。另一方面,注重電子檔案元數據管理的規范性。在獨家規范標準允許的前提下,可銷毀部分無用的實體文檔以減少存儲元數據的空間與后期維護成本[5 ]。
2.2.3 成本效益評價。通過對比分析內封裝、半封裝、不封裝與特定封裝四種電子檔案元數據管理方案,發現內封裝檔案存在工作效能較低的問題,半封裝與不封裝管理方法下元數據與電子檔案內容信息的真實性與憑證性有待驗證,并且三種管理方案做耗費的成本較高。特定封裝作為一種安全有效管理方案,不僅擴展能力強,而且元數據使用效率高,在系統開發過程中的復用性也較強,極大地降低了電子檔案內容信息與元數據身份驗證、技術架構變化產生的風險。在數字化業務進程加快的背景下,相關機構與成員需要對管理方案的成本與效益進行全面的量化評價,從而實現元數據管理方案策略科學化水平提升的目標。
3 結論
綜上所述,元數據管理作為電子檔案工作中的基礎性工作,對加強檔案數字化、信息化具有重要意義。因此,檔案工作者應在工作中主動創新,明確內封裝、半封裝、不封裝、特定封裝元數據管理方案策略的優勢與劣勢,并合理運用電子檔案信息系統,以此加強檔案內部信息間的關聯性,為后續電子檔案管理與應用奠定堅實基礎。
參考文獻:
[1]展霄鵬,王慧,康晨煒.淺談電子文件、元數據、四性檢驗與電子檔案的關系[J].蘭臺內外,2020(18):27—28.
[2]李飛榮.基于文檔一體化管理的電子公文檔案管理系統設計與實現[D].湖南大學,2018.
[3]張洋.數據轉型背景下的檔案業務過程數字化策略研究[J].山西檔案,2020(02):131—137.
[4]顧嘉.淺析“互聯網+”企業智慧檔案網絡平臺的構建[J].黑龍江檔案,2019(02):45.
[5]崔杰,田偉,任天琪.新時代檔案元數據核心集構建的創新研究[J].檔案天地,2018(12):29—31.
作者簡介:金彩平(1981-),大學學歷,浙江省嘉善縣城市建設檔案館館員,主要從事城建檔的收集、審核、整理以及數字化工作。