王青 馬小亮
摘 要:真實性、完整性、可用性和安全性是電子檔案的重要屬性,“四性”檢測是電子文件接收過程中,保證這些屬性的一種重要手段。在檔案系統和PDM接口開發過程中,對“四性”檢測的實現進行了初步探索,本文對實現過程及實現效果進行了描述,為“四性”檢測的最終實現提供參考。
關鍵詞:電子文字;歸檔;“四性檢測”;實踐
DOI:10.12249/j.issn.1005-4669.2020.25.101
隨著信息化建設的推進,越來越多的業務應用系統上線使用,如檔案管理系統、PDM系統、OA系統、ERP系統、知識管理系統、軟件工程化系統以及合同管理系統等。通過和檔案系統開發集成,大量的電子文件通過接口將被推進檔案系統內,那么如何保障接收電子文件的真實性、完整性、可用性及安全性(即“四性”),已成為檔案電子信息化管理中亟待解決的問題。針對這一問題,結合“四性”檢測要求,筆者在檔案系統和PDM系統的接口開發過程中,進行了初步實踐。
1 “四性”檢測的定義和意義
1.1 “四性”檢測的定義
DA/T70-2018對“四性”的定義為:
1)真實性,是指電子檔案的內容、邏輯結構和背景與形成時的原始狀況相一致的性質;2)完整性,是指電子檔案的內容、結構和背景信息齊全沒有被破壞、變異或丟失的性質;3)可用性,是指電子檔案可以被檢索、呈現或理解的性質;4)安全性,是指電子檔案的管理過程可控、數據存儲可靠,未被破壞、未被非法訪問的性質。
1.2 “四性”檢測的意義
隨著檔案信息化建設的推進,越來越多的電子文件歸檔到檔案系統,電子文件將逐步取代紙質文件,成為主要的檔案管理對象。電子檔案“四性”檢測是保證電子文件、電子檔案真實性、完整性、可用性、安全性的重要手段,也是確保電子檔案憑證價值、查考價值和保存價值的重要措施。因此,在電子文件接收以及電子檔案管理過程中,“四性檢測”具有舉足輕重的作用。
2 PDM接口開發及“四性”檢測的實現過程
2.1 接口集成方式
檔案系統和PDM系統之間的接口采用Web Service的方式及SOAP協議來實現集成。檔案系統作為服務提供者,發布Web Service服務; PDM系統作為服務請求者,請求服務。
Web Service是使原來各孤立的站點之間的信息能夠相互通信、共享而提出的一種接口,是建立可互操作的分布式應用程序的新平臺,其定義了應用程序如何在Web實現互操作性。Web Service所使用的是統一、開放的標準,如HTTP、XML、SOAP(簡單對象訪問協議)、WSDL等,所以Web Service可以在任何支持這些標準的環境(Windows,Linux,Unix)中使用。Web Service具有平臺無關性、普遍性、易于使用等優點,可以溝通不同平臺、編程語言和組件模型中的不同類型系統,方便地實現異構系統之間的集成。
2.2 集成方式的優點
采用Web Service方式具有以下特點:
1)實時性好,PDM系統中調用Web Service方法,可以實時將數據轉入到數字檔案綜合管理系統中;2)通用和擴展性好,雙方系統的耦合度低,一方的需求和系統變動不會帶來另一方開發工作量的增加;3)安全性好,雙方只需溝通傳遞的數據內容和格式,均不需要了解對方的數據庫地址、表結構,不會對對方數據造成潛在危險。
2.3 接口“四性”檢測內容及實現過程
2.3.1 真實性檢測
在真實性檢測過程中,對電子文件內容、電子文件元數據及相關的目錄信息等內容、技術信息屬性進行了檢測,主要包括以下內容。
1)目錄信息檢測:PDM將電子文件相關的目錄信息寫入XML結構中,檔案系統接收到XML結構后,歸檔接口檢測目錄信息是否符合檔案著錄規則要求,包括數據類型、長度、格式、值域以及信息內容是否合理等。2)目錄和電子文件關聯準確性檢測:檢測電子文件與目錄信息是否關聯。關聯信息包括:電子文件名稱、電子文件大小以及電子文件的哈希值。3)電子文件名稱檢測:對比PDM上傳的電子文件名稱是否與XML結構中電子文件關聯信息的文件名稱相同(包括擴展名稱)。4)電子文件大小檢測:獲取PDM上傳的電子文件,計算文件大小是否與XML結構中電子文件關聯信息的文件相同(單位為(KB)字節)。5)電子文件哈希檢測:通過MD5算法計算PDM上傳的電子文件的哈希值,對比哈希值是否與XML結構中電子文件關聯信息的文件哈希值相同(MD5算法)。
2.3.2 完整性檢測
在完整性的檢測過程中,對電子文件內容、元數據及其相關目錄信息內容完整、項目齊全等進行檢測,主要包括以下內容。
1)電子文件類型檢測:檢測電子檔案類型與移交接收類型是否一致,包括變更單、圖紙及簽署頁等。 2)目錄項目完整性檢測:按照檔案著錄規則檢測檔案目錄項目是否填寫齊全(必填項檢驗)。3)電子文件完整性檢測:檢測每條歸檔的電子目錄是否都有對應的電子文件(一對一,或者一對多)。
2.3.3 可用性檢測
在可用性檢測過程中,對電子檔案的目錄數據、電子檔案內容能夠長期保存,并被合法用戶無障礙地使用進行檢測,主要包括以下內容。
1)目錄數據可用性檢測:檢測電子檔案目錄數據是否可以被正常檢索(條目檢索)。2)電子檔案內容可用性檢測:檢測電子檔案內容是否可以被正常打開和瀏覽(全文檢索)。
2.3.4 安全性檢測
在電子檔案安全性檢測過程中,對電子檔案具有安全保管和長期可用的環境進行檢測,主要包括以下內容。
1)目錄數據安全性檢測:檢測著錄項目中的密級和控制標識是否規范,確保電子檔案利用安全。2)按照“四性”檢測要求,應該對電子文件進行病毒檢測,檢測電子文件是否感染木馬或病毒,確保電子檔案保存和利用安全。實現這一功能需要和殺毒軟件進行開發集成,在本次接口開發中暫未病毒檢測。
3 實現效果
通過在檔案系統和PDM系統接口增加了“四性”檢測功能,除了病毒檢測外,基本實現了對PDM在線歸檔數據的“四性”檢測,確保了電子文件、電子檔案的真實性、完整性、可用性及安全性,同時,也促進了電子文件及歸檔過程的規范性。
1)能夠準確無誤地將電子文件元數據和電子文件歸檔到檔案系統中,保證在歸檔過程中數據不丟失、不被篡改。確保了歸檔電子文件的真實性。2)通過對歸檔條目信息屬性以及電子文件關聯關系的校驗,能夠確保歸檔數據的完整性,使不符合歸檔要求的數據被拒退回,并提示歸檔人必須完善所有歸檔信息后才能正確歸檔。提高了歸檔文件信息的完整性及規范性。3)避免檔案人員手工錄入條目和掛接電子文件,以及這一過程中可能出現的錯誤。檔案利用者可能通過條目檢索、全文檢索快速的獲取檔案信息。在確保電子可用的同時,提高了檔案管理和檔案利用的效率。
4 結束語
目前檔案界對“四性”檢測的研究還處于起步階段,實踐領域的成功案例也很少。基于這種情況,在這次PDM接口開發過程中,對“四性”檢測的功能實現也僅僅是一個初步的探索,還存在一些不足,比如,病毒檢測未能實現,隨著進一步的使用及“四性”檢測技術的成熟,還有待進一步改進優化。
參考文獻
[1]DA/T70-2018.《文件類電子檔案檢測一般要求》
[2]駱建珍,楊安榮,馬來娣.電子檔案“四性”檢測要求及其實現方法[J].浙江檔案,2017(12):27-30.
作者簡介
王青,女,副研究館員,研究方向:科研院所檔案信息化建設,數字檔案館建設;產品檔案管理。