
摘 要:真實性、可靠性、完整性和可用性“四性”是電子檔案管理目標的普遍共識。近年來,隨著醫療衛生事業的快速發展,產生了大量的電子檔案。確保電子檔案“四性”,是做好新時代檔案工作的重要標尺。本文深入分析電子檔案“四性”內涵實質,為探討影響電子檔案“四性”的因素提供了理論支撐。最后,提出電子檔案“四性”的具體實現路徑,旨在為做好新時代電子檔案管理提供有益參考。
關鍵詞:電子檔案;真實性;完整性;可用性;安全性
前言
根據《電子檔案管理基本術語》(DA/T58-2014)、《電子檔案管理系統通用功能要求》(GB/T39794-2021),電子檔案是指具有憑證、查考和保存價值并歸檔保存的電子文件及其相關信息的集合。其中,電子文件是由內容、結構和背景等組成[1]。《檔案法》明確規定要做好電子檔案檢測工作,確保電子檔案真實性、完整性、可用性和安全性?!缎畔⑴c文獻—文件管理》(ISO15489)指出“一份文件關鍵性的特征:真實性、可靠性、完整性和可用性?!笨梢?,“四性”是電子檔案管理目標的普遍共識。《電子文件歸檔與電子檔案管理規范》(GB/T18894-2016)等國家標準和規范也均提出要確保電子檔案“四性”要求。煙臺市市直機關醫院始建于1950年,現已發展成為集預防、醫療、教學、科研、保健、社區服務于一體的綜合性醫院。隨著醫療衛生事業的快速發展,煙臺市市直機關醫院產生的電子檔案數量和規模不斷增加,嚴格依據上述法規規范開展電子檔案管理,對統一電子檔案管理標準,便于電子檔案檢索利用,發揮電子檔案應有價值具有重要的現實意義。
1 電子檔案“四性”的內涵實質
1.1 電子檔案的真實性(authenticity)
真實性是指反映事物真實情況的程度。電子檔案真實性是指電子檔案內容、邏輯結構和背景與形成時的原始狀況相一致的性質[2]。從電子檔案真實性的概念可知,要滿足其“真實性”,就要符合三個條件:電子文件與其制文目的相符;電子文件形成、發送與其既定形成者與發送者相符;電子文件形成或發送與其既定時間相符。即目的、主體和時間三個方面?!澳康摹毕喾麘鰯U大解釋,包括維持電子文件背景、結構和內容原始特性的長期持久性[3]。從文件的全生命周期來看,從文件起草、流轉、歸檔、銷毀等,現行、半現行和非現行階段都應具真實性(見表1)。從電子文件全生命周期視角分析,電子文件真實性還需要在其電子文件歸檔應嚴格遵循文檔管理的程序、規范、標準和要求,確保從文件到文檔的一致性。
1.2 電子檔案的可靠性(reliability)
DB/T26162-2021《信息與文獻文件(檔案)管理概念與原則》中將“可靠性(reliability)”定義為:文件的內容可信,可以充分、準確地反映其所證明的事務、活動或事實,在后續的事務或活動過程中以其為依據。文件應在事務處理或與其相關的事件發生之時或其后不久形成,且由經辦人或由業務活動設備形成[4]。從該定義可知,電子檔案要可靠,首先是其內容要“可信”,并且還能夠作為其他事務或活動“依據”;其次是時間要“可靠”,要在事務處理或者事件發生之時或之后形成;再次是主體、設備或載體可靠。即電子文件及電子檔案在內容、形成時間、主體或載體上應可靠[5]。從“簽名”判斷內容的可靠性,從成文日期判斷形成時間的可靠性,從形成載體判斷主體或載體的可靠性。
1.3 電子檔案的完整性(integrity)
電子文件的完整性是指電子文件齊全,且未經改動。電子檔案內容、結構和背景信息齊全且沒有破壞、變異或丟失的性質。從電子文件到電子檔案要經過諸多環節,任一環節出現問題,都會影響電子檔案完整性。完整性主要表現在兩個方面,一方面是內容的完整性,一方面是形式的完整性。尤其是在傳統紙質檔案向現代電子檔案轉變,與傳統紙質檔案完整性關注其實體的完整以及未被篡改的性質不同的是,電子檔案完整性更加關注其信息內容完整性、結構完整性和背景信息完整性,而且構成電子檔案的內容、結構和背景信息未被破壞、變異及丟失。傳統紙質檔案從“大部頭”資料逐漸變成“比特”數據,邁向數字化時代的電子檔案完整性包括數據完整性、復制完整性和比特完整性。
1.4 電子檔案的可用性(usability)
《ISO15489-1信息與文件-文件管理》將可用性定義為:文件應該是可被查找、可被檢索、可被顯示及可被說明?!峨娮游募n案工作者業務指南》則將可用性定義為:電子文件檔案可用性是指利用計算機,如硬件與軟件,可以查找、定位到所需的文件,并可將文件轉換成人可直讀的形式[6]。國家檔案局發布的《電子檔案管理基本術語》則將電子檔案可用性定義為:可以被定位、被檢索、呈現和理解的性質。由此可見,電子檔案的可用性是長期保存要求的基礎和前提,若不可用,則真實性、完整性、可靠性無從談起,也使電子檔案失去了長期保存的現實意義。
2 電子檔案“四性”的影響因素
2.1 電子檔案元數據(meta data)
電子檔案元數據是指描述電子檔案內容、結構、背景及其整個管理過程的數據,類似于傳統紙質檔案的“著錄數據或著錄信息”。《ISO23081信息和文獻·記錄管理過程·記錄用元數據·第1部分:原則》規定,文書類電子文件元數據包含文件實體元數據、機構人員實體元數據、業務實體元數據和實體元數據。其中,文件實體元數據包含了電子文件號、檔號、來源、電子屬性、電子簽名、存儲位置、附注、權限管理等;機構人員實體元數據包括機構人員名稱、組織機構代碼、個人職位、人員類型等;業務實體元數據包括業務行為、業務狀態、行為描述等;實體元數據包括實體標識符、關系類型、關系描述等。電子文件附帶相關元數據,并經“四性”檢驗、按一定原則方法分類進入歸檔,最終形成電子檔案[7]。
2.2 電子檔案格式
檔案部門使用不同的軟硬件系統,所建數據庫種類的不同,都會導致電子檔案格式不一、相互不兼容,最終會影響電子檔案可用性等。根據《電子文件歸檔與管理辦法》的相關規定,將紙質檔案加工成電子檔案,并以圖片格式存儲的電子檔案,其保存格式有TIFF、JPEG、BMP等。還有直接產生的純文本文件、格式文件、版式文件、視音頻文件等電子檔案,這些文件都應使用相應的通用文件格式,如PDF、DWG、DOC、TXT等。收集相應電子檔案還要注明文件存儲格式,同時應收集軟件型號、名稱、版本號及相關參數手冊等等,否則會影響后期的打開和使用。
2.3 電子文件固化
從檔案管理系統中的電子文件捕獲到電子檔案,需要將電子文件內容及其結構,按照歸檔的標準和要求進行固化,并賦予電子文件保管期限。電子文件的固化過程就是通過檢驗后,利用時間戳、電子簽章、數字簽名等形式將電子文件予以固化保存,確保電子檔案真實、可靠[8]。目前,電子文件固化的方式主要是將電子文件原始格式轉化為長期保存版式文件格式,如PDF/A,OFD格式。
2.4 管理規則
從電子文件到電子檔案經過嚴格規則流程,使文件內容、結構、背景等信息嵌入流程,并按照規范要求完整保存元數據、預置樣式,使電子文件“來源可靠、程序規范、要素合規”。從而保證其“四性”要求?!峨娮游募w檔與電子檔案管理規范(GB/T18894-2016)》《電子檔案移交接收操作規程(DA/T93—2022)》《檔案關系型數據庫轉換為XML文件的技術規范(DA/T57-2014)》《版式電子文件長期保存格式需求(DA/T47-2009)》等規則的執行效果也是影響“四性”的重要因素。
3 電子檔案“四性”檢驗路徑
從文檔全生命周期確保電子檔案“四性”,實際就是考察電子文件、電子檔案等業務應用系統及檔案管理系統是否共同保障“四性”。根據文檔生命周期不同階段的“四性”保障特點和職責,認真落實不同環節“四性”的具體內容。具體來說,就是要從歸檔、移交與接收、保存等每個環節檢測其“四性”,發現問題及時處置。
3.1 電子文件歸檔
電子文件歸檔是按照相關規定將具有保存價值的電子文件及其元數據保管權交由檔案管理部門。電子文件的歸檔環節應落實的“四性”。(1)真實性。從電子文件中的電子簽章、簽名的合法性來保證電子文件數據來源的真實性。從電子文件的封裝時間、簽章時間、簽章人、文件大小與歸檔前的電子文件是否一致,以及檢測非原生電子文件在上傳至檔案管理系統中,電子文件大小、格式、算法值與電子文件是否一致等,確保電子文件內容真實性。從電子文件元數據項、電子文件歸檔中的元數據項長度、值域范圍、數據值、特殊字符等,確保電子文件元數據真實性。將電子文件中的著錄項數據內容類型、數值型內容范圍進行檢測,確保電子文件著錄數據的真實性。(2)完整性。明確統計電子文件總件數、總字節數,并將統計的結果與歸檔電子文件的總件數、總字節數進行對比,確保電子文件數據總量的完整性;檢查必著字段內容是否缺失,確保電子文件著錄數據的完整性。詳細記錄文件級目錄總條數,并將每一個目錄條下文件項目數進行統計。組卷后將案卷文件數與目錄數進行比對,確保目錄項完整性。將移交數據包中的文件級總條目數與組卷完成時記錄的文件總量進行對比,確保電子檔案內容的完整性。(3)可用性。查看鏈接數據庫是否正常,元數據表訪問是否正常等,確保目錄數據可用性。歸檔電子文件內容數據格式要統一,符合相關規定和標準要求,保證歸檔電子文件內容可用性。歸檔載體要符合統一要求,確保電子檔案數據信息的可讀性。檢查信息包存放元數據XML文件是否能正常讀取,以確保歸檔信息包可用性。(4)可靠性。在滿足真實性、完整性、可用性基礎上,還需要確保目錄數據安全、做好數據備份,確保電子文件歸檔的可靠性。
3.2 電子檔案移交與接收
電子檔案移交是指按照規定將電子檔案保管權交由檔案館或檔案室專門管理的過程。電子檔案接收是指檔案館、檔案室按規定履行收存電子檔案的過程。(1)真實性。電子檔案移交應包括電子印章、電子簽章真實合法;移交的電子檔案大小、封裝時間、簽章人及簽章時間、算法值等與電子檔案移交前保持一致;電子檔案元數據項和移交信息包中的元數據項長度、值域范圍、數據值均在合理范圍內;著錄項數據內容及范圍應與著錄項定義模板一致;移交目錄、文件級著錄數據與電子內容關聯要準確。(2)完整性。移交后,接收完成時,要對每個案卷檔案數量進行比對,確保目錄項完整性。從移交信息包中的文件級總條目數與移交時的總條目數進行比對,確保電子檔案內容的完整性;移交信息包中的目錄信息數量與元數據一致,電子檔案數量與元數據一致,確保歸檔信息包完整性。(3)可用性。接收電子檔案內容數據格式要滿足要求,確保電子檔案內容可用性。移交電子檔案載體要滿足標準規范,確保載體數據信息的可讀性;移交信息包中的元數據XML文件要保證能正常讀取,確保歸檔信息包可用性。(4)可靠性。在保證電子檔案移交、歸檔真實性、完整性和可用性的基礎上,還要確保電子檔案目錄數據中不得包含著錄攻擊字符;確保移交信息包沒有感染病毒,并將不同存儲載體的電子檔案進行數據備份,確保安全可靠。
3.3 電子檔案保存
電子文件歸檔,以及電子檔案移交、接收,后期的保存,都要始終圍繞“四性”要求,確保電子檔案得到長期維護,及其所涉及的過程和操作符合檔案管理要求。(1)真實性。長期保存的電子檔案應包括電子印章、合法電子簽章等,確保數據來源真實;長期保存的電子檔案封裝時間、簽章時間、文件大小、簽章數量應與接收的電子檔案保持一致;數據庫中的電子檔案元數據與接收的信息包中的元數據值域范圍、數據值等是否在合理范圍,檢測其元數據的真實性;對比著錄項的定義模板,檢測數值型、數據內容類型,確保長期保存的電子檔案著錄數據真實性。對比檢測接收的電子檔案目錄、文件級著錄數據,確保電子檔案內容與目錄關聯的準確性。(2)完整性。統計接收的電子檔案總件數、總字節數與元數據中記錄的總件數、總字節數進行比對,檢測電子文件數據總量是否完整;此外,還要從著錄數據、目錄項和電子檔案內容、歸檔信息包、電子檔案封裝包等方面,檢測接收的長期保存的電子檔案完整性。(3)可用性。從目錄數據可用性、電子檔案內容可用性、載體數據的可讀性和歸檔信息包的可用性等方面,檢測長期保存的電子檔案的可用性。(4)可靠性。在保證真實性、完整性和可用性的基礎上,檢測目錄數據安全性、電子檔案病毒檢測及載體安全性等方面,確保長期保存電子檔案的可靠性。
參考文獻
[1]李國華.試析電子文件與電子檔案“四性”的含義及其全程保障[J].機電兵船檔案,2023(1):81-86.
[2]鞠紅旗,譚淑紅,王磊.建設工程電子檔案全生命周期“四性”檢測研究[J].未來城市設計與運營,2022(10):70-75.
[3]譚明瓊.從“四性檢測”角度研究電子檔案的管理和應用[J].城市情報,2022(24):158-160.
[4]展霄鵬,王慧,康晨煒.淺談電子文件、元數據、四性檢驗與電子檔案的關系[J].蘭臺內外,2020(18):27-28.
[5]孫立業,楊雯,張北建.電子檔案“四性”在《中華人民共和國檔案法》修訂版中的體現及實現途徑[J].機電兵船檔案,2021(5):81-83.
[6]張泓.“5W1H分析法”視角下看會計類電子檔案“四性檢測”[J].社會科學,2021(7):206,208.
[7]王大眾.《文書類電子檔案檢測一般要求》解讀[J].中國檔案,2019(4):34-35.
[8]姚姮.大數據時代企業電子文件歸檔和電子檔案管理的探索與實踐[J].陜西檔案,2021(6):38-39,37.
作者簡介:曹洪陽(1983— ),大學學歷,煙臺市市直機關醫院館員,主要從事醫院檔案管理研究。