張勇
摘要:在大數據時代的背景下,檔案館出現新的工作重心,主要是對檔案數字信息資源的管理。其業務全流程包括:檔案接收、檔案數據管理、檔案數據存備、檔案數字信息資源利用等,本文以北京市檔案館為研究對象,對綜合檔案館檔案數字信息資源業務全流程管理進行了探討。
關鍵詞:檔案數字信息資源檔案工作業務流程紙質檔案數字化副本
當今社會在大數據時代的背景下信息技術飛速發展,為檔案數字信息資源的管理和傳播提供了便利條件和技術手段,同時也使其面臨諸多挑戰。電子檔案的大量產生,以及館藏檔案數字化進程的加速推進,使北京市綜合檔案館檔案數字資源以驚人的速度增長,數據量級將完成太字節(TB)向拍字節(PB)的邁進,檔案工作本身也相應產生變化:檔案實體的管理與檔案數字資源的管理正逐步分離,傳統的檔案實體將更傾向于充當異質保存的角色,而檔案數字資源的管理則將逐步成為檔案工作重心。如何對檔案數字信息資源開展全流程管理,克服相關管理中存在的問題,是擺在檔案工作者面前的新課題。本文選取在業務特性、數據規模都具備代表性的北京市檔案館作為研究樣本。
一、檔案數字信息資源業務的全流程管理
檔案數字信息資源業務全流程管理涵蓋檔案接收、檔案數據管理、檔案數據存備、檔案數字信息利用等主體業務環節的規范管理。綜合檔案館對檔案數字信息資源開展全流程規范管理,具有以下幾個方面的意義:
(一)提高檔案數字信息資源的質量、增加數量
檔案館和利用者都渴望大量的數字資源可供利用,檔案數字信息資源業務流程的管理帶來數字資源的規范化,將使檔案館可以按照同樣的標準和質量進行組織加工,加工速度也得以提高。
(二)增強專業化協作,減少浪費、增加實效檔案數字信息資源業務流程管理的規范可以減少資源加工過程中的重復性工作,從而減少不必要的重復勞動,將復雜的問題簡單化,充分利用前人的勞動成果。數字檔案資源管理業務流程的規范為檔案館的管理提供了條件。在檔案館內各部門之間,通過技術、管理和工作的規范,管理得以正常實施。另外,使檔案館管理與檔案館外部協作得以順利實現。專業化協作是社會生產組織的先進形式之一,是生產社會化和生產分工的產物。專業化把社會生產分解為各個獨立的生產部門,而協作又把被分解的各個部門聯結成為有機的整體。專業化協作的條件是規范化。沒有統一的規范,專業化協作無法進行。
(三)促進世界檔案信息技術標準建立,促進檔案信息技術進步
數字檔案資源業務流程管理的規范一旦實施,一定會產生必要的技術規程或標準,同時促進檔案信息技術的進步。
二、北京市檔案館的相關管理現狀和主要問題
目前,北京市綜合檔案館缺乏針對檔案數字信息資源的全流程管理規范。
(一)檔案接收
現狀:北京市檔案館目前采用離線方式接收電子檔案,使用光盤、移動硬盤作為接收載體介質。接收文件類型多樣,包含電子照片、電子文檔、程序文件、網站系統、辦公系統、音頻視頻文件、多媒體文件等。檔案進館時與立檔單位辦理檔案移交手續,進行數據校驗、核對數目、介質查殺病毒、介質可讀性檢驗、文檔打開檢驗、音視頻隨機播放檢驗等。
主要問題:北京市檔案館因為沒有用于在線接收的軟件平臺,數據校驗之后,接收進館的檢索目錄和電子文件沒有進入系統,而以光盤載體形式存放,并且沒有元數據采集和著錄交接信息,利用方式為檔案光盤調閱。
(二)檔案數據管理
現狀:北京市檔案館紙質檔案數字化副本可以在線查詢,電子文件不封裝,數據按照明文方式存儲。
主要問題:北京市檔案館接收的電子檔案全部處于應用系統之外,不能在線檢索利用;檔案館應用系統在檔案數字資源憑證性保障功能方面空缺;檔案館應用系統沒有館藏檔案數字資源統計報表模塊,統計仍然依靠手工方式進行。
(三)檔案數據存備
現狀:北京市檔案館采用在線、近線、離線備份策略,分別對應本地、同城、異地三級數據備份。接收電子檔案載體存放于專用防磁庫房,介質包括光盤、移動硬盤等。
主要問題:缺乏電子檔案的定期檢查和銷毀機制。
(四)檔案數字信息資源利用
現狀:北京市檔案館采用三種方式提供檔案數字資源利用和信息發布:一是內部數據專網提供電子檔案載體介質調閱和檔案數字化副本在線查詢;二是北京市檔案信息網門戶網站網上檢索服務;三是檔案館舉辦主題展覽和檔案編研出版。
主要問題:檔案館應用系統沒有編研模塊。由于大量的數字資源存放于檔案管理應用系統之外,檔案館不能進行大數據挖掘,不能對公眾開展數據推送服務。
三、提升檔案數字信息資源業務全流程管理績效的建議
根據以上分析,北京市檔案館在數字信息資源業務全流程管理中存在的主要問題可以歸納為:檔案接收沒有建立在線接收機制;檔案數據管理沒有形成完整體系;檔案數據存備沒有檢查銷毀機制;檔案數字資源利用方面缺乏數據挖掘等。針對上述問題,筆者提出了如下建議:
(一)檔案接收
針對檔案館無在線接收機制問題,建議首先建立在線接收系統,并確定相應的接收流程。
關于電子檔案接收的主要流程,筆者的建議是:檢驗電子檔案數據、辦理交接手續、接收電子檔案數據、著錄保存交接信息、遷移和轉換電子檔案數據、存儲電子檔案數據等。數據移交形式為在線和離線。
數據檢驗環節第一步進行數據安全性檢驗,查看有無計算機病毒;第二步進行數據的真實性、完整性、有效性檢驗;第三步進行數據準確性檢驗,核實機讀目錄是否準確規范;第四步進行數據可讀性檢驗,如采取的是離線移交方式,則還需核實光盤目錄是否準確規范,檢查移交光盤的盤面是否清潔、有無劃痕、是否具有可讀性。移交單位和檔案館交接雙方共同辦理檔案資料交接文據,由交接雙方簽字、蓋章,各自留存,文據可采用電子形式并以電子簽名方式予以確認。檔案館正式接收電子檔案數據,應當對接收的電子檔案載體保存5年以上。檔案館應當將電子檔案交接、遷移、轉換、存儲等信息補充到電子檔案元數據中。檔案館應當對電子檔案數據遷移和轉換前后的一致性進行校驗。檔案館對電子檔案載體應當按照DA/T 38《電子文件歸檔光盤技術要求和應用規范》和DA/T 15《磁性載體檔案管理與保護規范》進行存儲管理。
(二)檔案數據管理
建議建立以資源庫為核心的數據管理體系,該管理體系應包含以下內容:
1.檔案數字資源庫維護。檔案數字資源庫維護是一項經常性的數據管理工作,也是數字檔案館建設的核心內容。檔案資源庫一般包括目錄數據庫或元數據庫、內容數據集等。元數據采集方式主要是通過對電子文件或數字檔案的背景、結構和管理過程信息進行自動生成和適當人工添加而形成。內容數據集是數字檔案資源建設的主體,它是通過數據庫、數據倉庫等技術方法將檔案全文按照一定的分類、排序方式排列形成的集合。內容數據一般通過與目錄數據掛接方式實施有效管理,隨著信息技術,特別是檢索技術的發展,將來也會采用其他技術方法對內容數據進行有效管理,對于由電子文件歸檔形成的電子檔案,其內容數據還應與其元數據建立持久有效的聯系,防止非法修改,采取技術措施,確保其可靠和可用。檔案數字資源庫還包含一些需要維護的數據庫表,包括:代碼庫(代碼表如密級、專業、部門)、主題詞表、綜合信息庫(庫房管理)、編研庫。
2.數據整理數據整理。包括元數據增刪改維護、元數據配置、元數據庫管理、價值鑒定。
3.數據歸檔數據歸檔。包括格式轉換、電子文件封裝。
4.數據統計。包括報表統計和報表打印。
(三)檔案數據存備
建議對檔案館藏的電子檔案建立定期檢查、遷移備份和銷毀機制。
1.保管與檢查。電子檔案的保管環境應符合GB 50174-2008《電子信息系統機房設計規范》、GB/T 2887-2011《計算機場地通用規范》、GB/T 9361-2011《計算機場地安全要求》等國家標準的要求,以上標準始終以最新修訂版本為準。在定期檢查過程中發現問題應及時采取補救措施,檢查方法包括人工抽檢和技術檢測。
2.遷移與備份。電子檔案的脫機備份載體應選用磁帶或硬磁盤,保存在脫機載體中的電子檔案應每滿4年遷移一次,數據遷移至新載體后即刻進行一次檢查,原備份載體至少再保存4年,保存期滿后按相關保密規定處理。用作電子檔案備份的載體不得用于其他任何用途,檔案數字信息資源可以按照三級備份體系實施,即以本地備份為基礎、以同城備份為重大保障、以異地備份為重要補充。
3.銷毀與處置。根據《電子文件歸檔與管理規范》(GB/T18894-2002),歸檔電子文件的鑒定銷毀,參照國家關于檔案鑒定銷毀的有關規定執行,且應在辦理審批手續后實施。屬于保密范圍的歸檔電子文件,如存儲在不可擦除載體上,應連同存儲體一起銷毀,并在網絡中徹底清除,不屬于保密范圍的歸檔電子文件可進行邏輯刪除。
(四)檔案數字信息資源利用
建議檔案館根據檔案信息的利用需求和網絡條件,分別通過公眾網、政務網、局域網等建立利用窗口系統,并且應實現如下系統功能:
1.檔案編研。系統應當能夠輔助進行檔案信息資源智能編研、深度挖掘,對數據重新收集、編輯、提煉。首先建立新的編研專題,通過系統提供的自動分類、自動聚類、智能發現、自動摘要、自動關聯推送等功能將符合新專題條件的檔案目錄放入專題庫,然后對專題庫中數據進行編輯,形成新的說明信息,再對專題庫中的資料進行提煉,形成編研材料,最終形成的編研材料通過信息發布的流程發布或出版。
2.綜合查閱。系統應當能夠運用最新檢索技術方法滿足利用者在各種利用平臺對檔案數據進行快速、準確、全面的利用查詢要求。綜合查閱提供目錄檢索、全文檢索、元數據檢索。使得所有用戶在嚴格的權限控制下有效且高效地查詢利用本人權限范圍內的檔案數據和擴展資源數據,包括條目信息和電子原文信息,并能對常用檢索途徑進行優化,滿足用戶對查全率、查準率的要求。系統可實現自然語言搜索和相似性搜索等智能搜索,支持對自動搜索到的全部信息進行智能分類,并可對設定的主題,將全部相關信息進行聚類,系統的自動分類和聚類功能可以以圖形方式展示,方便用戶定位到關心的信息以及了解信息分類之間的關系,從而實現檔案數據的廣泛利用。
參考文獻:
[1]馮惠玲,劉越男.電子文件管理國家戰略[M] .北京:中國人民大學出版社,2011: 2.
[2]梁建梅,陳少慧.教學檔案的管理與信息化建設[M] .北京:中國書籍出版社,2013: 4.