江麗華
為推動檔案工作的轉型升級,加快與信息社會融合,1999年,深圳市檔案局在全國率先提出并啟動數字檔案館建設工程。21世紀初,各級國家綜合檔案館圍繞檔案數據和資源利用,加強檔案資源“全數據”建設,館藏檔案的數字化工作逐步鋪開,并作為檔案工作的一項全新事業、全新工程在全國各地快速推進。作為檔案信息化的基礎支撐性工作,這項工作取得了很大的成績,但在實際工作中,也存在一些困擾檔案事業高質量發展的根本性問題。
一、檔案數字化的現實意義
1.檔案數字化是實現檔案信息化的重要內容
紙質檔案數字化是指采用掃描儀等設備對紙質檔案進行數字化加工,使其轉化為存儲在磁帶、磁盤、光盤等載體上的數字圖像,并按照紙質檔案的內在聯系,建立起目錄數據與數字圖像的關聯關系。隨著計算機技術、網絡技術以及通信技術的發展和應用,我國檔案事業從傳統管理逐步邁向檔案信息化階段。作為信息化轉型的關鍵支撐,紙質檔案數字化是數字檔案館和智慧檔案館的核心內容之一,是“互聯網+”時代檔案工作的必然選擇,館藏資源數字化也是實現檔案信息組織與服務網絡化、檔案實體虛擬化、信息資源共享化、檔案利用知識化的基礎,是信息化社會給予檔案事業的新挑戰和新契機。
2.檔案數字化是實現檔案管理、利用模式轉變的重要手段
檔案數字化工作以檔案存儲數字化、利用網絡化、服務大眾化為目標,改變過去檔案工作單一、局限的管理模式,建立網絡化的檔案利用服務體系,不斷增強檔案信息社會共享和遠程服務功能,統籌安排檔案利用服務、政府公開信息服務和其他公共服務,開展檔案信息在線檢索、調取、瀏覽、傳輸等全程化合作,提供查檔一站式服務和遠程服務,由傳統利用方式向現代利用方式轉變,形成面向公眾、便捷高效的檔案信息服務利用體系。
3.檔案數字化是充分體現檔案價值的重要支撐
檔案信息化水平的提升,有利于進一步提高檔案工作制度化、規范化、科學化水平,突破檔案屬地利用限制,打破檔案“信息孤島”,實現館際檔案資源的共建共享。隨著國家治理體系和治理能力現代化的深入推進,檔案工作發揮作用的空間越來越大,與老百姓的關系也越來越密切,依法樹立以開放為原則的服務理念,推動數字檔案資源的共建共享,可以全方位、多層次、多角度地為經濟建設和社會發展服務。
二、紙質檔案數字化工作的現狀
檔案部門考慮到自身人力和物力的局限性,根據檔案信息化發展的需要,通過招標、競價等方式將檔案數字化工作委托給外包服務公司,可以實現檔案數字化工作效益的最大化。但是從現有的檔案數字化成果來看,數字化工作中也存在一些問題。
1.數字化工作中存在的問題
(1)目錄錯誤率高
根據《文書檔案文件級目錄數據庫結構與著錄細則》和《江蘇省文書檔案文件級目錄數據庫結構與數據交換格式》規定的相關要求,目錄著錄的錯誤包括題名中錯字較多、題名不完整、擬題不清、其他著錄項錯誤等。目前在全文檢索存在很大難度的前提下,目錄數據庫的建立是方便檔案檢索和利用的唯一途徑。由于在檔案數字化之前,已建立一定程度的目錄數據庫,數字化過程中核對目錄、完善目錄數據庫工作環節往往被忽視,相關工作人員素質良莠不齊,對文件的理解和把握能力不夠,錄入文字的準確性不高等,致使雖然數字化已完成,但檔案還是查不到或查不全。
(2)數字化前整理工作缺失
紙質檔案數字化前的整理工作,是在充分尊重前人勞動成果的基礎上,以適應紙質檔案數字化要求為目標而開展的兼具回顧性和開創性雙重特征的重要基礎業務工作,包括確定掃描頁、編制頁號、目錄數據準備、拆除裝訂、技術修復等環節。例如,許多檔案中存在頁碼編制錯誤,跳頁、漏頁等現象,有數字化外包公司省略整理編頁環節,也有數字化外包公司在編制頁碼時采用了“-1”“-2”等副頁辦法。筆者認為,頁碼編制不規范會造成兩方面后果:一是著錄項中載體數量與實體檔案頁數不符;二是在查檔利用時如果只需要一件檔案中的部分材料,而掃描頁碼與檔案中實際標注的頁碼不一致,就會發生選擇頁碼錯誤,影響查檔效率,還有可能在沒有認真審查的情況下,打印不需要的頁面而浪費紙張。
(3)掛接錯誤或掛接不上
檔案數字化完成后,會發現有檔案無法掛接或是打開錯誤的情況,一般來說有三個原因:一是數字化公司掃描后的文件一般以JPEG格式儲存,這時的命名是按掃描的順序自行命名,為了利用需要,轉換為PDF時應該按檔號命名,許多公司用自行研發的軟件在批量命名時發生錯誤,這會導致因檔號錯誤而無法掛接,文件打不開。二是檔案在歸檔整理時發生錯誤,目錄著錄張冠李戴,如建房證存根,目錄擬對應的與實體中反映的不是同一人,在數字化掃描時也未能發現錯誤,就會發生利用時用正確的目錄打開了錯誤的頁面。三是分件錯誤,數字化公司在圖像處理環節進行圖像的分件處理時發生錯誤,而導致一份實體檔案的掃描件被分割在多個目錄中。
(4)掃描過程中產生的錯誤
掃描過程中,因為漏頁、重復掃描,掃描時紙張掃不全,兩頁合并掃描等原因,導致了文件缺頁、重頁、上下重疊掃描不完整等錯誤。
(5)未能準確區分涉密檔案
涉密檔案一般不進行數字化加工或由檔案館自行數字化加工后加密存放,工作人員在區分時對涉密文件認識不清或操作不仔細,致使部分涉密文件未能挑出。
(6)利用時文件打開速度過慢
在查檔利用時,打開一個文件需要5—10分鐘,這一問題產生的原因:一是檔案管理軟件本身的局限性,全文打開的方式有待優化;二是檔案整理時將多份文件裝訂成一件,如一套創建材料、一套會議材料、一整本工資名冊等,因圖片過大而導致文件在查閱時打開很慢,影響查檔效率。
(7)其他
在掃描中,因掃描儀分辨率不高、紙張放置歪斜、裝訂順序錯誤、過度修圖裁邊等產生的問題。
2.數字化工作發生問題的原因
(1)數字化前處理工作流程疏于監管
數字化公司為節省人力和財力,相應的規則形同虛設,工作人員為追求利益最大化,視流程為空文。
(2)目錄著錄方式不規范
許多檔案館要求數字化外包公司在目錄著錄時采取雙機著錄的方式,但實際操作中數字化公司為省工沒有實施。
(3)數字化公司與檔案部門溝通不及時
數字化過程中出現的許多業務問題,數字化公司不與檔案館及時溝通,自行走捷徑處理,導致有的問題加工完畢才發現。
(4)數字化公司質檢環節走過場
一般的數字化公司會設置質檢環節,但在實際操作中并沒能按要求嚴格進行,有流于形式走過場的情況。
(5)抽檢機制不合理效率不夠高
一部分檔案館會對數字化成果進行抽檢,但數字化工作安排中沒有為質檢與加工留出足夠的緩沖時間,質檢往往滯后于加工環節幾個批次,質檢結果出現之前新的加工已經開始,無法及時發現加工方存在的問題,許多問題是在日常使用中才發現的,導致同樣錯誤越積越多,最后難以徹底修改。
三、有效開展紙質檔案數字化工作的對策
1.加強頂層設計,完善檔案管理一體化系統
形成需求導向的檔案信息化管理新模式,檔案行政管理部門主動適應互聯網和大數據、云計算、區塊鏈、人工智能等前沿技術的發展趨勢,圍繞戰略性、前瞻性、實用性問題開展檔案科技研究,關注國家實施大數據戰略和推進電子政務、電子商務、云計算的發展成果,研究其對檔案工作的影響,切實加強檔案信息化頂層設計和長遠規劃,探索電子文件歸檔和電子檔案管理的可行模式,推行自上而下相對統一的檔案管理系統軟件,改變目前由于各地區發展程度不同,檔案管理的軟件設計、硬件功能、管理流程和管理模式不同而自成一體的割據現狀。
2.注重提升效能,確保數字化工作的制度化和規范化
2005年國家檔案局出臺了《紙質檔案數字化技術規范》,從技術標準方面對紙質檔案數字化工作作出了相關要求。但由于信息技術的不斷發展、數字化設備等硬件的更新換代以及檔案內容形式、管理方法、利用方式等的變化,國家檔案局于2017年頒布了DA/T 31—2017《紙質檔案數字化規范》(以下簡稱《規范》),提出了更符合新時期信息技術發展的紙質檔案數字化工作的規范要求。檔案館和數字化外包單位應以《規范》為統領,研究論證,出臺符合自己館藏特點的細則、要求,并嚴格組織實施,做到相關流程不走過場,相關制度不流于形式。
3.堅持問題導向,做好檔案的基礎業務建設和標準化質檢工作
隨著信息化工作的推進,計算機的輔助管理對檔案整理工作提出了更高的要求,檔案整理的基礎決定了數字化工作的質量,規范檔案基礎工作,嚴把檔案進館關,對列為檔案數字化對象的館藏檔案,嚴格按要求進行數字化前處理工作,即在進行數字化之前,對檔案逐卷、逐件檢查,查看檔案分類是否正確、組卷是否合理、編號是否規范、保管期限劃分是否準確、頁號編寫是否正確、盒內文件是否有破損、歸檔目錄填寫是否完整、案卷題名擬寫是否準確等。對于相關要點,數字化外包公司應熟記并準確掌握,一旦發現問題及時登記或按規范進行處理。建立規范的質檢體系,數據從采集到成品應經過生產單位自檢、數字化加工小組抽檢以及檔案管理人員成品驗收,質檢合格后方可歸檔入庫。
4.開展業務培訓,提升隊伍的整體水平
加快推進以信息化為核心的檔案管理現代化,必須有一支高素質專業化的檔案干部隊伍。許多基層檔案干部知識結構已不符合檔案事業發展的需要,檔案行政管理部門應建立完善科學的引才育才機制,多措并舉,進行電子檔案基礎知識、計算機管理技術、數字通信技術等強化培訓,使他們迅速掌握電子檔案管理的技能,建設一支政治過硬、本領高強、作風嚴謹、有專業水準的高素質檔案干部隊伍,推動檔案公共服務邁向現代化,以適應新時代黨和國家對檔案工作的新要求、人民群眾對檔案工作的新期待。