王宏卿
檔案數字化是隨著計算機技術、掃描技術、OCR技術、數字攝影技術(錄音、錄像)、數據庫技術、多媒體技術、存儲技術的發展而產生的一種新型檔案信息形態,它把各種載體的檔案資源轉化為數字化的檔案信息,以數字化的形式存儲,網絡化的形式互相連接,利用計算機系統進行管理,形成一個有序結構的檔案信息庫,及時提供利用,實現資源共享。隨著時代進步和科技發展,檔案數字化是今后一段時間內檔案管理工作不可或缺的重要組成部分,此項工作周期長、任務重、要求嚴,因此深入思考檔案數字化過程中存在的問題意義重大。筆者結合工作實踐,就檔案數字化工作中應注意事項與大家進行探討交流。
首先,掃描是數字化檔案的重要步驟。眾所周知,掃描是紙質檔案數字化中的關鍵環節,掃描工作的好壞影響著整個數字化工作的質量。
就硬件而言,在信息采集設備中,一般的掃描儀只能掃描有限幾種類型的紙張,如A3、A4或更小的紙張,而實際工作中存在一些紙張較大的檔案資料,普通掃描儀滿足不了相關需求,會導致掃描件成像不全。而信息存儲設備則要求更高,設備的運行速度、容量以及成像像素都影響著紙質檔案掃描后的質量。信息提取設備配備的不足,會影響和局限數字檔案的利用,使得部分數字化后的檔案無法提取和識別。
就軟件而言,操作系統的不統一,很容易造成規范性、服務性、共享性的不統一。
就成本而言,經濟成本偏高,非一般單位所能承受,如設備的購置、維修、維護及耗材的定期更換,人員的定期業務培訓,專業掃描公司的聘用等。時間成本過大,影響紙質檔案掃描時間的因素有很多,如硬件設備、軟件設備、人員操作熟練程度等。
就操作人員而言,需要其具有相關的專業知識,做好檔案整理、掃描準備、正式掃描、圖像處理等工作,要分工清楚,責任明確,專人專類或專人專卷。實施檔案數字化的過程中,須對原有檔案進行撤架、拆封、編號、標記等一系列的處理工作,在此過程中如有操作不當會對原件造成損壞。掃描前,檔案原件必須完整、排序正確,要整理好需要掃描的各類檔案目錄,對所有檔案按要求編制統一規范的檔號,并確定相關的字段名和字段類型,避免造成卷目混亂和損害。在拆除原檔案裝訂時,要注意保護檔案原件,對折損嚴重影響掃描質量的原件要按規定預先修整。對模糊不清的檔案進行特殊處理,確保檔案數字化質量。檔案形成于不同年代,載體、字跡復雜多樣,字跡清晰度和紙張質量差異很大,印章的色差也不同,所以在掃描前要根據檔案的具體狀況,適當進行整理,視需要進行登記或做出標識,在登記標注時不易字體偏大過重,尤其是脆弱紙張要小心處理。掃描前整理的不規范會直接影響掃描的速度和質量,造成漏掃、重復掃描甚至損壞原件,減少原件的憑證價值和歷史價值。
正式掃描中操作人員要經常檢查、解決、協調掃描過程中出現的各種問題。如檔案目錄錄入時可能存在錯誤情況,需要仔細核對。對字跡模糊不清的檔案,需記錄下來單獨處理,掃描時,避免對檔案原件壓制用力,翻頁動作要輕,幅度要小,不要盲目追求速度,忽視質量。而相應參數設定的不規范性也會影響錄入圖像的清晰度。在參數設置問題上,雖然國家和地方出臺了相關的標準和條例,但也只是給出了原則性的規定,是粗線條的,籠統的,這就需要操作人員主觀判斷,根據實際情況做出適當的調整,做到因件而異,“量體裁衣”。
掃描后,要對圖像質量進行檢查,減少掃描件混亂、缺失、失真等情況的發生,如紙張較大的檔案需掃描多次再經后期處理合成,批量處理的檔案會造成少數掃描件失真,后期處理不當會導致掃描件與原件對比時發生遺漏和缺失,發現不符合要求的,要進行再處理,如去掉掃描紙張中明顯的裝訂孔、文件中明顯的污垢等。掃描后的文件圖像應保持檔案的原貌,字跡清楚不失真,無錯掃、漏掃,對文件圖像質量有問題的應重新掃描。
其次,是檔案數字化后的安全管理。現在對于普通的紙質檔案,我們已經有了非常成熟的管理制度和技術,對于檔案的調閱也有著嚴格的審批制度,在選址、防火、防盜等方面也有相應的措施來保障文件檔案的安全。但對于數字檔案,還沒有詳細的、操作性強的安全管理制度。這就需要檔案管理者不斷適應計算機技術的發展,打破原來傳統的模式,運用新的科學技術進行管理,創新思維、技術來適應新的社會檔案管理的需要。面對大量產生的電子文件和照片、音頻、視頻等以數字為載體的聲像檔案,管理人員往往會在不經意間造成數字檔案管理的漏洞,形成安全隱患。另外,計算機技術發展迅速也是造成各種攻擊以及破壞手段層出不窮的因素,數字檔案的安全包括網絡、系統、信息、物理等方面,因此,日益增加的數字檔案管理是有很多環節容易出現問題的。綜上所述,數字化檔案信息,保證信息載體的可靠性、安全性,已經成為所有檔案管理者必須首要解決的問題。這就意味著數字檔案管理在主機服務器、存儲設備、系統軟件、硬件等基礎安全、網絡安全及操作人員管理的安全等方面都要具有很高的安全保證、管理及防范措施。
就基礎安全而言,主要是指涉及到系統存貯的檔案數據的安全問題,包括硬盤、操作系統、數據庫管理系統、數據存貯和備份、數據格式的轉換以及各類電子文件的保管和異地存貯策略等。硬件的損壞,軟件的故障這兩大因素會給系統中的檔案數據帶來威脅。這就需要管理人員在選擇硬件時充分考慮到硬件的品牌、可擴展性、兼容性以及軟件的可靠性和可恢復性。防止由于硬件的升級、硬件設備的意外損壞、數據版本的更新、數據格式的轉換、存貯介質的老化、失效等造成的數據丟失、數據損壞甚至是計算機系統的破壞和癱瘓等情況的發生。
選擇什么樣的操作系統來確保應用系統的安裝和運行呢?目前主流的操作系統有Windows、MACOS X和Linux,在操作性能和安全性能方面各有優缺點,關鍵是如何選擇滿足用戶實際需求的操作系統和數據庫管理系統。尤其是基于Windows XP的數字化檔案系統,今后的系統升級和安全維護是檔案安全管理的重點,需要盡快找到妥善的解決辦法。系統的主要設備、軟件、數據、電源等應有備份,并有技術和組織措施,能在較短時間內恢復系統運行。服務器的UPS電源要保證在停電后10小時內仍能保持正常工作,保證電源穩定和雙路供電,并對相關設備進行安全接地,定期進行軟件更新升級、系統漏洞掃描,及時安裝補丁程序。對檔案數據要自動、定期備份,定期檢查,不僅要做好本地數據備份,還要根據現有條件做好數據異地備份,妥善保存備份記錄,只有這樣才能有效預防突發的各類狀況,確保數字檔案信息萬無一失。
就網絡安全而言,主要以技術手段進行約束。如:將信息內網和互聯網進行物理隔離,設立雙網防火墻,在內部網和公共網絡之間建立一個安全網關,保護私有網絡資源免遭其他網絡使用者的擅用和入侵。對IP地址和計算機進行綁定,保護網絡不從內部被攻擊,即使是內部攻擊也能及時找到相對應的設備,給予反制措施。設立身份認證、修改權限、訪問權限和訪問模式,用身份認證的形式來確認訪問的合法性,通過可靠的身份認證確定用戶身份,再通過網絡訪問控制系統設置網絡訪問規則,有效保護內部檔案資料,防止信息外泄。修改權限只限定指定的檔案工作者擁有,而訪問權則指定有該權限的用戶擁有。建立訪問日志,對網絡活動進行審計和監測。必要時對重要檔案進行分級加密,根據組織或職務級別設立查看檔案的密級程度。定期更換口令,防止口令外泄。在用戶終端安裝防病毒軟件,防止數字化檔案系統感染病毒,造成巨大損失。
就操作人員的管理安全而言,要采取嚴格有效的管理措施。要不斷建立和完善數字化檔案安全的管理制度,對存在不足或需要改進的制度及時進行修訂,做到有“法”可依,違“法”必懲。要加強人員安全管理,明確安全責任,建立專人負責制,及時終止離崗人員的訪問和修改權限,做到內部嚴密控制。要建立檔案工作應急預案,定期演練,加強員工安全培訓,不斷提高員工安全意識。
檔案數字化是信息化時代對檔案管理的挑戰,也是檔案管理的機遇,既具有存儲、檢索便捷,傳輸快速,信息共享等優點,是傳統紙質檔案望塵莫及的,也不可避免地存在一些缺陷和不足,我們只有清醒地認識到這些問題,才能理解檔案數字化建設還有諸多難題亟待我們深入研究解決,否則將給未來的檔案事業留下很多缺憾。
(作者單位:河北港口集團有限公司)endprint