孫楊民
(佳木斯大學,黑龍江 佳木斯 154007)
檔案管理現代化的一個重要特征是數字化檔案的使用與傳播。20世紀80年代開始有關檔案的數字化實踐工作就已經開展了,主要方式是利用計算機模擬傳統檔案管理方式實現簡單的檔案目錄管理工作,更多的是作為手工管理的一種補充。隨著信息時代的到來尤其是互聯網技術的發展,檔案管理的信息化、數字化工作得到長足發展,已成為檔案管理的工作方式和手段不再只是作為輔助,同時借助檔案的數字化副本帶來的便利性可以實現檔案信息資源的共享以及高效利用,把長期沉睡檔案的內涵價值最大限度地挖掘出來,實現其社會價值。
紙質檔案數字化或者說檔案數字化是檔案管理現代化的重要一環,可以說每一座檔案館都收藏有大量的紙質檔案,對這些紙質檔案數字化并管理是一項重要工作。由于人員、資金、設備等條件的限制和制約,不同的檔案機構面臨不同的問題和困難,如何做好存量紙質檔案的數字化工作有許多問題值得探討和研究,而構建紙質檔案數字化的管理與利用體系是開展此項工作的重中之重。
紙質檔案數字化是一個長期的回溯過程,需要系統謀劃來完成,目前普遍使用的辦法是通過采用數碼轉換設備并輔助人工來完成紙質檔案的數字化加工并存儲在磁帶、磁盤、光盤等能被計算機讀取與識別的設備上,當前使用較多的轉換設備仍然是掃描儀和數碼相機。作為數字資源的一種,數字化的紙質檔案改變了傳統的檔案利用和傳輸方式,使檔案工作者從繁瑣的日常事務性管理中解脫出來,更加專注于檔案內容的管理、傳播和利用,可以說這種轉變是革命性的,拓展了檔案利用的外延,豐富了檔案工作的內涵。
紙質檔案數字化的兩種主要方式是掃描與拍攝,區別在于根據紙質檔案的形態和質量差異而采用不同的儀器設備,由于紙質檔案的形成方式和來源不同人工輔助依然不可缺少,因為無法實現完全自動化從而增加了轉換難度和轉換時間,成本居高不下。快速得到紙質檔案的靜態數字圖像可以使用掃描儀,對于無法使用掃描儀的不規則文本可以使用照相機或高拍儀等設備拍攝,得到紙質檔案的數字影像,后續開展內容識別得到數字文本,按照檔案著錄規則獲取元數據并進行標引工作也是不容忽視的重要工作。一些先進的紙質檔案數字化設備、更高效的圖像拼接技術、字符識別技術等使得紙質檔案數字化的人力成本和時間成本得到降低,比如不拆卷的斷層掃描儀可以不用破壞檔案完成數字圖像的獲取。
合理、高效開展紙質檔案的數字化工作受到多方因素的影響和制約,這項工作涉及到許多部門和環節,是一項系統工程,不可能一蹴而就,需要結合實際工作開展。毋庸置疑,構建合理有效的紙質檔案數字化體系是推進紙質檔案數字化、信息化工作的基礎,需要通過事前的調查研究確定一個可操作性強的、較為完備的紙質檔案數字化體系。這個體系至少要包括數字化加工體系、數字化存儲體系、數字化安全體系等三個方面,如果可能的話還要增加一個數字化工作的評價體系和數字化檔案管理和使用規范來保證數字化檔案工作的有效性、連續性、完整性。
當前大多數檔案機構的紙質檔案數字化工作的通常做法是依靠掃描儀或計算機的分散式處理來完成,一般所使用的都是基于c/s結構的集成管理系統,當館藏資源較少時還可以應對,隨著數據量的不斷增加以及面對海量資源時能力明顯不足。一整套的數字化加工體系可以達到事半功倍的效果,借助現代信息技術所建立的數字化加工體系是基于云存儲的網絡環境下的流程式系統,利用快速的輸入、輸出設備,高效的識別技術,數字化編輯軟件的協同工作,實現高效、快速、安全、準確的數字化加工,進而得到高質量的數字圖像或影像,為后續的數字資源管理打下堅實的基礎。
檔案的數字化工作是一個連續的不間斷過程,存儲系統是不可或缺的剛性需求。建立合理有效的存儲體系要充分考慮到海量數據實時存儲、處理、永久保存、方便存取、容災容錯等因素的影響。首先,連續不斷的檔案數字化過程所產生的數據量是隨時間不斷積累增加的,因此建立的數字化存儲體系容量需要不斷增長的同時具備較高的存儲效率,即可擴展性和高效存取要平衡;其次,選用合適的媒介和技術方法來保證數字化成果在長期保存之后還要可以訪問和使用,并永久保存;此外,對新技術新方法的使用不依賴于特定的設備與人員,能夠加快和保證數據的無縫訪問和管理。
確保檔案的安全是檔案管理工作的一項重要工作,和檔案的存在形態無關,而數字化資源的易復制、易傳播、易篡改的特點又決定了數字資源的安全保護工作更加復雜和不確定性。因此建立一套完整的、可操作性強的、可實施的紙質檔案數字化安全保障體系是十分必要的,這樣就從源頭上保障了檔案實體、檔案信息的安全和真實有效。一個強健的可實施的數字化安全體系至少應當包括有效的數字檔案安全制度,信息系統安全保障措施、檔案的傳播與利用的安全保證等方面。
紙質檔案的數字化過程及結果要保證完整性、準確性,這就需要有一個評價體系來對整個流程進行質量評價進而保證所得到的數字化檔案的完整、準確。這個評價體系使得整個的數字化過程可控并可追溯,并可對接續的數字化流程提供改進方案和措施,提高效率。首先建立綜合評價指標體系,對數字化檔案工作所存在問題與解決措施等一系列情況進行全面的事前評估。其次評估紙質檔案數字化流程是否合理有效,獲取的數字影像或數字文本是否保證了檔案的真實性和完整性;再者,對接下來的數字化工作提出合理化的建議和改進措施。
紙質檔案數字化的最終目的還是為了更好地開發和利用檔案資源,數字化的檔案信息依靠合理高效的科學管理方法和全新的技術手段實現對紙質檔案信息的深層次挖掘。檔案事業的發展在信息時代、網絡時代與過往相比存在較大的不同或差異,現代信息技術的廣泛應用是保證檔案有效管理的必要條件。經過深加工的數字化檔案使得檔案管理手段和方式極大豐富,尤其是檢索速度和檢索效率提高使得檔案工作者從繁重的檔案日常重復管理中解脫出來,專注于檔案內容管理、數據挖掘、提高信息服務水平等。
紙質檔案的數字化過程需要多方人、財、物的配合以及連續不斷的工作積累,是一項艱巨的任務,是一個不可間斷的密集勞動過程。在這個過程中需要合理規劃,對將要遇到的問題進行提前預判、充分論證并給出妥善解決辦法,這樣才可以達到事半功倍的效果,爭取工作的早日完成。
檔案數字化工作需要員工借助某些特定設備、系統來完成,所以專業的檔案管理人員仍然是檔案數字化工作的主體勞力。檔案管理人員需要通過不斷的政治理論學習和業務學習,提高政治理論素質、工作責任心、業務能力,積極主動合理高效地做好紙質檔案的前期收集、整理工作,同時要具備一定的科研、攻關意識,工作中做到理論與實踐相結合,合理創新,拓寬數字化檔案工作的服務領域。檔案管理部門也要為館員創造終身學習的良好環境,這不只是檔案數字化的要求,也是檔案事業發展的要求。
從手工到自動化,從實體到數字文本,檔案的管理方式和存放方式改變的同時也需要全新的管理理念相適應。這種轉變的一個重要特征是由藏向用的轉變,即管理向服務的轉變,從接收檔案入館到主動開展各級各類檔案的收集與征集工作使得館藏極大豐富,借助于現代信息技術尤其是互聯網技術使得檔案的管理和利用更加方便快捷等。
技術手段在紙質檔案數字化的過程中尤其重要,目前的數字化技術多種多樣,圖像處理和圖像識別技術是紙質檔案數字化過程中最主要的技術,采用規范化的通用技術對后續的數字資源的存儲和管理十分必要。新技術新方法層出不窮,目前以云計算為核心的現代信息技術已經成為數字化管理的主流,在本館的紙質檔案數字化工作中引入云計算的過程中要合理有效地利用現有資源和技術,不斷改進工作方案,科學地融入,從而保持工作的一致性和連續性。
檔案由藏到用的轉變一個重要的特點是由關注檔案的實體到對檔案內容的利用與分析,如何從海量信息中找到有價值的信息是檔案數字化之后的后續關鍵問題。借助于信息挖掘技術找出有價值的檔案資源為管理機構和個人提供更專業的服務并解決問題是提高檔案服務水平的一個重要手段,在實際工作中起到重要作用。得益于時代的發展,檔案數字化成為當前檔案工作的主要內容之一,檔案從業者也在采用新的信息技術和新的檔案管理理念的推動下不斷探索與發現檔案數字化管理工作的新思路。雖然無論是已經開始或即將開始紙質檔案數字化的管理機構都面臨著各種各樣的問題,但通過構建高效的數字化工作體系開展的數字化工作已經逐漸實現了沉睡檔案巨大價值的深度發掘和使用,在今后的工作中,隨著技術的發展和進步,紙質檔案的數字化工作將取得更大成就。