【摘 要】 文章主要介紹了檔案數字化建設的基本原則與措施,并探討了數字化過程中需要解決的問題。
【關鍵詞】 檔案 數字化建設
Abstract : The paper mainly introduces the basic principle of the archives digital construction and the measures.
當今人類社會已經邁入了信息時代,信息技術的迅猛發展,深刻地影響著社會的各個領域,變革著人們的生活、工作和學習方式。信息化浪潮的沖擊,同樣給檔案工作也帶來了一場革命。檔案的信息化建設包括方方面面的內容,最主要的是檔案信息資源建設、網絡建設、法規標準建設和人才建設。其中最基礎、最迫切的是檔案信息資源建設,特別是檔案的數字化處理工作,浩如煙海的傳統檔案資料要經過數字化處理變成計算機能識別和處理的代碼序列,這無疑是一項艱巨的工程,也是當前我國檔案界進一步推進檔案信息化建設所遇到的“瓶頸”問題。
1.檔案信息數字化的基本原則:
鑒于電子文件管理、檔案資源質量等方面的問題,當前沒有可能和必要將所有檔案進行數字化。為了追求數字化工作的實際效果,數字化工作應當遵循以下原則:
1.1價值性原則:即優先選擇珍貴檔案進行數字化,以便提供利用數字化副本,保護珍貴的檔案原件。
1.2實用性原則:即優先選擇利用率較高的檔案文獻進行數字化,以提高檔案的利用價值。但實用性應用的總需求的高度來考慮。
1.3開放性原則:即優先選擇開放的檔案文獻進行數字化,以提高檔案的共享程度。有限考慮非密檔案的數字化。
1.4特色性原則:即優先選擇開放的檔案文獻進行數字化。由于所處的地理位置、專業系統等條件不同,每個檔案館收集的檔案都有自己的特色。選擇特色有利于檔案館創立自己的名牌產品,提供特色服務,還可以在檔案館建造中避免重復。
2.加快館藏資源數字化建設的措施
傳統檔案進行數字化處理不外乎兩種手段,一種是通過鍵盤錄入進入計算機,另一種是進行光學掃描進入計算機,以圖片格式或光學字符識別技術變成文本格式存儲起來。鍵盤錄入只適用于檔案目錄數據庫的建立,顯然對于浩如煙海的檔案全文信息不能采用這種方式,只能用光學掃描技術。
2.1分析館藏數質量,確立數字化對象
龐大的傳統檔案資料需要數字化處理,從何處下手呢?這必須考慮先與后、點與面的問題。也就是說必須確定哪些館藏需要優先數字化?哪些必須數字化?哪些可以暫時不數字化?從各個檔案館的館藏內容和特色來看,情況不完全相同,但有共性之處。在軍隊將檔案的保管期限分為永久和定期兩種,而地方檔案館將檔案的保管期限分為永久、長期和短期。筆者認為首先是永久檔案必須數字化,特別是永久的文書檔案、科技檔案和一部分專門檔案應該優先數字化;其次再是定期、長期和一部分短期檔案;聲像檔案應盡早數字化;在永久檔案中,利用頻率高的檔案應該優先數字化。
2.2集中人員設備以工廠化作業方式展開
確立了館藏數字化對象后,就應該抓緊建設檔案目錄數據庫和全文信息數據庫。“九五”期間,各檔案館基本已經完成了檔案目錄的著錄,檔案目錄數據庫業已基本建成。現在迫在眉捷的是檔案全文信息數據庫的建立,即對傳統檔案全文進行光學掃描。各檔案館應該集中經費、人員和設備重點開展這項工作。
2.3注意使用新技術新設備
在對傳統檔案進行數字化處理時,應注意使用新設備和新技術,如縮微品轉換為數字信號的技術,經過縮微處理的檔案,只需使用縮微膠片掃描儀,對縮微膠片進行掃描,直接將縮微膠片轉換成數字信號,避免再對紙質原件進行重復掃描。
2.4貫徹邊建設邊服務的思想
在進行館藏資源數字化建設的同時,也應抓緊檔案館網站建設,貫徹邊建設邊服務的思想。要將已經完成的檔案目錄數據庫上網,將完成的部分全文信息分全宗、分專題上網,通過檔案館網站提供服務,還可在檔案館主頁上設置留言板,返饋利用者的利用信息,根據利用者的利用需求,指導我們館藏資源數字化的對象和范圍。
3.數字化需要解決的問題
在加快館藏資源數字化建設的過程中,要特別注意解決以下幾個問題:
3.1存儲格式標準問題
館藏檔案經數字化處理后,以什么格式存儲,既能保證其品質又能方便以后的提供利用,這就有一個格式標準的問題。我們在考慮標準問題時,就信息技術而言,首先應該考慮的是國際標準,其次是國家標準,再次是行業標準。傳統檔案經掃描后,以圖像文件存在,以現在比較成熟的標準來看,有TIF格式、JPG格式、GIF格式等,這三種都是國際標準。我們可以借鑒數字圖書館的實踐,在存儲層采用TIF格式,在網絡層采用JPG格式,在索引層采用GIF格式。
3.2質量檢測問題
傳統檔案經數字化處理后,其質量如何,是否圖像清晰,便于閱讀?必須建立健全質量檢測制度。安排專人進行質量檢查,嚴格落實責任制,做到誰出錯誰糾錯。對那些格式錯誤、非原件因素字跡模糊不清、褶痕明顯遮蓋檔案內容、漏頁、檔案內容不完整等不符合質量要求的問題,應該重新處理,確保經過數字化處理所形成的數字檔案內容完整、字跡清晰,方便閱讀。經檢查合格后方可進行存儲、備份和數據刻錄。
3.3做好數據存儲備份,確保數據安全
經數字化處理形成的數字檔案凝結著檔案工作者的辛勤勞動,是用時間、人力和經費創造出來的寶貴的數字信息資源,一旦保管不善,數據丟失,將會造成難以彌補的損失。為確保其安全,建議在存儲數據時,至少采用四套制。即一套用大容量硬盤存儲,另一套用大容量硬盤做鏡像存儲。另兩套刻錄成光盤,兩套光盤分開保存,確保數據的安全。光盤的壽命較長,據有關資料報到,第一張光盤是在1980年誕生的,迄今為止也只有21年,為了測試光盤的壽命,科學家們在實驗室做光盤老化實驗,以“塊錯誤速率”≥50為指標,美國實驗室得出的結果是光盤在常溫、黑暗條件下保存其壽命超過100年,柯達公司的試驗結果是光盤在黑暗、25℃、相對濕度40%的環境中,95%的光盤的壽命超過200年。
綜上所述,旨在說明加快館藏資源數字化建設已是當今檔案信息化建設的重中之重,我們必須采取有效措施,力爭在較短的時間內完成這項工作,盡快利用現代信息技術全面提高檔案信息服務水平。
參考文獻:
[1]高治宇,李超,常曉茹.《數字化檔案長期保存的問題及對策》.蘭臺世界,2009.
[2]陳煒.《檔案信息數字化與檔案信息資源開發利用》.科技進步與對策,2006.
[3]高振宇.《圖書檔案的數字化實踐》.科技與出版,2010.
(作者單位:哈爾濱第二電業局)
China’s foreign Trade·下半月2011年2期