陳春榮
[關鍵詞]檔案信息數據庫;要求;方法
檔案信息數據庫是在計算機存儲設備上合理存放的、可以共享的、具有共同存取方式和一定組織方式的、相互關聯的檔案信息數據的集合。“相互關聯”、“共同存取方式和一定組織方式”、“共享”是檔案信息數據庫本質的三個要素。數據庫中儲存的是一系列相互關聯的檔案信息數據,而不是雜亂無章的數據。這些數據包括檔案題名、責任者、分類號、主題詞、內容摘要等,還包括全文、圖像、聲音、影像等。這些相互關聯的數據是經過調查、試驗、統計、整理和歸納后得到的,并經合理分類和規范化處理之后,以記錄的形式存儲。
一、檔案信息數據庫建設的關鍵所在
實現檔案信息數據庫建設的關鍵,是要首先抓好檔案目錄數據庫建設。檔案目錄數據庫的建設是數據庫建設的第一個目標。信息化建設的切入點和工作重心,首先是抓好目錄數據庫的建設。目錄數據庫可以比較全面地反映檔案信息,有助于實現全方位的、動態的、完整的檔案信息服務。?在檔案目錄數據庫建立的基礎上,既要考慮建立檔案目錄中心,實現一定范圍內檔案內容互補和檔案信息資源整合,又要更大限度地發揮檔案效益。
二、檔案信息數據庫建設順序
首先是收集檔案信息。傳統檔案的數字化和電子文件是檔案信息的主要來源,檔案機構和管理部門也是數值數據和事實數據的重要來源。在建立相應的數據庫時,必須確定檔案信息的收集范圍和來源,按要求進行全面地收集。
對各種以傳統載體形式存在的檔案信息進行數字化處理后形成的數字副本,和直接通過計算機生成和處理的、并由檔案機構進行收信歸檔的電子文件,是檔案信息主要來源的兩個方面。
其次是對檔案信息的前期處理。這是一項基礎工作,為數據庫提供經過加工處理的數據。主要是將檔案的內容特征和形式特征著錄、標引出來。著錄標引必須達到規范化、標準化的要求。這是建立數據庫的必要過程,也是保證檢索質量的前提條件。
1.檔案信息數字化
數字化是指把一切信息都變成只用O和1這兩個數字組成的、用不連續的數位表示的二進制代碼。檔案信息數字化是指為了使紙質檔案、音像檔案等以傳統載體形式承載的檔案信息能夠通過計算機進行管理的提供利用,而利用高速掃描技術、數據壓縮技術等信息處理手段,將其進行轉換處理,形成數字信息,并以數字代碼方式存儲起來。這些數字信息可以通過計算機進行操作處理,通過網絡進行傳輸。紙質檔案、音像檔案等各種載體的檔案都可以以文本文件格式、圖像文件格式,音頻文件格式或視頻文件格式轉換成數字信息。
2.電子文件的收集歸檔
隨著計算機技術與辦公自動化技術的結合,誕生了一個新生兒電子文件。電子文件一經產生其信息就是以數字代碼形式表現的,所以在功能上電子文件等同于經過數字化處理的文件。由此,直接在計算機中生成和處理的電子文件是重要的檔案信息來源。
第三個步驟是檔案信息數據錄入,也就是將檔案信息前處理的結果轉化成機讀數據。錄入過程需要較嚴格的校對審核。如審查字段的數據形式是否正確;字段長度與確定的結構長度是否符合;各種標識符號是否有誤等。這其中可能包括對不同格式的數據進行轉換。
第四個步驟是數據庫的完善。
由于計算機硬件能力奇跡般地不斷更新,計算機技術爆炸般地迅猛發展,數據庫系統發生著劇烈的變化。雖然它的基本組成部分仍然是數據、軟件和硬件,但是它們的范圍、規模和復雜性都大大地擴展了。數據庫是信息資源存儲和開發利用的基礎,是信息資源共享的先決條件,是信息系統的核心。因此把數據庫建設作為當前檔案信息發布的核心工作,檔案數據庫建設越有成效,檔案信息管理與服務也就越有保證。
三、檔案信息數據庫建設對檔案管理工作的影響
檔案信息數據庫建設,意味著在信息社會中檔案管理工作開始涉及各類相關的技術問題,檔案工作開始大規模引進現代技術。從長遠看,檔案信息數據庫建設的發展就是檔案信息化建設的推進,其間涉及數字檔案信息的形成、收集、歸檔、整理、鑒定,存儲、保管、保護,檢索、傳遞、利用、統計、銷毀等全過程。檔案信息數據庫建設將對相應的檔案管理工作產生各種影響,使之在一定程度上發生某些變化。
在相關檔案業務環節的調整上,首先要做的是內部調整,即:簡化整理工作,使之簡明實用,檔案整理只要做到在充分尊重文件形成的自然形態的基礎上保持文件之間的內在聯系,不必強求外觀上的整齊劃一,而且整理工作的重點應放為檔案計算機檢索系統或管理系統做好數據準備上。
其次是檔案管理向數據庫環境下的檔案管理過渡的一種銜接,它符合電子文件的形成和發展規律,有助于計算機輔助檔案管理,有助于實現電子文件的歸檔。如果檔案管理中電子文件達到相當比例,技術應用發達到一定程度,電子文件的歸檔與整理將合二為一。
在數據庫環境下,檔案信息檢索這一工作環節日趨重要。它決定了數字檔案信息的著標引及存儲,因此要進一步深化檔案檢索工作,為利用者提供高效的信息服務。
除此之外,研究和實現數字檔案信息的保管保護工作,以及外部重組,即文檔一體化及其實現,也同樣重要。
“文檔一體化流程不只是文件管理與檔案管理的簡單對接,而是一種管理變革,是以現代信息技術為手段,對機關、企業、事業單位及各種組織中文件信息流的重新組織,是一個業務流程重組的過程。”文檔一體化就是把文件管理與檔案管理兩個管理管理銜接起來,整合到一個管理系統之中,對文件生命周期的全過程進行統一控制和管理。