文/哈爾濱工程大學檔案館 車艷紅
高校實現檔案館藏數字化的途徑主要有三個方面:包括了學校獨立完成建檔、檔案館之間相互合作、館藏檔案數字化工作外包。文章探討高校對檔案數字化建設的管理,研究以外包的方法來建設檔案數字化。
高校紙質檔案實現數字化的途徑主要有三方面:
(一)學校獨立完成建檔。高校應獨立完成檔案數字化建設,根據高校的實際情況,比如高校的經濟情況,人力情況等,制定合理的開展目標,完成高校檔案的數字化轉換工作。
(二)檔案館之間相互合作。相互合作可以在人才和技術方面解決問題,很多時候館藏檔案數字化的開展,不能夠保證質量,主要因素是人才上的缺少,經過各個館藏之間的相互合作,可以有效解決技術人才問題,實現館藏檔案數字化工作。
(三)館藏檔案數字化工作外包。外包工作能夠很好地保證數字化質量問題,而且完成效率會更高。
隨著現代科學技術的不斷發展,高校館藏檔案實施數字化技術上的問題得到了逐步完善,實現數字化策略方面,主要存在的問題是數字化成本承受能力問題。出現的成本問題主要包括三個方面的成本,也就是在人力投入上出現的成本問題、時間投入上出現的成本問題和在資金投入上出現的成本問題。因此高校館藏檔案數據化建設時,要根據各自單位在時間、人力和財力上的具體情況,對高校館藏檔案開展數字化建設。本文關于實現館藏檔案數字化建設,主要是從外包數字化建設方面寫作,以此來實現高校館藏檔案數字化。
(一)高校館藏數字化建設內容。建設高校館藏檔案數字化,其主要建設內容有三個方面:1.檔案專題建庫,并且在建立的數據庫要提供使用,而且在建庫前要對檔案專題信息化采集。2.建立檔案目錄信息化和數字化,而且要對該目錄下的內容建立數據庫。3.實施載體檔案的數字化,這些方面的工作,主要是將一些紙質檔案數字化,比如照片檔案、紙質檔案以及一些音頻檔案,要實現這些檔案的數字化,檔案在數據庫建設方面,要對影像檔案建立數據庫,同時還要建立多媒體數據庫。
(二)高校館藏檔案數字化數據庫建設。高校館藏檔案數字化數據庫建設主要包括四個方面的內容:1.目錄數據庫建設。高校要建立館藏檔案的數字化,首先要建立的是館藏檔案目錄數字化,檔案目錄建立過程中,可以根據學校各個檔案的基本情況,通過著錄標引,建立以原始檔案保存狀態為編目錄單位的各種檔案基本目錄數據庫,這個方面的工作,主要是對以前保存的手工檔案目錄計算機化,這個目錄的計算機化主要包括卷目錄計算機化和卷內目錄計算機化。2.專題檔案內容數據庫建設。對專題檔案內容數據庫建設方面,要根據學習實際情況,也就是檔案信息化程度的實際情況和數字檔案館建設的實際情況,對現有的檔案數據庫進行深度挖掘,這種挖掘特指某一專題檔案內容,對專題目錄建立一種從目錄到整個內容的數據庫。比如在高校中的中醫院、師范學校,這些高校本身就有著很強的特色,他們有很多檔案信息資源,對這些高校檔案做深度挖掘工作,并且建立數字化檔案,再將數字化的檔案上傳到專題數據庫中,能夠實現這些資源的有效利用。3.聲像檔案數據庫的建設。聲音檔案和圖像檔案能夠更加直觀地展示高校歷史沿革,對高校聲音和圖像檔案數據庫建立,可以實行各類高校的聲音和圖像檔案以統一標準收錄到數據庫中,統一管理可以實現資源的有效使用,還可以提高管理效率。4.館藏檔案全文數據庫建設。全文檔案數據庫的建立,可以把高校的一些珍貴檔案館藏實現全文管理,這些珍貴的館藏檔案包括了人事檔案實物和原件、聲像檔案實物和原件、黨政檔案實物和原件,對這些檔案進行數字化的處理工作以后,要編訂好相應的關鍵詞索引、責任者索引和題名索引,把這些內容上傳到管理系統中,可以實現檔案的全文管理。
(三)館藏檔案數字化的實現方法。在流程上主要可以進行七個方面的工作:1.對檔案的鑒定和整理流程。鑒定和整理工作要根據館藏檔案開展的實際情況進行,要根據檔案的內容作篩選工作,確定需要實現數字化的范圍,一定要分清輕重緩急、分階段有序開展。開展中可以進行五個方面的工作內容:第一個是館藏中有很多的珍貴檔案,要對這些檔案做數字化處理。第二個對于檔案中,有的檔案是有著永久管理權限,也有著永久使用權限,對這些檔案做優先數字化處理。第三個是學校檔案中有的檔案能夠體現學校的特色文化價值,要對這方面的檔案做數字化處理。第四個是學校檔案中有的能夠代表高校特色,要對這些檔案做數字化處理。第五個是高校檔案有的利用價值高,而且利用率大,這些檔案要做好數字化處理。使用編制確定館藏目錄,對需要館藏的資料做數字化鑒定,使用文件目錄來確定哪些檔案需要優先數字化。可利用編纂好的檔案資料來取代檔案原件作為數字化內容,使用這種方法來鑒定檔案數字化,可以在工作效率上提高,還可以在質量上提高。高校館藏檔案工作的開展,要根據上文中提出的幾種方法,有機結合高校的實際情況,靈活使用這些方法,才可以在館藏檔案工作方面確保質量。2.檔案交接。做檔案交接工作方面要明確分工開展,當天借出的檔案內容,使用的原則應該是當天要歸還。如果高校檔案數字化工程是外部其它公司進行,就需要注意檔案在交接時的安全問題,交接過程中雙方都需要指派相應的負責人做好交接清點工作,同時做好簽字確認。3.檔案拆卷、掃描。檔案在做拆卷工作上,其原則是不能夠破壞原有裝訂基準,數字化處理過程中對資料的掃描工作要符合相應標準,這個標準一般是《中華人民共和國行業標準紙質檔案數字化技術規范》。開始的數字化處理工作要確保檔案在拆卷、掃描圖像這些方面和原有檔案保持一致,還要保持其整潔性。4.圖像處理工作。掃描的檔案資料上,有很多是圖片資料,掃描以后的檔案圖像,還需要做進一步的圖像處理。有著同一編號的檔案和這些檔案的附件,要進行合并處理,使檔案在合并以后形成一個檔案,不能夠出現亂序現象,更不能夠出現混檔情況,文件要以檔案的編號進行命名工作,一般的次序是目錄號、案卷號、檔號,按照這些來進行儲存工作,其目的是方便在掛靠工作時能夠更好地融入系統。普通的文本掃描工作中是按照300DPI分頁進行黑白二值掃描,使掃描以后形成一種整體PDF文檔;老舊文檔有著泛黃情況掃描過程中使用的技術是300DPIPGB真彩掃描,完成掃描以后形成一個整體PDF文檔;掃描的檔案資料中有著一些是打印資料文檔,工作時要對其制作成為雙層的PDF文檔;使用掃描技術以后,文檔中沒有明顯的墨跡出現;圖像要求能夠做到縮放的百分之一百,照片進行掃描技術方面,要求使用的像素是在600DPI以上,同時在掃描完成以后的圖片還要做加工處理工作,一般是修邊處理、去污處理,使圖片沒有暗影,也沒有其它信息干擾。掃描完成以后的電子圖片。傾斜度要保證在1度之內,不可以出現缺損現象和折疊現象,要確定圖片的完整性。5.數據檢查。數字化處理工作完成以后,還要做質量檢查,這個檢查主要使用抽查的方法進行,要求抽查的數量要達到8%,抽查數據合格率要在95%以上。數字化檔案檢查工作主要包括三個方面的內容:第一個質量抽查。抽查中如果發現有不合格的數據,要及時更改,一般采用重新返工掃描方法。第二個是數據監測。在數據檢測工作方面,主要有三個方面的工作內容,也就是數據準確率核對工作、數據運行情況檢測工作和數據庫病毒檢測工作。第三個是數據利用監測。這個工作開展時,是在檔案資料數字化處理完成以后,在掛靠到系統運行時,對外使用過程中,是否有不合理的情況或者是出現錯誤的情況,對這些方面檢測。6.數據整理。這個數據的整理工作主要是指在數據化處理完成以后,數據經過檢查合格,對這些數據做備份整理工作和檔案需要掛接在運行系統中提供利用作整理工作。數據在備份工作方面,主要是指可移動式備份,采用的主要方法是硬盤備份、光盤備份等。備份方面,為了保證其安全性,一般采用備份在兩種方法以上。一般的備份方法,最為常用的方法是硬盤備份,數據生成以后,都是儲存在計算機的硬盤上,使用直接備份的方法,可以生成兩份數據,保存在兩個硬盤上,并且做好標記,就可以實現備份要求,這種方法簡單適用而且方便。光盤備份采用的是DVD刻錄技術,選擇光盤備份,一般情況下光盤的容量在4.5G左右,這種情況下,高校的檔案資料完成數字化以后,其容量都會大于一張光盤的容量。因此使用光盤技術備份,要對大的數據庫做化整為零處理,使數據均勻分配在各個光盤中。掃描完成以后的檔案數據,檢查確定沒有錯誤的情況下,把這些數據掛靠在系統中進行運行。7.裝訂還原。檔案掃描完成以后要做還原處理,在還原處理中的檢查工作是保證還原質量的關鍵舉措,這個是檔案數字化以后的后續工作,在專業上叫做數字化后處理。還原處理要做好四個方面的工作:一是對照目錄清點檔案,看是否有未歸還檔案。二是檔案是否有損壞情況。三是還原裝訂是否按照國家的標準進行。四是是否完成合同要求。檔案檢測工作,一般要求是全數檢查法,要確保沒有遺漏。
綜上所述,館藏檔案數字化外包過程中主要包括七個方面的內容,這些是對檔案的鑒定和整理流程、檔案交接、檔案拆卷掃描、圖像處理工作、數據整理、數據檢查、裝訂還原。完成好這七個方面的內容,可以實現館藏檔案的數字化處理,實現檔案的數字和信息化,適應現在社會的發展。