韓向斌,何祖華
(南京中醫藥大學 檔案館,南京 210023)
檔案數字化建設的思考和建議
韓向斌,何祖華
(南京中醫藥大學 檔案館,南京 210023)
本文針對檔案數字化的前期準備、過程實施和后期數字化數據及存儲設備的檢驗3個環節,根據工作經驗對出現的問題進行了整理,并提出了具體的操作方案,從法律規范約束、環境安全控制、數字化內容質量把關3個方面來規避風險,保證檔案的安全和數字化工作的順利進行。
數字化;安全;檔案;數字檔案
隨著信息時代的發展,信息查詢速度和數量不斷提高,檔案信息工作不斷深入和推進,為使館藏檔案得到更好的利用,檔案部門迎來了館藏檔案數字化的浪潮。傳統的紙質檔案在檢索和查閱上都較為復雜,保存效果也較差,不利于檔案的開發利用,數字檔案存儲空間小、利用便捷,所以將紙質檔案數字化成為檔案工作的主流趨勢,為了節約人力、物力資源,控制成本,數字化外包走上舞臺。南京中醫藥大學檔案館也加入了數字化的大軍,根據幾年來的數字化工作經驗,對工作中存在的問題做了總結和思考。
1.1進行市場調研,做好標書
通常招投標部門會根據標書要求結合競標價格來確定中標方,所以要得到滿意的競標商,首先要做好前期的調研和考察。對已經完成數字化和正在進行數字化的單位走訪,了解數字化服務公司的情況和數字化部門對該工作的意見,實地體會數字化現場工作并了解數字化流程和注意事項。征詢專家和相關行政機構的意見,結合企業背景和檔案數字化外包規定,邀請符合條件的公司到單位競標,擇優選擇。
1.2鑒定、統計要數字化的檔案,簽訂相關協議
1.3做好場地的安全設施布置
首先,工作室需要進行全方位24小時監控,要安裝前后攝像頭,保證360度無死角。其次,做好電子產品檢測,合同中規定禁止攜帶電子產品,但是檔案部門不可能對外包人員搜身,有效的辦法是采取電子探測,但自動電子探測門的代價較高,掃描工作本身又短期性的;人工探測費用可以接受,但是掃描人員較多,且出入頻繁,長期守門也不現實,所以這個問題仍然不能得到很好的解決。最后,做好場地信號屏蔽,場地是無網絡的區域但是卻因為條件限制,可以接收手機信號和網絡信號,所以應安裝信號屏蔽器。此外,U盤變得越來越小,越來越隱秘,裝飾品成了U盤的外衣,主機USB口也較隱秘,U盤插上去人眼幾乎都無法察覺,更不用說安裝在高處的攝像頭,因此還要拆去主機上的所有可能外設安插接口。
1.4與外包方提前協商,盡可能保證人員穩定性
掃描工作較為枯燥,且含金量較低,工資偏低,工作人員多為年輕、低學歷人群,這就造成外包公司中掃描人員整體素質偏低且流動性大。而人員變動由外包公司管轄,檔案部門無權干涉,這會造成后期檔案檢查中出現問題時權責不清,如檔案單頁丟失,掃描數據交接不清等問題,給檔案的安全性帶來極大的隱患。
1.5制訂數字化加工方案
按照《中華人民共和國行業標準(DA/T 31—2005)紙質檔案數字化技術規范》的要求制訂加工方案,包括:前期準備標準(借還檔案,掃描文件命名、電子目錄與紙質目錄校對,紙質目錄與紙質原件校對),掃描中標準(確定文書、圖紙、照片等不同文件的格式、分辨率、大小、色彩度等參數;掃描操作規定,要保證紙張,頁碼順序、案卷順序、檔案盒都保持拆卷前的狀態,規定問題另行備注不可在原件上進行,不能因加工或拆卷而造成對紙質文件的損壞)、質量檢驗標準(確定檢查標準,文件歪斜、紙張大小與原件不符、頁碼順序不對、漏頁或重復、PDF文件未雙層處理、文件不清晰、光盤刻錄數據損壞、數據不全等重新處理)。
2.1借閱歸還檔案
第一次進北大校園,我也好似劉姥姥進了大觀園,感覺一切都是新鮮迷人的。北大之大,景色之奇,建筑之美,都超乎我的想象。
檔案應遵循當天借出、當天歸還的原則。雙方工作人員均要在“數字化檔案借閱記錄”上登記、簽名,寫清案卷數量和卷號、借出和歸還時間、雙方負責人簽字。在檔案出庫入庫時都需清點清楚,出庫后數字化服務人員檢查有無缺損,入庫時檔案部門負責人檢查原件是否復原,數目、排序是否正確,有無缺頁損壞等問題。檔案應及時還回到庫房,以免信息外漏或者丟失。通常,實際工作中,紙質檔案較重且較多,搬運過程只能記錄檔號和卷數,內部雖有目錄但裝訂完了后很難做到一頁一頁的檢查,被遺漏或者訂錯一頁或幾頁,如果紙質的檔案常年未被利用,根本無法察覺,多年后再發現也無從確定是怎么弄錯的;以件為單位的檔案,由于統計數量更加龐大,一份一份地查看更加不現實;檔案因年代過久,紙質易因老化出現損壞;工作人員有時也因翻頁時動作幅度較大造成原件受損;案卷過厚,數字化服務人員裝訂不仔細,個別紙張會錯位,造成打孔時打在內容上,破壞了原件等。因此,紙質檔案交接過程中需要工作人員耐心、細致,制定技術標準和流程規范,保持操作的統一,保證紙質、數字化檔案的安全。而目前好多檔案館庫房、辦公區較小,有的僅一墻之隔,掃描直接在庫房中進行,雖然方便操作,節省了空間和時間,但給檔案的安全帶來了極大的隱患,所以這種情況要杜絕。
2.2檔案掃描過程
第一,拆卷。檔案不論是件、卷、盒,都應遵從復原后保持檔案裝訂原貌的原則,所以在拆卷時要按照順序,一本本有序進行,力度適中,以不損壞檔案為原則。第二,掃描。掃描的文件、圖片、圖紙都應達到制定的數字化標準的要求,保持內容、大小、色彩均與原件一致,應按照文件編號處理、合成一份文件,按照規定的命名方式命名,等待掛接。通常,普通文件按300dpi黑白掃描,老舊泛黃檔案和彩頁按300dpi彩色掃描,并保存為PDF和JPEG兩種格式;照片掃描像素為600dpi以上,保存為JPEG格式;圖紙掃描像素根據圖紙大小調整,以內容絕對清晰為標準,保存為TIF和PDF兩種格式。老舊泛黃檔案如果破損嚴重或無法直接掃描,還需要先進行修復處理。掃描的圖片通常要進行糾偏、去污、拼接、裁剪等技術處理。第三,裝訂。掃描完成后,應將檔案按照檔案的裝訂原貌進行重新裝訂,且應注意保持檔案的頁碼、件號、卷號順序不變,內容準確、無遺漏。
3.1數字化數據檢查
掃描工作量大,重復性強,檔案具有相似性,掃描時容易造成漏頁,錯頁的現象,因此,數字化后的檔案數據要進行質量檢查。因為數字化數據量巨大,采用抽檢的方式進行檢查。通常,數據驗收時抽檢的比率不得低于5%,合格率達到95%以上(含95%),認為合格(合格率=抽檢合格文件數/抽檢文件總數×100%)。但實際工作中發現,檔案需要絕對的完整、清晰和真實,抽檢對檔案工作來說存在有很大的問題。首先,掃描工作具有主觀性,和掃描個人認真程度密切相關,所以常常發現掃描問題是扎堆出現的。其次,案卷需要裝訂,就容易出現頁碼遺漏、標注錯誤的現象,數字化過程也是二次糾正的一個好時機,而抽檢很難發現。最后,如招投標、科研文件部分檔案不需要數字化,數據自然會出現斷碼的情況,抽檢很難排除缺頁原因是斷碼還是漏掃。況且由于數量巨大,一旦掛接入系統,后期利用中很難發現問題,一旦出現問題后,糾正也很麻煩。為了解決遺漏問題,可能檔案還要重新掃描、處理,然后再覆蓋系統數據、光盤數據、移動硬盤的錯誤數據,還會給利用者帶來不便。所以本館采用一頁一頁檢查的方式,雖然耗時耗力,但一勞永逸。審核完畢后,一定要盡快針對問題進行修改,再次檢查無誤后,必須負責人或相關領導確認、簽字后方有效。
3.2存儲、備份數據檢查
電子數據需要載體存儲、備份,通常保存載體為光盤、移動硬盤、服務器等。為保證數據安全,通常采用在線、離線備份和多套備份方式。所以檢查過程要針對不同的備份載體進行。通常針對設備是否正常(光盤、移動硬盤是否可讀)、數據是否可正常讀取、數據數量是否正確,數據內容是否完整等標準檢查。檢查完成后離線備份數據需要進行目錄著錄、粘貼標貼、存放入庫等操作,以便今后的管理和利用。
3.3原文掛接
數字化數據檢查無誤后,可以將其掛接到系統中對應的目錄下,開始進行利用。因數字化文件數量巨大,通常采用批量掛接的方式,需要文件名稱與數據庫中目錄一一對應,這是就體現了文件命名規則的重要性。掛接過程會出現電子目錄找不到,或者目錄多條的現象,就需要即使修改電子目錄,重新掛接該條數據。掛接完成后,需要針對掛接的數據進行檢查,通常問題有數據顯示不正常、文件打不開、掛接漏頁、掛錯位置、文件格式錯誤,無法下載等問題,因文件內容本身就大,數據量又多,工作量也更加龐大,通常只能采取抽檢的方式進行,抽檢的比率不得低于5%,合格率達到95%以上(含95%),認為合格。掛接原文的錯誤通常都是一眼就可發現的,且不涉及文件內容,所以抽檢是可以保證檔案的真實有效性,后期利用發現問題后,只需要找出備份文件重新掛接即可,工作量也較小。
館藏檔案的數字化降低了檔案的保存成本,提高了檢索利用的便捷性,同時也有效推動了檔案電子信息化進程,對檔案事業的發展起到了積極的推動作用。但因檔案數量巨大而催生的數字化外包,給檔案安全也帶了新的風險。檔案部門除了在數字化外包期間做好上述的工作,還應增強工作人員的安全意識,對全館人員進行數字化安全風險教育,讓檔案工作者做好數字化期間的監督工作,確保數字化工作期間,檔案信息和原件得到最大程度的安全保障。
主要參考文獻
[1]李建朋.檔案數字化面臨的風險及其防控[J].四川檔案,2011(2).
[2]孫寧寧.檔案數字化管理體系建設問題研究[J].黑龍江史志,2014(3).
[3]陳明,李莉.對實施檔案數字化工作的幾點思考[J].蘭臺內外,2014(1).
[4]種金成,何祖華.高校館藏檔案數字化實施方案及安全策略研究[J].黑龍江檔案,2014(1).
[5]王靜.對檔案信息安全體系建設的幾點思考[J]. 東方企業文化,2014(3).
[6]王翠紅.實施檔案數字化管理的幾點思考[J]. 檔案管理, 2013(5).
[7]孟慶華.利用信息化建設創新檔案工作[J]. 黑龍江史志,2013(15).
[8]安艷芳.淺談網絡環境下檔案信息化管理與服務機制的創新[J].山西檔案, 2012(z1).
[9]所桂萍,王輝凱,李寶玲. 現代檔案安全保護及應對策略研究——基于河南省檔案安全調研的視角[J]. 鄭州大學學報:哲學社會科學版, 2011(5).
10.3969/j.issn.1673 - 0194.2016.16.127
G270.7
A
1673-0194(2016)16-0195-02
2016-07-02
2013年南京中醫藥大學校哲學社會科學基金項目(13XSK09)。