文/陳霄
國家檔案局9號令提出,檔案館要適應信息化建設的需要,收集電子檔案和紙質檔案的數字化副本。檔案數字化工作越來越受重視,相應的數字化要求也會越來越高。我國檔案工作“十二五”規劃中特別就數字化工作作了明確要求。上海市檔案事業發展“十二五”規劃提出:“檔案數字化全文覆蓋率平均達到60%-70%”。浙江省檔案事業發展“十二五”規劃提出:“對機關單位未到移交進館年限的紙質檔案,全部進行數字化”。文化遺產資料數字化技術指南來自于國際檔案理事會網站。國際檔案理事會(簡稱ICA)是全球文件和檔案專業人員的代表,致力于文件的有效管理和世界檔案遺產的保護和利用。在其網站上發布了很多專業的檔案項目,其中一個項目為圖像視聽檔案工作組的,指南是其工作的一個重要成果。
指南從技術概述、成像工作流、不同記錄類型的數字化規則、文件格式比較、元數據、儲存推薦、質量管理等方面全面介紹了如何開展數字化工作。指南共分8個章節,它們是:
第一章:引言
第二章:技術概述
第三章:成像工作流
第四章:各類文稿的數字化規范
第五章:文件格式比較
第六章:元數據
第七章:推薦存儲
第八章:質量管理
其目的是開發這套用于鼓勵各個聯邦機構(以及其它有意向的機構)協作的數碼圖像指南,為公眾提供格式統一的圖像,為數字化服務供應商和制造商提供常見的實踐方式和技術基準。提供一套符合當前實際的數字化方法。提供一套適用于各種輸出和各種用途的一致的成像和元數據收集方法。定義用于描述評價數碼成果及用于評測符合規定要求的驗證方法的通用的質量或品質指標。
指南指令性條文性的內容很少,信息翔實案例豐富,側重于實用性。
本文涉及的主題包含以下內容:
靜態圖像的數字圖像采集——主文件創建、圖像參數、數字化環境、色彩管理等。
色彩編碼準確度——色彩空間、圖像處理圖像閱覽的色溫、線性及區域矩陣質量、不同插值算法的質量。
數字圖像品質——評估數字圖像特性的可操作指標和標準的發展,該指標和標準用于數字圖像的檢測或質量控制,包括多種位圖類型的分辨率、噪聲、色彩編碼、失真的指標和標準。
圖像處理工作流范例——包含圖像處理、銳化等方面的指南。
元數據最低要求——討論為了主文件能夠可讀、可查、可用所需收集和建立的最小元數據集。
文件格式——主文件的推薦格式和編碼等。
文件命名的方法。
基本存儲建議。
質量管理——圖像、元數據、圖像檢查、接受和拒絕、計量(保證檢測和質檢設備讀數精確精準)這些方面的質量保證和質量控制。
(一)指標量化。指南對數字化過程中各類指標及術語都做了詳盡的說明。在技術概述章節中詳細描述了數字化過程涉及的各種專業術語,比如柵格圖像特性方面的空間分辨率、其測量方式為每英寸的像素即PPI或每英寸點數即DPI,信號分辨率,其表示為位深度,比如8比特位(8-bits),色彩模式、常見的色彩模式包含RGB(紅red、綠 green、藍 blue),CMYK( 青Cyan、品 紅 Magenta、黃 Yellow、黑Black[ K:blacK = 黑色,為了避免與RGB的Blue藍色混淆而改稱K])和LAB(明度lightness、紅/品紅和綠色red-green、黃和藍 yellow-blue)。

?

?
在數字化環境方面的參數、其中提到數字化中對顯示器有較高要求。
掃描儀和數碼相機性能的量化章節提供了套用于評估數碼成像的通用質量指標,也是該指南的一個關鍵章節,共六個表,一個主表(第一部分——數碼成像性能分類),五個附表(第二部分——數碼成像的評估和質量控制)。這些表和評估標準用于指導具體數字化工作。以下是主表(表1)和其中一個附表(表2)的范例。在每個表中任何指標該指南都有詳細的技術說明。
(二)范例豐富。各類文稿的數字化規范章節中,對手稿、書籍、圖文稿、插畫、地圖、平面圖、照片、航拍照片、實物及文物等類型原稿都有詳細的操作實例,并給出了具體的處理建議和技術參數,說明詳盡,圖文并茂,使讀者能很快了解不同原稿處理時的注意點,處理的關鍵,掌握操作步驟。指南還提供了這些文稿數字化處理工作流實例。
以指南中文稿印章掃描為例,圖1中顯示的左側為普通平板掃描的成果,文稿中的印章幾乎無法識別。指南在印章處理章節中詳細說明如何進行實際操作,右側是按照指南中印章處理的方法,在掃描過程中采用單側光源,印章內容清晰可見。
本人在平時的工作過程中,會有檔案員咨詢如何將本市數字化規則應用到工作中,說明本市數字化規則在設定時,還是側重于條文,而在范例應用上比較欠缺。以后在制定數字化規則時,可以參考指南,引入操作范例。
(三)元數據在數字化過程中的應用。指南的一大特點就是,在數字化過程中引入元數據的管理。在元數據章節中,指南建議選擇合適的元數據,在數字化過程和數字化成果保存利用過程中都需要應用元數據。元數據選取過程中首先要考慮以下內容,元數據是否已在其它系統中存在,比如數據庫、書目記錄、檢索工具、或者類似都柏林核心數據庫或本地數據的數據格式中,元數據由誰來獲取,如何獲取,何時收集,何處存儲,如何存儲,是否與其他系統交互,元數據記錄明細度等。
在質量管理章節中,指南建議數字化圖像100%驗證,即全面質檢,并要求圖像的元數據完整。
在我國,元數據在檔案信息化過程的應用也是一個熱點話題,浙江省也是元數據應用的國家試點地區。而在日常工作中,數字化加工很少涉及元數據。如何將元數據應用在數字化工作中,以確保數字化成果完整性、有效性,使數字化成果能夠長久保持,方便利用。筆者認為在這方面可以參照指南,是值得研究的。
指南在文獻遺產數字化方面提出的操作標準及理念處于世界領先水平,又是國際檔案理事會推薦的數字化標準,因而指南對本地數字化工作有啟示意義。當然,指南中的標準及參數是建立在美國聯邦機構數字化實踐的基礎上,與我們的實際工作會有不同的地方,因而在如何學習,如何提高本地數字化工作上,需要做很多努力。