北京市檔案局信息化處
2010年12月29日,市質監局發布北京市地方標準公告2010年標字第16號,由北京市檔案局起草的《檔案數字化規范》(以下簡稱《規范》)系列標準第一至四部分正式成為北京市地方標準,并于2011年4月1日起實施。
《規范》系列標準是在深刻總結北京市檔案數字化工作經驗并廣泛吸取國家和兄弟省市有關檔案數字化先進研究成果的基礎上,針對北京市檔案數字化的實際發展情況而制定的。這是我市第一批檔案信息化地方標準,該系列標準的出臺將進一步規范和促進北京市檔案數字化工作,對推進檔案信息資源開發利用,保證檔案實體和信息安全具有重要意義。本文就實際工作中如何理解和執行該系列標準進行解讀。
一、制定《規范》系列標準的背景
近年來,北京市的檔案數字化建設發展很快,市和區縣檔案館以及絕大部分市屬單位都已開始大規模地開展館(室)藏檔案數字化工作。檔案數字化是一項長期的系統工程,需要選擇加工方式,需要確定工作流程和工作環節,需要制定各種技術指標,是一項技術性較強的工作,必須用統一的標準作為指導和依據。在《規范》第一至四部分出臺之前,北京市開展檔案數字化工作時可依據的僅有《紙質檔案數字化技術規范》(DA/T 31—2005)和《縮微膠片數字化技術規范》(DA/T 43—2009)兩個檔案行業標準,但這兩個行業標準沒有覆蓋更多載體類型檔案,也沒有對檔案數字化成果的存儲和利用提出詳細規定,已然不能完全滿足北京市大力開展檔案數字化工作的需要。為了更好地適應和促進北京市檔案數字化建設事業的快速發展,由此,《規范》系列標準便應運而生。
二、《規范》系列標準的總體框架
(一)《規范》系列標準的架構
本次發布的《規范》第一至四部分只是《規范》系列標準的前四部分,規劃中的《規范》系列標準共分為八個部分,內容覆蓋檔案數字化的各個方面:從橫向上來說,《規范》系列標準包括紙質、縮微膠片、照片、錄音和錄像五種載體檔案的數字化加工標準;從縱向上來說,《規范》系列標準則涵蓋了數字化加工、數字化成果的存儲和利用等檔案數字化工作的各個環節,從而形成了一個相對完整的檔案數字化標準體系。
除了已發布的前四部分,規劃中的《規范》系列標準的第五至八部分將在今后陸續推出。規劃中的《規范》系列標準的整體架構見圖1。

圖1:規劃中的《規范》系列標準的架構圖
(二)《規范》系列標準的主要內容及不同部分之間的關系
《規范》系列標準的第一部分主要規定了檔案數字化工作的基本要求和基本流程,是《規范》系列標準的“總綱”,其它部分都是建立在第一部分的基礎上的,它適用于各種載體檔案數字化的全過程。第二至六部分分別規定不同載體檔案數字化加工過程的工作環節和相應的技術要求,其中每一部分適用于某種載體類型檔案的數字化加工環節。第七部分主要規定檔案數字化成果的存儲策略、方式和要求等。第八部分則主要規定檔案數字化成果利用的相關技術要求和管理要求等。
其中,第一部分、第七部分和第八部分就像是大學中的 “公共課”,不論哪個專業的學生都要學習,而第二至六部分就像是“專業課”,不同專業的學生選擇相應的“專業課”進行學習即可。在開展檔案(不論是何種載體)數字化工作時,在遵守第一、七、八部分(相當于“公共課”)的基礎上,再根據檔案數字化的具體載體類型在第二至六部分中選擇相應載體類型的那一部分(相當于“專業課”),共同作為開展該載體類型檔案數字化工作時所要依據的標準。
三、《規范》與檔案行業標準之間的關系
要深入地理解和執行《規范》,就要弄清《規范》與《紙質檔案數字化技術規范》和《縮微膠片數字化技術規范》這兩個檔案行業標準之間的關系。
(一)《規范》遵從于兩個檔案行業標準
《規范》系列標準是在充分遵從兩個檔案行業標準的基礎上制定的,在檔案數字化的總體原則、工作環節劃分、工作流程設計等主要問題上都與兩個檔案行業標準基本保持一致,而不與之相抵觸。
(二)《規范》涉及的內容更全面
兩個檔案行業標準僅涉及了紙質和縮微膠片兩種載體檔案,而《規范》系列標準則包含紙質、縮微膠片、照片、錄音和錄像五種傳統載體檔案,涉及的內容更加全面。
(三)《規范》的某些規定更詳細
在兩個檔案行業標準中,檔案數字化成果的存儲和利用這兩方面的內容都是作為標準的條款而提出來的,沒有更詳細的規定。《規范》則將檔案數字化成果的存儲和利用分別以系列標準的一個部分的形式單獨制定標準,其規定更加詳細、具體。此外,《規范》還進一步細化了檔案數字化加工過程中一些具體環節的操作要求。如《規范》第二部分的5.1條和5.2條分別對“確定掃描頁面范圍”和“編頁”提出了具體的要求,更利于檔案數字化操作人員在工作中準確把握和利用標準。
四、如何使用《規范》
《規范》作為系列標準,其第一至四部分已經出臺,那么應該如何使用呢?
首先,應該有針對性,即在檔案數字化工作中充當不同角色的人員應該有針對性地使用。對于檔案數字化建設單位的領導來說,只需要對檔案數字化有一個整體的認識和了解,這樣他們一般只需要參閱《規范》的第一部分《總則》即可。而對于檔案數字化的管理人員和操作人員來說,則更需要明確檔案數字化加工流程中的每一個工作環節和詳細的技術要求等具體細節,因此他們應該更著重研究使用《規范》的第二、三、四部分。
其次,檔案數字化建設單位不僅在自主生產時要把《規范》作為開展檔案數字化工作的依據,而且當采用外包生產方式時,也要在與外包商簽署的協議中明確“嚴格執行《規范》系列標準”這一事項,并在項目完成后按照《規范》規定的有關指標進行驗收。
五、《規范》使用過程中的幾個關鍵點
目前已出臺的《規范》系列標準的第一至四部分中,除了第一部分《總則》外,其它三部分分別是關于紙質、縮微膠片和照片檔案數字化加工的標準。在這三種載體檔案數字化加工過程中,有幾個特別需要注意的地方,如選擇掃描色彩模式、選擇分辨率、選擇檔案數字化文件的存儲格式等。這里就以開展紙質檔案數字化加工為例,對《規范》在使用中的幾個關鍵點作一些簡要說明。
(一)選擇掃描色彩模式
《規范》第二部分7.3條明確了紙質檔案數字化加工常用的三種掃描色彩模式,具體包括黑白二值、灰度和彩色模式,但除了藍圖等特殊檔案外,一般不推薦采用灰度模式。對于大多數只有文字的紙質檔案來說,一般采用黑白二值圖像模式掃描即可;當采用黑白二值圖像模式不能充分反映檔案內容信息時就直接用彩色模式進行掃描。這里之所以推薦選擇彩色圖像模式而不選擇灰度模式,主要是因為在圖像文件大小基本相同的情況下,彩色圖像的層次更加豐富,清晰度更高,可以更真實地顯示檔案原貌。當然,如果需要數字化的紙質檔案數量不是很多,在資金條件允許的情況下,完全可以全部采用彩色圖像模式進行掃描,以實現更好的效果。
(二)選擇掃描分辨率
《規范》第二部分7.4條規定了紙質檔案數字化加工時黑白二值圖像模式掃描和彩色圖像模式掃描的分辨率均應“不小于200dpi”。
這里提到的分辨率是紙質檔案數字化加工中的一個重要指標參數,它直接決定紙質檔案數字化成果的質量。檔案數字化建設單位在開展紙質檔案數字化之前就應該確定掃描分辨率這一指標參數,分辨率的選定原則是在能夠滿足當前和未來一段時期內主要需求的前提下,再根據檔案類型、檔案數量、掃描色彩模式和存儲設備空間等情況綜合酌定。需要注意的是,《規范》規定的所有指標參數都是最低值,而非最佳值,各單位在實際工作中一般可以選擇等同于或略高于《規范》規定的最低值即可。目前北京市相當多的單位都采用分辨率為300dpi的彩色掃描模式來開展紙質檔案數字化加工。
(三)選擇圖像文件存儲格式
存儲格式關乎檔案數字化文件是否能夠長久保存和安全保管,同時它也是決定檔案數字化成果存儲空間的重要因素,檔案數字化建設單位要慎重選擇。《規范》第二部分7.5條規定了紙質檔案掃描后的圖像文件可以存儲為TIFF、JPEG和PDF這三種常見且通用性較好的格式。一般的,黑白二值圖像宜保存為TIFF(G4)格式,灰度或彩色圖像宜保存為JPEG格式,而以單份文件為單位存儲的可保存為PDF格式。各單位應根據本單位的實際情況選擇相應的存儲格式,并保持存儲格式的相對穩定,一般不要隨意更改或轉換存儲格式,以避免可能引起的數據混亂、損壞甚至丟失。
(四)驗收合格率
驗收作為檔案數字化加工質量控制的最后一個環節,其重要性不言而喻。為了把好檔案數字化加工質量控制這最后一道關卡,結合實際調研情況,《規范》規定了驗收合格率應達到99.7%以上(含99.7%),這大大高于檔案行業標準95%的驗收合格率。驗收合格率提高就意味著成本的增加,那么為何《規范》要大幅提高驗收合格率這一指標呢?這是因為檔案作為歷史的真實記錄,對社會和個人都擔負著極其重要的憑證作用,在筆者看來,與檔案的嚴肅性和重要性相比,適當增加一些成本來提高檔案數字化的質量是值得的。其實,嚴格地說檔案數字化本來是不容許出現任何錯誤的,驗收合格率無論設置得多高都不過分,但考慮到現實中在大規模的檔案數字化加工過程中由于紛雜的工作環節和人員操作的不穩定性等原因,偶爾出現一些問題又是無法避免的,因此,《規范》提高了驗收合格率至99.7%,也就是只有3‰的“容錯率”。需要說明的是,在紙質檔案數字化加工中通常容易出現的錯誤主要包括以下三類:一是機讀目錄著錄錯誤;二是圖像質量問題,包括圖像模糊,亮度、對比度、飽和度等參數設置不合理、圖像歪斜等;三是機讀目錄與圖像文件掛接錯誤。其中,《規范》規定3‰的“容錯率”主要就是針對第二類錯誤,同時也是唯一可以容忍的一類錯誤;而對第一、三這兩類錯誤則應該采取“零容忍”的態度,一旦發現這兩類錯誤就應直接退回改正或重做。
《規范》涉及的內容還有很多,由于篇幅限制不能逐一討論。但在使用《規范》來開展檔案數字化的過程中,如果把握好了以上幾個關鍵點,其它的就都相對容易地參照《規范》系列標準來執行。(執筆人:楊中營)