李進
國內數轉模相關技術標準比較分析
李進
(國家圖書館,北京100081)
對國內縮微攝影技術、文件管理應用、檔案行業等領域中關于數轉模技術的相關標準進行分析對比,觀察各標準在測試畫面研究、設計和制作中所采用的視角、思路和方法,總結其在測試畫面、解像力、字符識別、密度等關鍵技術參數上的設定,以及各標準關于數轉模轉換原則及實際操作上的規定,為設計制作符合中文字符數轉模的標準規范和操作流程提供借鑒。
數轉模;技術標準;測試畫面
計算機輸出膠片,在國內各技術標準中統稱“COM”。最早的COM系統1958年產生于美國,距今已近60年歷史,最早用于原子能、汽車、飛機等工業,之后陸續在法人賬本、進貨單、申請書、收據的保存上得以使用。當時對COM的主要觀點是:COM作為將計算機處理過的大量數據直接印到縮微膠片上的高密度輸出制品,與電磁記錄相比,其檢索性能不夠好,但具有保存性強、只需單幅放大還原就直接可讀、系統維持費用低等優點。在當時,由COM形成的縮微膠片已開始同由紙、電磁記錄和拍攝產生的膠片并存,但各自的保存年限和憑證年限各有不同。
近年來,隨著數字技術的快速發展和廣泛應用,數字資源的長期保存問題愈發受到關注。數轉模技術可以將文獻數字資源轉換到縮微膠片上進行異質備份和長期保存,從而有效地彌補數字資源因軟硬件及網絡等因素造成的長期保存難題。這一技術在國外圖書館及檔案界得到高度的認可,并被廣泛應用于珍貴數字資源的長期保存工作中。在這一趨勢引導下,計算機輸出膠片(COM)的技術原理、操作對象、實現手段以及核心概念也相應發生一些變化。正如GB/T 30540-2014所描述的那樣:“ISO6196(GB/T 6159)關于COM術語的正式定義并沒有將近年來該技術的重要發展考慮進去”。因此,GB/T 30540-2014將COM描述為“電子文件以縮微品形式的構建和記錄”。筆者認為,凡是以計算機為媒介,實現數字資源轉換成縮微膠片的技術都可納入COM技術范疇。
國際COM標準中,關于字符識別及線對表現能力基本以數字、英文字符作為基準,這與發源于象形文字的中文字符相比,其字符形狀、筆畫、交叉等多有不同。針對中文字符的典型特征,設計獨特的測試畫面,從而評估其對中文字符的線對表現能力,首先應從各技術標準的對比研究入手。
本文擬通過對國內縮微攝影技術、文件管理應用、檔案行業等領域中關于數轉模技術相關標準的分析對比,觀察各標準在測試畫面研究、設計和制作中所采用的視角、思路和方法,總結其在測試畫面、解像力、字符識別、密度等關鍵技術參數上的設定,以及各標準關于數轉模轉換原則及實際操作上的規定,為設計制作符合中文字符數轉模的標準規范和操作流程提供借鑒。
為廣泛對比國內各數轉模相關標準,本文以《國家標準全文數據庫》和《中國行業標準全文數據庫》為主要檢索庫,以“縮微”作為“標準名稱”項檢索詞,檢索得到標準90條;分別以“COM”“計算機輸出”等為“標準名稱”項的檢索詞,檢索得到有效標準5條,通過篩選,作為本文所重點闡述的標準共以下5項(8條)。
(1)GB/T 30540-2014,文件管理應用電子數據的存檔計算機輸出縮微品 (COM)/計算機輸出激光光盤(COLD)
規定為長期確保電子數據的完整性、可存取性、可用性、可讀性和可靠性而將其存檔的技術,以便保護數據的證據價值。
(2-1)GB/T 17294.1-2008,縮微攝影技術字母數字計算機輸出縮微品質量控制第1部分:測試幻燈片和測試數據的特征
規定用于測量字母數字計算機COM記錄儀輸出縮微品質量的測試幻燈片和測試數據的特征。
(2-2)GB/T 17294.2-2008,縮微攝影技術字母數字計算機輸出縮微品質量控制第2部分:方法
規定利用格式幻燈片對字母數字計算機輸出縮微品(COM)質量的測量方法,以及采用該方法所需使用的標準測試幻燈片的樣式和測試數據的詳細說明。
(3-1)GB/T 20494.1-2006,縮微攝影技術使用單一內顯示系統生成影像的COM記錄器的質量控制第1部分:軟件測試標板的特性
提供用于評價使用COM記錄器影像質量的軟件測試表板特性規范。
(3-2)GB/T 20494.2-2006,縮微攝影技術使用單一內顯示系統生成影像的COM記錄器的質量控制第2部分:使用方法
規定GB/T 20494.1-2006所規定的軟件測試標板的使用方法。
(4-1)GB/T 19474.1-2004,縮微攝影技術圖形COM記錄儀的質量控制第1部分:測試畫面的特征
規定測試畫面的特征,用于評價圖形COM記錄儀產生的縮微品的圖像質量。適用于能夠在黑白膠片上記錄字符和圖形的圖形COM記錄儀。
(4-2)GB/T 19474.2-2004,縮微攝影技術圖形COM記錄儀的質量控制第2部分:質量要求和控制
規定利用GB/T 19474.1-2004中制定的測試畫面檢測圖形COM記錄儀生成的縮微品的圖像質量。適用于能夠在黑白膠片上記錄字符和圖形的圖形COM記錄儀。
(5)DA/T 44-2009檔案行業標準數字檔案信息輸出到縮微膠片上的技術規范
規定數字檔案信息輸出到16mm和35mm卷式黑白縮微膠片上的一般要求,適用于利用計算機等設備將A0或A0以下幅面紙質檔案數字化后產生的數字圖像制作成縮微品的過程。
作為規范性的技術標準,本文重點類比的五項標準的術語基本都引用GB/T6159.1-2014、GB/ T6159.3-2014、GB/T6159.4-2014、GB/T6159.5-2014、GB/T6159.7-2014等縮微攝影技術標準規范中關于專業詞匯的表述。但因這五項標準本身的適用對象和設計理念存在區別,其關鍵術語各有側重。
2.1COM計算機輸出縮微品
GB/T 30540-2014規定,COM方法為電子文件以縮微品形式的構建和記錄。
2.2字母數字COM記錄器
GB/T 6159.7-2000規定,字母數字COM記錄器為只生成文字 (字母數字字符、標點及某些符號)的COM記錄器。
2.3圖形COM記錄器
GB/T 6159.7-2000規定,圖形COM記錄器為既能生成文字,又能生成圖形的COM記錄器。
2.4測試畫面
GB/T 19474.1-2004規定,測試畫面為在COM記錄儀中產生測試圖像的數據文件。
2.5測試幻燈片
GB/T 1729.1-20084規定,測試幻燈片為用于測量COM系統輸出質量的格式幻燈片。
2.6點
GB/T 20494.1-2006規定,點為COM記錄系統在膠片上所能記錄的最小單元。
2.7點跨距
GB/T 20494.1-2006指出,點跨距為膠片上連續兩點中心到中心的距離。
2.8點重疊率
GB/T 20494.1-2006指出,點重疊率為點直徑與點跨距之比。點重疊率通常是由COM記錄系統制造廠商在1.3-1.5之間選定一個系數。
2.9證據副本
GB/T 30540-2014規定,證據副本為:為保持被復制文件的證據效用,以專門選擇的技術手段來制作的復制品。
如何通過有效可靠的方法,設計出能夠呈現給用戶清晰可讀的信息并穩定測量數轉模設備影像質量的測試畫面,是各個標準首要解決的問題。本文所重點對比的標準大都涉及測試畫面,雖規格各有不同,但包含的測試內容基本一致,最主要的是解像力、密度、字符識別、字符區分、縮率等部分。
如圖1所示,GB/T 17294.1-2008規定用于測量字母數字計算機COM記錄儀輸出縮微品質量的測試幻燈片和測試數據的特征,包含密度測量區域、測試圖區域、密度平衡區域、字符可讀性測試區域、字符測試區域等部分。標準明確提到,生產廠家應為每張測試標板提供證明符合該標準要求的合格證書。此外,在測試畫面的“字符組成區”額外制成一行外形相似的字符對于字符識別非常有用,比如:1和I,0OQ,B和8,Z72等。但是,由于本文所關注的中文字符與字母和數字存在較大區別,字母數字COM標準對于中文字符數轉模并不完全適用。

圖1 GB/T 17294.2-2008中關于測試圖形的設計

圖2 GB/T 20494.1-2006中關于測試圖形的設計
GB/T 20494.2-2006規定使用單一內顯示系統生成影像的COM的測試標板的特性和測量方法,圖2是該標準所提供的測試圖形設計。對于當前主流數轉模設備而言,都是基于單一內顯示系統而生成的影像,因此該標準對于中文字符數轉模的研究有很大的借鑒意義。該標準所設計的測試標板包含測試圖樣、密度測量區、斜線、字符可讀性區、替代字形區、測量比例尺和標題區等部分。該標準的整體設計思路基于“點”的概念。標準認為,點與點之間存在重疊,膠片上連續兩個點中心到中心的距離為點跨距。點重疊率等于點直徑與點跨距之比。點直徑通常大于點跨距,從而使連續點的記錄得以平滑,形成一條直線。對于廠家來講,點重疊率應在1.3-1.5之間。點直徑隨縮率和解像力的變化而變化。如果原件規定的解像力為240DPI,那么全尺寸的點跨距為0.11mm,如果以48倍的縮率記錄到縮微膠片上,那么膠片上的像素跨距為0.0022mm。
GB/T 19474.1-2004主要針對圖形COM記錄儀的質量控制,因此該標準設計了檢測畫面尺寸直線型和定位的測試畫面,檢測解像力、可讀性和密度的測試畫面、檢測徑向記錄的測試畫面、檢測曲線的測試畫面以及檢測字符顯示和字符旋轉的測試畫面等5個測試畫面。由于各個測試畫面檢測的關鍵點不同,因此該標準并未將5個測試畫面并在一起,而是分別給出畫面樣本。

圖3 GB/T 19474.1-2004中用于檢測解像力、可讀性和密度的測試畫面
圖3是該標準關于檢測解像力、可讀性和密度的測試畫面。本文認為,對于使用者而言,5個測試畫面都應繪制且輸出到縮微膠片上,才能完全評估圖形COM的輸出質量。
GB/T 30540-2014和DA/T 44-2009沒有直接給出測試標板的設計樣圖,而是強調:制作縮微品的質量應符合以上 GB/T 17294-2008、GB/T 19474-2004和GB/T 20494-2006三個標準的規定。
字符的可讀性體現在各個標準中解像力的測試上,宜選取無襯線字符作為測試圖樣,COM記錄對于解像力的要求取決于被記錄的字符的類型(字體和大小)以及所使用的縮率。
GB/T 17294-2008設計了五組完全相同的圖樣分布在測試標板的中心和靠近四角處,見圖1。每個圖樣中包含E和H兩種字符,大小相同的字符E和H成對排列,橫向五對,縱向四排,高度(H)和寬度(L)逐步遞增。該標準以質量值Q表示解像力:Q=P×H。其中,P為解像力符合要求的測試區域③中的最高圖樣標示數 (即可分辨的最小圖樣的空間頻率數),H為從COM字符可讀性測試區⑤測出的高度。當得出的質量值不小于8時,該標準認為得到了良好的效果;若質量值不小于5,亦無困難地閱讀;但當值小于3時,閱讀存在困難。最小值宜為3.6。
GB/T 20494-2006測試標板的各個角和中心一共六組解像力測試圖,每個測試圖由5組橫豎對應的線條組成,線條寬度分別是1個點-5個點,線條長度為48個點,橫線之間的距離為10個點,豎線之間的距離為27個點,見圖2。標準指出應根據可分辨的最小的即最細的測試圖案來確定解像力,觀察時使用的顯微鏡的最低放大倍率應等于縮微影像所用的縮率。
GB/T 19474-2004解像力測試標板由若干五線組合構成圖樣,每個五線組合旁標有字母以用于標示,見圖3。測試時,使用放大倍數是有效縮率倒數1-3倍的顯微鏡檢測位于測試標板中心和四角的圖樣,依照GB/T 6161描述的方法,注明每個表搬出所能分辨的最小線條組合的字母。該標準認為,之所以使用字母而非數值來標識組合,是因為解像力是圖像尺寸的函數,實際以每毫米線對數為單位的解像力可由COM廠商提供的數據表對比得知。
以上檢測方法都有其獨特的設計之處,但對于中文字符而言,字體的交叉是這些專為字母數字COM、圖形COM而設計的測試畫面所不能體現的,比如中文字符里的“矗”“數”等,因此,在專為中文字符數轉模設備研發而設計的測試圖畫中,中文字符應突出表現出來。
GB/T 17294-2008的測試標板中,密度測量區域包括兩個圓,分別為25線每厘米的50%半色調網屏圖和全黑圖(密度值至少為2.0),此外還有四個密度平衡區域,分別是9個25線每厘米,10%-90%的半色調網屏圖,每個半色調圖獨有衣閣完整的數字標識,一半為白,一般為黑,顯示適當的百分比,見圖1。普通銀明膠型縮微膠片可允許的最小背景密度值為0.75,最小密度差為0.6。
GB/T 20494-2006的測試標板有三個密度區,分別是實心的(所有點都生成),空白的(所有點都不生成)以及生成線寬1個點,間距2個點的網線區域。檢測時,負片檢測空白點的(所有點都不生成)區域,網格區主要用于監測曝光和沖洗的一致性,見圖2。普通銀明膠型縮微膠片可允許的最小背景密度值為0.75,最小密度差為0.6,這與GB/T 17294基本一致。
GB/T 19474-2004可接受的密度范圍相對寬松,最小背景密度值為1.0,最小密度差為0.9。
DA/T 44-2009指出密度值應符合 GB/T 19474-2004的規定。
相對于GB/T 17294-2008、GB/T 19474-2006 和GB/T 20494-2004三個標準,GB/T 30540-2014 和DA/T 44-2009的重點都在于對縮微品轉換的具體方法提出要求,包括輸出前的準備、膠片輸出規范、膠片沖洗、縮微品的質量要求、存儲環境、證據所用等。
DA/T 44-2009主要針對的是檔案信息輸出,規定其在標板數字圖像的制作上,除測試畫面標板外,還應包括憑證標板 (包括縮微品制作委托書、批準書、檔案原件證明、輸出說明等)、識別標板(檔案權屬單位、立檔單位、輸出單位、輸出時間、輸出人員、輸出設備型號、輸出縮率、操作系統、相關軟件及其他需要識別的內容等)、著錄標板(檔案全宗名稱、全宗號、目錄號、年代、保管期限、類別等)。
為便于縮微品統一使用,DA/T 44-2009對膠片上影像的編排順序參照傳統縮微攝影技術標準,包括編排、縮率、分幅、合幅等。
在縮微品質量要求上,DA/T 44-2009對數轉模縮微品所要去的項目與傳統縮微攝影技術標準對縮微品質量要求的項目相同,以可讀性、完整性、保存性和憑證性為原則。
GB/T 30540-2014特別強調數轉模用來存檔電子數據,以確保其真實性和滿足長期存檔需要的原則:(1)當需要保證電子數據完整性的時候,即使在非常短的時期內,也推薦使用計算機輸出攝影技術(數轉模);(2)對于需要存檔3年以上的數據,建議使用計算機縮微攝影技術(數轉模)。
GB/T 30540-2014也對COM記錄的證據作用提出了要求,并在附錄 B中引用 ISO18901、ISO18911、ISO18917、ISO10977、ISO12040中關于縮微品適合長期保存的處理條件與存儲條件原則,包括沖洗處理條件、環境條件調整、存儲設備與用具、存儲室、照明條件、溫度條件、相對濕度、防火防洪、監測條件等方面。
[1]牟薇,曉蘇.縮微與信息處理技術的變遷[J].縮微技術,2002 (3):2-6.
[2]范韞.DA/T 44-2009《數字檔案信息輸出到縮微膠片上的技術規范》解讀[J].數字與縮微影像,2016(1):22-25.
[3]中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會.文件管理應用電子數據的存檔計算機輸出縮微品(COM)/計算機輸出激光光盤(COLD):GB/T 30540-2014[S].北京:中國標準出版社,2014.
[4]中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會.縮微攝影技術字母數字計算機輸出縮微品質量控制:GB/T 17294-2008[S].北京:中國標準出版社,2008.
[5]中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會.縮微攝影技術使用單一內顯示系統生成影像的COM記錄器的質量控制:GB/T 20494-2006[S].北京:中國標準出版社,2006.
[6]中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會.縮微攝影技術圖形COM記錄儀的質量控制:GB/T 19474-2004[S].北京:中國標準出版社,2004.
Comparative Analysis on Domestic Technical standards of COM
LI Jin
(National Library of China,Beijing 100081,China)
This paper makes a comparative analysis on techrical standards of COM in the field of domestic micrographics,document management,archive industry,observes the angle,ideas and methods of the standard test frames,summarizes the set on the test frames,resolving power,character recognition,density and other key technical parameters,as well as the criteria for the COM conversion principles and actual operation,in order to provide a reference for design standards and operating procedures that comply with Chinese characters COM.
COM;technical standards;test frame
G255.72
G255.72
A
2095-5197(2016)04-0087-05
李進(1982-),男,館員,碩士,研究方向:縮微攝影技術及圖書館經濟管理。
2016-05-20(編發:王域鋮)