尤慧玲
數字化加工舊報紙的深度一般分為3 個層次:①數字化基礎工作。 進行載體轉換,處理成數字圖像;②數字化篇章信息著錄。 在數字圖像的基礎上進行標題文字識別; ③在數字圖像基礎上進行全文識別和版面還原。 舊報紙轉換為數字圖像,如果有微縮膠片,則優先采用掃描膠片的方式。 對于幅面較大的舊報紙,則需采用掃描儀進行轉換。 這種方式不但需要昂貴的大幅面掃描儀, 而且掃描過程需要拆包壓平,對舊報紙造成損害。 因此,采用單反相機進行翻拍更加簡單易行。
筆者在審核采用單反相機進行翻拍的60 多種近2000 冊珍貴的舊報紙數字圖片時發現,圖片質量的控制對版面信息標識、 標題和全文數字化有重大影響, 舊報紙翻拍圖片的質量是后續標引和識別的基礎。 本文從舊報紙翻拍實踐出發,針對常見的圖像質量問題,制定圖像分辨率、白平衡、圖片亮度、清晰度、幾何畸變和色彩還原等標準。通過標準化翻拍環境、 舊報紙整理、 單反相機設置、拍照和圖像數據審核流程,為翻拍圖片質量驗收提供依據,并以此作為操作規范,形成舊報紙翻拍的統一圖片質量標準。
本文分為3 部分: 第一部分描述翻拍舊報紙的環境及翻拍流程; 第二部分說明翻拍過程的圖像質量控制指標;第三部分進行總結。
為了提高翻拍質量和一致性, 穩定可控的翻拍環境是基礎。 采用固定翻拍架(如圖1 所示),可以控制舊報紙翻拍環境的亮度、色溫,減少環境變化干擾。 因此,參考高清新聞演播室的燈光方案,翻拍時采用色溫為5600K 的光源, 控制舊報紙上的亮度不低于600lux。 具體翻拍流程如下。

圖1 翻拍架
①館藏梳理:把要翻拍的舊報紙按報種、出版時間整理好,便于補漏,保證數據的完整性;②平整:拍攝前先查看舊報紙質量,清潔舊報紙,把粘在舊報紙上面的書蟲、碎片小心處理掉。有折角折皺的先做平整處理。有破損的墊上同色系牛皮紙,目的是不疊字,達到最佳的圖片質量。
為了達到更好的圖像質量, 采用全畫幅單反相機和50mm 固定焦距鏡頭,減少鏡頭變形,提高銳度;由于環境光源固定為單色溫5600K,將白平衡設置為手動, 色溫5600K 與環境燈光一致;光圈采用景深與衍射平衡較好的F8,避免景深太小或衍射引起的模糊;感光度設為ISO100,減少相機傳感器的底噪;快門采用自動快門,測光采用均勻測光,手動對焦。 相機輸出圖片格式為JPG 和RAW,JPG 采用最精細模式減少壓縮損失,RAW圖像輸出的特點是沒有經過數碼相機的預處理,圖像信息是傳感器原始信號, 為后期處理提供了白平衡、亮度、降噪、清晰度、色調曲線等調整工具。 不同品牌的單反相機的RAW 文件采用不同后綴名, 佳能相機RAW 文件后綴是CR2 或CR3,尼康的RAW 后綴名為NEF。
保證數碼相機每一拍和原報或原報合訂本的順序一致, 有利于審核校對和從圖片溯源到原報或原合訂本。 從效率、統一性的角度考慮,報紙采用單雙面同一臺相機分開拍攝, 目錄下建立01、02 子目錄,審核的時候再合并成冊。 文件名由系統自動生成,不手工改動數據,確保圖像順序與報紙順序完全一致。翻拍過程中碰到漏拍、重拍的問題,后期審核的時候再進行刪除、插入。 最后合并成冊。
把拍攝好的圖片按格式分開(JPG,NEF 或CR2)后,分別對兩個格式圖片進行統一命名,查看每一拍的JPG 圖像,審核是否有漏拍、重拍、顛倒、模糊、傾斜、陰影、遮蓋及拍攝不全等情況。 標注后,讓拍攝人員進行補拍、重拍,進行圖片比對后,再進行圖片刪除、插入、替換,最后再重命名,合并圖片成冊,完成電子圖片的預處理。
印刷不嚴導致食品二次污染。眾所周知,包裝印刷是造成食品二次污染的一個主要原因。包裝材料粘合劑以及印刷油墨的溶劑一般是苯類,而苯類卻是一種常見的致癌物質且因不易揮發而殘留一部分在包裝材料中,從而對顧客的飲食安全造成巨大威脅。
圖片質量控制即圖片質量標準確定及檢查舊報紙翻拍質檢工作要求對舊報紙翻拍輸出的圖像數據和版面信息進行檢查、標引,做到一致的效果。 標引包含報紙的種類、版面基本信息等。
對翻拍的圖片, 涉及拍攝圖像分辨率、 清晰度、畸變和色彩等技術參數,采用量化客觀標準和主觀判斷,以保證報紙完整準確地呈現給讀者。客觀標準含圖片清晰度、亮度、白平衡、完整性及畸變等,主觀判斷含色彩準確度、色彩飽和度、版面破損、折皺及遮蓋等。通過調整拍攝環境,優化相機設置,讓翻拍的舊報紙盡可能接近原報色彩,讓讀者電腦查看時,有更好的視覺體驗。
翻拍過程中碰到的問題主要有以下幾點: ①異物遮蓋,破舊報紙有碎紙片、書蟲等異物文字遮蓋;②裝訂遮蓋邊緣拍攝不全;③折皺遮蓋,報紙折皺文字遮蓋;④手影拍攝,由于翻頁過快拍攝到手指或身體遮住光源,導致圖片陰影等;⑤報紙多拍、漏拍問題。 可采取的措施是,每一本報紙在翻拍前先把頁面上遮蓋的異物小心去除,提前用折皺壓板進行平整處理, 在破損的報紙下面墊上同色系紙,避免下面一張報紙文字跟當前報紙文字混在一起,影響閱讀。 拍攝的時候把握節奏,避免拍到手指或因拍攝人員擋住燈光造成陰影。邊緣裝訂遮蓋的把裝訂線拆開再拍攝。
每一張照片對應一個編號,進行簡單版面信息標引,便于以后網上查閱。 最后,清點文獻的冊數,按種類、年月順序裝箱,貼上標簽,上架,完成文獻提取的全部程序。
以下提出圖片質量控制指標,在實踐中能夠很好地滿足不同批次的拍攝要求。
邊角裁10%后分辨率盡量滿足300dpi 輸出要求,一版圖片分辨率為:5792×8688。 邊角裁剪10%的原因有: 中心成像質量高,鏡頭邊角有暗角/亮度衰減,相機高度需根據報紙幅面做調整,在保證拍攝完整畫面的情況下盡量放低以保證圖像的有效像素;相機一定要平行于報紙,避免圖像變形。
在陽光、陰霾的天氣及室內各種燈光下,人們所看到的白色物體顏色恒為白,因為人的大腦可以偵測并且更正這樣的色彩改變,進行自我適應。 但是相機不具有自適應功能,需要利用白平衡進行校正。 自動白平衡會由于舊報紙偏黃而出現誤判。 根據翻拍架光源色溫, 把相機白平衡設置為手動模式,色溫設為5600K,與光源色溫一致,避免白平衡偏差。 如果不知道燈光的準確色溫,也可以采用自動白平衡,讓相機拍白紙自動計算色溫,再運用到舊報紙拍攝。
舊報紙一般為黑色字和偏黃背景,采用自動曝光, 圖片灰度直方圖背景亮度分布最大值接近110,主觀顯示與原始報紙較一致,如圖2 所示。

圖2 圖片亮度直方圖
按原始尺寸放大圖片, 舊報紙中間和邊緣都清晰不模糊。
如圖3 所示,桶形/枕形畸變小于2%。

圖3 幾何畸變示意圖
發黃的舊報紙中有些內容采用套印突出宣傳重點。 為了精確還原色彩,采用拍攝24 標準色卡,通過識別色塊產生配置文件進行校正。
通過以上對單反相機各參數的正確設定,可以拍出質量合格、批次統一的圖像,進行標引。
通過上述步驟,可以做到舊報紙翻拍質量有標準可依,方便拍后檢查,保證質量一致可控,方便推廣到不同批次的舊報紙,在不同地方實現翻拍。 審核完成的圖片上傳到指定服務器,按照編碼規則統一重命名,打上水印,根據不同使用需要轉換不同尺寸,做好文件的存檔備份,建設簡單的數據庫。把翻拍好的舊報紙分類裝箱貼上標簽密集存放。
筆者通過審核翻拍的60 多種近2000 冊舊報紙,制定出檢查單、拍攝規范及審核標準,用于不同批次數字化推廣,避免返工,獲得了良好效果。
多數舊報紙長期保存在書庫中, 藏而不用,鮮為讀者所知。 數字化完成后,可以通過宣傳,讓讀者及時了解資源的特色及檢索方法, 主動對讀者進行培訓, 努力提高讀者通過網絡利用資源的操作技能。此外,在尊重知識產權保護版權的前提下,增強開放性,適當開放使用限制,盡可能讓用戶可以通過網絡隨時隨地利用資源。 對于提高資源的利用率,充分實現資源的社會價值,具有十分重要的意義。