夏偉偉+張照余
摘 要:本文從來源、壓縮編碼標準、兼容性、原真性保存等方面分析了主流圖像文件格式的歸檔屬性,進而推薦JPEG、TIFF、PDF為檔案長久保存格式;從開發者、軟件免費開源情況、版本更新情況、格式支持等角度研究了常用圖像處理軟件,優選出適合作為圖像文件歸檔格式轉換工具的軟件;在反復實驗的基礎上,梳理出圖像文件格式轉換通道,同時對格式轉換過程中可能出現的問題作了說明。
關鍵詞:圖像文件;格式轉換;電子文件
1 圖像文件格式的歸檔屬性分析
圖像文件作為多媒體電子文件歸檔,必須保證其原真性。理論上,圖像文件應采用未壓縮或無損壓縮的圖像格式進行保存。但采用未壓縮或無損壓縮的圖像格式保存圖像文件時,大量圖像文件會占用巨大的存儲空間,欠可操作性。而事實上,正是壓縮技術的完善與發展,使數字化存儲和網絡傳輸成為可能[1]。因此,圖像文件歸檔,要兼顧原真性和圖像文件磁盤占用空間。
此外,操作系統、應用軟件的種類繁多與頻繁升級,都給圖像文件可識讀性帶來了挑戰。這要求圖像文件歸檔時,優選標準化程度較高的開放格式;工具軟件支持較多、業界廣泛使用的主流格式;對技術環境的獨立程度較高、對不同應用系統兼容性較好的可移植格式。
基于此,對幾種主流圖像文件格式作如下歸檔屬性分析(見表1)。
除此之外,常見的圖像格式還有PSD 、PCX、TGA、JPEG XR、JPEG 2000等。
綜合上述圖像文件格式歸檔屬性分析,推薦JPEG、TIFF、PDF為通用檔案格式。中華人民共和國國家標準GB/T18894-2002指出,“對用掃描儀等設備獲得的采用非通用文件格式的圖像電子文件,收集時應將其轉換成通用格式”[2]。
2 圖像處理軟件及其對應的圖像文件格式
對圖像文件格式進行轉換,需要借助于特定的圖像轉換工具,即圖像處理軟件。圖像處理軟件分為圖片查看器和圖片編輯器。圖片編輯器的體積通常大于圖片查看器,功能較圖片查看器也更多。表2是常用的圖片查看器,表3是常用的圖片編輯器。
圖像處理軟件對常用圖片文件格式支持情況見表4。為了簡單明確地表達筆者的想法,筆者對本文中出現的“圖像處理軟件的格式支持”作如下說明:如果A圖像軟件可以讀取B格式圖像,且B格式圖像可以通過A軟件被轉化為另外一種具有可讀性的常用圖像格式,那么則稱A圖像軟件支持B圖像格式。
備注:表中的RAW格式以DNG為例,DNG是一種開放的RAW格式。
3 歸檔圖像文件格式轉換通道
全面考慮圖像處理軟件的開發團隊、公開發行時間長短、免費與否、軟件更新情況、系統兼容性、格式支持、格式轉換性能,從常用圖像處理軟件中優選出8款圖像處理產品:ACDSee;IrfanView;XnView;美圖看看;QQ影像;Adobe Photoshop;Corel Photo-Paint;格式工廠。
給出JPEG、TIFF、PDF、RAW(以DNG為例)、BMP、GIF、PNG等十種常見圖像文件格式用這些軟件進行格式間轉換的路徑。
備注:①代指“ACDSee” ②代指“IrfanView ”③代指“XnView ”④代指“美圖看看” ⑤代指”QQ影像” ⑥代指“Adobe Photoshop” ⑦代指“Corel Photo-Paint” ⑧代指“格式工廠”
備注:①代指“ACDSee” ②代指“IrfanView ”③代指“XnView ”④代指“美圖看看” ⑤代指”QQ影像” ⑥代指“Adobe Photoshop” ⑦代指“Corel Photo-Paint” ⑧代指“格式工廠”
圖3是常見格式轉換為PDF格式的轉換通道。
備注:①代指“ACDSee” ②代指“IrfanView ”③代指“XnView ”④代指“美圖看看” ⑤代指”QQ影像” ⑥代指“Adobe Photoshop” ⑦代指“Corel Photo-Paint” ⑧代指“格式工廠”
4 歸檔圖像文件格式轉換中若干問題說明
4.1 元數據保存問題。所謂元數據,是指描述電子文件數據屬性的數據。國內檔案行業已經形成關于文書類電子文件元數據的DA/T 46-2009標準,而并無圖像電子文件元數據的統一標準。然而,中華人民共和國檔案行業標準DA/T 50—2014指出,“歸檔的數碼照片應是用數字成像設備直接拍攝形成的原始圖像文件,不能對數碼照片的內容和EXIF信息進行修改和處理”[3]。因此,我們在進行圖像格式轉換時,要保留圖像原有EXIF信息。此外,IPTC元數據作為對圖像文件進行描述的一種標準格式,在圖像格式轉換過程中,也要盡可能保存。
4.2 可讀性問題。圖像電子文件作為檔案保存,必須具有可讀性。圖像格式轉換過程中出現的可讀性問題,可以通過以下幾種方式解決。第一,安裝插(下轉26頁)件。例如,可以通過安裝插件使IrfanView對PDF圖像具有可讀性。第二,更換讀取軟件。例如,同一個通過轉換格式得到的PDF文件,可能IrfanView讀取效果遠遠不如Adobe Reader。第三,更換格式轉換工具。例如,用Adobe Photoshop CS6轉換含有文字的PDF文件時,讀取形成文件會出現“黑點”,而使用IrfanView對其轉換,則能很好地規避這個問題。第四,通過選擇不同的兼容性。例如,將常用格式轉換為PDF時,會出現PDF圖像無法讀取的情況,可在格式轉換過程中彈出的“PDF設置”對話框中,選擇不同的兼容性來解決。
4.3 內容原真性問題。不同于傳統文件,電子文件的原真性對載體和文件記錄形式的依賴性大大降低,電子文件原真性更多是指文件內容的真實可靠[4]。圖像內容原真性,落腳到圖像文件格式轉換上來,就是要保證圖像格式轉換之后,分辨率、尺寸、清晰度沒有太大變化。可以從兩個方面對其加以控制:第一,在圖片格式化轉換過程中,通過設置分辨率、尺寸、壓縮比來保證。第二,在通過設置具體參數很難實現的情況下,可以更換轉換工具。例如,格式工廠對DNG進行格式轉換時,圖像尺寸、質量下降明顯,而改用ACDSee后,圖像尺寸不變、質量幾乎無變化。