馬麗 張雪
摘 要:受檔案數字化浪潮影響,基于圖像掃描的電子檔案生成系統受到我國檔案管理業界的廣泛重視。基于此,本文將簡單介紹基于圖像掃描的電子檔案生成系統,并深入探討基于圖像掃描的電子檔案生成系統運用要點,希望研究內容能夠為檔案管理人員帶來一定啟發。
關鍵詞:圖像掃描;電子檔案生成系統;圖像掃描設備
為滿足檔案數字化管理需要,檔案信息采集問題的解決極為關鍵,基于圖像掃描的電子檔案生成系統因此應運而生。電子檔案生成系統可通過掃描儀將各類紙質檔案轉化為電子檔案,檔案管理工作可由此更好適應時代發展,而為了實現對電子檔案生成系統的合理使用,正是本文圍繞該課題開展具體研究的原因所在。
1 基于圖像掃描的電子檔案生成系統
基于圖像掃描的電子檔案生成系統一般由電子檔案生產軟件、服務器、數據錄入設備、計算機設備、光盤柜組成,計算機設備包括圖像掃描工作站、識別校對工作站、數據服務器,電子檔案生成系統的圖像掃描設備一般可掛接市面上主流的高速圖像掃描設備。電子檔案生成系統采用的軟件主要有信息卡表格描述、數據輸出描述、校對處理、智能數據識別、多種圖像格式存儲等。光盤柜則主要由光盤鏡像服務器、光盤刻錄機組成,用于圖像、數據的存儲,并能夠提供檢索服務。在電子檔案生成系統的具體應用中,表格描述、圖像處理、條碼識別、智能識別、OMR識別、邏輯檢查、數據處理均屬于系統所具備的具體功能,充分應用這類功能與圖像掃描技術,即可保證基于圖像掃描的電子檔案生成系統較好服務于檔案數字化發展[1]。
2 基于圖像掃描的電子檔案生成系統運用要點
2.1 合理選用圖像掃描設備
為保證基于圖像掃描的電子檔案生成系統更好為檔案數字化管理提供支持,圖像掃描設備的合理選用必須得到重視。對于一般單位來說,圖像掃描設備的選用需在一定程度上考慮成本節約,因此應在充分利用原有掃描設備的基礎上,考慮是否需要引進新型掃描設備,這一過程需考慮檔案數字化管理的具體需求。以某單位為例,該單位曾在2005年購入一臺平板掃描儀,型號為EpsonGT15000,至今仍保持良好工作狀態,可滿足一般文檔、尺寸不規則文檔、紙張較薄的紙質檔案掃描需要,能夠在一定程度上滿足電子檔案生成系統的運用需要。但為了進一步提升檔案數字化管理水平,充分發揮電子檔案生成系統優勢,該單位基于經費充足考慮,在2018年購入了一臺新型掃描儀,型號為EpsonD60000,這一掃描儀帶有饋紙器,支持自動進紙雙面高速掃描與手工平板掃描,基于圖像掃描的電子檔案生成效率因此實現長足提升。配合同時采購的成冊掃描儀(M2030-PR0),電子檔案生成系統在應用中可能出現的文字識別功能故障可有效規避,并滿足更為多樣化的圖像掃描需要。
2.2 合理選擇掃描加工人員
掃描加工人員在基于圖像掃描的電子檔案生成系統運用中發揮著關鍵性作用,這是由于該工作本身具備較高專業性,因此掃描加工人員的選擇必須從文字錄入、圖像處理、故障診斷等方面的技能掌握情況出發。結合檔案數字化管理需要,不同單位需參考自身實際需要,打造相對穩定的掃描團隊。如檔案掃描工作量相對較少,單位可采用臨時招聘紙質檔案掃描人員的方式,這類人員的勞動成本較低、掃描加工效率較高,如檔案保密度較高、掃描工作量較大、錄入時效性要求較高,則需要設置專業的檔案管理人員負責檔案掃描加工,配合針對性的專業培訓與講座,即可保證掃描加工人員較好使用電子檔案生成系統,更好發揮圖像掃描技術的應用優勢[2]。
2.3 嚴格制定和落實掃描標準
在應用電子檔案生成系統的過程中,必須嚴格制定掃描標準,掃描分辨率、顏色模式選擇、掃描文件格式均需要得到明確。一般情況下,采用300dpi掃描5號以上字體,在滿足文字識別需求的前提下,可降低空間占用、提高掃描速度。對于5號以下字體或模糊字體,多采用600dpi掃描,打印文本清晰度、文字識別率可由此大幅提升。因此單位需針對性控制掃描分辨率,以文字清晰為標準,準確權衡文字清晰度、文字識別率、文件大小間的關系;黑白、灰度、24位彩色均屬于電子檔案生成系統圖像掃描常用的掃描色彩模式,單位需基于檔案內容合理選擇不同的掃描色彩模式,如黑白模式適用于普通文字紙質檔案,灰度模式適用于含有較多圖表及插圖的紙質檔案。24位彩色模式適合用于含照片、印章、紅頭的紙質檔案掃描,其色彩保真度較高;掃描文件格式需采用雙層PDF,以此滿足檔案的數字化與數據化需要,檔案的全文檢索需求可由此得到滿足。
2.4 合理選用掃描輔助軟件
為保證基于圖像掃描的電子檔案生成系統更好服務于檔案數字化,掃描輔助軟件的合理選用極為關鍵。隨著電子檔案生成系統的不斷完善,配套的集成掃描軟件可實現自動化的檔案掃描各環節管理,如清華同方的OCR文字識別軟件、ABBYY Fine Reader軟件均屬于其中代表,這類軟件多具備文字識別、圖像處理、掃描管理、雙層PDF生成等功能,可較好服務于電子檔案生成系統的效用發揮。一般來說,ABBYY Fine Reader軟件在使用成本、識別率、版面還原率、圖像處理、雙層PDF生成等方面的表現較為優秀,因此本文建議采用該軟件輔助電子檔案生成系統。此外,PDF-ToolsPortable、2345Renametool、Files2Folder等軟件也能夠為電子檔案生成系統的應用提供支持,這類軟件可提供PDF制作、文件批量重命名、特殊目錄結構生成等服務。
2.5 圖像處理實用技巧
基于圖像掃描的電子檔案生成系統應用還需要重點關注圖像處理環節,這是由于現階段的電子檔案生成系統尚無法實現自動化的高水平圖像處理,在具體的掃描工作中,無法后期處理掃描檔案圖像的情況極為常見,污跡較多、灰黑背景、文檔傾斜等問題屬于其中典型。在電子檔案生成系統使用過程的圖像處理中,需利用ABBYY Fine Reader軟件的圖像處理功能,以此實現梯形失真校正、圖像歪斜校正的自動檢測,由于OCR識別屬于軟件的設計基礎,因此其能夠較好服務于多數檔案掃描件的掃描需要,僅要求原始檔案掃描件質量不是過差,配合軟件的自動化運行與手動化操作,即可較好滿足文字清晰度增強、原始文檔顏色信息保留、圖像去污操作簡化需要,檔案掃描成本可由此實現有效節約。此外,PHOTOSHOP軟件也能夠較好為電子檔案生產系統的應用提供支持,如靈活運用軟件的動作功能、合理應用“CTRL”鍵的多選功能,檔案圖像的自動批量處理效率和質量可由此得到保障,紙質檔案掃描加工專業性也能夠由此不斷提升。
3 結論
綜上所述,基于圖像掃描的電子檔案生成系統運用需關注多方面因素影響。在此基礎上,本文涉及的合理選用圖像掃描設備、合理選擇掃描加工人員、嚴格制定和落實掃描標準、合理選用掃描輔助軟件、圖像處理實用技巧等內容,則提供了可行性較高的電子檔案生成系統運用路徑。為更好發揮電子檔案生成系統運用優勢,各類新理念、新技術、新設備的引入和應用必須得到重視。
參考文獻
[1]賴雯.檔案數字化圖像自動檢測技術的研究與應用[J].科技與創新,2018(12):149-150.
[2]田支斌.高校檔案資源低成本數字化實踐與探索[J].資源信息與工程,2018,33(01):197-198+201.