盛靜SHENG Jing;王曙明WANG Shu-ming
(永州職業技術學院,永州 425000)
(Yongzhou Vocational Technical College,Yongzhou 425000,China)
檔案作為一種重要的信息資源,具有較高的科研價值。在《國民經濟和社會發展第十個五年計劃的建議》中共中央明確提出:檔案作為一種原生的信息資源,在國家信息化建設過程中,檔案信息化建設是一個重要的組成部分。通過加強檔案信息化建設,提高檔案管理的現代化水平,這是先進生產力、先進文化發展的必然要求,同時也是提高檔案信息服務水平的必然選擇,在檔案事業發展過程中,提高檔案管理的現代化水平具有重要的現實意義。
2.1 概念 PDF 全稱為便攜文檔格式(Portable Document Format),是一個適合文檔交換的開放標準,致力于不依賴文檔創建環境,允許用戶交換及瀏覽的一種電子文檔格式。具有不限定軟硬件及系統環境,高壓縮比、長期保存、高質量輸出等特點。
2.2 技術 PDF 文件格式已成為國際標準,越來越多的行業和單位正在使用它。PDF 文件是一種具有多層結構的格式文件,其特點是:文件既可以是文本型的(比如由word 生成的文件),也可以是圖像型的(比如由掃描生成的文件),雙層PDF 技術還可以將tif、jpg、bmp、gif、png、單層PDF(圖像)等圖像類文件經加工后輸出為可全文檢索的雙層(圖層和文字層)PDF 文件。雙層PDF 文件是指文件內容既包含文本層,也包含圖像層,且其位置上下一一相對應。對于PDF 文件來說,其每一頁涉及的內容主要包括:第一上層是對紙質文件進行掃描獲取的原始圖像,第二下層是通過OCR 軟件對圖像進行掃描識別后產生的文字結果。通過上述處理,用戶在使用PDF 文件的過程中,看到的是掃描圖像,原始版面的公章、簽名等可以100%保留,在需要的情況下,可以對下層的文字信息進行選擇、復制、檢索等。
2.3 制作方法 PDF(Portable Document Format)文件格式作為一種特殊的文本格式,是由Adobe 公司所開發,該文本格式與其他文本格式相比,其優點主要表現為:尺寸小、閱讀方便,同時便于網絡傳播和使用。但是,如果對其進行文本、格式等操作就會變得比較困難,因為在解碼格式方面,PDF 格式與Doc 格式存在一定的差異,通過回車符、換行符,以及圖片格式等在PDF 格式下無法將其直接轉換為Doc 文件。具體的解決方式為:
Adobe Reader 6.0 Standard:通過點擊菜單欄中的“創建PDF”按鈕,對相應的創建途徑進行選擇,選擇“從文件”,選中需要轉換的文件。
在文件格式轉換過程中,通過Acrobat Distiller 使得轉換更加輕松,在這種情況下,借助Office 辦公軟件打開相應的Doc 文件,然后選擇“文件”——“打印”中的Acrobat Distiller 打印機。
Adobe Acrobat 7.0 Professional:對于Adobe7 來說,通常情況下需要進行激活處理,用Paradox Key Generator 生成,在rar 文檔中,經解壓后出現一個“Keygen”。運行文件夾里的pdx-ac7p.exe 程序,借助該組生成的S/N 進行相應的安裝處理,完成安裝后,需要重新啟動計算機,進入Acrobat 界面,在操作界面上選擇彈出菜單列表中的“Activate Option”,并單擊“Activation by telephone”按鈕,在彈出Acoabat 中,產生Activation code,這時,Paradox Key Generator 程序將會被執行,在界面產生的S/N 及Activation code 中輸入Paradox Key Generator,同時取得Authorization code,并手工輸入。
利用Office2003 的轉換工具:首先使用Adobe Reader打開需要轉換的PDF 文件,同時對文件菜單中的打印進行選擇,按照“Microsoft Office Document Image Writer”設置“打印機”的“名稱”,確認按照MDI 格式將該PDF 文件設為虛擬打印文件。對于“Microsoft Office Document Image Writer”項,如果在“名稱”設置的下拉列表中沒有找到,在這種情況下,說明安裝Office 2003 時沒有安裝該組件,這時對其進行更新和安裝,需要借助Office 2003 安裝光盤中的“添加/刪除組件”。通過運行Microsoft Office Document Imaging,打開保存的MDI 文件,在工具欄中選擇將文本發送到Word 菜單,然后選中彈出窗口中的“在輸出時保存圖片板式不變”,經過確認后,系統會自動提示“必須在執行此操作前重新運行OCR,這可能需要一些時間”,最后按確認鍵即可。
PDF 技術使檔案數字化管理給搜索、查找、即時閱讀帶來的便捷是毋庸多言的,能夠簡化并極大提高管理的質量和效率。許多紙質或其他實物檔案,由于年月已久,只要動一動就會散裂或塵化,損毀風險極大,通過PDF 技術數字化采集圖片、視頻、尺寸、材質、介紹、文字描述等內容就可以在未來相當長一段時期保證原檔的完好性,并且便于向需要的人提供參考。
隨著PDF 技術的發展,檔案數字化管理技術實現了長足的發展,同時隨著技術的不斷創新,其工作方式、管理模式必將出現新的變革。在一定程度上利用先進的技術對檔案進行數字化管理,進而對檔案進行多元化、網絡化管理,同時轉變檔案的管理模式。在對檔案進行管理的過程中,以保管、利用檔案實體為重點,同時以檔案信息的數字化存儲為核心,使得檔案管理走向數字化、規范化、網絡化。
[1]郭金光.雙層PDF 技術及在檔案數字化中的應用[J].陜西檔案,2013(02).
[2]周錦云.檔案管理系統的設計與實現[J].電子科技大學,2013(03).
[3]熊雨前,徐紅輪.PDF 技術及應用[J].數字與微縮影像,2011(03).