朱桂平
[摘 要] 檔案館庫存的資料,尤其是20世紀的老資料多為紙質資料,借閱及資料的二次開發利用不方便,只有做好庫存檔案資料的電子化工作,才能更好地發揮檔案資料的作用。
[關鍵詞] 檔案;資料;電子化;二次開發
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 12. 028
[中圖分類號] F272.7;G275 [文獻標識碼] A [文章編號] 1673 - 0194(2014)12- 0045- 01
0 引 言
檔案館庫存的紙質檔案資料存在以下幾個特點:①保存不便,保存時限有限,年久容易損壞,防火、防潮、防蟲等安全系數不高;②對庫房的容量要求比較高,隨著地勘單位承擔的地勘項目越來越多,向檔案館匯交存檔的紙質檔案資料越來越多,檔案館庫存的壓力越來越大;③借閱、利用不便,很多圖紙圖幅大,翻閱不便,容易損壞;④資料的二次開發利用不便,大部分地質資料的二次開發是建立在電子版的基礎上。由此,檔案館庫存的紙質檔案資料電子化工作刻不容緩,如何高效做好紙質資料電子化工作對檔案工作人員的綜合素質要求很高。
1 準備工作
1.1 儀器、設備
(1)電腦。要求配置高,運行內存大,對提高大型圖件及軟件運行速度有利;存儲內存要求大,掃描高質量的圖件所占內存較大。
(2)掃描儀。選擇掃描速度快,大小合適的掃描儀。可從以下幾個性能指標來挑選。
①分辨率:分辨率反映的是掃描圖像的清晰程度。選擇分辨率時要適合圖紙掃描,但也不能過大,分辨率越大所占內存越大,對存儲配置要求就越高。②色彩位數:色彩位數反映了掃描圖像與實物在色彩上的接近程度。色彩的位數越高則掃描儀所能反映的色彩越豐富,掃描出的圖像也越真實。③感光元件:掃描儀所使用的感光元件有光電倍增管、CCD電荷耦合器件和CIS接觸式圖像傳感器3種,光電倍增管是3種感光元件中性能最好的。④掃描幅面:掃描儀的幅面規格一般有A4、A4加長、A3、A1等。建議配置兩臺不同規格的掃描儀,A4幅面的掃描報告及附表、附件類,A1幅面的掃描圖紙類。
1.2 軟件
(1)Photoshop。Photoshop是對掃描的圖像格式的文件進行處理的軟件,掃描后的圖像在經過Photoshop裁剪、修飾、旋轉、銳化照片以及去除掃描時產生的暗邊等處理后才能存檔。
(2)OCR文字識別。掃描的報告類資料是圖片格式,資料二次利用不方便,需將其轉換成可編輯的文檔。靠手工錄入比較費時,可安裝OCR文字識別類軟件。OCR軟件的應用對文字資料的整理非常方便,替代了人工鍵入文字的工作,大大縮短了錄入時間,減輕了勞動強度,節省了人力且降低了費用,提高了錄入正確率、工作效率和現代辦公自動化程度。選擇OCR文字識別類軟件時注意其是否能夠識別各種印刷體、手寫體、表格以及能否識別中英文混排等因素。
(3)MapGIS圖形處理軟件。MapGIS是中國地質大學武漢中地信息工程有限公司開發的地理信息系統平臺,廣泛適用于地質、礦產、地理、測繪、城建、土地管理、水利、交通等領域。與傳統制圖相比較,MapGIS具有成圖周期短、速度快、精度高等特點,工作效率高,節省人力。成圖后,對于地形地質圖的二次開發利用作用明顯,在單一的地形地質圖上添加不同的專業內容,如添加地質、物探、水文要素,可以生成各種專題地圖,應用廣泛。
(4)AutoCAD圖形處理軟件。AutoCAD是由美國Autodesk 公司開發的通用計算機輔助設計軟件,能夠繪制二維圖形與三維圖形、標注尺寸、渲染圖形以及打印輸出圖紙,目前已廣泛應用于機械、建筑、土木工程、冶金、地質、氣象、紡織、輕工、商業等領域。
工程勘察領域的圖件資料多使用AutoCAD進行矢量化。
2 電子化工作
2.1 一般紙質檔案資料的電子化
一般紙質檔案資料指文書檔案、報告及其附表、附件等無大型圖件的資料,該類資料內容多為文字。該類資料的電子化先選擇適合檔案資料篇幅的掃描儀進行掃描,掃描時統一編號、命名,保存時選擇JPEG格式存檔。掃描后使用Photoshop進行修飾及去除暗邊等處理后才能存檔。對成果報告類檔案資料,除存檔圖片格式外,還應將其使用OCR文字識別類軟件進行處理,將其轉錄成可編輯的文檔類資料,以便日后資料二次開發利用。
2.2 圖件的電子化
地形地質圖等圖件類檔案資料在掃描儀掃描后還應進行矢量化。
2.2.1 地形地質圖的矢量化
(1)掃描。地形地質圖掃描時比例不能縮放,保存時選擇Tiff柵格格式,掃描后使用Photoshop進行修飾,調整水平。
(2)標準/非標準分幅的影像校正。由于原圖圖紙變形和掃描時存在一定的系統誤差,在掃描后應進行圖形校正,消除輸入圖形的變形,校正后的圖形可直接在圖上讀取實際坐標。
(3)矢量化。按照國標的圖例,對圖件進行矢量化,將矢量數據分別存入到點文件(*.WT)、線文件(*.WL)和面文件(*.WP)中。在開始矢量化前,可先建立圖例庫,矢量化時更加快捷;矢量化時一定要先建好圖層,將不同的圖形實體存放在不同的圖層上,為以后的利用提供方便。
2.2.2 工程圖件的矢量化
因工程領域圖件處理多使用AutoCAD,所以工程圖件使用AutoCAD進行矢量化,方法步驟與地形地質圖類似,在此不贅述。
3 電子檔案資料后期處理工作
電子化的檔案資料為方便管理及二次開發利用,應對其進行分類、建庫、建檔。
3.1 分類
一般性檔案資料按成果資料、原始資料、實物資料進行分類;地形圖的電子化管理應對地形圖按圖幅進行分類;地質圖等專題圖件可按專題分類或按礦區分類。分類的好處一是避免不同檔案工作人員重復矢量化;二是方便資料提取,查閱。
3.2 建庫
掃描及電子化處理后的檔案資料多而亂,為方便管理,應按檔案號進行建庫,并及時加載進地質資料管理系統,方便檔案資料查詢和利用。
3.3 建檔
對分類好并建庫的檔案資料,按題名建立檔案目錄,避免不同時期、不同檔案工作人員重復工作,也可方便技術人員搜索、查閱、利用。
4 結 語
檔案資料的電子化工作看似簡單,但是要做好這項工作,就需要掌握電子化工作的方法及上述軟件的使用技巧。做好檔案資料的二次開發利用,除做好檔案資料的電子化工作,還需要做好電子化檔案資料的管理。