柏晗 陸玉瑩
[摘 要]隨著網絡技術的飛速發展,圖書文獻資源服務的數字化、網絡化需求越來越強烈。為了適應這種需求,在分析南京水利科學研究館藏資源的現狀和讀者需求的基礎上,提出了在數字圖書館建設方面應采取的初步策略,以此開展館藏特色資源的數字化建設和研究。
[關鍵詞]數字圖書館;數字化;文獻信息;數據庫
doi:10.3969/j.issn.1673 - 0194.2018.22.072
[中圖分類號]G250.76 [文獻標識碼]A [文章編號]1673-0194(2018)22-0-03
南京水利科學研究院自1935年建院以來,累積了大量的科研成果報告和20世紀的珍貴水利資料,都是獨具特色的寶貴文獻資料。這些紙質資源由于存放時間長,加上紙張質量、印刷及庫存條件等因素,急需進行保護性處理,否則將會造成難以彌補的損失。同時,隨著信息化網絡化技術的快速發展,為了方便廣大科研人員通過網絡環境快速查詢下載所需文獻資源,為此需要集中力量進行數字化建設,從而有效地保護和利用這些寶貴的文獻資源。
1 數字圖書館建設的需求
南京水利科學研究院信息中心是建館80余年的專業圖書館,從建院之初已經存在,館內收藏了大量寶貴的文獻資料,其中不單包含大量的建國早期乃至清末、民國時期的珍貴水利資料,還保存了從建院之初到現在的所有紙質科研成果報告,但由于各方面的原因,館藏文獻資源的數字化程度較低。為了加快館藏文獻資源電子化、數字化建設的步伐,同時也為了更好地保存這些特色文獻資源,需要對這些寶貴的紙質文獻進行保護性的搶救處理,并建設獨具特色的全文數據庫,為科研及水利水電、水運交通行業的生產建設提供更好的服務,這也是建設數字化圖書館的必然要求。
2 現階段的研究內容
數字圖書館的理念是20世紀90年代美國最先提出的,在建設發展的過程中,特色文獻的數字化建設以自身的優勢,開始引起各國重視,我國也在進行這方面的建設和研究。基于特色文獻數字化所具有的整體優勢,南京水利科學研究院的數字化圖書館建設也以特色文獻的數字化為突破口,其中圖書館的特色之一就是館藏科研成果報告。
在館藏科研成果數字化建設方面,根據南京水利科學研究院圖書館的管理運作現狀及考慮到讀者需求,計劃分為3個階段進行。現階段主要對1990-2009年產生的紙質科研成果報告進行數字化處理并建設相應的數據庫。主要研究內容包含四點:①數字化建設過程中的控制和管理研究,確定過程控制的流程和管理要求;②數字化建設的規范和標準問題研究,確定掃描方式、色彩模式、分辨率、質量標準、圖像存儲格式和命名原則等相關內容;③檢索庫的建設和數據掛接問題研究,確定檢索庫數據格式和驗收標準;④數字化資源的管理、存儲和提供服務方式的研究,建立特色資源數據庫發布系統。
2.1 數字化建設過程的控制和管理研究
南京水利科學研究院館藏科研成果全部集中在密集書庫管理,每項成果入庫時都有2~4本復本,按1~4編號,在書庫里是分部門按年份以及成果編號的順序存放,因此,通過分析紙質文獻資源的借還方式和規律,確定了數字化建設過程中的控制方法。
在不影響讀者正常借閱的基礎上,利用類似于讀者借還的方式,工作人員通過已建立的館藏書目數據庫進行檢索,導出所需數字化建設資料的清單,按照清單在書庫對應區域查找并取復本編號靠前的一本,并在清單上記錄相應編號;并通過流通處進行核對、登記、借出等手續,最后在移交清單上簽字。在文獻資源掃描完成后,再次利用讀者借還方式,將之前清單上的文獻資料通過流通部辦理歸還手續,并再次在移交清單上簽字確認。
資料掃描前,好需要先了解資料本身的清晰度、完整度等,根據需要確定是否需要拆解,如何拆解并復原,還需要確認是否含有超大圖紙頁面,確定其掃描及拼接方式,并做好相應的登記工作。
2.2 數字化建設的規范與標準問題研究
很多館藏科研成果由于歷史悠久,會出現各種不同的情況,例如紙張發黃變脆、字跡變淡、插圖清晰度不夠,甚至由于印刷和借閱導致的污漬、年代和印刷技術導致的差異性。如何提高掃描質量和效率成為數字化建設的一個關鍵問題。
2.2.1 數字化建設的規范問題研究
(1)紙質文獻資源管理方面。實物資料的交接需嚴格核對文獻資料清單與實物是否一致,并做好《資料交接記錄》交由管理人員簽字確認,對資料的成果編號、數量、經手人及借還時間進行詳細登記,確保其完整性。
(2)掃描前的拆分整理工作。由于時代原因,導致紙質文獻的裝訂和印刷存在各種問題,對需要拆分掃描的文獻資料需按照原頁碼順序整理,并去除其中可能引起掃描問題的訂書釘等,盡可能提高掃描結果的清晰度。
(3)掃描加工的規范化。掃描人員需要根據實際情況選擇預先設定的模板或重新設定新的參數。同時,由于早年印刷技術、紙張質量及借閱保管不當等導致的各種問題,還應根據需要對掃描所得的圖片進行手動去黑邊、糾正傾斜角度、頁面不顛倒、文件順序不混亂等,以保證掃描所得數字化文獻的整體質量。
(4)掃描過程中紙質資源的保護。按文獻資源的頁碼順序掃描,處理過的資料也需按順序擺放整齊,避免資料出現丟失或缺頁。同時,按規定操作方法進行掃描操作,避免操作不當導致資料文件或掃描設備損壞。
(5)掃描后的整理工作。對于掃描過程中需要拆解的紙質文獻,應按原樣再裝訂還原。
(6)破損文獻資源的管理。資料本身存在破損,或掃描過程中出現了損壞情況,需及時告知流通管理人員,并登記。
2.2.2 數字化建設標準問題研究
在科研成果數字化的過程中,如何保證不同資料掃描所得的數字化文件的清晰度和存儲大小的平衡,既能保證圖像的清晰度完整度,又能有效利用存儲空間,方便數字化資源的網絡傳輸和利用,在經過大量掃描和反復修改實踐的基礎上,終于確定了下列標準。
掃描方式標準:①按文獻標明的頁碼順序掃描;②對于同一份文獻資料或同一頁面內存在不同清晰度的內容,特別是早期文獻資料存在鉛筆、鋼筆、圓珠筆同時使用的,以主要部分的清晰度為準,也可以根據不同清晰度一頁多掃;③對于紙張質量差、容易破損的,應使用平板掃描,禁止使用滾筒掃描;④掃描圖像應該包括文件上的頁眉、頁腳、頁碼等所有相關標記,以確保文獻的完整性;⑤合成掃描文件時,應使用原文獻名稱命名,章節名也需如此,同一篇文獻的全文文件和各章節文件應存于同一個子目錄。
參數設置標準:在實際掃描過程中,因為個人的操作的差異和不同掃描設備之間存在差異,導致掃描的結果也會出現差異,經過大量的比對最終確定了主要參數標準,如表1所示。
圖像質量標準:在對掃描完成的圖像進行比對之后,確定了以下標準。①圖像文件最大傾斜角度不得大于0.5o。②掃描所得圖像文件必須是A3、A4、B4的標準尺寸(附件圖表除外)。③確保圖像文件的長寬比一致。④清理圖像文件中存在的污點,確保污點量不超過50%。⑤確保整體清晰度不低于原紙質文獻,圖像準確率100%,圖像文件格式為tiff和雙層PDF格式。
2.3 數字化文獻資料管理系統檢索庫建設和數據掛接問題研究
南京水利科學研究院館藏科研成果報告本身包含多種信息,為了使數字化后的文獻資料便于查找和應用,需要重新設計檢索庫。
2.3.1 檢索庫數據格式
通過長期從事科研成果編目工作,發現成果報告主要包含26個信息點,其中由于項目類別和要求的差異,所含信息也有不同,通過比對分析最終確定檢索庫的每個字段數據格式如表2所示。
2.3.2 檢索庫的數據錄入
為了便于錄入數據,在數字化掃描的最后要生成雙層PDF文件,用于識別文字信息,從而便于識別出檢索庫各數據化文獻對應信息源的信息,準確快速地錄入檢索數據。所以,檢索庫的建設過程與數字化掃描可同步完成。
2.3.3 檢索庫數據掛接問題研究
為了解決數據掛接的問題,需要先確定命名規則,以便于數據批量掛接,同時也便于讀者下載時辨別所需文獻內容。根據研究確定了以下兩條:①每篇成果全文為“1.0”+“報告名稱”;②每章節為“1.”+“章節序號”+“章節名稱”。
2.3.4 檢索庫驗收標準
在完成檢索庫錄入和全文數據掛接之后,還需要通過驗收才能提供讀者使用。這里可以直接利用檢索窗查詢的方式查看所查文獻資料是否正確,數據是否完整,鏈接全文是否能正常閱讀和下載。
2.4 數字化資料的管理、存儲和服務方式
2.4.1 數字化資源的管理
在文獻資料數字化后主要生成tiff和雙層PDF兩種格式的文件,其中對數字化資源管理是以tiff文件按報告建立目錄,而雙層PDF文件則作為數據庫的備份進行管理。
2.4.2 數字化資源的存儲
由于數字化的文獻資源是按兩種格式進行管理的,因此存儲也是一樣,tiff文件直接存儲在機房的存儲設備上,而PDF文件則存儲于服務器上,并由系統進行定期備份,以確保數字化資源的安全。
2.4.3 數字化資源的使用
根據我國數字圖書館建設的實際情況,加上“十三五”時期國家重點突出了網絡信息安全保障能力建設,而現階段數字化的文獻資源主體為南京水利科學研究院獨具特色的成果報告,因此,瀏覽和下載是需要受限的,根據讀者的不同設置不同的權限,有的只能查看,有的可以下載本部門的文獻,有的則可以瀏覽和下載全部文獻。
3 結 語
進入21世紀以來,隨著移動數字平臺飛速發展,信息交流的速度大幅提高,人們可以隨時隨地獲取想要的信息資源,為工作和娛樂帶來了很多便利。但帶來便利的同時也帶來的各種挑戰,那就是如何才能更好地滿足大眾對信息資源的需求,如何才能更快速地為人們提供更迅捷和準確的數據資源,最終促進各行各業的信息化發展,而數字圖書館在其中占據主導地位。
如何建立擁有自身特色的文獻資源數據庫,將館藏核心文獻及特色文獻資源轉化為數字信息,實現網絡傳播、信息共享,建立一個包羅萬象的信息倉儲,并通過網絡為用戶提供更高效便捷的信息獲取途徑,是各圖書館、信息中心等信息機構未來必須擔負的重任。本文的研究成果為南京水利科學研究院館藏特色文獻資源的數字化建設積累了寶貴的經驗,能夠為以后的數字化建設工作以及其他圖書館在數字化建設方面的交流提供有力的支撐,為今后逐步實現真正意義的數字化圖書館奠定了基礎。
主要參考文獻
[1]湯紅娟.中共黨史文獻資料數字化建設研究[J].江漢大學學報:社會科學版,2011(5).
[2]張秋.新疆少數民族特色文獻數字化構建研究[J].現代情報,2009(8).
[3]蔡屛.圖書館文獻資源數字化立項論證工作研究[J].圖書館論壇,2012(1).
[4]龔麗瑛.企業檔案數字化研究文獻綜述[J].辦公自動化雜志,2012(6).
[5]蘇云,張慶來.面向海量文獻的數字化系統研究[J].圖書與情報,2010(2).