許 瓊
(昆明冶金高等專科學校圖書館,云南 昆明 650033)
在現代社會中,人類已經進入了數字化時代,計算機數字技術對社會生活的各個領域都產生了革命性的影響。為此,同屬圖書館領域的古籍也不可避免地受到影響[1]。在數字社會里,古籍整理已經不能再拘泥于傳統的方式與方法,必須有所創新。這是數字化社會賦予圖書館工作者、古籍整理工作者的歷史使命,也是為古籍整理工作和歷史學研究注入新生機和新活力的必然[2]。
中國古籍是我國歷代保存下來的歷史文化瑰寶。它既反映了我國在人類社會發展進程中的歷史地位和作用,同時所蘊含的中華民族特有的精神價值、思維方式和想像力、創造力,也是中華文明綿延數千年,一脈相承的歷史見證[3]。古籍數字化是指利用現代信息技術對古籍文獻進行加工處理,使其轉化為電子數據形式,通過光盤、網絡等介質保存和傳播[4]。我國古籍數字化經歷了數據庫版、光盤版、網絡版3個建設階段。數據庫版古籍包括書目數據庫和全文數據庫兩種形式;光盤版古籍一般有圖像版、全文版和圖文版3種類型;網絡版古籍主要是將數字化的古籍資源在網絡上有償或無償發布,供互聯網用戶使用,這是目前古籍數字化的主要目標[5]。
古籍是我國科技文化與歷史文化的寶貴資源。因此,圖書館保護好有限且珍貴的古籍是我們的重要職責。盡管我國在古籍保護方面投入了巨大的人力和物力,但是古籍保護的任務仍然十分艱巨。我們知道,古籍屬于非再生性的文化遺產,隨著時間的推移,在數量上將會不斷減少,而開展數字環境下的古籍數字服務是解決這一問題的有效途徑。
在數字環境下開展古籍數字化服務必須依托古籍數據庫。就古籍書目數據庫而言,傳統的古籍目錄只能按照書名、責任者、分類等途徑進行檢索。數字化的古籍書目數據庫著錄的書目則甚為廣泛,還可提供多種途徑檢索和資源鏈接,可以實現多種條件的組配檢索。同時古籍書目數據庫為開發利用古籍提供了快捷準確的途徑[6]。
由于數字化資源都具有快捷檢索和交互流通的特點,古籍數字化資源的出現將徹底改變以前查找資料需要逐本翻閱大量書刊的狀態。當前科學研究和弘揚中華文化對數字化古籍的需求非常大,開展數字環境下的古籍服務將極大地改善廣大科學研究人員的科研環境,有利于提高科學研究水平。
2.1 古籍數字化打破了以往在古籍整理中給古籍圈定的范圍,原來不屬于古籍范疇的甲骨文、金文、遼文等都成為古籍數字化的對象,這是對古籍整理傳統觀念的突破,更符合現代社會科學研究的需要。不過目前就連紙質古典文獻的大規模錄入問題也只能說是有所突破,并沒有完全解決。多種古典文獻的數字提取和錄入尚處于起步階段[7]。
2.2 大多數古籍數字化產品都實現了任意字、詞和字符串的檢索,一些較好的則實現了按條件檢索。有的檢索系統實現了在檢索時簡繁互換等關聯,但同古籍數字化實際要求達到的檢索性能相比,還有相當大的差距。使用這樣的檢索系統檢索出的結果中夾雜著大量不符合要求的數據,而一些不是檢索詞但是符合要求的數據卻沒有檢索出來[8]。
2.3 目前的古籍數字化產品僅僅是基本實現了古籍載體的轉換和全文檢索功能等,這只是所有數字化文獻具有的普遍特點,并不是古籍數字化產品的特色。在解決使用計算機數字技術表現古籍特征這一問題上,把古籍的特點與數字技術結合起來,是古籍數字化下一步工作的重點和難點,是一項極為復雜和困難的工作。
2.4 古籍整理軟件的數量和種類都很少,缺乏通用性,更沒有形成一個集成的古籍整理平臺。目前的古籍整理軟件基本上都是首先將掃描圖像與原稿進行校對的校對系統,及對古籍文本圖像進行文字切分的數字化處理系統。它們還不是通用軟件,僅適用于當前的古籍數字化項目。
構建內部局域網自動化管理系統,實現文獻的數字化制作、編輯、流通與利用自動化,是網絡信息服務的平臺。當前我國基于網絡平臺的古籍信息服務比較多,我們綜合考慮到現有自動化系統水平、數據標準化和運行穩定性,認為清華同方的TPI數字圖書館系統功能較強。使用其中的數字加工子系統和內部管理發布系統,可以集多種功能于一體,完成古籍數字化的建庫、掃描、圖像處理、生成電子書、建立導航系統、古籍網上發布與瀏覽等功能。同時對于存儲容量500頁以上的古籍,如果全文放在網上,下載速度非常慢,而系統提供了在線瀏覽功能,讀者可以進行在線瀏覽,傳輸速度非常理想。
針對館藏資源數字化問題,可以綜合比較多個公司的數字化解決方案,其中,北京萬方公司的數字化系統由于采用了國際標準的數字格式和無損壓縮格式,同時支持GIF、JPG、PNG、MP3等圖形格式,描述數字資源的元數據采用了國際通用標準,為將來數據開放、交換和系統升級提供了廣闊的環境;數字化加工的差錯率低于萬分之五,且加工成本較低,因此,可以采用北京萬方公司的系統實現館藏資源的數字化。
由于數字化館藏資源的存儲、組織以及全文檢索等問題是相互聯系的,因此,在確定古籍資源數字化整合建設方案時,應該進行統一考慮。國內目前適合中文數字全文檢索的軟件系統也有多個,其中,易寶公司的TRS系統功能強大,可實現多庫并行檢索,內置1萬多條智能檢索規則,輸出格式靈活,能夠把PS數據轉換成HTML、XML、PDF以及用戶自定義模式,完全滿足了用戶Web下載的要求。為此考慮到二次開發的易用性和通用性,我們建議可以考慮采用易寶的TRS系統作為數字館藏文獻的存儲、組織和全文檢索的基礎數字平臺。
當前我國很多大學的圖書館數字中心在互聯網上建成了初具規模的網站系統,數字用戶以高速寬帶接入方式建立二級網站,因此,具備了數字化共享與發布的基礎平臺。在內部數字管理系統的劃分與銜接上,設計了先進的數字結構并引入了相關的數字設施,成功實現了二者的有效安全連接。
按照我國頒布的著作權與知識產權法的要求,對數字化古籍應區別情況分類管理。首先對于無知識產權作品和已進入公有領域的作品,數字化加工后可以自由使用。其次對于他人擁有知識產權的來源作品經數字化加工后,可利用合理使用制度,在公益條件下,讀者可以為教學和科研的需要自由閱讀,不過要防止非法復制。第三,對于當前普遍具備原創性的數據庫作為版權法的編輯作品加以保護,信息資源數字化整合建設中形成的二次和三次文獻數據庫,具備自主知識產權。第四,對于購買的各類電子文獻數據庫,作者和出版社享有知識產權,可使用數字版權保護技術。當前北大方正的Apabi數據圖書館支持軟件Apabi-library,該軟件使用數字版權保護技術,實現了網上管理、讀者注冊、檢索與閱讀,妥善地解決了數字版權的保護問題。
我們認為,圖書館古籍數字化交流模式的發展趨勢有以下幾個方面:按數字圖書館模式對古籍數字化進行組織,建立古籍整理的自動完成集成系統,檢索系統和支持系統研究將成為重點,國家對數字化古籍資源進行整體規劃,加大資金投入力度,人才培養勢在必行,古籍數字化項目的國際性合作將是未來發展的目標。
總之,圖書館古籍的數字化交流模式構建是一項系統工程,筆者還沒有涉及到具體的設施、硬件設備和技術問題。但是隨著計算機技術與數字技術的發展,圖書館古籍的數字化交流模式將被越來越多的人接受,對于圖書館古籍的數字化需求也將越來越深化,數字化服務的系統化、規模化必將成為圖書館古籍數字化服務發展的趨向。
[1] 李玉梅,遲偉凡.略論我國大學與科研單位館藏建設的基本特點及成因[J].圖書館論壇,2006(2):147-149.
[2] 李勇,閔維方.論大學與科研單位的特征[J].教育研究,2004(1):61-64.
[3] 汪肇兵.個性化智能數字檢索的設計與實現[J].計算機工程與應用,2009(11):62-64.
[4] 孔燕.數字時代高校圖書館用戶需求及服務研究[J].大學圖書情報學刊,2010(1):39-42.
[5] 吳葉葵.數字圖書館中面向用戶數字服務的組織[J].情報理論與實踐,2008(4):21-28.
[6] 金更達.數字圖書館模式探討[J].圖書館建設,2008(2):54-56.
[7] 杜文巒.數字圖書館數字個性化定制服務現狀分析[J].情報資料工作,2010(1):112-114.
[8] 陳晶.從用戶的可用性角度看數字環境下圖書館數字資源建設[J].情報資料工作,2002(1):56-58.