[摘要]古籍數字化已經成為 21 世紀古籍整理的主流,代表著未來古籍整理、開發、利用的發展方向。目前,古籍數字化還需要注意和改進的方面有:統一標準,專業人才培養,數字化前的整理工作,古籍數字化深度開發,數字化產品聯合研發,數字資源的共享,數字化產品立法,古籍普本的開發。
[關鍵詞]圖書情報學;古籍;數字化
[中圖分類號]G250.76 [文獻標識碼]A [文章編號]1005-3115(2012)22-0101-02
古籍是指產生于1911年以前,記載中國古代傳統文化、具有中國古典裝幀形式的典籍。古籍是不可再生的文物,在長期的流通使用中,一些古籍紙張已經變質、變脆,不能再繼續流傳閱讀。特別是一些孤本、珍本,更需要珍藏。由此,古籍收藏單位采取各種措施加以保護,其中古籍數字化是最理想的使用方式,可減少對古籍原本的直接使用,便于長期保存,還可使古籍資源得以有效的開發、利用。
在以紙本文獻為主要文獻類型的時期,我國的古籍工作者主要從目錄、校勘、版本等方面入手,對古籍進行系統的整理。讀者主要依據書目卡片檢索和傳統查閱方式查閱古籍。隨著計算機技術和網絡技術的推廣,利用新興技術手段開展古籍整理,實現古籍數字化,已成為古籍管理和利用的新方式。2007 年3月,國務院辦公廳發布《關于進一步加強古籍保護工作的意見》,提出要“建立中華古籍聯合目錄、古籍數字資源庫……進一步加強古籍的整理、出版和研究利用,特別是應用現代技術加強古籍數字化和縮微工作,建設中華古籍保護網。”①《意見》極大地推動了圖書館古籍數字化事業。因此,古籍數字化已經成為 21 世紀古籍整理的主流,代表著未來古籍整理、開發、利用的發展方向。
潘德利先生在《中國古籍數字化進程和展望》一文中對古籍數字化定義為“采用計算機技術對古籍文獻進行加工、處理,制成古籍文獻書目數據庫和古籍全文數據庫,用以揭示古籍文獻中所蘊涵的極其豐富的信息資源,為古籍的開發利用奠定良好的基礎”。②定義認定了古籍數字化采用計算機技術對古籍文獻加工處理,使古籍原典在計算機上實現瀏覽、檢索、利用,從而揭示文獻資源,為讀者提供便利。主要采用古籍文獻書目數據庫和古籍全文數據庫兩種方式進行。其中,古籍書目數據庫反映的是古籍的外在特征和基本文獻信息,如書名、作者、版本年代、行款尺寸等,便于讀者查找和圖書館古籍管理。全文檢索數據庫將古籍資源全文錄入,轉化為電子文本,供用戶查閱,提供了一種以字符為主要處理對象,根據資料內容而不是外在特征來實現檢索的先進查詢手段。
當前,數字化古籍按載體形式可分磁盤資源和網絡資源兩大種。現有的磁盤版古籍一般有三種類型:一是圖像版,它是將古籍直接以圖像格式掃描存儲。如《中國基本古籍庫》,該數據庫以 DVD—ROM 為載體,全套光盤庫總計全文 20 億字,版本圖像 2000 萬頁,其中近 2000 種為世人罕見的孤本和珍本,具有極高的學術價值和收藏價值。二是全文版,它存儲的不再是圖像,而是數字化的古籍文本,是真正意義上的數字化圖書,可實現全文檢索和查找。三是圖文版,它在古籍書頁圖像存儲的基礎上,將書中具有檢索意義的內容數字化,并輔以數字化的電子工具書,為讀者提供快捷有效的檢索、統計、整理和編輯功能。《中國方志庫》收錄中國方志 8000 種。每種方志均制成全文文本和原版圖像,總計全文超過 30 億字,圖像超過 3000 萬頁。可從區域、條目、全文三條路徑進行全方位的檢索。
隨著網絡技術的迅速發展和普及,古籍資源的網絡化也成為一種趨勢。它主要是將數字化的古籍資源在網絡上有償或無償地發布,供互聯網用戶使用。例如,北京大學圖書館古文獻資源庫(http://rbdl.calis.edu.cn/index.htm )是在北京大學圖書館館藏善本古籍、普通古籍,以及金石拓片、輿圖、契約等特藏文獻的基礎上進行相關的數字化加工而建設起來的,它包括古文獻目錄、圖像、全文數據庫,古籍、拓片、輿圖等文獻資源的系列著錄系統,是提供給最終用戶使用的檢索平臺。
古籍數字化減少了珍貴古籍的紙本流通,有效保護了珍貴古籍,方便圖書館工作人員對古籍的科學管理。古籍數字化還可使讀者有效檢索、利用古籍資源,幫助學者排除冗余信息的干擾。可以肯定地說,古籍數字化改變了學者查閱古籍文獻的方式。他們可以利用文獻機構的古籍文獻數據庫進行查詢、閱讀,可以隨時隨地查閱互聯網上豐富的資源,這種閱讀方式具有劃時代的意義,它必然帶來學術研究方法和方式的進步,進而推動科學研究的發展。
然而,在古籍數字化研發和使用過程中也出現了一些問題,值得我們關注,如古籍數字化標準不一,人才缺乏,數字化產品質量參差不齊,缺乏深層次開發產品,缺乏公益性古籍數字化產品,盜版猖獗,直接影響古籍整理數字化的快速發展。為了促進古籍數字化科學有序地進行,也為了滿足廣大讀者的需要,廣大古籍工作者或研發機構要認真總結經驗,統一認識,取長補短,為社會廣大讀者提供優秀的高質量的數字化產品。根據目前古籍數字化工作中出現的問題,筆者認為應該從以下幾方面推動工作的開展,以滿足社會的需要。
第一,統一標準。如著錄條例、數據庫格式、編目軟件使用字庫等,以保證數據庫的質量和查詢服務效果,為讀者提供一個共享古籍文獻的統一平臺。
第二,培養新型的古籍整理研究人員。古籍數字化需要的人才不僅要掌握中國古籍文獻的分類、版本鑒定、編目,還要會編制數據庫,懂得計算機網絡、多媒體等現代技術,能開展研究和開發工作,這是古籍數字化需要解決的問題之一。
第三,做好古籍數字化前的整理工作。整理是古籍數字化工作前的重要環節,整理工作的好壞決定了數字化產品內容質量的優劣。整理首先要在古籍數字化選題上狠下功夫,盡量收集到有關的不同版本,在比較研究的基礎上選擇最優版本。對嚴重破損的圖書,先修復再進行數字化。校勘是古籍數字化前一項重要工作。校勘的目的是為了有效地消除訛誤,方便閱讀。要考慮古籍讀者群中專家學者注重原始文本的閱讀,對版本有一定的要求,就應該采用圖像掃描的方式保持原件本來面目,充分體現古籍善本的文物價值和文獻價值。最好能提供文本和圖像兩套內容,前者實現全文檢索和語詞統計的功能,后者可提供讀者瀏覽古籍的原貌。電子版校對可采用多文本交互的方法,對同一個版本的書籍,可以采用兩人或多人同時輸入,避免一些低級的輸入錯誤,最后的文本應由專業人士校對,確保數字化產品的質量,將最優秀的數字化產品展現給讀者。
第四,古籍數字化深度開發,滿足多層次研究者的需要。古籍數字化的目的和作用不僅是保存與普及傳統文化,同時還應為學術研究服務,為研究者提供更深層次的服務。一些研究者提出,今后的古籍數字化開發“應設法努力在各個統計知識庫之間建立更密切的關聯,以便于研究者將各種統計結果相互結合、參照、對比,獲得更大的思考和研究空間”。③在古籍文獻的不同版本之間建立起聯系,“包括數字圖像版與文本版、不同文本版之間的對照和切換,以便對照和互補互證”。④建立強大的以全文檢索為基礎構造的智能化檢索系統,“實現包括條件檢索、邏輯檢索、模糊檢索、組配檢索、屬性檢索等多種類型的檢索”。⑤使數字化古籍豐富多樣,更符合學術研究需要的功能,從而支持甚至引導更深層次的研究。
第五,古籍數字化產品聯合研發。古籍數字化是一項艱巨而復雜的工程,為建立起一個和諧的古籍資源庫,應該走社會化協同合作之路,即收藏者、投資者、高科技企業、出版單位,多家參與聯合共研共建,收益分享,為加快高質量、高水平、高速度的古籍信息資源數字化建設進行協作。
第六,做好古籍數字資源的共享。目前,古籍數字化資源雖然數量不少,但絕大多數為付費產品,限制了古籍數字化資源的利用。為了宣傳中國傳統文化,筆者認為:首先,應建立公益性的中國古籍基本讀物網。⑥這個網站可由政府投入,將中國最精華的古籍讀本放上去,并實行免費開放、檢索和下載。國學網開發的《國學備覽》,通過光盤這一載體,提供上千萬字的古籍電子讀物。這類公益性網站的建立,技術和資金上都應由政府提供。其次,建立注冊式研究性局域網實現資源共享。這種共享包括書目的共享、文獻的共享和研究成果的共享。如中國國家數字圖書館(http://www.nlc.gov.cn/service/guancang/gujishanben.htm),在導航區點擊“善本古籍”,可檢索其館藏的27萬種古籍中的善本;北京大學數字圖書館古文獻資源庫(http://rbdl.cal is.edu.cn/pages/In-struction.htm),收錄北京大學圖書館古籍約150萬冊,其中善本近20萬冊;其他如中國人民大學圖書館普通線裝古籍書目數據庫,上海圖書館古籍書目查詢,天津圖書館館藏古籍善本圖錄,北京師范大學、復旦大學、吉林大學圖書館等,均有古籍書目可查詢,供讀者或研究者共享。
第七,為古籍整理數字化專門立法,杜絕盜版作品,有效地保護古籍整理數字化的合法權益,以保證古籍整理數字化的順利進行。
第八,古籍普本有待開發。目前的古籍數字化開發集中在古籍珍本、善本上,而占古籍總數絕大部分的普通古籍卻乏人問津。古籍數字化開發應該實行全部古籍數字化,把所有古籍最終納入數字化系列中,為社會使用,最大程度地弘揚中國傳統文化。將古籍信息數字化、網絡化,做到資源的共知、共建和共享。
[注釋]
①白瀛、周瑋:《國務院辦公廳發布古籍保護方案并統籌實施》,《人民日報》,2007年3月2日。
②潘德利:《中國古籍數字化進程和展望》,《圖書情報工作》,2002年第7期。
③④⑤徐清等:《古籍數字化資源的深度開發》,《圖書情報工作》,2007年第3期。
⑥劉明華:《古籍數字化與文化共享》,《西南大學學報》(社會科學版) ,2008年第11期。