鐘伶

摘要:選擇香港8所公立大學,通過網絡訪問、文獻調研的方式調查高校古籍特色資源建設與共享現狀,總結香港高校特色數據庫建設與共享方面的特點,以期為今后古籍特色庫建設及共享提供建議。
關鍵詞:古籍特色庫;香港;高校圖書館;共享
中圖分類號:R2-5 文獻標識碼:A 文章編號:2095-5707(2016)03-0006-05
古籍是研究古代政治、文化、經濟的一手資料,極具收藏與學術研究價值。據2003年《香港所藏古籍書目》記載,香港中文大學、香港大學、香港浸會大學、香港科技大學、香港城市大學、香港理工大學等11家高校圖書館所收藏的1911年(含1911年)以前寫、抄、刻、印之各類中文古籍有7368種,叢書子目達18718種。為擴大珍貴古籍的利用,各高校先后開始了古籍數字化工作,建立了一批古籍的特色資源庫,并在建設與共享方面有著自己的特色。
本研究選擇香港8所公立大學,通過網絡遠程訪問各所高校的圖書館或古籍研究機構的網站,收集、整理各高校建立的古籍特色庫目錄、可訪問及共享情況、特色庫內容,以及各個特色庫的建設與發展歷程:同時通過文獻調研方式,收集并參考有關香港高校古籍特色庫建設方面的各類文獻,包括圖書、期刊論文、會議論文、會議演示文檔、新聞報道等,對古籍特色資源建設與共享現狀進行調研,以期為今后古籍特色庫建設及共享提供建議。
1.8所高校古籍特色庫建設現狀
本研究中的香港8所公立大學包括香港城市大學、香港浸會大學、嶺南大學、香港中文大學、香港教育學院、香港理工大學、香港科技大學、香港大學。除香港教育學院、香港理工大學以外,其他6所高校均對古籍進行了數字化,并逐步建立古籍特色庫。其中以香港中文大學、香港科技大學、香港大學等建設的古籍特色庫最為豐富,見表1。
2.香港高校古籍特色庫特點分析
2.1統籌規劃,有計劃進行
古籍的特色庫建設是一項長期而艱巨的工程,包括古籍的清查、整序、數字化、研究與開發等諸多內容。香港幾所高校的古籍數字化工作大多數沒有國家或政府層面的統籌規劃,每個高校的研究機構或圖書館根據單位古籍藏書情況,將古籍特色庫建設作為一項長期的、有計劃的項目來進行,對工作進行長期規劃,分階段制定詳細的工作計劃,頒布細致的工作流程與規范,并及時將工程進展、取得成果對外公布。
如香港科技大學圖書館“About Rare&SpecialeZone”(http://lbezone.ust.hk/rse/about)就是對正在進行與已經完成的古籍特色庫項目建立的專門介紹網頁,介紹古籍特色庫的由來、典藏的范圍與內容,以及項目進展情況等。
2.2古籍范圍寬泛
在中國大陸地區,古籍是指1911年以前(含1911年)在中國書寫或印刷的書籍。而香港由于歷史原因,受西方影響較大,在古籍時間限定上沒有1911年這個時間節點的限制,一般以時間超過100年的資源就作為古籍來處理。香港高校收集古籍的范圍除了中國傳統古籍外,同時也收集了西方出版的一些古典著作,以及日本、韓國的古籍。如香港城市大學圖書館建立了“英國法律特藏”書庫(http://www.cityu.edu.hk/lib/collect/law/englaw/chinese sc.htm.),以收錄1900年以前出版的英國法律珍本書為主,同時也收錄北美、英聯邦國家與法律相關的哲學、社會科學、語言、文學等古籍。香港大學馮平山圖書館收藏的古籍以中文古籍善本、日文古籍為主,是世界著名的東亞文化研究中心。在古籍的類型方面,大陸地區以書為主,而在香港地區的古籍范圍相對寬泛,類型包括多樣,如線裝書、卷軸、甲骨、輿圖、竹簡等,甚至是現代文獻中常見的圖書、期刊、圖片等。
2.3經費來源多元化
古籍特色庫的建設與維護需要花費大量的人力、物力與財力,故經費問題是特色數據庫建設當中不得不考慮的問題。與內地高校特色館藏數字化經費主要來源于政府部門或專門機構等不同,香港高校古籍特色館藏的數字化與特色庫的建立經費來源渠道更為豐富,主要有以下3個來源。
2.3.1自籌 自籌經費是香港高校古籍特色庫建設資金的主要來源,也可見香港各高校對古籍數字化十分重視。如香港浸會大學的“基督教古籍數據庫”,由香港浸會大學圖書館與香港浸會大學校牧處合作建立。
2.3.2政府或行政部門資助 如香港中文大學中國文化研究所建立的“漢達文庫”(http:llwww.cuhk.edu.hk/ics/rccat/database.html)包括多個子庫,不同的子庫其資助來源不同。比如,1994年獲得“大學及理工撥款委員會”資助,建立了“竹簡、帛書出土文獻數據庫”;1996年獲得“香港大學撥款委員會”資助,開展“甲骨文全文數據庫”研究計劃;1999年又得到“香港研究資助局”撥款資助,開展“金文全文數據庫”建設;2000年得到“香港研究資助局”撥款,建立中國古代類書計算機化數據庫。
2.3.3個人資助 例如香港科技大學古籍系列特色庫的主要經費來源于意得集團有限公司高佩璇博士300萬港幣捐款,捐款主要用于修建一個開放的圖書館特藏與大學檔案展覽廳,另外一部分是用于3年內把特藏掃描成高分辨率的數字文檔。
2.4數字化水平高
香港高校對古籍的整理早于20世紀90年代初,但數字化的工作大多在21世紀才開始進行。此時古籍的數字化已經達到一定水平,因此,香港各高校的古籍數字化可借鑒的經驗以及技術比較多,古籍數字化起點較高。各高校建立的古籍特色庫除了瀏覽的功能外,大多可以進行檢索,并且古籍頁面清晰,辨識度高,有利于教學與研究。如香港中文大學中國文化研究所與圖書館合作開發的“漢達文庫”,從1989年創建至今,經歷了20多年,尚在不斷完善當中。其中“甲骨文資料庫”是將7種甲骨要籍中所收錄的甲骨文字重新臨摹,并加校勘、釋文,在窗口系統上,可同時顯示甲骨文字原字形及隸定釋文(隸定古文的目的是讓后人認識和讀懂古文,其做法是以隸書或楷書的筆法來寫古文的字形,或以己釋的局部結構來組合古文整字。它是古文字考釋的前期步驟。隸定古文有時以“釋文”的身份出現,但它與古文并不能一一對應);“金文資料庫”以《殷周金文集成》為素材,分設漢字部首和原形部首2種檢索法,釋文分A、B兩種形式顯示:釋文A依據銘文原來位置,以隸定字對應顯示,方便讀者了解銘文原貌;釋文B以隸定字順序顯示,并加句讀;提供金文原形字和釋文點擊對應顯示;附有金文的時代、出土、現藏、著錄等資料。
2.5元數據規范
自建特色庫最突出的問題之一就是元數據的規范化問題,元數據的規范化、標準化有利于資料特別是數字化古籍資料的交流、整合,以達到最大范圍的共建共享。為了實現文獻資源的共建共享,1967年成立的香港高校圖書館咨詢委員會(JULAC)發起了“中文名稱規范合作計劃”與“中文資料編目共享項目”對中文資料編目進行規范化處理。“中文名稱規范合作計劃”建立了人名、團體名稱、會議名稱、統一題名及叢編題名的統一標準,以及多語種、多腳本的統一數據庫。“中文資料編目共享項目”則建立了CNMARC、CMMARC、LC CJK MARC三者整合的元數據庫,在不改變各成員館編目習慣的基礎上,實現編目數據的共建與共享。同時8所高校使用同樣的圖書管理系統innopac,使館際之間的合作更為方便與容易。
2.6重視共建共享
香港各大學在古籍特色庫建設方面重視與大陸、臺灣、澳門等地區的合作。如聯合目錄建設方面,香港中文大學馮平山圖書館與香港中文大學圖書館均參與了臺灣國立圖書館牽頭建立的“中文古籍書目資料庫”的建設。香港中文大學從2007年開始,參與了“中美百萬冊書數字圖書館合作計劃”(即高等學校中英文圖書數字化國際合作計劃,CADAL),將1923年以前出版的超過3000本西方語言書籍進行數字化,還能分享超過65萬冊民國時期出版的書刊。在全文共享方面,香港城市大學的“漢古籍特藏”、香港浸會大學的“基督教古籍數據庫”等都可從網絡上免費檢索與瀏覽全文。不僅如此,香港高校的古籍特色庫積極在世界各開放獲取知識庫中注冊,以便更大范圍的共享。如香港中文大學的“中國古籍庫”(http://udi.1ib.cuhk.edu.hk/p rojects/chinese-rare-bookdigital-collection/open-access?language=zh-hans)分別在BASE、Directory of Open Access Repositories(OpenDOAR)、OCLC WorldCat OAIster、OpenArchives Initiative、Registry of Open Access Repositories等開放獲取平臺中注冊,供全世界古籍愛好者閱讀與研究。
2.7注重版權問題
對于可以在網絡免費使用的古籍特色庫,香港高校圖書館都對資源使用時的版權作了不同程度的聲明,告知讀者應遵守的相應規定。如香港城市大學圖書館在讀者使用特色庫之前,將其必須遵守的使用條款先呈現出來,讀者只有在接受相關條款后方可使用相關的特色庫,在使用條款中明確規定了使用規范、版權、撤回政策、聲明、聯絡方式等相關內容。香港科技大學圖書館對古籍特色庫的使用條款中則明確規定,古籍特色庫的使用不得用于商業目的或衍生物性工作,如果超出該范圍,需事先提交申請,以便合理合法使用古籍特色庫資源。
3.香港高校古籍特色庫建設與共享的啟示
3.1立足于本館館藏,重視管理與利用
隨著人們對古籍文化價值與經濟價值的了解,古籍作為一種稀有資源,獲取越來越困難,與其花費大量的資金在購買古籍上,不如基于現有館藏,重視其管理與利用,發揮古籍應有的價值。香港各高校的古籍特色庫資源多來源于本館已有的收藏,后期的古籍主要來源于私人捐贈或交換,各高校大多數設立了特藏部,負責保管與數字化處理古籍等特色館藏,以期最大程度使古籍被讀者查詢與利用。相比之下,大陸雖然有不少高校擁有豐富的古籍,但總體來說,數字化程度不高,大多數只能提供書目或提要信息查詢服務,多數不能進行全文瀏覽或全文瀏覽受限,更不能進行全文檢索;還有一些高校的古籍束之高閣,或僅供少數人使用。因而古籍的管理與利用是應該重視的方向。
3.2重視古籍研究及專業人員培養
古籍的數字化與古籍特色庫的建立不是簡單的掃描與電子化過程,而是在研究的基礎上,對古文獻的重新提取與整理。古籍采用文字豎版排列,且無句讀,在錄入與識別時需要古籍處理人員有一定古文獻的知識,才能保存古籍的原貌。另外,古籍對現代人來說內容晦澀難懂,缺漏字現象普通存在,古籍版本眾多,在數字化過程中均需要古籍特色庫建設者對古籍有一定的研究基礎,才能準確反映原作者的思想,保留著作本來風格。因而古籍特色庫的建立需要融入研究成果,才能真正建立起出色的數據庫。香港中文大學的“漢達文庫”“走馬樓三國吳簡,嘉禾吏民田家莉資料庫”等均建立在研究的基礎上,匯集了多方的研究成果,這樣的古籍特色庫使讀者不僅能看到古籍的原文,而且同時能參考研究者的研究成果,更好地了解古籍、學習古籍、利用古籍。另外,古籍特色庫的建設亦要重視專業人員的培養,特別是古籍研究人員與古籍數字化專業人員的培養,使真正懂古籍的專業人員來建立專業的古籍特色庫。
3.3注意古籍特色庫標準建設與應用
古籍特色庫的標準問題一直是困擾古籍共建共享的關鍵基礎性問題。目前,在古籍字符方面,有ISO/IEC 10646標準可以參考,以滿足簡體字、繁體字、異形字及難字的編碼問題;在計算機處理方面有Unicode提供支持,實現計算機跨語言、跨平臺的文本轉換及處理;在元數據方面,國內已經有由中國高等教育文獻保障系統(China Academic Library&Information System,CALIS)制定的《我國數字圖書館標準規范專門數字對象描述元數據規范》,針對具有中國文化特色的文獻資料類型如古籍、拓片、輿圖等,建立元數據格式及其擴展和互操作規則等;在特色數據庫建設方面,CALIS也頒布了一系列的標準規范。但在國內高校中遵循以上標準者僅限于CALIS資助下的系列專題特色庫,其他古籍特色庫建設者無論是著錄格式還是其他方面依然采用各自的標準。另外,在文檔格式、分辨率、文件大小等方面均無統一標準;特色庫建設與管理平臺建設多種多樣。以上問題均可造成古籍特色庫在共建共享中的壁壘,因而需要如CALLS甚至更大范圍、更高規格的統籌與規劃平臺,加強古籍特色庫建設的規劃與管理,為共建共享提供技術層面的保障。
3.4逐步開發,實現全文檢索
從實際應用出發,全文檢索是古籍數字化的核心技術,因為現代人對于古籍的檢索需求大于系統的全書瀏覽模式,故強大的全文檢索系統對于古籍特色庫是必須的。而全文檢索的實現,對特色庫的建設者來說是非常艱巨的挑戰。全文檢索主要采用逐字標引的方式實現,而古籍的繁體字、異體字、通假字、避諱字等形式的存在,無疑使得檢索效果大打折扣。另外,利用掃描儀錄入原文也必須把文字圖像轉換成計算機可讀的字符,檢索功能才能得以發揮,而Unicode定義的漢字也并不能包括現有古籍中的全部字符,使得全文檢索的實現更加難上加難。除此之外,古籍版本眾多,同名異書、同書異名等現象普通存在,地名、人名等也存在這種狀況。如南京,歷史上先后稱為冶城、越城、金陵、建業、建康、應天等;而唐代詩人杜甫,又被稱之為詩圣、杜工部、杜少陵、杜拾遺等。因此,古籍特色庫全文檢索的實現,既要保持古籍原貌的完整,又要實現全文檢索,應該先易后難,逐步開發。另外,加強古籍通用知識支撐系統的建立,如人名、地名、朝代等通用知識,對于實現古籍全文檢索也很重要。
3.5考慮開放荻取
古籍資源是一種不可再生資源,并隨著時間變遷,變得越來越稀少。古籍存在的意義并不是束之高閣或供少數人使用,最大范圍地被人們利用,使古老的文化煥發新的生命力,才是古籍最好的歸宿。要擴大古籍的使用,開放獲取是當今公認最佳的方式之一。由于聯機目錄的廣泛使用,查詢到古籍的書目信息已經不是困難的事情,但全文獲取仍有困難。可喜的是,已有部分高校或研究機構意識到開放獲取對古籍保護與利用的價值,紛紛將館藏古籍建立成古籍特色庫,并在開放獲取注冊平臺上注冊,供全世界古籍研究者和愛好者使用,著名的如“哈佛大學哈佛燕京圖書館藏中文善本古籍特藏”“東京大學東洋文化研究所漢籍影像數據庫”等。今后國內高校古籍特色庫的建立,也應考慮資源的開放獲取,以利于古籍能發揮出更大的價值。