尤建輝
[摘 要]計算機技術的發展為解決出土文獻整理難題提供了全新機遇。短短的二十多年間,國內外利用計算機技術編制了大量的出土文獻數字化資源。雖然數字化整理取得了很大成就,但仍有一些值得思考的問題亟須我們解決。
[關鍵詞]出土文獻;數字化;資料庫
出土文獻的整理是一門技術性、綜合性要求很高的基礎工作,在學界甚受重視。王國維《古史新證》中說:“吾輩生于今日,幸于紙上之材料外更得地下之新材料。由此種材料,我輩固得據以補正紙上之材料,亦得證明古書之某部分全為實錄,即百家不雅馴之言亦不無表示一面之事實?!保?)以“地下之新材料”補充“紙上之材料”,對于資料相對缺乏的先秦兩漢文史哲研究,具有重大作用和重要意義。然而對散佚的簡牘、文書、碑刻等進行的收集工作浩繁,整理研究花費時間長,導致這類“遺產”不被重視人成為“危產”,當前對出土文獻的搶救、保護、整理和研究,有許多亟待解決的問題,[1]出土文獻的數字化整理是解決這一難題最有效的方法。
出土文獻數字化整理就是利用計算機技術,將常見的文字或圖形符號轉化為數字符號的過程。出土文獻數字化以其特有的資源特點必將給出土文獻整理帶來全新的機遇,其重要性和意義在于:一是有利于瀕危出土文獻的搶救和保護;二是出土文獻全文數據庫有利于全方位開發利用出土文獻;三是有利于古籍文獻資源的網絡共享。
一、數字化整理成果(2)
在短短的二十多年間,國內外利用計算機技術編制了大量出土文獻數字化資源。圖書館和研究機構是出土文獻收藏和研究的主要機構,負有對出土文獻的保存、利用和研究的重要職責,因此也是出土文獻數字化資源建設的主要單位。
日本收藏有大量的中文古籍,隨著古籍數字化進程的開展,日本各大科研機構也開始將簡帛文獻數字化,并提供網絡化服務。其中在簡帛文獻數字化資源的開發與建設方面,以早稻田大學和奈良文化財研究所最具成就。(一)早稻田大學文學部工藤研究室開發的“楚簡數據庫”由簡牘資料庫和楚系文字資料庫組成,內容包括楚帛書、鄂君啟節、天星觀楚簡、信陽楚墓竹簡、包山楚簡、郭店楚簡、曾侯乙墓竹簡、望山楚簡等9個地點新出土的帛書和竹簡,具備良好的檢索功能,使用者可選擇特定文本與篇章或全部文獻進行檢索。(二)奈良文化財研究所制作的“web版木簡數據庫”包括木簡數據庫、墨書土器數據庫、文書數據庫、遺跡數據庫等,可提供瀏覽檢索、文字檢索和全文影像閱讀。
港臺地區已開發出許多出土文獻數字化資源,其單位主要為港臺地區的研究機構和部分數字化公司,其中以香港中文大學中國文化研究所和臺灣“中研院”歷史語言研究所最具特色。(一)香港中文大學中國文化研究所古文獻數據庫中心開發制作的“漢達文庫”包括甲骨文資料庫、竹簡帛書資料庫、金文資料庫、先秦兩漢資料庫、魏晉南北朝資料庫、中國傳統類書資料庫及中國古代詞匯資料庫,其中“甲骨文資料庫”收錄當今海內外七種主要大型甲骨書籍,共計卜辭53834片,約近100萬字甲骨卜辭,可同時顯示甲骨文字原字形及隸定釋文,可通過甲骨單字、關聯字串以及句式進行檢索;“竹簡帛書資料庫”收錄十二種竹簡帛書出土文獻,約近140萬字,可同時顯示簡帛圖片和對照釋文,可提供單字、字串及句式檢索文獻,檢索結果可直接列印或存檔。(二)由香港中文大學中國文化研究所與中國社會科學院歷史研究所共同開發的“甲骨文全文資料庫”主要以胡厚宣主持編纂的《甲骨文合集》13冊釋文為底本輸入所收入的四萬余片甲骨上的近百萬字卜辭。(三)香港中文大學圖書館與香港中文大學中國語言及文學系張光裕教授共同制作的“郭店楚簡資料庫”主要為張光裕教授《郭店楚簡研究第一卷文字編》乙書載錄的《老子》《太一生水》《緇衣》《魯穆公問子思》《五行》《尊德義》等十六篇道家及儒家著作,可按竹簡編號、篇目名稱或相關字詞檢索,支持全文檢索,以及于2001年12月新增的“郭店楚簡主要參考論著”檢索系統,可按作者、書/篇目或出處項檢索。(四)臺灣“中研院”歷史語言研究所開發制作的“簡帛金石資料庫”包括先秦至魏晉的簡牘、帛書、碑刻、官印、鏡銘等,收錄60余種簡帛金石資料及研究書目共3401684字的純文字數據,以及居延漢簡補編(共1324簡)等圖文資料,支持布爾運算、多項目查詢、詞組查詢、排除字符及自然語言查詢。(五)臺灣“中研院”歷史語言研究所開發制作的“先秦甲骨金文簡牘詞匯資料庫”分為詞匯檢索與全文檢索,收錄甲骨文、金文和簡牘三種文字材料,依詞類、材質作為搜尋條件,展示詞匯的詞性、時代、書目來源、釋文段落,現階段詞匯共收錄約13萬筆,每個詞匯包括出處、編號、上下文,便于使用者回查與檢閱,幫助理解詞匯意義。
中國大陸地區是簡帛文獻收藏最為豐富的地區,在簡帛文獻數據庫開發建設上雖起步較晚,但仍取得豐碩成果,參與開發建設的單位主要為科研機構和數字化出版企業。(一)華東師范大學中國文字研究與應用中心研制的“戰國楚簡帛文字典型形體檢索系統”收錄的材料范圍包括《包山楚簡》、《長沙子彈庫戰國楚帛書研究》、《郭店楚墓竹簡》、《九店楚簡》、《曾侯乙墓》、《戰國楚竹簡匯編》、《上海博物館藏戰國楚竹書》一、二、三、四、五及《葛陵新蔡楚墓》等材料,目前可提供GBK編碼范圍內通用字頭的檢索。(二)北京時代瀚堂科技有限公司制作的“瀚堂出土文獻庫”含甲骨文、金文、簡帛、印章、錢幣和石刻等分庫,是目前唯一的集成性的中國出土實物文獻數據庫,數據庫圖片清晰,可全文檢索,支持復制、打印功能,并附有聯機字典。此外,國內各大博物館還開通了館藏精品數據庫查詢,如國家博物館館藏精品查詢、故宮博物院館藏精品查詢均可進行甲骨文、銘刻、簡帛、法書、碑帖等圖譜的檢索查詢,并附有圖譜在線功能。
二、數字化整理存在的難題及解決方法
雖然出土文獻數字化整理已取得相當大的成就,仍存在一些亟須解決的問題。第一,由于沒有統一的組織和機構協調出土文獻數字化資源建設,出現了重復建設問題,造成巨大的人力、物力和財力的浪費。第二,由于出土文獻數字化制作的主體和各自的利益訴求不同,制作的數據庫無法兼容。第三,由于資源封閉和利益保護的弊端,給讀者帶來了諸多不便,導致資源無法有效共享。第四,文獻購置和設備購置成為制約出土文獻數字化的兩大難題。第五,人才知識的不全面性難以適應出土文獻數字化。
針對現階段出土文獻數字化建設中存在的問題,需要做好以下幾個方面的工作:第一,建立一套包括數據庫結構、檢索界面、查詢格式、專業用表和組織方式在內的標準體系以適應出土文獻載體多樣、內容廣泛、學科交叉、時間跨度大的特點,有效提高文獻數字化的質量和檢索效率,降低研發成本。第二,聯合計算機界、科研單位、文物部門及其他相關部門設置統一的組織和結構,在遵循全局規劃、整體建設、統一實施原則的基礎上負責開展出土文獻數字化的研究工作,避免重復建設的弊端。第三,通過申請國家專項資金和吸引社會力量投資擴大資金來源渠道,以滿足數字化整理所需的巨額資金。第四,在發揮現有專業人才骨干作用的基礎上,多渠道、多層次的培養一批既具備一定的計算機、圖書館學等專業知識,又具有整理出土文獻的基本技能的更好地適應出土文獻數字化建設的復合型人才。
三、小結
出土文獻提供大量有價值的佚書和傳世古書最早的版本,使我們對古書真偽、時代源流等謎團有了破解,這些都需要多角度考訂審核、多層次檢討反思,涉及文字組合、書寫釋讀、校對勘誤、詞義訓詁、音韻探源、版本目錄以及古代學術史、思想史等。而出土文獻數字化整理是搶救出土文獻于“危產”之中,保護、整理和研究出土文獻最行之有效的方法;也是適應當前信息化時代,學術研究所必然面臨的挑戰。只有將出土文獻數字化整理之后,才能利用網絡共享提高出土文獻的利用效率,發揮出土文獻應有的貢獻。
參考文獻:
[1]葛承雍,《出土文獻整理:請多一些關懷》,《中國文物報》2005年1月14日第5版。
[2]梁松濤、趙彥平,《淺析我國出土文獻數據庫建設的制約因素及對策》,《圖書館工作與研究》2008年第4期總第146期,頁48~51。
[3]毛建軍,《簡帛文獻數字化述論》,《蘭臺世界》2011年第8期,頁23~24。
[4]鄭杰文,《論我國古籍整理的幾個重點》,《陜西師范大學學報(哲學社會科學版)》2008年第37卷第5期,頁120~123。
注釋:
(1)王國維:《古史新證——王國維最后的講義》,清華大學出版社1994年12月版,第2頁。
(2)介紹出土文獻數字化整理成果時,筆者在《淺析我國出土文獻數據庫建設的制約因素及對策》、《簡帛文獻數字化論述》和《論我國古籍整理的幾個重點》基礎上參考相關數據庫介紹而寫就。