白 鑫
甘肅教育出版社,甘肅蘭州 730000
基于敦煌學研究資料與成果的數據庫搭建
白 鑫
甘肅教育出版社,甘肅蘭州 730000
敦煌學的數字化是學界一直以來最為關注的。由甘肅教育出版社牽頭并與敦煌研究院、蘭州大學敦煌學研究所共同提出的“基于敦煌學研究資料與成果的數據庫”正是其最為重要組成部分,同時這個數據庫也是敦煌學術研究的底層支撐系統,更是出版企業從傳統紙媒向數字化轉型的一種嘗試。本文試圖從理論層面對這個項目進行可行性分析并提出內容與架構的初步框架性方案。
敦煌學;數字化;數據庫;數字出版
敦煌因為有了莫高窟和藏經洞文獻而聞名于世,敦煌學術之研究近年來又以甘肅地方研究機構和高校的成果最為突出,而甘肅出版界又責無旁貸地走在了敦煌學術出版的前沿。現在傳統出版企業正面臨數字化轉型的機遇與挑戰,作為傳統優勢板塊的敦煌學術出版領域也必定是甘肅出版界數字轉型的一個主陣地。
20世紀初,莫高窟藏經洞出土大批古代佛經與世俗文書,從此,各國學者開始對這些資料的多學科研究,并最終擴展為以文獻、石窟藝術、歷史地理等為主要研究對象,包括歷史、考古、宗教、石窟藝術、文學、建筑、民俗、交通、教育、樂舞等在內的一門國際性顯學:敦煌學。經過百年的發展,敦煌學產生了海量研究成果,而這些成果又多以傳統的紙質印刷物為載體。敦煌學的數字之路開始于20世紀80年代,到90年代末,隨著國內敦煌學術研究的越發繁榮、數字技術的迅速發展,敦煌學數字化工作也迅速展開,并在很短時間內取得了豐碩的成果。
目前,敦煌石窟的彩塑、壁畫的數字化主要由敦煌研究院通過“數字敦煌”項目來完成;國內外敦煌學界和圖書館界的學者開發的敦煌學數據庫主要有:敦煌研究院的“敦煌學研究文獻數據庫”、蘭州大學的“敦煌學數字圖書館”(“敦煌學Web數據庫”)、敦煌研究院文獻所和蘭州大學圖書館聯合開發的“敦煌遺書數據庫”、中國國家圖書館的“敦煌數字化計劃”等。其中敦煌研究院主導的對莫高窟彩塑、壁畫的數字高清拍攝及其應用的“數字敦煌”項目和“敦煌遺書數據庫”由于有雄厚的資金與技術支持,進展順利,運行良好。
1)項目必要性。國內已知最早提出的與敦煌學相關的數據庫是蘭州大學1999年提出并開始建設的,旨在為敦煌學研究專家提供信息服務的“敦煌學Web數據庫”。隨后,一些高校、圖書館、研究機構相繼建設了一批規模不等的敦煌學數據庫。但是這些數據庫普遍設計、立項、建設較早,規模小、技術落后,又受制于版權、資金等問題的制約,現在均不能很好地支撐科研活動。近年來,隨著數據庫技術、網絡應用技術、各種電子閱讀設備的快速發展,敦煌學術研究的迅速繁榮,建立一個開放的、功能齊備、內容豐富、實用性強的敦煌學數據庫已是敦煌學界的迫切需求。“基于敦煌學研究資料與成果的數據庫”(以下簡稱:“敦煌學數據庫”)的建立,可以使分散的敦煌學基礎資料、研究成果集中起來,形成資源流,使信息迅速得到共享,同時也方便學者第一時間了解與掌握敦煌學界最新的科研動態,不斷推出最新的研究成果與學界交流。
2)項目可行性。在國內,清華同方的知網、萬方數據等大型學術數據庫,利用傳統出版資源進行數字化運行,取得很好經濟效益與社會效益,已經是高校、研究機構、各學科專業技術人員不可或缺的資料查詢工具了。在國外,由于出版社的數字出版能力普遍較強,所以出版企業建設的專業數據庫的成功案例很多,如埃思維爾(Elsevier)的全文數據庫Science Direct,斯普林格(Springer)的全文數據庫SpringerLink等。事實證明,這種模式是成熟的、可持續發展的。
“敦煌學數據庫”項目由甘肅教育出版社為建設主體,敦煌研究院、蘭州大學敦煌學研究所為共建單位。甘肅教育出版社是國內最權威的敦煌學研究成果出版機構,擁有大批敦煌學研究成果的數字版權;同時也是甘肅省首批數字出版轉型示范單位,有豐富的數字出版實戰經驗與技術儲備;甘肅教育出版社的母公司“讀者傳媒”,又是國內上市的為數不多的文化企業,可以為其提供資金上的大力支持。而敦煌研究院、蘭州大學敦煌學研究所是國內最權威的敦煌學研究機構,擁有大量研究成果,并且有“敦煌遺書數據庫”“敦煌學研究文獻數據庫”兩個試驗性數據庫的建設經驗與內容做支撐,加上兩家機構各有一個敦煌學專業期刊,可為今后“敦煌學數據庫”的數據更新提供源源不斷的新鮮血液。因此,該項目可操作性很強。
3)項目建設的目標、基本架構。敦煌學數據庫建設的最終目標就是就是建立一個最專業的、開放的、功能強大的、對敦煌學研究者黏性極大的、能為敦煌學術研究提供最專業服務的、基于敦煌學研究資料與成果的數據庫;并且這不僅僅只是一個提供查詢服務的系統,而還應該一個專業的數字出版平臺。
敦煌學數據庫是個廣義的概念,架構應該是:一個數據加工平臺,可將出版社、雜志社保存的書稿和論文的排版文件,將原作者提供的WORD文檔等直接轉換成數據庫存儲的標準格式;一個數據庫及可以連接出版社ERP系統的數據庫管理系統;一個開放的、多元的多媒體數據發布平臺。
4)項目內容的構成。敦煌石窟群除了莫高窟、西千佛洞,還包括瓜州榆林窟、東千佛洞以及肅北五個廟石窟和一個廟石窟。其中莫高窟有編號的洞窟就有735個,造像2 400余身,壁畫5萬多平方米,各類藝術品1 000多件,再加上藏經洞出土的5萬余卷以佛經及世俗文書為主體的敦煌遺書,這些均是敦煌學研究的基礎資料。因此“敦煌學數據庫”正是以此以及對這些材料的研究成果作為核心數據并加工、整理、發布、應用的。數據庫應當包含以下內容:
敦煌學著作及各相關專題研究成果的目錄和全文等資料、論文(含期刊論文、學位論文、會議論文、網絡論文等)。
藏經洞出土文獻的敘錄、圖版、錄文、譯文及題記;敦煌出土簡牘和碑刻等的敘錄、圖版、錄文及譯文等信息。
敦煌洞窟中的彩塑、壁畫、建筑等的目錄、圖像、視頻、3D場景以及輔助介紹資料等。
敦煌所出土各種織物畫、紙畫、刺繡和其他各類藝術品的目錄、文字、圖像、視頻等輔助介紹資料。
有關敦煌考古和田野調查方面的報告、日記、圖片等資料。
敦煌石窟中文物和各類敦煌文獻的保護、修復檔案資料。
有關敦煌歷史的年表、地理、人物、事跡、風俗等資料。
敦煌學研究機構、研究隊伍、研究專家的名錄和具體情況介紹等。
,如大藏經、各種正史、資治通鑒、政書、方志等資料。
然而隨著敦煌學術研究的不斷深入與發展,出現了與其他學科相融合的現象。例如:隨著敦煌漢簡研究成為敦煌學術的一部分,居延漢簡甚至這個簡牘學都與敦煌學產生了共鳴;“一帶一路”的提出,加上敦煌與絲綢之路的天然的無法割裂的關系,使得對絲綢之路的學術研究也進入敦煌學界的視野。因此,“敦煌學數據庫”還要收入簡牘學,河西走廊及絲綢之路沿線石窟寺、魏晉墓葬、地方文化,西北史地等的研究資料與成果。
5)數據庫的檢索方式。“敦煌學數據庫”數據庫檢索方式主要有分類檢索與關鍵詞檢索兩種。
分類檢索:是指從主頁根目錄開始, 按照目錄信息的提示,點擊相關鏈接,直至查詢到所需信息的樹形瀏覽檢索方式。
關鍵詞檢索:在設置于主頁的“關鍵詞檢索”框中直接輸入相關詞語,便能檢索到相關的文字、圖片、視頻、遺書錄文、譯文及研究成果等信息,并且通過鏈接相互關聯,彼此呼應。比如用“吐蕃統治時期”一詞可以檢索到所有關于吐蕃統治時期營建洞窟中塑像、壁畫的圖像;又可以顯示敦煌遺書中所有確定或疑似“吐蕃統治時期”的佛經與世俗文書的照片、錄文、譯文等;還可以考察所有在題目或各級標題及內容中含有“吐蕃統治時期”字樣的論著信息。
本文所探討的是一個以出版社為主體建設的專業學術數據庫,這在國內出版業內并不多見。敦煌學術之研究已走過百年,敦煌學的數字化的步伐也伴隨著學術研究與信息技術的飛速發展而越來越快。“敦煌學數據庫”作為敦煌學數字化的重要組成部分,具有劃時代的意義;同時作為傳統出版企業轉型升級的一個數字出版平臺,也有重要的實踐意義。希望這個平臺搭建能夠大力促進敦煌學術研究與研究成果出版的發展與繁榮,徹底改變曾經“敦煌在中國,敦煌學在國外”的尷尬局面,讓大家都知道,敦煌學是世界的,但敦煌學研究的中心在中國,敦煌學的數據庫與出版平臺在甘肅。
參考文獻
[1]趙書城,莊虹,馮培紅,等.關于敦煌學數據庫[J].敦煌學輯刊,1999(1):128-131.
[2]韓春平.“敦煌學網”——敦煌學數字化的總目標[J].敦煌研究,2011(5):119-122.
[3]韓春平.敦煌學文獻數字化芻議[J].圖書與情報,2004(2):38-40.
[4]李潤淵,李鴻恩.敦煌學文獻數據庫建設的探索與實踐——以敦煌研究院敦煌學研究文獻數據庫為例[C]//中國圖書館學會專業圖書館分會2009年學術年會論文集,2009.
[5]江志學,韓春平.關于敦煌學數字圖書館[J].敦煌研究,2005(6):128-130.
G2
A
1674-6708(2016)171-0126-02
白鑫,編輯,甘肅教育出版社,主要從事敦煌學、西北史地研究成果的出版工作及傳統出版企業數字化轉型的研究與實踐。