[摘要]西夏是個以黨項為主體的多民族地方政權,曾與宋、遼、金鼎立。歷時189年,后被蒙古所滅。改革開放以來,我國的西夏研究呈現出上升趨勢,但由于資料比較分散,學者查閱很不方便,更無法集中提供于世界學界進行全面研究,從而影響了西夏學的研究進展,本文探討了建立西夏學文獻數據庫的必要性、可行性以及措施。
[關鍵詞]西夏學文獻 數據庫 質量控制
西夏是個以黨項為主體的多民族地方政權,曾與宋、遼、金鼎立。歷時189年,后被蒙古所滅,西夏王朝的歷史也逐漸被后世淡忘。元修宋、遼、金三史,唯獨沒有給西夏修史。清朝后期崇尚考據學,當時尚屬空白的西夏歷史才引起人們的重視,學者們拾遺補闕,撰寫了多種西夏著作。直到20世紀初,大量西夏文獻的發現,對西夏的研究從此得以開始,尤其是改革開放以來,我國的西夏研究呈現出上升趨勢,研究隊伍不斷擴大,研究領域不斷拓寬,西夏研究逐漸形成了一門獨立的國際性學科。但由于資料比較分散,學者查閱很不方便,更無法集中提供于世界學界進行全面研究,從而影響了西夏學的研究進展,因此開發和建立西夏學文獻數據庫,為后世學者提供新的研究平臺,已成為當今十分迫切的任務。
一、西夏文獻資源概況
由于歷史原因,我國流傳下來的有關西夏的歷史資料一直很少。20世紀初,以莫高窟、黑水城為代表的西夏文獻又大批流失海外,主要集中在英、法、俄三國。1996年《俄藏黑水城文獻》首先在國內出版, 2002年,北方民族大學、上海古籍出版社和英國國家圖書館合作,出版了《英藏黑水城文獻》。2007年準備出版《法藏敦煌西夏文獻》。這批資料的出版,標志著上世紀初流失到俄羅斯、英國、法國的西夏文獻都已“回歸”中國。雖然日本還有少量收藏,其主要藏品與靈武出土的《華嚴經》等類同,和中國國家圖書館館藏西夏文獻是同一來源。2005年寧夏大學西夏學研究中心和甘肅五涼古籍研究中心合作出版的《中國藏西夏文獻》20冊,將國內現藏極為珍貴的原始文獻盡收其中。我國學者從浩如煙海的漢文古籍史料中搜集、整理出版了《黨項資料匯編》《西夏紀》《西夏書事》《西夏紀事本末》《西夏志略》等一批漢文史料。
由于這些考古資料與文獻資料的整理出版,推動了西夏學的全面研究,一個世紀來我國學者對西夏文的研究相繼出版了《文海研究》《同音研究》《番漢合時掌中珠》《類林研究》《天盛律令改舊新定律令》《貞觀玉鏡將研究》《西夏語比較研究》《西夏史稿》《西夏簡史》《西夏文化》《黨項史研究》《西夏佛教史略》《西夏研究叢書》等一大批研究成果二百多種,西夏學研究論文三千多篇。豐富的西夏文獻資料給數據庫的建立提供了資源保障。
二、西夏學文獻數據庫的建設原則
目前我國數據庫的建設有了很大的發展,形成了一定的規模。但大多數數據庫都是書目數據庫,讀者要查找原文不太容易。因此西夏學文獻數據庫的建立應考慮其完整性,即建立書目、摘要和全文三種形式并存的數據庫。建設西夏文獻專題數據庫的目的,在于通過電子信息傳遞網絡化,實現服務社會化,達到全球文獻資源共享。因此標準化、規范化是實現信息資源共建共享和文獻信息檢索自動化的重要基礎和前提之一。數據庫建設的標準化主要表現為兩個方面:一是數據庫管理系統的標準化,具體表現在基于數據庫管理系統的標引系統、檢索系統和操作系統;二是數據庫數據著錄的標準化。必須對建庫所使用的軟件、數據庫結構、信息內容表達、錄入數據格式和字段的定義等給予規范化界定,按照國際標準書目著錄、規范數據款目著錄規則等有關數據庫的標準,而且要對原文進行深層次的加工,從多方面、多角度地對文獻內容加以劃分和揭示,使隱性信息顯形化,設置有效的檢索點,以免漏檢。
三、建立數據庫的質量控制
為了確保西夏學文獻數據庫的質量,建立一支高水平的專業人員隊伍,是建立數據庫質量控制的關鍵。首先應選調一批西夏學的研究專家參與,他們可以對數據庫的選項、以及文獻的準確性、時效性、和價值選用等方面,給予科學的判斷,以保證文獻的質量;其次,引進和培養有較高水平的計算機程序管理人員,隨時對應用軟件進行維護、修改,使應用軟件運行形成良性循環,做到不出錯或少出錯;再次,培養和配備一批既有圖書館學、分類編目理論知識,能熟練進行分類和主題標引、會準確使用中國機讀目錄通訊格式進行文獻著錄,又能掌握現代信息處理技術、熟練使用和操作計算機的專業人才。為數據庫的建立提供有力的技術支持。只有充分發揮人的主觀能動性和積極性,挖掘其潛力,實現人機統一,才能確保數據庫的質量。
四、建立西夏文獻數據庫的措施
(1)建立一個統一的協調機構:面對目前數據庫建設整體上條塊分割、各自為政的局面,要制定統一的方針政策,逐步建立起協調建庫的管理機制,在行業內部建立一個發展協調委員會,以確保數據庫在網絡運行中的兼容性、可靠性及安全性。
(2)依托某個文獻資源雄厚、現代技術設備精良、人員素質高的文獻信息單位,以課題形式,組建數據庫開發中心,每個文獻收藏單位都應是這個中心的成員,采取統籌規劃, 共同開發,在信息、技術上互通有無,資源共享;在人力、物力、財力上各盡所長,優勢互補。
(3)軟件和硬件的配備: 自建數據庫所需的系列軟件:E2BOOK制作軟件、元數據標引工具、分類工具、內容發布系統軟件、全文檢索服務器管理軟件、網站信息搜索引擎、實時信息采集系統、視頻點播軟件。所需的硬件設施包括服務器、磁盤陣列、計算機、掃描儀及相關網絡設備。選擇合適的數據庫管理軟件,制定數據庫建庫的技術標準建庫的業務操作規程,對參加人員進行建庫培訓。
(4)分工合作,集中建庫:在資源、人力、技術、設備等都具備的條件下,首先對西夏文獻資源的分布情況進行調查,并整理出文獻資料目錄,并根據西夏文獻的特點將其進行統一分類編目。西夏文獻按內容可分為宗教文獻和世俗文獻兩大類,再按文獻的文字載體分為西夏文文獻、漢文文獻和其他民族文字文獻,最后再按文獻的具體內容,仿照《中圖法》分類;最后集中到開發中心,進行統一標引、設定完善的檢索系統,最終完成數據庫的建立。
(5)數據庫的維護與管理:數據庫建成后,便面臨著更新數據內容和維護管理的任務,這是保證數據庫質量和長久生命力的重要環節。其主要措施,一是對已經建成的數據內容在使用過程中發現存在的誤差進行修正和補充;二是隨時注意考古發現和國內外研究動態,隨著新的研究成果的面世,及時補充新的文獻資料數據。
隨著西夏學文獻專題數據庫的建成和網絡的廣泛使用,最終實現了全球的資源共享,這將更能促進西夏學研究的快速發展。
參考文獻:
[1]包和平,包愛梅. 民族高校民族文獻數據庫建設探討. 情報資料工作,2005年第4期.
[2]黃曉斌,蒲筱哥. 我國圖書館特色數據庫建設的現狀.問題與對策. 情報科學,2007年5月.
(作者單位:寧夏大學西夏學研究中心)