丁海斌 趙錦濤
(1.廣西民族大學管理學院,廣西南寧,530006;2.廣西數字檔案管理研究所,廣西南寧,530006)
隨著信息技術的發展,以及國家層面對于史料整理的重視,中國古代檔案史史料電子資源近30年來呈現幾何式增長。電子資源的產生不僅改變了傳統史料的整理與保存方式,也極大地提高了史料搜集和利用的效率。目前,學界尚未對中國古代檔案史史料電子資源進行深入專門的研究。由此,本文著重對中國古代檔案史史料電子資源進行專門研究,對其類型、特點、優勢和應用情況進行探析,以展現中國古代檔案史史料電子資源的概貌和獨特價值。
電子資源已成為中國古代檔案史研究中不可或缺的史料來源,對檔案史研究具有極為重要的價值,為中國古代檔案史的教學和科研發展奠定了基礎。中國古代檔案史史料電子資源主要存在于檔案館官網和在線數據庫中。
對我國31個省級檔案館和國家級檔案館進行網絡調查發現,共有13個保存有中國古代檔案史史料電子資源的網站,多以明清檔案史料為主。多數檔案館僅能提供目錄查詢,其中只有中國第一歷史檔案館的《清實錄》和《清會典》能夠實現全文查詢。在這些檔案館官網電子資源中,涉及中國古代檔案史史料最多的是清代檔案,其次是明朝和唐朝的檔案史料,最具代表性的是中國第一歷史檔案館、遼寧省檔案館和四川省檔案館,均保存了大量史料,且數字化后開放利用的規模和程度較高(詳情見表1)。

表1 重要檔案館史料電子資源介紹
20世紀90年代后檔案數字化整理進入快速發展階段,截至目前,中國古代檔案史史料數字化已經取得重大進展,各種類型的檔案史史料數據庫也紛紛建立。通過調查發現,現階段檔案史史料數據庫以檢索型數據庫為主,包括愛如生大型古籍數據庫、國學寶典(網絡版)、中華古籍資源庫、中華再造善本庫、中國方志庫、中國學術期刊全文數據庫、萬方數據等。以國學寶典(網絡版)和中國學術期刊全文數據庫為例,前者收錄了從先秦至清末所有以漢字作為載體的歷代典籍。后者收錄了包含較多與中國古代檔案史史料相關的內容,如專業詞典、國學寶典等。量化型數據庫仍在不斷地探索,成果相對較少,包括中國歷史地理信息系統、中國歷代人物傳記資料庫、臺灣歷史數位圖書館等。其中集合臺灣史一手史料的臺灣歷史數位圖書館收錄了與中國古代檔案史史料相關的明清臺灣行政檔案、古契書等。
通過對調查所得的重要檔案館網站和在線數據庫進行分析,可以總結出史料電子資源具有如下特點:第一,建設主體。我國史料電子資源建設主體主要包括檔案館、公共圖書館、學術機構和古籍數字化企業。[1]檔案館和公共圖書館主要以建設館藏史料電子資源為首要目的,主要解決館藏、保護以及利用三者之間的矛盾;學術機構以教學和科研為首要目的,主要解決科研的需要;古籍數字化企業主要以營利為首要目的,以市場需求為指導原則。各種建設主體之間雖然出發點和目的不同,但是也相互合作、各取所長,共同構建更加完整的檔案史史料電子資源。第二,資源內容。在資源建設內容上,中文古籍類和館藏檔案類史料數字化資源較多。檔案館電子資源主要是清代檔案史料,其次是明代和唐代檔案史料。如一史館的《清實錄》和《清會典》全文數據庫。公共圖書館、學術機構和古籍數字化企業電子資源主要以紙本古籍為主。其中公共圖書館根據自身館藏特色建設和開發史料資源;學術機構根據科研需要,以史學類和方志類資源建設為主,建設的資源內容重復性較小。[2]第三,資源類型。在所調查統計的電子資源中,各主體提供的均是專題數據庫。在檔案館官網中其主要功能是檢索,提供檔案史料目錄查詢;公共圖書館和古籍數字化企業提供的是古籍全文數據庫,但是古籍數字化企業提供的產品需要付費才能使用。量化分析型史料數據庫建設主要以學術機構為主,能夠提供統計分析和可視化展示等綜合分析功能。[3]
史料電子資源具有檢索便利性、使用快捷性、內容精準性等特征,不僅能夠促進檔案史料的永續保存和充分利用,對于檔案史及檔案史史料學的發展也大有裨益。其應用使中國古代檔案史研究向跨學科、精準性和科學性的方向發展[4],相對于傳統史料資源,電子資源具有巨大的應用優勢:第一,電子資源使史料檢索更加便捷,不僅提高了研究者查找史料、校勘和考訂史料的效率,而且打破了中國古代檔案史史料保存和用戶利用之間的時空阻隔;第二,相較于傳統史料研究,電子資源拓寬了史料搜集范圍,研究者可以進行整庫與全網檢索和統計,使其研究范圍更加開闊,數量關系更加準確、全面,在長期梳理事實、觀念、詞匯源流等方面具有傳統史料無可比擬的優勢[5];第三,任何用戶可通過互聯網平臺使用電子資源,這不僅有利于促進學科和技術間更好地融合與發展,而且能夠催發“新文科”和“數字人文”等新學術形態的產生。
(1)數據統計,探究源流
信息技術的發展促進了歷史語言學和計量語言學的進一步發展。研究者可通過對關鍵詞進行聚類檢索以統計字頻和出現的次數,分析詞族的相同和相異之處,并將這些信息共同呈現給讀者;還可以通過查找關鍵詞以追蹤詞字歷史演變的軌跡。這也是近年來電子資源在中國古代檔案史研究應用中比較常見的方式。如,筆者主持承擔的國家社科基金項目“中國文檔名詞發展演變史”,其中古代部分的數據主要來源于“國學寶典數據庫”和“四庫全書數據庫”,后期亦使用了“愛如生基本古籍數據庫”,與其他數據庫相互參考、對比、補充。該系列文章以電子資源文本檢索和數據統計為基礎,應用數量分析的方法了解歷史上文檔名詞應用的頻次與范圍等。[6]
(2)E考據——檔案史料的“立體”應用
E考據是黃一農教授提出,意為充分利用電子資源進行考據。其在中國古代檔案史領域應用中,研究內容以明清時期檔案史較多,這與明清時期史料保存和公開的電子資源較多有很大的關系;研究重點在考疏歷史淵源、探究檔案史相關內容的功能演變及歷史特殊性等方面;研究類型較多集中在檔案名詞、文書檔案研究以及對檔案史研究的評介與綜述等方面。
(3)數字人文與特殊檔案史料資源開發
數字人文帶來了新的研究方法和研究工具,助力電子史料資源的分析和利用,對研究中國古代檔案史某一個專題具有重大的意義。數字人文與社會人文歷史領域的融合促進了研究者對歷史人物—事件間關系的關注,海量的電子資源和數據分析技術為高效厘清人、事、物之間復雜的關系提供全新的范式,為中國古代檔案史史料的發展研究提供了新的思路和方法。此外,中國古代檔案史史料的形式多樣,除古籍文本外,被應用較多的還有碑文檔案、圖畫以及地圖檔案等。研究者通過對這些特殊檔案史料進行研究能夠窺探某一地區變遷的情況或者某一事物的全貌,更好地還原當時的場景。
中國古代檔案史史料種類繁多,資源結構和類型各不相同,史料數字化和數字人文研究方式的應用以及各種數據庫的出現,有利于對大量史料的檢索,輔助實證研究,但史料電子資源的應用尚存在不足。
(1)史料數據庫自身的信息服務功能需要完善
古籍全文數據庫可分為三類:圖文型、圖像型、文本型。圖文型數據庫不僅能提供文本檢索,還能對照古籍原文內容,避免文字自動識別出現錯誤。[7]而文本型數據庫,如常用的國學寶典數據庫[8],需要用戶在使用過程中把查到的古籍電子版本與古籍原始版本進行對比以確保引用的準確性,這無形中增加了用戶的時間成本。這類數據庫應完善信息服務功能,增添古籍影印版,從而使用戶能夠在線完成對比、提高效率。此外,在糾錯勘誤功能上,目前常用的數據庫中僅有中國基本古籍庫、瀚堂典藏、中華經典古籍庫具有該功能,亟須加強對該功能的建設與完善。
(2)存在以檢索代替研究的問題
“電子史料資源給研究帶來很大便利,但是‘搜索式’文章,缺乏對史料上下文語境的考察,從而忽視了史料真正價值。”[9]研究者在享受電子資源便利性的同時,還應把史料電子資源當作技術手段輔助研究,不能“買櫝還珠”,忽略史料本身的價值。
(3)對特殊載體的電子史料資源應用關注度低
中國古代檔案史史料電子資源應用多以古籍文本為研究內容,進而作實證分析,但中國古代檔案史史料資源豐富、題材眾多,如地方文獻類、碑文類等,還未受到研究者的較多關注。重視對特殊載體類史料電子資源的應用,對中國古代檔案史史料的研究大有裨益,同時也有利于促進中國古代檔案史史料電子資源更加完整。
電子資源是中國古代檔案史史料中的重要組成部分,是信息化時代人們最常檢索、閱覽的史料形式。一方面,電子資源的出現和新技術的應用不僅拓寬了中國古代檔案史史料的應用場景,也實現了不同學科之間的交叉與融合。但另一方面,技術在給我們帶來便利的同時,也給我們帶來了新的挑戰。我們應以更加嚴謹的態度,對史料電子資源進行科學鑒別、篩選和分析,提升電子資源的利用效率。