張宛艷
摘要:作者闡述了古籍檔案數字化建設的基本實施途徑,并從古籍檔案數字化的幾種實現方式和存在的若干問題等方面探討了古籍檔案整理利用的特點,提出了個人對古籍檔案數字化建設的一些思考,以期為古籍檔案管理者提供工作參考。
關鍵詞:古籍檔案;古籍檔案整理;古籍檔案數字化:檔囊管理者
我國歷史源遠流長。古代文獻檔案浩如煙海。古籍檔案作為民族歷史文化的象征,是先人留給我們的歷史文化瑰寶和寶貴財富。是今人研究歷代社會政治經濟、科技文化等方面的重要原始材料,整理保存和研究利用古籍檔案是一項長期而艱巨的任務。隨著文獻信息載體向數字化、網絡化發展的趨勢,古籍檔案整理已經走出傳統觀念,正在朝著數字化存儲和網絡化服務的方向發展。
1古籍檔案數字化建設的意義
古籍文獻對于人類文明與社會發展有重要的史料作用,同時也是我國檔案文獻遺產中重要的一部分。據有關專家估計保存至今的古籍約23萬卷,全國古籍藏量應在5000萬冊左右,可謂卷帙浩繁。這些寶貴的文化遺產,蘊藏著豐富的信息資源,為學者進行學術研究提供了取之不盡、用之不竭的資料,古籍檔案作為紙質文獻,隨著時間的推移,它越“古老”,其珍貴價值就越高;同時紙張的老化也在加劇,且不易修復;再加上反復借閱使用,必將加速紙張的磨損,這些都造成對古籍文獻或多或少的損壞,隨著計算機應用、數據庫技術、網絡多媒體技術的普遍實施,科技的發展迫使古籍檔案的整理也應與之相適應,然而實際情況是古籍檔案整理工作的科技應用和其他領域相比顯得要落后許多,開拓古籍檔案整理與研究的現代化領地,是擺在我們面前的嚴峻課題。
古籍檔案數字化就是從利用和保護古籍檔案的目的出發,采用計算機技術,將常見的語言文字或圖形符號轉化為能被計算機識別的數字符號,從而制成古籍檔案書目數據庫和古籍檔案全文數據庫,用以揭示古籍檔案信息資源的一項系統工作。古籍檔案數字化以后,讀者可以通過光盤或者網絡瀏覽閱讀電子讀物,可以任意跳躍查找或局部放大,避免了直接翻閱古籍檔案的諸多不便,給古籍檔案的使用帶來革命性的變化,數字化后的古籍檔案不僅可提供屏幕閱讀、內容檢索,還可以提供下載打印、遠程全文傳送、專題展覽。以及制作多媒體電子媒介等多種全方位的服務。事實證明,古籍檔案數字化不但有效地保護了古籍檔案,而且方便了讀者的閱讀使用,大大提高了古籍檔案的利用價值。
2古籍檔案數字化建設的方式
我國從上世紀80年代中期就開始古籍檔案數字化的嘗試,從單純的全文掃描圖像,到制作書目數據庫、開發研制各種檢索工具,再到現在的對古籍檔案全文數字化,經過這么長期的探索,已取得不少成就,也積累了豐富的經驗。目前古籍檔案數字化一般來說有以下四種方式:
完全圖像方式。這是最簡單的一種數字化的方,法。只需將古籍檔案掃描成圖像,存儲在存儲介質上即可,文字是以圖像方式如BMP、JI G、TAG、GIF等格式存儲,通過這種方式得到的古籍檔案數字化版本被稱為“全圖像版”,全圖像版直觀真實、快捷實用,但文字與圖像之間沒有索引關系,無法直接檢索到古籍檔案內容。不便查找。
目錄文本、正文圖像方式。這是在“全圖像版”基礎上的一種改進。目錄全部用文本方式存儲,而正文部分采用圖像方式存儲,并建立目錄與正文之間的索引關系。讀者可以在目錄級進行檢索和查找,并可根據目錄與正文之間的索引關系,找到所需的正文圖像。這里的目錄可以認為是廣義的目錄,除了包括卷名、書名、大小標題外。還可以包括圖名和表名等,這種方式的古籍檔案數字化版本可稱為“標題檢索版”。
全文本方式。“標題檢索版”只實現了目錄級的檢索與查找問題。全文本方式是將書中所有文字全部采用文本方式存儲,屬于真正意義下的數字化圖書,可以實現全文檢索和查找。這種古籍檔案數字化版本我們稱為“全文本版”。
全文圖文對照方式。該方式是上述方式的綜合體,也是目前古籍檔案整理工作者普遍運用的方法。它分別以圖像和文本方式存儲古籍,還對古籍檔案中的每一個漢字與它在原書中的圖像之間建立索引關系,用戶既可以在“全文本版”中檢索、查找和閱讀古籍檔案,又可以迅速方便地“翻閱”到當前文字在“全圖像版”中對應的位置。這種方式得到的古籍檔案數字化版本我們稱為“圖文檢索版”。“圖文檢索版”是目前最為理想化的數字化方式,既可以讀文、檢索,又可以觀察原文圖像,觀看古籍檔案中字體的寫法、排版特點等情況。
3古籍檔案數字化中存在的問題及對策
古籍檔案的數字化極大提高了古籍檔案的利用價值,解決了古籍檔案“藏”與“用”之間的矛盾,但是在利用過程中我們也看到古籍檔案數字化還存在不少的問題。
3.1古籍檔案數字化申存在的問題
目前古籍檔案數字化建設和利用中存在著許多值得重視的問題,主要是:偏重于硬件建設,軟件開發和信息服務明顯滯后:核心技術開發能力薄弱,關鍵硬件和軟件依賴進口;信息資源開發嚴重不足,而網絡和數據庫又存在大量低水平的重復建設,且難以實現互聯共享;信息安全存在隱患。
現行通用的標準是1996年10月由中國文獻編目規則編撰小組編撰、全國情報文獻工作標準化技術委員會及中國圖書館學會推薦使用的《中國文獻編目規則·古籍著錄規則》。隨著時代的進步和科學技術的日新月異,原有標準已經無法完全適用。因此,我們有必要根據這個著錄規則編目或對已有的目錄加以修訂補充,統一著錄標準,以保證數據庫的質量和查詢服務效果。不僅要有規范的著錄條例、數據庫格式、編目軟件使用字庫,還要有統一的古籍分類法,這些標準的制定不僅要有圖書館界、檔案界、信息產業界和軟件開發商共同參與,而且要有從事古籍檔案整理的專業人員參與,這樣才能為讀者提供一個數字化古籍檔案的統一平臺。
古籍檔案數字化建設和利用工作是需要學術界和軟件廠商的共同參與,因而有產業化的趨勢。由于前期參與的機構眾多,造成數據文件格式繁多。一般不能通用,需要單獨的閱讀器才能使用,這樣的局面極不利于讀者閱讀、使用。另外,在古籍檔案數字化產品中,選題和內容重復也是一個不爭的事實。例如《四庫全書》原文電子版、《四庫全書》全文檢索版、《四部叢刊》全文檢索版等。重復的選題,造成了人力、物力、財力等資源的巨大浪費。
還有,當今在學術界愿意從事古籍檔案整理工作的年輕人才已經非常少,特別是那種既具備古籍檔案整理知識又能熟練掌握應用現代化信息技術的較高層次的復合型人才更為匱乏。隨著從事古籍檔案整理的老一輩工作人員的陸續退休,古籍檔案數字化建設工作的人才“斷層”問題,顯得尤為突出。
3.2對古籍檔案數字化建設的思考
我國的古籍檔案浩繁,且分布地域廣泛,為了避免造成重復建設的資源浪費,全面了解全國古籍檔案數字化建設和應用情況,促進古籍檔案數字化建設和利用的健康發展,我們呼吁成立全國古籍檔案數字化建設領導小組和古籍檔案數字化建設專家組,由各相關專業、各相關領域的學者專家組成,加強統籌協調,堅持面向市場,統一規劃,統一領導,相互協調,相互配合,相互支持,在古籍檔案數字化建設中實現資源共享,扎扎實實推進我國古籍檔案數字化的建設和應用。
要進行廣泛調研和深入分析,吸取經驗教訓,避免走彎路;在技術上要高起點,實行整體規劃,業務系統建設與整合分步實施:在建設中要充分考慮對已有系統整合與無縫連接,共同協商制定古籍檔案數字化的內容、標引的深度、相關檢索工具的配置等,不能為了數字化而搞數字化,要用市場的辦法發展數字化;不能搞沒有效益的數字化,更不能搞“花架子”。同時各個相關業務單位應該樹立大局意識,舍棄小我利益,既要培育競爭機制,又要加強統籌協調,努力為古籍檔案數字化發展創造良好的環境:要按照互聯互通、資源共享的原則,杜絕各種網絡和系統的重復建設,防止一哄而起;既要重視對外開放與合作,又要加強自主科研開發。
古籍檔案的數字化建設對研究人員提出了更高的標準,它不僅要求研究人員要掌握古籍檔案的分類、版本鑒定、編目,還要會編制數據庫,懂得計算機網絡、多媒體等現代技術,并能輔導讀者利用現代化的科技手段來閱讀、使用和研究古籍檔案。因此盡快培養一批學有專長、信息素養較高、技術熟練、善于合作的復合型人才顯得極為重要而又迫切。
總之,古籍檔案數字化整理工作是隨著科技的進步而進步的,它需要檔案工作者和研究者、古漢語學者和數字信息專家們的通力合作。相信只要我們進行不懈的努力,最終定能實現數字化的古籍檔案真正意義上的資源共享。
參考文獻:
[1]覃燕梅,我國高校圖書館古籍文獻保護工作研究[J].圖書館論壇,2007(4).
[2]朱小健,古籍整理通用系統及其中字典的編纂[J].語言文字應用,2000(3).
[3]余述淳,古籍資源數字化建設的一些探討[J].大學圖書情報學刊,2003(2).
[4]潘德利,中國古籍數字化進程和展望[J].圖書情報工作,2002(7).
[5]王發杜,古籍數字化的幾點思考[J].圖書館論壇,2006(3).
[6]厲莉,古籍數字化的現狀及對策[J].江西圖書館學刊,2002(1).
[7]鄭幸飛,從書院文化數據庫建設看古籍文獻數字化[J].圖書館,2006(6).
(作者簡介:南陽師范學院來稿日期:2009-06-20)