【摘要】圖書館想要更加全面和有效地履行其社會職能,對我國古籍文獻資源進行深度保護與可持續傳承發展,就需要結合最新的技術手法來針對古籍資源予以數字化處理,同時開發更加富有針對性的古籍文獻檢索系統,推進古籍編目。本文在闡述圖書館古籍整理需要注意的要點的基礎上,結合實際探討數字環境下圖書館加強古籍整理和保護的有效策略。
【關鍵詞】數字環境;圖書館;古籍整理;保護策略
【中圖分類號】G255.1 【文獻標識碼】A
古籍的類型繁多,透過宏觀角度觀察,包括甲骨文拓本、青銅器銘文、唐宋雕版印刷品等;微觀層面理解,則強調在有雕版印刷過后我國1911年前出現的種種印本和寫本。經過互聯網和信息化等技術蓬勃發展之后,民眾對于歷史文化開始愈來愈關注,而圖書館保留的歷史文獻則是進行數字化處理的主要對象。所以說,各地圖書館應該更加細致地完成古籍整理、組織、應用等工作,進一步透過互聯網實時性的傳播,引導更多民眾去了解和傳承有關的傳統文化。
一、圖書館古籍整理需要關注的要點
(一)古籍的數字化轉化和存儲
所謂古籍的數字化轉化,就是憑借計算機等技術來針對古籍文獻予以批量化的加工處理,進一步形成完善的數目數據庫和古典全文數據庫,在方便讀者檢索、下載、閱讀、應用的同時,使他們快速發掘當中蘊藏的各類文化要素,從而滿足自身不斷提升的精神文化需求,提升綜合素養。
(二)古籍全文數據庫的創建
在進行古籍內容數字化轉化過程中,經常會觸碰到相關文字過小或是篇幅被大面積蟲蛀等消極狀況,再就是一些掃描完畢的書籍,盡管說能夠方便讀者在線即時閱覽,卻因為沒有經過光學字符識別而難以被全文檢索、編輯或是下載存儲。為了確保今后可以更加高效率和高水平地應用古籍文獻,進一步為我國傳統文化保護、傳承、發展提供不竭的推動力,就需要及時將古籍全文掃描并轉化為統一格式的電子文本。
古籍全文數據庫的表現形式則主要包含兩類:一是古籍文字的鍵盤輸入;二是文字識別系統的自動化識別、分析、索引、閱覽等。北京大學圖書館就沿用了第一種形式,在將藏書資源掃描成為圖像之余,將有關內容完整地輸入到文檔之中并添加標點,制作成時代所需的全文檢索系統。通常狀況下,古籍系統能夠同時發揮出文件原貌呈現、全文檢索和閱覽等功能;再就是方便進行各類顏色的文件處理,在無需打字或是校對的前提下,即可完成文件的數字化轉化任務。
(三)索引模塊的編制
圖書館要更加有效率地整理古籍資源,進一步為讀者提供貼心的借閱和指導服務,就必須要預先編制清晰實用的書目和索引。而隨著計算機信息技術的普及,有關電腦編制機讀書目開始受到各地圖書館關注,慢慢地轉化成為館際甚至國際間不可或缺的合作系統,至于索引模塊的開發進度則稍慢一些。實際上,現階段全文檢索系統已然替代了傳統的逐字檢索模式,只要輸入和館藏古籍相關的信息,包括書名、人名、地名、事物名等,即可在計算機系統中快速獲取,從而快速了解諸如方志和類書等鮮有的古籍著作。
(四)網絡古籍資源的組合和檢索
要透過圖書館內的全文檢索等系統來獲取想要的古籍資源,就需要依靠元數據的組織和檢索功能。所謂元數據,即對館藏資料屬性的描述內容,其存在意義則是方便館員精細化地檢索、管理與分析。縱觀傳統的圖書館,有關元數據主要憑借目錄卡片或是網絡公用目錄中的機讀編目形式出現,同時兼備著錄功能,目的就是方便館員、讀者群體等快速辨識和應用資料。歸納起來,元數據擁有數字資源定位和探索、文件記錄與評估等多重功能,是圖書館古籍整理中不可缺少的工具。
二、數字環境下圖書館古籍保護的有效策略
古籍可以說是圖書館館藏中的精品,具備較高的收藏和學術研究價值,與此同時,這些古籍都經過歲月的洗禮,且大都是紙質形式,不方便保存。為了避免這些稀缺的古籍資源被人慢慢忽略和粗暴對待而不斷減少甚至消失,就需要圖書館積極履行自身職能,采用數字化加工處理等方式,開發出更加專業可靠的古籍檢索和保護管理系統。久而久之,使更多的讀者可以隨時檢索和了解相關古籍內容,對傳統文化和知識進行可持續傳承和發展。
(一)設置嚴格的數字加工處理標準
概括起來,就是在開發實用的古籍數字資源庫前提下,針對一些重要的加工環節設置嚴格的規范標準并督促各地圖書館嚴格遵循,進一步提升古籍整理和保護的水平。盡管說和其余類型文獻相互對比,古籍資源的數字化整理和保護有許多共同特征,不過卻也存在明顯的特色,即需要針對當中內容進行全面再現和適度重組。基于此,圖書館在進行古籍數字化標準體系創建期間,要嚴格貫徹開放性、系統性、實用性和拓展性等要求。客觀地講,在組織古籍數字化加工活動中,難免會遭遇到標準繁多的狀況,諸如要求在圖像制作中呈現出不同的解析度基礎上,分別針對黑白和彩色圖像設置不同的存儲格式。就好比是上海圖書館,現階段主要沿用TIFF、JPGE格式來分別存儲黑白和彩色圖像,與此同時,黑白和彩色掃描的解析度分別設置為200~300dpi、100~150dpi。
截至目前,我國在進行古籍影像數據庫建設期間,主要面臨著中文文字辨識系統、存儲媒體、文件影像分析處理等技術瓶頸,尤其是中文文字辨識系統,直接決定著整個古籍保護工作的進行效率和質量。所以說,各地圖書館要盡快開發出可以同時、準確辨讀不同字形與字體,還有失真率低且壓縮比高的影像壓縮等技術,再就是在影像分析處理層面上,要更加全面地兼顧古籍的特征。相信今后古籍影像資料的制作工作量還會急速增加,為了確保方便后續予以統一性管理和及時性共享,還應該針對其存儲格式、媒體環境等設置嚴格的規范標準。
(二)開發實用的古籍檢索和管理系統
為了更好地迎合古籍整理和保護工作的最新要求,就需要及時開發出兼備數字處理、文件分析、文字識別以及容錯性檢索等實用功能的古籍全文數據庫。唯有如此,才可以更加高效率加工重組各類古籍的全文內容,確保在不失真的前提下予以生動重現,并且方便用戶隨時進行全文檢索。需要注意的是,因為古籍中有很多的通假字與異體字,加上語義切分和別稱等現實問題交織,導致讀者檢索期間難免會出現多檢或是漏檢等不良狀況,而以現階段各個圖書館的技術實力來講,還無法做到針對手寫或是木刻的古籍文字進行快速、準確辨識。
為了更好地處理上述挑戰問題,希望各個圖書館能夠抓緊開發一套理想化的古籍影像制作和全文數據庫創建方案,在掙脫館藏壁壘束縛的基礎上,促成全國范疇內古籍全文的精準檢索和有序管理。如透過圖書館、研究所、高校、商業機構等進行資源整合,鼓勵這些主體合作來創建專門的數據庫,賦予圖書館古籍資源檢索功能急需的便捷性和兼容性,進一步清除古籍數字化發展道路中的種種障礙,促成古籍信息資源的可持續保護與全方位共享。
(三)彼此合力來加快古籍的編目進度
合作編目方式對于現代圖書館古籍書目數據庫創建來講大有裨益,而在正式合作共建中文古籍數目數據庫時需要注意兩個要點,分別是建檔書目資料的整合和有關規范的設置,其中后者更是創建中國古籍數目數據庫的基礎保障。具體來講,古籍合作編目活動中要同時關注收錄范疇和類型、著錄規則、分類和標題模式、建檔格式、中文內碼等細節性問題,而要將它們及時而全面地處理就需要依靠各方力量和智慧去設置合理的規范標準。就好比是當前的CALIS古籍聯機編目數據庫,沿用了統一的編目客戶端、著錄標準、數據格式、分類法,對于國內古籍聯合目錄的創建有著較強的示范功效,不過仍需持續增加成員館,特別是要吸入一些古籍館藏較為豐富的單位。
(四)結合實際制訂適合古籍的元數據標準
在現代數字化圖書館建設工程當中,比較關鍵的內容莫過于古典文獻,選擇針對其開發完善的檢索功能顯得更為重要。而所謂元數據,實際上就是針對古籍屬性的一種描述形式,其存在意義就是方便用戶借助專門的數據庫來即時性檢索、管理和分析有關古籍資源。因此,今后在加快圖書館古籍數字化和網絡化改建進程中,不單單要針對古籍資源予以數字化轉化,還要創建和組織適當規模的數目信息,基于元數據來開發和提供更加便捷的檢索模式。如北京大學數字圖書館就借助高端化的互聯網技術和通用XML網絡傳輸語言來制訂古籍資源專屬的元數據標準,確保用戶在不用安裝各類程序的前提下就可以輕松登錄web界面并體驗聯機編目功能,從而實現對圖文的自由性管理,表現為流暢性銜接目錄、圖像和全文,簡化MARC格式內部的定長字段并令編目界面變得更加生動簡潔,使著錄和檢索模塊更為緊湊地融合等。
(五)兼顧古籍數據庫的標準化
首先,數據庫管理系統方面。在進行圖書館古籍數據庫規范性和標準化創建過程中,特別要關注描述和標引語言,同時配合國內外通用的數據著錄、數據格式、數據標引、規范控制等協議予以邏輯化和系統化地組織。至于對應的標準可以依次細化為通信、字符編碼、元數據、檢索語言、安全等標準。這樣一來,不但能夠促成相關圖書館數據庫間的靈活轉換、緊密互聯、適當互訪,還能夠節約用戶檢索古籍所耗費的時間和金錢,即在大幅度提升檢索效率的基礎上,達成古籍信息實時性共建共享的目標。
其次,數據庫數據著錄的標準化。一方面要精細化篩選古籍版本,之后再統一進行數字化處理,并加入一些未被選用的版本信息,方便讀者進行鉆研和拓展;另一方面就是深度標引古籍當中的內容,尤其是那些保留特定學術價值的詞匯,諸如文獻中多次出現的官階、地點、年號、典故、體制、族屬、人名等,要制成特定的索引,確保今后讀者可以透過任何角度來準確檢索所需的信息,如果說發現一些同書異名、同名異書、相同作者不同稱謂的部分,要結合傳統文獻整序中的名稱和主題規范檔、權威檔等予以規范處理。好比是添加年號和公元紀年對照表、家族世系表、地名沿革表、人名字號表等。還有一方面則是維持古籍數字文件格式的標準化,畢竟文獻全文檢索格式包含txt、doc、html、pdf等諸多類型,且分別要用專門的閱讀器方可以閱覽,彼此間又難以兼容。所以,圖書館要保證做好版權保護工作的同時,針對古籍數字文件設置普遍的格式并提供在線閱覽功能,使讀者及時關注和篩選比較感興趣的文件,并有針對性地檢索、下載、收錄、整合、分析、應用。
三、結語
綜上所述,在互聯網等高端信息飛速發展的過程中,涉及公共圖書館的服務也朝著數字化方向轉變。為了確保在古籍閱覽方面提供給讀者更加便利的服務和指導,進一步發揮對傳統文化的可持續傳承和發展功用,各地的圖書館須緊緊把握機遇,開發出更加可靠的數據庫,提供嚴格的規范標準,提供詳細的著錄信息等。長此以往,才能更好地迎合數字環境特征,大幅度提升圖書館古籍的整理和保護水平。
參考文獻:
[1]周瓊芳.惠州市古籍普查與保護工作研究——以惠州市古籍公藏單位為例[J].圖書館學研究,2014,29(3):166-171.
[2]李明杰.數字環境下古籍整理范式的傳承與拓新[J].中國圖書館學報,2015,26(5):126-128.
[3]張文玥.數字化背景下古籍整理展望[J].唐山師范學院學報,2016,23(1):71-75.
[4]姜妮.國內古籍數字化之解析與探討[J].四川圖書館學報,2016,23(1):114-119.
作者簡介:趙娜(1979-),女,漢族,河南西華縣,本科,館員,研究方向:圖書館學。