胡建峰
(衢州市圖書館,浙江 衢州 324000)
〔作者信息〕胡建峰,男,信息技術部副主任,館員。
地方文獻數據庫是圖書館為科研、生產活動提供信息服務的重要情報源,它匯集了特定地方的政治經濟、文化教育、歷史地理等各方面的文獻資料,向讀者提供地方文獻的全文信息或檢索線索。近年來,各地方圖書館都在積極開展地方文獻數據庫的建設工作,衢州市有關部門和圖書界的同仁們都十分重視,市圖書館、各縣圖書館等都在這方面做了不少的工作。但是,由于各個單位在文獻收集和管理上各自為政,缺乏宏觀調控,造成衢州地方文獻在建設上還缺乏整體性和規劃性,在利用上不能實現資源共享,在文獻的管理和揭示上更是缺乏規范性和系統性。為此,建立以網絡為基礎條件的地方文獻數據庫,為挖掘和利用地方文獻資源提供一個共建共享的大平臺,對于推動衢州經濟文化建設和對外開放都具有積極的意義,也是衢州圖書信息服務科研工作中的一項基礎工程。
幾年來,衢州市圖書館充分利用報紙、廣播、電視等媒體,廣泛宣傳圖書館地方文獻工作的重要意義和地方文獻呈繳本制度。注意發揮地緣優勢,廣泛向全國各地衢州籍專家學者寄發征集函。與此同時,又注意加強與各級黨史辦、方志辦、地名辦、政協文史委、統計局、社科聯、文聯、科協等有關部門的溝通交流,努力構建文獻征集網絡。
據統計,市館地方文獻藏有 8613種,14326冊。其中,各種地方志、專業志 115種 232冊,地方年鑒 37種 72冊,地方黨史、組織史 95種 219冊,地方史料 197種、451冊,府、縣古地圖 30幅。通過重點征集與長期掛鉤征集相結合,收集各種報刊 76種 823冊;通過服務征集與追蹤征集結合,從《四庫全書》中查找復制宋代程俱的《北山小集》40卷、《麟臺故事》5卷;元代吾丘衍的《周秦刻石釋音》、《學古編》、《閑居錄》各 1卷,以及《竹素山房詩集》3卷;衢州歷代名人中,衢籍作者的傳世佳作錄入《四庫全書》的有 43人,61種 594卷。通過剪報輯錄的《三衢兒女》專題人物 225位,為衢州名人專題數據庫的建立奠定了基礎。
通過抽樣調查的方式對部分文獻收藏單位進行地方文獻收藏情況調研,基本情況歸納為以下幾個方面:
衢州地方文獻的蘊藏量非常豐富,但收集工作呈分散性和多樣性。如開化縣圖書館歷來非常重視地方文獻工作,但是只針對開化境內的文獻收藏,而衢州市圖書館主要負責對全市文獻的收藏,部門之間的重復工作造成了資源浪費;另外,圖書館、檔案館、地方志辦公室等多家之間缺少主動合作和有效的管理機制,出現有些文獻缺藏的狀況,使得整個地區的文獻建設缺乏完整性和系統性。
一方面是因為對地方文獻的收集范圍在概念上缺乏統一的認識,另一方面各收藏部門受自身人力、物力和技術條件的限制,對一部分學術研究型的文獻的收集,衢州地區幾乎處于空白狀態。如發表在學術期刊上的學術論文、專業性學術會議論文和一些特種文獻。而這些文獻能在很大程度上反映出本地區的經濟、科技和文化的發展,對地方建設有很重要的指導意義。
首先,地方文獻的各個收藏部門基本上采用手工為主的低層次的加工處理方法,作為信息產品只能在局部范圍內利用;其次,對文獻開發的隨意性較普遍,而且,文獻著錄不規范、標準不統一,難以適應數字化和網絡化發展的需求,使得地方文獻無法實現網絡化的共享;再者,整個衢州地區地方文獻收藏單位因功能和職責不同,給利用帶來很大的不便。如文保部門主要是以保存為目的,一般不作為信息提供需求者使用,同時從文物保護的角度考慮還要盡量降低使用頻率。盡管如此,這部分文獻會因保存時間過長而逐漸毀壞。
數據庫建設是運用高速發展的計算機、網絡、影像描述技術,把存放在庫房里的各種地方文獻變為便于存放及查看的電子文獻,并存入大型數據庫,建立網絡圖像管理系統。目的是提供豐富的信息資源實現資源共享,尤其是在網絡環境下必須要求擁有完善的、結構合理的檢索功能體系。根據地方文獻數據庫建設的要求,信息存儲一般需要具有以下特點:
①系統能完全兼容CDS/ISIS、ISTIC/ISIS、QuickIMS的數據及其功能;
②界面標準化,和其它數據庫產品在界面上保持風格一致,提供數據庫桌面管理工具的全部數據維護管理功能;
③用戶可在本地建立自己的 R M S數據庫,包括數據庫的定義、數據維護(可定制數據維護格式)、索引維護、檢索、排序、分類和統計報表等;支持用戶自定義報表、統計分析、分類檢索、邏輯子庫等功能;
④可完成MARC、ISO-2709、XML等格式的數據交換功能, 可將任意格式的關系數據庫導入本系統;
⑤支持基于字典的標準數據維護和記錄間的數據復制和拷貝,在系統數據維護方面,支持數據字段的缺省值維護,支持表格式維護和用戶自定義格式維護,簡單易用;
⑥全面支持子字段、重復字段和外部文件、多媒體等對象數據處理;支持基于詞表的自動標引,支持大小寫敏感標引和檢索;支持字段檢索、自然語言搜索等全文內容的搜索和結果排序輸出;
⑦可同時管理本地的遠程授權資源庫;系統支持數據庫的基于日志的數據備份與恢復功能。
2.2.1 信息資源目錄體系的建設
為了便于信息資源的采集、處理和利用,必須對浩瀚的信息進行合理的分類,目錄體系是在合理的信息分級、分類基礎上,將所有業務工作所需的信息資源編制一個統一的目錄。通過目錄服務使信息資源的使用者、維護者方便地按照目錄和索引的導航進行工作。信息資源目錄體系是全面整合信息資源的先決條件,也為未來的統一信息服務平臺的建設奠定基礎。
2.2.2 建設信息資源數據庫平臺
全面整合信息資源采集渠道、信息內容,建設圖書館信息資源特色數據庫平臺。將現有的地方特色文獻進行數字化加工,形成可以直接利用的電子文獻,并借助平臺的便捷性為讀者提供資源的查詢利用。
2.2.3 建設統一信息服務平臺
整合各種信息資源和業務模塊,建設具有先進水平的集信息采集、存儲和服務于一體的多功能平臺,能夠全天候及時地為讀者提供信息服務。
2.2.4 安全保障體系建設
建立信息安全保障體系框架,逐步完善信息安全管理體制;加強對信息采集、整合、加工、分析工作的監督和審計,保證信息資源的真實、完整、有效;建設信息安全分級體系,滿足不同類型工作人員的不同信息需求;采用身份認證、訪問控制、防火墻、數據備份等安全防護技術措施,確保信息資源和系統安全。
特色數據庫系統應用平臺框架分為五層,自下而上分別是:基礎設施層、系統軟件層、應用軟件層、數據庫資源層、用戶服務層。
基礎設施層:主要由計算機、網絡、存儲系統等組成,是系統運行的硬件環境。
系統軟件層:主要由操作系統、數據庫管理系統等系統軟件組成。
應用軟件層:是管理特色數據庫系統工作平臺,主要包括資源加工、資源管理、資源利用、信息檢索、用戶服務等子系統。
數據庫資源層:按信息來源包含 3類數據庫:互聯網數據庫、業務信息庫、工作資料庫。
用戶服務層:主要包含導航檢索、跨庫檢索、數據挖掘、信息發布等內容。
對于開展圖書館文獻資料數字化研究,擬出一條適合的技術流程,為全面實現文獻資料管理
掃描子系統的主要流程如圖 1所示:的信息化奠定基礎,能有效地整合圖書館各部門的信息資源,使之成為有序的、管理簡便并且完善的資料庫。
數字加工處理系統可劃分為掃描子系統和標引子系統。具體加工流程如下:①把所有紙質文獻資料通過掃描形成電子圖像文件,保存一套原始的數字圖像文件;②對古籍的電子圖像文件進行全文 O C R識別,形成全文文本數據,并和圖像文件一起生成雙層 pdf格式文件;③對期刊的圖像進行標引取得各自的元數據,轉換成 X M L文件;④將圖像文件、元數據及全文文本數據整合形成電子文獻資源庫。

圖 1 掃描子系統的流程圖
標引子系統的主要流程如圖 2所示:

圖 2 標引子系統的流程圖
〔1〕周文.地方文獻數據庫的建設的實踐與思考[J].內蒙古科技與經濟,2009(5):152-153
〔2〕尤維玲.我國圖書館的地方文獻工作研究[J].黑龍江科技信息,2008(22):116
〔3〕江濤.淺談我館地方文獻資源建設[J].貴圖學刊,2008(2):71-72
〔4〕周欣娟.構建萍鄉地區地方文獻數據庫的思考[J].萍鄉高等專科學校學報,2003(3)
〔5〕董志珍.關于衢州圖書館地方文獻工作的思考.圖書館研究與工作,2008(2):69-72