【摘 要】對民國期刊進行修復和數字化整理、開發意義重大。本文介紹并比較了民國時期期刊篇名數據庫、國家圖書館和CADAL的民國期刊庫等三個我國常用的民國期刊數據庫,并對這些數據庫在建設過程中存在的問題提出了建議。
【關鍵詞】民國期刊 數據庫 檢索
一、三種民國期刊數據庫概況
國家圖書館民國數據庫是中國數字圖書館最具特色的數據庫之一。民國時期的中文期刊是國家圖書館保存的民國文獻之一,為了更加有效的保護文獻、利用文獻,國家圖書館已對館藏民國期刊進行縮微膠片制作和數字化掃描,現有期刊電子影像的全文瀏覽4351種。
CADAL民國期刊庫是CADAL計劃的子數據庫,現收藏有6500多種期刊。CADAL計劃是大學數字圖書館國際合作計劃的簡稱,前身為高等學校中英文圖書數字化國際合作計劃。
民國時期期刊篇名數據庫(以下簡稱篇名數據庫)的信息源是上海圖書館館藏的民國時期期刊文獻,并由上海圖書館全國報刊索引編輯部編校出版。收錄范圍廣、期刊種類多、時間跨度長是其主要特色。該數據庫檢索功能強大、檢索途徑多,是目前國內制作較成熟的民國期刊數據庫,目前已有400多萬條篇名數據。
二、三種民國期刊數據庫比較
1、檢索方式
國家圖書館民國數據庫只提供簡單檢索、二次檢索和關聯檢索。簡單檢索包括題名、出版人、出版地、責任人、出版時間的檢索。二次檢索可對簡單檢索的各項再次檢索。CADAL的期刊數據庫設置有快速檢索、圖像檢索、高級檢索、視頻檢索、二次檢索和書法字檢索,并實現在學位論文、民國圖書、古籍、現代圖書和民國期刊等數據庫之間的跨庫檢索。此外,CADAL的數據期刊庫還提供分類瀏覽方式功能,用戶可通過瀏覽期刊名稱來進一步了解資源的情況。CADAL民國數據庫提供簡單檢索、二次檢索。首次的簡單檢索只提供題名項的檢索,二次檢索僅可自由輸入,進行模糊檢索。
從簡單檢索來看,國圖期刊庫的檢索點有6個,它們分別是“出版者”、“題名”、“責任者”、“模糊查詢”、“時間”、“地點”,而CADAL期刊庫的檢索點默認為所有字段。同時,這兩個期刊庫都提供高級檢索和二次檢索。在高級檢索中,國圖的期刊數據庫同樣也有該庫簡單檢索里的6個檢索點,而CADAL的期刊數據庫只有5個,分別是“書名”、“出版機構”、“作者”、“關鍵字”、“描述”。橫向對比,這兩個數據庫的4個檢索點是基本一致的:出版機構(或出版者)、責任者(或作者)、題名(或書名)、描述(或模糊查詢)。而CADAL的期刊數據庫雖然比國圖期刊庫的檢索點少了一個,但其提供的關鍵詞檢索點更貼近多數用戶的使用習慣。
與以上兩種數據庫相比,篇名數據庫的檢索更智能。該數據庫下設多種子庫,檢索時可避免盲目性。該庫檢索字段可按題名、全文段、作者進行檢索。首次檢索可選定期刊時間范圍,二次檢索可自定義模糊檢索,也可以按照相關度、文獻來源、年份讓系統排序。值得一提的是,該數據庫也是唯一可以全文字段檢索的數據庫。更方便的是,此數據庫可以在檢索中查看所要檢索內容的期數、所在版面、時間。
此外,篇名數據庫建設有比較完善的“刊名庫”。供應商通過這個“刊名庫”對館藏民國期刊進行分錄,用戶可以在“刊名”、“出版年份”、“出版周期”、“出版地”、“主辦單位”、“備注”、“館藏情況”欄目下圈定范圍,給用戶在提供了較為詳細的線索。更為方便的是,“刊名庫”中的“刊名”、“出版地”和“主辦單位”字段可與篇名數據庫實現鏈接檢索。
2、數據輸出和收費模式
CADAL的期刊數據庫對檢索結果提供打印、移動、保存、翻頁、縮小、放大、和90度旋轉功能,默認方式是書名排序,查詢結果每頁顯示20條。而國圖的期刊數據庫對檢索結果提供OCR(光學字符設別)、剪切、加入書簽和書架、打印、縮放、換膚、旋轉、翻頁等功能。或因國圖和CADAL這兩個民國數據庫都是免費的(用戶實名注冊即可使用),二者均只提供單頁保存功能。這樣,就給使用者帶來了極大不便。
與二者相比,篇名數據庫則可用PDF格式進行下載。進入下載頁面時,還能現實下載篇目的標題名、所屬刊物的信息。更方便的是下載完成后,文件名自動生成。但篇名數據庫卻需要支付不菲的下載費用。該庫有兩種支付方式:個人購買,該數據庫的價格是每頁兩元,郵費另計;集中購買,實行包年制度,一次性支付費用,全年無限次數使用,較適用于學校和科研機構。
三、三種民國期刊數據庫存在的不足和合理化建議
首先,標引質量亟需提高,數據庫數據標引深度還需加強。篇名數據庫經過最近長時期發展,目前已經成為國內發展時間最長的一個民國期刊數據庫。該數據庫以其保存便捷、檢索人性化特點,在這三種數據庫中始終保持使用率的領先地步。國家圖書館和CADAL期刊庫的民國期刊數據庫的用戶界面雖然簡潔,但功能單一,僅局限在按照期刊名稱進行瀏覽。這兩種期刊數據庫不提供篇名的具體檢索,所提供的題名檢索均局限在期刊名稱上,大大限制了用戶的查詢需要:國圖的期刊數據庫不能提供主題詞和關鍵詞入口;CADAL的期刊數據庫雖然提供關鍵詞檢索點,但具有很大的局限性。
其次,文獻保存相對困難,應完善用戶對相關數據瀏覽或下載的體驗。CADAL和國圖的期刊數據庫只能提供單頁保存功能,用戶對一篇文章的保存往往要花費大量時間,而且不能對文件進行編輯,會給用戶在使用上帶來很大不便。篇名數據庫雖然搜索人性化、便于保存和下載,但不提供期刊全本預覽,使得單篇數據缺乏整體性,使用者往往在對整本期刊進行整理保存時,可能由于單篇數據散雜不夠連貫,而降低了用戶的使用效率?;诖?,建議該數據對于單位用戶開放期刊整本預覽和單頁指定下載功能,個人用則考慮可以增設整本下載的功能。
第三,豐富數據庫的收藏量,加大對地方性期刊的收錄。收錄期刊數量的豐富與否是衡量一個數據庫質量的關鍵,國家圖書館民國數據庫收錄期刊4351種,CADAL民國期刊庫目前已有6500多種期刊,而民國時期期刊篇名數據庫收錄期刊篇目400多個條。收藏量之豐富是這三種數據庫的一大特點,而對于民國時期地方性期刊的收錄還待進一步完善。目前,各地方的圖書館或受規模和技術、資金的制約,無法或尚且沒有對現存的稀有地方性期刊進行數字化修復、整理和開發。因此,以上數據庫在建設過程中應依靠自身優勢加強與地方性期刊館藏單位的合作,不斷提高數據庫數據資源的廣度和深度,更好地為用戶服務。
最后,滿足用戶的不同需求,提供個性化服務和特色服務。比如,不同用戶在檢索的時候可以根據自己的需求保存自己的檢索結果和檢索策略,然后系統會自動根據這一指令進行檢索,并將檢索的結果通過電子郵件發送給用戶;另外,每個用戶可以根據自己的興趣愛好設定檢索范圍(如政論類、工學類、醫學類、農學類等),使系統檢索縮小到用戶的興趣偏愛的范圍內;還有,可以針對不同用戶特點提供服務,如制作成印刷版或光盤、實現網上傳送、開發專屬閱讀器等、在內容上多開發獨具特色的產品、加強信息資源的深加工、縮短更新周期、考慮與國際上的數據庫系統橫向聯合等?!?/p>
參考文獻
①張丁、王兆輝,《試論民國文獻的數字化建設》[J].《數字與微縮影像》,2011(3)
②吳佩娟,《查找民國文獻的有效工具》[J].《中國索引》,2009(12)
③黃玉華,《對全國報刊索引數據庫發展的探討》[J].《遼寧公安司法管理學院學報》,2005(3)
(作者:河南大學新聞與傳播學院碩士)
責編:周蕾