古籍書目數據庫的設計與開發

2010-12-31 00:00:00李銳楊清林

現代情報 2010年9期

〔摘要〕針對北京林業大學圖書館館藏古籍面臨的一些問題，提出了建設古籍書目數據庫，并進行了系統功能和流程的設計及開發，闡述了部分特色功能的具體實現，并對系統實施后的運行情況進行了討論。通過古籍書目數據庫的建設，解決了存在的問題，便利了讀者，加強了讀者與圖書館的互動溝通。

〔關鍵詞〕古籍;書目;數據庫;開發

DOI:10.3969/j.issn.1008-0821.2010.09.018

〔中圖分類號〕G250.74 〔文獻標識碼〕B 〔文章編號〕1008-0821(2010)09-0071-04

Design and Development of Ancient Books Bibliographic DatabaseLi Rui Yang Qinglin

(Library，Beijing Forestry University，Beijing 100083，China)

〔Abstract〕In view of the problems that the ancient books of Beijing forestry university library is facing，ancient books bibliographic database was established，including the development and design of functions and flows，and how to develop some characteristic functions was described，at last，the operation situation of this system was discussed.By constructing ancient books bibliographic database，the problems were resolved，making convenience for readers and strengthening the inter-relation between readers and library.

〔Keywords〕ancient books;bibliography;database;development

古籍是中華民族悠久歷史與燦爛文化的最重要的載體之一，蘊藏著巨大的精神財富與智力資源，對于了解、把握我國的歷史和指導未來發展都具有重要的借鑒意義。國內大部分圖書館都將古籍特別是古籍善本作為珍貴館藏，對此類圖書的借閱和使用有著嚴格的規定，讀者使用非常不方便，古籍的利用率很低，如果將古籍進行數字化處理將會較好的解決古籍的收藏和使用之間的矛盾，并能有效提高古籍的利用率;但由于古籍文獻的文字體例、內容、載體形式和裝幀方式與現代文獻有著很大差別[1]，國內大部分圖書館正在應用的自動化集成管理系統尚不能較為完善的對古籍進行編目，探尋一條較為合理的將古籍進行數字化的道路是國內圖書館界正在面臨的問題之一，而實現古籍書目的數字化將對問題的解決提供有益的探索。

1 問題提出與分析

第一，北京林業大學圖書館目前擁有《四庫全書》、《四庫全書存目叢書》、《續修四庫全書》、《叢書集成初編》、《叢書集成續編》、《古今圖書集成》、《民國叢書》、《四部叢刊》、《北京圖書館古籍珍本叢刊》、《宋元方志叢刊》等大型新版古籍叢書，但這些新版古籍叢書在圖書館信息管理系統中都未被標注出詳細的子目，讀者難以檢索和查看到全面的信息。

第二，現有的圖書館信息管理系統難以完全滿足古籍書目特有的錄入和檢索要求，檢索時讀者往往在輸入繁體的檢索詞后才能進行正確的檢索，而且通常無法進行朝代、字、號等字段的檢索，缺少古籍編目所需要的很多字段，既無法全面的描述古籍，讀者檢索也很不方便。

基于以上的問題，筆者提出構建古籍書目數據庫。以期達到如下的系統目標:①依據四庫分類法，設置較為完整的古籍描述字段，并可以發布相關圖片，較為全面的描述古籍;②實現描述字段的完全檢索，允許讀者二次檢索、下載書目，能與讀者進行一定程度的互動交流;③允許讀者按照四庫分類法對古籍書目進行分類瀏覽;④實現讀者檢索時輸入檢索詞的繁簡字體自動轉換;⑤實現對讀者檢索行為的初步統計和分析;⑥具有較為完善的后臺管理功能，能夠便捷的管理工作人員及其權限，方便的添加、刪除、修改古籍書目;⑦能夠將現有信息管理系統中的相關古籍書目數據遷移到新系統中，減少重復勞動。

2 系統功能設計

為實現系統目標，將系統分解為前臺和后臺兩個子系統，共11個模塊:檢索模塊，瀏覽模塊，繁簡轉換模塊，檢索記錄模塊，交互模塊，書目下載模塊;書目管理模塊，人員管理模塊，交互管理模塊，統計分析模塊，用戶驗證模塊。如圖1所示。

2.1 前臺子系統

子系統功能概述:用戶為讀者，完成讀者的檢索、瀏覽書目的請求，記錄讀者的檢索行為，自動完成檢索詞的繁簡字體轉換，并可以進行二次檢索、下載書目，此外，讀者還可以瀏覽最新的消息、留言及回復，還可以進行留言。具體功能描述如下:

2.1.1 檢索模塊

讀者輸入檢索詞后，根據其選擇的檢索方式和檢索項，分頁給出檢索結果列表，讀者可以進行二次檢索，點擊每一條記錄可以查看詳細書目。

2.1.2 瀏覽模塊

允許讀者按照四庫分類法的部、類、屬分門別類的瀏覽書目，分頁給出古籍書目列表，讀者可以在此基礎上進行二次檢索，點擊每一條記錄可以查看詳細書目。

2.1.3 繁簡轉換模塊

判斷讀者輸入的檢索詞的字體類型，如果是繁體則直接將檢索詞提交給檢索模塊，如果是簡體則轉換為繁體后提交給檢索模塊。

2.1.4 檢索記錄模塊

實時記錄讀者輸入的檢索詞及時間，并將其儲存到后臺數據庫以供統計和分析。

2.1.5 互動模塊

允許讀者瀏覽最新信息和留言與相關回復，讀者還可以依據自己的問題來提交留言。

2.1.6 書目下載模塊

判斷讀者是否選擇了要下載的書目，如果選擇，則要求讀者填寫其電子郵箱地址，并對其郵箱地址進行可用性驗證，驗證通過后，將讀者選擇的書目信息發送其所提供的郵箱中。

期古籍書目數據庫的設計與開發2.2 后臺子系統

用戶為古籍書目管理人員，主要完成古籍書目的管理(添加、刪除、修改)、人員和權限的管理，互動模塊的管理，檢索詞初步統計分析，開發完成后如圖2所示。

2.2.1 書目管理模塊

書目管理人員登錄后可以進行古籍書目的添加、刪除、修改。

2.2.2 人員管理模塊

管理員可以添加、刪除工作人員賬號，并設定其權限和密碼，普通工作人員可以修改自己的密碼。

2.2.3 互動管理模塊

用于添加、刪除、修改最新消息，回復用戶的留言，刪除不適宜的留言。

2.2.4 統計分析模塊

對讀者的檢索行為(主要是關于檢索詞的)進行初步的統計分析，列出讀者最常用的檢索詞。

2.2.5 用戶驗證模塊

在用戶登陸時對其身份有效性進行驗證，在用戶使用后臺相關模塊時對其權限進行驗證。

3 主要的流程設計

整體的流程圖較為復雜，依據功能設計，給出檢索流程圖(圖3)和后臺管理流程圖(圖4)。

由于數據遷移屬于一次性完成功能，通過數據抓取直接實現，不在此詳述。

4 系統實現

4.1 技術平臺選擇

開發平臺采用windows Xp+Apache+Mysql+PHP+Ajax，運行平臺采用Linux+Apache+Mysql+PHP+Ajax，從開發平臺向運行平臺的系統遷移很容易實現，LAMP[2]模式也是目前較為穩健且免費的一種WEB應用系統平臺，Ajax[3]技術可以為交互式應用提供較好的支持。

系統體系構架上選擇B/S[4]結構，無論是讀者還是工作人員都無需使用專門的客戶端，也不用再進行專門的培訓，會使用網頁瀏覽器即可完成所有的系統功能，同時減輕了系統開發的負擔。

4.2 部分特色功能的實現

4.2.1 繁簡體的自動轉換

首先建立一個常見繁體字的字庫，與其相應的簡體字建立一一對應關系，生成對照表，系統在接收到檢索請求后先根據檢索詞的ASCII碼判斷其字體為繁體還是簡體，如果是簡體則查詢對照表進行轉換，查詢不到則不轉換直接提供檢索請求，如果是繁體則無需轉換直接進行檢索。譬如輸入“農”字進行檢索，可以直接得到含有“農”的書目，如圖5所示，上半部分為輸入檢索詞，下半部分為檢索結果，限于篇幅僅截取了部分界面。圖5 繁簡字體自動轉換

4.2.2 書目下載的實現

首先判斷用戶是否選擇了要下載的書目，如果未選擇將給予相應提示，然后判斷其輸入正確的電子郵箱格式是否正確，不正確則請其重新填寫，最后利用PEAR[5]項目中提供的Mail[6]、MailMime[6]、MailmimeDecode[6]等程序包實現郵件的發送，將讀者所選擇的書目詳細信息發送到其指定的電子郵箱中。

4.2.3 書目目錄樹的實現

依據四庫分類法，運行php腳本查詢mysql數據庫，判斷出部、類、屬各級目錄下是否有子分類，js腳本根據查詢得到的數據來決定目錄樹的結構從而實現顯示，結果如圖6所示，具體的判斷邏輯和實現方法不在此詳述。圖6 古籍書目目錄樹

5 系統特點

(1)實現了檢索詞的繁簡字體在后臺的自動轉換，很大程度上方便了讀者;提供了較為齊全的檢索方式和檢索詞匹配方式，實現了全字段檢索，能夠進行二次檢索;為讀者提供了檢索結果保存功能(郵件發送方式)。

(2)為讀者提供了瀏覽功能，依據四庫分類法分類瀏覽所有的書目，結構清晰，使用方便，有助于熟悉古籍的讀者快速查找到所需的書目。

(3)為讀者和工作人員之間建立了較為順暢的溝通渠道，既便于讀者的問題得到及時解答，又有利于工作人員實時把握讀者的最新需求，從而提供更好的服務與幫助。

(4)提供了較為完善的后臺管理功能，能夠便利的進行古籍書目的加工、數據遷移，用戶與權限管理清晰明確，并且預留了添加書籍相關圖片的數據接口，此外還具備了初步的讀者行為(檢索詞)統計分析功能，便于掌握讀者的檢索行為規律從而進一步提高系統的可用性和易用性。

(5)所采用的系統平臺的相關軟件全為開源項目，性能穩定，易于升級和遷移，而且沒有軟件使用費用，綜合運用了服務器端和客戶端開發技術，提高了系統的易用性。

6 討論

6.1 標準規范化問題

目前國內很多圖書館都在進行古籍數字化方面的建設，但尚無統一的規范和標準，基本上各個館自行其事，這樣開發的系統既不具有通用性，又耗費了很多的人力物力，也不利于古籍數字化的健康發展。

6.2 系統存在的問題

本系統的開發具有實驗性質，基本上滿足了設計要求，但字庫很小，繁簡體自動轉換的問題還很大，繁體和簡體之間并不是簡單的一對一關系，經常有多對多的情況，要解決這個問題還需要廣大有志于古籍數字化工作的同志進一步的協作和努力，特別是古籍研究人員要和技術開發人員搞好合作才能進一步將此問題細化乃至解決。

6.3 古籍數字化與數字圖書館的同步與結合問題

古籍數字化要作為圖書館數字化建設的一部分，最好是利用已有數字化圖書館的技術平臺，盡量在此基礎上進行擴展和補充，盡可能避免浪費人力、物力，要力圖避免造成信息孤島，開發新的系統要考慮到跨平臺檢索的問題。

參考文獻

[1]王雪迎，楊慧.計算機古籍編目初探[J].清華大學學報:哲學社會科學版，1999，14(2):85-89，94.

[2]百度百科.LAMP[EB].http:∥baike.baidu.com/view/365086.htm?fr=ala011，2009-12-08.

[3]百度百科.Ajax[EB].http:∥baike.baidu.com/view/1641.htm?fr=ala01，2009-12-08.

[4]百度百科.B/S[EB].http:∥baike.baidu.com/view/679018.htm?fr=ala01，2009-12-08.

[5]THE PHP GROUP.PEAR[EB].http:∥pear.php.net，2009-12-08.

[6]THE PHP GROUP.PEAR Packages[EB].http:∥pear.php.net/packages.php，2009-12-08.

現代情報2010年9期

現代情報的其它文章: 從圖書館學學術信息非正式傳播的角度分析我國圖林博客; 新技術環境下區域數字圖書館的發展與實踐; 協助優秀主管為企業研發及市場營銷界面建立知識管理系統; 評價期刊影響力的三項指標比較研究; 制造商與供應商信息共享程度評價研究; 高校圖書館基于城市社區服務模式的調查與對策研究