畢艷芳,曹學艷
近幾年來,隨著數字出版的發展,電子書由于其成本較低、占用空間較少等顯著優勢在高校圖書館數字館藏中所占的比重越來越大[1]。在2008 年針對英國所做的關于電子館藏的調查結果顯示,3/4 的學術圖書館和一半的公共圖書館打算在2009 年增加他們的電子書館藏,并且有一半的圖書館表示將以電子書作為各個學科核心書目的重要支持[2]。根據教育部高校圖書館事實數據庫的統計[3],2010- 2012 年三年間,清華大學、北京大學、西安交通大學、上海交通大學和電子科技大學五所高校的電子書數量均有較大的漲幅,尤其是清華大學和電子科技大學,這兩所高校圖書館2012 年的電子書數量較2011 年分別增長了254%和31%(如圖1 所示)。

圖1 2010-2012年五所高校電子書累積量
我國高校圖書館電子書的采購方式一般分為訂閱(遠程訪問)模式和買斷(鏡像)模式兩類。而買斷模式由于其訪問速度較快、不需要支付年度訪問費用、采購靈活等優點,成為很多高校圖書館優先考慮的電子書采購方式。買斷模式下的電子書選書流程如圖2 所示,最終的書單由本校讀者反饋推薦上來的“推薦書單”和采訪館員自行挑選的“自選書單”兩部分組成。因此,買斷模式電子書建設數量的劇增給圖書館員特別是采訪館員帶來了全新的挑戰。

圖2 買斷模式電子書選書流程圖
目前,國內外專家學者已經針對選書系統做了一些研究,例如,Binge Cui 和Ankit Khera 基于不同的程序語言和輔助工具分別設計開發了不同的網上選書系統[4-5],邱成曉所研究開發的基于J2EE 技術的網上選書系統主要適用于網上書店等電子商務領域[6],孫卿采用UML 建模語言設計實現的圖書薦購系統主要針對的是讀者用戶群的推薦書單這一部分[7],唐高芳在其研究成果中論述了選書薦購系統的運作模式、界面要求及系統的結構與功能,并沒有涉及到選書系統的設計和實現[8]。上述研究成果中所涉及的選書系統,無一例外的均是針對選書流程中的推薦書單這一部分,并不適用于采訪館員所要集中選取的自選書單。而實際上由于采購時間短、院校師生選書時間有限,推薦書單上的書目較少且存在一定的片面性,因此很多時候選書的重任仍然落在采訪館員肩上。為了幫助采訪館員在短時間內集中挑選出適合本館館藏的電子書,本文基于Delphi 語言構建了由“數據導入/建庫、選書、數據導出”三個模塊組成的通用型電子選書系統。通過對Excel 表單格式的大批量源書目數據的讀取和分析,系統從設定字段如:“學科分類、出版時間范圍”等多字段、多途徑對源書目數據進行過濾和篩選,獲取滿足學科發展需求和館藏建設的最有價值和代表性的電子書目集合。
通用型電子書選書系統的系統框圖如圖3所示。由于EXCEL 電子表格在數據處理過程中容易發生數據丟失或更改,因此選書系統的第一個環節就是數據導入/ 建庫,即將XLS 或XLSX 格式的電子表格轉換成MDB(Microsoft Database)存儲格式的電子表單,以便后面進行的數據操作。在數據導入/建庫過程中還可以對書單的字段進行一個選擇和重命名。按照選書的習慣,書單的字段可分為三種類型:必備字段、有則必備字段、可選字段(如表1 所示)。這些字段采訪館員均可以在第一個環節中自行選擇或更改。

圖3 通用型電子書選書系統框圖
建庫完成后,將進入第二個環節—選書。在對大批量電子書進行挑選的過程中,學科分類和出版時間范圍是采訪館員選書的重要依據。學科分類由數據庫商提供,中文電子書和外文電子書的學科分類分別參照中國圖書館分類法和美國國會圖書館分類法來劃分。出版時間范圍以每五年為一個時間界限,分別為:1990 年以前圖書、1990- 1994 年圖書、1995- 1999 年圖書、2000- 2004 年圖書、2005- 2009 年圖書和2010- 2013 年圖書。出版時間范圍不需要數據庫商提供,系統在運行過程中將自動讀取出版時間字段的前四位數字,因此出版時間字段的前四位必須是出版年代,如:2013/7/1,2013- 07- 01 等。

表1 書單字段
通用型電子書選書系統的最后一個環節是數據的導出。此過程是將已經選擇的書目導出并保存為EXCEL 表單格式的數據,并返回給數據庫商進行買斷模式電子書的安裝。
Delphi 是Inprise(原Borland)公司推出的應用程序開發工具,具有功能強大、運行速度快、易于學習和使用以及開發效率高等特點。它是可視化應用編程開發環境、可重用性面向對象編程語言、快速編譯器和數據庫的完美結合[9]。
基于Delphi 語言的通用型電子書選書系統分為數據導入/建庫、選書、數據導出三個部分。數據導入/建庫部分的軟件流程如圖4 所示。特別注意的是在第一部分中,“學科分類”和“出版時間”是兩個特殊字段,系統運行時需將這兩個字段作統一的名稱修改,以便完成第二部分選書環節的數據分類模塊的顯示。數據導入/建庫部分的核心程序源代碼如下:

圖4數據導入/建庫軟件流程圖



圖5 選書和數據導出軟件流程圖
選書和數據導出兩個部分的軟件流程圖如圖5 所示。選書和數據導出兩個部分的核心程序源代碼如下:


為了檢測通用型電子書選書系統的性能,將測試表單數據(共計2 萬條)導入該選書系統中。數據成功導入后,用戶界面如圖6 所示。按照表1 中所提到的必備字段、有則必備字段、可選字段結合選書習慣來對源書目的選書字段進行篩選。點擊“保存”按鈕后,系統會將EXCEL 表單文件自動轉換成MDB 格式的電子表單。第一階段的數據導入/建庫結束后,進入第二個階段—選書階段。選書階段的用戶界面如圖7 所示。界面左上側分別提示各個學科電子書數量和已選的電子書冊數。通過左側部分的勾選框就可以進行電子書的選書。選書完成后直接點擊“保存”按鈕就可以將所選的書單保存成EXCEL 表單格式。通過測試,整個選書系統功能正常,操作靈活高效,選擇的書目較為準確,完全符合最初的設計思路。

圖6 測試數據導入用戶界面

圖7 選書用戶界面
除了上述功能之外,基于Delphi 的通用型電子書選書系統還特別設計了“選書情況記錄”窗口(如圖8 所示),用戶可以在這個窗口中查看上次選書的時間、已選圖書的數量,同時還可以選擇“新建選書任務”還是“繼續選書任務”。這一獨特設計使得整個電子書選書系統更加人性化。

圖8 選書情況記錄窗口
當前電子書產業正蓬勃興起,繼數據庫和電子雜志的發展和應用之后,近年來電子書正日益成為出版商、圖書館、作者等的關注焦點。本文從前期的系統框圖設計到中期的軟件流程圖繪制再到后期的程序源代碼編寫、系統功能測試,完整地完成了一項基于Delphi 語言的通用型電子書選書系統的開發工作。該系統不受語種和提供商等書目信息的限制,處理源數據量大、操作靈活,避免人工處理過程中的“挑選- 復制- 粘貼”等重復性瑣碎勞動和工作誤差,具有科學、準確、高效的特點。利用該系統,采訪館員可以輕松高效地完成大批量、多語種以及各種類型的電子書選書工作,從而為圖書館電子資源的科學采購、篩選提供可靠性較高的技術輔助工具,具有良好的應用和推廣價值。
[1] 胡振華.電子書產業發展下的高校圖書館館藏建設研究[J].圖書館建設,2011(3):36- 39.
[2] 張曉林.現代圖書情報技術快訊[J].現代圖書情報技術,2009(1):104.
[3] 教育部高等學校圖書情報工作指導委員會,中國高等教育文獻保障系統.教育部高校圖書館事實數據庫系統[DB/OL]. [2013- 07- 09]. http://www.tgw.cn:18080/.
[4] Cui,Binge,Chen,Xin. An online book recommendation system based on web service[C]//Proceedings of 6th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2009. Tianjin:IEEE,2009:520- 524.
[5] Ankit Khera. Online Recommendation System[EB/OL].[2013- 09- 23]. http://scholarworks.sjsu.edu/etd_projects/97/.
[6] 邱城曉. 基于J2EE 的網上選書系統的實現[D]. 上海:華東師范大學,2005.
[7] 孫卿.山東省圖書館圖書薦購系統的設計與實現[D].濟南:山東大學,2010.
[8] 唐高芳.網上薦購系統在高校圖書館的應用分析[J].圖書館學研究,2008(1):19- 21.
[9] 高英,石文華. Delphi 數據庫開發基礎與應用[M].北京:人民郵電出版社,2006.