徐菁樺(1.武漢大學信息管理學院,湖北武漢430072;2.北京世紀書之源信息咨詢有限公司,北京100048)
世界一流大學圖書館館藏數據庫分析
徐菁樺1,2
(1.武漢大學信息管理學院,湖北武漢430072;2.北京世紀書之源信息咨詢有限公司,北京100048)
對十所世界一流大學圖書館收藏數據庫的數量進行統計分析,并以哈佛大學圖書館為例討論其收藏數據庫的種類,對十所大學圖書館收藏數據庫的特點進行總結,以期對國內高校圖書館的數據庫建設有所啟迪。
數據庫;大學圖書館;數據分析
隨著計算機技術、數字信息技術的迅猛發展,計算機的使用越來越普及,電子信息資源和網絡信息資源的利用率不斷提高。為了滿足廣大讀者對文獻信息資源的多元化、高層次需求,世界一流大學圖書館紛紛投入大量精力進行數字館藏建設,數據庫的建設是其中的重點。數據庫是一個按一定的數據模型來組織、存儲和管理數據的倉庫,它最主要的用途是記錄和維護信息。數據庫一般包括:文摘索引型數據庫、事實型數據庫、全文型數據庫三種類型。文章以官方語言為英語的十所世界一流大學圖書館為調查對象,對其收藏數據庫的數量進行了調查;以哈佛圖書館為例,分析其收藏數據庫的種類,并對十所大學圖書館收藏數據庫的特點進行分析總結。
圖書館購買、自建或是通過其它方式能夠使用的數據庫,均認為是該館收藏的數據庫。表1是世界一流大學圖書館列表。

表1 大學圖書館列表

序號大學圖書館名稱所屬國家序號大學圖書館名稱所屬國家3牛津大學圖書館英國8普林斯頓大學圖書館美國4劍橋大學圖書館英國9加州大學伯克利分校圖書館美國5麻省理工學院圖書館美國10康奈爾大學圖書館美國
通過軟件獲取上述十所大學圖書館收藏數據庫名稱、數量、描述字段等信息,統計得出各圖書館收藏數據庫的數量,圖1是十所大學圖書館收藏數據庫的數量統計。

圖1 十所圖書館收藏數據庫排序圖(單位:個)
十所圖書館共收藏數據庫9679種/11519次,重復率為1.19。如圖1所示,收藏數量超過一千個的圖書館個數占調查總數的70%,康奈爾大學圖書館收藏數量最多,達1594種,是劍橋大學圖書館的2.8倍。
哈佛大學圖書館共收藏1564個數據庫,通過十二個字段(Database Name、Bookmark、Alternative Name、Description、Coverage、Updated、Related Formats、User Guide、Search Hints、Restriction、Type、Subject/Subcategory)進行描述。哈佛大學圖書館將數據庫分為21種(見表2),為了便于統計研究,根據數據庫是否包含全文文獻將其分為全文數據庫和檢索數據庫,具體信息如表2、3,圖2、3所示。

表2 哈佛大學圖書館數據庫種類列表(單位:個)

序號種類名稱數據庫數量5 Dictionaries and encyclopedias(字典百科全書數據庫)127 6 Newsmedia(新聞媒體數據庫)91 7 Library catalogs and bibliographies(圖書館目錄及書目數據庫)68 8 Statistics and data(統計數據數據庫)65 9 Directories and guides(目錄指南數據庫)56 10 Archivalmaterials(檔案材料數據庫)55 11 Other(其它數據庫)52 12 Harvard digital collections(哈佛數字館藏數據庫)41 13 Library web sites(圖書館網址數據庫)30 14 Biographies(傳記數據庫)19 15 Image collections(圖像數據庫)18 16 Subject gateways(主題網關數據庫)15 17 Sound recordings(錄音數據庫)9 18 Electronic book/text collections(電子書或教材數據庫)3 19 Archivalmaterials Electronic book-text collections(檔案材料、電子書數據庫)1 20 Subject gateways Electronic book-text collections(主題網關、電子書數據庫)1 21未標識數據庫種類80合計1564
表3中第三列數字是相應種類的數據庫數量,最后一列數字是每一種數據庫數量占總數(1564—80=1484)的比例。鑒于Newsmedia、Harvard digital collections、Library web sites、Image collections、Subject gateways、Sound recordings六類數據庫進行學術研究時較少用到,且數量相對較少,因此統一歸為全文數據庫中的其它數據庫。凡是具有兩種種類的數據庫,例如種類為Archivalmaterials Electronic book-text collections以及種類為Subject gateways Electronic book-text collections的數據庫,為了避免重復計算數據庫種類,上述兩類數據庫分別記作Archivalmaterials(檔案材料數據庫),Subject gateways(主題網關數據庫)。

表3 數據庫種類列表(單位:個)
圖2、3分別描述了全文數據庫、檢索數據庫中各個類型數據庫所占比例。從圖2可知,電子書、研究指南和電子期刊三類數據庫占據全文數據庫54%的比例,為全文數據庫的主要類型。圖3顯示了檢索數據庫由期刊索引、圖書館目錄及書目、目錄指南三類數據庫組成,其中期刊索引數據庫所占比例達60%,是檢索數據庫的主體類型。

圖2 全文數據庫中各種類型數據庫所占比例圖

圖3 檢索數據庫中各種類型數據庫所占比例圖
從十所大學圖書館收藏數據庫的數量及哈佛大學圖書館數據庫收藏的種類分布情況,可以看出具有如下幾個特點:
(一)收藏數據庫的數量龐大,內容豐富
從圖1可以看出,這十所大學圖書館收藏數據庫總量都超過了500個,其中有7所大學圖書館數據庫收藏量超過了1000個。這足以說明世界一流大學圖書館收藏數據庫數量之大。
(二)檢索功能完備
十所大學圖書館在檢索功能上都做得較完善。以哈佛大學圖書館為例,將上千個數據庫有序組織起來,統一到一個檢索平臺上。檢索數據庫不僅可以按字順查找,還可按關鍵詞、學科主題查找,把每個數據庫作為一個文獻單元進行標引,如同圖書一樣,對每個數據庫所歸屬的學科主題進行深入標引,這大大提高了讀者的檢索效率,使每位讀者都能迅速在平臺上檢索到自己所需的數據庫中的內容,方便快捷。
(三)數據庫收藏類型多樣
以哈佛大學圖書館為例,不僅有圖書館書目數據庫、電子期刊數據庫,還有在國內高校圖書館中很少見的傳記數據庫、檔案材料數據庫、字典百科全書數據庫等[1]。
(四)各館間數據庫收藏重復率低
十所圖書館共收藏數據庫9679種,而重復率僅為1.19,這說明各圖書館所擁有的數據庫大部分都是獨有的,這就為文獻共建共享提供了條件,各個圖書館都可將自己館內的獨有數據庫通過館際互借、文獻傳遞等手段分享給其它圖書館,促進各圖書館間的交流,共同發展,同時也可使讀者足不出戶就可獲得所需的最廣泛的資料,這大大提高了文獻保障率,使最廣博的數據庫內容得到了最廣泛、合理的利用。這也給我國大學圖書館數據庫建設提供了很好的啟示和借鑒。
文章基于數據統計對世界一流大學圖書館館藏數據庫進行了宏觀分析,并對其特點進行了總結。隨著信息技術的飛速發展,國內高校圖書館也迎來了全新的外部環境,為更好地為教學科研做好服務,必須做好數據庫建設。國外一流大學圖書館的數據庫建設經驗可以成為國內圖書館建設的良好借鑒。國務院剛剛印發了《統籌推進世界一流大學和一流學科建設總體方案》,高校圖書館正依此制定十三五發展規劃,因此,了解世界一流大學圖書館館藏數據庫的宏觀建設情況對我國高校圖書館制定文獻信息資源建設規劃具有十分重要的借鑒意義。
[1]王佳.高校圖書館特色館藏數據庫建設研究[J].圖書館學刊,2014,(3).
[編校:龔添妙]
Analysis on the Library Collection Database of the Avant-Garde Universities in theWorld
XU Jinghua
(1.School of Information Management,Wuhan University,Wuhan Hubei 430072; 2.Beijing Century Isource Consultation Co.Ltd.,Beijing 100048)
This article counts and analyses the amount of the library collection database of the ten avant-garde universities in the world.Taking the Harvard University library for example,the article discusses the kinds of the library collection database of the Harvard University.Besides,this article also summarizes some characteristics of the library collection database of the ten universities so as to be inspired by our librarians in the construction of the collection database.
database;university library;data analysis
G258.6
A
1617-9654(2015)04-068-05
2015-10-19
徐菁樺(1987-),女,江蘇蘇州人,在讀碩士研究生,研究方向為數字圖書館。