□劉佳音
南京航空航天大學圖書館,南京,210016
隨著數字圖書館的不斷發展,電子資源的建設與利用逐漸成為衡量一個圖書館實力的重要指標。目前電子期刊在江蘇省高校圖書館中有著較高的擁有率,構成了各館數字館藏資源的主體。據CALIS管理中心2005年統計,在參加CALIS集團采購電子資源的所有省份和地區中,江蘇省的采購量僅次于北京,位居第2位,全省圖書館采購的數據庫數量為46種,其中外文電子期刊數據庫29種,尤以Science Direct、EBSCO、Springer三大電子期刊數據庫的使用量最為突出。然而,與此同時,外文全文數據庫如Science Direct、IEL等的購買經費也在連年攀升,平均每個圖書館購買數據庫的費用達到45萬元[1]。在2007年底,曾經低價進入中國高校的Science Direct數據庫高調漲價。目前,在中國大陸,僅高校圖書館組團購買愛思唯爾(Elsevier)公司及其捆綁期刊的價格已經達到1800萬美元,每年的價格還在不斷上漲。這些外文數據庫對圖書館資源建設經費的占用較大,相對影響了其他資源的保障力度。
為了解這些昂貴的電子資源是否被很好地利用,需要對電子資源的使用情況進行深入的分析研究。根據信息資源管理理論,增加投入的目的是提高產出,對于電子資源來說,最直接的產出就是用戶的利用率。對電子資源特別是全文數據庫的利用率作統計分析,是圖書館績效評價研究的一項重要內容。本文希望通過對資源訪問量、下載量等利用情況的統計分析,反映出讀者對電子資源的動態需求,為圖書館館藏資源建設提供有效指導,同時為信息素質教育與培訓提供建議,有力地促進數字圖書館的發展。
愛思唯爾是設在荷蘭的一家歷史悠久的跨國科學出版公司,該公司出版的期刊是世界公認的高品位學術期刊,且大多數為核心期刊,被世界上著名的二次文獻數據庫SCI、SSCI、EI收錄。該公司將其出版的兩千余種期刊全部數字化,建立了Science-Direct全文數據庫,并通過網絡提供服務。該數據庫涵蓋了數學、物理、化學、天文學、醫學、生命科學、商業以及經濟管理、計算機科學、工程技術、能源科學、環境科學、材料科學、社會科學等眾多學科。
2000年1月CALIS全國工程文獻信息中心以集團方式組織國內部分學術圖書館正式訂購了Science Direct數據庫。到目前為止,全國已有一百多所高校及科研單位成為集團成員。在2006年5月于南京召開的“CALIS數字資源整合與服務創新研討會暨第四屆國外引進數據庫培訓周”上,清華大學圖書館副館長楊毅的報告也指出,通過對集團用戶購買的各個數據庫的使用統計報告分析,Science Direct數據庫已成為全國用戶檢索次數較多、下載文獻最多、單篇文獻下載成本最少的全文數據庫[2]。根據湯森路透發布的2010年度《期刊引文報告》,23%的愛思唯爾期刊在其所屬類別名列前10%[3]。可以說,Science Direct已經成為中國科研工作者常用的信息資源和研究工具。
數據庫的使用情況可以用量化的指標來反映,常見的指標包括:檢索次數、登錄次數、全文(文摘)下載數量、文獻利用情況等[4]。圍繞電子資源的評價問題,國內外先后有多個機構以項目的形式開展了研究。由英國PALS利用統計工作組提出并正式發布的COUNTER得到了美國出版協會、國家信息標準化組織等11個組織的大力支持,第2版目前已成為國際上較為通用的網絡電子資源在線使用統計的標準和規范。目前國內各高校圖書館組團購買的訂購率較高的外文電子資源,包括Science Direct數據庫在內,使用數據統計大多遵循COUNTER標準,而Science Direct則是提供用戶使用統計報告最詳盡最規范的數據庫之一。
截至2010年12月底,南京航空航天大學校園網用戶可使用Science Direct數據庫中的2000余種全文期刊。根據數據庫商提供的使用報告[5],2010全年有1600余種期刊被用戶瀏覽文摘或下載全文,尚有400余種期刊的使用次數為0。從2005年到2009年的全文下載量見圖1。

圖1 南京航空航天大學Science Direct數據庫2005-2009年下載量
三大全文電子期刊數據庫(Science Direct、EBSCO、Springer)中,Science Direct數據庫在南京航空航天大學的使用量優勢非常突出,在所有外文數據庫中,使用量排名第一,且基本呈上升趨勢,2009年更是達到37萬多篇的全文下載量。
數據庫商還會按月提供統計數據,這種統計可以使圖書館了解在不同月份讀者訪問電子資源的情況。通過統計我們發現,高校的科研有明顯的周期性特點,每年的不同時期讀者的需求傾向不同。例如圖2所示為2010年全文使用量按月統計情況。

圖2 Science Direct數據庫2010年全文使用量按月統計表
從數據庫的月使用統計數據中我們發現,數據庫訪問量在春秋季處于峰值,在3月達到最高點,這主要是由于學生在新學期開學后學習科研的使用需求激增而引起的。而在2月份與暑假期間則處于谷值,這是由于假期學生大量離校,電子資源校外訪問受IP限制而導致的使用數量驟減。
在對數據庫利用情況統計分析的基礎上,我們結合數據庫的購買價格計算出下載成本,進行績效分析,具體數據如圖3所示,成本單位:元。

圖3 Science Direct數據庫2005-2009年下載成本
將統計數據和當年全國的平均數據進行比對,我們發現雖然數據庫的購置費用在逐年上漲,但我校Science Direct全文數據庫的篇均使用成本還是呈逐年下降趨勢,2008年的使用成本遠低于全國平均使用成本2.87元,各年使用成本均低于當年全國平均成本。這說明我校對該數據庫的推薦和利用程度較高。
同時,筆者通過對數據庫中文摘和全文使用量前20位的統計,提取在兩者中均出現的期刊,作為選取我校重點需求期刊的參考標準,同時分別統計前20位期刊或前100位期刊的學科分類[6]和影響因子的分布比例。期刊的影響因子是表征期刊影響大小的一項定量指標,也就是某刊平均每篇論文的被引用數。它實際上是某刊在某年被全部源刊物引證該刊前兩年發表論文的次數,與該刊前兩年所發表的全部源論文數之比。通過分析以上數據,可以進一步了解我校重點需求期刊的學科滿足度及利用情況。
筆者將Science Direct數據庫使用報告中的1c.Abstract usage per journal與1f.Full text article usage per journal各自排名前20位的期刊使用數據抽取出來,對照數據庫商所提供的所有期刊學科分類表以及2009年SCI期刊影響因子表,整合成以下兩張數據表。

表1 2010年Elsevier數據庫文摘下載量前20位的期刊

序號 刊名 下載量 主題 影響因子18 Journal of Mathematical Analysis and Applications 457 Mathematics 1.22519 Transactions of Nonferrous Metals Society of China 449 Materials Science 0.44520 Journal of Materials Processing Technology* 434 Engineering 1.42
表1中多數期刊的影響因子都在1.0以上,在1.0以下的四種期刊Acta Astronautica、Aerospace Science and Technology、Chinese Journal of Aeronautics和Transactions of Nonferrous Metals Society of China均為與我校航空航天特色相關的期刊或是國內出版的期刊。

表2 2010年Elsevier數據庫全文下載量前20位的期刊

序號 刊名 下載量 主題 影響因子18 Wear* 3,553 Engineering 1.77119 Materials Letters 3,509 Materials Science 1.9420 European Journal of Operational Research 3,489 Mathematics 2.093
經計算,從這20種期刊下載全文文獻的數量占Science Direct數據庫中下載全文文獻總量的26.3%,而這20種期刊僅占Science Direct數據庫期刊總數的1.18%,并且以上20種期刊基本能和我校重點學科所需文獻相對應。由此可見,用戶的需求還是比較集中的;重點學科對文獻信息資源的需求量較大,在學校圖書經費有限的情況下,所購文獻盡量向重點學科傾斜是正確的。
表1、表2中期刊名稱后帶有星號的為兩表中均出現的,將其提取出來,確定為在Science Direct數據庫中我校使用最多的期刊。此方法也可應用于其他數據庫,匯總后可得到全校電子資源中的重點需求期刊,為全校電子型和印刷型期刊的采購和調整提供參考依據。

表3 Elsevier中南京航空航天大學使用最多的期刊
對用戶檢索行為數據的分析可了解用戶檢索習慣,對于信息素養教育的開展可以給予一定參考和幫助。
通過數據庫商提供的基于COUNTER標準的使用報告,我們可以具體了解并查看我們的用戶使用文獻的全文或者文摘以及HTML或PDF等不同格式的偏好,同時了解我們的用戶是怎樣瀏覽期刊主頁和出版商網站的。

表4 2010年各種格式文獻使用情況

圖4 文獻類型分布圖
通過表4和圖4可見,用戶對于文獻的使用更多地偏重于索取全文,瀏覽文摘的三種方式相加的總和僅達到15%,HTML或PDF這兩種類型的全文使用比例總和占到了85%。其中,使用PDF格式更多,超過HTML格式一倍以上。這說明用戶在使用全文數據庫時的使用需求較為明確,文摘瀏覽僅作為輔助。
我們將Science Direct數據庫中的檢索類型進行了匯總統計,各類型的使用次數顯示于表5中。

表5 2010年檢索方式匯總
筆者認為,根據檢索類型可將數據庫中的檢索功能分為初步檢索和修正檢索兩種類型,從而了解用戶在檢索過程中的使用習慣。數據庫中的Quick Search(快速檢索)、Advanced Search(高級檢索)和Expert Search(專業檢索)屬于初步檢索,Search within Search Results(在結果中檢索)、Refine Search(調整檢索)和Rerun Search(重新檢索)屬于修正檢索。圖5和圖6分別顯示了初步檢索和修正檢索兩種類型的比例。

圖5 初步檢索分類和比例圖
我們發現,用戶在初步檢索時,更多偏向于快速檢索功能的使用,因其具有與搜索引擎界面類似的便捷性。高級檢索功能的使用比例約占快速檢索的一半。而突顯數據庫使用技巧和專業性的專業檢索的使用比例幾乎為0。這一現象值得信息素質教育工作者關注,思考怎樣結合用戶的習慣,更好地引導他們來使用數據庫。

圖6 修正檢索分類和比例圖
而在進行修正檢索時,一半比例的用戶傾向于在結果中縮小檢索范圍,另外近一半比例的用戶不滿意得到的檢索結果范圍,傾向于返回之前的檢索界面進行檢索策略的調整,只有4%的用戶會重新檢索。這體現了用戶的檢索習慣。修正檢索總量僅僅占初步檢索總量的約10%,比例較低。這反映出用戶在檢索過程中對于二次檢索行為的積極性和檢索成熟度不夠高。
Science Direct數據庫提供了多樣式的提醒功能。比如對感興趣的期刊、主題、有價值的檢索式等,都可以將其保存為定期提醒(Save as Alert)。如果有新的文獻符合設定的檢索式,系統可自動定期發送郵件提醒,將相關的最新檢索結果通過Email推送給用戶,以便用戶對相關領域進行及時追蹤。用戶可以自行設置定期提醒的內容、提醒的周期、檢索的范圍等。各種提醒功能的使用量的統計情況見表6。

表6 提醒功能的使用報告

圖7 提醒分類和比例圖
目前用戶使用最多的提醒服務還是就某種期刊的定題推送,其次是基于檢索式的定題追蹤。但提醒服務的使用總量相較于檢索量相差甚遠,這說明有待培訓人員對該功能加強推薦。數據庫商也應該進一步加強對該功能的宣傳,以增強用戶對數據庫的黏性。
針對不同供應商提供的統計報告數據格式不統一問題,COUNTER標準規定了用戶使用報告的種類及其內容和格式,以便進行各數據庫之間的比較分析。在《COUNTER實施規范》(第1版)中規范了7種使用報告格式,涵蓋電子期刊和數據庫,對報告內容、格式以及傳遞要求都有詳細說明。使用報告按內容的詳略程度分為1級(Level 1)和2級(Level 2)[7]。1級是最低級別要求,2級要向用戶提供更詳細的信息。然而,并不是所有的中外文數據庫都嚴格按照《COUNTER實施規范》提供格式完全統一的數據報告。例如,部分數據商的在線數據是按月或季度提供統計數據,部分數據商是按年度提供統計數據。這會給統計工作帶來一定難度,需要分別明確統計項目的內涵界定,對各個數據庫的統計報告里的數據指標逐一甄別和處理。
Science Direct數據庫的后臺提供的統計報告包括兩種類型。一種是基于COUNTER標準的數據報告,提供前一年的完整數據及當年1月到當前月的數據。更多的則是提供一些用戶訪問細節的數據,僅包括近13個月的數據,即數據是即時推移的。如圖書館員不及時在每年1月份做好前一年各項使用報告的收集和保存工作,可能會給獲取前一年的完整數據造成很大障礙。因此,圖書館每年應按時做好統計數據的保存工作,以保證數據的連續性。對于報告中的一些常用的重要數據,應依據規范的表格進行整理,如Science Direct數據庫提供CSV、XML、HTML、EXCEL、PDF等多種文件格式的使用報告,我們建議選擇易于處理的excel形式進行輸出保存。表7列出了2004年訪問量最大的前5名Science Direct使用報告[8],供參與電子資源績效評價工作的圖書館員參考。

表7 2004年訪問量最大的前5名Science Direct使用報告
目前,一些圖書館的資源建設部已開始利用這些統計數據來協助工作。例如:通過查看檢索統計數據,監測用戶對某個數據庫的接受程度;根據使用統計數據,提出推廣或取消某數據庫的建議;重新評估對一些以前未訂購期刊的需求;重新考慮花費(基于使用量)是否在學校各院系成員中得到合理的分配;查看數字圖書館的應用情況如何,從而決定還需購置何種期刊。
同時,為了及時發現在電子資源使用過程中出現的某些問題,我們也應重視基于COUNTER標準的期刊使用報告,建立一些內部機制來保證對此類數據的調查與跟蹤。特別是當某些期刊的使用量在統計報告中較低時,我們應深入調研,了解情況,思考是否還有必要保留該期刊。在大多數情況下,低使用量的主要原因是該期刊的名稱未被加入到圖書館的OPAC中,或未被加入到按字母順序排列的期刊列表以及鏈接解析器軟件中。一旦類似的小失誤得以更正,通常使用量就會回升。重視使用報告數據,可以為電子資源利用率的提高提供直接的方向性指引,以利于我們更加科學合理地構建高校數字圖書館。
1 趙乃瑄.電子期刊管理——體系、方法與實踐.大連:大連理工大學出版社,2006.12:228-229
2 夏立娟,張蘇.基于Science Direct Online的電子期刊數據庫的檢索功能.現代情報,2007(2):167-169
3 愛思唯爾公布2010年度期刊影響因子亮點.[2010-08-10].http://china.elsevier.com
4 張李義.高校圖書館商業數據庫評價指標體系研究.中國圖書館學報,2004(1):66-69
5 Science Direct-Reports.[2010-01-09].http://usagereports.elsevier.com/asp/main.aspx
6 Subject collection.http://www.info.sciverse.com/techsupport/journals/sc2012.htm
7 COUNTER.[2010-01-09].www.projectcounter.org
8 考量什么,不考量什么:深入了解Elsevier使用報告.[2010-08-10].http://usagereports.elsevier.com