,
近年來,由于數據庫資源的數量激增、部分核心外文數據庫價格漲幅過高以及人民幣兌外幣匯率波動趨高,導致部分高校缺乏足夠的資金購買所需數據庫資源,在數量和質量上已無法滿足學校教學科研需求,這給高校圖書館數字資源建設提出了嚴峻挑戰。為了提高數字資源采購的科學性, 評價這些數據庫的使用顯得尤為重要。
帕累托法則也稱為二八定律或80/20法則,是指在眾多現象中,80%的結果取決于20%的原因, 這一法則在很多社會領域被廣泛應用[1]。Richard L. Trueswell早在1969年首次將帕累托效應引入圖書館[2]。 此后,國外有大量的相關研究[3],如Mangkholien Singson等人在研究印度圖書館采購聯盟所提供的數據庫下載量分布時,發現電子期刊的使用遵循“80/20” 法則或帕累托效應[4]。然而,國內學者在期刊全文數據庫的使用率方面的研究[5-9]中,很少結合帕累托效應評估讀者核心需求、指導文獻資源建設,目前僅有暨南大學的朱前東發現該校ScienceDirect 數據庫的下載量符合帕累托效應[10]。驗證Wiley Online Library(WOL)數據庫使用中的帕累托效應的意義在于通過揭示全文下載量與下載品種之間的不平衡關系,尋求創新思維意識,體現有所為、有所不為的工作方法[11]。帕累托效應的價值主要體現在制定圖書館文獻藏書原則、制定圖書館文獻資源購置比例、圖書館文獻資源共建共享、圖書館文獻剔舊等方面的應用[12]。
在數據庫中引入帕累托效應,以動態發展的視角,實施文獻資源整合、優化、取舍等策略,是圖書館為解決文獻資源購置經費短缺性和文獻資源品種多樣性、學科復雜性、分布無序性與本單位用戶文獻需求特殊性之間矛盾而產生的一個具有實際意義的研究課題。
本文以中國藥科大學(以下稱稱“我校”)WOL數據庫使用為例, 采用量化的實證法,分析2011 -2015 年全文下載量的期刊分布,并從年下載量的學科分布情況,SCIE、SSCI 、A&HCI來源期刊收錄情況,我校SCI論文載文情況等方面, 探析了帕累托效形成的原因及對文獻資源建設、數據情報服務與學科服務等方面的啟示。
WOL數據庫是John Wiley & Sons Inc 的學術出版物在線平臺,提供包括化學化工﹑生命科學﹑醫學﹑高分子及材料學等14個學科領域的學術出版物,是中國藥科大學讀者最熟悉和最常用的外文全文期刊數據庫。圖1反映了2011-2015年WOL數據庫下載情況。這里的統計數據包括訪問網頁(HTML)和下載全文(PDF)兩部分,年下載量按兩部分之和計算。

圖1 中國藥科大學2011-2015年WOL數據庫下載情況
從表1可以看出,我校2011-2015年Wiley全文下載量呈逐年遞增狀態,2011-2015年全文下載量增長了兩倍,可見師生對WOL數據庫的使用越來越頻繁。為進一步解析數據庫中期刊與下載量之間可能存在的關系,以至少有一次下載記錄的期刊數量及網頁訪問為基準計算。
表1統計了2011-2015年WOL數據庫全文下載量前80%的期刊分布情況,分別計算出每年下載量占當年下載量80%的期刊總數,及占當年已訪期刊總數之比。結果表明,10%左右的期刊提供了80%的下載量,2011-2015提分別為9.66%,10.86%,10.47%,7.92%,7.60%。

表1 2011-2015 WOL全文下載占80%下載量分布
以2015年數據為例,至少有一次下載記錄的期刊數量是658種。依據Wiley提供的數據,按期刊下載量高到低的順序統計,有50種期刊下載量合計達65 494篇,即占2015全年下載量(81 686篇)的80%。因此,約有7.60%的期刊占全文下載量的80%。
9.3%的期刊產生80%的全文下載,而90.7%的期刊只提供了20%的全文下載。帕累托效應理論表現了一種不平衡關系,即少數主流的事物可以造成主要的、重大的影響。并非只有20/80的比例才能說明帕累托效應出現在了期刊數據庫的使用中。帕累托效應只說明了一個規律,而不是絕對的比例分布[13]。由此可見,我校WOL數據庫近幾年使用情況基本與帕累托效應吻合。為了解釋帕累托效應,本文下面提到的20%期刊與80%期刊,是指20/80中的20和80部分,并不是實際的數字。
以WOL數據庫收錄的SCIE、SSCI 、A&HCI來源期刊考察下載量與帕累托效應可能存在的關系。本文以2014年的JCR報告為標準,以2012-2014年期刊情況為分析對象,統計了2012-2014年WOL數據庫使用中的20%和80%期刊分別收錄的SCIE、SSCI 、A&HCI來源期刊的數量。
這里20%期刊數量是指下載量達80%的部分,實際并未達到20%,80%期刊數以此類推。統計結果見表2。

表2 2012-2014年WOL數據庫使用中的20%和80%期刊收錄的來源期刊數量
由表2可以看出,2012-2014年WOL數據庫中20%的期刊收錄SCIE、SSCI、A&HCI來源期刊數量所占的比例明顯高于其他80%期刊收錄數量,分別高于80%期刊17.83%、14.56%、10.97%。雖然80%期刊和20%期刊收錄SCIE、SSCI、A&HCI來源期刊的差距逐年縮小,但仍明顯低于20%期刊的收錄情況,說明用戶更傾向選擇質量高的全文期刊進行閱讀和下載。這是導致WOL數據庫使用中產生帕累托效應的部分原因。
當SCI來源期刊上刊載了教師或博士研究生的論文時,該來源期刊往往會成為相關師生的關注對象。為考察WOL數據庫收錄我校SCI論文情況與20%、80%期刊可能存在的關系,沿用前面關于20%、80%期刊的表述,通過檢索WOS,統計了2012-2014年20%期刊和80%期刊刊載我校SCI論文情況(表3)。
從表3中可以看出,20%期刊刊載中國藥科大學論文的期刊數量和論文的篇數,均遠遠高于80%期刊的刊載數量和篇數。2012年20%期刊中刊載我校論文的期刊數量和刊載的論文篇數分別為80%期刊的7.5倍和5.4倍,2013年的20%期刊中刊載我校論文的期刊數量和刊載的論文篇數分別為80%期刊的3.5倍和2.6倍,2014年20%期刊中刊載我校論文的期刊數量和刊載的論文篇數分別為80%期刊的1.5倍和1.83倍。由此可見,雖然20%期刊和80%期刊在刊載論文的期刊數量和論文篇數方面的差距逐年減小,但20%期刊刊載我校論文的期刊數量和論文篇數上仍要大大高于80%期刊。

表3 2012-2014年WOL數據庫20%期刊和80%期刊刊載中國藥科大學SCI論文
由此可以說明,刊載我校論文的SCI來源期刊更受讀者的關注和使用,是在WOL數據庫使用中產生帕累托效應的部分原因。
表4統計了2011-2015年下載頻次前20期刊的下載量,以探析WOL數據庫期刊高頻下載的成因。

表4 2011-2015年WOL數據庫中前20種期刊的下載量/次
從表4可見,2011-2015年前20名期刊下載總量逐年增加,其中AngewandteChemieInternationalEdition從2011-2015年都占據全文下載量的第1位,且占全文年下載量的比例逐年遞增;其余年度下載量較高的還有Chemistry-AEuropeanJournal,JournalofPharmaceuticalSciences等期刊。因此,有必要進一步對以上期刊進行數據挖掘,探究其高頻下載原因。
我校校內師生是全文電子期刊的主要使用者,科研、學術討論、發表學術論文、撰寫畢業論文等都需要下載一定數量的相關文獻,所下載的文獻往往與師生所屬的專業和研究方向有很大關系。為探尋期刊高頻下載量的成因,本文進對上述24種期刊的研究方向、期刊影響因子等指標進行了統計(表5)。
從表5可以看出,出版國別包括英國(10種)、德國(7種)、美國(3種)、瑞士(3種)、日本(1種)。期刊平均影響因子為4.2,按期刊研究方向包括有機化學(6種)、生物化學(3種)、分析化學(8種)、藥理及制藥(8種)、臨床醫學(6種)、無機化學(3種)、納米化學(1種)、計算化學(1種)。這與我校學科設置及學科重點發展方向是一致的。
中國藥科大學是一所以藥學為特色的學校,目前設有天然藥物活性組分與藥效、藥物代謝動力學、藥物分子設計與成藥性優化、腫瘤發生與干預等重點實驗室及新藥篩選中心。
藥學為國家重點一級學科,藥物化學、生藥學、藥劑學、藥物分析學、藥理學、微生物與生化藥學為國家重點二級學科。由此可,學術期刊的主要使用人群,如學校重點和優勢學科的師生以及實驗室的研究人員,是導致全文電子期刊數據庫使用過程中產生帕累托效應的重要原因。

表5 2011-2015年WOL24種高頻下載期刊研究方向
通過上述分析,驗證了期刊全文數據庫使用中產生的帕累托效應。帕累托效應也是經驗定律。理論上,20%的期刊對應80%的下載量;實踐中,80%的下載量對應20%的期刊,10%-30%的期刊也可接受。暨南大學2007-2009年SD數據庫全文下載量分布,80%下載量的期刊占期刊總數比例分別為27.67%、21.03%、23.72%[14];我們統計的2011-2013年WOL數據庫80%下載量的期刊占期刊總數為9.66%、10.86%、10.47%,兩者平均值相差13.81%,均在可接受的范圍,兩者分布符合帕累托法則。本文因受學科專業及研究方向等的限制,使分析結果與綜合性院校暨南大學有所區別,但可在醫藥專科院校中起到一定的示范作用。
目前,全國醫學門類專業的普通高等本科院校約有280余所,根據DRAA高校數字資源采購聯盟的最新統計,我國引進的醫學相關專業期刊全文數據庫有128個。針對醫學院校圖書館引進全文數據庫資源,根據各校的實際情況,應充分考慮數據庫的質量和使用對象。 從WOL數據庫使用中產生的帕累托效應可以看出,文獻質量和使用對象的需求在很大程度上決定了資源的使用情況。因此,醫學院校在引進數字資源時要先評估數據庫的質量,然后分析試用期間的使用數據,在綜合考慮數據庫質量和用戶使用情況后,結合已購資源學科分布、重復情況等因素決定是否購買。中國藥科大學讀者群體在使用WOL期刊數據庫時,帕累托效應表現得極為明顯,體現在少于20%的期刊提供了80%的下載量。我校在實際集團采購WOL數據庫中選擇了包庫選刊方案。以2015年為例,購買了WOL的82種刊,有近50種刊合計下載量達到了當年的80%。這50種刊只占了已訪問刊658種的7.6%。以相對少的經費購置了高頻使用的期刊數據,說明我校的外文全文數據庫采購策略是成功的。考察數據庫使用的分布情況,是圖書館數據庫購置策略的一個重要方面。 對于醫學專科學校而言,選擇一個合適的數據庫定價模式越來越重要。 如果20 %的期刊相對集中于某個或數個學科, 應當努力爭取按學科子庫進行購買。 這樣不僅可以節省數字資源購置經費, 還可以發揮數字資源最大使用價值。
此外,期刊采購是圖書館運行中最繁瑣的內容之一,需要投入大量的人力、物力、財力,而帕累托效應的分析及應用可以給予很大的幫助。對中國藥科大學WOL數據庫使用中產生的帕累托效應的觀察和分析,通過高頻下載量分析可以以較快的速度,確定高頻下載期刊數量、期刊的研究方向,從而制定部分特色館藏明細,避免了枯燥且復雜的篩選,或浪費大量時間進行數據整理和分析。
WOL數據庫中有大于80%的期刊只提供了20%的下載量,。在80%期刊中也有部分高質量的期刊,圖書館應該深度挖掘這部分數據的價值。在此基礎上,圖書館可以通過各種途徑即時為科研提供全方位、一站式情報服務,包括文獻傳遞、課題調研、最新資訊推送、專題檢索、收引查新等,提供快速和高效的文獻保障和信息服務,提高低使用率期刊的使用, 充分發揮數字資源的最大使用價值。除此之外,圖書館還可以采取網絡推介、讀者培訓、校內通告、期刊導航、期刊投稿指南等方式, 讓讀者熟悉并利用這些期刊, 使其在學校教學科研活動中,發揮更大的作用。
針對WOL數據庫高頻下載期刊的研究方向及專項課題研究領域,以有機化學、生物化學、分析化學、藥理及制藥、臨床醫學、無機化學、納米化學、計算化學等學科領域的研究論文、學術會議和基金項目作為分析框架和檢索目標,以中國藥科大學學科發展支撐平臺,提供基于CSCD/SCI 核心期刊數據庫、ESI 高被引文獻數據庫的學科發展趨勢以及國家自然科學基金(NSFC) 重點資助的醫藥領域、機構、項目分布與研究熱點等學科評估分析報告,為專項團隊的科學研究和技術研發提供有力的保障。