劉子輝,陳祖琴,譚光月
(重慶科技學院圖書館)
機構知識庫(Institutional Repository,簡稱IR)的概念產生于20世紀90年代。2004年,我國學者將IR的理念引入國內,國內有關IR的理念研究逐漸興起并成為研究熱點,且很多科研機構都開始建設本單位的IR。截止2016年10月,在Open Doar上注冊的IR數量已達3,238個,其中排名第一的是美國(485個),其次為英國(249個)、日本(196個)、德國(194個)、西班牙(123個)以及法國(119個);我國在Open Doar上注冊的IR數量為39個。從統計數據上可以看出,我國的IR建設與國外相比有一定的差距,但是我們應該看到,國內眾多的IR雖未進入到Open Doar的名單之中,但很多的機構都搭建了IR平臺,將本單位內部產生的正式或者非正式智力成果有序整理,推動科研成果的轉化、交流及文獻資源的共享。本文利用可視化軟件CiteSpace,選擇中文數據庫CSSCI進行檢索,檢索途徑為所有字段 =“機構知識庫”,共得到數據289條;同時,選擇外文數據庫Web of Science進行檢索,檢索途徑為主題=“Institutional Repository”or“Institutional Repositories”,共得到404篇文獻,分別對檢索出的國內外文獻進行清洗,從而保證數據的相關性。
通過對IR研究的論文量和論文分布進行分析,反映其研究熱度的變化,從而研究IR在我國的發展情況。
通過對國內外有關機構知識庫的文獻進行統計(見圖1),可以發現,國外有關IR的論文最早出現在2000年,Burchill等在論文中提出,馬尼托巴衛生政策和評價中心希望開發一個知識庫來處理數據文檔,并促進內部溝通和與其他網站的合作。[1]文章中論述的知識庫及其功能就是IR的雛形,但是文章中并沒有明確提出IR的概念。2002年,Raym Crow首次提出IR的概念,即數字館藏收集和保存單一或者多所大學社區的智力成果,同時指出IR是學術機構面臨的重要戰略問題。[2]此后的2003-2008年,國外的發文量增長迅速,論文量由最初的1篇增長到38篇,可以說自2002年IR概念被提出以來,迅速引起了學者的關注,有關IR的研究和實踐迅速升溫。2008-2013年,有關機構知識庫的論文發表量穩定在30篇左右,大家對IR的研究熱度持續不減,2014年和2015年,有關IR的發文量分別為50和57,說明有關IR的研究熱度持續升溫。

圖1 國內外IR研究的文獻年份分布圖
對國外有關IR研究的文獻按照國別進行可視化分析(見圖2),發表論文量排名前幾位的分別是美國(131)、英國 (41)、西班牙 (35)、澳大利亞 (17)、印度 (17)、加拿大 (15)、巴西 (15)、德國 (14)、馬來西亞(13)??梢钥闯觯绹贗R的研究最多,論文的貢獻量也最大,這和IR起源于美國且在美國的理論研究與實踐開展比較深入有關系。同時,論文分布于55個國家和地區,前9個國家發表的論文量為298篇,即16%的國家其論文發表量占整個論文量的74%,論文分布非常集中。

圖2 國外IR研究的文獻國別分布圖
由圖1可以看出,我國有關IR研究的論文最早出現在2005年,共有2篇論文,其中《機構知識庫:數字科研時代一種新的學術交流與知識共享方式》,其參考文獻基本是國外文獻,也能夠印證此階段國內有關IR的論述非常少,這篇論文不僅較早地向國內介紹了IR,同時較為系統地論述了IR的含義、數字科研環境中IR的內容、IR在數字科研環境中的作用、數字科研環境中IR的構建工具,介紹了DSpace等構建IR平臺的軟件。[3]從2005年到2010年,有關IR的論文發表量從2篇發展到40篇,其研究熱度迅速升溫,有關IR的概念、作用與意義被大家接受,并且開展了我國IR的理論與實踐研究。很多單位自主搭建了IR平臺,如中國科學院、北京大學、西安交通大學、廈門大學等開展了相應的實踐活動。從2010年至2013年,有關IR的研究熱度有所下降,這和IR建設中遇到的問題有一定關系,如IR建設無法獲取經費保障、存儲文獻單一、作者擔心知識產權被侵犯故積極性不高等。這一階段大家對機構知識建設多了一份冷靜與反思。2014年與2015年,該領域的發文量回升,相關的研究熱度增加,所以說任何一個新事物,在發展中總不會一帆風順,總會在曲折中前進,IR建設也不例外。
論文的發表數量在一定程度上反映了論文作者對IR領域的知識貢獻量。下面通過CiteSpace對文獻貢獻量進行可視化分析,分析哪些作者對該領域做了大量的研究。
(1)國外文獻貢獻量。國外有關IR研究的作者排名靠前的分別是Abrizah.A(9)、Xia.JF(8)、Bjork.BC(5)、Yakel.E(4)等,國外有關IR的研究者較為分散,大多數研究都只是發表了1-2篇文獻,發表3篇以上文獻的作者只有10人。Abrizah.A來自馬來西亞大學,在2009年發表了第一篇關于IR的論文,他以馬來西亞一所研究密集型大學的學者為研究對象,調查了他們對開放獲取知識庫的使用及宣傳,以及他們對機構知識庫(IRs)作出貢獻或不作貢獻的原因,這項研究的結果為由高校創建或與高校相關的機構知識庫在保存和傳播數字材料時提供參考。[4]他的其他論文內容主要包括圖書館員在機構知識庫變革中的作用,亞洲大學開放獲取機構知識庫的全球視野,阻礙了作者在開放存取庫中自我存檔的因素分析以及通過機構間存儲庫共享圖書館和信息科學學者資源的動機和阻力等。
(2)國內文獻貢獻量。從下表可知,論文發表量排在前10的作者中,祝忠明發文19篇,祝忠明及其研究團隊從2008年發表的第一篇論文開始,對IR的多個方面都進行了研究,如IR與科研管理信息的集成研究、IR的模式選擇、內容建設及推廣、以及IR聯盟的建設等;馬建霞的論文發表量也非常多,其論述的主要內容有機構知識庫的建設現狀、機構知識庫聯盟的建設現狀及對策等。

圖3 國外IR領域論文發表量圖譜

表 機構知識庫領域論文發表量
高被引作者是在某學科中發表的文獻被大量引用的作者,其發表的文獻對其他人的研究產生了較大的影響,通常被認為是該領域的核心研究者。
(1)國外核心作者。通過CiteSpace可視化分析發現(見圖4),被引用次數在20以上的作者有18位,排在前幾位的有 Crow R、Harnad S、Suber P、Sqan A等,其中,Crow R自2002年擔任SPARC的高級顧問起,他開始與學術和科學團體以及其他非營利出版商合作,建立能夠支持開放獲取出版物的模式。Crow R是IR的奠基者,其發表的相關論文對其他學者的研究有重要的學術價值。從數據可以看出,國外有關IR的研究,形成了該領域的核心作者,這些核心作者即包括Crow R這樣的IR的奠基者,也包括Harnad S、Suber P等研究者,但是從整體看,相關的研究者比較分散。

圖4 國外IR研究核心作者圖譜
(2)國內核心作者。國內相關文獻高被引作者最高的是鄧君,其次是張曉林、曾蘇、郭少友、柯平、吳建中、常唯、韓珂等。其中,鄧君的研究涉及IR的建設現狀、模型構建、發展動力、利益機制、技術成本等,其發表的多篇論文引用率都非常高,為其他研究者都提供了重要的幫助與啟迪,對IR的發展起到了推動作用。張曉林發表的有關IR的論文內容涉及IR的內容保存與傳播權利,IR的政策、功能和機制分析,IR的發展趨勢與挑戰等,被很多學者關注與引用,影響非常深遠。相比而言,國外在IR領域的研究出現了特別權威的學者及有影響力的文章,而國內有關IR的核心作者更為分散,沒有形成特別權威的學者。
為了直觀地呈現出該領域文獻的分布情況,我們通過CiteSpace對IR有關的來源期刊進行了可視化分析,即該領域的大量文獻主要被發表在哪些期刊上,從而分析出該領域文獻的核心期刊群,找出哪些是國內外IR領域的核心期刊。
(1)國外核心期刊。國外高被引期刊主要有D-Lib Magazine,LearnPublishing,SerialsRev,JAmSoc Inf Sci Tec,JAcadLibr等,其被引頻次都在60以上。其中,D-Lib Magazine被引頻次達到121,在所有的期刊中其被引頻次非常突出,表明這些期刊在IR領域的研究起到重要作用,在這些期刊上發表的有關IR的論文質量很高,被其他學者學習、借鑒、引用,給其他學者的研究更多的啟迪。
(2)國內核心期刊。《圖書情報工作》《中國圖書館學報》《圖書館雜志》《圖書館論壇》《情報科學》《情報資料工作》等這些期刊都是高被引期刊,其中《圖書情報工作》被引頻次更突出,說明其在有關機構知識庫的研究中起著重要作用,其刊載的論文質量更高,更具有學術價值。
從國內外核心期刊對比分析發現,國外的核心期刊除了D-Lib Magazine之外,分布更為均勻,被引頻次在20以上的有33種期刊;而國內的核心期刊除了圖書情報工作比較突出之外,其分布相對不均勻,比較集中。
一個研究領域的知識基礎支撐著該領域的發展,為該領域的進一步發展奠定了理論與實踐基礎。文章基于CiteSpace軟件,以Timeline和Cluster兩種方式顯示,分析奠基性文獻和高被引文獻。[5]
(1)國外奠基性文獻。有4篇文獻為IR研究的奠基性文獻。① Harnad S論述了“由于研究人員需要支付費用才能獲取相應的信息資源,給他們的科研帶來障礙,隨著開放存取的發展,作者只需將他們的文章存放在開放的機構知識庫中,即可讓全球所有的科研人員檢索與下載,實現了信息資源的共享,給科學研究提供信息保障?!保?]② Lawrence S指出“免費獲取科學文獻,可以給科學研究帶來極大的方便,可以最大限度地利用科學文獻、加快科學進步,所以作者和出版商都應該推動文獻信息開放獲取運動的發展。”[7]③ Kling R指出“在信息時代,傳統的交流模式已發生了很大的變化,現在通過電子媒介進行學術交流是一種發展趨勢,各個科學領域都已開始通過知識庫進行學術交流,實現文獻的檢索、下載、傳遞。不同的科學領域已經開發并且在論文和電子領域中使用截然不同的交流論壇?!保?]④ 上文中提到的Raym Crow的論文。
(2)國內奠基性文獻。國內奠基性文獻有以下幾篇。① 黃凱文等人發表于2005年的論文,介紹了“公共獲取運動”實施的模式、常用的軟件系統及支持的標準。[9]② 董文鴛等人的論文介紹了機構庫的定義及產生的原因,闡述了機構庫的特點及國內外相關項目。[10]③ 吳建中發表于2004年的文獻指出,IR對圖書館業務及其生存發展提出了嚴峻挑戰。[11]
(1)國外高被引文獻。國外高被引文獻有Raym Crow發表于2002年的論文,[2]被引用45次,其內容不再分析。第二篇是Antelman K的文章,被引用了28次,在文中作者關注了哲學、政治學、電氣和電子工程、數學的文獻信息獲取情況,在這四個學科中,用戶可以免費獲取該學科的文獻信息,這種公開獲取文獻信息的情況影響非常大,獲得大家好評。[12]第三篇文獻是Davis Philip發表于2007年的文章,主要論述了“大家雖然都很關注機構知識庫的開發與實施,但是教師對參與機構知識庫建設積極性并不高”,文中通過對自然、社會、人文科學的教師進行訪談,了解他們對機構知識庫的認識、態度、動機、行為。[13]
(2)國內高被引文獻。國內引用頻次最高的是郭少友于2006年發表的論文,被引頻次為19次,其主要介紹了機構庫建設過程中會遇到的服務模式選擇問題、法律問題、內容建設問題、資金問題等。[14]第二篇文獻是張曉林于2008年發表的論文,被引頻次為16次,提出了機構知識庫建設中相應的存繳、組織、傳播、保存以及擴展服務功能要求,闡述傳播保護和權益管理政策,并提出相應的支撐機制。[15]
通過對IR研究的關鍵詞詞頻分析,梳理了不同時期IR的研究熱點,可以分析IR領域研究的熱點變化及發展方向。
通過關鍵詞分析,Institutional Repository、Open Access、Digital Library、University、Scholarly Communication、Library、AcademicLibrary、Dspace、DigitalStorage等出現頻次較高。同時,對關鍵詞進行聚類分析,國外的研究熱點主要有:Digital-storage、Sustainable Development、Future of Journey、Business School、Confidentiality、Knowledge Management等,可以看出這些方面也是圖書館的研究熱點。
經統計可知,高頻關鍵詞依次為機構知識庫(251次)、開放獲取(39次)、開放存?。?5次)、Dspace(12次)、機構知識庫聯盟(10次)、知識管理(8次)。同時,對關鍵詞進行聚類分析(見圖3)發現,呈繳、科研數據、Altmetrics、RDF、Archimede、數據模型、機構知識庫IR、機構知識庫聯盟、數字圖書館等是IR領域的研究熱點。
[1] Burchill C,et al.Organizing the present,looking to the future:An online knowledge repository to facilitate collaboration [J].Journal of Medical Internet Research,2000,2(2):e10.
[2] CrowR.The case for institutional repositories:ASPARC positionpaper[EB/OL].[2017-01-31].http://www.sparc.arl.org/sites/default/files/instrepo.pdf.
[3]常唯.機構知識庫:數字科研時代一種新的學術交流與知識共享方式[J].圖書館雜志,2005(3):16-19.
[4] Abrizah A.The cautious faculty:Their awareness and attitudes towards institutional repositories[J].Malay sian Journal of Library&Information Science,2009,14(2):17-37.
[5]胡德華,種樂熹.國內外學科館員研究的可視化分析與比較[J].圖書館理論與實踐,2015(6):36-41.
[6] Stevan H.The self-archiving initiative.Freeing the refereed research literature online [J].Nature,2001(410):1024-1025.
[7] Lawrence S.Free online availability substantially increases a paper’s impact[J].Nature, 2001, 411(6837):521.
[8] Kling R,McKim G.Not just a matter of time:Field differences and the shaping of electronic media in supporting scientific communication [J].Journal of the American Society for Information Science, 2000, 51(14):1306-1320.
[9]黃凱文,劉芳.網絡科學信息資源“公開獲取運動”的模式與方法[J].大學圖書館學報,2005,(2):38-41,3.
[10]董文鴛,袁順波.聚集學術機構知識的中心機構庫(Institutional Repository)探析[J].圖書館雜志,2005 (8):51-55,59.
[11]吳建中.圖書館VS機構庫——圖書館戰略發展的再思考 [J].中國圖書館學報,2004(5):7-10.
[12] Antelman K.Do open-access articles have a greater research impact? [J].College&Research Libraries,2004,65(5):372-382.
[13] DavisPM,Connolly M J L.Institutional repositories:Evaluating the reasons for non-use of Cornell University’s installation of DSpace [J].D-lib Magazine,2007,13(3):2.
[14]郭少友.機構庫建設的若干問題研究[J].中國圖書館學報,2006(1):77-80.
[15]張曉林.機構知識庫的政策、功能和支撐機制分析[J].圖書情報工作,2008(1):23-27,19.