武同雁



〔摘 要〕 本文以CiteSpace II為工具,以Web of Science中的相關文獻為信息源,采用可視化分析方法,對國外機構知識庫研究領域的經典文獻、重要作者、重要期刊和研究熱點進行了定量分析與可視化呈現,以期能對我國機構知識庫的研究有所啟發。
〔關鍵詞〕 機構知識庫;信息可視化;CiteSpace II
DOI:10.3969/j.issn.1008-0821.2017.08.023
〔中圖分類號〕G255.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)08-0161-06
〔Abstract〕Taking the CiteSpace II as the tool,getting the data from the Web of Science,and using the method of information visualization,the paper made the analysis of the research on foreign institutional repository from the aspects of classic papers,important authors,important journals and hot topics.
〔Key words〕 institutional repository;information visualization;CiteSpace II
隨著計算機、網絡和數字化技術的迅速發展,大量數字資源急劇增長,如何對這些有價值的學術資源進行有效管理,成為圖書館在數字科研時代面臨的新挑戰。同時,期刊價格的持續上漲,造成了“學術交流危機”日益嚴重,學術界呼喚新的學術交流途徑。進入新世紀后,機構知識庫的出現為學術交流提供了一種新的選擇[1]。
機構知識庫一經問世便受到了各界的廣泛關注,呈現出理論研究與實踐建設齊頭并進的局面,先后涌現出ePrints、DSpace、Fedora等用于機構知識庫建設的系統平臺,各個國家及相關學術機構不斷推出促進機構知識庫發展的相關政策,瑞典發布了《瑞典開放存取先導計劃》(national open access initiative),以最大限度地推動瑞典高校及科研機構的科研成果實現免費開放,國際圖聯則推出其機構知識庫IFLA Library,中國科學院也于2008年開始系統推進機構知識庫建設,并以其集成服務網絡平臺對中國科學院各研究所建立的機構知識庫進行整合與一站式服務。經過20余年的發展,機構知識庫建設已經取得了令人矚目的成績,截至2017年2月,OpenDOAR收錄的機構知識庫數量已經超過了2600個[2],相關研究文章也不斷涌現。
信息可視化(Information Visualization)是結合了多個學科理論與方法(如數據挖掘、圖形學、人機交互等)的一種數據挖掘方法,通過利用計算機實現對抽象數據的交互式可視表示,可視化技術可以有效揭示出信息之間的關系和信息中隱藏的本質規律。本文采用信息可視化方法,對國外機構知識庫研究現狀進行深入分析,以便于挖掘隱藏在數據背后的知識內涵,快速借鑒國際前沿性研究成果。
1 數據來源與可視化工具
本文研究數據來源于Web of Science,數據庫選擇為SCI-Expanded, SSCI, A&HCI三個數據庫,文獻類型限定為Article, Review和Proceeding Papers,語種限定為英語,檢索并請說得到機構知識庫的相關文獻357篇。
CiteSpace II是由美國德雷克賽爾大學(Drexel University)信息科學與技術學院的陳超美博士開發的免費軟件,利用該軟件可以將知識和信息中引人注目的最前沿領域和學科制高點,以可視化的圖像直觀地展現出來,幫助人們挖掘、分析和現實科學知識以及它們之間的相互關系,并能夠較為直觀地識別學科前沿的演進路徑及學科領域的重要文獻[3][4]。為了解近年來國外機構知識庫研究的總體情況,本文即利用該軟件,通過文獻共被引、作者共被引、期刊共被引以及關鍵詞聚類等途徑,并結合文獻計量方法,對國外機構知識庫研究的整體情況進行定量分析與可視化呈現。
2 結果分析
2.1 經典文獻分析
經典文獻是一個研究領域中非常重要的文獻,不僅體現在其被引頻次高,同時中心度也高,即處在整個研究領域中較為核心的位置。通過運行CiteSpace II,選擇文獻共被引(Cited Reference)為節點,得到機構知識庫研究中經典文獻的可視化圖譜,如圖1及表1所示:
從上述圖表中可以看出,有5篇文獻的中心度和被引頻次較為突出,其中被引頻次和中心度最高的文獻是Crow發表的“The case for institutional repositories: A SPARC position paper”,該文是機構知識庫研究領域中具有奠基意義的重要文獻,在該文中,Crow詳細論述了機構知識庫出現的背景、定義、作用、基本組成部分,影響以及建設中應該注意的問題等基礎理論[5],因此被研究人員廣泛引用也就在情理之中了;Lawrence在2001年首次指出,科研人員通過機構知識庫、學科知識庫等途徑進行自存儲可大幅提高論文的被引頻次,他以119,924篇計算機科學領域的會議文獻為樣本,發現自存儲論文的篇均被引率為7.03,非自存儲論文為2.74,自存儲論文具有顯著的引用優勢[6]。Lawrence的研究結論引發了一場大范圍的關于自存儲能否提高論文被引頻次的討論,不少學者以多個學科領域的文獻為研究樣本展開了實證分析,其中Antelman的研究成果具有較大的影響力,作者以哲學(Philosophy)、政治學(Political science)、電子與電氣工程(Electrical and electronic engineering)和數學(Mathematics)等4個學科領域2017篇文獻為樣本,對其自存儲情況和被引情況進行了比較分析,發現自存儲論文比率分布在17%-69%之間,引用優勢在145%-191%之間[7];Chang以OCLC Systems & Service特邀編輯的身份發表了名為“Institutional repositories: The librarys new role”的論文,該文重點探討了機構知識庫對圖書館的影響以及圖書館的應對策略,指出圖書館應采取加強對館員數字資源管理能力的培訓、制定機構知識庫政策與管理制度等措施[8],該文對之后關于機構知識庫與圖書館關系的探討產生了較為重要的影響。此外,Chan發表的“Supporting and enhancing scholarship in the digital age: The role of open-access institutional repositories”主要探討了機構知識庫對學術交流的重要影響[9],也成為關于機構知識庫對學術交流影響研究中的代表作。
2.2 重要作者分析
對于一個領域而言,發表論文數量多的作者、被引頻次高的作者以及處于研究中心位置的作者都應該算作是重要作者。據統計,發表論文數量最多的是來自印第安納大學(Indiana University)的Xia JF和馬來西亞馬來亞大學(University of Malaya)的Abrizah A,均發表文獻9篇,Xia JF主要關注機構知識庫的評價問題,包括機構知識庫評價指標體系的構建以及實證調查分析等內容;Abrizah A主要就機構知識庫發展對學術出版的影響以及科研人員對機構知識庫的態度、存儲意愿等方面展開研究。
中心度反映的是某節點在網絡中的重要性程度的一個重要指標,通過運行CiteSpace II,選擇作者共被引(Cited Author)為節點,既可從被引和中心度的角度反映出作者的重要程度。具體如圖2所示:
從圖2可以看出,中心度較高的作者分別是Crow R, Lynch CA, Harnad S, Chan L, Foster NF 和Suber P等6人,這些作者也是本領域中的重要作者。Crow R和Lynch CA是機構知識庫基礎理論研究的先驅,先后發表了多篇具有重要影響力的研究論文/報告;Harnad S的研究興趣則為學術出版和開放存取,他先后創辦了開放存取期刊Psycoloquy、知名的學科知識庫CogPrints和美國科學家開放存取論壇(American Scientist Open Access Forum),雖然Harnad S的研究興趣不局限在機構知識庫,但其研究成果對該領域的研究產生了重要影響。此外,通過對原始數據的進一步分析發現,雖然Chan L, Foster NF和Suber P發表的文獻數量較少,但都發表了影響較大的文獻,因此能夠成為本領域的重要作者,如Foster NF在2005年即發表了關于科研人員對機構知識庫的態度及采納意愿的文章,這對機構知識庫用戶行為研究與資源建設研究產生了重要影響。
2.3 重要期刊分析
一個領域中的重要期刊,不僅是那些發表論文多的期刊,更應該是發表了具有重要影響力的期刊。據統計,發表論文最多的期刊是Serials Review和Program: Electronic library and Information Systems,均發表論文23篇,占總數的6.44%。發表文獻最多的6份期刊如表1所示:
通過運行CiteSpace II,選擇期刊共被引(Cited Journal)為節點,得到結果如圖3所示:
從圖3可以看出,基于被引和中心度的角度,D-Lib Magazine, Serials Review, Learned Publishing, College & Research Library, Nature, Ariadne, Portal: Libraries and the Academy等7份期刊表現較為出色。其中,Serials Review和Learned Publishing發表論文的數量也排在前2位,是國外機構知識庫研究領域名副其實的重要期刊。D-Lib Magazine和Ariadne則都是開放存取期刊,尤其是D-Lib Magazine持續刊載了多篇機構知識庫研究領域的相關論文,雖然該刊沒有被Web of Science收錄,因此在載文統計中其價值無從體現,但從被引和中心度的角度卻證實了其在機構知識庫研究領域的重要地位。此外,College & Research Library, Nature和Portal: Libraries and the Academy也發表了一些具有較大影響力的論文。因此本文將上述發表論文數量較多和影響力較大的11份期刊稱為國外機構知識庫研究領域的重要期刊。
2.4 研究熱點分析
關鍵詞在一篇文章中所占的篇幅雖然不大,但卻是文章主題的概括與凝練,同時參考文獻也能在一定程度上反映研究的興趣所在。因此對關鍵詞和參考文獻進行分析,可以確定某一個領域的研究熱點。本文通過運行CiteSpace II軟件,對關鍵詞和參考文獻進行聚類分析,得到結果如圖4所示:
通過圖4可以看出,國外機構知識庫的基礎理論研究、用戶研究、評價研究、資源建設研究以及實踐建設研究是本領域的研究熱點問題。
1)機構知識庫的基礎理論研究,作為一個21世紀才出現的新生事物,對其基礎理論進行重點探討也在情理之中,與此相關的聚類包括#1 open access initiative(開放存取先導計劃)、#8 scientific publication(科研出版物)、#9 Internet(因特網)、#10 responsive institutional repository(機構知識庫)、#11 open archive(開放存取文檔)、#21 scholarly publishing(學術出版)、#28 future direction(未來發展方向)等7類。據此可看出國外機構知識庫的基礎理論研究主要包括機構知識庫的定義、特征、影響以及未來發展等方面,如Lynch詳細闡述了機構知識庫的定義、特征、重要性、影響、建設中應該注意的問題及未來發展方向,他指出,機構知識庫不應該只是一個數據庫或硬件的組合,而是學術機構利用各種研究成果為科研人員提供的一種服務,其未來的發展方向將是多機構開展合作的聯邦式機構知識庫(federated institutional repository)[10];Oppenheim詳細分析開放存取期刊和機構知識庫對數字出版的影響,他指出,雖然現在機構知識庫的出現還不足以對出版體系產生實質性影響,但在未來相當長一段時間內機構知識庫將迅速發展,并最終對學術出版體系產生重要影響[11]。
2)機構知識庫的用戶研究,機構知識庫的發展離不開用戶(科研人員)的支持,因為機構知識庫中的資源全部都來自于科研人員。與此相關的聚類包括#12 purpose(目的)、#15 google user (google用戶)、#16 journal author behavior(作者行為)、#19 faculty content(機構成員的研究成果)、#22 research student(學生)等5類。如Kim以社會交換理論(Social Exchange Theory)為理論基礎,構建了一個科研人員在機構知識庫中進行自存儲的激勵因素模型,該模型包括成本、收益、內在激勵因素和個人成長經歷等4個方面的因素,結果表明這些因素都會對科研人員是否接受機構知識庫產生重要影響[12];Serrano-Vicente等人發現,科研人員對機構知識庫的認知度較高,大多數科研人員均了解機構知識庫的意義,但參與度不夠理想,多數科研人員均沒有在機構知識庫存儲資源的經歷,同時科研人員對機構知識庫的認知度和參與度均存在著學科差異[13]。
3)機構知識庫評價研究,隨著機構知識庫數量的迅速增加,如何對其進行有效評價,成為學者們關注的話題。與此相關的聚類包括#17 factor(因素)、#24 success(成功)、#26 critical success factor(關鍵成功因素)等3類。如Westell提出了機構知識庫建設的8個關鍵成功因素,分別是強制政策、契合學術機構的整體規劃、資金模式、與數字化中心的關系、互操作性、評價機制、學術機構的支持度和資源長期保持策略[14];Kim 則構建了一個機構知識庫的綜合評價模型,該模型包括4個方面,分別是內容、系統與網絡、用戶及提交者以及管理與政策,作者通過韓國的機構知識庫對此模型進行了實證研究[15]。
4)機構知識庫的資源建設研究,機構知識庫建設過程中一個非常關鍵的問題便是其資源建設問題,機構知識庫只有為科研人員提供高質量的學術資源,其價值才會得到充分體現,因此該主題受到了相關研究人員的重點關注。與此相關的聚類包括#6 exporting metadata(獲取元數據)、#7 digital preservation(數字資源保存)、#29 electronic thesis development(學位論文的資源建設)、#30 knowledge infrustructure(知識基礎設施)和#31 search engine coverage(搜索引擎覆蓋率)等5類。據此也可以看出這一主題的研究內容包括數字資源的組織、數字資源的長期保存、特殊數字資源建設以及數字資源利用等內容。如Markland利用GoogleScholar和Google兩個搜索引擎對英國境內的26個機構知識庫資源進行了檢索,期望通過搜索引擎對機構知識庫資源的覆蓋率來探討其利用問題,結果表明,搜索引擎科研較好地查找機構知識庫中的數字資源,但排在首位的并不一定是最相關的檢索結果,因此還需要科研人員做一定的鑒別才可以[16]。
5)機構知識庫實踐建設,整體而言,機構知識庫研究呈現出理論研究與實踐建設共同發展的局面,因此對機構知識庫實踐建設中的相關問題進行探討也成了本領域的一個研究熱點。與此相關的聚類包括#0 southampton(南安普頓)、#2 action plan(實施計劃)、#14 business school(商科學校)、#25 carl(加拿大研究圖書館協會)等4類。如Doctor對印度一所商科學校的機構知識庫建設情況及科研人員的接受度進行實證調研,結論認為在該校建設機構知識庫是可行的[17];網絡信息聯盟(Coalition for Networked Information, CNI)、英國聯合信息系統委員會(UK Joint Information Systems Committee, JISC與及荷蘭SURF基金(SURF Foundation in the Netherlands)則于2005年對美國、英國、澳大利亞等13個國家的機構知識庫實踐建設情況進行了大范圍的調查與分析,結果表明機構知識庫建設已經受到各國相關機構的重視[18]。
3 總結
綜上所述,機構知識庫作為一個新生事物,其相關問題受到了學界的廣泛關注,在國外已經形成了以Crow等人為代表的核心作者,以Serials Review和D-Lib Magazine為代表的核心期刊,并在機構知識庫基礎理論、評價、用戶行為及實踐建設等方面展開了研究。相比之下,國內機構知識庫的建設起步較晚,發展程度也相對較低,在研究的廣度與深度方面與國外相關研究還存在著一定的差距??傮w而言,國外相關研究可以從以下幾個方面對國內相關研究及實踐建設提供啟示:
1)國外不少相關研究都采取理論與實踐相結合的方式開始,即在機構知識庫實踐建設工作的基礎之上,開展調查等實證研究,并據此對機構知識庫的發展進行分析,提出具有針對性的建議。同時,由于國外有眾多項目如DRIVER等多個項目支持機構知識庫的發展,因此也有相關研究是對這些項目進行介紹與總結。而我國由于機構知識庫實踐建設不夠理想,因此大多數研究還停留在理論探討或者對國外研究進展介紹等層面。因此,在今后的研究中,有必要拓展研究廣度與深度,提升研究質量。
2)從研究熱點方面來看,國外的研究已經從更廣的角度對機構知識庫相關問題展開探討,其研究主題也從基礎理論研究演進至用戶行為、機構知識庫評價及實踐建設等方面,而國內相關研究則顯得角度較為單一。因此今后的發展過程中,需要重視研究主題的進一步拓展,以保證相關研究的可持續發展。
3)目前國外研究已經進入到了機構知識庫實踐建設引領理論研究的階段,如何解決建設中諸如系統平臺構建、資源內容建設、機構知識庫可持續發展、用戶行為等方面的問題,是相關研究關注的重點。國內的研究則顯得與實踐建設較為脫節,實踐建設明顯跟不上理論研究的步伐,只有中國科學院等少數學術機構的實踐建設取得了不錯的成績。因此,未來有必要大力推動國內機構知識庫實踐建設,以達到理論研究與實踐建設齊頭并進的局面。
參 考 文 獻
[ 1 ] 董文鴛,袁順波. 聚集學術機構知識的中心:機構庫(Institutional Repository)探析[J]. 圖書館雜志,2005,24(8):51-55,59
[ 2 ] OpenDOAR.[EB/OL] [2017-02-06] http://www.opendoar.org
[ 3 ] Chen C.,CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J]. Journal of the American Society for Information Science and Technology,2006,57(3):359–377
[ 4 ] 周金俠. 基于CiteSpace II的信息可視化文獻的量化分析[J]. 情報科學,2011,29(1):98-101,112
[ 5 ] Crow R.,The case for Institutional Repositories:A SPARC Position Paper [R/OL] [2017-02-26] http://works.bepress.com/ir_research/7/
[ 6 ] Lawrence,S.,Online or invisible?[J]. Nature,2001,411(6837):521
[ 7 ] Antelman,K.,Do Open-access Articles have a Greater Research Impact?[J]. College & Research Libraries,2004,65(5):372-382
[ 8 ] Chang S. H.,Institutional Repositories:The Librarys New Role[J]. OCLC Systems & Service,2003,19(3):77-79
[ 9 ] Chan L.,Supporting and Enhancing Scholarship in the Digital Gge:The Role of Open-access Institutional Repositories[J]. Canadian Journal of Communication,2004,29(3/4):277-300
[ 10 ] Lynch C. A.,Institutional Repositories:Essential Infrastructure for Scholarship in the Digital Age[J]. Portal:Libraries and the Academy,2003,3(2):327-336
[ 11 ] Oppenheim C.,Electronic Scholarly Publishing and Open Access[J]. Journal of Information Science,2008,34(4):577-590
[ 12 ] Kim,J.,Motivations of Faculty Self-archiving in Institutional repositories[J]. The Journal of Academic Librarianship,2011,37(3):246-254
[ 13 ] Serrano-Vicente,R.,Melero,R. et al.,Open Access Awareness and Perceptions in an Institutional Landscape[J]. The Journal of Academic Librarianship,2016,42(5):595-603.
[ 14 ] Westell M.,Institutional Repositories:Proposed Indicators of Success[J]. Library Hi Tech,2006,24(2):211-226
[ 15 ] Kim Y. H.,& Kim H. H..,Development and Validation of Evaluation Indicators for a Consortium of Institutional Repositories:A Case Study of dCollection[J].Journal of the American Society for Information Science and Technology,2008,59(08):1282-1294
[ 16 ] Markland M.,Institutional Repositories in the UK:What can the Google User Find There?[J]. Journal of Librarianship and Information Science,2006,38(04):221-228
[ 17 ] Doctor G.,Capturing Intellectual Capital with an Institutional Repository at a Business School in India[J]. Library Hi Tech,2008,26(1):110-125
[ 18 ] Westrienen G. V.,& Lynch C. A.,Academic Institutional Repositories:Deployment status in 13 Nations as of Mid 2005[J]. D-Lib Magazine,2005,11(09) also [2017-02-26]
http://www.dlib.org/dlib/september05/westrienen/09westrienen.html
(本文責任編輯:郭沫含)