周九常 劉思賢



關鍵詞:關鍵詞分析;研究熱點與趨勢;國外圖書館學
摘?要:emerald是管理學(包括圖書館學)中具有代表性的期刊數據庫,分析此數據庫中有關圖書館學的期刊文章可以了解國外圖書館學研究的熱點及其變化。文章對emerald數據庫進行檢索篩選,得到標題中含有“library”一詞的相關論文,搜集、清洗、整理了這些論文的關鍵詞,并對關鍵詞進行了分析,旨在掌握和了解國外圖書館學的研究熱點與趨勢。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2020)05-0136-05
1?背景
著名圖書館學家、北京大學教授吳慰慈先生在《圖書館概論》一書中認為,圖書館是社會記憶的外存和選擇傳遞機制,是社會知識、信息、文化的記憶裝置、擴散裝置,它具有許多社會職能,對人類來說十分重要[]?!耙怪袊鴪D書館發達,非得先研究圖書館學?!盵2]學者楊昭悊的這句話表明了研究圖書館學是發展圖書館事業的必要條件。想要圖書館和圖書館學發展起來,向國外這一研究領域借鑒和吸收是必不可少的。emerald是國外圖書情報領域具有代表性的數據庫,通過整理其中有關圖書館學研究文獻的關鍵詞,使用詞頻統計的方法,確定國外圖書館學研究的熱點所在,可以促進我國學者的圖書館學研究,能夠讓圖書館工作者從中汲取理論營養和科學方法,推動我國圖書館事業的發展。
2?相關研究回顧
劉曉波在CSSCI數據庫中選擇“圖書館學”二級學科,時間段設定為2006—2010年,檢索后得到與圖書館學相關的文獻共6,621篇,通過統計關鍵詞數量得出前60位高頻關鍵詞,隨后進行關鍵詞共現分析,通過宏觀視角和微觀視角確定了圖書館學領域研究熱點和發展動向[3]。胡浪選取了北京大學《中文核心期刊要目總覽》中影響力前13名的圖書情報類核心期刊作為研究對象,統計了2012—2016年間這些期刊的作者發文數量、論文被引頻次、關鍵詞頻次、關鍵詞共現分析等,并用可視化軟件CiteSpace通過知識圖譜展示,得到我國圖書情報領域近年來的高影響力作者分布、研究熱點和趨勢[4]。吳漂生通過文獻關鍵詞統計對我國圖書館學研究熱點進行了預測,并根據“二八定律”將《中文核心期刊要目總覽》中影響力前9名的圖書館學核心期刊作為統計對象,時間段定為2010—2017年,共得到16,358篇相關文獻,關鍵詞共61,207個,并通過整理高頻關鍵詞和關鍵詞共現分析預測了圖書館學的研究熱點和趨勢[5]。周笑盈將2014—2018年國際圖聯大會論文的關鍵詞作為研究對象,將國際圖聯官網近五年會議論文的標題、關鍵詞、摘要等信息記錄下來,篩選出242篇論文、735個關鍵詞,同時設計了一個關鍵詞語義標引模型,將關鍵詞進行標注以便于分析。該模型有四個語義功能,分別是研究背景、研究領域、研究熱點、研究對象,通過對上述四種不同語義功能的關鍵詞進行分析,揭示了國際圖聯大會數字圖書館的研究熱點與研究趨勢[6]。
當前,我國學者提取關鍵詞分析圖書館學研究熱點和趨勢多立足于中文數據庫,很少對外文數據庫中的圖書館學文獻進行關鍵詞統計,雖然周笑盈對國際圖聯大會的論文進行了關鍵詞分析,但僅有242篇文獻,樣本較少,結論的科學性較低。造成這種情況可能有兩個原因:一是外文數據庫的關鍵詞信息導出不方便,多數需要人工整理,工作量大。二是外文文獻的關鍵詞格式不統一,一詞多義、一意多詞以及單復數的現象影響統計。筆者選取圖書館學領域具有代表性的國外數據庫emerald,對六年跨度的圖書館學文獻進行關鍵詞分析,以期得出國外圖書館學領域研究的熱點和趨勢。
3?研究設計
emerald數據庫高級檢索中有5個檢索字段,即all fields、title、contributor、abstract和DOI,筆者以library為檢索詞,字段選擇title,時間段定為2014—2019年,類型選擇article,訪問類型選擇all content,最后得到1,266個結果,即emerald數據庫中最近六年與library相關的文獻共有1,266篇。由于emerald數據庫沒有導出文獻信息功能,因此筆者將1,266篇文獻逐一下載,然后進行關鍵詞提取,提取的情況有三種:一是如果文中有keywords部分就直接提取。二是如果文中沒有給出關鍵詞,就在emerald insight網站找到數據庫給出這篇文章的關鍵詞并記錄下來(沒有訪問權限無法下載全文的文章也需通過這一步提取關鍵詞)。三是如果文中和數據庫中均沒有關鍵詞,就通過閱讀文獻總結關鍵詞并記錄下來。關鍵詞提取完畢還需對其進行清洗,如將單復數形式統一、相同語義用一個固定單詞代表、刪除一些與論文主題無關的單詞等,然后對這些關鍵詞進行統計分析,最后得出一定數量的高頻關鍵詞,觀察它們隨時間變化的情況大致就可得出國外圖書館學的研究熱點和變化趨勢。
周九常,劉思賢:基于emerald的國外圖書館學研究熱點分析
4?數據分析
4.1?發文量分析
年發文數量直接反映了國外學者在圖書館學領域研究成果的多少,即當年國外學者的圖書館學研究成果產量。emerald數據庫中2014—2019年間與圖書館學相關的文獻數量詳見圖1。
圖1顯示,近6年國外圖書館學發文數量大致分為兩個階段:第一階段是2014—2016年,三年間共發文760篇,每年發文量均超過200篇,其中發文量最多的一年是2015年,有280篇;第二階段是2017—2019年,這三年共發文503篇,年均發文量為167.67篇,較前三年有明顯下降。綜上所述,6年間emerald數據庫中有關library的論文數量在2015年到達頂峰,之后數量有一定下降,但下降幅度不大,并且最終維持在一個新的平衡。由此可見,2015年是國外學者圖書館學研究成果推出的高峰年份,是他們進行圖書館學研究的興旺之年。
4.2?高頻關鍵詞臨界值計算
筆者選取頻次前15名的關鍵詞制作了詞頻統計表,關鍵詞占比即為關鍵詞數量與總文章數之比,然后通過高頻關鍵詞界分公式計算出高頻詞的臨界值。出現頻次前15位的關鍵詞分別是academic libraries,public libraries,digital libraries,libraries service,university libraries,information literacy,libraries management,librarian,collection development,assessment,librarianship,social media,user studies,technologies,collaboration。關鍵詞詞頻統計表(TOP15)詳見下頁表1。
通過界分公式計算高頻關鍵詞的臨界值,首先采用Donohue,J.C在1973年提出的高頻關鍵詞界分公式計算[7]:
N=(-1+1+8×I1)/2
公式中的I1指的是頻次為1的關鍵詞數量,N指的是高頻關鍵詞的臨界值。在1,266篇文獻中,共有6,397個關鍵詞,平均每篇5.05個,不重復的關鍵詞有3,171個,其中頻次為1的關鍵詞有2,445個,即I1=2,445,通過公式計算得出臨界值N=69.4。為了保證高頻關鍵詞選取的可靠性,筆者換一種公式計算高頻關鍵詞的臨界值。我國學者孫清蘭在1992年對donohue的界分公式做過一次改良[8],通過獲取關鍵詞的不同次數D得出新的界分公式:
N=D
代入本次的數據得出臨界值N=56.3,將這兩個公式得到的臨界值和表1比對,可知結果是一樣的,頻次超過臨界值的關鍵詞有academic libraries,public libraries,digital libraries,libraries service,university libraries,這五個關鍵詞的數量詳見圖2。
4.3?高頻關鍵詞變化趨勢分析
由于每年的發文數量不同,因而會影響高頻關鍵詞的數量,繪制每年高頻關鍵詞占文章的百分比折線圖可直觀判斷,一目了然。圖3為五個高頻關鍵詞占比隨年份變化折線圖。1,266篇文獻中出現頻次最高的關鍵詞是academic libraries,圖3顯示academic libraries所占的百分比在2014—2017年間逐年上升,之后穩定在20%左右,也就是說,平均每5篇文章中就會有1篇以academic libraries為關鍵詞,比例較高。由此可見,在圖書館學研究領域,academic libraries是國外學者研究興趣最集中的內容。究其原因,是由于academic libraries具有鮮明的特色,具有較強的學術性、研究級的館藏、專業的團隊和優秀的學者、高水平高質量的服務以及先進的技術等,因此能夠吸引國外學者的關注,從而成為最高頻關鍵詞。
圖4是第二高頻關鍵詞public libraries的占比圖。public libraries在六年間有增有減,整體波動不大,數值基本穩定。雖然國外一些發達國家對公共圖書館的研究起步較早,理論也已比較成熟,但圖4顯示國外學者對公共圖書館這一主題的研究仍然比較重視,每年都有一定數量的研究成果推出。筆者進一步分析論文內容后發現,2014—2019年以public libraries為關鍵詞的文章主要集中在公共圖書館管理、現代技術應用和信息服務三個方面。
第三高頻關鍵詞是digital libraries。圖5顯示,2014年是digital libraries占比最高的一年,接近10%,之后開始逐年下降,偶爾有小幅回升但最終占比僅維持在2014年的一半左右。筆者分析了以digital libraries為關鍵詞的論文后發現,數字圖書館研究涉及較多學科,說明該領域與其他學科有很多交叉點,同時關于數字圖書館的具體技術應用和服務方面的研究占比也較大。
圖6是第四高頻關鍵詞libraries services的百分比折線圖,其與第二高頻關鍵詞public libraries的折線圖有一些相似,都呈波浪形,有增有減,且二者的百分比增長年份與下降年份基本對應,都在2015年、2017年、2019年有所下降。出現這種情況可能是圖書館服務與公共圖書館之間關系密切,從公眾視角看,甚至可以說公共圖書館是圖書館服務的主角。此外,相較于其他圖書館,公共圖書館面對的用戶范圍更廣泛、類型更多樣、數量更龐大,因此公共圖書館服務比其他類型圖書館更為學者所重視。
第五高頻關鍵詞是university libraries,其百分比折線圖整體呈上升趨勢,特別是2017—2019年,三年接近一次函數增長見圖7,說明university libraries越來越受國外學者的重視。university libraries在大學的教學工作和學生的自主學習中扮演著重要的角色,再加上“互聯網+”時代的到來以及新媒體的快速發展,高校圖書館面臨巨大的機遇和挑戰,亟須進行變革,這都是吸引國外學者關注和研究的動因。筆者分析以university libraries為關鍵詞的論文后發現,該研究主題主要集中在館藏和學科館員兩個方面。新環境下的高校圖書館如何適應海量資源的增長和師生多渠道的訪問,怎樣快速對館藏資源進行調整,如何將已有館藏資源數字化,如何取舍紙質資源和數字資源,以及館藏建設與服務如何更好地參與教學科研工作等,這些問題都吸引著國外學者的研究目光。
5?結語
囿于調查統計的規模和復雜度以及時間限制,筆者僅檢索統計了emerald數據庫最近六年的圖書館學論文,總體看時間跨度不足,論文數量及關鍵詞數量依然偏少,可能會影響對國外圖書館學研究熱點和未來趨勢的精準把握,筆者建議可將該研究結果與我國學者其他類似的研究成果相結合[8-10],相互補充,更加準確全面地掌握國外圖書館學的研究熱點與趨勢。筆者研究emerald數據庫近六年國外圖書館學研究的熱點與趨勢,一方面可以為我國圖書館學者在選擇議題、接軌國際、掌握動向等方面提供參考和借鑒,使我國圖書館學研究可密切追蹤國外研究現狀與潮流,便于研究成果達到國際水準;另一方面,近六年的圖書館學研究熱點與趨勢在一定程度上反映國外圖書館實踐中存在的主要問題,便于圖書館工作者及時了解,從而為中外圖書館工作者的互訪學習提供指引。對國外圖書館學研究進行研究分析,并非要我國圖書館學研究在各個方面都與國外一一對標,也不是要亦步亦趨,蕭規曹隨,而是借此使我國的圖書館學研究既具有國際視野,借鑒國外同行的先進經驗,同時又立足于我國生動豐富的圖書館實踐,形成鮮明的中國圖書館學研究特色。
參考文獻:
[1] 吳慰慈,董炎.圖書館學概論[M].北京:國家圖書館出版社,2008:54.
[2] 王子舟.圖書館學的宗旨是什么[J].圖書館,2001(1):10-14.
[3] 劉曉波.我國圖書館學研究熱點及趨勢:基于關鍵詞共現和詞頻統計的可視化研究[J].圖書情報工作,2012(7):62-67.
[4] 胡浪.2012—2016年國內圖書情報學研究現狀及熱點探析:基于13種中文圖情核心期刊的計量分析[J].圖書館工作與研究,2018(2):67-76.
[5] 吳漂生.關鍵詞視角下我國圖書館學研究熱點透視[J].大學圖書情報學刊,2019(3):97-103.
[6] 周笑盈.基于關鍵詞標引的近5年國際數字圖書館研究熱點與趨勢分析[J].農業圖書情報,2019(4):37-47.
[7] Donohue J C.Understanding Scientific Literature:A Bibliographic Approach[M].Cambridge:The MIT Press,1973:101.
[8] 孫清蘭.高頻詞與低頻詞的界分及詞頻估算法[J].中國圖書館學報,1992(2):78-81.
[9] 劉露.我國數字圖書館研究熱點可視化分析[J].中國管理信息化,2019(19):131-133.
[10] 周曉燕,宰冰欣.從戰略規劃看國外高校圖書館的發展趨勢:以28所世界一流高校圖書館的戰略規劃為例[J].大學圖書館學報,2016(1):62-68.
(編校:徐黎娟)