高蘊梅 陳子豪 張文韜
摘 要:Altmetrics作為一種新型科研產出評價方法,涌現了大量相關理論、方法、應用和工具的研究成果。梳理與總結這些成果,可為后續研究提供一定的參考和借鑒。使用文獻計量學方法、BibExcel +Pajek等工具,分析作者機構數和發文量、作者數和發文量、期刊載文數和發文量的“二八規律”;采用關鍵詞的Louvain社區發現方法,通過聚類分析挖掘出4類研究熱點。
關鍵詞:Altmetrics;BibExcel ;引用分析;共現網絡; 聚類分析
DOI:10. 11907/rjdk. 192026 開放科學(資源服務)標識碼(OSID):
中圖分類號:TP391文獻標識碼:A 文章編號:1672-7800(2020)005-0178-03
0 引言
Altmetrics 是Alternative Metrics的縮寫,中文稱為補充計量學,又稱替代計量學、選擇計量學,是一種基于社會媒體的新型評價方法,通過測量研究成果受到網絡的關注程度評估計算其影響力[1]。自2010 年Priem建立Altmetrics.com 網站以來,各界對Altmetrics廣泛關注,產生了大量相關理論、方法、應用以及工具成果。因此,對Altmetrics領域研究現狀進行梳理與總結十分必要。
基于中國知網數據庫收錄的文獻梳理國內Altmetrics研究成果如下:武澎[2]分析了2012-2015年關于Altmetrics的內涵界定、國內理論與實證研究、相關科研機構應用;龔佳劍[3]分析了 2008-2018年Altmetrics研究文獻的時間分布、機構分布、作者分布和研究熱點;鄧進[4]分析了2012-2017年Altmetrics研究的時間分布、期刊分布、高引用分布、作者分布、機構分布及研究熱點。基于Web of Science核心合集數據庫梳理國際Altmetrics研究成果:齊世杰[5]分析了2010-2016年Altmetrics研究文獻的學科領域分布、國家及機構分布、核心作者分布和研究熱點;楊思洛[6]分析了2012-2014年Altmetrics研究的發展階段、內容歸納、優勢與劣勢和發展趨勢;田文燦[7]分析了2012-2018年Altmetrics領域知識概念生長與凋亡。這些研究成果較好地總結了Altmetrics領域研究現狀,但是缺乏對國際Altmetrics研究成果的作者機構數、作者數、期刊載文數與發文量的規律分析和總結,缺乏關鍵詞聚類結果的文獻內容分析。
本文在借鑒上述研究成果基礎上,利用Pajek和VOSViewer等工具,分析作者機構數和發文量、作者數和發文量、期刊載文數和發文量的“二八規律”,基于關鍵詞的Louvain社區發現聚類結果分析文獻內容,期望能為Altmetrics領域的發展以及學者后續研究提供參考和借鑒。
1 數據來源與處理
研究數據來源于Web of Science數據庫。檢索式為:主題=“Altmetric”,檢索年限限定為2012-2019年,選擇Web of Science核心數據庫,檢索時間:2019年3月6日,共得到327條數據。
利用文獻計量法對相關文獻進行統計分析、數據描述,解釋文獻特征和變化規律,通過繪制科學知識圖譜,揭示與解讀相關文獻。結合各軟件的優勢,選取BibExcel 、Pajek、VOSViewer、EXCEL、NotePad等軟件進行整理、編輯、統計、挖據和可視化等工作。
2 文獻“二八”特征分析
2012年Priem提出傳統引文文獻計量分析缺乏數據庫、軟件、博客等來源的引用問題,學者可在正式引用文獻出現之前討論、標注、推薦、駁斥、評論、閱讀相關內容,提出利用Altmetrics統計分析、度量評價、科學發現或推薦評價、在線工具和環境的定性研究,Altmetrics理論及其學術影響等研究,這些研究解決了Altmetrics數據平臺、指導思想、基本思路、應用范圍等一些基本問題。
2.1 機構數與發文量特征
327篇Altmetrics 論文作者機構共403個(包括非第一作者機構),403個機構在327篇論文中出現了1 110次。發表1篇論文的機構有202個,占比50%,發表2篇論文的機構有93個,占比23.02%,發表3篇論文的機構有31個,占比7.67%,發表4篇論文的機構有28個,占比6.93%,發表5篇及以上論文的機構50個,占比12.38%。
Altmetrics機構發文量分布的“二八特征”,即80%的機構只發表了1~2篇論文,共計出現了388次(占總次數的35%);20%的機構發表了3篇及以上論文,共計出現了722次(占總次數的65%)。
高產機構有Wolverhampton Univ(53篇)、Dalian Univ Technol(30篇)、Nanyang Technol Univ(29篇)、Univ Cordoba(28篇)、 Univ Alberta(23篇)、 Univ Montreal(22篇)、Univ Toronto(18篇)、Wuhan Univ(18篇)、Max Planck Inst Solid State Res(16篇)、Reina Sofia Univ Hosp(16篇)、 Max Planck Gesell(16篇)、Univ Maryland(16篇)、Leiden Univ(15篇)。13家機構(不足機構總數的4%)出現了300余次,占總數的27%。
2.2 作者數與發文量特征
從作者的產出數量可以識別主要作者、該領域的研究者規模及活躍程度。327篇論文共有501名作者(包括非第一作者),501名作者在327篇論文中出現了758人次。發表1篇論文的作者有397人,占作者總數的79.24%,占總人次的52.7%;發表2篇論文的作者63人,占作者總數的12.57%,共計出現了126次,占總人次的16.62%;發表3篇論文的作者16人,占作者總數的3.2%,共計出現了48次,占總人次的6.3%;發表4篇及以上論文的作者24人,占作者總數的4.8%,共計出現了187次,占總人次的24.7%。
Altmetrics作者數和發文量分布的“二八規律”,即80%的作者只出現了1次,20%的作者發表論文大于等于2篇,共計出現了361次,占總次數的47.6%。
高產作者有Thelwall(31篇)、Bornmann(20篇)、 Haunschild(15篇)、 Haustein(10篇)、Lariviere(8篇)、Holmberg(8篇)、Costas(7篇)、Ortega(7篇)、Gorraiz(6篇)、Bowman(6篇)、Sugimoto(6篇)、Owen(6篇)。
高產作者的發文特征:12名作者(占作者總數的2.4%)發文130篇(占論文總數的39.8%)。
2.3 載文期刊數與發文量特征
327篇文章發表在105種期刊上,分布在計量學、信息學、化學、醫學等多個學科期刊上,包括《NATURE》,《ACS CENTRAL SCIENCE》等多個世界頂級期刊,表明Altmetrics研究引起了眾多學科領域注意,且取得了較高層次成果。
75種期刊只發表了1篇論文,占期刊數的71.4%,占論文數的22.9%。發文量在2篇及以上期刊30個,占期刊數的28.6%,占論文數的77.1%。
載文期刊數和發文量呈“二八規律”:大約80%的論文發表在20%的期刊上,20%的論文發表在80%的期刊上(每個期刊只發表了1篇)。
大于5篇的高產期刊有:SCIENTOMETRICS(87篇)、JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY(24篇)、PLOS ONE(20篇)、JOURNAL OF INFORMETRICS(17篇)、ELIFE(15篇)、ONLINE INFORMATION REVIEW(13篇)、ASLIB JOURNAL OF INFORMATION MANAGEMENT(12篇)、ABSTRACTS OF PAPERS OF THE AMERICAN CHEMICAL SOCIETY(8篇)。
高產期刊數和發文量特征:8個期刊(占期刊數的7.6%)發文196篇,占論文總數的60%。
3 基于Louvain社區發現聚類的內容分析
關鍵詞是對論文主題的高度概括和凝練,是學術論文的核心與精髓。統計分析Altmetrics研究發表論文中關鍵詞出現頻次及其相互關系,可以揭示該領域的知識結構演變和研究熱點分布。使用BibExcel 提取頻次大于4的關鍵詞生成關鍵詞共現矩陣,Pajek生成共現網絡并用Louvain社區發現算法聚類分析,VOSViewer可視化結果得到4類研究主題及熱點。
第1個聚類的關鍵詞包括Facebook、Tweets、Twitter、Researchgate等社會媒體(Social Media),使用Altmetrics、Plumx等平臺和工具,獲得Research Evaluation、Webometrics、Article-Level Metrics等指標的度量、影響因子、數據背景等主題。Zhang[8]基于生態學領域的40 000篇文獻的計量學和Altmetrics數據,分析了科學論文在社交媒體上的傳播模式,特別是高Tweet和高引用論文,發現Tweet時間和用戶類型影響了科學出版物在社交媒體上的關注度。具有大量Tweet用戶的文章能及時被社會媒體曝光,通常是期刊相關機構用戶或有很多粉絲的用戶。一般高引用論文既不是及時推送也不是期刊用戶推動的結果;Vainio[9]研究是誰推送了農業、工程技術、醫學、自然和人文社科等4個學科的論文,通過定性和定量的關鍵詞分類、共詞分析和內容分析研究,結果發現Twitter 用戶推送學術文章的原因更多強調的是他們的職業專長而非個人興趣;Yu[10]研究了Altmetrics 數據的上下文背景,包括計數類型和用戶類別,不同twitter用戶類別數據表明,一般發到Twitter的信息對公眾用戶影響很大,研究者用戶比其他類別用戶具有更多的引用相關性。
第2個聚類關鍵詞包括Citation analysis、Impact factor、 Medndeley、H-index等,研究內容主要針對臨床實驗(Clinical Trials)等領域的傳統引文H指數和基于Mendeley等文獻工具的Altmetrics指數之間的對比分析、引用分析、引用特征、引用源等主題。Haustein[11]分析了37位天體物理學家的Twitter用戶推文行為,并比較了他們的出版行為和引用關系,結果發現他們的推文與出版數呈中度負相關,轉發與引用率不相關,推文和摘要的相似性很低;Costas(2017)分析了文獻工具Mendeley的讀者數分布與跨領域引用之間的不同和相似之處。通過特征分布和尺度方法分析兩者的分布形狀,解決兩者差異引出的標準化問題度量框架,結果發現Mendeley閱讀分布與各個領域的歪斜度高度相關,使用領域讀者數的均值作為標準化因子可以得到較好結果,引用數量是度量產出的重要指標;Luo(2018)從實引論文和來自有名機構的引用源兩個方面探究影響引用數量的因子,結果發現引用了有名機構的論文比無名機構的論文具有更高的引用數量,有名機構引用的論文作者和期刊具有更高的H指數、期刊影響因子、更高的Altmetric 分數和其它指標。
第3個聚類關鍵詞包括Open Access、Peer Review、Research、Blogging等,主要研究內容包括Altmetrics開放獲取、同行評審的相互影響和應用。Snijder(2016)從2009年就開始了一個實驗,驗證開放獲取對引文數量和推文專著關注量是否有相關影響。2014年獲取了引文和推文測試數據,結果表明開放獲取略有優勢,但是也應該考慮語言和主題的影響,Twitter的使用和引用行為很難有交集。在社交媒體、開放獲取、Altmetrics和大數據的影響下,同行評審越來越開放;Tattersall(2015)討論了公開同行評審意見的促進和障礙因素,鼓勵在出版前后公開同行意見。平臺(F1000 Research,Open Review,Peer J, Peerage of Science, PLOS ONE,PubMed Commons,Publons,PubPeer,ScienceOpen,The Winnower)可應用Altmetrics、雪球度量(Snowball Metrics)或其它類似的系統,公開和盲審出版前后的評審意見。
第4個聚類關鍵詞包括 Journal、Metrics, Correlations, Indicators, Citation Index, 主要研究Altmetrics的期刊度量、引用指標和相關性分析等主題。Markusova(2018)分析了2015年俄羅斯國內37 200條SCIE論文,使用兩個指標180天的使用數(記為U1),以及自2013年2月以來的使用數(記為U2),識別引用指標和論文級度量的Kendall相關系數,結果表明時間較長的U2比時間短的U1具有更強的相關性,U1的使用量和傳統期刊度量的被引半衰期呈弱相關。DOI是多數網站或Altmetrics 工具檢索、識別論文的關鍵元素,Boudry(2017)評估了在PubMed數據庫中生物醫學類期刊論文具有DOI的情況。使用出版商期刊的國家地理分析,結果發現1966-2015期間只有40.48%的期刊有DOI ,2000開始逐漸增加,到2015年86.42%的論文有DOI,但是仍有部分國家(如俄羅斯、泰國、烏克蘭)很少有DOIs。
4 結語
Altmetrics研究從無到有、由點及面,從備受質疑到廣為接受,并廣泛作為論文、專利、圖書、機構、期刊等評價的參考因素,進度和成果超出預期,相關研究成果豐碩。社交媒體平臺為科研工作者和科學愛好者提供了豐富的資源、廣闊的研究空間和研究前景。可以預見,有關Altmetrics的研究必將呈現蓬勃發展之勢,研究成果將持續增長。
參考文獻:
[1] 余厚強,任全娥,張洋,等. Altmetrics的譯名分歧:困擾、影響及其辨析[J]. 中國圖書館學報, 2019(1):47-59.
[2] 武澎,李田田,王開陽,等. 我國Altmetrics研究現狀與熱點分析[J]. 科研管理,2018(5):122-130.
[3] 龔佳劍,孟群. 補充計量學研究可視化分析[J]. 首都醫科大學學報,2019(1):106-111.
[4] 鄧進. 基于科學計量學的國內Altmetrics研究文獻的分析[J]. 西南民族大學學報(人文社會科學版),2018 (5): 236-240.
[5] 齊世杰,鄭軍衛. 基于文獻大數據的國際Altmetrics研究力量與熱點分析[J]. 現代情報,2017(10):130-138.
[6] 楊思洛,程愛娟. 社交網絡環境下的計量學:Altmetrics研究進展綜述[J]. 情報資料工作,2015(4) :33-37.
[7] 田文燦,胡志剛,王賢文.科學計量學視角下的Altmetrics發展歷程分析[J]. 圖書情報知識,2019(2):5-11.
[8] ZHANG L,WANG J. Why highly cited articles are not highly tweeted? a biology case[J]. Scientometrics, 2018(1):495-509.
[9] VAINIO J,HOLMBERG K. Highly tweeted science articles: who tweets them?an analysis of Twitter user profile descriptions[J]. Scientometrics, 2017(1):345-366.
[10] YU, H. Context of altmetrics data matters: an investigation of count type and user category[J]. Scientometrics, 2017 (1):267-283.
[11] HAUSTEIN S,BOWMAN T D,HOLMBERG K,et al. Astrophysicists on twitter: an in-depth analysis of tweeting and scientific publication behavior[J]. Aslib Journal of Information Management,2014 (3):279-296.
(責任編輯:杜能鋼)