韓雙楊
(西南大學 計算機與信息科學學院,重慶 400715)
20世紀60年代以來,引文分析作為傳統的科學研究成果評價方法,逐漸受到人們的質疑。引文索引的創始人加菲爾德曾經告誡人們,對引文分析應用于科學研究成果的評價要保持謹慎的態度。相關研究指出,引文分析存在著3個方面的局限性[1]。首先,引文分析的時滯過長,無法及時反映科學家的科研成果;其次,引文分析所展現出來的科學家影響力是片面的,科學家科研成果的表現形式不僅包含其所發表的論文,還包括撰寫的學術博客、在社交媒體平臺上發表的學術意見、會議PPT等與學術活動有關的產出;最后,引文分析存在著一些固有缺陷,如無法識別負面的引文動機等。因此,如何改進以引文分析為主的傳統科學研究成果評價方法,成為科學家們尤其是計量學家們共同追求的目標。隨著新技術的發展,科研環境發生了巨大的變化,從傳統的以期刊交流系統為主的科研環境轉向了新型的在線交流系統為主的科研環境。因此,科研成果的評價方式也隨之發生了改變,基于新型社交媒體的學術科研活動所產生的成果越來越得到重視。2010年,北卡羅萊納大學咨詢與圖書館系的Prime創建了“Altmetrics”一詞,用以測度在線科研環境下科研人員的學術成果影響力。它為學術成果的影響力測量提供了新的視角,拓展了人們對于學術成果研究的廣度和深度,具有重要意義。
為明確Altmetrics領域的研究現狀及特點,國內部分學者對已發表的Altmetrics研究領域的文獻進行了計量分析。齊世杰等[2]選取CNKI數據庫為數據源,采用文獻計量與可視化方法,從研究概況、文獻合著、研究內容三大方面對國內Altmetrics研究進行全面分析。丁喆[3]利用信息可視化軟件CiteSpace對從Web of Science(WoS)數據庫中下載的Altmetrics研究文獻進行分析,揭示該領域研究的學科、國家和作者分布情況,探究知識基礎中關鍵節點文獻的演進以及研究熱點聚類,并預測Altmetrics研究未來可能的發展趨勢。劉雯等[4]以Web of Science核心集為數據源,利用CiteSpaceⅤ可視化分析工具,從施引文獻學科、國家、機構的共現情況、作者合著網絡等方面,對Altmetrics研究進行了可視化分析,發現當前的研究熱點是基于社交網絡的相關研究,研究前沿是如何從社交網絡等平臺獲取Altmetrics的相關指標數據。
目前,國內鮮見同時以國內外Altmetrics相關文獻為研究對象進行綜合分析對比該領域的研究。對國內外Altmetrics領域的文獻進行深入整理和挖掘,有助于厘清國內外Altmetrics研究的現狀及未來發展態勢,探討進一步可考查的研究視角。因此,本文嘗試以國外Web of Science和國內CNKI兩個權威數據庫中關于Altmetrics的文獻為對象進行系統的對比分析,以期為國內該領域進一步研究提供思路和理論基礎。
為保證收集數據的質量,本文以國內外具有代表性的數據庫作為數據來源。國外文獻數據來源于Web of Science數據庫,選取Web of Science核心集,以“主題=Altmetrics”作為檢索條件,選取檢索時間范圍為2011—2020年,共得到相關文獻690篇,所收集的每條數據包括題目、作者、引用文獻等信息。國內文獻數據來源于CNKI數據庫,采用高級檢索的方式,以“‘主題=Altmetrics’or‘主題=替代計量學’or‘主題=補充計量學’or‘主題=選擇計量學’”為檢索條件,選取檢索時間范圍為2011—2020年,選取文獻來源類別為“北大核心”和“CSSCI”,共得到相關文獻294篇。利用所獲取數據,采用CiteSpace V進行可視化分析。CiteSpace V是一款基于JAVA環境的可視化共引網絡分析軟件,是由美國德雷克塞爾大學B?rner等[5]基于引文分析理論開發的計量學軟件。CiteSpace V可以檢測關鍵節點,使用戶輕松獲取中心度高的節點信息,并具有關鍵詞聚類等功能,可以確認Altmetrics領域的研究熱點。
雖然Altmetrics是在2010年提出的,但是通過統計國內外關于Altmetrics的發文量可以發現,2010—2011年國內外并無相關的論文發表。第一篇論文是Prime在2012年發表在PLoSONE雜志上的“The Altmetrics Collection”,該文章從時代背景出發,論述了傳統學術影響力評價方法的弊端,提出了基于在線工具和環境中的活動來研究學術影響度量的Altmetrics評價方法,自此引發了學者們對Altmetrics研究的熱潮。
圖1展示了2012—2020年國內外Altmetrics研究的文獻分布情況。可以看出,國內外Altmetrics研究起步于2012年,在2014—2016年國內外Altmetrics研究的發文量都呈現較大程度的上升趨勢,但是國內的增長速度小于國外,2016年以后國內外Altmetrics相關研究逐漸呈現波動增長局面。從發文數量來看,國外Altmetrics研究整體上要多于國內相關研究,在經過快速增長而趨于穩定之后,國外發文量保持在110篇上下,而國內的發文量穩定在50篇上下。可以預見,隨著在線科研環境的日趨成熟,國內外Altmetrics研究熱度將會持續增長。

圖1 國內外Altmetrics研究文獻時間分布
進一步地,本文利用Web of Science數據庫對各個國家發表的Altmetrics論文進行統計分析,發現不同國家對Altmetrics的關注程度和研究水平有所差異。將文獻的數據導入CiteSpace中,將Node Type設置為Country,設置閾值為10,其余選項設置為默認,得到排名前10的各國Altmetrics研究的發文量圖譜,如圖2所示。圖譜中每個節點代表一個國家,節點的大小表示每個國家的發文頻次,節點之間的連線代表不同國家之間的合作情況。從圖譜中可以看出,歐美發達國家的節點連線較多,說明歐美國家的Altmetrics合作研究已經形成了一定的規模。另外,圖譜中中國的節點相對來說較為孤立,說明中國在Altmetrics領域的研究缺乏與其他國家間的合作交流。

圖2 各國Altmetrics研究的發文量圖譜
通過統計各國在Altmetrics領域的發文量,得到發文量前10名依次為美國、英國、西班牙、中國、德國、加拿大、荷蘭、俄羅斯、巴西、印度。由此可發現歐美國家的發文量普遍較大,美國Altmetrics研究的發文數量領先于其他國家,占據世界首位,英國和西班牙緊隨其后,在發文量排名前10的國家中美國、英國、西班牙三國占比達54.3%,說明三國在Altmetrics領域的研究處于主導地位。與以上3個國家相比,中國的Altmetrics研究還有較大差距,并且與其他國家的合作研究也相對較少,這說明我國的Altmetrics研究還有相當大的提升空間,需要及時關注國際動態,加強與其他國家的合作研究,使中國在Altmetrics領域研究中扮演重要角色。總體來說,發文量排名前10的國家中,歐美國家占據大多數,且排名靠前,而中國、俄羅斯和印度等發展中國家排名相對靠后。
作者是一個學科領域發展的中堅力量, 熱門作者的研究方向往往反映了一個領域的研究熱點,作者的機構屬性反映了領域的知識生產能力分布特征。對作者分析時,首先需要確定被引頻次高的作者。使用CiteSpace可視化工具,將Node Type設置為Cited Author,閾值設置為10,得到高被引作者的知識圖譜,如圖3所示。
從圖3中可以看出,Prime是被引頻次最高的作者,被引頻次為34次。Prime開創性提出Altmetrics概念,從而引發了Altmetrics研究的熱潮。Thelwall的被引頻次達到29次,他是英國Wolverhampton大學的教授,是網絡計量學研究的重要人物,也是Altmetrics領域研究的資深學者。網絡計量學和Altmetrics有著非常密切的關系,Altmetrics是社交網絡環境下的計量學,可以說是在新興科學交流模式下的網絡計量學發展。Haustein的被引頻次排在第3位,達到24次。

圖3 國外高被引作者知識圖譜
由于CiteSpace軟件本身的限制,無法根據CNKI來源數據確定國內的高被引作者。因此,國內的重要作者分析從高產作者入手。首先,需要確定國內近十年來Altmetrics領域的高產作者。根據普萊斯定律[6],在同一領域中,半數論文為一群高生產能力作者所撰寫,這一作者集合的數量上約等于全部作者總數的平方根,用公式表示就是m=0.749(nmax)0.5,其中,nmax表示最高產的那位作者所發表的論文總數。對國內294篇論文進行處理,共得到作者107位,通過統計得到近十年內我國最高產作者發表的論文數為10篇,故m≈2。因此,該時間段內論文發表數量在兩篇以上的為高產作者,經過統計高產作者共有12位,分別是邱均平、余厚強、劉春麗、趙蓉英、劉麗敏、王晴、毛文莉、湯珊紅、王賢文、由慶斌、劉曉娟、匡登輝。邱均平教授近十年的發文數量最多,高達10篇[1,7-8]。他曾發表過《替代計量學的提出過程與研究進展》《替代計量學視角下的在線科學交流新模式》《替代計量指標分層與聚合的理論研究》等論文,將Altmetrics的最新研究引入國內,給出了這一術語的翻譯和解釋,并在指標體系的構建和工具應用等方面做出了卓有成效的研究。余厚強等[9]針對Altmetrics數據質量評估構建了指標體系;劉春麗等[10]對Altmetrics相關工具及其應用做出研究;吳勝男等[11]研究了Altmetrics應用工具的發展現狀;劉麗敏等[12]合作研究了Altmetrics應用于影響力評價的可行性;王賢文等[13]側重研究了科研論文在社交網絡中的傳播機制及綜合評價;由慶斌等[14]將Altmetrics譯為“補充計量學”,著重研究了基于Altmetrics的論文影響力評價模型構建;劉曉娟等[15]重點研究了Altmetrics的覆蓋率問題;匡登輝[16]以Altmetrics Top100論文為研究對象,對其合作模式及其演進特征進行實證分析。
研究熱點是指某個領域內的學者普遍認為的值得深入研究的問題。通過研究領域的熱點,可以更好地解決研究重點,并發現關鍵的問題。文獻的關鍵詞反映出該文獻的核心思想和關鍵內容,因此本文從相關文獻數據中的關鍵詞入手,通過對其出現頻數的分析,可以大致反映出該領域的研究熱點。在CiteSpace中,中介中心度是網絡節點重要性的參考,它測量了某一個網絡節點連接其他節點路徑上的重要程度。一個節點的中介中心度越高,該節點連接其他節點的中介性就越強。知識圖譜中介中心度大于或等于0.1的節點為關鍵節點,由紫色圓環表示,紫色圓環越厚,表示中介中心度越高。
利用CiteSpace軟件,將節點設置為“Keyword”,閾值設置為30,其余設為默認,得到Altmetrics關鍵詞共現圖譜,如圖4所示。圖中共有節點362個,連線1 017條。圖中“年輪”的顏色和厚度分別表示關鍵詞出現的時間和數量,節點大小表示關鍵詞出現的頻次,節點之間連線的顏色表示兩個關鍵詞最早共同出現的時間,連線的粗細表示關鍵詞之間共現的高低。

圖4 國外Altmetrics研究關鍵詞共現圖譜
從圖4中可以看出,出現頻次較高的關鍵詞依次為altmetrics、impact(影響力)、citation(引用)、social media(社交媒體)、bibliometrics(文獻計量學)、science(科學)、twitter(推特)、metrics(計量學)、indicator(指標)、citation analysis(引文分析)等關鍵詞。近十年來,國外Altmetrics的研究經歷了萌芽階段、奠基階段、全面發展階段,從概念的提出與討論、與傳統引文計量學關系的討論逐漸上升到Altmetrics工具研究,并利用相關的數據進行實證,研究深度與廣度不斷提高。
通過相同方法,對國內的相關數據進行分析,得到國內Altmetrics研究熱點的知識圖譜,如圖5所示。

圖5 國內Altmetrics研究關鍵詞共現圖譜
從圖5中可以看出,出現頻次較高的有“替代計量學”“Altmetrics”“科學評價”“學術影響力”“社會影響力”“機構知識庫”“開放存取”等關鍵詞。“替代計量學”節點非常突出,說明“替代計量學”這種譯法在很大程度上到學者的廣泛認同,并將其運用到研究中。Altmetrics的影響力主要體現在兩大方面:學術影響力和社會影響力,這點在圖譜中也有所體現。相關研究集中于Altmetrics在科學評價中的應用、相關工具的探討、Altmetrics指標與傳統引用指標的相關性探討等。
通過對比可以發現:國外Altmetrics研究的關鍵詞圖譜中,較多地出現了“twitter”“social media”等社交媒體術語,可見國外的Altmetrics研究與社交媒體緊密相關;在其關鍵詞聚類圖譜中,出現 “ scientific collaboration”(科研合作)、“medicine”(醫學)等詞,可見Altmetrics研究注重科研合作中的應用,且在醫學領域的應用明顯。然而,國內還主要集中于在圖書館服務等方面的應用,因此國內Altmetrics的應用領域有待拓寬。在Altmetrics指標的構建、指標的評估和工具開發等方面研究較多,而國內在指標評估方面研究相對較弱。國內的Altmetrics數據源覆蓋率有限,使得國內的科學研究成果影響力評價受到一定的限制,需要構建Altmetrics指標聚合平臺,并進一步加強Altmetrics數據源質量控制方面的研究。從研究熱點圖譜中可看出,國外關鍵詞共現圖譜的節點和連線相對于國內來講較為密集,這說明我國對于Altmetrics的研究廣度和深度有待加強。值得注意的是,我國學者對Altmetrics指標和傳統引文指標進行了大量的相關性分析,以驗證兩者之間的關系,這點在國外關鍵詞共現圖譜中并未體現。
本文通過利用信息可視化分析工具CiteSpace V對國內外有關Altmetrics研究的發文量、科研合作、重要作者、研究熱點進行了整理和分析,得出以下結論。
(1)從發文數量來看,Altmetrics研究呈現不斷增長的趨勢,而國外關于Altmetrics的研究整體上要多于國內的相關研究,預計在接下來的幾年里,國內外關于Altmetrics的研究熱度會持續增長。
(2)美國、英國、西班牙三國在Altmetrics領域的研究處于主導地位;歐美國家的Altmetrics合作研究已經形成了一定的規模,而中國在Altmetrics領域的研究缺乏與其他國家間的合作交流。
(3)國外的研究熱點主要集中于Altmetrics指標的構建、指標的評估、工具的發展,而國內需要進一步增加Altmetrics數據源的覆蓋率,構建國內的Altmetrics指標聚合平臺,并加強Altmetrics數據源質量控制方面的研究,拓寬Altmetrics的應用領域。
由于數據年份的限制,所收集的數據集容量較小,可能會使研究結果不夠全面,分析結果必然會存在偏差; 在研究熱點部分,根據關鍵詞出現頻數和中介中心度來確定該領域的研究熱點具有較強的主觀性,因此這部分還有很多具體問題值得進一步探討。