謝暄++蔣曉++王燕++何雨蓮++康祝圣++田江


摘 要:目前,Scopus已打破WoS在利用引文數據提供引證信息統計和評價分析的權威地位,并得到了越來越多科研人員的關注。針對Scopus數據庫和WoS數據庫,從文獻來源與引證指標統計數據源、主要引證指標、引證結果、被應用的情況等方面立體地進行了比較。結果指出,隨著科研工作的全球性、跨學科性、合作性的日益增強,相比于僅通過JCR一個評價報告獲得期刊與科研成果評價,同時采信Journal Citation Reports(JCR)報告和Scopus數據庫引證指標,獲得的評價結果更加公正、科學。
關鍵詞:Scopus;Web of Science;Journal Citation Reports(JCR);引證指標
中圖分類號:F426 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2017.04.008
一直以來,基于科技期刊數據庫的科技期刊引證指標都是科技期刊發展評價的重要參考指標,同時,也是科研人員與高校研究生進行科研成果評價的重要參考依據。自20世紀90年代以來,SCI數據庫、ISTP數據庫、EI數據庫一直被我國圖書情報工作者稱作國際三大檢索數據庫。其中,SCI數據庫的引文數據分析功能在期刊評價與科技成果評價中占有絕對權威的地位。發展至今,SCI數據庫已成為Thomson Reuters的最新Web of Science(WoS)核心合集中的一部分。WoS核心合集數據庫包括Science Citation Index Expanded(SCIE)、Social Science Citation Index(SSCI)、Conference Proceedings Citation Index(CPCI,原ISTP)、Arts & Humanities Citation Index(A&HCI)4個相互獨立的數據庫。2004年,世界著名出版公司Elsevier推出Scopus數據庫。目前,Scopus數據庫已成全球最大的文摘和索引數據庫。它的出現挑戰了WoS數據庫在引文數據分析評價中的權威地位。
隨著Scopus數據庫影響力的日益提高,國內外圖書情報學相關科研人員已分別從系統界面(人機界面)、國家論文數量、數據處理的規范性、某一學科領域期刊引證數據比較、源刊影響力等方面入手撰文比較了Scopus與WoS。大部分學者的研究從特定期刊或特定的某一學科入手,分析了2個數據庫的樣本。目前來看,尚沒有文獻全面對比、分析2個數據庫從文獻來源到被采信應用范圍的情況。
本文針對Scopus數據庫和WoS數據庫,從文獻來源與引證報告數據源、主要引證指標、引證結果、被應用的情況等方面比較二者,并為今后的期刊評價和科研成果評價中數據庫的選擇提出一些建議。
1 文獻來源與引證指標統計數據源比較
據Scopus官方說明,Scopus數據庫文獻來源包括期刊(Journal)、商業期刊(Trade journal)、叢書(Book series)、圖書以及有全文的會議文獻,總數據源約29 600種。其中主要包括27個學科,被分為四大主題,即生命科學(Life Sciences)、健康科學(Health Sciences)、自然科學(Physical Sciences)和社會科學(Social Sciences)(包含人文與藝術學科)。而期刊是Scopus數據庫的主要文獻來源。根據Elsevier公司公布的Scopus 2015 title list,Scopus共收錄期刊約22 000種,所有Scopus的引證指標都是基于所收錄的數據源計算得來的。
WoS數據庫包含SCIE、SSCI、CPCI、A&HCI 4個相互獨立的數據庫。總體來看,WoS數據庫中包括期刊、會議、專利等文獻類型,它們來自于自然科學、醫學、社會科學、人文藝術等學科領域,總數據源約18 900種。由于本文主要關心科技期刊的評價,因此,會重點關注WoS數據庫中SCIE和SSCI這2個子數據庫。Thomson Reuters公司2015年公布的SCIE&SSCI Full Title顯示,WoS在SCIE&SSCI中共收錄期刊約12 000種。WoS的引證指標計算結果作為WoS的一項單獨服務,以引證報告Journal Citation Reports(JCR)的形式每年出版,分為科學版和社會科學版(Science Edition與Social Science Edition),分別統計來自SCIE和SSCI的數據。
烏利希期刊指南(Ulrichs periodical database)作為全球最大的期刊目錄,收錄了全世界絕大多數出版中的期刊。因此,以烏利希期刊指南為比較基準,經過嚴格的ISSN匹配與期刊名稱、出版國家人工匹配發現,在生命科學(Life Sciences)、健康科學(Health Sciences)、自然科學(Physical Sciences)和社會科學(Social Sciences)四大主題中,相比于WoS數據庫,Scopus數據庫所收錄的期刊源表現出了更均衡的國家分布、更
強的國際化程度。與此同時,二者均表現出對英國、荷蘭、美國等西方國期刊的“過表達”(overrepresented)。不過這種情況并不意外,因為眾多優秀的出版公司都在這些國家。
由此可見,在總量和期刊數量上,Scopus數據源均多于WoS數據源,二者均收錄了來自醫學、理工、人文、藝術等多個學科的文獻,所收錄的數據源有大部分重復,同時,也各自有部分獨有收錄的數據源。Scopus數據源在出版國別分布上更加均衡,表現出更好的國際化分布。但是,在引證指標計算統計源的組織形式上二者完全不同。Scopus數據庫的引證指標是根據全庫數據計算而來的,統計源呈現了明顯的多樣性;而WoS的引證報告JCR則保留了傳統分類,僅按照某個子數據庫數據源單獨計算,統計源類型僅包括期刊文獻。
2 主要引證指標比較
2.1 Scopus主要期刊引證指標
2.1.1 CiteScore
CiteScore是Scopus醞釀多年推出的引證指標,是指在統計年計算期刊近三年在Scopus數據庫中收到的總引用量,除以期刊近三年發表的總可被引文章數。
2.1.2 SCImago Journal Rank(SJR)
SJR指標將期刊的互引事件看作一個復雜的網絡,每種期刊被看作網絡中的一個點(node),基于網絡理論(network theory)中“連接(connection)到權重更高的點給源點增加更多的權重”這一基本原理,結合PageRank算法估計某期刊的影響力。即該指標同時考慮了被評價期刊的被引次數以及施引期刊的重要性和聲望,從而更加客觀地評價期刊的影響力。
2.1.3 Source Normalized Impact per Paper(SNIP)
SNIP基于某學科內總被引次數計算某來源期刊的影響力。在SNIP計算中,一個來自于總引用量更少的學科的引用表達了更高的影響力。我們可將SNIP看作是學科歸一化后的影響力評價指標,可以幫助研究人員直接跨學科比較源刊的影響力。
2.2 WoS的主要評價指標
2.2.1 Impact Factor(IF)
IF是指,在統計年計算期刊近兩年被WoS中所有收錄的期刊的總引用量,除以期刊近兩年發表的總可被引文章數。IF是衡量期刊影響力的傳統指標。
2.2.2 5-year IF
5-year IF是在統計年采用近5年的數據計算IF。
由此可以看出,Scopus數據庫的引證指標中考慮了更多影響因素,更全面、客觀,能夠在某種意義上消除學科與研究類型的不同對評價指標的影響,從而便于對比不同學科的期刊,但計算方法相對比較復雜。而WoS所采用的引證指標計算方法簡單,已使用多年,被廣大科研工作者所接受。但是,它無法消除學科間的差別與研究類型不一致而導致的引證指標差別(一般來說,理論研究的文獻IF會遠高于工程應用文獻的IF)。二者的優缺點對比如表1所示。
3 引證結果比較
雖然Scopus數據庫與WoS數據庫采用的是不同的最終引證指標,但是,所有指標的計算都是從期刊被引次數統計開始的。被引次數是最基本且最不受算法干擾的指標。同時,在Scopus數據庫的引證指標計算中,IF也是SCImago中的一個子指標。因此,文獻[9]選擇從被引頻次和學科內IF排名對2個數據庫進行差異性分析。
從統計結果來看,期刊被引頻次差異最大的學科集中在計算機科學(Computer Science)和醫學(Medicine)2個學科,而在其他學科中,2個數據庫分別統計得到的期刊被引頻次指標一致性比較強。期刊被引頻次差異正是來源于文中提到的Scopus數據庫和WoS數據庫的引證報告統計源組織形式不同。Scopus數據庫所有統計數據均來自于全庫所有數據源,包含所收錄的全部學科和全部文獻類型。而WoS的統計僅僅來自于其中一個子數據庫,比如JCR的自然科學版只統計來自于SCIE庫的數據源,而社會科學版只統計來自于SSCI庫的數據源。在計算機科學學科,許多重要科研成果均發表在IEEE或ACM的頂級國際會議中,而JCR的統計不包括國際會議。由此可知,在JCR的統計中,未能計入計算機科學學科中會議對期刊引用數據的貢獻。這是導致計算機學科期刊被引頻次統計結果在2個數據庫中有明顯差異的主要原因。而醫學學科并無太多會議對期刊的引用,又是什么原因導致二者的差異呢?分析發現,醫學期刊多學科之間存在較強的學科交叉關系,特別是與社會科學和心理學之間有較強的交叉關系。雖然SCIE數據庫與SSCI數據庫有部分共同收錄的期刊,但SCIE數據庫中社會科學和心理學期刊依然少于Scopus數據庫中相應的數量。而JCR統計分為自然科學與社會科學2個版本,無法統計SSCI數據庫中社會科學和心理學等期刊對醫學期刊的引用,因此,導致醫學科學期刊被引頻次統計在Scopus數據庫和WoS數據庫中呈現明顯差異。
對于分學科IF排名,分別采用Scopus數據庫與WoS數據庫統計結果,排名差異明顯的學科是計算機學科。這種差異依舊來自于WoS的統計結果未能計入IEEE和ACM等重要會議的引用記錄,同時,說明某些期刊會議文獻對其引用頻次貢獻非常大。例如,對于著名的ACM會刊,ACM Trans. on Information and System Security在JCR中IF排名第46位,在SCImago中排名第12位。然而,在2個數據庫中分別統計醫學學科IF排名并沒有太大的變化。筆者認為,有一種原因可能是,雖然JCR自然科學版未統計入SSCI中交叉學科期刊對醫學期刊的貢獻,但是,這種學科交叉情況廣泛而均衡地存在于所統計的絕大多數醫學來源期刊中,所以,SSCI數據庫引用貢獻的缺失并未導致醫學期刊IF排名發生明顯的變化。這種推測會在將來的工作中進行數據分析、確認。
4 數據庫影響力比較
數據庫的被認可度和影響力表現為該數據庫及其評價指標被使用的情況,特別是被國際刊物采用的情況以及被科研績效評價與獎勵采用的情況。
在國際刊物采用情況統計中(本文界定在期刊介紹或期刊首頁使用數據庫任一統計指標,即認為該數據庫指標被采用),PLoS系列刊物和Elsevier出版刊物(ScienceDirect平臺中所展示的刊物)同時采用了Scopus引證指標和WoS引證指標。而Nature出版的部分刊物采用了Scopus統計指標,所有Nature出版刊物均采用了WoS統計指標。Science未采用2個數據庫的統計指標。
在科研績效評價與獎勵方面,Elsevier學術之星與高被引作者評價、多個世界高等學校排名(包括Elsevier、英國泰晤士報、Times、QS World Univ. Rankings 等高校排名)以及英國REF大學學科質量評價,均采用了Scopus數據庫而未采用WoS數據庫。其中,英國REF大學學科質量評價結果將被用于分配下一個REF評價年之前該高校的科研經費。這有非常重要的現實意義。具體數據庫采用情況如表2所示。
由表2可知,長期以來,鑒于WoS在期刊與科研評價中的權威地位,目前應該說WoS的影響力還是略高于Scopus的影響力,但是,Scopus確實已經打破了WoS的權威地位,并在不斷提升其影響力。特別是在需要綜合考慮各種文獻類型的場合,比如綜合性的大學排名、學科評價,Scopus已占有重要位置,不可或缺。
另外,據不完全統計,Scopus在歐洲及東南亞部分國家,比如新加坡、馬來西亞等,已成為學術資格評審(比如博士學位獲得條件,職稱晉升條件等)認可采用的數據庫。
5 結論
從對文獻來源與引證統計數據源、主要引證指標、引證結果和數據庫影響力等方面的分析入手,綜合比較了Scopus數據庫與WoS數據庫。在文獻類型來源、引文數據分析和信息揭示方面,Scopus與WoS相比有相似之處,WoS被接受度高,不過在某些學科評價中,Scopus更加客觀、全面。
比較結果顯示,在文獻來源方面,2個數據庫均呈現出多學科、多種文獻類型的情況,但是,引證指標計算的數據源組織形式卻各有不同,Scopus的指標針采用全數據源計算,而WoS的JCR報告仍采用原來的方法按子庫數據源分別計算,且JCR的統計源僅包含期刊。因此,對于有眾多重要會議,會對期刊引用產生貢獻的計算機學科和學科交叉性比較強的醫學學科,2個數據庫統計的期刊被引頻次呈現出了較大的差異。同時,在計算機科學學科中,2個數據庫統計的期刊IF排名也呈現出了較大的變化,而在其他學科,2個數據庫統計被引頻次與期刊IF排名表現出了較強的一致性。Scopus數據庫提出的統計評價指標——SJR和SNIP,致力于消除學科和研究類型對評價指標的影響,但計算方法復雜;而WoS的主要評價指標——IF和5-year IF計算方法簡單,使用多年,被接受程度比較高,但是,無法消除學科與研究類型的影響。從數據庫被采用的情況看,WoS在重要國際期刊評價中的被采用率高于Scopus,但在科研獎勵與大學排名等需要綜合考慮多種科研成果形式的場合,Scopus被采用率更高。由此可見,Scopus已經打破了WoS的權威地位,且其影響力在不斷提高。
隨著科研工作的全球性、跨學科性和合作性的日益增強,相比于僅通過JCR這1個評價報告獲得期刊和科研評價結果,建議同時采信JCR報告和Scopus數據庫引證指標。這樣,獲得的評價結果應該會更加全面。更多針對2個數據庫的數據研究將在今后的工作中逐步進行。
參考文獻
[1]邱均平,葉曉峰,熊尊妍.國外索引工具發展趨勢研究——以Scopus為例[J].情報科學,2009,27(6):801-807.
[2]Web of Science核心合集,湯森路透.[EB/OL].http://www.
thomsonscientific.com.cn/productsservices/web_of_science/.
[3]Meho L.I.,Rogers Y.Citation Counting,Citation Ranking,and h-Index of Human—Computer Interaction Researchers:A Comparison of Scopus and Web of Science.Jouma/of the Association for Information Science and Technology,2008,59(11):1711-1726.
[4]Matthew E.Falagas, Eleni I.Pitsouni,George A. Malietzis,Georgios Pappas,Comparison of PubMed,Scopus, Web of Science,and Google Scholar:Strengths and Weaknesses.The FASEB Journal,2008(22):338-342.
[5]Archambauh é,Campbell D,Gingras Y,et a1.Comparing Bibliometrie Statistics Obtained from the Web of Science and Scopus.Journal of the Association for Information Science and Technology,2009,60(7):1320-1326.
[6]Elizabeth S.Vieira,José A. N. F. Gomes.A comparison of Scopus and Web of Science for a typical university.Scientometrics,2009,81(2):587-600.
[7]L.Leydesdorff,F. de Moya-Anegón,V. P. Guerrero-Bote.
Journal Maps on the Basis of Scopus Data:A Comparison
with the Journal Citation Reports of the ISI.Journal of the
Associationfor Information Science and Technology,2010,
61(2):352-369.
[8]傅立云,吳敏琦,謝海華.SCIE和Scopus引文功能的評價分析[J].高校圖書館工作,2009(06):54-56.
[9]劉筱敏,孫媛,和婧.Scopus與SCI來源期刊影響力差異化分析[J].中國科技期刊研究,2014,25(9):1171-1177.
[10]Scopus.[EB/OL].http://www.elsevier.com/online-tools/scopus/.
[11]Scopus Title List.2015.[EB/OL].http://www.scopus.com.
[12]JCR2014.2015.[EB/OL].https://jcr.incites.thomsonreuters.co
m/JCRJournalHomeAction.action?SID=A2-x2FVV3kOziQc
BTe8-18x2d5x2FWQz0x2BsbyUPrQKQ8eH2vwx3Dx3DP9
rRT5PCZt3ao1YomgVtEQx3Dx3D-iyiHxxh55B2RtQWBj2
LEuawx3Dx3D-1iOubBm4x2FSwJjjKtx2F7lAaQx3Dx3D&
SrcApp=IC2LS&Init=Yes&wsid=4CARgCJeFEKMzLpYaR
7.
[13]Philippe Mongeon,Adèle Paul-Hus.[EB/OL].http://www.asis.
org/SIG/SIGMET/data/uploads/sigmet2014/ mongeon.pdf.
[14]González-Pereira,V.P.Guerrero-Bote and F.Moya-Anegón,A new approach to the metric of journals scientific prestige:The SJR indicator.Journal of Informetrics,2010,4(3):379-391.
[15]F. V. P. Guerrero-Bote,F. Moya-Anegón. A further step forward in measuring journals scientific prestige:The SJR2 indicator. Journal of Informetrics,2010,6(4):674-688.
[16]G.Henk,F. Moed.Measuring contextual citation impact of scientific journals.Journal of Informetrics, 2010,4(3):265-577.
————————
作者簡介:謝暄(1983—),女,博士,電子科大學報英文編輯
室主任。
〔編輯:白潔〕