張 勇,李靜芳,甄 乾,蔣建龍
(甘肅省科學技術情報研究所/甘肅省科技評價監測重點實驗室,甘肅 蘭州 730000)
1964年美國科技信息研究所(ISI)正式發行了科學引文索引(Science Citation Index,SCI)[1],2000年,ISI推出學術信息資源整合平臺(ISI Web of Knowledge),以WOS平臺為核心。目前WOS平臺歸屬于Clarivate Analytics,是全球最大、覆蓋學科最多的綜合性核心期刊引文索引數據服務平臺[2]。如果一本雜志被WOS平臺的其中一個引文庫索引,那么它的所有文章都會被WOS平臺覆蓋,在互聯網、大數據以及與云計算的背景下,WOS平臺已成為基于網絡的學術信息資源數據平臺之一。WOS平臺由2個部分組成,即“所有數據庫”和“信息分析工具和信息管理軟件”,前者包含WOS核心合集(Web of Science Core Collection,WOSCC)、美國生物學數據庫(BIOSIS Previews,BP)、韓國期刊數據庫(KCI-Korean Journal Database,KCI)、生物醫藥文獻庫()、拉丁語區引文索引(SciELO Citation Index,SCIELO)、俄羅斯科學引文索引(Russian Science Citation Index,RSCI)、中國科學引文數據庫(Chinese Science Citation Database,CSCD)、德溫特專利索引(Derwent Innovations Index Derwent Innovations Index,DII);后者包含科研評估與分析平臺(InCites):科研評估與分析數據庫(InCites Benchmarking and Analytics,In-Cites:B&A)、基本科學指標(Essential Science IndicatorsSM,InCites:ESI)和期刊引文報告(Journal Citation Reports,JCR);參考文獻管理者(Reference Manager)、學術信息市場化和開發學術軟件(EndNote)和文獻檢索插件(EndNote Click)。在“所有庫中”以WOSCC最著名、使用最廣,其以收錄自然科學、社會科學、藝術與人文學科的論文為主,數據來源于期刊、圖書、專利、會議錄等,收藏了3個經典期刊引文索引,即科學引文索引(Science Citation Index Expanded,SCI)、社會科學引文索引(Social Sciences Citation Index,SSCI)和藝術與人文引文索引(Art&Humanities Citation Index,A&HCI);2個化學信息事實型數據庫(Current chemical Reactions,CCR和Index Chemicus,IC),科技會議文獻引文索引(Conference Proceedings Citation Index-Science,CPCI-S)和社會科學以及人文科學會議文獻引文索引(Conference Proceedings citation index-Social Science &Humanalities,CPCISSH)。WOS平臺通過檢索技術和基于內容的連接能力,將高質量的數據資源、文獻分析和管理軟件高度融合,成為科研人員進行論文檢索、分析、管理、寫作與發表的創新型研究平臺。
截至2022年,WOSCC收錄了2萬多種全球權威的、最具影響力的自然科學、工程技術、生物醫學、社會科學、藝術與人文等領域的學術期刊,超過20萬份會議錄以及10萬多種科技圖書的題錄摘要。歷經半個多世紀,WOSCC一貫堅持嚴格的選刊機制,其依據布拉德福定律,僅收錄世界上各學科領域中被高關注度的學術期刊和最著名的會議、座談、研究會和專題討論會的會議錄資料,包括柳葉刀(The Lancet)、自然(Nature)、細胞(Cell)、科學(Science)等著名學術期刊。WOS平臺借助期刊引文報告(JCR)精心篩選和編制的數據,使科研人員充分感受和了解學術界對學科創新的快速反應和巨大影響。2021年《柳葉刀》的期刊影響因子(Impact Factor,IF)為202.731,在全科醫學和內科類期刊中排名第一,《自然》成為有史以來第一本在一年內總引用次數超過一百萬的期刊。WOS平臺推出的JCR、學料規范化的引文影響力值、學科排名、立即指數等成為學術界評價國家地區科研實力、了解“高被引科學家”的發展規律,探析世界科學領域研究熱點的重要指標。IF現已成為國際通用的評價期刊有用性、顯示度、學術水平,以及作者論文的質量、創新度、影響力的重要指標之一。
科研人員利用WOS平臺獲取來自全球出版機構的各種學術期刊收錄的自己感興趣的最新學術論文,并能對部分數據庫論文進行近百年的文獻回溯。WOS平臺通過引用這條主線把數據庫收錄的論文編織在一起,繪制出一張以時間為軸線,以國家地區、科研機構、研究方向、著名學者、資助基金等為節點的巨大知識網,成為科研人員在有組織科研活動和自由探索活動中快速獲得高質量科學數據的知識庫。InCites是分析WOS中權威引文數據(SCI/SSCI)的評價工具,其利用計量指標和學科國際標桿數據,將自己研究與全球和學科領域的水平進行深度對比,增加科研人員尋求潛在創新的機會。ESI是跟蹤學科領域發展趨勢的基本分析工具,是收錄12 000多種學術期刊的1 000多萬條文獻記錄而建立的計量分析數據庫,它為科研人員提供了對科學活動進行多角度、全方位分析的數據源,以及發現基于多學科交叉知識網結構的重要特征。
科研人員從一篇與自己研究相關的高質量論文開始,利用WOS平臺的數據庫及文獻分析管理工具,通過參考文獻發現研究基礎,通過被引文獻了解后續進展和發展勢態,通過相關記錄發現學科之間的交叉滲透關系,使得論文檢索越查越深,越查越新。WOS平臺正如GS,DOI,Sci-hub等論文專門網站一樣,也提供了原文鏈接檢索和獲取原文論文的窗口。
WOS平臺收藏內容涵蓋了超過7 480萬個學術數據集,以及254個學科中15億個引用的參考論文,數據庫的子集除了WOSCC外還包括BP、KCI、DII、MEDLINE、SCIELO、RSCI以及CSCD。其中,BP涵蓋了100多個國家5 500多種生命科學期刊和1 650多種非期刊文獻,收錄內容包括揭示生命科學各領域,生物學(植物學、生態學、動物學等)及交叉科學(生物化學、生物醫學、生物技術等)和諸如醫療器械和實驗方法等廣泛研究領域的研究成果;KCI收錄超過2 300本韓國學術領域核心期刊,數據可以回溯至1980年,文獻多涉及社會科學、人文領域,展示韓國最有影響力的科研學術成果,其引文數據均設置有通往全球研究數據庫的鏈接;MEDLINE收錄1966年以來世界70多個國家和地區出版的9 075余種生物醫學期刊的文獻,近1 100萬條記錄,數據來源為《醫學索引》、《牙科文獻索引》和《國際護理索引》;DII收錄60個知識產權組織涵蓋100多個國家公開的1 300萬條基本發明專利,3 000萬項專利,每周更新2萬5千多個專利數據,回溯至1963年;SCIELO為合作式電子出版物,其期刊覆蓋了農業、植物學、動物學、醫學等多個領域,數據庫直接鏈接拉丁美洲國家的開放存取期刊,共有200多種期刊;CSCD收錄我國數學、物理、化學、天文學、地學、生物學、農林科學、醫藥衛生、工程技術和環境科學等領域出版的中英文科技核心期刊和優秀期刊千余種。記載1989年到現在的論文記錄500余萬條,具有一般檢索和引文索引檢索功能,有助于對交叉學科和新學科的發展研究。WOS平臺的JCR覆蓋114個國家地區,提供了全面豐富的可按學科和排名進行篩選的文獻數據指標,從技術創新和新技術發現,到知識產權的管理保護,直至實現科研創新成果的商業化,涵蓋學術研究和政府機構,生命科學與健康,專業服務,消費,制造和技術等各個領域。
WOS平臺具有的專業知識和技術解決方案可覆蓋創新生命周期的每一個關鍵環節,WOS的獨特之處在于,對每個研究輸出中的所有元數據進行索引,包括每個被引用和引用的參考文獻,從而在被索引的研究與更廣泛的學術文獻之間建立了聯系。
基于WOS平臺,科研人員通過論文的已知條件可檢索獲取該論文的收錄、引用、作者、基金、期刊JCR報告等論文基礎信息,根據需要跨庫檢索獲取原文。論文檢索項支持對已知標題、作者、出版物、出版年、數據庫、作者地址、論文類型、研究領域等單獨或集成進行,達到檢索目標論文及其參考論文、被引論文等的目的。表1為通過已知論文標題Mass Measurements of the Neutron-Deficient Ti-41,Cr-45,Fe-49,and Ni-53 Nuclides:First Test of the Isobaric Multiplet Mass Equation in f p-Shell Nuclei(以下簡稱目標論文)在WOS平臺進行論文檢索獲得的論文數據。檢索結果顯示,該篇論文是由中國科學院近代物理研究等作者發表,收錄期刊為PHYSICAL REVIEW LETTERS(109卷、第10期、2012年出版);該篇論文在WOS平臺所有庫中共被引用118次;收錄期刊是SCI期刊,其JCR分區為Q1、2021年的影響因子為9.185。需要注意,一篇論文能在WOS平臺上檢到,并不代表該篇論文是SCI論文,確定該篇論文是SCI論文必須在核心集中的Science Citation Index Expanded中檢索到。同時,檢索一本期刊是否被SCI收錄是通過下拉WOS平臺頁面“產品”菜單,找到“Master journalist”主期刊列表,輸入期刊名稱進行檢索得到包括期刊官網、被SCI收錄的相關信息。

表1 基于WOS平臺的目標論文的著錄數據
利用WOS 平臺進行主題檢索的方法與在Springer、Elsevier Science Direct等平臺上類似,即將提煉的主題詞放入檢索頁面的添加行,創建檢索式,以獲取與研究課題主題相關的論文數據;通過添加日期范圍、發表日期、出版物語種、論文類型等項目來縮小檢索范圍,精煉檢索結果;利用檢索結果頁面“Analyze Results”按鈕,對檢到的數篇論文進行多角度排序,發現諸如引用作者和機構、引證論文的地區分布、高被引科學家等重要信息。
IF由美國著名論文信息檢索專家Eu.gene Garfield博士于1955年提出,是衡量期刊學術影響力的重要指標之一[3]。近年來,IF已成為最重要的論文計量學動態指標之一,被廣泛應用于科學研究的輔助工作,幫助科研人員評價來源論文的學術實力、研判科研項目與世界科學熱點的聚焦度,同時給科研機構提供了評價科研績效和人才創新能力的重要依據。Clarivate Analytics每年通過更新JCR推出新的IF,根據IF值的大小排序劃分不同區域,形成期刊JCR分區,直觀反映不同刊物在同一領域內的水準和排位,某領域1區的期刊即是該領域的頂級刊物。通過JCR可創建感興趣論文的引文報告,以圖表等可視化形式將引文按時間段進行統計并逐年列出,揭示引文的分布情況。科研機構可根據JCR等期刊影響力指標制定期刊訂閱政策,論文作者可根據JCR及IF排名決定投稿方向。但JCR只包含SCI和SSCI兩個數據集的期刊,只有包含在JCR里的期刊才會有影響因子。表2說明,目標論文的收錄期刊PHYSICAL REVIEW LETTER在2017—2021年的JCR分區均在Q1區、學科排名在6~8間、IF 5年平均值為9.319,表明這是一本在本研究領域中具有高質量、高影響力的SCI學術期刊,目標論文同樣是一篇具有高價值、影響力顯著的SCI學術論文,故通過WOS索引可以提高期刊的可發現性,并且也是獲得期刊影響因子的前提。

表2 WOS收錄期刊PHYSICAL REVIEW LETTER的學術影響力數據
Reference Manage、EndNote和EndNote Click是WOS平臺提供的三款文獻管理、檢索工具。Reference Manager是建立個人參考文獻書目數據庫的管理工具,每個自定義數據庫可容納65 000條數據。可通過作者、期刊名、關鍵詞、出版年份等進行查詢,制定的參考文獻書目與Word等文字處理軟件兼容;EndNote是文獻管理軟件,幫助科研人員進行論文收集、寫作、管理。EndNote支持7 000種國際期刊的參考文獻格式,同時還提供了幾百種涵蓋各個領域的雜志寫作模板[4],使軟件中Output Styles的編輯功能非常流暢、好用;EndNote Click是一款基于瀏覽器插件的在線獲取文獻PDF全文的檢索工具。EndNote Web個人圖書館基于Web利用EndNote和EndNote Click進行在線搜索論文、建立論文庫、定制論文、編排引文。根據目標論文的檢索結果創建的EndNote Web個人圖書館的具體操作是:勾選在WOS平臺檢索到的批量論文中的感興趣論文,選擇“產品”下拉菜單中的EndNote,進入操作界面,在file中選擇new創建文件夾,即My EndNote library,選擇EndNote的online模式導入Reference Manage或存儲在個人電腦;通過EndNote Click在線跨庫獲得PDF全文;通過Reference Manage對論文進行科學管理,包括標記已讀論文、已讀論文打分、論文去重、排序、查找。
科研人員可利用EndNote Web個人圖書館建立自己的科學網檔案,展示學術影響力;通過導入自己的出版物并添加同行評議,記錄填充個人資料,包括WOS核心集的收藏引用計數和h索引等。EndNote Web個人圖書館提高了學術論文的全文獲得、撰寫、整理和投稿的工作效率,大大提升了科研效率。
科研單位利用WOS平臺了解區域內科研機構、著名學者、科研動態、發文質量等情況,進行高質量科研論文產出和影響力的調查,研判區域科研實力,評價科研質量,優化科研政策,指導和建議科研工作。科研人員通過WOS平臺挖掘學術信息、發現潛力學科,了解近期研究熱點、學科全貌及熱點聚焦,優化課題布局,實時跟蹤課題最新研究進展,提升科研能力。科技服務機構利用WOS平臺,掌握基金支持、發文期刊動態、學者信息、會議發布,從海量信息中,創建定題跟蹤、引文跟蹤、論文檢索、查找與引證等增值服務,增強機構人員定向提供科研趨勢信息的能力,提升服務機構在學科服務中的價值,豐富增值服務的內容。
以2012年1月—2022年8月年被WOS平臺收錄的甘肅省學術論文為研究對象,采用文獻計量分析法,利用InCites數據庫中區域、機構、人員、研究方向模塊,從多角度分析WOS論文的相關數據,評價基于高質量科研論文產出的甘肅省科研狀況。InCites數據庫篩選條件設定:區域,State/Province GANSU,CHINA MAINLAND;國家地區,Gansu province;學科分類體系,Web of Science;文獻類型,Article、Review;出版年:2012年1月—2022年8月。檢索結果顯示,2012年1月—2022年8月(InCites數據集更新日期2022年8月26日,WOS平臺標引為2022年7月31日)甘肅省發表的WOS論文數量為87 823篇,見表3。

表3 WOS論文數、被引頻次、被引頻次排名前1%的論文百分比統計
WOS論文的質量指標可直接反映國家地區、科研機構、科研人員的研究實力。甘肅省2012年1月—2022年8月被WOS平臺收錄的論文中:被引總頻次為1 145 104次,被引用過的論文數百分比為77.02%,被引次數排名前1%的論文百分比為1.25%,高影響力論文801篇(0.89%)、熱點論文21篇(0.02%)、Q1期刊中的論文30,925篇,見表4。

表4 WOS論文的質量指標值
以表4WOS平臺收錄的甘肅省87 823篇論文為數據,統計顯示,研究方向排名前五的學科主要集中在MATERIALS SCIENCE,MULTIDISCIPLINARY(材料科學,多學科);ENVIRONMENTAL SCIENCES(環境科學);CHEMISTRY,MULTIDISCI PLINARY(化學,多學科交叉);CHEMISTRY,PHYSICAL(化學物理);PHYSICS,APPLIED(應用物理),由此產生的科研論文分別為9 786篇、6 181篇、5 917篇、5 583篇、5 337篇,五類共計發文量占發文總量的39.07%,見表5。

表5 2012年1月—2022年8月甘肅省基于高質量WOS論文產出的優勢學科類別統計
分別從被引用過論文百分比、WOS論文數2個維度進一步分析甘肅省WOS論文的產出特征。研究發現,主要發文機構集中在科研院所和高校,見表6。其中,中國科學院蘭州文獻情報中心的被引用過論文百分比達93.75%,中國科學院寒區旱區環境與工程研究所為93.27%,蘭州大學為81.56%;蘭州大學發文量達33 265篇,占甘肅省發文總量的39.62%,甘肅農業大學發文量為3 051篇,中國科學院蘭州化學物理研究所為6 950篇,中國科學院現代物理研究所為4 706篇。
基于表6分析表明,甘肅省在2012年1月—2022年8月間,基于WOS學術論文的科研產出呈逐年增長趨勢,近兩年發文量處在歷史較高水平;期間論文被引頻次表現為波動態勢,振幅有限,2020年初達到最高值,但高被引論文數量少、占比低,熱點論文占比僅為0.03%;收錄期刊的JCR分區在1區中的數量比較多,且學術論文的學科規范化的引文影響力大于全球平均水平。蘭州大學、甘肅農業大學等高等院校,中科院近物所等中科院在甘機構成為甘肅地區WOS論文的主要發文機構,甘肅省優勢學科為材料學、環境學、物理、化學及應用物理,此類論文在WOS論文中的占比大、集中度明顯。研究表明,近十年來甘肅省科研工作呈現穩步發展態勢,優勢學科在全球范圍內具有一定數量的科研產出和影響力,但研究主題與全球聚焦熱點有一定差距,WOS論文的發文機構數量偏低,類別單一,區域科研的學科領域發展不均衡,科研創新有待拓展。

表6 研究機構發表的WOS論文數、被引用過的論文百分數統計
科研選題是有組織科研活動的組成部分,是科研流程的關鍵一步,選題過程中要遵循科學性、創新性、可行性以及應用性的基本原則。目前,科研人員僅通過科學基金網絡信息系統(ISIS)的公開數據無法滿足有組織科研選題的需求,利用WOS平臺,包括Incites數據庫、ESI和JCR[5]定量分析與選題相關的高水平研究論文,為科研選題提供清晰的研究脈絡和可信的評價依據。具體為:科研人員借助WOS平臺找到與選題相關的重點論文,查看其中最新發表的核心論文,了解領域學者現階段研究前沿的主題;深度分析與選題相關的高質量綜述性論文,發現學科領域的主題演化態勢、交叉學科及衍生主題;掌握與選題相似的論文數量,分析選題的科研趨勢、可拓展方向,探明增長較快的新興主題。利用Incites數據庫的多元化指標,通過可視化信息加工工具對相關論文進行深度加工和分析,避免重復選題浪費科研經費,優化選題路徑,輔助制定選題策略。以ESI高被引論文和熱點論文為出發點,通過探究相關論文的共被引關系,避免只依據基金支持作為選題的單一性。使用ESI數據庫的Research Fronts對選題進行橫向比對,選取與之熱點詞關聯的研究論文進行深度閱讀和全面揭示,提高選題與課題指南的貼合度。
早在1955年,Dr.Garfield在Science發表論文,提出將引文索引作為一種新的論文檢索與分類工具,即將一篇論文作為檢索字段從而跟蹤一個Idea的發展過程及學科之間的交叉滲透的關系,WOS平臺憑借互聯網引文網絡,把海量信息進行了有組織、有關聯性的梳理,利用Citation Index串聯起每一篇論文,構建了一個巨大的科學知識網絡,使這種理論成為現實。科研人員在自由探索活動中,通過檢索論文,獲得與自己感興趣領域相關的論文及其參考文獻、施引文獻、相關記錄;通過論文、收錄期刊、學者、機構、國家地區等維度梳理引文之間的相互關系;通過IF、JCR、h-index等層面判斷自己感興趣領域的最新動態,對即將進行的課題進行評價;通過高被引論文,發現領域研究熱點、主要科研機構、知名科研人員及新一代領軍人物對領域的推動作用;通過引文報告查看領域論文發文數,關注論文被引用的進程,判斷即將進行課題的研究前景;通過“定題跟蹤”實時追蹤領域最新論文,了解最新進展。具體為:科研人員在WOS平臺檢索自己感興趣的論文,挑選一篇核心論文,通過分析論文的參考文獻發現其得以延續的理論基礎;追蹤論文的施引文獻,發現其后續研究進展;查看論文的相關記錄,擴展論文檢索的視角和閱讀范圍,找到跨學科領域與其相關的論文,從中梳理論文主題的發展進程;創建引文跟蹤,實時跟蹤某論文、某作者、某機構、某期刊等的最新研究進展。表7為目標論文的引文網絡。科研人員從一篇高質量的論文出發,通過引文觀察它的發展歷程及多學科交叉作用的關系,做出課題發展潛力和趨勢的預判,做出這個領域值得研究的選擇,助力科學自由探索活動,提升科研創新能力。

表7 基于目標論文構建的引文網絡
WOSCC嚴格遵循選刊標準,動態遴選全球最具學術影響力的高質量期刊和核心文獻資源,完整收錄一篇文章的多維度信息。有關“經濟學”方向的期刊在CSSCI中只收有74種,如果作為領域文獻資源就顯得比較有限了,但在WOSCC關于經濟與商業Economics &Business相關期刊有21個細分的學科方向超過1 600種期刊。科研人員在投稿選刊時,利用WOS平臺優質豐富的文獻資源,擴展了選刊視角和范圍,借助WOS平臺的領域影響力,在國際舞臺更好地發出中國學者的聲音。以WOSCC下SCI作為數據源,將這項研究的時間跨度限制為20年,研究發現,中國SCI出版物的年產量迅速增長[6]。2018年,美國國家科學基金會發布的一項報告顯示,中國成為世界上科學出版物總量最多的國家,中國期刊被SCI數據庫收錄的數量也發生了巨大變化,根據2000年公布的JCR_S1999,SCI收錄的中國期刊僅35種,2010年,這一數據為114種,到2019年,這一數據上升到224種,2020年公布的JCR_S2019,SCI收錄的中國期刊達到250種左右。與此同時,出現許多影響因子破10的中國期刊,例如《細胞研究》《真菌多樣性》《國家科學評論》《分子植物》等。在WOS平臺“分析檢索結果”中選擇“出版物標題”找到與研究課題合適的推薦期刊,借助JCR了解這本期刊的影響因子、分區、所屬學科類別、發文國家/地區、機構發文等,綜合判斷一本期刊是否適合投稿選刊。利用EndNote中“自動匹配”,輸入論文標題摘要,通過大數據的運行算法,推薦與自己論文關鍵詞匹配的信息,幫助找到合適的匹配期刊,確定期刊后,通過“期刊信息”找到投稿指南,進行投稿。
通過介紹WOS平臺的特點、功能及其在科研工作中的具體應用,闡述了基于WOS平臺數據庫構建的論文引文網絡對科研活動的利用價值,期刊JCR、IF,論文h-index等指標對評價科研績效、發現區域科研狀況的重要性,Incites、ESI數據庫的多元化指標在基金選題中的作用以及EndNote在論文管理、創建個人圖書館和投稿選刊中的應用。研究揭示,WOS平臺已成為科研人員進行有組織科研和自由探索活動的文獻數據支撐,成為科研人員進行檢索、分析、管理、寫作的創新型研究平臺。