張永娟 張麗雯 阮梅花 毛開云 施慧琳 于建榮












摘要:[目的/意義]科技評價對于優化資源配置、提高科研能力具有重要參考作用,建立科學合理的科技評價體系具有非常重要的意義,在生命科學與生物技術迅猛發展的當下,科研產品層出不窮,學科日益交叉會聚,我國的科研創新亟需一套具有中國特色的原創評估體系及方法。[方法/過程]基于此,中國科學院上海生命科學信息中心(生命健康科技智庫)依托生命科學、基礎醫學及相關學科領域的專家和學者,聚焦“生命科學與基礎醫學”領域,結合本領域的學科特點,立足專家評議、期刊影響力、領域權重、第一作者/通信作者權重等定性和定量指標,提出“π指數”的概念和算法。[結果/結論]每年發布生命科學與基礎醫學領域全球機構π指數分析報告、5年π指數趨勢分析報告、國家重點實驗室π指數分析報告,2018年還嘗試了探索基于多層引文和支持向量機相結合的“單篇論文學科分類”方法,對單篇文獻進行學科分類,并推出了“學科領域π指數分析報告”。本文對π指數的評價方法以及2018年發布的π指數系列報告進行了分析和闡釋。
關鍵詞:科技評價? π指數? 多層引文? 機器學習? 生命科學與基礎醫學
分類號:G251
DOI: 10.19318/j.cnki.issn.2096-1634.2019.01.13
1 引言
科技評價對于優化資源配置、提高科研能力具有重要的指導作用,因此建立科學合理的科技評價體系具有非常重要的意義。目前常用的科研評價指標,如用于評價期刊的影響因子IF、評價成果影響力的被引頻次、考察科研人員高被引論文數的h指數,Nature Index以及基于這些指標的擴展形式,都有一定的合理性和普適性。但是,不同領域和學科有其自身特點,評價體系也應有所不同。我國《關于深化科技體制改革加快國家創新體系建設的意見》對深化科技評價改革也提出要根據不同類型科技活動特點,注重科技創新的質量和實際貢獻。
鑒于此,中國科學院上海生命科學信息中心(生命健康科技智庫)聚焦“生命科學與基礎醫學”領域,依托相關學科領域的專家和學者,結合現存評價指標和本領域特點,立足專家評議和論文影響力等定性和定量指標,于2015年開始構建具有領域特色的科研產出評價指標——“π指數”,即生命科學與基礎醫學全球科研機構產出評價指數(機構產出評價指數的英文productivity index縮寫PI與π同音,“π指數”),每年發布生命科學與基礎醫學領域全球機構π指數分析報告,力求客觀評價領域內科研機構的科研產出、質量和貢獻,為科研評估和決策創新探索新的思路和方向。
與2016年相比,2017年的π指數相關指標增加了π因子(PIF,π值除以100)、π5(5年π因子)、PIV基線(PIVbl,全球發文10篇以上的機構π值的平均數)、PIQ基線(PIQbl,全球發文10篇以上的機構π商的平均數)等4個指標;在年度報告的基礎上增加了“2011—2015年π指數趨勢分析”報告,“生物與醫學領域75個國家重點實驗室5年(2011—2015)π指數分析”報告,以及“CNS發文分析”和“國際合作度分析”兩個主題報告。
2018年,又嘗試探索基于多層引文(multi layer reference,MLR)和支持向量機(support vector machine,SVM)相結合的“單篇論文學科分類”方法,對單篇文獻進行學科分類,并推出了“學科領域π指數分析報告”,以滿足學科分類的個性化需求,這是對更精細的學科分類、學科評價進行的有益探索和初次嘗試,未來將在更豐富的學科領域、主題領域以及團隊科研產出評價等方面推廣使用。
下文將詳細介紹π指數的的評價主體、計算方法、指標說明、創新點以及2018年π指數系列報告的主要內容,分析目前π指數的使用情況,并展望未來規劃。
2?? 評價方法
2.1 π指數評價的主體和范圍
評價的主體是發表在期刊中的研究型論文。研究型論文的評價是基礎科學領域中最直接的國際性評價標準,生命科學和基礎醫學領域的研究均屬于基礎研究,科研產出以論文為主要載體,鑒于此,π指數主要以研究型論文為評價主體,專利等和實際應用緊密相關的產出形式暫時不在評價范圍內。
評價的范圍是由領域專家聯合評議推薦的期刊上發表的論文。生命科學和基礎醫學有其自身特點,比如植物學和生物化學領域影響力相當的期刊其IF卻相差甚遠。因此,π指數研究小組分別邀請生命科學和基礎醫學領域的科研人員和期刊(《Cell Research》《Molecular Plant》)編輯等成立了咨詢專家小組,聯合評議推薦相應領域的高質量期刊,形成期刊列表,再在全球范圍內發放問卷,咨詢專家,最終形成期刊群。2016年首次入選的期刊共119種,每兩年增選一次,2018年新增《Nature Plants》《Nature Microbiology》《Science Advances》等3種,共122種,詳見π指數官方網站。
2.2 π指數的計算方法
π指數評價的標準分為期刊影響力評分標準和作者貢獻度權重標準兩個核心部分,其中期刊影響力評分標準依據專家咨詢組評議評分,將入選的期刊影響力按照學科領域分為5個檔次,并賦予不同的權重;作者貢獻度權重標準考慮了第一作者(含并列第一作者)、通信作者以及署名作者排序不同而貢獻不同等因素。
目前π指數包括π值、π商、發文量(AC)3個核心指標,以及π因子、π5值、π值基線、π商基線等基于π值的擴展指標,其中π值的計算方法是基于期刊影響力評分標準和作者貢獻度權重標準進行的,算法如下。
其他指標均在π值的基礎上進行擴展,詳見表1。
2.3 π指數的創新點
π指數作為國內首創的生命科學與基礎醫學領域的科研評價指數,該指數瞄準高質量期刊上發表的研究型論文,結合學科領域的特點平衡權重,對相關科研產出質量和機構貢獻度進行科學分析,客觀反映生命科學與基礎醫學領域相關機構和世界機構之間的位置,創新點主要表現在如下4個方面。
(1)π指數瞄準了各學科領域高質量期刊,以定性和定量相結合的方式進行評價。中國SCI論文的數量已躍居世界前列,但是質量參差不齊,僅從SCI發文量來看并不能客觀反映科研產出水平,故π指數瞄準全球高質量期刊,參考了影響因子IF、F1000、生命科學與基礎醫學領域科研人員的評議、《Cell Research》及《Molecular Plant》等期刊編審推薦等定性與定量相結合的方式遴選期刊,并根據發放問卷、召開專家咨詢會等方式通過同行評議對期刊影響力權重賦值。
(2)π指數平衡了生命科學與基礎醫學的不同學科領域期刊數量和影響力不均衡的問題。如生物化學與分子生物學學科領域和植物學領域,不同的學科受學科大小、引用頻次的影響,影響因子相差懸殊,但是從專家咨詢的建議來看影響力相當,則被賦予相同的權重,如《Blood》(IF,15.13)、《Plant Cell》(IF,8.23)雖影響因子相差較大但是被賦予了相同的權重。
(3)π指數區分了作者貢獻度,突出考慮了第一作者(包括并列第一作者)、通信作者的重要性,也區分了其他作者的排序與貢獻,并對單篇論文做標引與精確計算,在此基礎上對作者對應機構的科研產出進行評價。
(4)π指數的算法和指標是基于RDF和關聯數據語義知識庫完成的,對語義數據驅動情報學發展做了一次嘗試和探索。該知識庫采用語義網輕量級實現技術關聯數據技術和圖數據庫Virtuoso做支持,將文獻數據結構化、內容細粒度化、知識化,作者、機構、基金、文獻等規范知識庫的建立,讓知識從點連成線再結成網,使得π指數數據分析高效、準確,團隊關系評估也更容易被發現和揭示,同時也為機器學習、知識計算以及知識圖譜的構建奠定基礎。
3.1? 全球機構年度π指數分析
3.1.1? 全球發文量TOP10國家分布? 2017年,在生命科學與基礎醫學期刊上發表論文量排名前10位的國家分別為:美國(23,678)、英國(6,423)、德國(5,350)、中國(5,055)、法國(3,520)、加拿大(3,191)、日本(2,607)、澳大利亞(2,240)、荷蘭(2,161)、瑞士(2,107)。
全球發文量TOP10國家中,美國CNS發文量及CNS第一/通信作者發文量均排名第一,但瑞士CNS論文占比最高,為5.10%(圖1)。中國與美國相比,論文量、CNS發文量、CNS第一/通信作者發文量及CNS論文占比均存在較大差距。
3.1.2? 全球π指數TOP500機構分析
(1)π因子TOP10的機構
π因子TOP10機構中(圖2),美國有6個,法國2個,德國1個,中國1個。π因子排名前3的機構分別為:哈佛大學、霍華德休斯醫學研究所及法國國家科學研究中心。
中國科學院π因子(74.17)全球排名第8,較2016年排名上升2位,與排名第1的哈佛大學的π因子(276.42)差距明顯。
(2)π商TOP10的機構
π商TOP10機構中(圖3),美國有7個,以色列、中國、英國各有1個。π商排名前3的機構分別為:洛克菲勒大學、博德研究所及麻省理工學院。其中清華大學以π商8.12排名第8。
(3)全球π指數TOP500機構各國分布
全球π指數TOP500機構中,美國占絕對優勢,有164個,其次分別為:德國(47)、英國(41)、中國(39)、法國(26)、澳大利亞(21)、加拿大(19)及日本(17)等(圖4)。
進一步分析發現2017年國際π值基線為501.266,π商基線為4.537。在TOP500機構中,π值基線與π商基線以上的機構共288個,其中美國99個,英國31個,德國27個,中國22個,法國20個,澳大利亞11個等。
(4)全球π指數TOP500機構中國機構分布
中國共有39個機構進入全球π指數TOP500(見表2),其中中國臺灣有3個,分別為:臺灣大學、臺灣中央研究院及臺灣陽明大學。中國香港有2個,分別為:香港大學及香港中文大學。
排名前3位的機構分別為:中國科學院(π因子74.17,發文量1,101)、北京大學(π因子26.05,發文量397)及清華大學(π因子22.40,發文量276)。
3.2? 全球機構5年π指數趨勢分析
3.2.1? 中國和全球發文總量對比分析? 2012—2016年全球發文量總體保持穩定,其中2012—2014年全球年度發文量總量呈上升趨勢,2014—2016年呈下降趨勢;中國年度發文量持續穩健增長,年均增長約250篇,且中國/全球論文量比例一直呈現增長趨勢,2016年比例達11.02%(圖5)。
3.2.2? 10個國家π5排名第1的機構π因子分析? ?不同國家π5排名第1的機構π因子大小及發展趨勢存在一定的差距,從TOP500機構中選取10個國家機構進行分析,發現2012—2017年美國π因子基本保持穩定,均占有較大優勢,中國π因子自2012年開始呈現增長趨勢,2017年增長迅速,但與美國存在較大差距(圖6)。
3.2.3? 全球π5TOP500機構國家分布? 全球π指數TOP500機構中,美國占絕對優勢,有165個,其次分別為:英國(44)、德國(40)、中國(39)、法國(30)、澳大利亞(17)、西班牙(15)及意大利(14)(圖7)。進一步分析發現在TOP500機構中,2012—2016年π值基線與π商基線以上的機構共266個,其中美國97個,英國27個,法國19個,中國18個,德國17個,荷蘭12個。
3.2.4? 全球π5 TOP500中國機構? 中國共有39個機構進入全球π5 TOP500(見表3),其中中國臺灣有6個,分別為:臺灣大學、臺灣中央研究院、臺灣陽明大學、長庚大學、中華醫科大學及臺灣成功大學;中國香港有2個,分別為:香港大學及香港中文大學。
排名前3位的機構分別為:中國科學院(π5 283.74,發文量4,172)、北京大學(π5 87.94,發文量1,387)及上海交通大學(π5 63.81,發文量1,186)。
3.3? 學科領域π指數分析
學科分析報告基于MLR及SVM算法定位到單篇文獻,將11個學科領域(生物化學與分子生物學、心血管、進化與生態學、遺傳與發育、免疫學、微生物學、神經科學、營養與健康、腫瘤學、病理與生理、植物學)的相關論文從122種刊中進行抽取與分類,并以此為基礎進行相關學科機構的科研產出評價。
11 個學科領域中全球發文總量最多的3個學科領域分別是生物化學與分子生物學(biochemistry& molecular biology)、遺傳與發育(genetics & development)、微生物學(microbiology)。除了植物學科領域,美國發文量占據其他10 個學科領域的發文總量的60% 以上,以絕對優勢位居第1,中國在生物化學與分子生物學、遺傳與發育、營養與健康、腫瘤及植物學等學科領域發文量進入全球TOP3。
從π因子來看,哈佛大學在11個學科領域π因子排名中位于10個學科領域的榜首,科研產出整體實力全球領先,各學科均衡發展,中國科學院在植物學科領域位居第1。從π商來看,洛克菲勒大學在9個學科中π商進入全球TOP3,中國科學院神經科學研究所進入神經科學學科領域π商排名全球TOP3(第3名)。
以植物學學科領域為例,在全球TOP100機構中,中國科學院以π因子(12.87)位居第1,其次為法國國家科學研究中心(11.91)、德國馬普學會(8.40)。中國共有17個機構進入植物學科領域TOP100,分別為:中國科學院、中國科學院遺傳與發育生物學研究所、中國科學院上海生命科學研究院植物生理生態研究所、中國科學院植物研究所、華中農業大學、中國農業大學、中國農業科學院、北京大學、浙江大學、清華大學、南京農業大學、福建農林大學、臺灣中央研究院、山東農業大學、華南農業大學、復旦大學及廈門大學等(圖8)。
4.1? π指數的應用情況
自2016年始,中國科學院上海生命科學信息中心每年定期發布π指數系列報告,除此之外,還接受各機構根據自己的需求提出的定制報告,近年來曾服務中國科學院生物物理研究所、中國科學院植物生理生態研究所/中國科學院分子植物科學卓越創新中心、中國科學院生物化學與細胞生物學研究所/中國科學院分子細胞科學卓越創新中心、中國科學院神經科學研究所/中國科學院腦科學與智能技術卓越創新中心、中國科學院昆明動物研究所、廣州醫科大學、澳門大學等機構。
語義數據的驅動使π指數更具靈活性和可擴展性,便于為用戶提供個性化數據定制和報告定制服務,特別是基于機構規范庫的可擴展性,可將用戶提供的對比機構細化到二級或者更小的機構。
如某研究所由于體量較小,其他評價指標如果按照總量來計算不具有優勢,也不能客觀說明其科研產出實力。能體現機構單篇論文質量的π商則能相對客觀的對體量較小的研究機構進行評價。
4.2? π指數的未來展望
未來,π指數力求客觀地反映領域內科研機構的科研產出、質量和貢獻,為相關管理層和科研人員提供有益的咨詢參考。希望在目前工作的基礎上,持續完善,深入到內容和領域,團隊和個人,從更廣的角度、更多的維度和更細的粒度,進行研究和開發,希望給予科研人員和管理工作者有價值和積極意義的參考和引導,促進機構學術質量和特色特長學科的發展,集中優勢力量發揮學科競爭優勢,提高資源配置經濟效益,提高科研效率,創造出更多高質量的科研成果。
參考文獻:
[1]??? GARFIELD E. The history and meaning of the journal impact factor[J]. JAMA, 2006, 295(1): 90-3.
[2]??? GARFIELD E. Citation indexes for science: a new dimension in documentation through association of ideas[J]. Science, 1955, 122(3159): 108.
[3]??? PhysOrg. Physicist proposes new way to rank scientific output[EB/OL]. [2019-01-07]. https://phys.org/news/2005-11-physicist-scientific-output.html.
[4]??? Nature. Nature index[EB/OL]. [2019-01-07]. https://www.natureindex.com/.
[5]??? 中共中央, 國務院. 關于深化科技體制改革加快國家創新體系建設的意見[EB/OL]. [2019-01-07]. http://www.gov.cn/jrzg/2012-09/23/content_2231413.htm.
[6]?? FAN R E, CHANG K W, HSIEH C J, et al. Liblinear: A library for large linear classification[J]. Journal of Machine Learning Research, 2008, 9(9): 1871-1874.
[7]??? LING W. Mu-ming Poo: China brain project and the future of Chinese neuroscience[J]. National Science Review, 2017, 4(2): 258-263
[8]??? π-index[EB/OL]. [2019-01-07]. http://bm.pi-index.com/.
Reports of π Index: Metrics?of Research Productivity in Life and Basic Medical Sciences
Zhang Yongjuan? Zhang Liwen? Ruan Meihua? Mao Kaiyun? Shi Huilin? Yu Jianrong
Shanghai Information Center for Life Sciences, Shanghai 200031
Abstract: [Purpose/significance] Scientific evaluation is important for optimizing resources allocation and improving the research ability, therefore, it is of a great significance to establish a scientific and reasonable evaluation system. With the rapid development of life science and biotechnology, scientific research achievements are endlessly emerging and disciplines are increasingly converging. In China, it is extremely urgent to build an original evaluation system and method with Chinese characteristics. [Method/process] π index, first released by Shanghai Information Center for Life Sciences (Life & Health Technology Think Tank), focuses on the area of life science and basic medicine, relies on the experts in the life science and basic medicine field, combines the problems and characteristics of the existed evaluation index, bases on the qualitative and quantitative factors, i.e., expert review, journal impact, first and corresponding author weight. [Result/conclusion] The 2018 Reports of π Index include four individual parts: annual π index, 5-year trend analysis, China’s state key laboratory analysis, and subject analysis, which is a newly developed report based on multi layer reference and support vector machine. This paper detailedly illustrates the evaluation method and 2018 Reports of π Index.
Keywords: scientific evaluation??? π index??? multi layer reference??? machine learning??? life science and basic medicine