基于文獻計量學的高校臨床醫學科研產出評價指標體系的構建及實證研究

2015-03-22 03:17:10，，，

中華醫學圖書情報雜志 2015年11期

，，，

文獻計量學在借助文獻的各種特征、數量基礎上，采用準確和客觀的定量評價方法去描述、評價和預測科學技術的現狀與發展趨勢，這一技術的應用讓文獻成為反映某一學科或技術領域發展變化的晴雨表，亦成為對科研產出進行評價的重要參考工具。

臨床醫學是研究疾病診斷和預防治療的各專業學科的總稱[1]。針對臨床醫學的計量研究，一般是對國家、地區乃至全球某個學科主題的總體發展情況展開的，是對發文量和被引頻次等基本指標進行考察，得出排名靠前的國家、地區、機構或個人[2]。但是隨著更多創新的、科學的評價指標的問世以及人們對學科評價的需求從廣泛、粗糙到精細化、豐富化的轉變，傳統的計量指標在生物醫藥領域的運用顯然存在缺陷。本文根據臨床醫學的特點，建立并利用其評價指標體系進行實證研究。

1 評價指標體系的構建

評價指標的選取應該考慮3方面問題。首先是開放性，即科研產出評價過程中使用數據的采集、分析過程必須是開放的、透明的和簡便易行的[3]；選取的評價指標可以從公開渠道獲得數據，且數據來源必須具有一定的公信力，以保證數據的準確與可靠。其次是系統性，即選取的指標應該從不同角度考量科研產出的情況，指標間既不能相互沖突，也不能相互包含；還應考慮將數量與質量的評價相結合，指標中既要有體現科研產出數量的指標，也應有體現科研產出質量的指標。最后是可操作性，即選取的指標應該具備實用、操作性強和高效的特點，指標的選取不宜過多過細，而應盡量把復雜的工作簡單化，以保證評價工作的效率及可持續性。基于以上考慮，經過文獻調研與專家咨詢，本文共選取了10個文獻計量學指標。

1.1 評價指標的選取

1.1.1 Web of Science收錄論文數

臨床醫學文獻數量龐大，且分布較為分散。Web of Science是目前國際上公認的最具權威性的科技文獻檢索平臺，它能夠保證檢索論文覆蓋范圍的廣度和專業領域的深度，因此將其收錄論文數作為反映論文數量與質量的評價依據。

1.1.2 CSCD收錄論文數

科研評價不應忽略用本國語言發表的論文[3]。中國科學引文數據庫(Chinese Science Citation Database，CSCD)是我國第一個引文數據庫，收錄的千余種中文期刊涵蓋了生物學與醫藥衛生等臨床醫學相關領域。該庫對入選期刊嚴格篩選，評價功能較高，權威性強[4]。

1.1.3 篇均被引頻次

被引頻次能夠給予學術影響力客觀的評價結果，是反映國家、地區、機構、期刊或個人論文影響的重要依據。為了消除論文總數對被引頻次的影響，本文使用篇均被引頻次作為評價指標。

1.1.4 H指數

H指數是2005年由Hirsch首先提出的[5]。一名科研人員的H指數是指他/她至多有H篇論文分別被引用了至少H次。例如，某人的H指數是30，這表示他已發表的論文中，被引用了至少30次的論文總共有30篇。當然H指數不僅可以用來評價一個學者，也可以用來評價一個團隊、機構或者國家和地區。H指數最大的優點在于巧妙而有效地結合了發文量和被引用頻次兩個指標。

1.1.5 論文被引用率

篇均被引頻次可以較好地體現一組論文被引用的總體情況，但這個指標掩飾了一組論文中個別論文的被引頻次極高而其他論文可能根本無人引用的情況。論文被引用率考慮到了零被引論文的問題。

1.1.6 高被引論文百分比

H指數雖然綜合考慮了論文數量和被引頻次兩個因素，但卻忽視了那些高引頻、低產出作者的貢獻。2001年推出的文獻評價分析工具ESI(Essential Science Indicators)彌補了這個不足，ESI定期根據被引頻次排出位居世界前1%的高被引論文。一篇被引頻次處于前1%位置的論文，其對所在學科領域的貢獻和影響是毋庸置疑的。高被引論文百分比是指某一組論文中高被引論文數除以該組總論文數的百分比。

1.1.7 平均百分位

受到學科領域、文獻類型和出版時間等因素的影響，被引頻次、篇均被引頻次等指標難免會有偏差，這也促成了進行標準化處理的百分位數指標的出現。百分位數是將一組觀察值分割成100等分的一群數值，這些數值記作P1，P2，P3，…，P99，分別表示1%的資料落在P1之下，2%落在P2之下，99%落在P99之下。本文選擇的百分位指標來源于InCites。InCites是湯森路透集團推出的一種科研評價工具，它所使用的是反向百分位，即將被引頻次為0的文章的等級值設定為100，被引頻次越高的文章等級值越低，被引頻次越低的文章等級值越高[6]。例如一篇論文的百分位值為1，則該學科領域、同出版年、同文獻類型中99%的論文的引文數都低于該論文，即數值越小，影響力越大。

1.1.8 F1000推薦論文數

F1000是為科研人員和臨床醫生提供的快速發現、評價和發表為一體的綜合服務系統。其下的一個版塊F1000 Prime，主要是以專家對文獻的定性評價為主，由全球5 000余名生物學和醫學領域的頂尖科學家根據論文對當前世界生物和醫學研究的貢獻程度和科學價值，將少數優秀論文篩選出來，并給出評級，推薦給讀者[7]。該庫學科范圍聚焦在生物醫學領域，且成功地將定性的指標定量化。

1.1.9 熱點論文百分比

熱點論文是ESI中的一個重要模塊，是指在最近2年發表的論文中，在最近2個月內被引頻次排在某學科領域前0.1%的論文[8]。熱點論文反映了某個學科科學研究的最前沿和當前熱點，是創新性研究的體現。熱點論文百分比是指某一組論文中熱點論文數除以該組總論文數的百分比。

1.1.10 發明專利授權量

專利是知識產權的重要組成部分，其對科技創新的作用正受到越來越多的關注，也逐漸成為衡量高校科技創新能力的重要指標之一[9]。我國的專利分為發明專利、實用新型專利和外觀設計3種類型。其中發明專利是臨床醫學科學研究與開發活動重要的成果體現，可直接反映技術創新水平[10]。

1.2 指標權重的確定

利用專家咨詢法和層次分析法確定了上述10個指標的權重系數(表1)。

表1 基于文獻計量學的臨床醫學科研產出評價指標體系權重分布

2 實證研究

2.1 數據采集與統計

本文選取教育部學位中心2012年公布的學科評估排名中臨床醫學學科前10的高校作為評價對象，分別是上海交通大學、北京大學、復旦大學、北京協和醫學院、中山大學、四川大學、首都醫科大學、浙江大學、華中科技大學和第二軍醫大學，分析數據的年限是2010年1月1日至2014年12月31日。

通過InCites檢索10所高校的Web of Science收錄論文數、篇均被引頻次、H指數、被引用率、高被引論文百分比、平均百分位、熱點論文百分比等數據，時間限定在2010-2014年，然后在學科分類體系中選擇Clinical Medicine臨床醫學學科，同時將文獻類型限定為Article和Review。

CSCD收錄論文數從CSCD數據庫中檢索獲得，論文發表時間選擇2010-2014年，同時學科范圍限定為醫藥衛生類，并排除其下的預防醫學、衛生學、中國醫學、基礎醫學、口腔科學與藥學等學科。

F1000推薦論文數來自于F1000 Prime，論文出版時間限定在2010-2014年，學科范圍排除生物學、免疫學、公共衛生、藥學、生理學等。

發明專利授權量從國家知識產權局專利檢索及分析網頁檢索獲得，申請(專利權)人填寫各高校名稱，限定文獻類型為授權公告，發明類型為發明，公開(公告)時間為20100101-20141231，IPC分類號為A61B,A61F,A61G,A61H,A61J,A61L,A61M,A61N。需要說明的是，以檢索詞“北京協和醫學院”檢索時結果為0，但用“中國醫學科學院北京協和醫院”檢索有6篇。

2.2 結果與分析

通過檢索與數據篩選、整理，10所院校10個文獻計量學指標的數據如表2所示。

表2 2010-2014年10所院校臨床醫學科研產出

從表2可見，上海交通大學的Web of Science收錄論文數和CSCD收錄論文數均為第一名，說明該校科研活躍，成果卓著；北京大學的篇均被引頻次7.2次，有較顯著優勢；上海交通大學的H指數有較顯著優勢，以61排在首位。10所院校的被引用率差距不大，均在70%-80%之間，中山大學和第二軍醫大學以77%并列首位；北京協和醫學院和北京大學的高被引論文百分比超過1%，說明這兩所學校論文比其他幾所院校在全球影響力更大；中山大學平均百分位分值最低排名第一，但10所學校都沒有小于50%，說明影響力都只在中等偏下水平。北京大學F1000推薦論文數為59篇，排在第一位，說明該校的論文質量更多地得到了同行的認可；北京大學熱點論文百分比為0.13%，排名第一。但總體看來，10所院校的論文在研究前沿和熱點方面表現欠佳，上海交通大學的專利授權量遙遙領先。

本次實證研究設定指標單項滿分為10分，每個單項分乘以相應權重相加的和為最后得分，滿分為10分。每個學校每個單項的得分按該單項排名打分，排名第一10分，第二9分，以此類推。結果顯示，北京大學綜合表現排名第一，上海交通大學和中山大學分列第二和第三(表3)。

為了檢驗教育部學科排名和本次實證研究排名的相關性是否具有統計學意義，使用SPSS 20.0軟件對Spearman相關系數進行計算，r=0.815。由于通常分析的數據來自某個總體的樣本，得出的樣本相關系數只是總體相關系數的一個估計值，因此做總體相關系數是否為0的假設檢驗。

假設檢驗：H0:=0；H1:≠0。結果P=0.004，小于0.01，因此拒絕無效假設H0，接受備擇假設，認為兩種排名的相關性具有統計學意義。

3 結語

運用文獻計量學多項指標建立臨床醫學科研產出評價體系可以幫助學科定期從全景視角了解自身現階段的科研成果，了解一段時間內學科科研發展方向的變化，從而進一步為科研發展做出決策。雖然目前醫學界對建立何種科研產出評價體系尚未達成共識，希望本文的研究能夠為今后開展科研產出評價工作，建立更科學、合理的評價體系提供借鑒。