賀德方
(中國科學技術信息研究所,北京100038)
科技論文是科學研究產出的一個重要方面,可表現出科學研究內在的質量和水平,因此通過論文來度量一個國家的科學研究的質量和水平,是在科技評價研究與實踐活動中廣泛應用的定量指標之一。其中對高影響論文的統計分析和國際比較,更能從高水平研究產出的角度,反映出一個國家科學研究的質量、水平以及國際地位。
根據科學計量學理論和方法,論文的質量和水平可以從論文被引用情況以及論文所發表的期刊兩個方面來考察。論文數量是度量科學研究的一個最基本、最常見的指標。引文是科學家在其發表的論文中所列出的參考文獻,用來明確指出他們的研究建立在哪些早期研究工作成果的基礎上,因而引文可以表明早期研究成果是如何在他人后續研究工作中被利用的情況[1]。論文數量只能反映出科學研究產出的規模,但不能反映出科學研究質量和水平,而論文被引用次數則能客觀地反映出科學研究質量和水平。一般來說,論文被引用次數越大,說明論文質量和水平也就越高。
倫敦大學學者的研究表明,科學家在選擇在哪種期刊上發表論文時,首先考慮的是期刊的聲望和影響因子。科學家往往是把自己最具有創新性、代表性的論文投到聲望高和影響因子高的期刊上,因此,聲望高和影響因子高的期刊可以反映出其刊登的論文質量和水平[2]。例如,Science(《科學》)是一個享譽全球的知名期刊,其所刊登的論文質量和水平均比較高。期刊影響因子表示期刊刊登的論文的篇均被引用次數。一般來說,期刊影響因子數值越高,表明期刊整體學術質量越高,所刊登論文的被引用次數也越大。在影響因子高的期刊上發表的論文,其質量和水平也往往比較高。
在本研究中,高影響力論文是指高被引論文、熱點論文以及發表在世界著名期刊和頂尖期刊上的論文。從科學計量學數據指標的內涵上看,高影響力論文所報道的內容反映了最前沿、最重要和最有影響的科學發現與創新成果。國內外學者對高影響力論文的研究和應用主要包括以下幾個方面:
(一)高被引論文在基本特性、合著特性和老化特性方面與一般論文相比存在一定差異
有研究針對高被引論文的發表時間和各年被引次數進行了討論[3]。合著論文與論文被引次數有相當的關聯性,合著論文的被引次數通常高于單一作者論文從而成為高被引論文[4-7],Smart和Bayer抽取臨床心理領域、管理科學領域、教育評估領域文章,計算文章發表后十年內的被引次數,結果三領域合著文章之平均被引次數皆比單一作者文章高,尤其是管理科學領域。此外,合著與被引次數關系的研究還在其他領域進行,如數學統計領域、理論物理領域、化學領域[8]、生命科學、自然科學和工程材料[9]等,研究結果均表明,合著論文的被引次數均高于單一作者,尤其是國家合著論文。文獻老化研究能夠體現出論文的價值變化[10]。針對發表于1972年的自然科學領域的400篇高被引論文進行老化曲線分析,研究結果表明,被引次數較多的文章,得到引用的速度較慢,老化速度也較慢;被引次數較少的文章,得到引用的速度較快,老化速度也較快。并以集群分析得到兩種老化曲線:“快速上升,快速下降”和“緩慢上升,緩慢下降”。
(二)高被引論文作為學術評估指標,可用以對國家及研究機構的學術成果進行評估
美國蘭德公司在2008年發布的著名研究報告《美國科技競爭力》中,將一個國家的高被引論文數量作為一個比較指標,開展了美國與其他國家的科技競爭力的比較分析[11]。還有如衡量歐洲各國研究強度[12]。國內學者在比較研究國內大學的科學研究表現[13]、對國內大學科技競爭力的評估研究[14]和對國內大學的優勢學科及論文科研成果的影響力的評估[15]等研究工作中廣泛采用高被引論文統計分析結果作為定量研究的重要數據來源。王守業把高被引論文數量作為判斷大學學術影響力的重要事實型數據[16]。
(三)通過高被引論文來揭示某些領域的研究現狀及發展趨勢
如環境和職業健康領域研究特性的分析[17]、國內外高校在計算機科學領域的科研實力比較研究[18]、國內災害醫學救援學科發展現狀學術熱點的分析[19]、中國新媒體研究的發展歷程及特點研究[20]和中國眼科學的研究現狀分析[21]等。此外,還有一些研究關注高被引論文與科技期刊之間的相互關系[22-23]。
(四)以頂級學術期刊中的論文作為樣本進行的分析
周輝等對國內學者在Nature和Science發表的學術論文進行了統計分析[24]。王守業通過在三大頂尖期刊(Cell、Nature、Science)上發表論文數量的統計,對大學排名榜的結果進行校驗[16]。
在本研究中,高被引論文數據來源于湯森路透編制的“基礎科學指標”(ESI)。根據湯森路透公司的定義,以10年作為統計時間段來計算所有論文被引用次數,高被引論文是指被引用次數排在各學科前1%的論文。在本研究中,分別采集了2005年統計的1995-2005年10年段內的高被引論文和2010年統計2000-2010年10年段的數據。
熱點論文數據也是來源于湯森路透編制的ESI。根據湯森路透公司的定義,計算最近兩年內發表的論文在同時間段內的被引用次數,熱點論文就是被引用次數排在各學科前0.1%的論文。在本研究中采集了2010年統計2009-2010年2年段的數據。
世界著名期刊的論文數據來源于Cell、Nature、Science這三個國際公認的享有最高學術聲譽的科技期刊。所采集數據的范圍分別是2005年和2010年發表的論文,以便對我國十一五規劃始末的情況進行對比。
世界各學科頂尖期刊是指各學科影響因子最高的期刊。根據湯森路透公司出版的《期刊引證報告》(Journal Citation Reports)統計,2005年和2009年世界各學科頂級期刊分別有157個和173個。這些期刊上發表的論文就是頂尖期刊上的論文,統計時間范圍分別為2005年和2010年。
與中國進行國際比較的國家包括G7國家(美國、英國、德國、法國、日本、意大利、加拿大)和有代表性的新興國家(印度、韓國、俄羅斯)。
(一)中國高被引論文數量增長情況的國際比較
按照論文被引用的規律,論文在發表之后3-5年的期間里通常會達到被引用的高峰。在一個相對較長的統計時間段里,計算論文被引用次數,是一個科學的、客觀的評價論文影響力的方法。根據湯森路透公司的定義,以10年作為統計時間段來計算所有論文被引用次數,高被引論文是指被引用次數排在各學科前1%的論文。因此高被引論文可以反映近十年高質量和高水平的重要科學研究成果。
2005年統計的全世界在1995-2005年10年時間段里的高被引論文數為78046篇,其中中國高被引論文數為1555篇,世界排名第8位。美國排在第1位,達到50549篇。英國和德國排在第2位和第3位,論文數分別為10040篇和8312篇。日本、法國、加拿大和意大利排在中國之前,這些國家的論文數都在3000-5500篇之間。俄羅斯、韓國和印度排在中國之后。
2010年統計的全世界在2000-2010年10年時間段里的高被引論文數為98912篇,其中中國高被引論文數為5264篇,年均增長率達到27.6%。排在世界第7位。美國排在第1位,論文數高達56299篇,英國和德國的論文數分別為11904篇和11040篇,位于第2位和第3位。排在中國之前的國家還包括法國、加拿大和日本,這些國家論文數在5500-7000篇之間,意大利論文數為4801篇,被中國超越。韓國、印度和俄羅斯的高被引論文數雖然有不同幅度增長,但仍然都沒有超過2000篇。
(二)中國熱點論文數量情況的國際比較
如上所述,論文在發表之后3-5年的期間里會達到被引用的高峰,而在發表之后短時間內就得到大量引用的論文(熱點論文),往往反映了最新的科學發現和研究動向,可以說是科學研究前沿的風向標。根據湯森路透公司的定義,計算最近兩年內發表的論文在同時間段內的被引用次數,熱點論文就是被引用次數排在各學科前0.1%的論文。熱點論文僅占統計時間段內論文總數的千分之一,往往都具有重要的學術價值,并且在未來的更長時間內會產生廣泛的學術影響。
2010年統計的全世界熱點論文總數為1760篇,其中中國熱點論文數為132篇,排在世界第6位。美國熱點論文數最多,為990篇。其次為英國和德國,熱點論文數為306篇和257篇。加拿大和法國排在中國之前,熱點論文數分別184篇和183篇。意大利和日本排在中國之后,熱點論文數為128篇和94篇。韓國、印度、俄羅斯三個國家的熱點論文數量與中國差距較大,尚不足中國的30%。
(三)中國在三大名刊上發表的論文數量增長情況的國際比較
Cell、Nature、Science 是國際公認的三個享有最高學術聲譽的科技期刊,簡稱CNS。三大名刊以極其嚴格的同行評議著稱,對發表論文的質量和水平要求非常高。據Science主編Bruce Alberts介紹,Science每年都會收到大量投稿,但只有8%左右的投稿才能夠被采用[25]。發表在三大名刊上的論文,基本都是經過世界范圍內知名專家層層審讀,反復修改而成的高質量、高水平的論文。2005年CNS共刊登論文5978篇,中國論文僅有79篇,列在第10位。美國論文數最多,達到2701篇。英國以652篇排在第2位,德國、法國、加拿大、日本和意大利等其他 G7國家論文數量在100-400篇之間,都排在中國之前。韓國、印度和俄羅斯排在中國之后,只在CNS上發表了30-40篇。
2010年CNS共刊登論文5620篇。其中中國論文為145篇,與2005年相比增加了84%。美國仍然排在首位,論文數為2538篇。英國和德國列第2位和第3位,論文數分別是621篇和427篇。法國、加拿大、日本論文數量在150-300篇之間,仍然排在中國之前。意大利已經落后于中國,論文數為118篇。韓國、印度和俄羅斯也在中國之后,韓國、俄羅斯和印度則分別為48篇、27篇和24篇,與中國的差距進一步擴大。
(四)中國在世界各學科頂尖期刊發表論文數量世界排名第二
世界各學科頂尖期刊是指各學科影響因子最高的期刊。根據湯森路透公司出版的《期刊引證報告》,2005年各學科頂尖期刊有157種,2010年各學科頂尖期刊共有173種。這些期刊都是所在學科中最權威、最重要的學術期刊,一般來說,發表在學科頂尖期刊中的論文被引次數都比較高,其質量和水平也比較高。例如《新英格蘭醫學雜志》2009年的影響因子高達47.05,在內科學科全部132種期刊中排名第一,其2007年和2008年所刊登的論文篇均被引用次數達47.05次。
2005年,各學科頂尖期刊的論文總數為54409篇,其中中國論文為1797篇,排名為第8位。美國論文數最多,為22146篇。英國和德國論文數分別為4384篇和4211篇。日本、加拿大、法國、意大利等G7國家都排在中國之前,這些國家論文數在1900-3100篇之間。韓國、印度和俄羅斯則排在中國之后,論文數量都不足1000篇。
2010年,各學科頂尖期刊上的論文總數為55336篇。中國超越了意大利、加拿大、法國、日本、德國和英國,在頂尖期刊上發表的論文數量大幅上升到5203篇,排在世界第2位。2005-2010年,中國在頂尖期刊上發表的論文數量年均增長率高達23.3%,顯著高于同期中國SCI論文總數的年均增長率(15.5%)。2010年美國在頂尖期刊上發表的論文數為21296篇,仍排在世界第1位。英國發表論文5107篇,排在中國之后的第3位。德國、法國、加拿大、日本、意大利依次排在第4位至第8位,這些國家論文數在2000-4500篇之間。韓國、印度和俄羅斯在世界各學科頂尖期刊發表論文數量雖然也呈現出的明顯的增長趨勢,但是增長速度和幅度都不及中國。
(一)2005-2010年,中國高影響力論文數量呈現出快速增長的態勢,增速領先于G7國家。其中中國高被引論文數量年均增長率達到27.6%,G7國家的高被引論文數量年均增長率一般在8%以內;中國在三大名刊上發表論文的數量的年均增長速度達到12.9%,G7國家在三大名刊上發表論文數量年均增長率一般在5%以內;中國頂尖期刊論文的年均增長率達到23.7%,G7國家在頂尖期刊上發表論文數量年均增長率一般在6%以內。
(二)2005年中國的高被引論文數量、在三大名刊上發表論文的數量和在頂尖期刊發表論文的數量已經高于韓國、印度和俄羅斯等國家。5年來的年均增長率也高于韓國、印度和俄羅斯等新興國家,到2010年,中國領先這幾個國家的優勢進一步擴大。
(三)中國高影響力論文數量的快速增長,反映出中國科學研究質量和水平在不斷提升。高被引論文以及三大名刊和各學科頂級期刊論文均是世界范圍內的重要科學研究成果,可反應出一個國家科學研究的質量和水平。高被引論文數量是隨著論文總數的變化而變化,2005-2010年,全世界高被引論文數量年均增長率僅為4.9%,而中國高被引論文數量年均增長率達到27.6%,中國高被引論文總數占全世界高被引論文總數由2005年的1.9%提高到2010年的5.3%;對于三大名刊來說,2010年刊載論文總量比2005年減少了358篇,但中國在三大名刊上發表論文總量不但沒有較少,反而增加了66篇;對于世界各學科頂尖期刊來說,2010年刊載論文總量比2005年只增加了927篇,但中國在世界各學科頂尖期刊上發表論文總量卻增加了3406篇。這些數據的變化表明了我國的科學研究工作的水平和質量不斷快速提升,也顯示出我國科技工作者對世界科學技術的發展的貢獻度有明顯提升。
(四)我國與處于世界科技最強國地位的美國相比,還存在顯著的差距,按高被引論文、熱點論文、各學科頂尖期刊發表的論文和三大名刊的論文統計,中國分別只是美國的9%、13%、24%和6%。與英國相比,也存在一定的差距,除在各學科頂尖期刊發表的論文數量超過英國外,中國的高被引論文、熱點論文和三大名刊的論文數量分別是英國的44%、43%和23%。
經過“十一五”期間的努力,中國科技論文在總數上大大增加,并且高影響力論文的數量也呈現出快速增長的態勢,這從一個重要側面反映出我國科學研究的質量與水平以及在世界科學事業發展進程中所發揮的作用正在日益提高,中國科學研究的國際地位也在不斷提升。
[1]David A.Pendlebury.White Paper-Using Bibliometrics in Evaluating[R].Research Department,Thomson Reuters,2008.
[2]The Changing Scholarly Communication Landscape:An International Survey of Senior Researchers[J].Learned Publishing,2006,19(1):31-35.
[3]Plomp R.The Significance of the Number of Highly Cited Papers Asan Indicator of Scientific Prolificacy[J].Scientometrics,1990,19(3-4):185-197.
[4]Aksnes D W.Characteristics of Highly Cited Papers[J].Research Evaluation,2003,12(3):159-170.
[5]Smart J C,Bayer A E.Author Collaboration and Impact:A Noteon Citation Rates of Single and Multiple Authored Articles[J].Scientometrics,1986,10(5-6):297-305.
[6]Narin F,Hamilton K S.Bibliometric Performance Measures[J].Scientometrics,1996,36(3):293-310.
[7]Gl?nzel W.Coauthorship Patterns and Trends in the Sciences(1980-1998):A Bibliometric Study with Implications for Database Indexing Andsearch Strategies[J].Library Trends 2002,50(3):461-473.
[8]Rousseau R.Are Multi-authored Articles Cited More Than Singleauthoredones?Are Collaborations with Authors from Other Countriesmore Cited Than Collaborations Within the Country?A Case Study[OL].http://doclib.uhasselt.be/dspace/handle/1942/822,July 5,2007.
[9]Katz J S,Hicks D.How Much Is A Collaboration Worth?Acalibratedbibliometric Model[J].Scientometrics,1997,40(3):541-554.
[10]Aversa E S.Citation Patterns of Highly Cited Papers and Theirrelationship to Literature Aging:A Study of the Working Literature[J].Scientometrics,1985,7(3-6):383-389.
[11]Titus Galama,James Hosek.U.S.Competitivenessin Science and Technology[R].Rand National Defense Research Institute,2008.
[12]European Commission.Indicators for Benchmarking of NationalResearch Policies[OL].http://europa.eu.int/comm/research/era/pdf/benchmarking2001.pdf, Retrieved May 30,2004.
[13]馬崢等.2020年中國科技地位預測和估計[J].科學學與科學技術管理,2004,(3):5-8.
[14]趙蓉英,雷將.中國“985”高校科研競爭力的計量評價研究——以材料科學和工程學為例[J].重慶大學學報:社會科學版,2008,14(2):78-84.
[15]劉毅清,黃曉波,張紅武等.1994-2009年SCIE收錄的三所軍醫大學高影響力論文分析[J].解放軍醫院管理雜志,2010,(8):762-765.
[16]王守業.浙江大學:你真的是中國第一嗎?![OL].科學網:王守業的博客.http://blog.sciencenet.cn/home.php?mod =space&uid =563591&do=blog&id=440963.
[17]Smith,Derek R.Highly Cited Articles in Environmental and Occupational Health,1919-1960[J].Archives of Environmental& Occupational Health 2009,64:32-42.
[18]Ma RM,Ni CQ,Qiu JP.Scientific Research Competitiveness of World Universities in Computer Science[J].Scientometrics,2008,76(2):245-260.
[19]尤偉杰,李小萍,岳建華等.基于高被引論文的國內災害醫學救援研究現狀分析[J].中國急救復蘇與災害醫學雜志,2010,(12):1095-1097.
[20]徐劍,趙征南.中國新媒體研究的歷史回顧與反思——基于CNKI、CSSCI高被引論文觀察[J].上海交通大學學報:哲學社會科學版,2010,(5):46-53.
[21]方紅玲.2003~2008年眼科學高被引論文統計分析[J].中國科技期刊研究,2010,(2):197-200.
[22]韓維棟,薛秦芬,王麗珍.挖掘高被引論文有利于提高科技期刊的學術影響力[J].中國科技期刊研究,2010,(4):514-518.
[23]程琴娟.《陜西師范大學學報》(自然科學版)高被引論文分析[J].陜西師范大學學報:自然科學版,2010,(3):104-108.
[24]周輝,張光紅,賀飛等.中國內地學者在Nature和Science發表論文統計分析[J].中國基礎科學,2004,(2).
[25]萬建輝,彭小東.美國《科學》雜志主編在漢坦言:中國論文拒稿率非常高[N].長江日報,2010-10-12.