董政娥,陳惠蘭
(東華大學 圖書館,上海 201620)
基于ESI和InCites數據庫的東華大學學科發展預測
董政娥,陳惠蘭
(東華大學 圖書館,上海 201620)
基于ESI(Essential Science Indicators)和InCites數據庫引文分析及跟蹤,以東華大學為案例,通過計算其ESI中22個學科在全國各學科發展中占據的比重,分析學科結構及特征,探討預測后續最有可能進入ESI世界前1%學科的方法,進而對后續學科進入ESI世界前1%進行預測.結果表明:除目前入圍的工程(Engineering)、物理(Physics)、材料(Materials Science)、化學(Chemistry)4個學科外,數學學科(Mathematics)和計算機科學(Computer Science)學科會于近期入圍ESI世界前1%;在優勢競爭學科中,生物化工(Biology &Biochemistry)學科入圍ESI則會稍微滯后.
東華大學;學科發展;ESI;InCites;學科比重;預測
近年來,ESI(Essential Science Indicators,基本科學指標)論文備受關注,基于ESI論文,國內學者在學科發展[1]、科研競爭[2]等方面進行了大量研究.在《2012中國大學評價研究報告》中ESI論文被首次納入大學評價指標[3].入圍ESI世界前1%的學科及其數量則引起了國內外各大院校的重視.國內各“985”高校均將ESI指標作為衡量該校學科專業進入國際先進水平的一項重要指標[4].如何通過數據挖掘、信息處理等手段,使科研管理人員得以在整個學科發展以及學科評價中了解某學科在世界所處的位置及學科發展趨勢則顯得尤為重要.跟蹤、監測ESI中22個學科動態,并對其引文進行有效管理、分析和利用,將為研究的進一步發展提供強有力的推動.目前有關ESI中涵蓋學科引文分析多集中于識別當前的研究熱點或總結過去的發展過程,而對高引用率論文(Highly Cited Papers)、熱門論文(Hot Papers)和頂尖論文(Top Paper)與學科發展的關系以及對其進行相關預測的研究則尚未展開.隨著InCites數據庫的不斷完善,進行相關預測具備了可行性,而InCites數據庫[5]是湯森路透集團在匯集和分析 Web of Science(SCIE,SSCI,A&HCI)引文數據基礎上建立起來的科研評價工具,綜合各種計量指標和30年來各學科各年度的國際標桿數據.其學科分類包含 Web of Science分類(250多個)、Essential Science Indicators 分 類 (22 個)和OECD (Organization for Economic Cooperation and Development)分類(48個).該數據庫包含全球各個國家、機構和學科的論文統計結果,其中,國家對比數據庫包含180多個國家和9個區域性組織在所有學科中的論文統計結果,機構對比數據庫包含全球各主要國家中主要研究機構和研究機構聯盟在所有學科中的論文統計結果.
本文基于ESI和InCites數據庫引文分析及跟蹤,以東華大學為案例,在探討其優勢學科特征,高引用率論文、熱門論文和頂尖論文與學科發展關系分析基礎上,預測后續最有可能入圍ESI世界前1%學科的學科.
本文選取ESI和InCites數據庫引文數據,預測東華大學入圍ESI學科發展.其中跟蹤采集ESI數據庫引文分析部分Baselines(基準線)中Field Rankings功能下22個學科的總被引頻次.
本研究引入學科比重Qi,計算式如式(1)所示.

其中:i為ESI中22個學科中第i個學科;Xi為InCites數據庫中某機構的第i個學科論文被引頻次;Yi為ESI數據庫引文分析部分Baselines(基準線)中Field Rankings功能下22個學科的總被引頻次.學科比重Qi值越大,表示該學科的國際影響力程度越高,具有一定的優勢地位,反之則學科處于劣勢地位.
預測算法的流程如圖1所示,其基本思想:(1)利用InCites數據庫對東華大學近10年ESI中22個學科進行引文分析,形成第i個學科論文被引頻次Xi;(2)利用ESI數據庫跟蹤近10年ESI中22個學科發展,并對其進行引文分析,獲得第i個學科總被引頻次Yi;(3)計算學科比重Qi;(4)對22個學科的Qi值進行排序,進而預測進入ESI世界前1%學科的順序.

圖1 預測算法的流程Fig.1 Flow chart of the prediction algorithm
采集了InCites和ESI數據庫相關數據,并計算了學科比重Qi如表1所示.其中,Xi采集了InCites數據庫(1981-01-01—2010-12-31)東華大學22個學科論文的被引頻次;為了測度預測結果的穩定性,跟蹤采集了ESI數據庫連續3個時間段(2001-01-01—2011-10-31,2001-10-01—2011-12-31,2002-01-01—2012-02-29)各學科論文總被引頻次Yi.在采集數據基礎上計算獲得了東華大學22個學科(按照ESI數據的學科分類方法)比重Qi.
由表1可知,在ESI劃分的22個學科基礎上,根據學科比重Qi特征,東華大學的學科可以劃分為5個區間.
(1)第Ⅰ區間(Qi在0.010 00~0.100 00之間).該區間分布了7個學科,其分別為工程(Engineering)、數 學 (Mathematics)、物 理(Physics)、材料 (Materials Science)、計算機科學(Computer Science)、化學(Chemistry)、生物化工(Biology & Biochemistry). 早前跟蹤研究表明[6]:東華大學最先入圍ESI世界前1%的學科為工程,且2009年年初只有工程一個學科入圍;2010年底,則新增了化學,2011年年初新增了材料,2011年底新增了物理.亦即分布在第Ⅰ區間的7個學科,其中有4個學科已經入圍了ESI世界前1%學科.由此可見,該區間的學科最具有一定競爭優勢.

表1 東華大學進入ESI學科順序預測Table 1 Prediction on sequence of fields for Donghua University by ESI
(2)第Ⅱ區間 (Qi=0.001 00~0.010 00).該區間也分布有7個學科,包括經濟 & 貿易(Economics & Business)、 環 境/生 態 學(Environment/Ecology)、分 子 生 物 學 & 遺 傳 學(Molecular Biology & Genetics)、 多 學 科(Multidisciplinary)、 藥 理 學 & 毒 理 學(Pharmacology & Toxicology)、地 質 科 學(Geosciences)和農學(Agricultural Sciences).
(3)第Ⅲ區間 (Qi=0.000 10~0.001 00).分布于該區間的學科共3個,分別為醫學/心理學(Neuroscience & Behavior)、 微 生 物 學(Microbiology)和植物 & 動 物 科學 (Plant &Animal Science).
(4)第Ⅳ區間 (Qi=0.000 01~0.000 10).分布于該區間的學科有2個,分別為社會科學(Social Sciences,General)和 臨 床 醫 學 (Clinical Medicine).
(5)第Ⅴ區間(Qi=0).東華大學3個學科沒有論文被引用,其分別為免疫學(Immunology)、精神病學/心理學(Psychiatry/Psychology)和空間科學(Space Science).
在論文評價方面,ESI提供了高引用率論文、熱門論文和頂尖論文的被引用情況[7].其中高引用率論文和熱門論文包括在高被引論文(Most Cited Papers)模塊列表中[8],頂尖論文可以在如圖2所示排名中按“ ”查詢.

圖2 東華大學機構入圍ESI學科示意圖Fig.2 Example of field rankings for Donghua University
2.3.1 高引用率論文的學科分布
高引用率論文是被引頻次在前1%的論文.ESI根據論文的被引頻次,選擇靠前的1%范圍內的論文形成高引用率論文列表[7-8].
東華大學高引用率論文在學科中的分布如圖3所示.由圖3可見,東華大學最近10年高引用率論文主要分布在工程(Engineering)、數學(Mathematics)、物 理 (Physics)、材 料 (Materials Science)、計 算 機 科 學 (Computer Science)、化 學(Chemistry)、生物化工(Biology & Biochemistry)和藥理學 & 毒理學(Pharmacology &Toxicology)這8個學科中.其中,分布最多的學科為工程(Engineering),占 總 數 的 35.7%;其 次 為 物 理(Physics),占總數的25%;數學(Mathematics)、材料 (Materials Science)和 計 算 機 科 學 (Computer Science)這3個學科并列排名第三,均占總數的8.9%;排名第4的學科為化學(Chemistry),其占總數的7.1%;另外,生物化工(Biology & Biochemistry)和藥理學 & 毒理學 (Pharmacology &Toxicology)分別有3.6%和1.8%論文為高引用率論文.由此可見,高引用率論文多分布在學校具有優勢競爭學科領域中.

圖3 高引用率論文在學科中的分布(更新日期:2012-05-01)Fig.3 Distribution of highly cited papers in the fields(Update:2012-05-01)
2.3.2 熱門論文的學科分布
熱門論文是指最近2年發表的被引頻次位于前0.1%的論文,即與相同領域和出版年的其他論文相比,出版后很快就有高被引頻次的論文[7-8].熱門論文的選擇基于論文的發表年限能超過2年,而且在當前的2個月里被引用,這意味著論文必須在很近的一段時間里得到關注.東華大學熱門論文在學科中的分布如圖4所示.由圖4可知,東華大學最近2年熱門論文共有7篇,其中,72%的熱門論文分布在工程(Engineering)學科,數學(Mathematics)和生物化工(Biology &Biochemistry)學科則分別分布了14%的熱門論文.由此可見,熱門論文也多分布在學校優勢競爭學科中.

圖4 熱門論文在學科中的分布(更新日期:2012-05-01)Fig.4 Distribution of hot papers in the fields(Update:2012-05-01)
2.3.3 頂尖論文的學科分布
頂尖論文是某一科學家、機構、國家以及期刊在特定領域和年限中的被引頻次排名在前1%的論文,是某一學科高引用率論文與熱點論文之和.頂尖論文與高被引論文的主要差異在于頂尖論文是進入各領域排行的高被引論文,無法進入某領域排行的論文,便不能成為該領域的頂尖論文[7].東華大學頂尖論文在學科中的分布如圖5所示.由圖5可見,東華大學最近10年的頂尖論文共有58篇,其分布趨勢與高引用率論文分布趨勢基本一致,在高引用率論文與熱點論文中,其中5篇論文同屬于高引用率論文和熱點論文,而工程(Engineering)學科中有2篇論文為熱點論文,但卻不是高引用率論文.

圖5 頂尖論文在學科中的分布(更新日期:2012-05-01)Fig.5 Distribution of top papers in the fields(Update:2012-05-01)
為了進一步預測后續入圍ESI世界前1%的學科,圖6分析了第Ⅰ區間優勢學科的學科比重及其穩定性.由圖6可見,該區間的7個學科中工程學科所占比重最大,其次是數學學科、物理學科、材料科學、計算機科學、化學和生物化工.這7個學科連續3個時間段在世界同學科中所占比重均較穩定外,位于第1位、第3位、第4位和第6位的4個學科均已經入圍世界1%,由此可推斷位于第2位的數學學科(Mathematics)、第5位的計算機科學(Computer Science)和第7位的生物化工(Biology&Biochemistry)學科可能率先入圍ESI世界前1%,尤其是數學(Mathematics)科學和計算機科學(Computer Science)會于近期入圍ESI世界前1%,生物化工(Biology &Biochemistry)學科則會稍微滯后些.

圖6 優勢學科比重穩定性分析Fig.6 Analysis stability of proportion on the advantage discipline
從東華大學22個學科在世界各學科中所占比重、學科結構特征、高被引論文與入圍ESI世界前%學科關系分析,可得到如下結論:
(1)目前在ESI所包含的22個學科中,東華大學最具有競爭優勢的學科包括7個,其中,工程(Engineering)、物 理 (Physics)、材 料 (Materials Science)、化學(Chemistry)4個學科已經相繼入圍ESI世界前1%,在世界學科中所占比重較高的數學(Mathematics)、計算機科學(Computer Science)和生物化工(Biology &Biochemistry)3個學科可能率先入圍ESI世界前1%.
(2)東華大學高引用率論文、熱門論文和頂尖論文多分布在優勢競爭學科中,其中學科比重較高的學科高引用率論文、熱門論文和頂尖論文所占比例相對較高.因此,可以從提高論文質量,如加強高引用率論文、熱門論文和頂尖論文數量的角度出發,促進學科在世界學科中的競爭優勢,而這方面可以通過人才隊伍建設、人才引進等方法得以實現.
(3)在7個最具競爭優勢的學科中,排名第2位的數學(Mathematics)學科和第5位的計算機科學(Computer Science)學科將會于近期入圍ESI世界前1%,排名第7位的生物化工(Biology &Biochemistry)學科的入圍則會稍滯后.
(4)在今后的學科發展中,有待發展的學科為處于第Ⅱ區間的學科,如經濟 & 貿易(Economics& Business)、環 境/生 態 學 (Environment/Ecology)、分 子 生 物 學 & 遺 傳 學 (Molecular Biology & Genetics)、多學科(Multidisciplinary)、藥理學 & 毒理學(Pharmacology &Toxicology)、地質科學(Geosciences)和農學(Agricultural Sciences),這些學科已經在世界各學科中占有一席之地,但是仍然需要繼續努力,如可以在增加該學科論文產量基礎上,重視其在世界學科中的被關注程度等(即被引用頻次)方面出發來促進其進一步發展.
(5)對于較薄弱的第Ⅲ和Ⅳ區間學科而言,加強其學科發展,提高其在世界各學科中所占比例值得進一步探討.如分布于第Ⅲ區間的醫學/心理學(Neuroscience & Behavior)、 微 生 物 學(Microbiology)和植物 & 動物 科 學 (Plant &Animal Science)學科,尤其是植物 & 動物科學(Plant & Animal Science)學科,可以充分利用東華大學紡織材料與工程學科的特色進一步發展和完善;分布于第Ⅳ區間的社會科學(Social Sciences,General)和臨床醫學(Clinical Medicine)學科則可以從發展交叉學科的角度得以全面提高,如可以充分利用東華大學人文學院、外語學院以及管理學院現有資源,提高其在世界學科中的比重.
參 考 文 獻
[1]陸根書,劉敏.我國高校學科競爭力及學科建設成效分析[J].西安交通大學學報:社會科學版,2008,28(6):76-82.
[2]易勇.我國研究型大學科研能量及效率研究:基于科學計量學的視角[J].中國科技論壇,2011(10):109-113.
[3]騰訊教育.2012ESI-TOP論文排行榜揭曉清華大學高居榜首[EB/OL].(2012-01-09)[2012-05-01].http://edu.qq.com/a/20120109/000394.htm .
[4]東華大學3個學科入圍ESI世界前1%學科[J].紡織教育,2011(2):100.
[5]InCitesTM[DB].[2012-05-01].http://incites.isiknowledge.com/Home.action.
[6]董政娥,陳惠蘭.基于ESI和SCI-E論文來源期刊分區的東華大學學科發展分析[J].東華大學學報:自然科學版,2012,38(1):107-112.
[7]韓欣,劉子忠.ESI計量分析數據庫的功能與科學評價:以中國地學研究機構的科學評價為例[J].地質科技情報,2010,29(1):138-142.
[8]邱均平,馬瑞敏.引文索引的功能與科學評價:以美國《基本科學指標》引文數據庫為例(下)[J].評價與管理,2006,4(1):18-21.
The Discipline Forecast of Donghua University Based on the Databases of ESI and InCites
DONGZheng-e,CHENHui-lan
(Library,Donghua University,Shanghai 201620,China)
The development of discipline as example of Donghua University is forecasted in terms of citation analysis and alerting based on the databases of ESI(Essential Science Indicators)and InCites.The procedure of the forecast is as followed,firstly the proportion of discipline in the national discipline as a whole is calculated according to the 22 disciplines in ESI.Analysis of the discipline structure and character are followed.At last,forecast is carried out on the basis of sorting of the proportion of discipline.The result shows that two disciplines such as Mathematics and Computer Science will listed ESI the world's top 1%finalist in the near future,except four disciplines such as Engineering,Physics,Materials Science and Chemistry that listed in ESI.The Biology &Biochemistry will be listed a little lag in advantage disciplines.
Donghua University;discipline development;ESI;InCites;proportion of discipline;forecast
G 353.1
A
1671-0444(2013)05-0689-06
2012-05-21
中央高校基本科研業務費專項資金資助項目(12D23701);ESI和Incites數據庫視角下“985”高校人文科學發展跟蹤與分析2012
年度預研究資助項目(73D123707);紡織史相關資源建設和研究熱點的分析研究2012年度預研究資助項目(237-10-0108013)
董政娥(1978—),女,山西朔州人,館員,博士研究生,研究方向為信息咨詢、科研績效評估.E-mail:dzee071107@dhu.edu.cn
陳惠蘭(聯系人),女,研究館員,E-mail:hlch@dhu.edu.cn