呂天宇
(江蘇師范大學圖書館,江蘇 徐州 221116)
數學是一門有著悠久歷史且一直在人類生產生活中發揮極為重要作用的自然學科。數量關系以及空間形式是聯系數學這門學科與人類生產生活的兩座重要橋梁[1],并且其研究成果被廣泛應用于絕大部分的自然學科,甚至人文社會學科。這些學科的很多科研方法、模型或者工具都極其依賴數學學科的科研發展,所以對于數學領域的研究或者創新都在某種程度上反映了一所高校甚至一個國家的科研水平。當前時代是信息化、數據化以及智能化的時代,計算機學科的發展就和數學學科有著千絲萬縷的聯系,所以在當今時代背景下,對于數學學科的研究或者說對于數學與計算機科學結合應用的研究就顯得格外重要,誰掌握了數學研究領域的前沿科技成果,誰就掌握了時代發展的主動權。本文選取數學研究領域作為研究方向也是結合了當下的時代背景與科研需要。
基于希望真實可信地分析近年來全球數學研究領域的論文成果以及科研特征,本文選擇目前全球領先的專業信息服務提供商[2]科睿唯安(Clarivate)公司旗下的數據庫產品ESI(Essential Science Indicators)作為數據挖掘的起始點。ESI數據庫可以揭示在某個研究領域有影響力的國家、機構、論文和期刊以及研究前沿,其中高被引論文代表了近十年的引文數據中相同學科相同年度被引次數排名在前1%的文獻,而熱點論文則是最近兩個月以來被引次數排名在前0.1%的文獻[3]。這些特征保證了原始數據的權威性與完整性。
在獲得所需要的論文原始數據后,本文對其進行了必要的擴展以保證多角度可視化分析的可行性。拓展時選用了能夠基于ESI數據庫信息提供文獻全記錄數據的WoS(Web of Science)數據庫作為原始數據獲取的第二來源。此平臺把WoS核心合集和其他多個區域性平臺中的資源包括引文索引、專利數據等建立連接,從而保證了用戶檢索數據的廣度[4]。
同時,本文選擇了較為權威的可視化分析工具,將所有的數據轉換成清晰易讀的表格、圖片等可視化結果,使得讀者能夠直觀地理解本文的分析過程與結論,并且希望對有意向在此主題上作進一步研究和分析的讀者能夠有所參考和啟發。
本文的研究重點為多角度可視化分析,所以在挑選研究工具上主要基于以下3點標準:
(1)與WoS數據庫中獲取的原始數據格式高度兼容且能直接讀取并制作圖表,因為從WoS數據庫中下載的數據具有一定的格式特異性。
(2)可視化圖表需要清晰明了、簡單易讀,保證讀者可以高效地掌握文章的中心思想。
(3)同一工具基于同一份數據可提供不同角度可視化的變換,有效提高研究的效率并為后續研究提供有價值的參考。
通過篩選,本文最終選取了兩個可視化工具,分別為InCites和VOSviewer。
1.1.1 InCites簡介
InCites可視化分析工具同樣作為科睿唯安公司旗下的產品,正是基于WoS中各類豐富的數據信息并利用其極強的定制化、可視化分析特性,能夠幫助研究人員獲得詳細的、客觀的并且有說服力的信息[5]。InCites分析工具同時滿足了上述所提到的3個標準,所以本文選取它來研究較為宏觀層面的論文特征。
1.1.2 VOSviewer簡介
VOSviewer軟件的開發初衷就是要展現其對于處理規模較大數據時的優勢,尤其是在展現共現聚類圖譜時,可以允許研究成員進行各種微觀信息層面的查看及分析;而且在展現一些核心數據圖時(例如:作者、機構或者國家合作網絡圖,關鍵詞聚類圖等),VOSviewer的直觀程度相較于其他文獻可視化分析軟件會更高一些[6]。
在中國知網(CNKI)數據庫中搜索使用VOSviewer作為研究工具的相關文獻時發現:既有像本文一樣研究一個大的學科領域,例如使用VOSviewer可視化分析中國環境生態學領域的研究熱點;也有使用該工具研究一個較為微觀的知識點,例如研究人體腸道菌群的相關研究熱點[7-8]。
本文所需原始數據的第一來源為ESI數據庫。由于ESI數據庫數據每兩個月就滾動更新一次,具有時效性,所以特此說明數據下載時間為2021年10月19日。
首先,在ESI數據庫的篩選器中,將“Research Fields”(研究領域)設置為“Mathematics”(數學),同時將文獻篩選范圍分別設置為“Highly Cited Papers”(高被引論文)和“Hot Papers”(熱點論文)進行下載,分別得到4 771條和110條引文數據,至此就獲得了ESI數據庫中所需的所有原始數據。
如引言中所述,由于從ESI數據庫中下載的原始數據廣度有限,所以需要使用WoS數據庫來對這些數據進行擴展,具體過程如下:將從ESI數據庫中得到的4份數據中的入藏號全部挑選出來,并按照格式“入藏號1 or入藏號2 or…”復制到WoS核心合集數據庫中檢索,將所得檢索結果按照“全記錄與引用的參考文獻”的形式導出純文本格式文件,同樣也是按照ESI數據庫中的分類方式分為高被引論文數據和熱點論文數據,至此本文所需要的所有原始數據獲取完畢。
本文最終選取了兩個可視化軟件作為研究工具,所以按照研究工具類別來介紹最終的研究結果。
WoS數據庫中的檢索結果可直接導出至InCites數據庫工具,得到兩份WoS的原始數據時依次點擊按鈕“導出”-“InCites”,就可以同步至同一賬戶下的InCites數據庫中,之后在InCites中就可以直接選擇相應原始數據集進行可視化分析。
對數學領域高被引論文進行表格化分析,表格內容包括發文機構和國家或者地區、發文數量、被引頻次及引文影響力等方面。被引頻次和引文影響力是兩個能夠反映一個機構甚至一個國家或者地區在某一領域內發文水平的重要指標[9]。
高被引論文發文數量排在前10位的機構中,有4個機構(高校)都屬于中國內地,其余機構分布在臺灣地區、中東部分地區以及西方少數的發達國家地區,如表1所示。由此可以看出發展中國家及地區,尤其是中國大陸,在近十年對于數學領域的研究發揮了重要的作用。從被引頻次及引文影響力的角度來看,這10所機構的發文水平也是非常高的,充分證明了這些論文研究領域的實用性、前瞻性以及權威性。總體來說,發文數量占優勢的國家或者地區也能夠同時保證其發文的引文影響力。

表1 高被引論文發文數量排名前10位機構分布數據
從中國國內的角度來看,山東科技大學在數學研究領域的發文數量、被引頻次以及引文影響力3個指標都遙遙領先于其他高校,甚至其他國家的高校或者機構。其他上榜的國內高校依次是長沙理工大學、湖州師范學院以及曲阜師范大學,由此可以看出國內理工類及師范類高校特別重視數學領域的研究。從中還可以得出一個結論就是,國內數學領域的科研及人才資源并沒有特別集中于第一梯隊的重點高校,國家也在大力扶持二三線高校及學院在科研上的產出。
圖1是從具體的數學領域研究方向繪制的占比餅圖。從圖1中可以看出,應用數學方向論文占比達到50%,也就是說近十年以來整個世界對于數學領域的研究都集中在其具體的應用層面。占比其次的是理論數學,論文占比達到27%,雖然不及應用數學方向的比例,但也同樣是數學領域的研究重點,因為理論是一切實際應用的基礎。剩余的一些重點方向包括統計概率學、多學科應用以及數學與生物學計算等,表明了數學領域正更多地去和其他學科交叉滲透,相互發展。

圖1 高被引論文研究方向占比
對于數學領域熱點論文,同樣用以上兩種圖表的方式進行分析。近兩個月以來被引頻次較高的論文都集中在中國大陸地區、臺灣地區、埃及等地,說明這些地區是當下世界范圍內數學研究領域的第一梯隊,如表2所示。其中,臺灣地區近期對于數學領域的研究勢頭較為迅猛,發文數量占絕對優勢;其引文影響力及被引頻次也有較大優勢。中國大陸上榜的高校有河南理工大學、山東大學、武漢大學以及西安建筑科技大學4所高校,說明中國大陸目前仍處于數學研究的世界前沿。其中,相比于高被引論文的分布表可以看出,中國大陸的一些高校成為數學研究領域的后起之秀,說明有更多的國內高校在關注數學領域的研究,提升學校的綜合實力。

表2 熱點論文發文數量排名前10位機構分布數據
圖2是熱點論文研究方向占比餅圖。從圖2中可以看出,熱點論文研究方向占比分布和高被引論文基本一致,除了在多學科應用和統計概率學上有微小差別。占主流的研究方向仍然為應用數學,論文占比高達50%。由此可以看出,整個數學領域的研究方向在近十年以來幾乎沒有改變,而且預計今后的很長一段時間都會保持目前的方向特征,即關注于應用類數學方向。

圖2 熱點論文研究方向占比
本文運用VOSviewer軟件從關鍵詞聚類圖以及合作網絡圖兩個方向對數學研究領域發文進行可視化分析。由于在數據條目達到一定量級而生成的聚類或者網絡圖才有實際參考意義,所以本章節只基于高被引論文的原始數據進行研究。
將高被引論文的WoS原始數據(已整理好的純文本文件)導入該軟件中,并選擇作者關鍵詞共現,關鍵詞最低出現次數的閾值設置為5次。最后得到571個關鍵詞滿足篩選條件,其中有557個關鍵詞組成了最大的連接網絡,從而得到高被引論文作者關鍵詞聚類圖(見圖3)。從圖3中可以看出,出現頻率排在前3位的關鍵詞為stability(穩定性)、fixed point(定點)以及chemotaxis(趨化性),分別出現了89次、76次和63次。其實這3個關鍵詞都是數學建模過程中會頻繁用到的3個重要數學概念,與InCites數據庫中分析出的應用數學占比最大的特征保持一致。數學模型與應用數學是相輔相成的,建模的不斷改進也會大力促進數學領域思維的不斷創新[10]。

圖3 高被引論文作者關鍵詞聚類
合作網絡圖的生成過程與聚類圖類似,也是首先導入已整理好的純文本格式的WoS原始數據,待軟件讀取完畢后選擇生成合作作者網絡圖,研究單位規模為國家層面。同時,設置網絡圖中的國家至少有5篇發文的閾值并且同一篇文章的合作國家不超過25個,從而得到64個國家的發文滿足此條件,如圖4所示。

圖4 高被引論文國家合作網絡
從圖4中可以看出,中國作為發文數量最大的國家的同時也是合作網絡廣度最大的國家,與其中的58個國家都有合作發文。合作的國家既有像美國、英國和德國等西方發達國家,也有中東地區大量的發展中國家,其中與美國的合作深度最大,連接權值達到286。由此可以說明中國在數學領域的研究上與世界的合作非常緊密,同時也將重點放在與科研領先的發達國家合作上。總體來說,合作網絡圖中的64個國家都與其他國家有著或多或少的聯系,說明數學領域的研究需要合作與交流,從而達到共同進步的目的,畢竟數學領域上的突破創新會極大帶動人類社會諸多方面的發展。
本文以ESI數學研究領域的高被引論文、熱點論文數據及WoS擴展數據為研究對象,采用InCites及VOSviewer等軟件為可視化研究工具,從發文數量、被引頻次、引文影響力以及作者關鍵詞聚類圖和國家合作網絡圖等多個角度對原始發文數據進行了分析。
在用InCites數據庫分析后發現,近十年的高被引論文主要都集中在發展中國家或地區,其中中國大陸占比排名第1位,而且發文數量和被引頻次及引文影響力基本成正比。研究主要集中在應用數學方向,占比達到50%,說明數學領域對于多學科的應用較為重視。而分析熱點論文后發現,數學研究領域近兩個月以來的頂尖高被引論文也都基本集中在發展中國家或者地區,其中臺灣地區的發文量表現比較突出,印度及中東地區的引文影響力較高。對于研究方向的特征,與高被引論文特征相似,都是集中在應用數學方向,論文占比同樣達到50%。
在用VOSviewer軟件生成作者關鍵詞聚類圖后可以發現,出現頻率最高的三大聚類關鍵詞都與數學模型和數學建模有關,再次說明了應用數學在多學科滲透甚至整個數學領域中的重要地位。而生成國家合作網絡圖可以發現,中國大陸與其他國家的合作最為廣泛,幾乎遍及了世界上最主要的國家或者地區;同時其與美國的聯系最為緊密,也表現出我國對于世界先進科研水平的追求。
本文雖然從多個角度可視化地分析了ESI數學研究領域相關發文的特征,但展現的文獻特點依然有限,希望有興趣的研究人員可以在本文研究成果的基礎上從其他文獻計量學的角度來進行分析,從而獲得對數學科研有價值的信息。
本文中也提到目前中國大陸在數學研究領域發文表現較為突出的機構有山東科技大學和長沙理工大學等高校,希望這些機構可以繼續發揮數學領域的科研優勢,堅持先進的研究方向,培養科研人才并帶動其他科研院所共同提高我國的數學科研水平。