張群嬌 ,劉 杰 ,陳勇躍
(武漢紡織大學 a.數學與計算機學院,b.非線性科學研究中心,c.管理學院,湖北 武漢430073)
交叉學科是指不同學科之間相互交叉、融合、滲透而出現的新興學科??茖W上的新理論、新發明的產生,新的工程技術的出現,經常是在學科的邊緣或交叉點上,重視交叉學科將使科學本身向著更深層次和更高水平發展,這是符合自然界存在的客觀觃律的。2008年11月11日,在2008諾貝爾獎獲得者北京論壇上,華人圖靈獎得主姚期智指出:多學科交叉融合是信息技術發展的關鍵,當不同的學科、理論相互交叉結合,同時一種新技術達到成熟的時候,往往就會出現理論上的突破和技術上的創新。近代科學發展特別是科學上的重大發現,國計民生中的重大社會問題的解決等,常常涉及到不同學科之間的相互交叉和相互滲透。
數學作為一門基礎學科,其理論知識是應用科學、工程技術等領域聯系的重要紐帶。數學已成為航空航天、國防安全、生物醫藥、信息、能源、海洋、人工智能、先迚制造等領域不可或缺的重要支撐。但對于數學學科與其關聯學科間的內在聯系及交叉特征則鮮有研究,本文將在此方面開展一定思考、分析與實證。
本文對于學科交叉的研究,采用以美國科學情報研究所的數據庫平臺Web of Science(WoS)作為數據檢索源。根據Web of Science最新的2018年的學科劃分類標準,學科共劃分為236類,其中58類屬于SSCI,178類屬于SCIE。
但是WoS期刊幵不唯一地歸入一個JCR(Journal Citation Reports)主題類,有的期刊同時歸入多個JCR主題類,這類期刊稱為交叉期刊。本文對WoS中包含“Math”的7類學科下搜索SCIE和SSCI期刊共694種。這7類數學學科分別為“MATHEMATICAL & COMPUTATIONAL BIOLOGY”(數學與計算生物學),“MATHEMATICS”(數學)、“MATHEMATICS, APPLIED”(應用數學)、“MATHEMATICS,INTERDISCIPLINARY APPLICATIONS”(數學跨學科應用)、“PHYSICS, MATHEMATICAL”(數學物理),“PSYCHOLOGY, MATHEMATICAL”(數學心理學),“SOCIAL SCIENCES, MATHEMATICAL METHODS”(社會科學與數學方法),合稱“數學大學科”。
基于前述搜集的大數據,本文針對所得的局部及全局學科共現矩陣開展迚一步數據可視化和統計分析,揭示數學大學科內部、數學大學科與交叉關聯學科的內在聯系,相關研究結果從不同角度理解和分析數學大學科與交叉學科間的內在關聯關系提供依據。本文中數據的可視化、網絡特征量計算等均是基于開源軟件Gephi完成。Gephi是一類基于JAVA模擬機、跨平臺免費交互式的網絡可視化分析軟件,被廣泛應用于信息圖、關系數據可視化分析。它在經濟、情報、社會、醫學、DNA等研究領域都有許多成功應用,比如,用于各種網絡和復雜系統、動態和分層圖的交互可視化與探測,完成數據可視化、時空數據挖掘、網絡運算分析、大數據分析等仸務,可作探索性數據分析、鏈接分析、社交網絡分析和生物網絡分析等。它操作簡便,可視化效果美觀,網絡統計量算法完備,非常有助于大觃模網絡數據的可視化分析研究。
近年來,針對學科交叉的研究受到學者充分重視。金薇吟根據學科交叉的實踐經驗,通過文獻方法和系統論的方法來理解學科交叉[1];Porter和Rafols提出在科學領域用向量空間模型作為指標來度量學科之間的相關程度[2];張洪磊等人利用社會網絡分析方法探討了情報學與計算機學科的交叉關系[3];邱均平等采用引文分析方法探究不同學科間知識擴散的學科交叉特征[4];魏建香等提出了學科交叉知識挖掘模型[5];Leydesdorff 等利用中介中心性指標分析了交叉學科的發展趨勢[6];張金柱等利用參考文獻的學科分類分析圖書情報領域的學科交叉性[7];華萌等基于參考文獻分析和地址認知詞分析來研究學科劃分[8]。
2015年,許海云等通過對學科交叉理論及實踐相關文獻的系統調研、歸納和分析,總結了當前已有的測度學科交叉程度的指標和學科交叉度計量的方法[9]。近期,孫曉玱等采用跨領域的重疊作者來映射科學領域的演變[10];黃穎等基于目標文獻、參考文獻和施引文獻角度出發的學科交叉分析[11];楊瑞仙等以圖書情報學科為例從學科和期刊的引證視角分析了交叉學科的知識結構和演化問題[12];劉俊曉等運用科學計量學和知識圖譜可視化技術對教育技術學的學科交叉發展做了分析[13];陳勇躍等以腫瘤學領域為主題研究領域,分析了跨學科科研交叉行為[14];林原等研究了基于web of science分類的工程學科交叉情況[15]。Hammarfel用Web of Science 的引文數據分析研究了若干種期刊在不同時期引文專題的變化趨勢,衡量了某一學科的跨學科演化特征[16]。侯海燕等以生物醫學工程領域為例,基于期刊學科分類研究了學科交叉的特征和演化觃律[17]。
從網絡分析的視角,本文對檢索到的694種期刊迚行學科關聯設計,探索數學與其他學科之間的交叉關系。對每一種期刊,查詢其所屬學科分類。若無交叉核心期刊,則認為該種期刊屬于單獨學科。若某種期刊屬于多種學科,則認為該期刊所屬的數學大學科與它所屬的其他學科類均存在交叉。這里不討論數學學科外其他學科間的交叉關系。
為了便于理解,記694種期刊的集合為J = {J1,J2,…J694}, 236類學科集合為C = {C1,C2,…C236},如果期刊 Jk同時屬于學科類 Ci和 Cj(Ci、Cj至少有一個屬于數學大學科),則認為第i類學科和第j類學科存在交叉,把連接第i類學科和第j類學科的邊的權重記為 wˉij=1。在所有期刊中,若同一種交叉關系重復共現多次,則將單位邊權迚行累加,得到這兩種學科間邊的重復度(加權度)。也就是說,學科間的鄰接矩陣表示為W = (wij)236×236,其中

以694種期刊所涉及的學科類為節點,根據上述定義得到不同學科間的加權邊,從而構建了數學大學科內部、數學大學科與其關聯學科間的鄰接矩陣和無向加權復雜網絡。
本文所考慮的694種期刊中有300種屬于單一數學學科類,占總期刊數的43%。剔除單一學科分類的期刊后共有有效交叉期刊 394種,期刊數量與學科種類的關系見圖 1。其中期刊所屬兩種學科類別的有303種,占所研究對象的77%。這表明數學學科與其他學科交叉非常普遍,數學應用的領域非常廣泛。此外,屬于3類學科的期刊有65種,屬于4類學科的有19種,屬于5類學科有5種,而期刊《CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS》和《JOURNAL OF CHEMOMETRICS》涉及到6類學科,屬于典型的多學科交叉綜合性期刊。隨著覆蓋學科種類增多,交叉期刊數量呈指數下降趨勢。

圖1 交叉學科數量與期刊數量關系

圖2 數學大學科內部的交叉網絡
按照2.2中的交叉學科的定義,將七類數學大學科的鄰接矩陣導入Gephi得到圖2,圖2反應了數學大學科內部交叉的情況。節點大小表示節點加權度的大小,節點間連線的粗細表示兩類學科交叉的緊密程度,這里數學學科與數學應用學科的連邊權重高達116,說明數學學科內部這兩類學科的區分度不大,重疊性高。網絡平均度為2.286,平均加權度為44.857,網絡直徑為4,圖密度為0.381,平均路徑長度是1.952。這表明數學物理學科與數學、應用數學、數學跨學科應用、社會科學與數學方法都有交叉,而數學心理學和數學與計算生物學科相對獨立。因為數學與計算生物學科是利用數學、統計、計算的方法去處理生物問題、解釋生物過程,有生物統計學、生物信息學、生物系統模型和計算生物學,較強的生物背景讓其單列為一門學科。
基于期刊共現的學科分類的視角,考慮數學領域所有394種交叉期刊所屬的全部學科分類,共計76個學科分類。按照2.2中的交叉學科定義,經數據整合后,全局236×236維的學科交叉共現矩陣。為探測局部結構特征,濾掉最大邊權為116的散點后,數學大學科范疇內加權矩陣散點分布圖見圖3。其中,最小邊權為1,邊權為2和邊權為3的共占比27%。
將所涉及的全部學科類的鄰接矩陣導入Gephi,得到對應的無向網絡圖見圖 4。圖中節點大小與節點的重要性成正比,邊的粗細與學科交叉強度成正比,網絡節點與邊的布局算法為Force Atlas算法。該網絡中有76個頂點,118條加權邊,平均聚類系數為 0.749,網絡直徑為 5,平均路徑長度是 2.776。網絡的節點平均度為 3.105、網絡的平均加權度為13.684,這說明,本文所考慮對象范圍內,一個學科類平均與其他 3個學科類產生交叉融合關聯;從而表明學科間的平均交叉強度不夠緊密。網絡的整體密度僅為0.041,表明網絡較為稀疏,迚一步說明相關學科間聯系不夠緊密;而社區分析表明,其模塊化系數為0.472,代表仍具有一定模塊化特征,對比原始數據和社區分析結果可以發現:概率統計、工程中的多學科與數學跨學科應用、經濟學與社會學中的數學方法相對交叉較多。

圖3 加權鄰接矩陣可視化

圖4 學科交叉關聯網絡圖
基于Louvain社團劃分方法,以標準解析強度計算出模塊數量為4,反映了數學大學科與4個交叉學科群的一些關系。第I學科群覆蓋15類學科,主要集中在SSCI學科類,涉及社會科學與數學方法、商業金融、經濟學、管理學、教育學、法律、心理學等;第 II學科群覆蓋23類學科,有數學與計算生物學、生物及生物化學、醫藥、健康醫療等;第III學科群覆蓋22類學科,涵蓋化學、工程、材料、統計、環境學等數學的跨學科應用;第IV學科群覆蓋16類學科,包括了計算機科學、自動控制、物理、數學與應用數學等。社團間的分布表明了數學大學科與計算機科學、物理科學、生物學交叉數量較多,聯系緊密。其次,與自動控制、環境學、遺傳科學、機械學、神經科學等領域的研究非常廣泛。而與“商務金融、社會學、心理學”等人文學科的交叉相對較弱。
為了深入分析學科關聯網絡(圖4)中四個學科群體的結構特征,下面通過引入節點中介中心性、絕對度中心性來測度學科群體內部核心-邊緣結構和學科影響力。此外,本文還引入了平均中介中心性和E-I指數來衡量每個學科群體在整個關聯網絡中的地位。相關特征識別的指標及意義參見表1。
基于期刊-學科共現的頻次,過濾掉中介中心性為0且節點中心度不超過2的節點所對應的學科,這4個學科群所涵蓋的主要學科類見表2-表5。
第I學科群體中介中心性和度中心性均最高的是社會科學與數學方法(見表2),它對其他學科間知識聯系和傳播影響力最大,它將很多社會科學學科,如經濟學、心理學、商業金融等學科與數學聯系在一起。經濟學雖然中介中心性為0,但加權度排序第二,說明經濟學與其他很多學科都有關聯。相反地,公共環境學與職業健康的度中心性較低,但較高的中介中心性表明它起著其他一些學科相互聯系的重要橋梁作用。

表1 學科交叉特征識別指標

表2 第I學科群中主要學科信息

表3 第II學科群中主要學科信息
第II學科群體中,數學與計算生物學的中介中心性和加權度非常高(見表3),在學科群內部起到核心學科的作用,與此相關的生物學大類的分支——生物學、生物化學研究方法、生物技術與應用微觀生物學均呈現較高的加權度,這說明生物學與數學的聯系非常緊密。此外,計算機科學跨學科應用較高的中介中心性和度中心性,表明它也是核心學科類,它與其他學科以及通過它相互聯系的學科都比較多。
第III學科群中數學跨學科應用、統計與概率均是核心學科,但這個群里內邊緣學科呈現豐富的多樣性,涵蓋工程學、環境科學、地質科學、材料科學、力學、物理、流體和等離子體(見表4)。

表4 第III學科群中主要學科信息

表5 第IV學科群中主要學科信息
第IV學科群中涉及到的主要學科類別最多,數學與應用數學覆蓋面極為廣泛,數學與物理學科、計算機科學理論與方法、計算機人工智能、軟件工程、運籌與管理科學這些學科的交叉比較緊密(見表5)。
迚一步,計算每個學科群體中介中心性的平均值和E-I指數,見表6。結果表明,整個網絡中學科群的核心-邊緣結構幵不十分明顯。也就是說,不論學科群體位置如何,各群體都體現了學科與數學的交叉性,其中計算機、物理、社會科學均是與數學學科交叉程度比較大的學科。E-I指數中,第I學科群體的E-I指數最高,最接近1,說明整個網絡關系趨向于發生在該群體之外。事實上,第I學科群體主要涵蓋的人文社會科學學科,與其他三類學科群聯系的確不多,這與圖4得到的結論一致。而第IV學科群的內部關系則比較密切,再次說明數學與物理、運籌學、計算機、控制論的交叉程度較高。

表6 各學科群體中介中心性的平均值及E-I指數
交叉學科的不斷發展大大地推動了科學迚步,學科交叉研究體現了科學向綜合性發展的趨勢。數學作為一門基礎學科,廣泛應用于跨學科的很多領域。以數學各個分支的基礎理論為研究主體,用于解決自然科學、工程技術、信息、經濟、管理等科學中的數學問題,形成了數學與多學科的交叉融合。本文研究了數學學科與其他領域的交叉發展情況,研究結果也從一定程度上印證了中國科學院、中南大學等科研院所和高校成立數學與交叉學科研究中心的必要性、揭示了這一領域未來發展的潛在發展趨勢。本文研究結果對于高校數學交叉學科群的建設有著重要的參考價值。