陳麗偉 郭強 劉建國





摘要:分析組織內的科研合作網絡對于了解學科現狀,優化學科發展等學科管理具有重要意義。本文收集了某科研單位的論文發表信息,以三千余位科研工作者為節點,合作關系為邊,構建科研合作網絡。結合作者的年齡、職稱等信息,使用社會網絡分析等方法對該單位內的合作情況進行了分析。實證數據發現科研合作網絡中高科研產出者一定有多個合作者;不同年齡段科研人員的度和集聚系數表現出不同的合作形式;職稱越高,科研合作形式越單一。
關鍵詞:科研合作網;社會網絡分析;時間演化
引言
隨著知識經濟時代的到來及科學技術的全球化發展,科研合作(Scientific Research Collaboration)已成為當今科學發展的重要動力[1]。按照合作的一般定義,科研合作就是科學工作者為達到生產新的科學知識這一共同目的或實現各自的科研目標而進行的協同創新的科學活動。
科研人員間的論文合作關系是一種社會關系,所構成的合作網絡則是一種具有代表性的復雜社會關系網絡。關于科研合作網絡,國外已經有很多研究,其中較為全面的是Newman。他收集了物理學、生物醫學、計算機科學三個學科的科研論文并建立科研合作網絡,分析了合作網絡的統計特性,包括作者發表論文量、平均每篇論文的作者數、作者的合作人數、派系的存在及大小、聚集性。在此基礎上,Newman發現科研合作網絡既有小世界網絡的特性,又有無標度網絡的特性。2004年Newman又從論文數量分布規律、合作人數分布規律、網絡節點的平均距離等方面來研究合作網絡。在國內,也有很多學者進行科研合作網絡的研究。劉云等對一個權威的國際科技檢索系統統計發現,至上個世紀90年代,該檢索系統收錄的科研論文中,各國不同機構間的合著文章數增長了46%,跨國合作的文章數增加了115%。通過對科研合作網絡結構特性的研究與統計,對科研合作整體狀態的明確、科研人員角色與位置的識別和人員之間關系的刻畫有著積極作用。劉杰等通過對一個小型科研合作網絡的分析,發現其也具有類似許多大型合作關系網絡所具有的網絡特性。李進[10]等以一個專業期刊為樣本利用社會網絡分析方法對作者科研合作影響進行分析。結果顯示,具有較大影響力的科學家作為合作網絡的中心節點,可以帶動科研機構間的學術交流,促進科研工作的發展。郭崇慧等收集重點大學的合著論文,運用復雜網絡與社會網絡分析方法,從整體、個體和社區三個方面分別對國內和國際期刊校際科研合作網絡進行分析,分別得到國內期刊和國外期刊是以某幾所高校為核心的社區。龐秀麗等基于社會網絡的分析方法,從教師合著網絡的個性屬性及整體屬性兩方面分析研究了某大學一個學院教師論文合著特點,給出優化科研團隊建設的建議。張心悅等采用社會網絡分析方法,對中國科研機構國際合作網絡的時間演化問題進行了分析,揭示了中國科研機構在創新管理領域的國際合作的發展規律及運行狀態。周建林等通過構建有向科研合作網絡,將社會網絡分析方法和節點重要性度量方法相結合來識別復雜系統領域內有科研潛力的年輕學者和廣受歡迎的權威學者等重要節點。
本文沿用社會網絡分析方法,從科研論文中作者合著這一角度來研究科研合作關系,運用Pajek軟件構建作者科研合作網絡。不僅分析了網絡的結構特性,還從網絡結構的時間演化探索該科研單位的合作情況。利用集聚系數指標本身的特征優勢,本文考察了教師年齡與度和集聚系數的關系,以及職稱與集聚系數的關系。從集聚系數的角度出發,為科研合作網絡分析提供了新的思路,給組織內科研人員的合作提供建議。
1、網絡構建及其結構特性
1.1數據獲取與網絡構建
本文收集某科研單位在期刊及會議上發表文章的作者、作者單位等信息,以中國期刊全文數據庫(CNKI)作為數據檢索平臺,對該單位2013-2017年共計5年的論文分別進行檢索收集。整個數據集包含2013年至2017年五年間3099位研究人員,4002篇科研論文,將數據導入Gephi軟件,繪制五年科研合作網絡圖(如圖1所示)。將每個科研人員用網絡中的一個節點表示,合作過文章的兩人之間存在一條連邊,連邊權重取決于兩人合作文章的數量,以連邊粗細表示。作者度的大小用表示該作者節點的顏色和大小表示。作者度越大,則節點顏色越深,尺寸越大。本文在構建科研合作網絡時,并不考慮時間范圍內沒有發表論文的科研人員,以防止產生孤立節點。另外,為保護科研人員隱私,本文在數據預處理過程中將所有科研人員進行匿名化處理并統一編號。
1.2度和文章數的分布特性
在科研合作中,一個作者可能與多個科研工作者合作,但沒有高產出(本文僅以論文數認定科研產出),有高產出的作者未必有多個合作者。其中任何一種情況都不能凸顯作者在科研合作的地位。度,指的是一個節點在網絡中與其他節點聯系的數目,是刻畫單個節點屬性最簡單又最重要的概念之一。科研合作關系網絡中一個節點的度可以定義為與某一科研人員對應的節點相連的節點數目,節點度越大意味著與該節點相對應的科研主體合作所發表的研究成果數量越多,該科研主體在關系網絡中的地位越重要。本文將節點度數和全部節點個人所發文章數分別放入雙對數坐標中得到如圖2所示。從圖中可以看到,圖2 (a)節點度數與作者數(即節點數)在雙對數坐標圖中呈冪率遞減,說明整個合作網的度分布呈現無標度網絡特征,且發文數和度數的分布局部可以取得較好的擬合效果,擬合斜率分別為-1.86和-1.65,擬合誤差分別為0.091和0.078。這表明在科研合作中,與作者合作發文的人數和其發文章數目成正比,即高產出作者必有多個合作者。
2、網絡結構的時間演化分析
科研合作網絡是高度動態的,網絡中的節點和邊隨著研究人員的加入以及合作關系的建立不斷增長和變化。網絡結構的時間演化分析能夠幫助我們深入理解網絡的特性,進而構建演化模型,捕捉其形成機制,并模仿真實網絡行為。
表1中,,,r,N分別代表各年子網絡的平均度,平均集聚系數,平均路徑長度,度相關系數以及子網絡數目。由表1可知,各年平均度、集聚系數及子網絡數目相對穩定。平均路徑長度[6]為網絡中任意兩個節點之間距離的平均值,其實質是網絡傳遞所需要經過中間節點的平均個數,反映了網絡的全局性質。平均路徑長度小,說明網絡的易達性好,網絡運行效率高。在科研合作網絡中,平均路徑長度是連接網絡內兩個作者之間最短關系鏈中作者的平均人數。從表中可以看出,2013年至2015年任意兩個作者建立關系平均需要3.5步,2016、2017年則平均需要5.5步。這表明2013年至2015年網絡聯系較2016年和2017年更緊密。度相關性也即同配性,是為了度量網絡中不同的度的節點間的合作狀況。從一般的角度看,同配就是指屬性相近的節點傾向于互相連接。科研合作網絡中的屬性指的是節點的度。一個網絡中的同配系數r∈[一1,1]。如果r >0,則網絡是同配的;如果網絡r<0,則網絡是異配的。丨r丨的大小反應了網絡同配或異配的強弱程度。從這些數值我們看出,網絡整體是異配的,但是異配的強度較弱。觀察網絡圖可知,因為大量的子網絡節點數不多,圖形簡單且往往呈現星形結構,加之網絡中存在為數不少的“兩點一線”結構。前面一種呈現出異配性,后面一種則呈中性,同配系數為O,大量此類結構使得網絡呈現出弱異配性。
3、年齡職稱與集聚系數
網絡中節點的集聚系數可以反映節點鄰居間的緊密程度,科研合作網絡中節點的集聚系數能夠解釋科研人員相互之間的合作形式。基于集聚系數的特征,我們考察了教師的年齡與度及集聚系數的關系。其中教師的年齡與度的分布圖如圖3 (a)所示,明顯看出年齡處于30歲至55歲之間的教師,他們的度即合作人數大多數小于20,但度最大的教師處于該年齡階段;而年齡處于55歲以上的教師人數較少,他們的度多分布在0到40之間,分布較為分散。教師年齡與集聚系數的分布圖如圖3 (b)所示,明顯地,年齡在30歲到50歲之間的教師均可對應不同的集聚系數,系數值的變化范圍從0到1逐漸向下收緊,表明他們在網絡中的合作結構多樣,既有典型的師生兩兩合作,也有師生多人合作情況。而且集聚系數為1的教師均處于該年齡階段。有趣的是作者年齡在55歲以上的集聚系數均趨近于O,這從另一方面反映該年齡段的教師更加傾向于和自己的學生分別合作發表文章。
另外,我們又考察了職稱與集聚系數的關系。如圖4所示,職稱為講師、副教授和教授分別對應不同的集聚系數范圍。講師的集聚系數較為均勻地分布在0至0.4之間,副教授的集聚系數則集中在0至0.2之間,教授的集聚系數會更加集中在0至0.1之間。職稱越高,集聚系數分布越集中,且數值越小。顯然,教授更愿意和不同的人分別合作從事科研活動,也可以這么說,大多數人更愿意和擁有教授職稱的人一起實踐科研過程。職稱越高,科研合作形式越單一,猜測是因為更加享受科研過程而不是結果。
4、總結與展望
本文以社會網絡分析方法為基礎,不僅分析了網絡的結構特性,還從網絡結構的時間演化和部分節點的個體分析以及教師年齡與度和集聚系數的關系等多個角度出發,對一個具有培養研究生資質的科研單位科研合作狀況做了考察得出以下結論:在科研合作中,科研產量高的作者必有多個合作者。由度、集聚系數與教師年齡分布圖可知,年齡處于30歲至55歲的教師合作人數大多小于20,且集聚系數均對應不同的值,表明他們在網絡中的合作結構較為多樣;而年齡大于55歲的教師合作人數較為分散,大多分布于0到40之間,有趣的是他們的集聚系數均趨近于O,表明該年齡段的教師更傾向于和自己的學生分別合作發表文章。集聚系數與教師職稱分布圖可知,職稱越高,科研合作形式越單一,猜測是因為更加享受科研過程而不是結果。
本文對網絡結構的時間演化只是做了趨勢分析,沒有建立演化模型來模擬合作的產生以及預測未來的合作關系,接下來的工作將會圍繞這兩方面展開。由于署名和單位表達多元的原因,并未對SCI的文章進行統計,雖不影響整體結論,但一定程度上影響了結論的精確度,在后續的文章中將逐步完善。
參考文獻:
[1] Price D J, Solla D. Little Science, Big Science [M].New York: Columbia University Press, 1963.
[2] Newman M E J. Newman, M. E. J. Scientific collaboration networks. I. Network construction and fundamental results. Phys. Rev. E 64, 016131[J]. Physical Review E, 2001, 64(1 Pt 2):016131.
[3] Newman M E. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality[J].Physical Review E Statistical Nonlinear & Soft Matter Physics, 2001, 64(2):016132. Newman M E. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality[J].Physical Review E Statistical Nonlinear & Soft Matter Physics, 2001, 64(2):016132.
[4] Newman M E J. Who is the best connected scientist?A study of scientific coauthorship networks. Complex Networks: Lecture Notes in Physics, 2004, 650(1) :337-370.
[5]劉云,常青.中國基礎研究國際合作的科學計量測度與評價[J].管理科學學報,2001(1):37-47
[6]汪小帆,李翔,陳關榮《網絡科學導論》[M].北京:高等教育出版社,2012.4
[7] Wasserman S.Social network analysis: Methods and applications [M].Cambridge University press, 1994.
[8]岳天強,岳增慧.高校科研合作網絡結構研究[J].農業圖書情報學刊,2013,25(11):5一10.
[9]劉杰,陸君安.一個小型科研合作復雜網絡及其分析[J].復雜系統與復雜性科學,2004,1(3):56-61.
[10]李進,劉瑞璟,于偉,等.作者科研合作網絡構建及影響分析——以《復雜系統與復雜性科學》期刊為例[J].復雜系統與復雜性科學,2014,11(3):86-93.
[11]郭崇慧,王佳嘉.“985工程”高校校際科研合作網絡研究[J].科研管理,2013,34(S1):211-220.
[12]龐秀麗,姜維,李媛,等.某大學經管學院合著網絡構建與分析[J].黑龍江大學自然科學學報,2013(5):582-588
[13]張心悅,宋偉,宋曉燕.我國科研機構國際合作網絡的演化分析——以SCI 中創新管理領域的科技論文為例[J].中國高校科技,2015(7):12-17.
[14] Zhou J, Zeng A,Fan Y,et al. Identifying important scholars via directed scientific collaboration networks[J]. Scientometrics, 2018, 114(3): 1327-1343.