,
現實世界中普遍存在著相互聯系,用網絡的視角考察自然界和社會以及人類思維的方法已經被越來越多的專業認可[1]。通過網絡描述客觀世界起源于1736年德國數學家歐拉(Eular)使用圖論解決哥尼斯堡七橋問題[2]。隨著社會的發展,人們發現自然界和社會活動中存在著越來越多的網絡現象,如果要了解世界,就應該用聯系的視角來看世界,用網絡的方法來分析世界[3]。合作研究是促進科研進步的巨大動力,已成為當今科學研究的重要趨勢,因此在科學研究領域也逐步形成了一種復雜的信息網絡——科學合作網絡。
科學合作網絡是指通過科學文獻相互聯系和影響,來研究某一領域內的科學家之間合作情況的知識網絡[4]??蒲腥藛T的合著論文和科研者本身構成了“科學合作網絡”,其中節點代表科研人員,連接節點的邊代表合著的論文[5]。作者在網絡中的位置和論文影響力可以通過作者合著網絡評價指標(點度中心度、中間中心度、接近中心度和特征向量中心度)來體現[6]。本文通過研究科研合著網絡評價指標與文獻計量學評價指標之間的相關性,來探索作者合著網絡結構與特征,以此發現作者合著網絡節點重要性指標的具體評價意義。
點度中心度是評價節點的指標,由節點的度數(所擁有的連線數量)來反映。一個節點的點度越高,可調用的信息資源就越多,信息資源通達它的速度也就越快,這個節點的中心度也就越高。點度中心度是反映整個網絡的中心化程度的指標,是指把現有網絡的實際點度變異值,除以相同規模的網絡可能出現的最大點度變異值,所得到的比值[7]。
中間中心度是指網絡中所有節點之間的最短途徑中,經過該節點的最短途徑所占的比例,使用中間中心度可以準確找到網絡中對信息流通起關鍵樞紐作用的節點。對于一個網絡來說,可以用中間中心勢來評價網絡中心化程度,就是把該網絡實際中間中心度變異值,除以相同規模的網絡可能出現的最大中間中心度變異值,所得到的比值[8]。
接近中心度是指其他節點數除以該頂點與其他節點的距離之和,反映了節點在網絡中居于中心的程度。對于一個網絡可以用接近中心勢來評價網絡的接近度,就是把現有網絡的實際接近中心度變異值,除以相同規??赡艹霈F的最大接近中心度變異值,所得到的比值[9]。
節點特征向量中心度就是節點與具有高特征向量中心度的節點相連的程度。一個網絡的特征向量中心勢,就是把它的實際特征向量中心度變異值,除以相同規模的網絡可能出現的最大特征向量中心度變異值,所得到的比值[10]。
本研究采用定量分析法,分別選取2014年JCR收錄的醫學、化學、物理學三大領域影響因子最高的頂尖期刊為數據樣本。其中醫學領域期刊是New England Journal of Medicine,Lancet和JAMA-Journal of the American Medical Association;化學領域期刊是Chemical Reviews,Chemical Society Reviews和nature Chemistry;物理領域期刊是Nature Materials,Nature Photonics和advanced Materials。檢索2012-2015年上述三大領域的期刊,檢索時間為2012-01-01至2015-08-27,文獻類型限定為“article” “review”“proceedings paper”[11],分別獲得3 201條、2 713條、3 687條數據。
2.2.1 基礎數據處理
BICOMB是由中國醫科大學醫學情報學教研室的崔雷教授及其團隊研發的書目分析軟件。該軟件能夠準確地提取文獻書目信息,具有文獻計量分析、共現矩陣生成功能,所生成的矩陣可以進一步應用于聚類分析和社會網絡分析等[12]。本研究是利用BICOMB 2.01從原始數據中準確提取作者字段并歸類存儲、統計和生成作者共現矩陣。
2.2.2 構建作者合著網、計算網絡節點屬性指標
UCINET 是目前最普遍的社會網絡分析軟件,它能處理32 767個網絡節點,可進行中心性分析、子群分析、角色分析和基于置換的統計分析等[13]。本利用UCINET 6.186,導入作者共現矩陣數據,繪制出作者合著網絡,并計算三個領域合著網絡各個節點的點度中心度、中間中心度、接近中心度和特征向量中心度。
2.2.3 統計學處理
采用SPSS 19.0版本統計軟件導入分析數據,對數據進行常態檢定后,選擇Spearman秩相關分析,以P<0.01時為差異具有統計學意義。
3.1.1 醫學文獻計量學統計分析
醫學領域期刊共發文3 201篇,涉及35 032位作者,篇均有10.94名作者,其中3 062篇文獻由兩個及以上作者合作完成,合著率高達95.66%。
本研究中,作者發文量是指作者獨著和合著論文的總量,論文被引頻次是指作者參與所有論文的被引頻次之和。醫學領域發文量最多的作者是Murray, Christopher J. L和Bhutta, Zulfiqar A,均參與發表論文24篇;其次是Loscalzo, Joseph,發表論文21篇。論文被引頻次最高的作者是Murray, Christopher J.L,論文被引高達7 310次;其次是Lopez, Alan D和Naghavi, Mohsen,分別被引7 087次和6 549次。作者發文量、論文被引頻次情況詳見表1和表2。

表1 作者發文量統計

表2 作者被引頻次
3.1.2 醫學合著網絡圖譜
醫學領域作者數量龐大。為更好地分析合著網絡中作者之間的聯系得到清晰的圖譜,繪制了發文3篇及以上的2 178位作者的合著圖譜(圖1)。
醫學領域合著網絡圖譜中節點點度中心度最大為2467,最小為0,整個圖的點度中心勢為3.3%;節點中間中心度最大為131935.938,最小為0,圖的中間中心勢為5.46%;圖譜中節點接近中心度最大為473 9329,最小為27 9398,因為本圖為非連通圖,故無法計算圖的接近中心勢;節點特征向量中心度最大為13.455,最小為0,圖的特征向量中心勢為12.21%。

圖1 醫學合著網絡圖譜
3.1.3 醫學網絡評價與文獻計量學評價指標的相關性
通過BICOMB統計醫學領域作者發文量和論文被引情況,運用UCINET Network—centrality分別計算作者合著網絡各個節點的點度中心度、中間中心度、接近中心度和特征向量中心度,利用SPSS19.0軟件分析2 178位作者合著網絡評價指標與作者發文量、論文被引頻次之間的相關性,結果見表3。

表3 醫學網絡評價指標與文獻計量學評價指標的相關性
注:*N=2178;**相關性在0.01水平上顯著(雙尾)
由表3可知,點度中心度、中間中心度、接近中心度和特征向量中心度與發文量之間的Spearman相關系數分別為0.376, 0.44,-0.289, 0.284,顯著性P值均小于0.01,按以P<0.01時為差異具有統計學意義,認為4個網絡指標與發文量具有相關性。其中點度中心度、中間中心度和特征向量中心度與發文量呈正相關關系,接近中心度與發文量呈負相關關系。中間中心度與發文量的相關系數較大,說明這兩者之間的相關性更為顯著。
點度中心度、中間中心度、接近中心度和特征向量中心度與被引頻次之間的Spearman相關系數分別為0.56, 0.241,-0.404, 0.402,顯著性P值均小于0.01,按以P<0.01時為差異具有統計學意義,認為4個網絡指標與被引頻次具有相關性。其中點度中心度、中間中心度和特征向量中心度與被引頻次呈正相關關系,接近中心度與被引頻次呈負相關關系。點度中心度與被引頻次的相關系數最大,說明點度中心度的大小更能反映作者論文被引頻次的高低。
3.2.1 醫學文獻計量學統計分析
化學領域的3種期刊共發文2 713篇文獻,涉及8 971位作者,篇均3.3名作者,其中2 527篇文獻(93.14%)由2個及以上作者合作完成;發文量最多的是Yoon, Juyoung,共參與發表論文12篇;其次是Kim, Jong Seung和Zhang, Hua,發表論文10篇和8篇;作者論文被引頻次最高的是Zhang, Hua,論文被引頻次高達2 363次,其次是Zhou, Hong-Cai和Li, Jian-Rong,被引1 731次和1 706次,詳見表4、表5。

表4 作者發文量統計

表5 作者被引頻次統計
3.2.2 化學合著網絡圖譜
化學領域3種期刊發文2 713篇,共涉及8 971位作者,其中出現頻次在2次及以上的作者有1 226位。運用UCINET繪制出1 226位作者的合著網絡圖譜,具體見圖2。
化學領域合著網絡中節點點度中心度最大為38,最小為0,整個圖的點度中心勢為0.55%;節點中間中心度最大為62542.176,最小為0,圖的中間中心勢為8.22%;節點接近中心度最大為150 0625,最小為72 7181,因為本圖為非連通圖,故無法計算圖的接近中心勢;節點特征向量中心度最大為77.393,最小為0,圖的特征向量中心勢為79.08%。

圖2 化學合著網絡圖譜
3.2.3 化學網絡評價與文獻計量學評價指標相關性
利用SPSS19.0計算出化學領域1 226位合著網絡中點度中心度、中間中心度、接近中心度和特征向量中心度與作者發文量、被引頻次的相關性,結果見表6。

表6 化學網絡評價指標與文獻計量學評價指標的相關性
注:*N=1226;**相關性在0.01水平上顯著(雙尾)
由表6可知,點度中心度、中間中心度、接近中心度和特征向量中心度與發文量、被引頻次之間顯著性P值均小于0.01,按以P<0.01時為差異具有統計學意義,認為4個網絡指標與發文量,被引頻次之間具有相關性。其中點度中心度、中間中心度和特征向量中心度與發文量、被引頻次之間Spearman相關系數均大于0,故這3個網絡評價指標與文獻計量學評價指標呈正相關關系;而接近中心度與文獻計量學的相關系數為負數,這兩大指標之間呈負相關關系。另外,中間中心度與發文量的相關系數為0.405,為相關系數最高值,故說明二者間的相關性最為顯著。作者在合著網絡中的中間中心度越高,在一定程度上反映了作者的發文量越高;點度中心度與被引頻次的相關系數最高為0.230,說明點度中心度與作者被引頻次最相關。
3.3.1 物理文獻計量學統計分析
物理學領域3種期刊共發文3 687篇文獻,涉及18 368位作者,篇均4.98名作者,其中3 645篇文獻(占98.86%)是由兩個及以上作者合作完成,發文量最多的作者是Wang Zhong Lin,共參與發表論文48篇;其次是Jiang Lei和Bazan, Guillermo C,分別發表論文43篇和29篇;作者論文被引頻次最高的是Yang Yang,論文被引頻次高達3 603次;其次是Li Gang和You Jingbi,被引頻次是2 587次和2 007次,具體見表7和表8。
3.3.2 物理合著網絡圖譜
運用UCINET繪制物理領域出現頻次在3次及以上的1845位作者的合著網絡圖譜(圖3)。物理領域作者合著網絡中節點點度中心度最大為242,最小為0,整個圖的點度中心勢為0.75%;節點中間中心度最大為74543.086,最小為0,圖的中間中心勢為4.26%;節點接近中心度最大為340 0336,最小為98 364,因為本圖為非連通圖,故無法計算圖的接近中心勢;節點特征向量中心度最大為85.482,最小為0,圖的特征向量中心勢為86.65%。

表7 作者發文量

表8 作者被引頻次

圖3 物理合著網絡圖譜
3.3.3 物理網絡評價與文獻計量學評價指標相關性
利用SPSS計算出化學領域1845位作者發文量、論文被引頻次與點度中心度、中間中心度、接近中心度和特征向量中心度的相關性,結果見表9。

表9 物理網絡評價指標與文獻計量學評價指標相關性
注:*N=1845;**相關性在0.01水平上顯著(雙尾)
由表9可知,點度中心度、中間中心度、接近中心度和特征向量中心度與發文量、被引頻次之間的顯著性P值均小于0.01,按以P<0.01時為差異具有統計學意義,認為4個網絡指標與兩個文獻計量學指標具有相關性。其中點度中心度、中間中心度和特征向量中心度與發文量、被引頻次呈正相關關系;接近中心度與發文量、被引頻次呈負相關關系。中間中心度與發文量的相關系數較其他指標相關系數大,說明這兩者之間的相關性更為顯著,合著網絡中作者中間中心度越高,反映了作者的發文量越多。點度中心度與被引頻次的相關系數最大,說明點度中心度的大小更能直觀的反映作者論文被引頻次的高低,在一定程度上反映了作者點度中心度越高,其發表的論文被引頻次也會越高。
本文選取醫學、化學和物理影響力最高的期刊數據為研究樣本作橫向對比,相對于《作者合著網絡節點重要性評價指標的屬性研究》[14]一文研究學科覆蓋面更加廣泛,研究結果更具客觀性和普適性。通過相關性分析得出三大領域的研究結果與《作者合著網絡節點重要性評價指標的屬性研究》一文研究具有一致性,即合著網絡中的點度中心度、中間中心度和特征向量中心度三個指標與作者發文量、論文被引頻次呈正相關關系,接近中心度與其呈負相關關系。另外,本文結果還發現中間中心度與作者發文量相關性最為顯著,點度中心度與論文被引頻次最相關。同時本研究認為將合著網絡評價指標與文獻計量學評價指標結合起來使用,可以更全面地評價作者的重要性。
根據本研究的階段性結果,認為在合著網絡中作者中間中心度越高,則作者發文量越多。這種結果的出現是因為作者中間中心度越高。在合著網絡中表現為該作者處于越多作者交往的最短路徑之上,這就增加了與其他作者合作的機會,故其發文量也相應會越高。作者點度中心度越高,則作者論文被引頻次越高,這一結果的出現是因為作者點度中心度越高,在合著網絡中表現為與該作者節點直接相連的鄰居作者數目越多,也就是合作者越多,發文量也會越多,文章被引頻次的機率越高,累積被引頻次也隨之增高。
另外,接近中心度值較高的作者,其發文量和文章被引頻次偏低。因為接近中心度值是指節點到網絡中所有其他節點的最短路徑之和,反映了節點在網絡中居于中心的程度,即作者接近中心度值越低,則到達其他所有作者的距離越短,代表其接近中心性越高,越處于合著網絡中心位置,那么與其他作者越容易發生合作,故該作者的發文量會越高,論文被引率也越高。
本研究得出,作者發文量、被引頻次與合著網絡等各項評價指標具有不同程度的相關性,說明使用相應的合著網絡指標來評價作者的重要性具有一定的可行性。同時文獻計量學與合著網絡指標在評價內容上各有特點,其中發文量主要通過文獻數量來衡量,體現的是作者科研產出的能力;被引頻次屬于引文分析指標,衡量的是文獻質量和文獻影響力。但是自引、引用偏見、錯誤引用等因素會影響被引頻次結果,單純依靠傳統的計量學方法并不能全面評價作者的科研能力。合著網絡評價指標主要用于衡量作者在整個領域的影響力,不僅與發文量、被引頻次有關,還與作者的合作廣度、合作對象的影響力以及作者在網絡中的位置等因素有關。因此,兩大指標評價體系既相關又相異,說明兩種方法可以互相補充、互相結合,為作者影響力評價方法提出了一種新的研究角度,使得作者重要性評價方法更加全面客觀,同時為以后深入探究科研人才的重要性評價提供參考。