文/黑龍江大學信息管理學院 郝志超
社會網絡分析方法在合著網絡中的實證研究
文/黑龍江大學信息管理學院 郝志超
本文選取中國知網期刊數據庫收錄的《圖書情報知識》期刊作為作者合著分析的研究對象,應用社會網絡分析軟件Uc i n e t對作者合著情況進行整體網參數分析、中心性分析及凝聚子群分析,并以可視化技術展示合著網絡。本文通過研究情報學核心期刊,分析作者合著情況,以期促進領域內知識交流與學科發展。
社會網絡分析;合著分析;圖書情報知識
隨著科學技術的發展,科學研究進入全球化時代,合作成為科學研究的主流趨勢。科研合作促進了理論知識產生、凝聚創新思維、提高科研水平和高度,而論文合著即為科研合作中不可或缺的一類。科研者之間通過互相合作發表論文,建立了合著論文網絡,該網絡能較為真實地反映科研合著者的人際網絡,又稱為社會網絡。探尋科研合著者的社會網絡,可以促進學者間的信息交流,促進跨學科領域的發展。
社會網絡分析是對社會網絡中個體之間的關系進行量化研究。EvelienOtte和Ronald Rousseau指出,情報學家之間的合作關系和其他社會相互作用形式通過互聯網構成無標度的社會網絡,在這些研究中,社會網絡分析都可以得到廣泛應用。所以,應用社會網絡分析方法可以較為客觀地反映科研合著者之間的合作關系與交流情況。
(一)數據來源。本文選取中國知網期刊數據庫作為數據源,選取情報學領域核心期刊《圖書情報知識》作為研究對象。在期刊數據庫的高級檢索中,以《圖書情報知識》的ISSN號“1003-2797”進行精確檢索,限定文獻目錄分類為“圖書情報與數字圖書館”,時間范圍為“2012年-2016年”,得到論文396篇。排除卷首語、序言等,剩余有效期刊論文共336篇。
(二)研究工具。本文選擇書目共現分析軟件Bicomb與社會網絡分析軟件Ucinet作為研究工具。書目共現分析軟件Bicomb是由中國醫科大學醫學信息學系開發的用于快速讀取、提取字段并歸類、統計的數據分析工具。利用該軟件可以生成作者合著網絡矩陣。隨后采用社會網絡分析軟件Ucinet對構建的合著網絡矩陣進行中心性分析、凝聚子群分析及核心—邊緣分析。
(三)合著核心作者確定。使用Bicomb軟件進行“作者”字段抽取后,對作者進行頻次統計,即統計作者發文量。經統計,得到所有作者共582名,排除不存在合著關系的作者82位,剩余有效作者500位。文獻計量學學者普賴斯提出:一個主題下的論文,半數是由高產作者完成的。高產作者最低發文量M=0.749√N。其中N為該領域作者最高發文量。2012年到2016年間,《圖書情報知識》發文量最多的作者為曹樹金,發文數量為7篇。高產作者最低發文量M=0.749√N=0.749×√7≈1.981。按照取整原則,發文量為2篇及2篇以上的作者即為該期刊近五年的核心作者。使用普賴斯定律計算出的期刊核心作者共有85名。
(一)整體網絡參數。網絡密度用于衡量成員之間的關系緊密程度,整體網密度越大,表明網絡成員之間的聯系越緊密,該網絡對行動者的態度、行為等產生的影響就越大。聯系緊密的整體網可以為成員提供各種社會資源。經軟件計算,期刊作者合著網絡整體密度可算出為0.0057。這說明該網絡是一個極為稀疏的網絡,各個作者之間的聯系較少,不利于資源的傳播與交流。網絡平均距離是整體網絡中任意兩個節點之間距離的平均值,反映的是網絡的信息暢通程度。經計算,期刊作者合著網絡的平均距離為2.545。這表明任意兩個作者之間平均通過2.545個人可以互相建立聯系。聚類系數是指與某個節點相連的節點之間互相連接的可能性。聚類系數衡量的是網絡內存在的小團體的普遍程度。經計算,合著作者聚類系數為0.958。小世界網絡的評判標準是平均距離小于10,聚類系數大于0.1。這兩項數據證實了《圖書情報知識》合著作者網絡存在小世界現象。綜合來說,該期刊合著作者的網絡密度較低,但聚類系數較高,說明該期刊合著作者網絡內存在一部分小團體,且這些小團體成員之間相互熟悉,凝聚性較強,合著關系較多。
(二)點度中心性分析。網絡中一個點的點度中心性,可以用網絡中與該點有直接聯系的點的數目來衡量。如果一個點的點度中心性越高,即表明與其直接相連的點數越多。點度中心性是用來衡量誰是整個團隊中最主要的核心人物。在合著分析中,如果某位作者的點度中心性越高,說明他在整個作者群體中的地位越高,擁有的較高傳播信息與知識的能力。經計算得出,點度中心性最高的是曹樹金,其絕對中心度是22。說明,曹樹金與矩陣中其他22位作者存在合著關系。絕對中心度較高的作者有鄧勝利、陳曉宇、夏立新、冉從敬等。從結果中看出,點度中心性與發文量排名并不是呈正比關系。點度中心性數值位于前列的多是發文量在10名之后的作者,這說明發文量略低的作者更加注重團隊合作。絕對中心度最低值為1,且絕對中心度為1的作者有180位,占全部作者的36%。而絕對中心度數值為4以上的作者有98位,占全部作者的19.6%。
(三)凝聚子群分析:K-叢與n-派系。凝聚子群是指一個大的網絡中存在的子網絡。對凝聚子群進行研究,可以了解子網絡對整體網絡起到的作用。網絡分析者給出一系列算法,用來分析網絡的整體結構如何由子群結構,如:K-叢,K-核、n-派系,n-宗派、密度等。每個點都至少與除了K個點之外的其他點直接相連的子群即為K-叢。如果一個凝聚子群的規模為n,那么只有當該子群中的任何點的度數都不小于(n-k)這個值的時候,才稱之為K-叢。一個子圖中,任何兩點之間在總圖中的距離(即捷徑距離)最大不超過n的子圖稱之為n-派系。在K-叢分析時設定K值為2,最小子群規模為3;N-派系分析時設定N值為2,最小子群規模為3。

表1.K-叢和N-派系分析結果
從表中可以看出,2-叢和2-派分析中子群數都比較多,說明整個合著網絡中小團體數量較多。最小規模的子群數占比都較高,分別占總子群數的87.5%和39.5%,說明大部分作者的合作范圍有限,他們擁有的學術資源較少。從子群成員看,曹樹金、邱均平、肖希明、趙蓉英等發文量較高的作者同時屬于多個子群,同時表明他們擁有較多的學術資源,且處于網絡中較為核心的“中介”位置。這樣的小團體分布使學術資源較少的作者處于劣勢地位,不利于信息、知識的傳播與交流,甚至可能阻礙學科的發展。
(四)結果可視化。論文作者合著研究所形成的網絡具有復雜性網絡的特性,這種特性可以通過交互性、多維性和可視性的可視化技術生動形象地表現出來。運用Ucinet自帶的軟件Netdraw,可對作者合著網絡進行可視化分析(如圖1)。

圖1. 《圖書情報知識》期刊核心作者合著網絡
圖1是根據普賴斯定律構建的期刊核心作者合著網絡圖。在Netdraw中清除不存在合著關系的節點,進行成分分析后,對節點進行顏色和形狀的標注,可以清晰地看出作者群中存在的小團體和核心作者的規模。從圖中可以明顯地看出,核心作者群中存在較大規模的小團體有3個,即灰色(鄧勝利、陳曉宇等)、紅色(曹樹金、夏立新等)和藍色(邱均平、趙蓉英等)。而節點形狀的大小代表作者發文量的數量。在整個網絡圖中,曹樹金紅色節點所占面積最大,代表他的發文量最多。
本文構建了《圖書情報知識》期刊作者合著網絡,對網絡的整體參數、中心性、凝聚子群及核心—邊緣結構進行了分析研究。總的來說,該期刊作者合著網絡是一個較為稀疏的網絡,很多作者之間的聯系并不密切;只有極少數核心作者擁有較多的學術資源與影響力,大多數作者缺乏資源或缺乏建立聯系的途徑;小團體規模較小且數量較多,且小團體成員多屬于同一高校或機構,造成了學術知識的分布不均與差異,這樣的環境不利于整體網與個體網的發展,不利于知識與信息的傳播與共享,甚至會阻礙學科的發展。
社會網絡分析方法為研究作者合著提供了很好的視角,但本文僅選取一種期刊作為研究對象,研究結論具有較大局限性,在反映情報學作者合著真實情況上存在一定差距。針對該問題,應采用更加全面具體的數據進行研究,以得到更加真實可靠的結論。
[1]榮先乾,覃桃.社會網絡分析方法在圖情領域合著關系的實證研究[J].圖書館界,2010(1):1-5.
[2]羅家德.社會網絡分析講義[M].北京:社會科學文獻出版社,2005.
[3]EvelienOtte,Ronald Rousseau,Social Network Analysis:A Powerful Strat-Egy,Also for the Information Science[J].Journal of Information Science,2002,28(6):441-453.
[4]姜春林,張帆,唐悅.我國部分科學學期刊共被引網絡特征研究[J].情報雜志,2010,29(4):10-15.
[5]丁學東.文獻計量學基礎[M].北京:北京大學出版社,1992.
[6]溫芳芳.基于社會網絡分析的中外圖書館學合作模式比較研究[J].國家圖書館學刊,2014(1):76-83.
[7]Valverde S.etc.Scale-free networks from optimal design[J], Europhysics Letters,2011(60):512-517.
[8]李亮,朱慶華.社會網絡分析方法在合著分析中的實證研究[J].情報科學,2008,26(4):549-555.
[9]張洋,劉錦源.基于SNA的我國競爭情報領域論文合著網絡研究[J].圖書情報工作,2012(2):87-94.
[10]袁潤,王慧.基于社會網絡分析的圖書館學論文合著現象研究[J].圖書情報研究,2010(3):37-40.