宋艷輝,孫玉坤
隨著科技發展,知識領域普遍出現交叉與融合趨勢。我國計量學領域逐漸由“三計學”向“五計學”方向發展,2018年國家社科基金“‘五計學’的融合與圖書情報學方法創新研究”立項,表明學術界對“五計學”普遍認可[1]。“五計學”主要內容包括文獻計量學(Bibliometrics)、科學計量學(Scientometrics)、信息計量學(Informetrics)、網絡計量學(Webometrics)和知識計量學(Knowledge metrics)。當今科學研究領域的合作越來越普遍,合作共贏意識越來越強。五計學的作者合作關系包括顯性作者合作和隱性作者合作。本文篩選出核心合作作者,利用社會網絡分析法對該領域的顯性合作關系作者進行分析,再對作者進行因子分析,挖掘我國“五計學”的作者潛在合作關系,探析作者之間的合作交流狀況,為我國“五計學”發展提供參考。
本文數據樣本選取于CNKI,檢索時間為2018年9月28日,選擇檢索主題=“文獻計量學”and“科學計量學”and“信息計量學”and“網絡計量學”and“知識計量學”,共獲得9096條數據記錄。對檢索所得數據進行人工篩選處理,刪除重復文獻、會議紀要、投稿指南、綜述、述評等,最終得到9065 條論文數據,根據合作率=(一定時期內相關文獻)合作論文數/(一定時期內相關文獻)論文總數[2],計算得到我國五計學領域合作率為23.68%。五計學領域作者共3787位。由于作者人數多,整體合作網絡非常復雜,為了有針對性地分析,需要提取核心作者合作群[3]。
發文量是衡量作者學術水平和科研能力的重要指標,因此,在選取核心作者樣本時運用普賴斯定律。普賴斯在《小科學,大科學》中指出,在同一主題中,半數的論文為一群高生產能力作者所撰,這一作者集合的數量上約等于全部作者總數的平方根。依據普賴斯核心作者計算公式:M=0.749(Nmax)1/2,Nmax 代表發文量最高的作者的論文數,其余作者發文數超過M 篇的,則視為核心作者變化。計算得M=3.01 篇,所以在CNKI 上共發表論文數大于等于3 篇的作者就是核心合作作者,由此得到143 位核心作者。為更有針對性地分析核心作者間的合作關系,從143 位作者中按照合作發文頻次量由高到低提取出30 位作者做進一步研究。具體計算方法如下:分別計算這143 位作者與其他142 位作者的合作頻次,匯總得到該作者的總合作頻次,選取前30 位。從選取的核心作者看出:五計學的核心作者群既包括在計量科學研究領域內的學科權威,如邱均平、劉則淵、武夷山等,他們研究成果豐富、學術水平高,是五計學的重要支柱;也包括新涌現的高產作者,如趙蓉英、李江、宋艷輝、侯海燕、陳悅、姜春林等,他們也為五計學的發展提供了活力。
本文利用社會網絡分析方法(Social Network Analysis,SNA)來探究我國“五計學”的作者合作關系。社會網絡分析法是1960年代,懷特及其后繼者伯曼、布里格等人運用數學圖形推導出的數學分析方法,是對社會網絡中各種關系結構及其屬性加以分析的一套理論和方法,主要分析各行動者之間的關系模式[4]。實質上,社會網絡就是為達到特定目的,人與人之間進行信息交流和資源利用的關系網[5]。本文綜合運用社會網絡分析方法構建五計學領域的核心作者網絡,對其合作關系情況進行研究。UCINET 是社會網絡分析的常用工具[6],在進行數據分析時,主要用到網絡密度分析和網絡中心性分析。網絡密度測量網絡中各個節點之間的緊密程度,整體的密度反映了網絡的連通性[7],中心性則描述個人或團體在網絡中所處的地位和重要性。
因子分析最早是由英國心理學家C.E.斯皮爾曼提出的一項從變量群中提取共性因子的統計技術。因子分析可在許多變量中找出隱藏的具有代表性的因子,將相同本質的變量歸入一個因子,可減少變量的數目,還可檢驗變量間關系的假設[8]。科學文獻計量的理論也將貫穿研究始終,比如普賴斯定律幫助我們找到五計學領域的核心作者,在研究過程中還將利用因子分析的統計方法對五計學領域的作者合作情況進行深入分析,以發現當前具有高研究活力和研究潛力作者的分布情況,從而揭示五計學的研究熱點和研究主題的變更趨向。相對社會網絡分析,因子分析對探測學科前沿、研究學科知識結構更具有應用價值,它在一定程度上彌補了網絡分析的局限性,對發現潛在合作關系有重要意義。這個過程將運用SPSS 統計軟件得以實現。
對五計學的143 位作者構造合作矩陣,利用可視化工具NetDraw 繪制網絡圖,見圖1。圖1中顯示的每個圓點代表一位作者,圓點的大小代表作者合作發文中間中心性的大小,圓點越大,說明作者合作中心性越強,圓點間的連線代表作者間的合作次數,連線越粗說明作者間的合作次數越多。圖中邱均平、武夷山的圓點較大,代表其合作中心性較強,圖中劉則淵與侯海燕間的連線最粗,說明這兩位作者合作發文量最大。

圖1 全部核心作者合作關系網絡
在此網絡中能直觀地看到三個核心群體網絡:網絡A、網絡B、網絡C。網絡A 以武漢大學邱均平為核心,網絡B 以大連理工大學劉則淵為核心,網絡C 以中國科學技術信息研究所武夷山為核心。合作網絡A 和B 之間通過關鍵作者武夷山、宋艷輝、李江、姜春林和丁堃等人形成了一個大型的合作網絡,這說明兩個成熟的子網絡間并不是沒有聯系的。在網絡A 中,邱均平是溝通該網絡的關鍵點,其他節點大部分與其連接(除劉春麗外),總體呈現出由中心向外擴散的整體形態,形成規模最大的一個合作子網,并具有較好的連通性。C 網絡是以武夷山為核心的網絡,重要成員包含潘云濤、袁軍鵬、馬崢等,這也都是中信所情報方法中心的核心成員。在此網絡中還發現,聯系A 網絡與C 網絡的關鍵作者是宋艷輝、孫建軍,由于宋艷輝先后師從邱均平和武夷山,因此宋艷輝成為聯系武漢大學與中信所的重要橋梁,即連接A、C 兩個子網的關鍵點;武夷山、孫建軍同為南京大學的博士生導師,建立了合作關系;大連理工大學的姜春林和丁堃因為學術交流的原因,同中信所的潘云濤、王寧等建立了合作關系,因此將合作網絡B 和C 連接了起來。從圖1中還發現一支合作網絡D,這支網絡與網絡C 關系緊密,查看原始數據發現,盧朝暉、王寧、王敏都曾在山東省醫藥衛生科技信息研究所共事,建立了合作關系。王敏到中國醫學科學院醫學信息研究所后,同許培揚等新同事建立了合作關系。因工作原因,中國科學技術信息研究所與中國醫學科學院醫學信息研究所合作交流較多,學者間多有合作,從而形成網絡C、D 相融合的布局。在網絡B 中,形成以劉則淵為核心的蜘蛛網子網,這是第二大子網絡,姜春林、侯海燕、胡志剛、梁永霞、林德明等圍繞劉則淵分布,整體結構緊密,有著高度的連通性,劉則淵與陳悅、候海燕與劉則淵、候海燕與胡志剛間的合作頻繁,分析發現侯海燕與陳悅曾師從劉則淵,學生間、師生間建立了密切的合作關系。盛麗娜、方紅玲與梁繁榮、任玉蘭等作者分別形成了各自的中小型網絡,圖中還有大量單點型網絡和雙核型網絡分散分布。中小型網絡中團體間的合作不多,甚至沒有直接的合作關系。以上說明我國五計學的作者合作關系呈現不平衡的分布狀況,幾個大的合作網絡間的聯通性強,作者間的信息共享以及知識交流方面溝通順暢,但是獨立發文的子網絡間缺少合作交流的機會。在當今各學科交叉融合的背景下,要加強作者間的合作,通過作者間跨學科的交流融合,能夠發現新的研究方法、新的增長點,達成學科間的共識,更好的為各自研究領域服務。

圖2 30位核心作者合作關系
依據社會網絡分析方法,在Excel表格中編制VBA 程序,對篩選出的30位核心作者構造30×30 合作矩陣,繪制網絡圖,如圖2所示。
圖2中的網絡由30 位核心作者形成。圖中顯示的合作網絡是一個非聯通的網絡,具有合作關系的子網共有4個,包含兩個大型的合作網絡:以邱均平為代表的大型合作網絡共12 人,以劉則淵為代表的大型合作網絡共7 人。這兩個網絡核心作者之間的知識融合、思維碰撞、資源共享方面的連通性很好。還有兩個相對較小的關系子網,分別由方紅玲、盛麗娜、周志新、劉雪麗形成的核心蛛網型網絡,以及由任玉蘭、梁繁榮所形成的雙核型子網絡,但與圖1相比發現,沒有形成以武夷山為中心的合作網絡。整體來看,圖2與圖1所展示的合作情況基本吻合。
運用SPSS 對作者合作矩陣(30 位核心作者)進行因子分析,采取主成分(Principal Components)萃取因素,選擇直斜交(Direct Oblimin)進行轉軸,可提取出14 個成分,累計貢獻率為80.003%。通過因子分析,可以對核心作者群進行分組。對作者合作關系矩陣所形成的成分相關矩陣進行統計,可以發現相應合作團體的研究主題領域所在。
通過數據整理(只保留載荷值>0.2 的數據)可得到如表1所示結果:將“五計學”高頻率合作作者大致分為14 個主題領域,即文獻與信息計量學、科學計量學、影響因子、醫學計量、可視化分析、科技政策分析、共詞分析、網絡計量學、科學知識圖譜、被引分析、數字出版、經濟計量、化學計量以及科技創新網絡,不同主題領域所涉及的核心作者,以及作者對不同領域的研究貢獻都有很大不同。圖表顯示,有兩個主題下的核心作者總數最多,分別是以邱均平為代表的文獻與信息計量學和以劉則淵為代表的科學計量學,二者最大載荷值和載荷總值都是最大的,可見核心作者對于這兩大區域的研究集中性和活躍性相對較高。其他很多主題研究領域都是在文獻與信息計量學和科學計量學這兩個傳統主題上衍生發展出來的,這點從他們與其他因子間的相關性上體現出來。從最初的文獻計量學到后來的科學計量學、信息計量學、網絡計量學,再到知識計量學,邱均平、劉則淵、武夷山、姜春林等對這些研究主題的貢獻都比較大,并形成了自己的團隊,尤其以邱均平為中心的師生隊,如文庭孝、趙蓉英、張洋、宋艷輝等新生研究力量已經登上計量學研究舞臺;以劉則淵為中心的隊伍中,侯海燕、陳悅等在專利計量、科學計量等領域占有一席之地,他們對五計學的發展都做出了重要貢獻。而科技創新網絡與計量學在數字出版應用兩個研究領域的首要載荷作者數都僅有1個,且前者的載荷值相對較低,這與以上幾個研究領域的學科交叉性和綜合性是有關系的,這兩個研究主題在“五計學”領域還未呈現出穩定的分布態勢和發展潛力。

表1 因子分析結果

表2 作者-主題貢獻統計

表3 因子相關性矩陣
從表2還可以看出,五計學核心作者所涉及的研究主題情況也有很大不同。通過因子載荷統計發現,涉及領域最多的是邱均平,他在5 個領域都有研究貢獻。李江、任全娥、李曄君等涉及4 個研究領域,趙蓉英等集中于3 個領域的研究,有10 位作者在2 個領域有合作關系,武夷山、周志新、盛麗娜等只在1 個領域內有貢獻值,即主要專注于某一特定主題領域的研究;有些學者因為跨學科研究,只在特定因子上有較小值,在五計學領域中主要偏重于相關主題的泛在研究,或者是剛進入五計學領域的新人,還未形成專深的研究。從因子載荷分布看,大部分學者主要集中在單個主題或兩個主題的研究,可見五計學領域內核心作者的研究方向普遍比較集中。
國內外學者都已證明從作者合作關系出發,可以動態地揭示一個學科主題領域的知識結構,尤其是前沿熱點知識結構[9]。我們大致將核心高頻合作者分為橫向基礎和縱向探索兩大部分,前者以邱均平、劉則淵、趙蓉英、侯海燕、宋艷輝、陳悅、胡志剛、楊華、王菲菲等為代表,集中于文獻計量與科學計量、信息檢索與可視化分析、科技創新網絡等基礎性理論、方法與技術方面的研究;后者以武夷山、張洋、潘云濤、梁繁榮、任玉蘭、王敏等為代表,主要涉及網絡計量學、經濟計量、醫學計量等五計學領域綜合交叉性、應用衍生性為主題的研究。進一步研究因子相關性矩陣(表3),發現基礎和探索這兩大部分的因子之間存在較強的相關性,如影響因子與共詞分析、科學知識圖譜這兩大基礎性研究間存在較高的關聯度,這在一定程度上反映了計量學理論研究向信息分析應用研究的發展趨向,這是由這些具有橋梁作用的學者推動的,這些中間學者在合作研究過程中形成新的研究共同體,進而探討新的研究熱點。因子8 網絡計量學與基礎研究部分的相關性也相對較高,結合表1發現這兩個主題領域的載荷總值都較大且載荷均值相近,這在一定程度上說明這兩個主題領域的核心作者群已基本形成,其研究主體和客體較為穩定;還發現因子1、5、8 之間的相關性相對較高,這反映出由文獻與信息計量學領域、可視化分析領域向網絡計量領域進行拓展、深化、發展,這三方面研究緊密聯系,或可推動現代化網絡信息資源計量與管理這一熱點的形成與發展。
通過對30 位核心作者進行因子分析和網絡分析,對比分析結果發現,因子分析比網絡分析更能挖掘一些潛在的主題信息,比如通過因子分析,我們可以知道各個合作群體的單位以及合作的重點主題領域。通過因子分析載荷總值可以發現我國“五計學”領域學者多集中于文獻與信息計量和科學計量這兩個領域,除此之外還涉及網絡計量、共詞分析、科學知識圖譜等主題領域。從因子相關性矩陣中可以看出影響因子、共詞分析與科學知識圖譜間的相關性較高,還發現可視化分析與網絡計量學的相關性大,挖掘出潛在熱點。這些都是社會網絡分析解析不出的信息。
網絡分析較因子分析,可更為直觀地展現出不同子網絡的核心作者合作群,這為進一步進行因子分析提供了深入挖掘的信息支撐。在社會網絡分析輔助下,因子分析也可以發揮更大功效[10]。利用Ucinet 可對五計學領域的外在合作網絡節點的中心性進行計算,中介中心性是側重了節點在整個網絡的中心程度,表示的是整個網絡的集中或集權程度,即整個網絡繞一個點或一組點來組織運行的程度[11]。結果如表4所示,中介中心性排名第一的是邱均平,他在五計學領域的合作網絡中處于核心地位,與其他相關學者的聯通性最強,同時在整個綜合性合作網絡中具有較大的掌控權,說明在合作網絡中的影響力很大,是網絡中的核心人物。此外,武夷山、丁堃、姜春林、宋艷輝的中心性也很大,圖1中的圓圈大小能反映出他們在合作網絡中做出關鍵的貢獻,為五計學的研究發揮了重要作用。在前面展示的核心作者合作關系網絡中,可以獲得3 個大型的合作群體A、B、C,在進行因子分析后發現,這與網絡分析呈現出的合作群是大致吻合的,這為五計學領域的核心作者合作研究增加了可信性,說明分析研究結果是穩健的。

表4 核心作者合作中心性測度
本文選取的研究對象為五計學領域的核心期刊論文,通過對核心合作者的分析,得出以下主要結論:
(1)通過作者合作網絡結構分析發現,五計學領域有3 個重要的合作網絡:武漢大學、大連理工大學、中國科學技術信息研究所,分別以邱均平、劉則淵、武夷山為核心。這3 個合作團體間通過宋艷輝、孫建軍、李江、丁堃、姜春林等關鍵作者的推動形成一個大型網絡,從而形成五計學的一個核心研究群體。邱均平、劉則淵、姜春林、武夷山、宋艷輝等幾位作者的合作頻率較高,是當前五計學領域研究中較為活躍的幾位作者。但從總體上看,五計學并沒有形成一個高度聯通的網絡,作者合作網絡關系圖中呈現出各合作團體分散分布的現象,尤其是小規模團體和單獨發文的小型網絡。團體間的合作主要體現在同一單位內、相近單位之間,或有密切合作關系的師生之間、師門之間,作者合作頻繁的研究方向也主要集中于文獻與信息計量學、科學計量學等方面。
(2)通過對五計學領域的核心作者進行因子分析,共提取出14 個主成分,即文獻與信息計量學、科學計量學、影響因子、醫學計量、可視化分析、科技政策分析、共詞分析、網絡計量學、科學知識圖譜、被引分析、數字出版、經濟計量、化學計量以及社會網絡分析。其中文獻與信息計量學和科學計量學兩大主題下的核心作者數最多,反映了在這兩個主題領域的作者具有較強的專注性;影響因子主題下的首要載荷作者數最多,核心作者在這這個領域的研究集中性和活躍性都相對較高;五計學領域核心作者的研究所涉及的主題情況有較大的區別,研究范圍最廣的作者可涉足4 個甚至5 個主題領域,但多數作者集中于1 個或2 個主題領域。五計學領域研究大致可分為基礎研究和應用探索兩部分。前者主要集中于文獻與信息計量、科學計量、共詞分析、科學知識圖譜、社會網絡分析等基礎性理論、方法與技術方面的研究,而后者則主要涉及網絡計量、科技政策分析、經濟計量等綜合應用性的衍生應用主題研究。
(3)網絡分析與因子各有優勢。作者合作網絡能直觀地展示出不同子網絡的分布情況,得出不同合作團體間的合作關系狀況,發現各個網絡間的關鍵作者,為進一步的因子分析提供研究空間。因子分析則可挖掘各個合作群體的單位以及合作的重點、前沿主題領域,從而更深入的揭示五計學領域內作者合作的方向和規律。因此,我們認為將網絡分析與因子分析結合起來,將會是進行科學合作研究的理想方法。
最后,五計學領域發表文章的整體合作率較高,核心作者的合作聯系較為緊密,也有持續大范圍跨學科合作的趨勢。此外,作者在不同單位學習或工作會大大增加合作機會,在此強烈建議專家學者能夠通過各種方式積極參加學術交流來加強各個學科間的信息交流。