開 濱
(山東女子學院圖書館,山東 濟南 250300)
·管理論壇·
基于科學疊加圖的我國人文社會科學跨學科現象研究
開 濱
(山東女子學院圖書館,山東 濟南 250300)
[目的/意義]利用科學疊加圖進行跨學科的研究,可以非常直觀地從全領域的宏觀層面對學科之間的引用關系及跨學科現狀進行研究。[方法/過程]基于CSSCI中23個學科對我國人文社科領域的科學疊加圖的制作過程進行了探討研究,具體包括我國人文社科領域基礎圖、科學疊加圖的制作以及Rao-Stirling跨學科指數的計算。[結果/結論]對我國圖情學和山東省6所高校CSSCI發文這兩個實例進行了實證研究。結果表明,基于CSSCI構造的人文社科領域科學疊加圖較好地展示了學科的引用情況,Rao-Stirling指數較好地顯示了跨學科的水平,因此可以將其作為一種展示我國人文社科領域跨學科研究的可視化方法。
科學疊加圖;人文社科領域;跨學科;Rao-Stirling指數
隨著各學科領域的不斷融合發展,學科交叉性態勢呈現出不斷上升的趨勢,局部領域科學圖譜由于受制于有限的學科范圍,無法揭示整個全領域學科之間的特征及變化過程。近年來在計算機大數據計算及可視化技術日漸成熟的條件下,產生了一種不同于局部科學圖譜的方法——科學疊加圖。科學疊加圖是近年來興起的一種較新的可視化展示技術,用于對全領域性進行科學有效地展示。科學疊加圖作為一種全領域的科學圖譜,與以往局部的科學圖譜呈現的不同,借助于科學疊加圖,使我們能夠快速地跟蹤領域的發展變化,特別是在跨學科研究方面,科學疊加圖能夠為研究人員的科學研究及科學評價提供了一種全新的視角。國外研究方面,Leydesdorff和Rafols等學者開創了科學疊加圖的先河,他們通過使用WOS中的JCR構建了由221個學科組成的基礎圖,并利用科學疊加圖對具體實例進行了實證研究,證明了科學疊加圖已經成為科學研究非常有力的工具[1-2]。關于科學疊加圖的實用方面的研究包括Garechana等學者對廢物回收利用研究領域[3]、Kalz等學者對技術增強學習領域[4]等的實證研究。Shiji Chen等學者基于NSF包含的143個學科構造了一個全學科基礎圖,并以此構建的科學疊加圖對國際上生物化學和生物分子學的跨學科演變過程進行了分析[5]。國內研究方面主要是基于Leydesdorff和Rafols等學者制作的科學疊加圖對不同領域的跨學科進行研究,如張金柱、郭婷等學者分別對國際圖情學[6-7]、齊燕等學者對國際醫學信息學科[8]等進行的研究。孫茜等學者通過對國外科學疊加圖的概念、特點、原理進行了歸納總結,并通過實證研究證明了科學疊加圖同時也可以作為一種有效的展示機構學科成果評價的可視化工具[9]。當前的研究者主要基于國外的學科分類法進行科學疊加圖的構造,迄今還未有學者針對我國的引文數據庫構造我國的科學疊加圖,基于此,本文擬采用CSSCI數據庫對我國人文社科領域的基礎圖及科學疊加圖進行構造,以期為我國跨學科研究提供相應參考。
本文數據來源包括兩部分,第一部分為CSSCI中獲取的全學科數據,該數據用于構造全學科基礎圖,該數據來源于我國中文社會科學引文索引數據庫(CSSCI)中23門學科包含的數據,由于檢索延遲的原因2016年部分數據還未收錄,因此我們設定發文時間從2006-2015年的10年。第二部分為我國中文社會科學引文索引數據庫(CSSCI)中獲取的實例數據,本文中包含的實例數據分別為我國圖情學的數據以及山東省6所高校發表的CSSCI數據。以上兩部分數據的文獻類型均為Article,數據獲取時間截止到2017年2月20日。
具體制作過程包括4步,流程圖如圖1所示,下面我們結合圖1對各步驟進行說明。

圖1 制作過程流程圖
從CSSCI中下載23個學科在2006-2015年10年間的全部數據,同時列出23個學科的中文名稱與英文縮寫的對照表,23個學科名稱及對應表見表1所示。
為了對CSSCI原始數據中的引文進行分析,我們編寫程序用于對原始數據中的來源期刊進行自動提取以及對提取的期刊與學科進行自動匹配,最終得到23個學科之間的引文矩陣,該引文矩陣為非對稱矩陣,其中橫向代表施引學科,縱向代表被引學科。該矩陣中的數值為整數,代表了該數值所在的橫向學科引用了縱向學科的頻次,同時也代表了該數值所在的縱向學科被橫向學科引用的頻次。由于引文矩陣為非對稱矩陣,無法直接進行分析,接下來我們將引文矩陣導入SPSS中進行余弦相似性分析,得到學科引用相似性矩陣。該矩陣為對稱矩陣,該矩陣中的數值范圍為[0,1],代表了兩個學科之間的相似性程度,該數值越大,說明學科之間的相似性越高。
為了構造科學疊加圖,我們首先要構造全學科基礎圖。由于本文采用Pajek[10]可視化軟件,因此我們需要構造3種能被Pajek識別的文件,分別為Net文件、Clu文件和Vec文件。Net文件用于存放各學科代碼及其引用關系,Clu文件用于存放學科聚類信息,Vec文件用于存放實例數據中被引學科的頻次。下面分別對這3種文件的構造進行說明。

表1 CSSCI各學科名稱與代碼對應表
2.3.1 Net文件的構造
Net文件包含各學科之間的引用關系,簡言之,即某一學科具體引用了哪些學科及其引用頻次,該文件由3列構成,第1、2列分別為施引學科和被引學科,第3列為引用次數,引用頻次由引文矩陣來構造,然后依次經過去除零引用關系、去除自引關系、去除有向邊等步驟后得到Net文件。
2.3.2 Clu文件的構造
Clu文件包含各學科之間的聚類關系,簡言之,即哪些學科之間的關系更強,可以合并為同一大類。為了將其聚類,我們將引文相似性矩陣導入SPSS中進行因子分析,采用主成分分析法,因子旋轉采用最大方差法,共萃取得到8個主成分,如表2所示,其總方差解釋量為70.34%,這8個主成分即可得到Clu文件。

表2 CSSCI各學科因子分析結果
2.3.3 Vec文件的構造
這3類文件中,Net文件和Clu文件構造完成后即固定不變。只有Vec文件屬于實例文件。Vec文件的構造如下,從CSSCI中下載需要分析的實例數據后,通過自編程序可得到實例數據中的引用學科及其頻次,即得到了Vec文件。
2.3.4 基礎圖的構造
將上面得到的Net文件、Clu文件導入Pajek中,即可得到全學科的基礎圖,如圖2所示,該圖直觀顯示了2006-2015年我國人文社科領域23個學科之間的引用及聚類關系,圖中每個點代表了一個學科,連線的粗細代表了學科之間的相對引用頻次,線條越粗,表示學科之間引用的次數越多,相同顏色的點代表了學科之間屬于相同的聚類。

圖2 CSSCI人文社科全領域基礎圖
2.3.5 科學疊加圖的構造
在全學科基礎圖的基礎上,我們可以對具體的實例,例如某一學科領域、某一機構、某一地區或者某一作者的CSSCI數據進行科學疊加圖的構造。方法為將Net文件、Clu文件以及Vec文件同時導入Pajek中即可得到相應實例的科學疊加圖。
根據Rao-Stirling指數的公式,需要計算兩個變量:被引學科i所占的比例以及學科i、j之間的相似性Si,j。其中學科i所占的比例可以從實例數據的Vec文件中求得。Si,j可以從學科引文相似性矩陣中求得,最終可以計算Rao-Stirling指數。
例1:以CSSCI中2006年至2015年我國圖情學為例,繪制10年間我國圖情學的科學疊加圖,并對其跨學科變化進行分析,研究步驟如下。
第一步,從CSSCI中下載2006-2015年我國圖情學包含的數據作為實例數據;
第二步,將數據導入自編程序中得到10年間我國圖情學總的引用的學科及其頻次,該數據用于構造科學疊加圖;得到我國圖情學每年引用的學科及其頻次,該數據用于計算每年的Rao-Stirling指數;
第三步,將Net文件、Clu文件和Vec文件一并導入Pajek中,得到十年間我國圖情學的科學疊加圖,如圖3所示;
第四步,分別計算每年的Rao-Stirling指數及其變化趨勢,如表3、圖4所示。
從圖3可以直觀地看出,10年間我國圖情學最大的學科來源為圖書館、情報與文獻學,該學科代表的點遠遠大于其他學科所代表的點。這是因為:從隸屬關系來說,圖情學屬于圖書館、情報學與文獻學的范疇,說明我國圖情學的學者最經常引用的為本學科的知識。除了自引之外,我國圖情學的學科來源主要集中在管理學、經濟學、新聞學與傳播學、教育學等學科,這些學科構成了近十年來我國圖情學的主要學科來源,我國圖情學與這些學科的關系非常密切,說明我國圖情學的學者也較多的從管理學、經濟學、教育學、新聞與傳播學等學科中引用知識。而環境科學、人文、經濟地理、民族學與文化學、宗教學、考古學、藝術學、中國文學、外國文學等學科由于被引用頻次非常少,成為我國圖情學學科來源中的邊緣學科,這些學科與我國圖情學的關系較為疏遠。從圖3中我們也可以看出,與圖情學密切相關的學科大致分布在圖情學的鄰近位置,而與圖情學關系較為疏遠的學科則分布在離圖情學較遠的位置。
從表3和圖4我們可以得出如下結論:從被引學科數量來看,我國圖情學的引用學科的涉及面基本保持在21~23個學科之間,說明學科數量的多樣性變化并不明顯。從跨學科指數的變化趨勢來看,10年間我國圖情學的跨學科經歷了增長、下降、增長的過程,具體為2006-2011年,我國圖情學的跨學科處于增長階段,2012-2014年,我國圖情學跨學科處于下降階段,2015年之后又開始增長,說明2010年、2011年、2012年這3年我國圖情學的跨學科水平最高,即這幾年圖情學的引文分布較為均衡。同時我們也發現跨學科指數與自引率呈現出了相反的關系,這可以解釋為學科自引率越高,會導致越多的引文集中到該學科中,因此其引文分布變化相對不均衡,從而導致跨學科水平也越低。在計算跨學科指數時,我們同時計算每年的布里淵指數和COC指數進行對比。將表3導入SPSS進行相關性分析,結果顯示3種跨學科指數具有顯著的正相關性,其中Rao-Stirling指數與布里淵指數、COC指數的相關性分別高達0.997、0.999,說明了三者在描述跨學科變化程度上具有一致的效果,同時這一結論也可以從圖4中的3種指數的曲線具有非常近似的變化趨勢得出。

圖3 2006-2015年我國圖情學科學疊加圖

年引用的學科數量Rao-Stirling指數布里淵指數COC指數(%)自引率(%)年引用的學科數量Rao-Stirling指數布里淵指數COC指數(%)自引率(%)2006220.2196170.27983213.0986.912011220.3029110.346519.5180.492007220.2212420.2780413.3186.692012230.2986990.34662319.1180.892008220.2270270.28357913.7086.302013220.2803590.33059417.7082.302009220.2505480.30436115.4484.562014230.257490.31065315.8484.162010220.3001030.34886119.1980.812015210.2820470.3378117.4982.51

圖4 2006-2015年我國圖情學3種跨學科指數變化過程
例2:以2011-2015年山東省6所高校(山東大學、中國海洋大學、中國石油大學(華東)、山東師范大學、山東農業大學、山東科技大學)所發表的CSSCI文獻為研究對象,繪制6所高校的CSSCI科學疊加圖并進行分析,研究步驟如下。
第一步,從CSSCI中下載2011-2015年內6所高校發文的數據作為實例數據;
第二步,將數據導入自編程序中得到5年間6所高校所引用的學科及其頻次,該數據用于構造科學疊加圖及計算Rao-Stirling指數;
第三步,將6所高校的Net文件、Clu文件和Vec文件一并導入Pajek中,得到5年間6所高校的科學疊加圖,如圖5所示;
第四步,分別計算6所高校的Rao-Stirling指數,如表4所示。

圖5 2011-2015年山東省6所高校科學疊加圖
從圖5和表4我們可以得出如下結論:從6所高校的引文學科數量來看,CSSCI學科上涉及面最廣的為山東大學和山東師范大學,均為23個學科,其余4所高校為21個學科,這一點可以從圖5中各高校包含的點的數量看出。從6所高校相互比較來看,山東大學、中國海洋大學、山東師范大學3所高校所含有CSSCI優勢學科的數量較多,說明這3所高校在CSSCI學科的發展過程中優勢較為明顯,這一點可以從圖5中各高校包含的較大的點的數量看出。從6所高校自身比較來看,這6所高校在CSSCI學科上具有自身的特點,這一點可以從圖5中各高校具體包含哪些較大的點看出。其中山東大學的CSSCI優勢學科主要集中在經濟學、管理學、法學、政治學、歷史學、考古學、語言學等學科上,中國海洋大學的CSSCI優勢學科主要集中在經濟學、管理學、人文、經濟地理等學科上,山東師范大學的CSSCI優勢學科主要集中在心理學、經濟學、教育學、中國文學等學科上,中國石油大學(華東)、山東科技大學兩所學校的CSSCI優勢學科集中在經濟學和管理學上,除此之外6所高校也有各自的優勢學科,如山東大學的法學政治學、歷史學、考古學,中國海洋大學的人文、經濟地理,山東師范大學的心理學、教育學、中國文學,這些學科也與6所高校實際的人文社科優勢學科基本一致,代表了在學校發展中逐步積累起來的自身科研優勢。

表4 2011-2015年山東省6所高校跨學科指數列表
從跨學科指數來看,6所高校中山東師范大學的跨學科水平最高,說明該校從CSSCI各學科中吸收知識的多樣性和均衡性最為合理,之后依次為山東大學、中國石油大學(華東)、中國海洋大學,山東農業大學和山東科技大學兩所高校的跨學科性最低,一方面是由于這兩所高校引用的CSSCI學科數量及頻次相對較少;另一方面也由于這兩所高校在CSSCI的學科吸收方面,過度地集中在少量幾個學科中(山東農業大學為經濟學為主,山東科技大學為經濟學、管理學為主),缺乏較多有競爭力的優勢學科,導致了CSSCI學科的知識吸收均衡性水平相對較低。
本文基于CSSCI中23門學科的引文分析,對我國人文社科領域的基礎圖及科學疊加圖的制作及Rao-Stirling指數計算進行了研究。并以我國圖情學領域及山東省6所高校的CSSCI發文數據為例進行了實證研究。結果表明本文構造的CSSCI科學疊加圖能夠較好地反映我國人文社科領域學科引用的真實情況,同時Rao-Stirling指數也能較好地對我國人文社科領域的跨學科水平及其演變過程進行描述。因此借助于本文構造的科學疊加圖,我們可以開展如下研究:
1)針對CSSCI中某一學科、領域的科學疊加圖進行構造,能夠分析該學科、領域對于我國人文社科領域不同學科知識的吸收利用程度,同時也能夠反映學科、領域的跨學科狀況及其變化過程,為該學科、領域內的跨學科研究提供一種全局的視角。
2)針對某一地區、某一研究機構或研究學者在CSSCI中所發文獻的科學疊加圖進行構造,能夠分析該地區、研究機構或學者的科研產出對于各學科知識的吸收水平,這可以體現該地區、研究機構和學者對于不同學科輻射的廣度及深度,同時對于評價不同地區、不同研究機構、不同學者之間的科研水平也提供了一種全新的方法。
當然本文的研究還存在一定的局限性,由于本文構造的科學疊加圖只能對我國人文社科領域進行描述,對于自然領域則無能為力。本文的第2個例子中,中國海洋大學、中國石油大學(華東)、山東農業大學、山東科技大學4所高校均為理工類高校,因此根據人文社科領域科學疊加圖得出的結果僅能反映上述4所高校人文社科領域的科研水平,而并不能真實反映該校自然領域的科研水平,因此將本文構造的人文社科領域科學疊加圖擴展到全領域(包括自然領域和人文社科領域)范圍內的科學疊加圖才會更加真實地反映不同機構的科研水平和特色。由于科學疊加圖是基于引文數據庫開發的,最能代表我國人文社科領域和自然領域的引文數據庫分別為CSSCI和CSCD,如何將CSSCI和CSCD兩大引文數據庫整合在一起構造我國人文社科領域和自然領域全學科領域的科學疊加圖,需要后續的進一步研究。
[1]Rafols,Ismael,Porter,Alan L.,Leydesdorff,Loet.Science.overlay maps:A new tool for research policy and library management[J].Journal of the American Society for Information Science and Technology,2010,61(9) :1871-1887.
[2]L Leydesdorff,I Rafols.Interactive overlays:A new method for generating global journal maps from Web-of-Science data[J].Journal of Informetrics,2011,6(2):318-332.
[3]G Garechana,R Rio,E Cilleruelo,J Gavilanes.Tracking the evolution of waste recycling research using overlay maps of science[J].Waste Management,2012,32(6):1069-1074.
[4]M Kalz,M Specht.Assessing the crossdisciplinarity of technology-enhanced learning with science overlay maps and diversity measures[J].British Journal of Educational Technology,2014,45 (3) :415-427.
[5]Shiji Chen,Cle ment Arsenault,Yves Gingras,Vincent Larivie`re..Exploring the interdisciplinary evolution of a discipline:the case of Biochemistry and Molecular Biology[J].scientometrics,2015,102(2):1307-1323.
[6]張金柱,韓濤,王小梅.利用參考文獻的學科分類分析圖書情報領域的學科交叉性[J].圖書情報工作,2013,(1):108-111,146.
[7]郭婷,許海云,岳增慧,等.情報學學科交叉態勢可視化研究[J].情報理論與實踐,2015,(9):94-99.
[8]齊燕,許海云,方曙.基于WOS數據的醫學信息學學科交叉發展態勢研究[J].中華醫學圖書情報雜志,2016,(11):30-41.
[9]孫茜,趙旭,王大盈.科學疊加圖譜及其應用研究[J].情報資料工作,2016,(5):53-60.
[10]Pajek主頁[OL].http://mrvar.fdv.uni-lj.si/pajek,2017-04-18.
ResearchontheInterdisciplinaryPhenomenaofHumanitiesandSocialSciencesinChinaBasedonScienceOverlayMaps
Kai Bin
(Library,Shandong Women’s University,Jinan 250300,China)
[Purpose/Significance]Interdisciplinary studies using science overlay maps could be very intuitive to study the citation relations and interdisciplinary situations from the macro level of the whole field.[Method/Process]This paper studied the production process of the science overlay maps based on 23 disciplines in the CSSCI of China’s humanities and social sciences,specifically including the production of base map and science overlay maps of humanities and social sciences in China,and the calculation of Rao-Stirling index.[Result/Conclusion]This paper then made an empirical study on the two instances of library science and information science and scientific output of CSSCI in 6 universities in Shandong Province.The results showed that the science overlay maps of humanities and social sciences based on CSSCI could better demonstrate the citation of disciplines,and the Rao-Stirling index preferably showed the interdisciplinary level,therefore,it could be used as a visualization method to demonstrate interdisciplinary research in humanities and social sciences in China.
science overlay maps;humanities and social sciences;interdisciplinary;Rao-Stirling index
10.3969/j.issn.1008-0821.2018.01.024
G250.252
A
1008-0821(2018)01-0162-07
2017-08-01
開濱(1981-),男,副研究館員,碩士,研究方向:科學計量學、跨學科計量研究。
郭沫含)