999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于VOSviewer的我國各省市科研熱點領域分析

2017-09-13 19:00:35胡志剛林歌歌孫太安侯海燕
科學與管理 2017年4期

胡志剛++林歌歌++孫太安++侯海燕

摘要:通過研究產出和研究偏好兩個維度,揭示我國各省市自治區之間的科研差異性。在研究產出方面,基于CNKI數據庫,統計了中國31個地區(不包含港澳臺)的論文產出量。在研究偏好方面,使用余弦距離計算地區之間的研究偏好相似度,并根據研究偏好將31個省市自治區聚成了2個大類和6個小類。最后,借助VOSViewer軟件繪制各地區的研究領域熱點圖。這種視圖可以直觀展現各地區在科學研究中的優勢領域,對于識別我國各地區的研究特點和偏好,具有重要的應用和啟發。

關鍵詞:研究偏好;中國;CNKI;聚類;VOSviewer

中圖分類號:G322 文獻標識碼:A DOI:10.3969/j.issn.1003-8256.2017.04.007

Research on Spotlights Analysis for Different Regions in China by VOSviewer

HU Zhigang, LIN Gege, SUN Taian, HOU Haiyan

(Institute of Science Studies and S&T Management, WISE Lab, Dalian University of Technology, Dalian 116024,Liaoning, China)

Abstract:Revealing China's regional disparity both in research productivity and preferential research areas is thepurpose of this study. Thus, we investigated the research outputs of all 31 regions (Hong Kong, Macao and Taiwan not included) in mainland China. The investigated dataset was sourced from CNKI, one of the largest China's domestic academic databases. To measure two regions' difference in research preferences, we used the function of cosine distance rather than Euclidean distance. Clustering method was employed to classify the regions according to their similarity/disparity.In the end, two group and six clusters were generated. Each cluster is different in research preferences. In the end, VOSviewer is employed to visualized the spotlights of different regions in China.

Keywords:Research preference; China; CNKI; Cluster; VOSviewer

0 引言

近年來,隨著科技投入的不斷加大,我國科技產出規模和水平持續增長。2015年,在湯森路透的Web of Science數據庫中,中國發表的論文量約為30萬篇,占全球的16.6%,已經是連續第七年排在第二位。其中,高質量論文增長勢頭明顯,中國各學科論文在2005~2015年10年段的被引用次數處于世界前1%的高被引論文有15011篇,占世界份額的11.9%,排名世界第四位。在論文的被引次數方面,2005~2015年間中國國際科技論文被引用次數為1287.6萬次,排在美國、英國、德國之后位列第四。

雖然科技發展的總體成就令人振奮,但是各學科領域的發展水平和速度并不一致。按照Nature出版集團發布的2015年Nature Index China報告[1],中國的科學論文產出主要集中在化學、物理等幾個特定的學科領域。來自比利時聯合國大學的學者Lili Wang的研究[2]也表明,中國的研究優勢在于硬科學領域,像工程、能源、材料科學、計算機科學等,而在心理學、藝術與人文、社會學等軟科學方面仍遠遠落后于世界先進研究水平。此外,官建成及其團隊使用Web of Science數據對中國在個別學科上的表現做出了一系列的研究[3-7]。

除了學科之間的差異之外,各地區之間的科技水平和科研競爭力也不盡相同。正如經濟社會發展的不均衡一樣,中國各省市自治區在科技產出也存在著較大差異[8-11]。根據Nature Index China 2015報告,北京、上海、南京等排在前十位的城市貢獻了我國73.2%的高質量研究論文。而根據在Web of Science中檢索得到的數據,2015年我國發表的SCI論文中有大概1/4來自北京。目前,北京已經成為全球論文產出量最大的城市,超過了倫敦、東京、巴黎、紐約、舊金山和波士頓。

各地區的科研差異不僅體現在科研產出規模上,也體現在科研產出結構和優勢領域的分布上。例如,中國科技水平最高的兩個城市,北京和上海,在側重的科研領域上卻大相徑庭。北京更側重于基礎研究和人文社科領域的研究,而上海則更側重于生物、化學等高新產業技術方面的研究。

為了揭示我國各地區的科研水平和優勢領域,本文基于CNKI數據庫中的發文量數據,統計分析了我國31個省市自治區(不包括港澳臺)在各學科中的科研表現和產出規模,并根據其優勢領域的分布進行區域間的聚類,最后,借助可視化工具VOSviewer繪制各地區優勢科研領域的熱點圖。endprint

1 數據與方法

1.1 數據來源:CNKI

利用科學論文產出量[2]和引用次數[12-15]來對一個國家和地區的科研水平進行評價是科學計量學中的常用方法。此前關于中國學科表現的研究中多使用Web of Science、Scopus、Engineering Village (EI)等國際文獻數據庫。然而一個明顯的事實是,大部分中國學者的研究仍然主要用中文寫作,發表在國內期刊而不是國際期刊上。尤其是人文社科領域研究,因為研究問題往往太過“中國”化,而很難在國際期刊上發表。2002年,愛思唯爾出版集團首席科學家Moed等人曾分別使用中國本地數據庫——科學引文數據庫(CSCD)和國際期刊數據庫——湯森路透的SCI數據庫比較了我國在國內外的科研表現[16],得出了兩個截然不同的優勢領域圖景。周萍等人的研究[17,18]也表明,基于國內期刊數據庫進行統計分析可能比基于國際期刊數據庫的分析更為準確和全面。

基于上述原因,在本文中我們選用CNKI文獻數據庫做為數據來源。CNKI數據庫是全球最大的中文期刊論文數據庫,共收錄了10116本期刊,論文總數超過5100萬篇。在CNKI數據庫中共劃分了10個專輯,分別是基礎科學、工程科技Ⅰ輯、工程科技Ⅱ輯、農業科技、醫藥衛生科技、哲學與人文學科、社會科學Ⅰ輯、社會科學Ⅱ輯、信息科技、經濟與管理科學。這10個專輯又進一步被細分為168個研究領域。每一篇論文依據其標題、摘要、關鍵詞等信息被劃分到一個或多個領域。也就是說,和Web of Science這種基于期刊(Journal-based)的學科劃分不同,CNKI數據庫中的學科劃分是基于論文(Article-based)的。

本文查詢得到了2015年我國31個省市自治區在168個研究領域中各自的論文發表量。為去除掉質量不高的論文,這里我們只統計發表在北大核心期刊中的論文。在CNKI中,核心期刊占總期刊比例約為19.5%。

1.2 方法:相似度計算和聚類

首先,計算各省研究主題的相似性。相似性,是指各省在研究主題多維空間中的距離的大小,距離的測量方法有歐幾里得距離、馬氏距離、余弦距離等[19]。由于本文研究的是各省的研究偏好而非絕對數量,因此在測量距離時使用的是余弦距離,而不是歐式距離。后者的結果會受到研究主題論文產出絕對量的影響,而余弦距離則只依據各學科的比例。兩省之間的研究領域的排序越相似,其余弦距離越小。

然后,基于各省在研究傾向上的相似性,使用層次聚類法對31個省市自治區進行聚類。層次聚類法是一種自下而上的聚類方法,通過逐級合并的方式進行聚類,距離相近的省份首先被合并為一個聚類,最終形成一個層層聚集的樹狀結構。

最后,我們使用VOSviewer工具繪制各省份的研究領域熱點圖。VOSviewer是由萊頓大學的CWTS研究中心的Van Eck和Waltman在2010年開發的一款文獻分析和知識可視化軟件[20]。熱點圖的展現視圖是這款軟件中的一大特色。熱點圖視圖是通過顏色光譜展示研究熱點的強度,紅色暖色調的表示熱點領域(紅海),藍色冷色調的表示冷門領域(藍海)。因此這一視圖非常適合用來展現各省的研究側重,即在哪些領域相對較熱,哪些領域相對較冷。

2 結果

2.1 各地區的研究論文產出

表1是2015年各省市的論文產出情況。北京市以87718篇的論文產出量排名榜首,超過排名第二位的江蘇省(論文產出量53577篇)約63.7%,上海以30707篇的論文產出量排在第三。排在前三位的省市中,北京和上海是中國最發達的兩個城市,江蘇省的人均GDP(國民生產總值)在中國各?。ǔブ陛犑校┲信琶谝晃?,在經濟、科技、教育、文化等諸多領域處于國內領先地位。江蘇省省會南京市擁有兩所985高校(南京大學和東南大學)和六所211高校(南京航空航天大學、南京理工大學等),另外還有中科院系統下的南京土壤研究所、地理與湖泊研究所、地質古生物研究所等,這些高校及科研機構為江蘇省的科學發現和技術創新做出了很大的貢獻。

根據表1中各地區的論文產出量可以繪制中國的科研分布地圖,如圖1所示。在圖1中,各地區中顏色的深淺表示該地區2015年在CNKI中的論文發表量,顏色越深,說明該地區的論文發表量越多??梢钥闯觯袊目蒲姓撐漠a出主要集中在江蘇、廣東、山東、浙江等東部沿海地區和位于長江流域的湖北、四川等中部省份,這些省份貢獻了超過80%的論文產量。而位于西部的西藏、青海、甘肅、寧夏等省份或自治區,科研水平和論文產量較低。

2.2 研究領域的規模

表2展示的是2015年CNKI數據庫中的各研究領域所包含的論文量。論文量最高的研究領域是“環境科學與資源利用”,該領域的論文量為18182篇,其次是“建筑科學與工程”(17332篇)、“輕工業手工業”(17321篇)、“電力工業”(17144篇)等領域。我們發現,熱門研究領域的分布與我國當前的熱點問題相吻合,例如,近十年來備受關注的環境問題、基礎建設、輕工制造、電力工業等都在熱點研究領域中得到了突出體現,尤其是“環境科學與資源利用”領域,其論文量在全部168個學科中的排名從2008年的第5位直線上升至2015年的第1位。

2.3 各地區的研究偏好

進一步統計各地區的高產研究領域,以展現各地區的研究偏好。表3列出了北京、江蘇、上海和西藏等地區發表論文量最高的主要研究領域。可以看出,各地區的高產研究領域各不相同:北京市的研究主要集中在地質學、電力工業、環境科學與資源利用等領域;江蘇省的研究主要集中在中等教育、環境科學與資源利用、建筑科學與工程等領域;上海市的研究主要集中在建筑科學與工程、電力工業和環境科學與資源利用等領域;而西藏自治區最高產的研究領域則是畜牧與動物醫學、地質學和生物學等與第一產業有關的學科。顯然,地區的研究偏好與當地的經濟社會發展階段和需要有密切關系。endprint

2.4 各地區研究偏好的相似度

本文通過余弦距離來測度地區之間研究偏好的相異度(間接反映了相似度)。余弦距離計算產生的鄰接矩陣如表4所示,矩陣中的值代表各地區之間的相異度的大小。例如,安徽省和北京市的余弦距離是0.1066,與重慶市的余弦距離為0.0857,與新疆的余弦距離是0.3217。這說明在研究偏好方面,安徽省與重慶最接近,與北京市的相似度次之,與新疆最不相似。

表5列出了余弦距離最小和最大的地區。從表中看出,江蘇和浙江這兩個相鄰省份的余弦距離最小, 只有0.0390, 研究偏好最為相似。其次是上海市與天津市(余弦距離為0.0402), 這兩個直轄市有著相似的經濟地位和經濟結構。排名第三位的是北京市與湖北省(0.0483)。湖北省武漢市是世界上大學生最多的城市,也是中國高校最多的城市之一,武漢市共有69所本科院校,僅次于北京市的87所,因此武漢市和北京市的的研究領域覆蓋率都比較廣,理工農醫人文社科各學科領域齊頭并進向前發展。所以湖北省和北京市在研究領域分布上非常相似。

2.5 各省市按研究偏好聚類

使用層次聚類法,基于表4中的鄰接矩陣進行聚類分析,得到的聚類結果如圖2和圖3所示。圖2是聚類結果的樹狀圖,展現了各地區是怎樣根據相似度的大小一步步進行合并的成一個聚類的。按照Y軸的值(代表聚類之間的距離)為1.0進行切分,可以得到6個聚類;按照Y軸的值為2.0進行切分,6個聚類進一步合并為兩個組。為了更好的展現聚類結果,我們還在地圖上用不同的顏色對聚類結果進行了標注。

聚類A包含6個省份,包括東北地區的黑龍江、吉林,華北地區的山東、河北、河南。這些省份既是我國重要的農業大省,又具有較好的工業基礎。因此,該聚類中的省份的研究領域比較均衡,分布在生物學、金屬學、環境科學與資源利用等與第一產業和第二產業有關的領域。

聚類B是六個聚類包含省份最多的。它包含了11個省市,大多位于中國經濟最活躍的華東地區和華南地區,其中包括長三角(上海、浙江、江蘇)和珠三角(廣東)各省,另外還包括福建、江西、湖南和安徽等。聚類B的研究側重主要集中于輕工業、電力工業、化學、中等教育等,反映了這些地區在輕工業領域的經濟實力。

聚類C中包含了5個省份,主要包括北京市和位于中西部腹地的四川,湖北、陜西、山西各省。這些地區的高等教育較為發達。除了前面介紹的北京、武漢之外,陜西省的省會西安市和四川省的省會成都市都是高校、名校林立。這使得聚類C中的地區研究覆蓋的領域一般比較廣,自然科學、技術科學、人文社科發展比較均衡。

聚類D、E、F三個聚類比較小。聚類D包括內蒙古、甘肅、寧夏、云南和貴州五個省、自治區,這些位于西北和西南少數民族聚集的地區,大多經濟發展水平不高,研究領域側重于農林畜牧業和一部分輕工業。聚類E只包含海南省,研究領域側重于熱帶作物和植物學研究。聚類F包含新疆、西藏和青海,這三個地區都屬于地廣人稀的欠發達地區,研究領域側重于畜牧業和少數民族問題研究,具有鮮明的研究特色。

在更高的閾值上,聚類A、B、C中的22個省或市可以歸為組I,而聚類D、E、F中的9個省或自治區歸為組II。顯然,組I主要位于東部或中部發達地區,而組II主要位于西部欠發達地區。

2.6 各地區的研究領域熱點圖

基于每個地區的研究偏好使用VOSviewer軟件繪制各地區的研究領域熱點圖。熱點圖可以更好的展現出各地區在研究側重上的不同。由于篇幅限制,本文只選取組I中的湖北?。▓D4)和組II的內蒙古(圖5)作為案例進行展示。

圖4和圖5基于相同的底圖進行繪制,即各研究領域的坐標完全一致,以方便對二者進行比較。圖4展現了湖北省的研究熱點分布,可以看出湖北省的研究熱點主要集中在位于圖譜上方的地質學,位于中間的電力工業、環境資源與科學利用,以及位于底部的高等教育、圖書情報與數字圖書館等。

內蒙古自治區擁有中國面積最大的草原,經濟上以畜牧業和農業為主要構成,此外內蒙古還是資源大省,煤炭、天然氣、稀土資源儲量豐富。因此,內蒙古的熱點領域集中在位于圖譜上方的礦業工程、農作物,位于中間的金屬學及金屬工藝、畜牧與動物醫學等。內蒙古的人文社科研究也比較活躍,包括教育學、少數民族研究等。

3 結論

本文基于CNKI數據庫中的核心期刊論文產出數據,對我國31個省市自治區的研究偏好進行了分析和解讀,并通過VOSviewer軟件繪制了各地區的研究領域熱點圖,更直觀的展現了各地區的研究偏好及特點。

研究發現,各地區之間的差異不僅表現在科研產出的規模方面,在研究領域的偏好方面也有很大差異。通過計算和比較各地區之間的研究偏好,我們將31個省市自治區進行了聚類,劃分了6個聚類和2個大組。不同聚類的省份在研究偏好上具有不同的特點。例如,位于組I聚類C中的湖北的競爭優勢在于地質學,而組II聚類D則在畜牧和動物醫學方面相對較強。

從研究偏好的特征可以看出,一個地區的研究偏好和該地區的經濟格局有很大的相關性。市場力量在科學技術發展中發揮著非常重要的作用,中國工業化程度最高的省份,如江蘇、浙江和廣東等,在電力行業、輕工業行業、建筑行業中具有較大的需求,其科研投入和產出水平也明顯較高,這反過來又進一步鞏固了這些地區的工業化地位。而在西部相對貧窮的省份,如西藏、新疆、青海等,其經濟來源仍然以畜牧業和農業為主,這使得該區域的研究產出主要集中在農作物、畜牧業和動物醫學等相應領域,以滿足當地第一產業的發展需求。

參考文獻:

[1] MCGHEE K, PHILLIPS N. Nature index 2015 China[J]. Nature, 2015, 528(7582): S165.

[2] WANG Lili. The structure and comparative advantages of China's scientific research: quantitative and qualitative perspectives[J]. Scientometrics, 2016, 106(1): 435-452.endprint

[3] GUAN Jiancheng, MA Nan. A bibliometric study of China's semiconductor literature compared with other major Asian countries[J]. Scientometrics, 2007, 70(1): 107-124.

[4] GUAN J, HE Y. Patent-bibliometric analysis on the Chinese science—technology linkages[J]. Scientometrics, 2007, 72(3): 403-425.

[5] GUAN J, GAO X. Comparison and evaluation of Chinese research performance in the field of bioinformatics[J]. Scientometrics, 2008, 75(2): 357-379.

[6] GUAN Jiancheng, WANG Gangbo. A comparative study of research performance in nanotechnology for China's inventor-authors and their non-inventing peers[J]. Scientometrics, 2010, 84(2): 331-343.

[7] GAO X, GUO X. SYLVAN K J,et al.The Chinese innovation system during economic transition:A scale-independent view[J]. Journal of Informetrics,Elsevier Ltd, 2010, 4(4): 618-628.

[8] LEYDESDORFF L, PERSSON O. Mapping the geography of science: distribution patterns and networks of relations among cities and institutes[J]. Journal of the American Society for Information Science and Technology, 2010, 61(8): 1622-1634.

[9] BORNMANN L, LEYDESDORFF L, WALCH-SOLIMENA C,et al. Mapping excellence in the geography of science: An approach based on Scopus data[J]. Journal of Informetrics, 2011, 5(4): 537-546.

[10]BORNMANN L, WALTMAN L. The detection of“hot regions” in the geography of science—A visualization approach by using density maps[J]. Journal of Informetrics, 2011, 5(4): 547-553.

[11]ANDERSSON D E, GUNESSEE S, MATTHIESSEN C W, et al. The geography of Chinese science[J]. ENVIRONMENT AND PLANNING A, 2014, 46(12): 2950-2971.

[12]KOSTOFF R. Comparison of China/USA science and technology performance[J]. Journal of Informetrics, 2008, 2(4): 354-363.

[13]MOIWO J P, TAO Fulu. The changing dynamics in citation index publication position China in a race with the USA for global leadership[J]. Scientometrics, 2013, 95(3): 1031-1050.

[14]ZHOU P, LEYDESDORFF L. A comparison between the China scientific and technical papers and citations database and the science citation index in terms of journal hierarchies and interjournal[J]. Journal of the American Society for Information Science, 2007, 58(2): 223-236.

[15]YANG S, MA F. SONG Y,et al.A longitudinal analysis of citation distribution breadth for Chinese scholars[J]. Scientometrics, 2010, 85(3): 755-765.

[16]MOED H F. Measuring China's research performance using the Science Citation Index[J]. Scientometrics, 2002, 53(3): 281-296.

[17]ZHOU Ping, THIJS B, GLAENZEL W. Is China also becoming a giant in social sciences?[J]. Scientometrics, 2009, 79(3): 593-621.

[18]ZHOU P, LEYDESDORFF L. The emergence of China as a leading nation in science[J]. Research Policy, 2006, 35(1): 83-104.

[19]JAIN A K, MURTY M N, FLYNN P J. Data clustering:a review[J]. ACM computing surveys(CSUR),Acm, 1999, 31(3): 264-323.

[20]VAN ECK N J, WALTMAN L. VOSviewer: A computer program for bibliometric mapping[J].Scientometrics,2010,84(2):523-538.

(編輯:張萌)endprint

主站蜘蛛池模板: 亚洲一区无码在线| 58av国产精品| 国产一二视频| igao国产精品| 国产香蕉在线视频| 欧美国产视频| 98精品全国免费观看视频| 午夜福利在线观看成人| 欧美成一级| 亚洲国产精品人久久电影| 亚洲国产日韩视频观看| 欧美成人一级| 日韩在线网址| 99精品久久精品| 亚洲一级毛片在线观播放| 人人爽人人爽人人片| 午夜视频日本| 欧美日韩国产一级| 男人天堂亚洲天堂| 扒开粉嫩的小缝隙喷白浆视频| 毛片国产精品完整版| 9丨情侣偷在线精品国产| 久久亚洲国产视频| 欧美在线一二区| 88国产经典欧美一区二区三区| 国产无码精品在线播放| 亚洲成人一区在线| 91在线无码精品秘九色APP| 欧美自拍另类欧美综合图区| 国产色婷婷| 91青青在线视频| 中文字幕在线观看日本| 久久99国产视频| 久久精品娱乐亚洲领先| 久久久久久久蜜桃| 国产成人高清亚洲一区久久| 国产永久无码观看在线| 九色在线观看视频| 日本影院一区| 亚洲性日韩精品一区二区| 国内精品久久九九国产精品| 伊人查蕉在线观看国产精品| 欧美午夜网| 99久久国产精品无码| 亚洲国产一区在线观看| 蝴蝶伊人久久中文娱乐网| 在线无码九区| 日韩在线欧美在线| 久久窝窝国产精品午夜看片| 日韩一级毛一欧美一国产 | 欧美α片免费观看| 亚洲第一视频网站| 色婷婷在线影院| 特级欧美视频aaaaaa| 成人午夜久久| 欧美成人影院亚洲综合图| 青青草国产一区二区三区| 亚洲综合婷婷激情| 亚洲欧美成人综合| 欧美激情福利| 波多野结衣视频一区二区| 精品一区二区三区波多野结衣| 久久久久亚洲Av片无码观看| 国产日韩欧美在线播放| 中文纯内无码H| 日韩国产亚洲一区二区在线观看| 亚洲成人精品| 在线欧美一区| 欧美色综合久久| 国产在线精品99一区不卡| 久爱午夜精品免费视频| 国产91熟女高潮一区二区| 91精品啪在线观看国产91九色| 黄色成年视频| 精品99在线观看| 色偷偷一区二区三区| 香蕉视频国产精品人| 亚洲色偷偷偷鲁综合| 午夜欧美理论2019理论| 亚洲日韩Av中文字幕无码| 久草网视频在线| 亚洲国产综合第一精品小说|