張君冬,嵇紅濤,徐孟輝,盧 成
(南京中醫藥大學,江蘇 南京 210023)
基于2008—2017年CNKI我國深度學習現狀圖譜研究
張君冬,嵇紅濤,徐孟輝,盧 成
(南京中醫藥大學,江蘇 南京 210023)
文章以2008—2017年CNKI我國深度學習來源期刊發文及引用數據為數據來源,繪制并分析了深度學習作者合作共現圖譜,機構合作共現圖譜,關鍵詞共現圖譜及關鍵詞共現圖譜Time Zone視圖,Time Line視圖。通過相關知識圖譜的構建,文章可視化地呈現了我國深度學習近10年來的科研脈絡、重要影響力的學者及科學合作情況。
知識圖譜;深度學習;CNKI;圖譜分析;共現分析
新世紀初,隨著計算機技術的發展和信息可視化技術的應用,科學知識圖譜得到迅猛發展,根據相關資料調查,知識圖譜技術源于引文分析理論、復雜網絡系統、社會網絡分析以及信息可視化技術。我們可以把它通俗地理解為由知識點相互連接的語義網絡。任何一個知識圖譜都是由不同的節點和連線組成,節點的大小和緊密程度都直接影響了該學科的科研狀況,而連線的粗細代表著學科與學科間、作者與作者間的關聯程度,而通過繪制這種科學知識圖譜,我們可以把復雜的科學知識領域,通過可視化的方法直觀明確地顯示出來,便于我們分析該領域學科的繁榮程度及未來走向趨勢。機器學習是人工智能領域的一個重要學科。如果說淺層學習是機器學習的一次浪潮,那么深度學習作為機器學習的一個新領域,將掀起機器學習的又一次浪潮。深度學習通過建立、模擬人腦的分層結構來實現對外部輸入的數據進行從低級到高級的特征提取從而能夠解釋外部數據[1]。其應用領域非常廣泛,包括語音識別、機器翻譯、計算機視覺等多個領域。從對實際應用的貢獻來說,深度學習領域可能是機器學習領域最近這10年來最成功的研究方向[2]。本研究將通過繪制作者合作共現圖譜、期刊機構合作共現圖譜、期刊關鍵詞共現圖譜、期刊關鍵詞共現Time Line視圖,通過可視化技術來展現2008—2017年間我國深度學習領域研究發展脈絡,數據來源為CNKI收錄深度學習來源期刊發文及引用信息。
本節通過作者共現圖譜來展現出我國這10年內深度學習學者之間的研究合作情況,為了具體揭示深度學習這一領域的研究特征。2008—2017這10年來發表文章5篇及以上的學者一共有18位,按發文量降序排列,具體情況如表1所示。

表1 2008—2017年CNKI深度學習來源期刊高產學者
如表1所示,我們可以分析得出張雄偉、祝智庭、王志軍3名學者近10年來在深度學習領域發文量較多,其中張雄偉發文量達9篇,另外兩名作者也達到7篇。下面本文將通過作者共現圖譜來探究學者間的科研合作情況,以一年為一個時間切片,經過參數調整自動聚類后可視化圖譜如圖1所示。
如圖1所示,圖中每個節點代表一個作者,節點的大小代表作者發文量的多少,如張雄偉教授和祝智庭教授,節點的連線代表作者間的合作關系,連接線的粗細代表著作者之間合作的強度。網絡中的連線較少,這表明深度學習領域合作網絡的整體關系很分散,圖中的連接線偏細,可以看出學者之間的聯系強度較弱。通過進一步觀察可知網絡中仍存在一些小團體如禹龍教授與高雙印教授、史新宇教授,張雄偉教授與吳海佳教授,王志軍教授與陳麗教授就合作密切,而一些學者如王娟教授、陳玲教授等發文量則較為稀少。
如圖2所示,陜西師范大學教育學院、解放軍理工大學指揮信息系統學院這兩個機構發表文獻量較多,但各地學院圖上各個機構連線較少表明各個機構之間的聯系十分松散,都是采取自己獨立研究的方式,很少有機構與其他機構合作密切。

圖1 2008—2017年CNKI作者合作共現圖譜

圖2 2008—2017年CNKI深度學習機構合作共現圖譜
通過繪制2008—2017年我國深度學習領域整體的關鍵詞共現圖譜,將這10年的學科研究成果以一張共現圖譜的方式直觀地呈現出來,進而揭示國內深度學習領域研究的知識結構及其演進。以一年為一個時間切片,參數調整后可視化圖譜如圖3所示。
按照中介中心度的大小來控制節點標簽的顯示數量,節點大小與其代表的關鍵詞的被引頻次大小成正比,圓環的顏色代表年代信息,隨著年代的遞進顏色由淺入深,節點從里到外不同顏色圓環的厚度與對應年份的出現頻次成正比,節點間連線的顏色代表其共現的年份信息(見圖3)。
如圖3,表2所示,深度學習、卷積神經網絡、特征提取、神經網絡是這10年來深度學習研究領域學者使用較多的關鍵詞,其中深度學習和卷積神經網絡出現的頻次最多,中介中心度也領先于其他學科。為了更直觀地反映這一領域隨著時間的推演深度學習這一領域的文獻走勢狀況,特繪制關鍵詞Time Zone視圖(見圖4),該視圖是由一系列標識時區的顏色相間的柱形區域構成,這些時區按照時間順序從左向右排列,節點的位置代表其出現的年份信息,不同階段節點數量的多少反映當前時間段深度學習學科研究領域的繁榮程度。

圖3 2008—2017年CNKI深度學習期刊關鍵詞共現圖譜

表2 2008—2017年CNKI深度學習來源期刊熱點關鍵詞
如圖4所示,深度學習從2008年開始便是國內外學者研究的熱門領域,深度學習不僅包括深層學習、還包括學習科學、學習策略、學習動機、自主學習、淺層學習等多方面領域,目前這幾個發展領域發展迅猛,且到了2016年將專注于深度神經網絡和深度置信網絡的傳播特點和影響力這一領域。
為了更清楚地反映國內深度學習這一領域隨著時間的推演進程繪制了如圖5所示的Time Line視圖,節點標簽是由中介中心度的大小來控制的,節點的位置表示所代表引文的發文時間,可以讓同一聚類的節點按照時間順序被排布在同一水平線上,所以每個聚類的節點按照時間順序被排布在同一水平線上,每個聚類中的文獻就像串在一條時間線上,展示出該聚類的歷史成果。如圖5所示,我國目前的深度學習的研究領域主要分布在神經網絡、卷積神經網絡、機器學習、教學模式。
本文以知識圖譜作為研究方法,研究數據來源于CNKI數據庫,通過可視化技術繪制深度學習作者合作共現圖譜,機構合作共現圖譜,關鍵詞共現圖譜及關鍵詞現圖譜Time Zone視圖,Time Line視圖,Cluster View視圖等角度對我國深度學習學科研發展進行了可視化分析,相關結論如下:2008—2017年間,張雄偉、祝智庭和王志軍是這5年來發文量最多的兩位學者;學者之間的聯系較為分散且團體合作的整體關系很不理想;深度學習、卷積神經網絡、特征提取、神經網絡是這5年來深度學習研究領域學者使用較多的關鍵詞,其中深度學習出現的頻次最高;我國目前的深度學習的研究領域主要分布在神經網絡、卷積神經網絡、機器學習、教學模式,且這幾個領域在未來幾年里也將會得到長遠發展。

圖4 2008—2017年CNKI深度學習來源期刊關鍵詞共現圖譜Time Zone視圖

圖5 2010-2015年CNKI深度學習來源期刊關鍵詞共現圖譜Time Line視圖
[1]劉建偉,劉媛,羅雄麟.深度學習研究進展[J].計算機應用研究,2014(7):1921-1930,1942.
[2]余凱,賈磊,陳雨強,等.深度學習的昨天、今天和明天[J].計算機研究與發展,2013(9):1799-1804.
Research on the current situation of deep learning based on 2008-2017 CNKI in China
Zhang Jundong, Ji Hongtao, Xu Menghui, Lu Cheng
(Nanjing University of Chinese Medicine, Nanjing 210023, China)
This paper draws and analyzes the co-occurrence map of the cooperation on authors with deep learning, the co-occurrence map of the cooperation on enterprise, the co-occurrence of the key words and its Map Time Zone view and Time Line view. Through the construction of relevant knowledge map, this paper visualizes the scientific research context of deep learning nearly 10 years, the scholars with important influence and scientific cooperation in China.
knowledge map; deep learning; CNKI; map analysis; co-occurrence analysis
張君冬(1996— ),男,江蘇南通人,本科生;研究方向:情報學領域。