基于CiteSpace的人工智能研究可視化分析

2014-07-27 06:21:22陳文娟

創(chuàng)新科技 2014年12期

關(guān)鍵詞：可視化人工智能分析

陳文娟

（河南財(cái)經(jīng)政法大學(xué)圖書(shū)館，河南鄭州 450002）

基于CiteSpace的人工智能研究可視化分析

陳文娟

（河南財(cái)經(jīng)政法大學(xué)圖書(shū)館，河南鄭州 450002）

本報(bào)告借助于CiteSpace引文分析軟件對(duì)“人工智能”這一主題的相關(guān)文章從共引文獻(xiàn)、共引著者、共引期刊等多個(gè)角度進(jìn)行可視化分析，根據(jù)圖譜分析人工智能相關(guān)的研究現(xiàn)狀及前沿。

人工智能；CiteSpace；引文分析；可視化

人工智能也稱(chēng)機(jī)器智能，它是計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)等多種學(xué)科互相滲透而發(fā)展起來(lái)的一門(mén)綜合性學(xué)科。從計(jì)算機(jī)應(yīng)用系統(tǒng)角度來(lái)看，人工智能是研究如何制造出智能機(jī)器或智能系統(tǒng)，實(shí)現(xiàn)模擬人類(lèi)智能活動(dòng)的能力，以延伸人們智能的科學(xué)[1]。

近年來(lái)，隨著互聯(lián)網(wǎng)和通訊技術(shù)的迅猛發(fā)展，人工智能逐漸滲透到了社會(huì)生活的各個(gè)方面，極大地改變這社會(huì)面貌，也給人們的思想和行為帶來(lái)了深刻的變革[2]。本文對(duì)近十年來(lái)有關(guān)人工智能的文獻(xiàn)進(jìn)行可視化分析，清晰地揭示人工智能研究的發(fā)展演變態(tài)勢(shì)。

1 分析方法及數(shù)據(jù)來(lái)源

相比傳統(tǒng)的統(tǒng)計(jì)分析方法，引文分析法對(duì)于揭示某一學(xué)科研究領(lǐng)域的動(dòng)態(tài)結(jié)構(gòu)和發(fā)展規(guī)律，衡量著者、成果的影響力具有更大的價(jià)值。本文以Web of Knowledge為來(lái)源數(shù)據(jù)庫(kù)，借助于CiteSpace專(zhuān)業(yè)引文分析軟件，截取2003-2013年10年內(nèi)有關(guān)人工智能的文獻(xiàn)進(jìn)行計(jì)量分析。具體檢索策略是在Web of Knowledge中輸入檢索式“Artificial Intelligence”，時(shí)間限度限定在2000-2013，并選擇文獻(xiàn)類(lèi)型“ARTICLE”，得到的檢索結(jié)果為3 144條。

2 共引文獻(xiàn)（DCA）可視化分析

在CiteSpace中導(dǎo)入數(shù)據(jù)，限定時(shí)間為2003至2013，時(shí)間跨度為1，選取節(jié)點(diǎn)類(lèi)型為共引文獻(xiàn)（Cited Reference），運(yùn)行后進(jìn)行可視化，得到共引文獻(xiàn)聚類(lèi)的混合網(wǎng)絡(luò)，如圖1所示。圖示中的網(wǎng)絡(luò)共有170個(gè)節(jié)點(diǎn)，836條鏈接。

從圖1可以看出，此聚類(lèi)圖的發(fā)展途徑呈現(xiàn)出從左上角到右下角的演化，出現(xiàn)三個(gè)明顯的聚類(lèi)：最先出現(xiàn)了左上角的藍(lán)色聚類(lèi)，主要聚焦于蛋白質(zhì)組學(xué)（proteomy）；隨后出現(xiàn)了以湖藍(lán)色聚類(lèi)，在這之后分為了兩個(gè)不同的研究領(lǐng)域，研究?jī)?nèi)容分別為大神經(jīng)網(wǎng)絡(luò)（large neural network）與特殊謂語(yǔ)（special predicate）；最后出現(xiàn)的是以橙色和黃色的聚類(lèi)，內(nèi)容涵蓋遺傳算法（genetic al?gorithms）、機(jī)器學(xué)習(xí)（machine learning）、基礎(chǔ)神經(jīng)網(wǎng)絡(luò)（funda?mentals neural）、遺傳編程（genetic programming）、計(jì)算機(jī)智能（IEEE Cevol computer）等新領(lǐng)域。黃色和橙色部分聚類(lèi)連線較多，聯(lián)系緊密，是目前人工智能領(lǐng)域研究的核心區(qū)域。

圖 1 基于DCA的人工智能引文聚類(lèi)圖譜

中間中心性和被引次數(shù)均排在前列的文章是Goldberg DE于1989發(fā)表的有關(guān)遺傳算法的文章，共被引32次，中心度為0.18，是該群體最具影響力的作者。這一文章可以說(shuō)是人工智能領(lǐng)域的奠基之作，且仍處于目前研究的核心領(lǐng)域。從綠色到黃色、橙色的過(guò)渡并沒(méi)有明顯的節(jié)點(diǎn)。藍(lán)色和湖藍(lán)色的部分都相對(duì)孤立的，但左下方的湖藍(lán)色部分文章節(jié)點(diǎn)都是紅色，這表明這一領(lǐng)域的文章還是處于研究前沿。綠色節(jié)點(diǎn)較為分散，表明這一領(lǐng)域的研究出現(xiàn)時(shí)間較短或者研究尚淺，或是研究中遇到了難題，因此分布比較分散。自2008年之后的黃色與橙色的聚類(lèi)網(wǎng)絡(luò)相對(duì)緊密，這說(shuō)明這些領(lǐng)域是目前研究的熱點(diǎn)，且取得了較多的創(chuàng)新和成果，相互間聯(lián)系比較緊密，分布比較集中。

3 共引著者（ACA）可視化分析

在CiteSpace中，選取節(jié)點(diǎn)類(lèi)型為共引著者（Cited Author）進(jìn)行分析，進(jìn)入可視化界面，得到文章共引著者的聚類(lèi)混合網(wǎng)絡(luò)，如圖2所示。

圖 2 基于ACA的人工智能引文聚類(lèi)圖譜

由圖可知，共引作者與共引文獻(xiàn)的走向大致相同，藍(lán)色與湖藍(lán)色（2004至2005年）與其他文獻(xiàn)之間聯(lián)系不緊密，共引現(xiàn)象不多。在2005年之后共引開(kāi)始增多，多個(gè)研究領(lǐng)域相互交叉，共引率較高。但同時(shí)也可以看出，2005年之后出現(xiàn)的研究相對(duì)比較分散，形成了多個(gè)分叉研究領(lǐng)域，且每個(gè)領(lǐng)域尚沒(méi)有形成一個(gè)系統(tǒng)，雖然彼此間聯(lián)系緊密，但從人工智能整個(gè)研究領(lǐng)域來(lái)說(shuō)，目前所做的研究尚淺，研究的整體性不強(qiáng)，還有許多內(nèi)容需要探索。

CiteSpace也給出了基于ACA人工智能的共引記錄，其中共引率最高的是Haykin S，被引次數(shù)為64次。被引次數(shù)排名第二的為前面提到的Goldberg DE，中心度為0.18，可以說(shuō)是人工智能研究領(lǐng)域內(nèi)最具有影響力的權(quán)威專(zhuān)家。其他具有影響力的專(zhuān)家還有Zadeh LA，Newell A、Holland JH、Rumelhart DE、Kennnedy J、Mccarthy J等。

4 共引期刊（JCA）可視化分析

根據(jù)統(tǒng)計(jì)得知，人工智能研究領(lǐng)域共有126種共引期刊。在CiteSpace中，選取節(jié)點(diǎn)類(lèi)型為共引期刊Cited Journal進(jìn)行可視化，可以直觀地看出該領(lǐng)域最重要的期刊有ARTIF INTELL、SCIENCE，以及LNCS、LECT NOTESARTIF INT等。同時(shí)視圖也展示出了人工智能隨著時(shí)間共引情況的發(fā)展變化情況：人工智能的研究起始于五六十年代，事實(shí)上，“人工智能”一詞最初是在1956年Dartmouth學(xué)會(huì)上提出的[3]。從那以后，研究者們發(fā)展了眾多理論和原理，人工智能的概念也隨之?dāng)U展。自80年代以來(lái)，人工智能取得了較大的進(jìn)展，人工智能的研究不斷向多個(gè)方向和領(lǐng)域延伸，并取得了很大的成就，許多文獻(xiàn)見(jiàn)諸一些世界級(jí)權(quán)威期刊。

通過(guò)人工智能共引記錄的共引次數(shù)與中心度的排序可以更明確地看出人工智能的共引期刊分布情況，繼而定義該領(lǐng)域的十大核心期刊。排名第一的期刊是ARTIF INTELL，被引次數(shù)（183次）最高，中心度（0.63）最大，是該領(lǐng)域最具有影響力的核心期刊。緊隨其后的是SCIENCE，也是很有該領(lǐng)域內(nèi)最有影響力的核心期刊之一；NATURE、LNCS、LECTNOTESARTIF INT、LECTNOTESCOMPUT SC這四種期刊次于前兩種期刊，影響力處于第二核心等級(jí)；COMPUT IND、IEEE TNEURAL NETWOR、EUR JOPER RES、DATA KNOWL ENG這四種期刊影響力弱于其前的四種期刊。

5 結(jié)論

本文利用web of science數(shù)據(jù)庫(kù)的檢索數(shù)據(jù)對(duì)人工智能（2004-2010年）進(jìn)行基于CiteSpace的科學(xué)知識(shí)圖譜分析，根據(jù)圖譜我們分析得知，人工智能的研究已經(jīng)持續(xù)多年，在近些年來(lái)更是取得了非凡的進(jìn)展，研究熱點(diǎn)主要集中在遺傳算法、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方面。但總體來(lái)看，人工智能領(lǐng)域的研究尚不成熟，研究主題分布較為分散，主題之間聯(lián)系不緊密。此外，本文通過(guò)定量分析，得出這一研究領(lǐng)域內(nèi)具有較大影響力的核心文獻(xiàn)、著者和期刊，有助于從宏觀上把握人工智能的發(fā)展過(guò)程和現(xiàn)狀，指導(dǎo)人工智能領(lǐng)域研究的進(jìn)一步發(fā)展。

[1]胡國(guó)華，袁樹(shù)杰.人工智能研究現(xiàn)狀與展望[J].淮南師范學(xué)院學(xué)報(bào)，2006，8（37）：22-24.

[2]劉樹(shù)安.人工智能研究領(lǐng)域及其社會(huì)影響[J].合作經(jīng)濟(jì)與科技，2012（19）：126-128.

[3]丁世飛.人工智能[M].北京：清華大學(xué)出版社，2011.

TP18

1671-0037（2014）06-88-1.5

2014年度河南省社科聯(lián)、河南省經(jīng)團(tuán)聯(lián)調(diào)研課題《基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)信息資源融和利用機(jī)制研究》，項(xiàng)目編號(hào)為：SKL-2014-765。

陳文娟（1988.3-），女，碩士，助理館員，研究方向：信息資源管理與服務(wù)。