陳文娟
(河南財(cái)經(jīng)政法大學(xué)圖書(shū)館,河南 鄭州 450002)
基于CiteSpace的人工智能研究可視化分析
陳文娟
(河南財(cái)經(jīng)政法大學(xué)圖書(shū)館,河南 鄭州 450002)
本報(bào)告借助于CiteSpace引文分析軟件對(duì)“人工智能”這一主題的相關(guān)文章從共引文獻(xiàn)、共引著者、共引期刊等多個(gè)角度進(jìn)行可視化分析,根據(jù)圖譜分析人工智能相關(guān)的研究現(xiàn)狀及前沿。
人工智能;CiteSpace;引文分析;可視化
人工智能也稱(chēng)機(jī)器智能,它是計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)等多種學(xué)科互相滲透而發(fā)展起來(lái)的一門(mén)綜合性學(xué)科。從計(jì)算機(jī)應(yīng)用系統(tǒng)角度來(lái)看,人工智能是研究如何制造出智能機(jī)器或智能系統(tǒng),實(shí)現(xiàn)模擬人類(lèi)智能活動(dòng)的能力,以延伸人們智能的科學(xué)[1]。
近年來(lái),隨著互聯(lián)網(wǎng)和通訊技術(shù)的迅猛發(fā)展,人工智能逐漸滲透到了社會(huì)生活的各個(gè)方面,極大地改變這社會(huì)面貌,也給人們的思想和行為帶來(lái)了深刻的變革[2]。本文對(duì)近十年來(lái)有關(guān)人工智能的文獻(xiàn)進(jìn)行可視化分析,清晰地揭示人工智能研究的發(fā)展演變態(tài)勢(shì)。
相比傳統(tǒng)的統(tǒng)計(jì)分析方法,引文分析法對(duì)于揭示某一學(xué)科研究領(lǐng)域的動(dòng)態(tài)結(jié)構(gòu)和發(fā)展規(guī)律,衡量著者、成果的影響力具有更大的價(jià)值。本文以Web of Knowledge為來(lái)源數(shù)據(jù)庫(kù),借助于CiteSpace專(zhuān)業(yè)引文分析軟件,截取2003-2013年10年內(nèi)有關(guān)人工智能的文獻(xiàn)進(jìn)行計(jì)量分析。具體檢索策略是在Web of Knowledge中輸入檢索式“Artificial Intelligence”,時(shí)間限度限定在2000-2013,并選擇文獻(xiàn)類(lèi)型“ARTICLE”,得到的檢索結(jié)果為3 144條。
在CiteSpace中導(dǎo)入數(shù)據(jù),限定時(shí)間為2003至2013,時(shí)間跨度為1,選取節(jié)點(diǎn)類(lèi)型為共引文獻(xiàn)(Cited Reference),運(yùn)行后進(jìn)行可視化,得到共引文獻(xiàn)聚類(lèi)的混合網(wǎng)絡(luò),如圖1所示。圖示中的網(wǎng)絡(luò)共有170個(gè)節(jié)點(diǎn),836條鏈接。
從圖1可以看出,此聚類(lèi)圖的發(fā)展途徑呈現(xiàn)出從左上角到右下角的演化,出現(xiàn)三個(gè)明顯的聚類(lèi):最先出現(xiàn)了左上角的藍(lán)色聚類(lèi),主要聚焦于蛋白質(zhì)組學(xué)(proteomy);隨后出現(xiàn)了以湖藍(lán)色聚類(lèi),在這之后分為了兩個(gè)不同的研究領(lǐng)域,研究?jī)?nèi)容分別為大神經(jīng)網(wǎng)絡(luò)(large neural network)與特殊謂語(yǔ)(special predicate);最后出現(xiàn)的是以橙色和黃色的聚類(lèi),內(nèi)容涵蓋遺傳算法(genetic al?gorithms)、機(jī)器學(xué)習(xí)(machine learning)、基礎(chǔ)神經(jīng)網(wǎng)絡(luò)(funda?mentals neural)、遺傳編程(genetic programming)、計(jì)算機(jī)智能(IEEE Cevol computer)等新領(lǐng)域。黃色和橙色部分聚類(lèi)連線較多,聯(lián)系緊密,是目前人工智能領(lǐng)域研究的核心區(qū)域。

圖 1 基于DCA的人工智能引文聚類(lèi)圖譜
中間中心性和被引次數(shù)均排在前列的文章是Goldberg DE于1989發(fā)表的有關(guān)遺傳算法的文章,共被引32次,中心度為0.18,是該群體最具影響力的作者。這一文章可以說(shuō)是人工智能領(lǐng)域的奠基之作,且仍處于目前研究的核心領(lǐng)域。從綠色到黃色、橙色的過(guò)渡并沒(méi)有明顯的節(jié)點(diǎn)。藍(lán)色和湖藍(lán)色的部分都相對(duì)孤立的,但左下方的湖藍(lán)色部分文章節(jié)點(diǎn)都是紅色,這表明這一領(lǐng)域的文章還是處于研究前沿。綠色節(jié)點(diǎn)較為分散,表明這一領(lǐng)域的研究出現(xiàn)時(shí)間較短或者研究尚淺,或是研究中遇到了難題,因此分布比較分散。自2008年之后的黃色與橙色的聚類(lèi)網(wǎng)絡(luò)相對(duì)緊密,這說(shuō)明這些領(lǐng)域是目前研究的熱點(diǎn),且取得了較多的創(chuàng)新和成果,相互間聯(lián)系比較緊密,分布比較集中。
在CiteSpace中,選取節(jié)點(diǎn)類(lèi)型為共引著者(Cited Author)進(jìn)行分析,進(jìn)入可視化界面,得到文章共引著者的聚類(lèi)混合網(wǎng)絡(luò),如圖2所示。

圖 2 基于ACA的人工智能引文聚類(lèi)圖譜
由圖可知,共引作者與共引文獻(xiàn)的走向大致相同,藍(lán)色與湖藍(lán)色(2004至2005年)與其他文獻(xiàn)之間聯(lián)系不緊密,共引現(xiàn)象不多。在2005年之后共引開(kāi)始增多,多個(gè)研究領(lǐng)域相互交叉,共引率較高。但同時(shí)也可以看出,2005年之后出現(xiàn)的研究相對(duì)比較分散,形成了多個(gè)分叉研究領(lǐng)域,且每個(gè)領(lǐng)域尚沒(méi)有形成一個(gè)系統(tǒng),雖然彼此間聯(lián)系緊密,但從人工智能整個(gè)研究領(lǐng)域來(lái)說(shuō),目前所做的研究尚淺,研究的整體性不強(qiáng),還有許多內(nèi)容需要探索。
CiteSpace也給出了基于ACA人工智能的共引記錄,其中共引率最高的是Haykin S,被引次數(shù)為64次。被引次數(shù)排名第二的為前面提到的Goldberg DE,中心度為0.18,可以說(shuō)是人工智能研究領(lǐng)域內(nèi)最具有影響力的權(quán)威專(zhuān)家。其他具有影響力的專(zhuān)家還有Zadeh LA,Newell A、Holland JH、Rumelhart DE、Kennnedy J、Mccarthy J等。
根據(jù)統(tǒng)計(jì)得知,人工智能研究領(lǐng)域共有126種共引期刊。在CiteSpace中,選取節(jié)點(diǎn)類(lèi)型為共引期刊Cited Journal進(jìn)行可視化,可以直觀地看出該領(lǐng)域最重要的期刊有ARTIF INTELL、SCIENCE,以及LNCS、LECT NOTESARTIF INT等。同時(shí)視圖也展示出了人工智能隨著時(shí)間共引情況的發(fā)展變化情況:人工智能的研究起始于五六十年代,事實(shí)上,“人工智能”一詞最初是在1956年Dartmouth學(xué)會(huì)上提出的[3]。從那以后,研究者們發(fā)展了眾多理論和原理,人工智能的概念也隨之?dāng)U展。自80年代以來(lái),人工智能取得了較大的進(jìn)展,人工智能的研究不斷向多個(gè)方向和領(lǐng)域延伸,并取得了很大的成就,許多文獻(xiàn)見(jiàn)諸一些世界級(jí)權(quán)威期刊。
通過(guò)人工智能共引記錄的共引次數(shù)與中心度的排序可以更明確地看出人工智能的共引期刊分布情況,繼而定義該領(lǐng)域的十大核心期刊。排名第一的期刊是ARTIF INTELL,被引次數(shù)(183次)最高,中心度(0.63)最大,是該領(lǐng)域最具有影響力的核心期刊。緊隨其后的是SCIENCE,也是很有該領(lǐng)域內(nèi)最有影響力的核心期刊之一;NATURE、LNCS、LECTNOTESARTIF INT、LECTNOTESCOMPUT SC這四種期刊次于前兩種期刊,影響力處于第二核心等級(jí);COMPUT IND、IEEE TNEURAL NETWOR、EUR JOPER RES、DATA KNOWL ENG這四種期刊影響力弱于其前的四種期刊。
本文利用web of science數(shù)據(jù)庫(kù)的檢索數(shù)據(jù)對(duì)人工智能(2004-2010年)進(jìn)行基于CiteSpace的科學(xué)知識(shí)圖譜分析,根據(jù)圖譜我們分析得知,人工智能的研究已經(jīng)持續(xù)多年,在近些年來(lái)更是取得了非凡的進(jìn)展,研究熱點(diǎn)主要集中在遺傳算法、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方面。但總體來(lái)看,人工智能領(lǐng)域的研究尚不成熟,研究主題分布較為分散,主題之間聯(lián)系不緊密。此外,本文通過(guò)定量分析,得出這一研究領(lǐng)域內(nèi)具有較大影響力的核心文獻(xiàn)、著者和期刊,有助于從宏觀上把握人工智能的發(fā)展過(guò)程和現(xiàn)狀,指導(dǎo)人工智能領(lǐng)域研究的進(jìn)一步發(fā)展。
[1]胡國(guó)華,袁樹(shù)杰.人工智能研究現(xiàn)狀與展望[J].淮南師范學(xué)院學(xué)報(bào),2006,8(37):22-24.
[2]劉樹(shù)安.人工智能研究領(lǐng)域及其社會(huì)影響[J].合作經(jīng)濟(jì)與科技,2012(19):126-128.
[3]丁世飛.人工智能[M].北京:清華大學(xué)出版社,2011.
TP18
A
1671-0037(2014)06-88-1.5
2014年度河南省社科聯(lián)、河南省經(jīng)團(tuán)聯(lián)調(diào)研課題《基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)信息資源融和利用機(jī)制研究》,項(xiàng)目編號(hào)為:SKL-2014-765。
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務(wù)。