陳文娟
(河南財(cái)經(jīng)政法大學(xué),河南 鄭州 450002)
基于CNKI的關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展計(jì)量分析
陳文娟
(河南財(cái)經(jīng)政法大學(xué),河南 鄭州 450002)
本文以CNKI中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)為文獻(xiàn)來(lái)源,借助CNKI分析功能和Excel軟件,針對(duì)2008-2013年我國(guó)關(guān)聯(lián)數(shù)據(jù)學(xué)術(shù)研究進(jìn)展,從年載文量、文獻(xiàn)來(lái)源、著者、關(guān)鍵詞、引文等多方面進(jìn)行計(jì)量分析,從而揭示我國(guó)近年來(lái)關(guān)聯(lián)數(shù)據(jù)的研究特點(diǎn)。
關(guān)聯(lián)數(shù)據(jù);計(jì)量分析;CNKI
關(guān)聯(lián)數(shù)據(jù)概念的提出最初緣于互聯(lián)網(wǎng)上普遍存在的信息異構(gòu)、信息孤島等問(wèn)題,2006年萬(wàn)維網(wǎng)的發(fā)明者Tim Berners-Lee[1]在語(yǔ)義網(wǎng)的基礎(chǔ)上提出發(fā)展關(guān)聯(lián)數(shù)據(jù)之網(wǎng)的構(gòu)想,并指出其核心和關(guān)鍵是關(guān)聯(lián)數(shù)據(jù)。此后,關(guān)聯(lián)數(shù)據(jù)迅速得到了圖書情報(bào)界、信息界、政府機(jī)構(gòu)及相關(guān)企業(yè)的廣泛關(guān)注和重視,自2008年引入我國(guó)以來(lái),國(guó)內(nèi)學(xué)者對(duì)其研究熱情也逐漸高漲。
2.1 數(shù)據(jù)來(lái)源與分析方法
本文以中國(guó)知網(wǎng)(CNKI)的中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)為來(lái)源,借助于CNKI數(shù)據(jù)分析和Excel統(tǒng)計(jì)功能,截取2008—2013年6年內(nèi)有關(guān)關(guān)聯(lián)數(shù)據(jù)的文獻(xiàn)進(jìn)行計(jì)量分析,以期揭示出我國(guó)關(guān)聯(lián)數(shù)據(jù)研究的演變態(tài)勢(shì)。具體檢索策略是在“篇名”為“關(guān)聯(lián)數(shù)據(jù)”,時(shí)間從2008年到2013年,在CNKI中共檢索到文獻(xiàn)153篇,去除一些會(huì)議通知、重復(fù)等錯(cuò)檢項(xiàng)后,得到文獻(xiàn)147篇。
2.2 年代分布與來(lái)源期刊分布
通過(guò)對(duì)一段時(shí)期內(nèi)某主題領(lǐng)域的年發(fā)文量的統(tǒng)計(jì)分析可以了解該領(lǐng)域的發(fā)展態(tài)勢(shì)。通過(guò)統(tǒng)計(jì),2008年篇名為關(guān)聯(lián)數(shù)據(jù)的文獻(xiàn)僅有4篇,從2010年開始,關(guān)聯(lián)數(shù)據(jù)的研究有了較快的發(fā)展,文獻(xiàn)量逐年遞增,到2013年論文達(dá)到58篇。我國(guó)2008—2013年關(guān)聯(lián)數(shù)據(jù)的年代分布如圖1所示。

圖 1 關(guān)聯(lián)數(shù)據(jù)文獻(xiàn)年代分布
根據(jù)統(tǒng)計(jì),刊載關(guān)聯(lián)數(shù)據(jù)相關(guān)文獻(xiàn)的來(lái)源期刊分布也相對(duì)集中,近75%的文獻(xiàn)分布于圖書情報(bào)領(lǐng)域的9種期刊中。其中,刊載量最多的是《現(xiàn)代圖書情報(bào)技術(shù)》,載文21篇,其次是《圖書情報(bào)工作》,載文19篇,隨后依次是《中國(guó)圖書館學(xué)報(bào)》(載文10篇)、《圖書館學(xué)研究》(載文10篇)、《圖書與情報(bào)》(載文6篇)等,上述幾種期刊均為中文社會(huì)科學(xué)引文索引CSSCI來(lái)源期刊,反映了關(guān)聯(lián)數(shù)據(jù)領(lǐng)域高質(zhì)量的研究成果較多。根據(jù)布拉德福定律的描述,《現(xiàn)代圖書情報(bào)技術(shù)》、《圖書情報(bào)工作》是目前我國(guó)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的核心期刊。圖2顯示了關(guān)聯(lián)數(shù)據(jù)來(lái)源期刊的分布情況。

圖 2 關(guān)聯(lián)數(shù)據(jù)來(lái)源期刊分布
2.3 著者及研究機(jī)構(gòu)、基金分布

伴隨著關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域著者的集中與分散的分布特點(diǎn),研究機(jī)構(gòu)也呈現(xiàn)出集中與分散的趨勢(shì)。根據(jù)CNKI的統(tǒng)計(jì),關(guān)聯(lián)數(shù)據(jù)的學(xué)科研究隊(duì)伍主要分布在中國(guó)科學(xué)院國(guó)家科學(xué)圖書館(13篇)、上海圖書館(7篇)、武漢大學(xué)(7篇)、中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所(5篇)、浙江大學(xué)(5篇)。這些也是在信息界、圖書情報(bào)界具有較大影響力的學(xué)術(shù)機(jī)構(gòu),具有較強(qiáng)的科研實(shí)力,足見關(guān)聯(lián)數(shù)據(jù)這一新興概念自引入國(guó)內(nèi)以來(lái)便受到了極大的重視,成為圖書情報(bào)研究領(lǐng)域一個(gè)新的研究陣地,相關(guān)的研究成果具有較高的學(xué)術(shù)水平和社會(huì)影響力。
2.4 關(guān)鍵詞分析
通過(guò)對(duì)關(guān)鍵詞及其詞頻的統(tǒng)計(jì)分析,能夠揭示該領(lǐng)域現(xiàn)階段的研究熱點(diǎn)和發(fā)展趨勢(shì)。根據(jù)CNKI統(tǒng)計(jì),得出147篇關(guān)聯(lián)數(shù)據(jù)論文中頻次大于5的關(guān)鍵詞共計(jì)10個(gè),如表2所示。關(guān)聯(lián)數(shù)據(jù)作為一個(gè)新興的研究領(lǐng)域,在國(guó)內(nèi)尚未形成清晰的脈絡(luò)和學(xué)術(shù)派別。研究主題大致可概括為四個(gè)方面:關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)理論、語(yǔ)義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)技術(shù)、關(guān)聯(lián)數(shù)據(jù)應(yīng)用等。目前,對(duì)于關(guān)聯(lián)數(shù)據(jù)的概念、研究進(jìn)展、研究意義等基礎(chǔ)理論所做的研究最多;語(yǔ)義網(wǎng)、數(shù)據(jù)網(wǎng)絡(luò)作為關(guān)聯(lián)數(shù)據(jù)的發(fā)展環(huán)境和發(fā)展目標(biāo),與關(guān)聯(lián)數(shù)據(jù)的研究密不可分;關(guān)聯(lián)數(shù)據(jù)的發(fā)展又依賴于技術(shù)的發(fā)展,RDF、知識(shí)組織、知識(shí)發(fā)現(xiàn)等關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)逐漸受到關(guān)注,將成為未來(lái)關(guān)聯(lián)數(shù)據(jù)的研究重點(diǎn);圖書館和網(wǎng)絡(luò)是關(guān)聯(lián)數(shù)據(jù)應(yīng)用的主要陣地,也是未來(lái)關(guān)聯(lián)數(shù)據(jù)研究的前沿和重點(diǎn)。

表 2 關(guān)聯(lián)數(shù)據(jù)關(guān)鍵詞分布
2.5 引文分析
根據(jù)“H指數(shù)”理論[4],某研究領(lǐng)域文獻(xiàn)中至少有N篇文獻(xiàn)被引頻次不少于N次,該領(lǐng)域文獻(xiàn)的H指數(shù)就是N。通過(guò)對(duì)147篇文獻(xiàn)進(jìn)行統(tǒng)計(jì),得知關(guān)聯(lián)數(shù)據(jù)文獻(xiàn)的H指數(shù)為14,這個(gè)數(shù)值并不高,進(jìn)一步說(shuō)明了國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究還處于初級(jí)階段,學(xué)術(shù)產(chǎn)出還不豐富,學(xué)術(shù)影響力也有待提高。
這14篇文獻(xiàn)中,引用頻次最高的是黃永文的《關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述》(被引50次),其次是劉煒的《關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望》(被引46次),以及沈志宏的《關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述》(被引42次),其余文獻(xiàn)被引頻率均在30次以下。內(nèi)容主要集中在關(guān)聯(lián)數(shù)據(jù)的基礎(chǔ)理論、語(yǔ)義關(guān)聯(lián)以及應(yīng)用展望等方面。這些文獻(xiàn)的作者大都是我國(guó)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的核心著者,進(jìn)一步體現(xiàn)了這些作者在關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的影響力和核心地位。
通過(guò)借助CNKI分析功能和Excel軟件,對(duì)關(guān)聯(lián)數(shù)據(jù)相關(guān)研究成果的統(tǒng)計(jì)和分析,可以看出關(guān)聯(lián)數(shù)據(jù)自引入國(guó)內(nèi)以來(lái)迅速引起了圖書情報(bào)學(xué)界的重視,目前已經(jīng)取得了一定的學(xué)術(shù)成果,涌現(xiàn)出了一批核心領(lǐng)軍研究學(xué)者,但總體上還處于學(xué)科誕生起,尚未形成清晰的研究脈絡(luò)和學(xué)術(shù)派別,研究?jī)?nèi)容主要體現(xiàn)在基礎(chǔ)理論方面,有關(guān)技術(shù)和應(yīng)用方面的研究將會(huì)是未來(lái)的研究熱點(diǎn)和發(fā)展趨勢(shì)。
[1]Berners-Lee T.Linked Data-Design Issues[EB/OL].[2014-03-14].http//www.w3c.org/DesignIssues/LinkedData.htm l.
[2]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報(bào),2011(2):5-12.
[3]邱均平.信息計(jì)量學(xué)[M].武漢:武漢大學(xué)出版社,2007:191-195.
[4]Hirsch,Jorge E.An index to quantify an individual's scientific research output:PNAS,2005:102(46):16569-1657.
G353.1
A
1671-0037(2014)05-42-1.5
陳文娟(1988.3-),女,碩士,助理館員,研究方向:信息資源管理與服務(wù)。