999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究現(xiàn)狀分析

2018-12-04 09:39:44支鳳穩(wěn)鄭彥寧杜薇薇
現(xiàn)代情報(bào) 2018年12期
關(guān)鍵詞:語(yǔ)義資源研究

支鳳穩(wěn) 鄭彥寧 杜薇薇

(1.河北大學(xué)管理學(xué)院,河北 保定 071002;2.中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)

2000年12月18日,萬(wàn)維網(wǎng)創(chuàng)始人Tim Berners-Lee在XML2000會(huì)議上正式提出了語(yǔ)義網(wǎng)概念,并在2001年對(duì)語(yǔ)義網(wǎng)體系架構(gòu)進(jìn)行了論述。依據(jù)Tim等的描述,語(yǔ)義網(wǎng)不同于以前的網(wǎng)絡(luò),是一個(gè)機(jī)器可理解的立體網(wǎng)絡(luò),包括7個(gè)層級(jí),由低到高依次為:Unicode和URI、XML+NS+XML Schema、RDF和RDF Schema、Ontology Vocabulary、Logic、Proof、Trust[1]。由上可知,語(yǔ)義網(wǎng)研究關(guān)聯(lián)多個(gè)學(xué)科:計(jì)算機(jī)科學(xué)、圖書情報(bào)等,涉及多個(gè)主題領(lǐng)域:語(yǔ)義組織、語(yǔ)義檢索、機(jī)器推理、語(yǔ)義服務(wù)等。語(yǔ)義網(wǎng)將是未來(lái)WWW發(fā)展的主要方向,作為WWW環(huán)境下開展的重要服務(wù),數(shù)字圖書館將因此獲得新的發(fā)展契機(jī),但同時(shí)語(yǔ)義網(wǎng)理論及技術(shù)也將對(duì)已有資源標(biāo)注及主題關(guān)聯(lián)方式等提出了更高要求。數(shù)字圖書館是館藏電子資源服務(wù)的窗口和平臺(tái),在海量信息環(huán)境下,其所提供使用資源列表也在不斷增多,不同分布式數(shù)據(jù)庫(kù)資源異構(gòu)、用于資源標(biāo)注主題詞的不一致、資源主題聚合粒度過(guò)粗等語(yǔ)義化問(wèn)題日漸凸顯。鑒于此,語(yǔ)義網(wǎng)規(guī)范化的體系架構(gòu)將在數(shù)字圖書館資源語(yǔ)義化建設(shè)中起到正向增益作用,如借助本體改變傳統(tǒng)書目組織基于MARC的線性的一維結(jié)構(gòu),提升資源檢索效率[2];實(shí)現(xiàn)基于語(yǔ)義的館藏?cái)?shù)字資源深度聚合[3];加強(qiáng)詞表資源關(guān)聯(lián),提升資源標(biāo)注語(yǔ)義水平[4]等。國(guó)內(nèi)外學(xué)者從不同的視角進(jìn)行了相關(guān)研究:國(guó)外學(xué)者Guns討論了資源描述框架(RDF)中的數(shù)據(jù)網(wǎng)絡(luò)為何以及如何被稱為Web的問(wèn)題,并基于(語(yǔ)義)Web的早期設(shè)計(jì)文檔進(jìn)行分析,認(rèn)為已經(jīng)出現(xiàn)在早期的web標(biāo)準(zhǔn)和草案中的鏈接類型和在線元數(shù)據(jù)是主要決定因素,發(fā)現(xiàn)語(yǔ)義網(wǎng)與早期的人工智能工作直接相關(guān)[5]。Neish描述了關(guān)聯(lián)數(shù)據(jù)是如何在澳大利亞和全球的圖書館及相關(guān)機(jī)構(gòu)中應(yīng)用的,并通過(guò)關(guān)聯(lián)數(shù)據(jù)應(yīng)用實(shí)踐的案例來(lái)說(shuō)明一些項(xiàng)目比其他項(xiàng)目更成功的原因[6]。國(guó)內(nèi)相關(guān)研究成果主要體現(xiàn)在如下方面:1)關(guān)注理論框架構(gòu)建。如邱均平等引入了計(jì)量分析方法,構(gòu)建了基于計(jì)量分析的館藏資源語(yǔ)義化理論模型[7];張洋等提出基于資源本體的館藏資源語(yǔ)義化理論體系框架以及語(yǔ)義體系層次結(jié)構(gòu)模型,形成了更有效的館藏資源知識(shí)組織方法[8]。2)關(guān)注館藏資源語(yǔ)義化技術(shù)。樓雯從微觀層面設(shè)計(jì)了館藏資源語(yǔ)義化模型,描述了館藏資源語(yǔ)義化的關(guān)鍵技術(shù),并進(jìn)行了實(shí)證檢驗(yàn)[9]。3)關(guān)注資源的聚合服務(wù)方式及實(shí)現(xiàn)。如賀德方等探討了基于語(yǔ)義的館藏資源聚合方式,構(gòu)建了館藏資源聚合服務(wù)所需要的語(yǔ)義描述框架和可視化展示機(jī)制[10];韓璽等從多維度聚合和語(yǔ)義關(guān)聯(lián)兩個(gè)方面分析了數(shù)字資源聚合的理論基礎(chǔ),構(gòu)建了基于語(yǔ)義關(guān)聯(lián)的圖書館移動(dòng)視覺(jué)搜索資源多維度聚合模型,并分析了圖書館移動(dòng)視覺(jué)搜索服務(wù)的實(shí)現(xiàn)流程[11]。4)關(guān)注計(jì)量學(xué)研究綜述的應(yīng)用,如趙蓉英等借助文獻(xiàn)計(jì)量學(xué)和共現(xiàn)分析的方法對(duì)國(guó)內(nèi)外館藏資源語(yǔ)義化研究進(jìn)展進(jìn)行了對(duì)比分析[12],這是該領(lǐng)域的最新研究綜述。可見,國(guó)內(nèi)外學(xué)者在館藏(數(shù)字)資源語(yǔ)義化研究不斷取得進(jìn)展,為相關(guān)學(xué)者提借了重要的理論借鑒與實(shí)證證據(jù),然而,近幾年來(lái)的研究進(jìn)展特別國(guó)外的研究現(xiàn)狀并不清晰。館藏?cái)?shù)字資源語(yǔ)義化工作開展始于國(guó)外,為了弄清楚這一研究領(lǐng)域進(jìn)展,本研究以WOS數(shù)據(jù)庫(kù)相關(guān)文獻(xiàn)資源為對(duì)象進(jìn)行計(jì)量分析,并分析揭示文獻(xiàn)的時(shí)間分布、作者分布、地區(qū)(機(jī)構(gòu))分布、主題分布等,總結(jié)梳理國(guó)外在館藏?cái)?shù)字資源語(yǔ)義化方面的研究進(jìn)展,以全面了解目前的研究現(xiàn)狀,為國(guó)內(nèi)相關(guān)工作開展提供參考。

1 文獻(xiàn)來(lái)源

Web of Knowledge(WOS)是由美國(guó)科學(xué)情報(bào)所(ISI)開發(fā)的信息檢索平臺(tái),它包括SCI、SSCI、A&HCI等7個(gè)子庫(kù),索引9 000多種世界范圍內(nèi)最具影響力的、經(jīng)過(guò)同行專家評(píng)審的高質(zhì)量的期刊,其數(shù)據(jù)庫(kù)資源每周更新。用戶可以通過(guò)WOS檢索關(guān)于自然科學(xué)、社會(huì)科學(xué)、藝術(shù)與人文學(xué)科的文獻(xiàn)信息,并可以同時(shí)對(duì)多個(gè)數(shù)據(jù)庫(kù)進(jìn)行單庫(kù)或跨庫(kù)檢索。因此,對(duì)WOS中收錄的有關(guān)館藏?cái)?shù)字資源語(yǔ)義化的文獻(xiàn)進(jìn)行計(jì)量分析,有助于了解世界范圍內(nèi)館藏?cái)?shù)字資源語(yǔ)義化研究的現(xiàn)狀及代表性成果。

在文獻(xiàn)來(lái)源甄選階段,本研究依次開展了以下工作:①確認(rèn)檢索數(shù)據(jù)庫(kù)。本文選取的數(shù)據(jù)庫(kù)依次為科學(xué)引文索引(SCI-E)、社會(huì)科學(xué)引文索引(SSCI)、藝術(shù)與人文科學(xué)引文索引(A&HCI)、科技會(huì)議錄引文索引(CPCI-S)。②確認(rèn)檢索式和檢索年限。數(shù)據(jù)庫(kù)選擇好之后,需要對(duì)研究主題進(jìn)行凝練,提取主題詞并構(gòu)造檢索式。依據(jù)文章主題提取兩個(gè)主題詞:館藏?cái)?shù)字資源和語(yǔ)義,并確認(rèn)主題詞對(duì)應(yīng)的翻譯名:Library Digital Collection和Semantic,考慮英文中存在同根詞(如Semantical、Semantic、Semantically、Semantics),因此使用通配符(?、*等)來(lái)輔助檢索式構(gòu)造,最終得到的檢索式為:Topic=(Library Digital Collection)AND(Semantic*)。鑒于語(yǔ)義網(wǎng)概念正式提出是在2000年,考慮到之前所做的預(yù)研究,選擇文獻(xiàn)發(fā)表時(shí)間跨度為:1996-2018年。③篩選檢索記錄。初次檢索后得到127條記錄(檢索日期為2018年7月5日),對(duì)每篇論文的摘要進(jìn)行了瀏覽,刪除主題不太相關(guān)的5篇論文,最后保留得到122條記錄,包括78篇會(huì)議論文和54篇期刊文章(部分論文既出現(xiàn)在論文集中,又發(fā)表于期刊,這種情況按期刊論文處理),這些論文主要分布在計(jì)算機(jī)科學(xué)信息系統(tǒng)、計(jì)算機(jī)科學(xué)人工智能、計(jì)算機(jī)科學(xué)軟件工程、信息科學(xué)等學(xué)科領(lǐng)域。保存這些記錄的題錄信息,包括題名、作者、關(guān)鍵詞、國(guó)家、機(jī)構(gòu)、發(fā)表時(shí)間、被引次數(shù)等字段,以此為基礎(chǔ)展開國(guó)外館藏?cái)?shù)字資源語(yǔ)義化的文獻(xiàn)計(jì)量分析工作。

2 國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究的時(shí)空分布

基于題錄中的字段信息,本研究對(duì)國(guó)外館藏?cái)?shù)字資源語(yǔ)義化文獻(xiàn)的時(shí)間分布、地域分布、作者分布等情況進(jìn)行了統(tǒng)計(jì)分析,從而揭示出世界范圍內(nèi)該主題領(lǐng)域研究的發(fā)展態(tài)勢(shì)、熱點(diǎn)國(guó)家、典型機(jī)構(gòu)和核心作者。

2.1 文獻(xiàn)時(shí)間分布

文獻(xiàn)時(shí)間分布規(guī)律描述了文獻(xiàn)在過(guò)去一段時(shí)間內(nèi)產(chǎn)出的效率及影響力,因此文獻(xiàn)時(shí)間分布研究包括文獻(xiàn)數(shù)量時(shí)間分布和文獻(xiàn)被引時(shí)間分布[13],通過(guò)這兩個(gè)維度可以評(píng)測(cè)該主題領(lǐng)域發(fā)展態(tài)勢(shì)和預(yù)測(cè)其未來(lái)發(fā)展。從保存題錄信息中提取出年限、被引次數(shù)等基本字段,按照年限分組獲得每年發(fā)文章量、論文被引總次數(shù)。這些統(tǒng)計(jì)指標(biāo)在一定程度上反映該主題領(lǐng)域?qū)W術(shù)研究的理論水平和發(fā)展速度,近23年有關(guān)文章數(shù)及被引的時(shí)間分布如圖1所示。

通過(guò)圖1可得出以下結(jié)論:1)館藏?cái)?shù)字資源語(yǔ)義化研究始于1996年,之后文章產(chǎn)出量呈現(xiàn)出遞增趨勢(shì),2007年達(dá)到高峰,達(dá)到13篇,以后文章產(chǎn)出量有所下降,呈現(xiàn)出高低震蕩的態(tài)勢(shì),但幅度不大。總體分析可知,該主題領(lǐng)域的研究相對(duì)穩(wěn)定,還有待在基礎(chǔ)理論和關(guān)鍵技術(shù)方面取得突破性研究。

2)從1996年開始,論文的被引次數(shù)呈現(xiàn)上升趨勢(shì),并在2000年達(dá)到第一個(gè)峰值,之后論文被引次數(shù)呈現(xiàn)震蕩態(tài)勢(shì)。2015年度文章對(duì)于該主題領(lǐng)域發(fā)展具有較大影響,被引頻次達(dá)到61次,推測(cè)應(yīng)該是該學(xué)科的開創(chuàng)性或奠基性成果。2007年發(fā)文數(shù)量最大,共13篇,被引次數(shù)為23,篇均被引次數(shù)只有1.77。總體上來(lái)看,發(fā)文數(shù)量與被引次數(shù)呈現(xiàn)出一致性的分布(個(gè)別年份除外,如2018年的文獻(xiàn)還未全部出版)。

圖1 1996-2018年發(fā)文數(shù)量與被引頻次的時(shí)間分布

2.2 文獻(xiàn)地域分布

文獻(xiàn)地域分布規(guī)律旨在揭示該主題領(lǐng)域的熱點(diǎn)研究區(qū)域和研究機(jī)構(gòu),對(duì)于科研合作及其國(guó)家、機(jī)構(gòu)影響力評(píng)價(jià)研究都能起到良好的導(dǎo)向作用。CiteSpace能夠通過(guò)識(shí)別并可視化表示文獻(xiàn)的地域分布、作者、期刊、關(guān)鍵詞、被引文獻(xiàn)等信息的關(guān)系,從而展現(xiàn)一個(gè)學(xué)科或知識(shí)領(lǐng)域在一定時(shí)間的發(fā)展趨勢(shì)與動(dòng)向。本研究提取題錄信息中的國(guó)家(地區(qū))、機(jī)構(gòu)、題目等字段值,分別以國(guó)家或者機(jī)構(gòu)為分組類別,借助CiteSpace軟件統(tǒng)計(jì)每一國(guó)家(地區(qū))或者機(jī)構(gòu)在統(tǒng)計(jì)年限內(nèi)的發(fā)文量,近23年文獻(xiàn)國(guó)家(地區(qū))和機(jī)構(gòu)分布情況見圖2和表1。

圖2 文獻(xiàn)國(guó)家(地區(qū))分布

圖2中節(jié)點(diǎn)代表國(guó)家(地區(qū)),節(jié)點(diǎn)大小表示發(fā)文量多少,節(jié)點(diǎn)越大,表明該國(guó)家(地區(qū))的發(fā)文量越多,節(jié)點(diǎn)之間的連線代表國(guó)家之間存在合作關(guān)系。統(tǒng)計(jì)結(jié)果顯示,122篇文獻(xiàn)是由37個(gè)國(guó)家或地區(qū)撰寫的,發(fā)文3篇以上的國(guó)家有15個(gè),其中美國(guó)發(fā)文29篇,德國(guó)發(fā)文12篇,西班牙發(fā)文10篇,英國(guó)和意大利均發(fā)文8篇,法國(guó)發(fā)文6篇,中國(guó)臺(tái)灣地區(qū)發(fā)文5篇,日本發(fā)文4篇,和奧地利、加拿大、希臘、印度、巴基斯坦、波蘭和韓國(guó)均發(fā)文3篇,前15個(gè)國(guó)家共發(fā)文104篇,占總發(fā)文量的85.25%。可見,不同國(guó)家在館藏?cái)?shù)字資源語(yǔ)義化研究中存在著較大差距,美國(guó)和歐洲是該主題領(lǐng)域研究的熱點(diǎn)國(guó)家或地區(qū),美國(guó)相關(guān)文獻(xiàn)數(shù)量最多,德國(guó)次之,其中排名前15為國(guó)家中,歐洲占據(jù)7個(gè),北美占據(jù)2個(gè),亞洲占據(jù)5個(gè)(中國(guó)臺(tái)灣地區(qū)和日本),大洋洲占據(jù)1個(gè),非洲和南美洲在該領(lǐng)域鮮有文章。

表1 文獻(xiàn)機(jī)構(gòu)分布

由表1(只統(tǒng)計(jì)了發(fā)文量大于等于3的機(jī)構(gòu))可知,發(fā)文比較多的機(jī)構(gòu)大部分為大學(xué)(UNIV),通過(guò)數(shù)值觀察發(fā)現(xiàn),發(fā)文最多的機(jī)構(gòu)是Univ Illinois(6篇),其次是Univ Belgrade(6篇),前10的機(jī)構(gòu)共發(fā)文40篇,占文獻(xiàn)總量的32.79%。機(jī)構(gòu)發(fā)文量差別不是很明顯(極差為6),但是可以推測(cè)的是發(fā)文量較多的機(jī)構(gòu)大部分都在美國(guó)和歐洲,其他國(guó)家或地區(qū)研究工作亟待拓展和開啟。最后,多種機(jī)構(gòu)類型參與到館藏?cái)?shù)字資源語(yǔ)義化研究進(jìn)程中有利于該主題領(lǐng)域快速發(fā)展起來(lái),如IBM CORP開發(fā)的數(shù)字圖書館系統(tǒng)平臺(tái)在我國(guó)數(shù)字圖書館建設(shè)中發(fā)揮著重要作用[14]。

3 國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究的作者分布

文獻(xiàn)作者分布規(guī)律旨在揭示該主題領(lǐng)域內(nèi)的核心作者,核心作者的提取存在著兩種方法:主觀提取方法和客觀提取方法。主觀提取方法就是要選取描述作者類(見圖3)的屬性或者操作,根據(jù)統(tǒng)計(jì)值高低排序,并設(shè)定相應(yīng)閾值來(lái)提取核心作者的過(guò)程。客觀提取方法是通過(guò)分析文獻(xiàn)作者分布規(guī)律,借助以往經(jīng)驗(yàn)公式來(lái)提取核心作者的過(guò)程。雖然兩種方法各有優(yōu)缺點(diǎn),但主觀方法操作簡(jiǎn)單,應(yīng)用更加廣泛,本研究也采用主觀提取的方法。圖3中作者和文章之間是發(fā)布關(guān)系(issue),文章和關(guān)鍵詞之間是組成關(guān)系(composite),在此主觀提取方法僅利用發(fā)布關(guān)系及其關(guān)聯(lián)實(shí)體,組成關(guān)系及其關(guān)聯(lián)實(shí)體在第4部分應(yīng)用,有關(guān)實(shí)體及其多重性描述可參考UML內(nèi)容[15],在此不再贅述。

本研究的122篇文獻(xiàn)共由359個(gè)作者撰寫,其中105篇文獻(xiàn)是由多個(gè)作者共同完成,17篇文獻(xiàn)是由單個(gè)作者獨(dú)立完成。發(fā)文量為4的作者有3人,他們是來(lái)自東京大學(xué)的KUO PJ、AOKI T、YASUDA H;發(fā)文量為3的作者為來(lái)自美國(guó)的亞利桑那大學(xué)的CHEN HC,發(fā)文量為2的作者有16人,發(fā)文量為1的作者有339人。設(shè)定主觀提取方法的閾值為2,提取核心作者列表,如表2所示。

本研究還借助中國(guó)科學(xué)院國(guó)家科學(xué)圖書館研發(fā)的文獻(xiàn)計(jì)量在線分析平臺(tái)繪制了作者合作網(wǎng)絡(luò),對(duì)作合作情況進(jìn)行可視化展示,以直觀地了解國(guó)外館藏資源語(yǔ)義化研究的核心作者和合作團(tuán)體,如圖4所示。圖中節(jié)點(diǎn)代表發(fā)文作者,節(jié)點(diǎn)之間的連線代表作者之間存在合作關(guān)系。作者合作關(guān)系反映了該領(lǐng)域的研究力量分布情況,合作程度越高,越有利于加深該領(lǐng)域的縱向研究和結(jié)合其他學(xué)科領(lǐng)域的橫向發(fā)展[12]。文獻(xiàn)的合作度(作者總數(shù)/論文總數(shù))與合作率(合作論文數(shù)/論文總數(shù)×100%)是反映合作程度的重要指標(biāo),據(jù)此可以算出國(guó)外館藏資源語(yǔ)義化研究的合作程度,合作度為2.94,說(shuō)明平均每篇論文由3個(gè)作者共同,合作率為86.07%,約有13.93%的論文是單個(gè)作者獨(dú)立完成的。

圖3 作者(Expert)——文章(Knowledge)屬性特征及關(guān)系特征描述

表2 核心作者列表

由表2可知,KUO PJ、AOKI T、YASUDA H和CHEN HC是館藏?cái)?shù)字資源語(yǔ)義化研究領(lǐng)域的核心作者。進(jìn)一步分析表2和圖4可以發(fā)現(xiàn),KUO PJ作為第一和通訊作者,AOKI T和YASUDA H分別為第二和第三作者,合作發(fā)表了4篇會(huì)議論文,3人形成合作網(wǎng)絡(luò)A。可見,東京大學(xué)在該領(lǐng)域的研究實(shí)力較強(qiáng),然而,遺憾的是這些論文是日本在該領(lǐng)域的所有成果,其他機(jī)構(gòu)在該領(lǐng)域還未取得突破。這些論文發(fā)表于2004-2005年,至今還被引用,可見這些文獻(xiàn)還未引起學(xué)者們的足夠重視。另外,近年來(lái),該作者團(tuán)隊(duì)沒(méi)有在該領(lǐng)域進(jìn)展緩慢,還未發(fā)表新的研究成果。由圖4可知,國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究領(lǐng)域的合作網(wǎng)絡(luò)以以3~4人為主,但也有10人以上的合作網(wǎng)絡(luò)B和C,B是以亞利桑那大學(xué)的CHEN HC為中心的15人合作網(wǎng)絡(luò),共發(fā)表論文3篇。C是由來(lái)自德國(guó)8個(gè)不同的機(jī)構(gòu)14位作者組成的合作網(wǎng)絡(luò),該網(wǎng)絡(luò)雖然人數(shù)較多,但僅2013年合作發(fā)表了1篇論文。總體而言,國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究領(lǐng)域還未形成穩(wěn)定的核心作者群和合作團(tuán)體,作者之間關(guān)聯(lián)不是很緊密,相關(guān)研究合作還需要進(jìn)一步加強(qiáng)。

4 國(guó)外館藏?cái)?shù)字資源語(yǔ)義化的研究熱點(diǎn)

本部分將從內(nèi)容特征出發(fā)去揭示國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究的熱點(diǎn),以期為國(guó)內(nèi)數(shù)字圖書館建設(shè)方向提供指導(dǎo)。關(guān)鍵詞是文獻(xiàn)內(nèi)容特征的核心與精髓,是對(duì)文章主題的高度概括和凝練,出現(xiàn)頻次高的關(guān)鍵詞常被用于確定一個(gè)研究領(lǐng)域的熱點(diǎn)問(wèn)題。文獻(xiàn)內(nèi)容特征分析主要圍繞題名[16]、摘要和關(guān)鍵詞[17]等字段信息展開,分析方法主要包括共現(xiàn)分析、聚類、因子分析、多維尺度分析等。常用可視化分析工具CiteSpace可以通過(guò)對(duì)熱點(diǎn)關(guān)鍵詞進(jìn)行聚類分析,探測(cè)學(xué)科領(lǐng)域的研究熱點(diǎn)。CiteSpace依據(jù)譜聚類算法實(shí)現(xiàn)自動(dòng)聚類,譜聚類本身就是基于圖論的一種算法,它對(duì)共引網(wǎng)絡(luò)這種基于鏈接關(guān)系而不是節(jié)點(diǎn)屬性的聚類具有天然的優(yōu)勢(shì)。為保證數(shù)據(jù)的準(zhǔn)確性和結(jié)果的科學(xué)性,本研究對(duì)122條文獻(xiàn)記錄進(jìn)行了數(shù)據(jù)清洗,主要包括:?jiǎn)螐?fù)數(shù)合并(如libraries和library、collections和collection、models和model、archive和archives),詞的原形合并(如searching和search),刪除無(wú)實(shí)際意義且題名頻率較高的代詞、介詞(如based、towards)等。在CiteSpace軟件中,Node Types設(shè)定Keyword,選擇探索關(guān)鍵詞的路徑算法(Pathfinder),剪切網(wǎng)絡(luò)中大部分不重要的關(guān)聯(lián)節(jié)點(diǎn),最大程度上將原網(wǎng)絡(luò)簡(jiǎn)化為一個(gè)最小值網(wǎng)絡(luò)18,并進(jìn)行相應(yīng)的參數(shù)調(diào)整,生成研究熱點(diǎn)聚類知識(shí)圖譜,如圖5所示。圖5中的每個(gè)十字型的節(jié)點(diǎn)代表一個(gè)關(guān)鍵詞,節(jié)點(diǎn)越大,表示該關(guān)鍵詞出現(xiàn)的頻次越大,黑色字體的是關(guān)鍵詞的標(biāo)簽(設(shè)定閾值為2,只顯示出現(xiàn)2次以上的關(guān)鍵詞標(biāo)簽)。

圖4 作者合作網(wǎng)絡(luò)

CiteSpace還能生成關(guān)鍵詞出現(xiàn)頻次、中心性列表,本研究提取了高頻(≥4)和高中心度(≥0.05)關(guān)鍵詞,如表4所示。國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究的高頻關(guān)鍵詞有digital library、ontology、semantic web、metadata、information retrieval、collection、linked data、system等;高中心度的關(guān)鍵詞有ontology、retrieval、digital library、information retrieval、search、collection、science等,比較高頻關(guān)鍵詞與高中心度關(guān)鍵詞可知,兩者大體上保持一致,所以這些關(guān)鍵詞在一定程度上能夠反映館藏?cái)?shù)字資源語(yǔ)義化研究的熱點(diǎn)。進(jìn)一步分析文獻(xiàn)信息可以發(fā)現(xiàn),2000年以前,有些學(xué)者們開始關(guān)注數(shù)字圖書館、信息檢索、建模、語(yǔ)義網(wǎng)的相關(guān)研究,2001年以后,學(xué)者們開始關(guān)注本體、分類、元數(shù)據(jù)、標(biāo)引、分類、抽取信息組織工作流程等相關(guān)內(nèi)容,關(guān)鍵詞在不斷增多,這說(shuō)明研究范圍在不斷擴(kuò)展、不斷豐富。該主題領(lǐng)域內(nèi)容繁雜,涉及多個(gè)學(xué)科,既包括傳統(tǒng)基礎(chǔ)研究,如metadata、又包括前沿?zé)狳c(diǎn),如ontology、semantic等。

表4 高頻(≥4)和高中心度(≥0.05)關(guān)鍵詞

圖5中,不同顏色的填充區(qū)域代表不同的聚類,紅色字體是聚類的標(biāo)簽,國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究可以生成12個(gè)聚類(軟件只顯示含有10個(gè)成員以上的聚類),分別是semantic search、creating engineering、concept space、users behaviour pattern、semantic retrieval、scientific publication、exploratory search、4th zarih、metadata、management、hopfield net、text categorization、evaluation study、reference map。可以看出國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究視角廣泛,內(nèi)容豐富。表5顯示了每個(gè)聚類的Cluster ID(編號(hào))、Label(標(biāo)簽)、size(規(guī)模)和silhouette(輪廓系數(shù))。silhouette是用來(lái)衡量聚類網(wǎng)絡(luò)不確定性的指標(biāo)[19],取值范圍是(-1,1),如果一個(gè)聚類的silhouette值為1,代表它能夠與其他聚類完美地區(qū)分開來(lái),Chen C希望silhouette值為0.7~0.9之間,或更高[20],因此可以認(rèn)為本研究的聚類效果良好。

圖5 國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究熱點(diǎn)圖譜

表5

綜合分析圖5和表5可以現(xiàn),最大的聚類是“semantic search”,它有47個(gè)關(guān)鍵詞,輪廓系數(shù)為0.89,該聚類最活躍的引證文獻(xiàn)是Nandzik J于2013年發(fā)表在《MULTIMEDIA TOOLS AND APPLICATIONS》上的“CONTENTUS—Technologies for Next Generation Multimedia Libraries”。第二個(gè)聚類是“creating engineering concept space”,它有31個(gè)關(guān)鍵詞,輪廓系數(shù)為0.855,該聚類最活躍的引證文獻(xiàn)是Chen HC于1996年發(fā)表在《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》上的“A Parallel Computing Approach to Creating Engineering Concept Spaces for Semantic Retrieval:The Illinois Digital Library Initiative Project”。第三個(gè)聚類是“users behaviour pattern”,它有30個(gè)關(guān)鍵詞,輪廓系數(shù)為0.942,該聚類最活躍的引證文獻(xiàn)是Chen YN于2013年發(fā)表在《ONLINE INFORMATION REVIEW》上的“An Analysis of Users’ Behaviour Patterns in the Organisation of Information a Case Study of Citeulike”。第四個(gè)聚類是“semantic retrieval”,它有27個(gè)關(guān)鍵詞,輪廓系數(shù)為0.942,該聚類最活躍的引證文獻(xiàn)是Kherfi,ML于2007年發(fā)表在《IEEE TRANSACTIONS ON MULTIMEDIA》上的“Image Collection Organization and Its Application to Indexing,Browsing,Summarization,and Semantic Retrieval”。以上聚類是既是國(guó)外館藏?cái)?shù)字資源語(yǔ)義化領(lǐng)域現(xiàn)有研究的重點(diǎn),也是未來(lái)研究需要繼續(xù)深化拓展的方向。

5 結(jié) 語(yǔ)

語(yǔ)義網(wǎng)為數(shù)字圖書館資源深度聚合提供了新的途徑和方法,為了弄清楚目前國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究的現(xiàn)狀,本研究對(duì)WOS數(shù)據(jù)庫(kù)該主題領(lǐng)域文獻(xiàn)進(jìn)行了計(jì)量分析,得出以下結(jié)結(jié)論:1)從發(fā)展趨勢(shì)來(lái)看,國(guó)外館藏?cái)?shù)字資源語(yǔ)義化研究已經(jīng)過(guò)20多年的發(fā)展,但研究進(jìn)展緩慢,相關(guān)研究成果還處于早期積累階段。2)從研究成果的地域分布來(lái)看,不同國(guó)家間的研究差別很大,美國(guó)和歐洲優(yōu)勢(shì)明顯,主要研究力量也集中于此。3)從核心作者發(fā)文量和作者合著網(wǎng)絡(luò)來(lái)看,該領(lǐng)域高影響力的作者總體偏少,還未形成穩(wěn)定的核心作者群,研究合作還有待進(jìn)一步加強(qiáng)。4)通過(guò)研究熱點(diǎn)分析,發(fā)現(xiàn)該領(lǐng)域內(nèi)容繁雜,立足基礎(chǔ)研究之上的數(shù)字圖書館、信息檢索、用戶行為模式、元數(shù)據(jù)管理、本體理論及方法等是該領(lǐng)域研究熱點(diǎn),該領(lǐng)域在理論基礎(chǔ)和方法技術(shù)方面還有很大的發(fā)展空間。總體而言,該領(lǐng)域的研究以理論構(gòu)建為主,研究方法相對(duì)單一。理論框架仍然比較模糊,理論分析還不夠深入,研究?jī)?nèi)容缺乏系統(tǒng)性與綜合性。學(xué)者們已經(jīng)認(rèn)識(shí)語(yǔ)義化為館藏?cái)?shù)字資源建設(shè)和利用帶來(lái)的美好前景,對(duì)本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義化技術(shù)應(yīng)用也進(jìn)行了實(shí)證探索,但大多基于傳統(tǒng)信息計(jì)量學(xué)和文獻(xiàn)外部特征元數(shù)據(jù)而展開,計(jì)量本體及其基礎(chǔ)上的計(jì)量語(yǔ)義化應(yīng)用還有一定的局限。

無(wú)論是在技術(shù)實(shí)現(xiàn)層面,還是在實(shí)踐應(yīng)用層面,都有學(xué)者進(jìn)行了探索和研究,但相比其他傳統(tǒng)學(xué)科,語(yǔ)義網(wǎng)的基礎(chǔ)理論體系尚不健全,鮮有研究專門對(duì)其進(jìn)行梳理、界定和闡釋[21]。因此,館藏資源語(yǔ)義化依然任重道遠(yuǎn),建立能夠很好地揭示并序化文獻(xiàn)實(shí)體和屬性之間的關(guān)系的語(yǔ)義化的、統(tǒng)一的、規(guī)范的館藏?cái)?shù)字資源組織與檢索方式,不僅是圖書館應(yīng)對(duì)大數(shù)據(jù)時(shí)代挑戰(zhàn),提高知識(shí)服務(wù)能力的必然要求,也是學(xué)者們應(yīng)該繼續(xù)關(guān)注的重點(diǎn)。未來(lái)研究不僅要關(guān)注基礎(chǔ)研究,還應(yīng)該注重應(yīng)用研究,同時(shí),還要進(jìn)一步進(jìn)行多學(xué)科交叉研究,在模型構(gòu)建和研究方法方面做出更大努力。本研究展示國(guó)外館藏資源語(yǔ)義化研究現(xiàn)狀,能為學(xué)者們進(jìn)行深入研究提供一些參考,但未能進(jìn)行深入系統(tǒng)的討論,希望后續(xù)學(xué)者補(bǔ)充完善,在豐富相關(guān)領(lǐng)域研究成果的同時(shí),為我國(guó)館藏?cái)?shù)字資源建設(shè)和有效利用提供必要的指導(dǎo)。

猜你喜歡
語(yǔ)義資源研究
FMS與YBT相關(guān)性的實(shí)證研究
基礎(chǔ)教育資源展示
遼代千人邑研究述論
一樣的資源,不一樣的收獲
語(yǔ)言與語(yǔ)義
視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
主站蜘蛛池模板: 无码一区二区波多野结衣播放搜索| 久久国产精品电影| 国产成人亚洲欧美激情| 丝袜美女被出水视频一区| 尤物精品视频一区二区三区| 99精品一区二区免费视频| 午夜天堂视频| 亚洲精品桃花岛av在线| 国产尤物jk自慰制服喷水| 国产精品欧美日本韩免费一区二区三区不卡| 欧美97色| 亚洲精品va| 美女一区二区在线观看| 中文无码精品a∨在线观看| WWW丫丫国产成人精品| 亚洲人免费视频| 美女亚洲一区| 国产午夜无码专区喷水| 99这里只有精品免费视频| 色偷偷一区二区三区| 色偷偷一区| 一区二区欧美日韩高清免费| 日韩欧美在线观看| 国产永久在线视频| 欧美中文字幕在线二区| 国产美女一级毛片| 亚洲中文字幕久久精品无码一区| 亚洲国产精品无码AV| 99手机在线视频| 成年看免费观看视频拍拍| 日韩国产黄色网站| 五月天福利视频| 大香伊人久久| 国产免费网址| 99精品视频播放| 久久国产V一级毛多内射| 久久精品免费国产大片| 三级视频中文字幕| 91美女在线| 老司机久久99久久精品播放 | 欧美激情二区三区| 亚洲国产欧美目韩成人综合| 波多野结衣亚洲一区| 欧美不卡视频一区发布| 中文字幕日韩丝袜一区| 久久公开视频| 天天综合网在线| 自慰高潮喷白浆在线观看| 69视频国产| a色毛片免费视频| 无码人中文字幕| 日本国产精品一区久久久| 国产在线精品人成导航| 天堂中文在线资源| 五月天天天色| 天堂中文在线资源| 亚洲高清日韩heyzo| 在线播放国产一区| 成人国产精品网站在线看| 亚洲一区网站| 精品撒尿视频一区二区三区| 免费中文字幕在在线不卡| 久久婷婷人人澡人人爱91| 黄片一区二区三区| 久久免费精品琪琪| 亚洲一区黄色| 色天堂无毒不卡| 日韩精品中文字幕一区三区| 精品自拍视频在线观看| 国产成人综合在线视频| 免费无遮挡AV| 不卡网亚洲无码| 最新午夜男女福利片视频| 久久动漫精品| 伊人91在线| 伊人精品成人久久综合| 久久人搡人人玩人妻精品| 国产在线精彩视频二区| 日韩国产亚洲一区二区在线观看| 精品国产成人a在线观看| 欧美高清三区| 中国丰满人妻无码束缚啪啪|