鄒美辰
(1.中國科學院大學,北京 100049;2.中國科學院文獻情報中心,北京 100190)
?
·管理論壇·
基于共詞分析和社會網絡分析的國內外關聯數據研究探析
鄒美辰1,2
(1.中國科學院大學,北京 100049;2.中國科學院文獻情報中心,北京 100190)
準確把握國內外關聯數據的研究方向及研究熱點,梳理分析國內外關聯數據的核心作者及核心團體,有效了解國內關聯數據研究存在的問題與差距,以期為國內關聯數據的后續發展提供借鑒與參考。以國內的CNKI和國外的Web of Science兩個數據庫中2006-2015年的相關文獻為數據來源,運用共詞分析和社會網絡分析方法,分析整理該領域的研究方向及作者合作關系,并將國內外的相關情況進行對比分析。發現國內的研究相較國外存在一定的差距,認為在后續的發展過程中,國內應在深化已有研究方向的基礎上,積極開拓新的研究方向,并加強作者和機構之間的合作關系,促進整個領域的知識傳播。
共詞分析;社會網絡分析;關聯數據;合作關系;聚類分析
關聯數據(Linked Data)這一概念最初是由“萬維網之父”Tim Berners-Lee于2006年提出的,之后便引起了國際范圍內的廣泛關注。其目的是構建數據之間的關聯,形成一個能被計算機理解的數據網絡(Web of Data),而不是傳統萬維網中僅僅能被人理解的文檔網絡(Web of Document)[1]。通過構建數據之間的關聯,可以實現語義查詢和知識發現等功能,從而將現存的信息孤島整合成一個巨大的數據庫。關聯數據的提出具有劃時代的意義,有效地推動了語義網的發展。
歐美對于關聯數據的研究一直處于領先地位。2007年,W3C的關聯開放數據(Linking Open Data,LOD)項目啟動,極大地推動了關聯數據的發展,包括英國廣播公司(BBC)、美國國會圖書館(LOC)、瑞典國家圖書館在內的很多組織都開始參與到關聯數據的發布當中。截止到2014年7月,LOD云圖中的數據集已經達到570個[2]。近年來,國外又開啟了關聯數據研究的新階段,趨向于將關聯數據應用到知識發現和數據挖掘等前沿領域。
國內對于關聯數據的研究則比較滯后,最早的研究始于2008年劉煒所做的引進介紹[3],隨后劉煒等人又翻譯了兩篇關聯數據領域的相關論文,分別為瑞典國家圖書館書目數據的關聯化[4]和美國國會圖書館以關聯數據的形式發布主題詞表[5]。2010年之后,關聯數據的相關研究開始出現大幅增長,達到高潮。但研究的重點主要集中于關聯數據的概念、理論和發布等方面,相較國外存在一定的差距。因此,筆者認為對比分析國內外關聯數據的研究情況是十分必要的,可以為國內關聯數據的后續發展指明方向。
1.1 數據來源
為保證國內外研究數據的權威性,本研究選取的數據來源為國內的CNKI和國外的Web of Science兩大數據庫,檢索時間為2015年6月27日。
國內數據的獲取途徑是在CNKI數據庫中以主題詞為“關聯數據”或者“關聯開放數據”檢索2006-2015年的相關文獻。同時為了保證查準率,將學科領域限定為“信息科技”,共得到文獻589篇。經過人工篩選,剔除重復、無作者信息和非相關文獻后得到有效文獻270篇。
國外數據的獲取方式則是在Web of Science核心合集中以主題詞為“linked data”或者“linked open data”檢索2006-2015年的相關文獻,并在國家/地區當中排除中國和臺灣地區。同樣為保證查準率,將研究方向限定為計算機科學、圖書和情報學、數學和醫學信息學等領域,得到有效文獻1 105篇。
1.2 共詞分析
共詞分析是內容分析法的一種,最初是在20世紀70年代由法國計量學家提出的[6]。雖然目前對于共詞分析沒有明確的定義,但文獻計量學領域已經開始廣泛認可和應用這種方法。共詞分析就是通過統計某一領域相關文獻中關鍵詞對同時出現的情況,來揭示該領域的研究方向與研究熱點,分析該領域的發展趨勢。共詞網絡與其他傳統網絡最根本的區分就是其節點是抽象的知識單元而非有形的實體,是一種具有認知意義的知識網絡[7]。
運用共詞分析進行文獻計量研究的步驟為:第一,確定分析的問題和領域;第二,確定該領域的高頻詞;第三,構建高頻詞共現矩陣;第四,運用不同的統計方法揭示該矩陣所包含的各種信息。
1.3 社會網絡分析
社會網絡分析起源于數學領域的圖論[8],并因為小世界理論的提出得到學術界的認可和重視。社會網絡分析研究的是一組行動者之間的關系結構及其屬性,可以廣泛應用于輿情監測、數據可視化和數據挖掘等領域。
近年來,社會網絡分析開始廣泛應用于文獻計量學領域,對其發展產生了深遠的影響。傳統文獻計量學采用的主要是基于統計思想的研究范式,而社會網絡分析則重視對圖形的繪制以及對結構關系的研究,有效地彌補了傳統文獻計量學對于合作關系、引用關系和知識結構關系分析的不足。
1.4 研究流程
本研究主要從兩方面展開,一是探析國內外關聯數據的研究方向和研究熱點并進行對比分析;二是研究國內外關聯數據作者合作情況,探尋兩者之間的差異。具體的研究流程如圖1所示。本文的創新之處在于,將社會網絡分析和傳統的文獻計量學相結合,對研究領域進行多角度、全方位的分析。同時,在共詞分析的過程中,不僅僅依賴軟件分析的結果,而是將軟件分析和具體的文章內容分析相結合,以達到更好的分析效果,得到更有價值的研究結論。

圖1 研究流程圖
當前關聯數據已經經過了十年的發展,回顧國內和國外在這十年當中的發展歷程,分析其研究方向與研究熱點,對于該領域進一步的發展具有很強的指導意義。同時,有助于發現與國外的差距所在,為國內的后續研究指明方向。
2.1 構建關鍵詞共現矩陣
在CNKI數據庫和Web of Science數據庫中分別以EndNote和HTML格式下載相關文獻,并保存相應的文獻題錄信息。之后將其導入SATI軟件[9]當中,提取文獻的關鍵詞并進行詞頻統計。為了全面地概括該領域的發展情況,同時減少低頻關鍵詞的干擾,將國內和國外相關文獻中的詞頻選取閾值分別設置為4和8,得到高頻關鍵詞33個和36個。為了消除頻次懸殊造成的影響,筆者使用ochiia系數構造高頻關鍵詞的相似矩陣[10]。相似矩陣中的數字代表關鍵詞之間的相似性,數值越大表明相似性越高,反之相似性越低。國內和國外關聯數據領域高頻關鍵詞的相似矩陣如表1、表2所示(由于篇幅所限,只給出部分數據)。
從相似矩陣中只能看出高頻關鍵詞兩兩之間的相似性,無法明確地表示其隱藏關系。為了進一步分析國內外關聯數據領域的研究方向,需要采用聚類分析的方法。

表1 國內關聯數據領域高頻關鍵詞相似矩陣(部分)

表2 國外關聯數據領域高頻關鍵詞相似矩陣(部分)
2.2 聚類分析
聚類分析的主要任務就是基于數據對象之間的相似度,將其劃分至不同的類別。聚類分析在共詞分析中運用十分廣泛,通過將高頻關鍵詞進行聚類,能夠直觀地展示該領域的研究方向與研究熱點。
將表1、表2所示的相似矩陣導入SPSS統計分析軟件當中進行層次聚類分析,得到的聚類結果樹狀圖如圖2、圖3所示。

圖2 國內關聯數據領域高頻關鍵詞聚類結果樹狀圖

圖3 國外關聯數據領域高頻關鍵詞聚類結果樹狀圖
從聚類結果可以看出,國內在該領域的主要研究方向呈現為七大類,國外則大致分為十大類,筆者根據涵蓋的高頻關鍵詞賦予其概括性的名稱或含義,如表3所示。
從表3可以看出,國內外主要研究方向的前四類是十分相似的,但根據類別中的關鍵詞和對文章內容的分析,其涵蓋的內容和側重點又有所區別。

表3 國內外關聯數據領域主要研究方向
①關聯數據的基本理論:國內在該研究方向上的文章大多為綜述類的,介紹了關聯數據的研究現狀與最新進展,包括關聯數據的概念、發布原則、應用情況以及面臨的前景和挑戰等。例如,潘有能等人對關聯數據及其應用進展的研究[11],李琳闡述了關聯數據在圖書館界的應用與挑戰[12]。國外的文章則多集中于對特定技術和平臺的研究,例如對某一具體關聯數據集和技術工具的介紹。筆者認為產生這一差別的原因在于關聯數據在國內的發展較晚,因此在目前階段,綜述類的文章占大多數。
②關聯開放數據:國內在該方面的研究主要集中于分析關聯開放數據的現狀和應用以及關聯開放數據的關聯發現過程,大部分集中在理論層面。例如,嚴駿研究了關聯數據的概念及應用[13],沈志宏、黎建輝等對關聯開放數據關聯發現過程的定位、目標和復雜性進行了分析[14]。國外則側重于將關聯開放數據和傳統數據相結合或利用關聯開放數據提供一些服務,大部分集中在技術層面。例如,利用DBpedia數據集開發關聯數據移動瀏覽器[15]以及將關聯開放數據和傳統數據相結合,以提升數據挖掘的效果[16]。
③知識組織:國內在該方面的研究主要集中于利用關聯數據改進原有的知識組織和管理方法,構建新的知識組織模式,并闡述其相對于傳統方式的優勢所在。例如,付旭雄基于關聯數據的知識地圖中知識鏈接的構建研究[17],以及牟冬梅、張艷俠等對于數字資源語義互聯模式的比較研究[18]。國外在該方面的研究則集中于探索關聯數據領域的詞表和本體對于知識組織的促進作用,從文章內容分析來看,研究點更加明確具體。
④資源整合:國內在該方面的研究側重于關聯數據資源整合在圖書館中的應用,并構建了新的資源整合模式。例如,鐘莉對于關聯數據背景下圖書館信息資源整合的研究[19]。國外則側重于資源整合過程中可視化技術的使用,從而構建新型的網絡服務。例如,國外的Linked Jazz項目,以可視化的形式展示了爵士樂領域杰出音樂家之間的關聯[20]。
通過上述分析,筆者以表格的形式對國內外在這四類研究方向上的側重點進行了對比分析,結果如表4所示。

表4 國內外相似研究方向對比分析
下面筆者將對國內外在該領域的其他研究方向進行分析。國內的主要研究方向除了上述四大類,還包括數據挖掘與知識發現、關聯數據的發布以及圖書館的知識服務。
①數據挖掘與知識發現:數據挖掘與知識發現是國內關聯數據研究的新興方向,國內在該方面的研究主要集中于知識發現研究體系和研究框架的建立,技術實現方面的研究較少,還不夠深入和成熟。例如,李楠和張學福探索了有關關聯數據知識發現模型和知識發現體系的構建[21]。
②關聯數據的發布:國內在該方面的研究主要集中于關聯數據的發布流程和發布技術。例如,夏翠娟、劉煒等人梳理了關聯數據的發布模式和發布工具,并運用開源的語義網技術平臺成功地將“中國歷史紀年和公元紀年對照表”發布為關聯數據[22],以及沈志宏、劉筱敏等人探討了將科技文獻和科學數據發布為關聯數據的流程及關鍵問題[23]。但從文章內容分析來看,大部分的發布方式都是簡單的將數據發布為RDF的形式,缺少本體和模型的支撐。
③圖書館的知識服務:國內在該方面的研究側重于構建基于關聯數據的圖書館知識服務模型,從而提升圖書館的知識服務質量,幫助用戶更加高效地獲取符合自身需求的知識。例如,賀令輝對于關聯數據環境下高校圖書館知識服務的探討[24]。
國外的主要研究方向還涵蓋了大數據與社會化媒體、關聯數據的質量、數據網絡與互操作、實體識別、信息檢索與語義查詢以及云計算與眾包。
①大數據與社會化媒體:國外在該方面的研究主要集中于將社會化媒體中產生的大量數據用關聯數據和語義網的技術進行處理,以挖掘數據背后的隱藏信息。
②關聯數據的質量:國外在該方面的研究主要集中于構建關聯數據的原則和框架,以提升關聯數據的質量。并且開發了一系列的工具和平臺來驗證關聯數據的質量。例如,國外學者提出的綠色關聯數據的原則和框架[25]。
③數據網絡與互操作:國外在該方面的研究側重于構建數據網絡中的互操作機制和框架,包括模式變換、映射生成、查詢轉換和查詢效率等?;ゲ僮鳈C制對于用戶獲取和查詢數據網絡中的數據是十分關鍵的。
④實體識別:國外在該方面的研究側重于探索實體識別的具體算法,以及一系列的關聯發現框架。例如,Yves Raimond等[26]結合語義網中的音樂數據集,提出了基于文本匹配的互聯方式以及基于圖匹配的互聯方式。國外的學者還提出了基于規則的關聯發現框架SILK[27]和針對關系型數據的語義連接發現框架LinQuer[28]等。
⑤信息檢索與語義查詢:國外在該方面的研究主要集中于開發可用于信息檢索的語義搜索引擎,促進隱形知識發現,為用戶提供更加精準的檢索結果。例如,Elbedweihy等概述了語義搜索引擎的評價方式[29]。
⑥云計算與眾包:國外在該方面的研究主要集中于利用眾包的方式進行關聯數據的互聯和集成,將機器和人工處理方式相結合。同時還探索了利用云計算處理大規模關聯數據集的方法。眾包指的是以自愿的形式,讓大眾參與到某個特定任務當中,涵蓋了用戶共創價值的理念。
通過以上分析可以看出:①國內外的主要研究方向存在重合,但具體的側重點不同。國內重視理論層面的研究,而國外則偏重于技術。例如,對于關聯開放數據的研究,國內側重于關聯開放數據的現狀與應用,而國外則側重于將關聯開放數據與傳統數據相結合,或利用其提供新型服務;在資源整合方面,國內注重資源整合在圖書館中的應用,以及新型資源整合模式的構建,而國外則注重可視化技術在資源整合中的使用。②國內是“面”的研究,而國外則是“點”的研究。例如,對于關聯數據的基本理論,國內側重于整個領域的研究現狀與最新進展,而國外則側重于特定的技術和平臺;在知識組織方面,國內注重新型知識組織模式的構建,而國外則注重詞表和本體對知識組織的作用。③國外的研究方向覆蓋面更廣,涵蓋了一些前沿研究方向。例如,大數據與社會化媒體、信息檢索與語義查詢、以及云計算與眾包等。而國內的研究方向則比較傳統,在前沿方向上的研究匱乏,缺乏創新性。
筆者認為國內在后續的發展過程中,首先要深化已有研究方向,強調技術層面的研究。其次應逐步收斂研究方向,從“面”轉移到“點”,注重特定的技術和平臺。最后要加強對前沿方向的研究,提升研究的創新性。
運用社會網絡分析方法分析作者合作網絡,可以從總體上了解該領域的作者合作關系。同時通過網絡密度與中心性分析,可以衡量該領域的知識流動性,識別該領域的核心作者與核心團體。
3.1 構建作者合作網絡
將CNKI和Web of Science數據庫中下載的相關文獻導入SATI軟件當中,提取文獻的作者并進行發文量統計。由于構建整體的作者合作網絡十分復雜,也不便于分析,所以為了能夠直觀地了解該領域的作者合作情況,需要進行作者篩選。筆者根據普賴斯定律選取了該領域的高產作者[30]。普賴斯定律認為,在相同的主題當中,半數的論文是高生產力作者完成的,高產作者的最低發文量計算公式如下。
其中,N為該領域作者最高發文量。在關聯數據領域,國內發文量最高的作者為夏翠娟,發表論文13篇。國外發文量最高的作者為Auer,S,發表論文21篇。經過計算,分別選取國內和國外發文量大于等于3和大于等于4且存在合作關系的作者,構建作者合作網絡。作者合作網絡的構建需要借助UCINET社會網絡分析軟件,國內和國外的作者合作網絡如圖4、圖5所示。圖中的節點表示作者,連線表示其兩端的節點在同一篇文章中出現,節點的大小表示與之有合作關系的合作者數量,連線的粗細則表示作者合作次數的多少。
從圖中可以看出,國內核心作者之間的合作情況較少,且沒有大型連通分量,網絡的連通性較差。共有子網12個,最大的合作子網為5人的蛛型子網,其余大部分為雙核子網和三核子網,子網內部的連通性較好。國外核心作者之間的合作情況雖然也不多,但存在一個大型連通分量,網絡的連通性要明顯好于國內。共有子網19個,最大的合

圖4 國內關聯數據作者合作網絡

圖5 國外關聯數據作者合作網絡
作子網為圖5左側的作者群,共62人。
3.2 網絡密度分析
網絡密度是指節點之間實際聯結數目與最大聯結數目之間的比值,比值越高,密度越大。一般認為,合作網絡的密度越大,越有利于知識的傳播,越能促進該領域的發展。經過計算,國內和國外的作者合作網絡密度分別為0.0622和0.0227,整體結構都比較松散,知識的流動性較差,這一點在作者合作網絡圖中也能明顯看出,但另一方面也說明該領域還處于成長期,有很大的發展空間。
國內的作者合作網絡密度高于國外,并不是因為該領域在國內的發展較好,而是因為大型網絡的密度一般都要小于小型網絡。在實際生活中,一個人的精力是有限的,維持某些關系的能力也是有限的,所以大型網絡的密度一般都較低。
3.3 中心性分析
中心性一般用于衡量一個節點的重要性,中心性越高,該節點在網絡中充當的角色就越重要,中心性一般可以分為點度中心性和中介中心性。點度中心性衡量的是該領域的中心人物,作者的點度中心性越高,說明他與越多的作者存在合作關系。中介中心性衡量的則是該領域的樞紐或者橋梁,作者的中介中心性越高,說明他的橋梁作用越明顯,其他作者必須通過其建立間接合作關系。
經過UCINET的計算,國內外關聯數據領域點度中心性和中介中心性排名前10的作者,如表5、表6所示。

表5 國內外關聯數據核心作者點度中心性

表6 國內外關聯數據核心作者中介中心性
從表5可以看出,國內點度中心性最高的作者為付旭雄、周習曼、馬倩倩、梁艷琪和高勁松,均來自于華中師范大學,絕對點度中心度為4.000,所占份額為0.054,是該領域的核心人物。國外點度中心性最高的作者為Decker,S,來自于愛爾蘭國立大學,絕對點度中心度為16.000,所占份額為0.040,處于該領域的核心地位。國內和國外整個網絡的點度中心度分別為5.88%和10.00%,說明國外的作者合作關系較多,而國內有待進一步提升。
從表6可以看出,國內中介中心性最高的作者為張艷俠,來自于吉林大學,絕對中介中心度為2.0,標準化中介中心度為0.232,說明其他人通過其進行溝通的可能性較高。整個網絡中除了張艷俠之外,其他作者的中介中心度均為0,說明網絡的連通性不好,各個合作團體之間的聯系較少。國外中介中心性最高的作者仍為Decker,S,絕對中介中心度為676.721,標準化中介中心度為7.827,說明其占據該領域的樞紐位置。整個網絡的中介性為7.41%,遠遠高于國內的0.36%,說明國外各個合作團體之間的聯系更加緊密。
同時,國外有5位作者在點度中心性和中介中心性當中均排名前10,分別為Decker,S、Lehmann,J、Ngomo,CAN、Cyganiak,R和Deus,HF,說明他們既與較多的作者存在合作關系,同時也占有相對豐富的資源,應予以重點關注。
3.4 合作團體分析
合作團體的劃分可以通過距離進行計算,在一定的距離范圍內可達的節點為一個團體。利用UCINET軟件中的N-派系分析方法,對作者合作團體進行劃分。由于國內和國外作者數量差距較大,故選取不同的參數進行劃分。在劃分國內合作團體時,將距離設置為2,節點數量下限設置為3,劃分結果為7個團體。
團體1,梁艷琪、高勁松、付旭雄、周習曼、馬倩倩,均來自于華中師范大學,于2013-2015年合作發表論文3篇,第一作者均為高勁松,研究方向主要為關聯數據的語義鏈接。
團體2,夏翠娟、劉煒、張春景、朱雯晶,均來自于上海圖書館,于2011-2015年合作發表論文9篇。團體中的核心人物為夏翠娟和劉煒,研究方向主要集中于關聯數據的應用及其技術實現。
團體3,沈志宏、張曉林、黎建輝,均來自于中科院文獻情報中心,于2011-2013年合作發表論文8篇。在該團體發表的論文當中,沈志宏均為第一作者,研究方向主要為關聯數據的互聯。
團體4,李春旺、黃永文、劉媛媛,均來自于中科院文獻情報中心,于2011-2012年合作發表論文3篇,研究方向主要為關聯參考服務的構建。
團體5,范煒、方安、洪娜,范煒來自于四川大學,其他來自于中國醫科院醫學信息研究所,于2012-2013年發表論文3篇,研究方向主要為醫學關聯數據的發展。
團體6,張艷俠、黃麗麗、畢強、牟冬梅,均來自于吉林大學,于2012-2014年合作發表論文5篇,研究方向主要為關聯數據的語義互聯。
團體7,王忠義、石義金、夏立新,均來自于華中師范大學,于2013-2015年合作發表論文5篇,第一作者均為王忠義,研究方向主要為關聯數據的創建與發布。
通過對團體的分析,可以看出國內關聯數據領域作者的合作關系受地域和機構影響較大,相同地區和機構的作者更容易形成合作關系。同時多數的合作關系為師生合作,隨著學生的畢業,合作關系也就隨之中斷。目前,比較活躍的團體為團體1、團體2和團體7,其余團體沒有最新的研究出現。
在劃分國外團體時,將距離設置為2,節點數量下限設置為10,劃分結果為11個團體。由于團體成員較多,不在進行一一列舉。國外合作團體和國內的不同之處在于,不同團體之間存在交叉,且不局限于同一個機構,知識流動性較強。
基于上述分析,筆者認為,國內應首先加強作者和各個團體之間的合作關系,促進知識的流動。其次,合作關系不應受到機構和地域的限制,跨機構的合作更有利于該領域的發展,能碰撞出更多的思想火花。
本研究運用共詞分析和社會網絡分析方法,對國內外關聯數據的研究現狀進行了分析。分別以CNKI和Web of Science數據庫中2006-2015年的文獻數據為研究對象,分析了該領域的研究方向以及作者合作情況,并對國內外的相關情況進行了對比。通過分析得出:①國內外的主要研究方向存在重合,分別為關聯數據的基本理論、關聯開放數據、知識組織和資源整合。但具體的側重點不同。國內重視理論層面的研究,而國外則偏重于技術;國內是“面”的研究,而國外則是“點”的研究。②國外的研究方向覆蓋面更廣,涵蓋了一些前沿研究方向。而國內的研究方向則比較傳統,在前沿方向上的研究匱乏,缺乏創新性。③國內外作者合作網絡的密度較低,整體結構比較松散,知識的流動性較差,說明該領域還處于成長期,有很大的發展空間。④國內外作者合作網絡的點度中心性和中介中心性存在較大差異,國外的作者和各個團體之間的聯系更加緊密,連通性更好,而國內則有待進一步提升。⑤國內在該領域的合作團體相較國外受地域和機構影響較大,同時多數的合作關系為師生合作,隨著學生的畢業,合作關系也就隨之中斷。
本研究一方面概述了國內外關聯數據的研究情況;另一方面為國內的后續發展提供了意見和建議。當然,本研究也存在很多不完善之處,要對該領域有更全面的認識,還需要進行引文分析等研究,追蹤知識的產生和積累過程。這也是筆者后續所要關注的。
[1]Tim Berners-Lee.Linked Data-Design Issues[N/OL].http:∥www.w3.org/DesignIssues/LinkedData.html,2015-06-20.
[2]State of the LOD Cloud 2014[N/OL].http:∥linkeddatacatalog.dws.informatik.uni-mannheim.de/state/,2015-06-21.
[3]付瑤,楊畔.基于共詞分析的我國關聯數據研究進展探析[J].圖書館學研究,2013,(4):18-24.
[4]Martin Malmsten.將圖書館目錄納入語義萬維網[J].李雯靜,譯.現代圖書情報技術,2009,(3):3-7.
[5]Ed Summers,Antoine Isaac,Clay Redding,Dan Krech.LCSH,SKOS和關聯數據[J].現代圖書情報技術,2009,(3):8-14.
[6]廖勝姣,肖仙桃.基于文獻計量的共詞分析研究進展[J].情報科學,2008,26(6):855-859.
[7]范少萍,李迎迎,張志強.國內外共詞分析研究的文獻計量分析[J].情報雜志,2013,32(9):104-109.
[8]滕廣青,牟冬梅,任晶.國外社會網絡分析在文獻計量領域的應用研究[J].情報資料工作,2014,(1):47-51.
[9]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012,(1):50-58.
[10]劉春年,陳通.基于共詞聚類的能源互聯網研究熱點及發展脈絡分析[J].現代情報,2015,35(11):127-133.
[11]潘有能,張悅.關聯數據研究與應用進展[J].情報科學,2011,29(1):124-130.
[12]李琳.關聯數據在圖書館界的應用與挑戰[J].圖書與情報,2011,(4):58-61.
[13]嚴駿.關聯開放數據概念及應用[J].信息與電腦:理論版,2014,(12):88.
[14]沈志宏,黎建輝,張曉林.面向LOD的關聯發現過程的定位、目標與復雜性分析[J].中國圖書館學報,2013,(6):101-108.
[15]Christian Becker,Christian Bizer.DBpedia Mobile:A Location-Enabled Linked Data Browser[J].LDOW,2008,369-370.
[16]Paulheim Heiko,Fümkranz Johannes.Unsupervised generation of data mining features from linked open data[C].Proceedings of the 2nd international conference on web intelligence,mining and semantics.ACM,2012:31-42.
[17]付旭雄.基于關聯數據的知識地圖中知識鏈接構建研究[D].武漢:華中師范大學,2012.
[18]牟冬梅,張艷俠,黃麗麗.數字資源語義互聯的模式及其比較研究[J].圖書情報工作,2013,57(17):6-10.
[19]鐘莉.基于關聯數據的圖書館信息資源整合研究[D].杭州:浙江大學,2014.
[20]Lange Leanora,Pattuelli Maria Cristina.Linked Jazz:Building with Linked Open Data[N/OL].http:∥www.educause.edu/ero/article/linked-jazz-building-linked-open-data,2015-06-23.
[21]李楠,張學福.基于關聯數據的知識發現模型研究[J].圖書館學研究,2013,(1):73-77.
[22]夏翠娟,劉煒,趙亮,等.關聯數據發布技術及其實現——以Drupal為例[J].中國圖書館學報,2012,(1):49-57.
[23]沈志宏,劉筱敏,郭學兵,等.關聯數據發布流程與關鍵問題研究——以科技文獻、科學數據發布為例[J].中國圖書館學報,2013,(2):53-62.
[24]賀令輝.基于關聯數據的高校圖書館知識服務探討[J].圖書館研究,2013,(1):95-97.
[25]Hoxha Julia,Rula Anisa,Ell Basil.Towards Green Linked Data[C].COLD,2011.
[26]Raimond Yves,Sutton Christopher,Sandler Mark.Automatic Interlinking of Music Datasets on the Semantic Web[J].LDOW,2008:369.
[27]Volz Julius,Bizer Christian,Gaedke Martin,Kobilarov Georgi.Silk-A Link Discovery Framework for the Web of Data[J].LDOW,2009:538.
[28]Hassanzadeh Oktie,Kementsietsidis Anastasios,Lim Lipyeow,Miller Renée,Wang Min.A framework for semantic link discovery over relational data[C].Proceedings of the 18th ACM conference on Information and knowledge management.ACM,2009:1027-1036.
[29]Elbedweihy Khadija,Wrigley Stuart,Clough Paul,Ciravegnae Fabio.An overview of semantic search evaluation initiatives[J].Web Semantics:Science,Services and Agents on the World Wide Web,2015,30:82-105.
[30]邱均平,伍超.基于社會網絡分析的國內計量學作者合作關系研究[J].圖書情報知識,2011,(6):12-17.
(本文責任編輯:馬 卓)
The Research of Linked Data in Domestic and Abroad Based on Co-word Analysis and Social Network Analysis
Zou Meichen
(1.University of Chinese Academy of Sciences,Beijing 100049,China;2.Documentation and Information Center of Chinese Academy of Sciences,Beijing 100190,China)
The paper aimed to grasp the research orientations and research focuses accurately,to analyse the core authors and the core groups related to linked data field in domestic and abroad,to understand the problems and gaps in domestic linked data research,and to provide advice to it in the following development.The paper took the related documents from 2006-2015 in CNKI and Web of Science database as the data sources.Based on the co-word analysis and social network analysis,the paper studied the research orientations and the cooperative relationships of authors in this field.After that,comparing the relevant situation of domestic and abroad.The paper found that the research in domestic was well behind abroad.It argued that the research in domestic should deepen the existing research orientations,develop the new orientations and strengthen the cooperative relationships of different authors and organizations,so that the knowledge dissemination in this field could be promoted.
co-word analysis;social network analysis;linked data;cooperative relationship;clustering analysis
2015-09-07
鄒美辰(1992-),女,碩士研究生,研究方向:信息資源組織與建設。
10.3969/j.issn.1008-0821.2016.03.023
G203
A
1008-0821(2016)03-0135-09