潘 煦,陽廣元(西南民族大學圖書館)
近年來國內基于關聯數據的數字圖書館研究綜述
潘煦,陽廣元(西南民族大學圖書館)
以國內基于關聯數據的數字圖書館研究的文獻為分析對象,歸納總結出當前國內基于關聯數據的數字圖書館研究所涉及的主題主要分布在關聯數據的理論研究、關聯數據的構建與發布、基于關聯數據的信息資源組織與整合、基于關聯數據的知識服務研究以及綜述或其他研究內容等五個方面,并從這五個方面對國內基于關聯數據的數字圖書館研究現狀進行梳理,總結出國內該研究領域的特點、不足及發展趨勢。
關聯數據;數字圖書館;資源整合;綜述
近年來,為尋求數字圖書館在資源組織與整合、發布與共享、發現與再利用等方面的新突破,以增強和擴展資源發現服務平臺、提升社會價值和整體服務能力與效率,我國圖情界開始致力于關聯數據在數字圖書館領域的理論與實踐研究。為厘清和把握國內基于關聯數據的數字圖書館研究領域的進展、特點、不足及未來發展趨勢等,并為該研究領域及相關研究領域的深入研究與實踐提供參考借鑒,筆者分別以檢索式“篇名‘數字圖書館 and關聯數據’”和“篇名‘圖書館’and關鍵詞‘關聯數據’”在清華同方的中國知網、維普期刊資源整合服務平臺和萬方知識服務平臺中分別進行“精確匹配”檢索,并對檢索結果進行去重等梳理后,最終獲取到基于關聯數據的數字圖書館研究的相關文獻合計78篇。筆者對這些相關文獻研究內容進行梳理分析發現,國內基于關聯數據的數字圖書館研究領域主要集中在關聯數據的理論研究、關聯數據的構建與發布研究、基于關聯數據的信息資源組織和整合研究、基于關聯數據的知識服務研究以及綜述或其他研究等五方面。
1.1關聯數據的理論研究
目前國內基于關聯數據的數字圖書館的研究主要是從關聯數據的起源、定義、目的、原則、特點、對數字圖書館的影響等方面進行深入探討。關聯數據最早由 WWW(World Wide Web)的創始人 Tim Berners-Lee在一個語義網項目中提出,在數字圖書館領域還沒有形成統一的被認可的定義,目前學界普遍采用維基百科(Wikipedia)關于關聯數據的定義,即關聯數據是實現語義網的輕量級核心技術之一,描述了一種構建在標準網絡技術(如HTTP、RDF和URIs)之上的能從語義層面實現數據相互關聯的一種數據發布方法。[1]其構建與發布的基本原則為:(1)使用URIs來命名或識別對象;(2)使用HTTP URIs來定位對象;(3)采用RDF、SPARQL等標準來擴展對象使其能在查詢時提供更有意義的信息;(4)提供相關的基于URI的HTTP,以便發現更多的對象。其應用有兩種基本模式:(1)瀏覽器/服務器模式,即通過瀏覽器來訪問關聯數據,如Tabulator、Signa等;(2)客戶端(應用系統)/服務器模式,即系統與系統之間的數據傳遞。[2]其特點為低成本、標準化、去中心化、自助化及框架簡潔等。[3]
關聯數據在圖情領域已得到了廣泛的研究與應用,如知識服務[4]、集成管理[5]及學術推薦[6]等,尤其是在數字圖書館研究與構建中,[7]關聯數據發揮著十分重要的作用,通過關聯數據的引入,能為數字圖書館的信息資源融合提供有力保障;強化與教科研之間的聯系;增強和擴展數字圖書館信息資源發現服務平臺;通過將自身資源發布為關聯數據能提升圖書館的社會價值;進一步加強信息資源的利用和再利用;增加個性化服務的成效。[8-10]同時數字圖書館關聯數據具有開放性、可拓展性、可重用性、顯性的語義關系和國際化等優點。[11]
1.2關聯數據的構建與發布研究
國內除對關聯數據的基本理論進行研究外,還對關聯數據的構建與發布作了深入探討。孫鴻燕指出圖書館關聯數據發布的前提是關聯關系的構建,關聯構建形式有映射關聯和非映射關聯;[12]王忠義等借助D2R工具實現了數字圖書館中層關聯數據的構建與發布。[13]張忠莉深入探討了E-Learning時代高校圖書館關聯數據的構建問題,指出高校圖書館關聯數據的構建內容主要包括資源組織本體的構建;基于資源組織本體,將關系型數據庫中數據表的各類篇名元數據轉換為基于RDF的表達;基于關鍵詞,構建不同來源、不同類型的科技文獻,如期刊、會議、標準、專利、科技報告等的關聯關系。[14]游毅探討了面向圖書館關聯數據的語義鏈接構建,指出主要有基于SPARQL查詢與基于相似度的鏈接構建等兩種構建方式。[15]
1.3基于關聯數據的信息資源組織和整合研究
信息資源的整合不僅是實現數字圖書館建設目標的關鍵,[16]也是擴展數字圖書館資源發現服務平臺的一種有效途徑。關聯數據作為一種發展迅速的新的信息資源發布技術,能快速有效地將不同來源的信息資源關聯起來,特別是能有效地將圖書館館內信息資源與外部信息資源融合在一起,從而增強和擴展數字圖書館的信息資源發現服務平臺,以提升整體服務能力和水平。丁楠等提出了一種能有效擴展信息資源范圍和改進用戶服務的基于關聯數據的數字圖書館信息聚合模型,并從數據層、聚合層和應用層三個層面對其進行了全面的分析。[17]路瑩等通過對當前基于導航的信息資源整合、基于OPAC的信息資源整合、基于異構統一平臺的信息資源整合和基于語義的信息資源整合等四種信息資源整合方法存在的不足以及關聯數據的研究,指出關聯數據為完全自主、異類及異構的信息資源的整合提供了有效的解決方案。[18]鄭燃等深入剖析了關聯數據在圖書館、檔案館和博物館之間信息資源整合的作用,構建了基于關聯數據的LAM(Libraries,Archives,Museums)信息資源整合模式。[19]房小可從科學數據的實體URI命名、描述、關聯和發布等四方面全面闡述并構建了基于關聯數據的科學數據組織模型。[20]歐石燕等提出了一種能實現數字圖書館中不同格式、不同類型文獻資源及館內與館外相關資源的關聯與融合的可無限延伸與擴展的開放的基于本體和關聯數據的層次化資源融合框架,指出該方法在深度和廣度上都優于傳統的信息資源融合方式。[21]蘇春萍等為屏蔽醫學數據源的異構性并為用戶提供智能化,設計了一種基于關聯數據和SOA的醫學數字圖書館信息資源整合模型。[22]歐石燕等研究了傳統信息資源整合、基于本體的信息資源整合和基于關聯數據的信息資源整合,并在汲取這些優點的基礎上提出了一種能實現不同層次與范圍的基于本體和關聯數據的數字圖書館信息資源整合框架。[23]鐘莉構建了一種能彌補傳統書目信息資源整合缺乏語義整合的基于關聯數據的數字圖書館書目信息資源整合模型。[24]張鳳霞對關聯數據在數字檔案整合中的應用進行了深入研討,指出其為數字檔案的聚合提供了基本技術支持、擴展了其發現平臺,更好地滿足了用戶的需求。[25]歐石燕等研究了利用關聯數據進行信息資源的動態組織,提出了一種面向圖書館關聯數據的能將自動問答擴展到多個RDF數據集的自動問答方法。[26]
1.4基于關聯數據的知識服務研究
目前,國內基于關聯數據的知識服務研究主要集中在個性化知識服務、云服務、服務創新、服務策略、服務模式等方面的研究。個性化知識服務的關鍵是根據用戶需求提供有針對性的知識服務,[16]用戶建模又是實現個性化知識服務的起點和關鍵因素,而作為巨大數據中心的關聯數據分布著大量能為用戶建模提供豐富的、與用戶相關的數據來源,從而更好地動態感知用戶需求,提升個性化知識服務的整體服務質量;[27]張小峰指出關聯數據實現了學術資源之間的關聯和鏈接,為學術資源推薦與用戶之間架起了橋梁,并設計了一種基于關聯數據的數字圖書館學術資源推薦系統;[6]付兵在概述基于關聯數據的數據挖掘算法的基礎上,設計了一種由數據存儲層、數據挖掘層和用戶界面層構成的基于關聯數據的個性化信息推薦系統;[28]李愛國等指出應在保護用戶隱私的前提下將用戶信息發布為關聯數據以擴展各種知識生產與服務系統,實現圖書館用戶信息的資源化與關聯化。[29]
云服務作為一種新的服務模式,如何將關聯數據這種新的圖書情報新技術運用到云服務以改善云服務的服務能力,提升圖書館的整體服務水平已成為當前圖情界的關注點,并已取得了不錯的研究成績,如曾琦在深入探討了圖書館云服務與關聯數據之間關系的基礎上,設計了一種基于關聯數據的能更好實現圖書館信息資源發現服務的圖書館云服務平臺;[30]王業平提出了一種能有效解決圖書館關聯數據管理缺陷的將云計算引入到其管理模塊的面向關聯數據的圖書館云服務框架;[31]田寧深入剖析了關聯數據、云服務及基于關聯數據的圖書館云服務的內涵,提出了一種基于關聯數據的圖書館云服務框架,指出需要解決好技術、知識產權、數據庫廠商及圖書館員素質等的制約才能更好地實現此服務;[32]鄒學昌也在研究關聯數據及云服務的相關理論基礎上,提出了一種能更好滿足語義網環境下用戶知識服務需求,提高圖書館服務質量和地位的基于關聯數據的圖書館云服務模型。[33]
另外,還有學者對基于關聯數據的知識服務創新、策略及模式等方面進行了深入的研究,如楊愛武從知識的發布、發現、檢索及異構融合等方面探討了圖書館的知識服務創新;[34]管進概述了關聯數據的內涵、應用及對知識服務的影響,指出圖書館應建立以關聯數據為基礎的知識服務資源保障體系,加強對知識服務的數據和服務方式的整合,加強對知識服務的技術保障以及組建高素質的知識服務團隊;[4]趙明深入探討了知識地圖、關聯數據及圖書館信息服務的內涵以及關聯數據在圖書館知識地圖信息服務中的作用,構建了一個能減少服務的時間和空間限制、擴大服務范圍和提升個性化服務質量的面向圖書館信息服務模式的基于關聯數據的知識地圖。[35]賀令輝指出關聯數據讓圖書館及網絡中不同類型的知識資源被發現和共享變成可能,并從知識資源的關聯數據構建與發布、整合和推薦等角度探討了基于關聯數據的高校圖書館知識服務。[36]趙衛軍指出關聯數據能建立知識資源之間的關聯,從而實現知識資源的融合和擴展知識發現服務,提出了基于SOA的關聯數據的高校圖書館知識服務框架模型。[37]
1.5綜述及其他研究
目前,國內基于關聯數據的數字圖書館的研究還出現了一些對關聯數據在數字圖書館領域的相關應用現狀和存在問題的綜述研究,并提出了國內該研究領域應注意的問題和未來發展建議。如黃永文從信息資源的發布與發現服務、數據的語義融合與檢索服務、在學術研究與交流中的作用、跨機構關聯數據的開放與復用、圖書館與教學系統的集成等方面分析了關聯數據在數字圖書館中的應用現狀,指出未來應加強關聯數據的利用意義、服務方式、質量和有效性等方面的研究;[2]李琳概述了關聯數據在數字圖書館中的實踐現狀,指出未來應加強用戶交互、數據整合、鏈接維護及隱私保護等四方面的研究。[38]孫鴻燕、吳旻指出隨著關聯數據在數字圖書館中的應用,圖書館應從關聯數據的挖掘與創建、關聯構建、發布與瀏覽,以及鏈接維護等方面強化關聯數據的綜合管理。[5,12]付瑤指出為避免產生大量冗余、錯誤及失效等低質量數據內容,應加強對關聯數據的質量控制,構建了專門針對關聯數據質量控制的模型框架。[39]梁亮以杭州圖書館“熱門標簽”為例,從實踐角度闡述了關聯數據在數字圖書館中的應用實踐,指出應從提升標簽質量、拓展標簽用途和滿足用戶需求等方面,優化關聯數據在數字圖書館的研究與應用。[40]陳定權等指出圖書館在關聯數據運動中扮演著關聯數據的發布者、信度驗證者、消費者及其應用的組織與協調者等角色。[41]曹月珍等探討了圖書館如何利用關聯數據實現服務轉型,指出未來應加強關聯數據的相關技術與開放策略,以及與其他文化機構的合作等方面的研究與實踐。[42]王景俠指出圖書館數據的關聯數據化將讓其融入到開放互聯的關聯數據網絡,并有效提升圖書館的服務水平和地位,提出未來應加強理念的創新、技術的革新和實踐的探索。[11]
2.1研究特點
2.1.1核心作者群和核心機構初步形成
目前國內該研究領域已初步形成了以歐石燕、王薇、盧玉紅、吳旻、梁亮等為代表的核心作者群;以南京大學信息管理學院、華中師范大學信息管理學院、杭州圖書館、西北大學圖書館等為代表的核心機構,他們對關聯數據在數字圖書館中的應用進行了持續性的跟蹤與實踐,這在一定程度上說明我國在該研究領域已初步形成了較完備的科研人員及體系,也表明了國內各界研究者對該研究主題的關注度較高。
2.1.2研究內容逐步轉向應用實踐
國內圍繞關聯數據在數字圖書館中的應用研究已從起初的純理論研究逐步向與具體實踐相結合的方向發展,并取得了不錯的成績。研究初期經常對諸如關聯數據的概念、特點、原則、對數字圖書館帶來的機遇與挑戰及現有應用現狀等進行研究,隨著研究者對關聯數據及其在數字圖書館中的應用研究的深入,開始從熱門標簽、書目數據的發布及個性化推薦等更細化的實踐應用角度開展該主題的研討,而且此類主題也將成為未來研究的主流。
2.1.3研究主體的多樣性
國內基于關聯數據的數字圖書館的研究吸引了各界研究者的重視并取得了不錯的成績,如《中國圖書館學報》《現代圖書情報技術》《圖書與情報》《圖書館學研究》《圖書館工作與研究》《圖書館論壇》《山西檔案》等圖書情報檔案類期刊;《信息技術與信息化》《科技信息》《計算機光盤軟件與應用》等計算機類期刊;另外還有8篇學位論文和5篇會議論文等非期刊性文獻對其進行系統性的研討。
2.2研究不足
通過對我國目前基于關聯數據的數字圖書館研究的相關文獻的研究內容分析發現,盡管我國各界十分重視該研究主題并取得了不錯的成績,但還存在一些不足,如缺乏對關聯數據的質量、基于關聯數據的數字圖書館等的有效評價方法;缺乏對關聯數據的自動化構建與發布方法的研究;缺乏對關聯數據應用于數字圖書館中的安全(如知識產權、隱私保護等)、效用、質量控制、鏈接維護等問題的探討與實踐;缺乏對如何保障用戶獲取高質量地關聯數據的研究;當前所設計的基于關聯數據的數字圖書館相關模型缺乏對用戶參與度的考慮;絕大部分文獻都只從理論層面進行研討,缺乏具體的實踐應用與經驗總結,僅有少部分文獻如文獻[41]才是真正將理論應用于實踐,從具體實踐角度研究關聯數據在數字圖書館中的應用,也只有這些實證性研究才能有效推動我國關聯數據在數字圖書館中應用的深度和廣度,進一步促進關聯數據及其在數字圖書館中應用的理論的完善與經驗的積累。
3.1利用關聯數據技術實現更深層次的個性化服務
個性化服務既是圖書館未來發展的重要方向,也是未來生存的重要基礎。如何更好地根據用戶需求提供更具針對性地個性化服務已成為了當前各界(特別是圖書館界)的研究熱點,也是圖書館可持續發展的一個難點。關聯數據不僅為用戶信息的關聯化提供了有效支撐,也為從海量數據中實時動態地獲取用戶的個性化信息(如用戶特點、曾經的需求、檢索記錄等)提供了有效途徑,而這些都將有效地提升數字圖書館在提供服務的過程中對用戶個性化需求的動態感知,更好地為用戶提供針對性強、符合用戶真正需求的個性化服務。因此,關聯數據為個性化服務帶來了一次新的變革。與此同時,基于關聯數據的個性化服務研究也必將成為未來的研究熱點和趨勢。
3.2基于關聯數據的數字圖書館的實際應用
目前,國內雖然對基于關聯數據的數字圖書館的應用實踐做了較深入的研究且取得了一定成績,但缺乏對具體某一個領域的具體實踐應用的研究與實現。只有與具體應用相融合的實踐探索才能真正地發掘到關聯數據在數字圖書館領域中應用所遇到的問題,拓展其應用的深度和廣度,促進該研究領域的進一步發展。如何有針對性地構建和發布適合特定領域的關聯數據,有效地嵌入到數字圖書館的某個具體領域的系統;如何設計并實現適合特定需求的基于關聯數據的數字圖書館系統等實踐性強的研究將成為未來關聯數據在數字圖書館領域實踐應用的研究趨勢。
[1]Berners-LeeT.LinkedData—DesignIssues[EB/OL]. [2015-04-06].http://www.w3.org/DesignIssues/Lin kedData.html.
[2]黃永文.關聯數據在圖書館中的應用研究綜述[J].現代圖書情報技術,2010(5):1-7.
[3]王伯秋,等.關聯數據在圖書館資源整合中的應用[J].醫學信息學雜志,2013(10):64-66.
[4]管進.基于關聯數據的圖書館知識服務策略研究[J].圖書館理論與實踐,2012(6):9-11.
[5]吳旻.圖書館關聯數據的集成管理研究[J].圖書館理論與實踐,2012(9):67-69.
[6]張小峰.基于關聯數據的圖書館學術資源推薦研究[J].圖書館學研究,2012(5):87-89.
[7]孫鶴然.基于語義門戶SEAL的數字圖書館構建研究[J].圖書館學研究,2011(7):48-52.
[8]徐華,等.關聯數據:圖書館學研究的新領域[J].南華大學學報(社會科學版),2011,12 (6):107-109.
[9]羅錚,等.高校圖書館應用關聯數據的意義及注意事項[J].圖書館雜志,2012(5):51-53.
[10]蔣京平,易慶勛.高校圖書館關聯數據的實現與挑戰[J].農業圖書情報學刊,2015(10):76-79.
[11]王景俠.圖書館從數據關聯到關聯數據化發展及其啟示[J].圖書館雜志,2014(11):49-54.
[12]孫鴻燕.圖書館關聯數據的綜合管理及其實現[J].圖書館學研究,2011(23):51-54.
[13]王忠義,等.數字圖書館中層關聯數據的創建與發布[J].現代圖書情報技術,2013(5):28-33.
[14]張忠莉.E-learning時代高校圖書館關聯數據的構建及應用分析[J].決策與信息(下旬刊),2014(12):41-43.
[15]游毅.面向圖書館關聯數據的語義鏈接構建研究[J].圖書與情報,2014(3):74-78,96.
[16]李華.近五年國內基于本體的數字圖書館研究綜述[J].圖書情報工作,2011(11):62-65,61.
[17]丁楠,潘有能.基于關聯數據的圖書館信息聚合研究[J].圖書與情報,2011(6):50-53.
[18]路瑩,甄保社.圖書館數字資源整合及發展趨勢[J].中華醫學圖書情報雜志,2012(10): 21-23.
[19]鄭燃,等.基于關聯數據的圖書館、檔案館和博物館數字資源整合研究[J].圖書與情報,2012(1):71-76.
[20]房小可.基于關聯數據的高校圖書館科學數據組織研究[J].圖書館建設,2013(10):31-34.
[21]歐石燕,王薇.基于本體與關聯數據的圖書館數字資源知識融合[C]//第四屆全國知識組織與知識鏈接學術交流會議文集.北京:中國科學技術情報學會,國家科技圖書文獻中心,2013:1-12.
[22]蘇春萍,等.基于關聯數據和SOA的醫學圖書館信息資源整合模型設計[J].中華醫學圖書情報雜志,2013(3):6-9.
[23]歐石燕,等.本體與關聯數據驅動的圖書館信息資源語義整合方法及其測評[J].圖書情報工作,2014,58(2):5-13.
[24]鐘莉.基于關聯數據的圖書館信息資源整合研究[D].杭州:浙江大學,2014.
[25]張鳳霞.關聯數據在圖書館數字檔案聚合與服務中的應用研究[J].山西檔案,2015(3):57-59.
[26]歐石燕,唐振貴.面向圖書館關聯數據的自動問答技術研究[J].中國圖書館學報,2015(6): 1-21.
[27]牛亞真,祝忠明.個性化服務中關聯數據驅動的用戶語義建??蚣埽跩].現代圖書情報技術,2012(10):1-7.
[28]付兵.基于關聯數據的數字圖書館個性化信息推薦系統[J].圖書館學刊,2013(4):108-110.
[29]李愛國,等.圖書館用戶信息模型框架構建[J].圖書情報工作,2015(13):1-7.
[30]曾琦.基于關聯數據的圖書館云服務平臺設計[J].圖書館學研究,2012(5):35-39.
[31]王業平.面向關聯數據的圖書館云服務研究[D].西安:西安電子科技大學,2013.
[32]田寧.基于關聯數據的圖書館云服務框架初探[J].農業圖書情報學刊,2014(1):57-59.
[33]鄒學昌.基于關聯數據的圖書館云服務研究[D].哈爾濱:黑龍江大學,2013.
[34]楊愛武.基于關聯數據的圖書館創新服務研究[J].圖書與情報,2012(3):85-88.
[35]趙明.基于關聯數據的知識地圖在圖書館信息服務中的模式研究[D].武漢:華中師范大學,2013.
[36]賀令輝.基于關聯數據的高校圖書館知識服務探討[J].圖書館研究,2013(1):95-97.
[37]趙衛軍.基于SOA的關聯數據的高校圖書館知識服務架構 [J].圖書館學刊,2013(6):103-105.
[38]李琳.關聯數據在圖書館界的應用與挑戰[J].圖書與情報,2011(4):58-61.
[39]付瑤.圖書館關聯數據質量控制研究[D].長春:東北師范大學,2013.
[40]梁亮,周宇麟.關聯數據在圖書館的應用實踐——以杭州圖書館“熱門標簽”應用為例[J].圖書館學研究,2013(18):24-28.
[41]陳定權,盧玉紅.圖書館在關聯數據運動中的角色解析[J].圖書館建設,2014(3):17-21.
[42]曹月珍,馬建玲.關聯數據在圖書館的最新發展[J].圖書館學研究,2014(14):6-12.
Research Review on Domestic Digital Library Based on Linked Data
Pan Xu,Yang Guang-yuan
Taking the documents of digital library that are based on linked data in mainland China as objects,this article summarizes the documents are mainly focus on 5 aspects:theoretical research of linked data,the construction and release of linked data,the organization and integration of the information resources based on linked data,the research of the knowledge service based on linked data and some reviews etc.Finally,the article points out the characteristic,the disadvantage and the future development of the researches on digital library based on linked data.
Linked Data;Digital Library;Resources Integration;Review
G250.76
A
1005-8214(2016)07-0034-05
潘煦(1974-),女,西南民族大學圖書館學科與信息咨詢部副研究館員,研究方向:圖書情報學;陽廣元(1982-),男,西南民族大學圖書館技術服務部館員,研究方向:信息科學、計量學、圖書情報學。
2015-12-03[責任編輯]閻秋娟