999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯數據的科研關系揭示與未來研究

2017-08-15 21:03:00李志姜小函
創新科技 2017年5期

李志 姜小函

[摘 要] 本文從關聯數據的角度,研究科研關系揭示問題。本文從關聯數據的研究現狀出發,認為基于關聯數據的科研關系揭示未來研究重點應從科研實體的識別與抽取、語義描述框架構建、科研實體及關系的本體構建、科研關系揭示服務這四個方面來開展。科研關系揭示實現了海量數字資源中分散的、異構的科研實體轉化成遵循統一標準的結構化數據,從而構建一個內容相互關聯、多維度的資源體系,將不同學科主題、不同內涵外延、不同屬性關系的實體進行識別、標識和鏈接,從而形成一個龐大的關聯數據網絡,以便快速、高效、全面地揭示科研關系。

[關鍵詞] 關聯數據;科研關系揭示;科研關系網絡

[中圖分類號] G205 [文獻標識碼] A [文章編號] 1671-0037(2017)5-28-4

Abstract: From the angle of linked date, this paper studied the scholarly relationship to revel problems.It starts from the present situation of linked date, and believes that the future research about revelation of scholarly relationship based on linked data should mainly follow four aspects: identification and extraction of research entity, construction of semantic description framework, ontology construction of scientific research entities and relationships, and revelation service of scholarly relationship. The scholarly relationship revelation has transformed disperse and heterogeneous scientific research entities in the massive digital resource into structured data following a unified standard,built a content-correlation and multi-dimension resource system, and achieved recognition, identification and association of entities with different subject themes,connotation extensions and attributes relationships, so as to form a huge network of linked data, for revealing scholarly relationship rapidly and efficiently.

Key words: linked data; scholarly relationship revelation; scholarly relationship network

1 引言

當前,學術數字資源已成為信息資源的主流,包含各類期刊、學位論文、會議錄、科技報告、圖書專著、專利、標準等。在這些數字資源中蘊含著豐富的科研實體,如科研主體(科研人員、科研機構、國家地區等)、科研活動(科學會議、科學實驗、科研項目等)、科研條件(科研方法、科學儀器、科研經費、科學期刊等)、科研產出(科研成果、專利、標準等)以及科學文獻、科學主題等[1],這些科研實體之間存在著相互交錯的多維聯系,稱為科研關系。科研關系揭示研究有利于增加信息檢索的準確性,提高檢索效率;有助于構建大型的科研關系網絡,展現知識與知識之間的潛在聯系,進而更加有效地實現知識導航、智能檢索、科學評價、專家識別等深層次的知識服務。如何實現相關實體的有效聚合,深入挖掘和有效地揭示科研關系是科研關系網絡構建的基礎。

2 關聯數據研究現狀

2006年,萬維網之父伯納斯-李(Tim Berners-Lee)首次提出關聯數據(Link Date)的概念,他認為“關聯數據”是一組用于發布、共享和鏈接網絡上的結構化數據的最佳方法。關聯數據以RDF(資源描述框架,Resource Description Framework)作為基礎,將Internet上分布的異構的、不同形式的非結構化數據轉化為具有統一標準的結構化數據,方便用戶和機器的閱讀與理解,并且利用URI(統一資源標識符,Uniform Resource Identifier)來命名和發布數據實體,然后通過http協議獲取這些數據[2]。關聯數據是在現有萬維網基礎上,構建一個能夠與世間萬物一一映射的數據網絡,可以對世界上的任何實體以及它們之間存在的關聯關系進行理解和描述,進而形成一個結構化、具有豐富語義且互通互連的知識網絡,使用戶可以通過計算機網絡工具準確、快速、高效地在網絡中找到互相關聯的知識。因此,關聯數據是語義網的一種輕量級的實現技術,它有堅實的技術基礎,完整的系統結構,簡單高效的發布方式,并且能夠為不同類型、不同語言、不同粒度的數字資源動態聚合提供新的研究視角。

2.1 理論研究方面

自關聯數據提出之后,國內外相關領域的學者就關聯數據本身開展了大量的理論研究。2007 年 Richard Cyganiak人在“Linking open data”項目申請中再次強化關聯數據的概念[3],此后關聯數據的研究受到了各界的重視。自此,全球互聯網大會、AAAI年會和語義萬維網等國際會議均有關聯數據的主題會議。2011年圖書館信息資源委員會(Council on Library and Information Resources)、斯坦福大學圖書館與學術信息資源中心(Stanford University Libraries and Academic Information Resources)召集技術專家和圖書館相關人員對關聯數據在圖書館中的應用所遇到的問題和挑戰進行了討論[4]。國內關聯數據的研究始于2008年,上海圖書館的劉煒等人對國外關聯數據的文獻和著作進行了翻譯,并介紹了相關應用。2010年中國科學院的沈志宏和張曉琳梳理和分析了大量文獻,介紹了關聯數據的原則和技術體系,研究了關聯數據的核心技術[5]。2012年中國科學院國家科學圖書館的陶俊對德國柏林自由大學提出的關聯數據映射語言R2R進行了深入分析,并與SPAR-QL語言比較,發現推廣R2R有助于提升RDF鏈接創建能力,從而更好地為創建關聯數據提供支持[6]。2014年學者游毅按照關聯數據的基本原則與聚合機制,通過圖書館MARC書目數據的RDF格式轉換、URI資源命名與指向外部數據源的RDF鏈接實現館藏元數據的關聯數據化與網絡關聯,提供了一個實現館藏資源關聯揭示的全新模式[7]。同年樊秋妮和張麗萍利用西安航空學院圖書館有效的MARC數據,從網站上收集相關信息并參照FRBR模型進行書目數據分解,利用關聯數據來實現書目數據語義化[8]。

2.2 應用研究方面

2.2.1 國外關聯數據應用現狀。在關聯數據的實踐推進中,2008年瑞典國家圖書館(National Library of Sweden)最先將本國的國家聯合目錄發布為關聯數據。緊接著,美國國會圖書館(Library of Congress)英國國家廣播公司(British Broadcasting Corporation)、法國國家圖書館(La biliothèque nationale de France)和德國國家圖書館(Die Deutsche Nationalbibliothek)等的書目數據也紛紛開放了關聯數據服務。2009年作為國際領先的搜索引擎公司Google利用關聯數據對視頻內容進行標識,對搜索結果摘要中的人物和評論進行RDFa標識,提高了Google的搜索質量,更好地滿足了用戶的檢索需求。2010年萬維網協會W3C還專門成立圖書館關聯數據孵化小組,鼓勵圖書館界將各類文檔和數據以關聯數據的形式發布到網上,使圖書館的資源能夠在和互聯網上實現共享[9]。美國國立衛生研究院資助康奈爾大學等機構研發了VIVO平臺,利用RDF、OWL、Jena和SPARQL等技術,構建一個廣泛適用的科研本體,對科研人員、科研項目、科學數據、科研成果以及文獻資源等進行語義化的知識揭示,為科研人員提供關聯知識發現服務[10]。英國廣播公司BBC(British Broadcasting Corporation)使用關聯數據技術進行數據集成,如將音樂網站與維基百科鏈接,獲取音樂人的信息,通過關聯數據技術為每個節目建立自己專屬的網頁和靜態地址,使用戶體驗得到大幅度的提升。此外,還有紐約時報、百思買等紛紛使用關聯數據技術發布多媒體、新聞等數據。

2.2.2 國內關聯數據應用現狀。與國外相比,國內針對關聯數據的應用相對較晚。中國科技信息研究所較早關注關聯數據,并針對關聯數據技術應用開展實踐。2008年國家科技圖書情報文獻中心最早成立了關聯數據項目。2010年中國科學技術信息研究白海燕等初步實現了關聯數據在書目信息組織中的應用。2011年武漢大學信息資源研究中心馬費成等提出一個基于關聯數據的網絡資源集成框架,設計并實現了以“武漢大學”為基本單位的免費網絡學術資源集成實驗系統[11]。2012年中國人民大學和清華大學信息研究院的朝樂門和邢春曉等人研究關聯數據的跨域共享以及關聯數據知識地圖的原則、體系、技術等,并在此基礎上采用語義Web編程技術實現面向DBpedia、Yago、FOAF、Freebase等不同關聯數據集的知識地圖系統[12]。2013年中國農業科學院農業信息研究所的鮮國建設計自動批量轉化工具,將農業科學敘詞表(Chinese Agricultural Thesaurus,簡稱 CAT)轉換為CAT/SKOS關聯數據,實現面向農業科研的新型服務[13]。2014年吉林大學崔春等人采用挖掘實體關系為目標的研究路線與方法、發布中文名稱規范關聯數據、對現有本體進行選擇和映射、利用眾包方式開展文本分析工作探索了關聯數據在提升文化遺產文獻的可視性方面的應用[14]。2015年浙江大學丁楠等人研究了關聯數據在加強政府信息集成方面的應用,構建了基于關聯數據技術的政府信息聚合模型,并通過實例驗證了其可行性[15]。2016年上海圖書館的夏翠娟等人以家譜開始,利用關聯基于語義萬維網的規范控制方法和基于知識本體的知識組織方法以及關聯數據技術等實現了面向知識發現的數字人文服務[16]。

2.3 其他方面

同時,還對CNKI優秀博碩士學位數據庫中有關關聯數據的文獻進行了檢索,得到博碩士學位論文49篇(檢索式為題名=“關聯數據”),其中博士論文6篇,碩士論文43篇。這6篇博士論文分別屬于計算機系統結構、農業信息管理與情報學專業,研究主要集中在關聯數據實現技術、關聯數據在知識服務和圖書館建設方面的應用,如表1所示。碩士論文的研究主要集中在關聯數據的技術體系和基本原則,以及關聯數據在知識服務、圖書館與檔案建設、企業、農業與醫學等方面的信息服務。

此外,又對全國社會科學規劃辦公室(簡稱“社科”)和國家自然科學基金委員會(簡稱“自科”)的網站進行了檢索,得到我國關聯數據項目的立項情況,如表2所示,其研究主要集中在關聯數據自身的理論研究以及關聯數據在圖書館建設、知識服務和政府數據開放方面的應用。自2011年以來,我國一直都有關聯數據的專門項目支持,這些項目不僅僅停留在關聯數據的理論研究,更多涉及到關聯數據的應用,使研究成果更好地為社會提供服務,發揮關聯數據的價值與優勢。

3 基于關聯數據的科研關系揭示未來研究建議

綜上所述,關聯數據的相關理論研究已經比較成熟,其應用范圍正在逐漸擴大。如何利用關聯數據已有的理論、方法、工具、規則去識別、揭示和挖掘出隱含的、復雜的、多維的科研關系是關聯數據在科研關系揭示方面的又一新的嘗試和應用。本文認為,基于關聯數據的科研關系揭示是在探討科研關系揭示概念與內涵,分析科研實體屬性與特征,以及科研關系類型、結構與表現形式的基礎上重點研究科研實體的識別和抽取、科研關系的語義化描述、科研實體和關系的本體構建,以及科研關系的應用這四個方面的內容,研究框架如圖1所示。

3.1 科研實體的識別與抽取

一方面,需要進行科研實體的識別與標注。分析不同科研實體的屬性特征,利用基于海量文本統計和自然語言理解來界定科研實體的語義特征,以便識別更細粒度的科研實體。采用命名實體識別研究方面相對成熟的技術和方法,如基于規則的方法、基于統計的方法、基于規則和統計相結合的方法、機器學習與人工知識相結合的方法等,結合海量信息資源所提供的信息,對主要科研實體,如人名、機構、地名進行識別。重點研究基于海量信息資源的篇章結構、科研實體的語義特征以及科研實體之間的鄰近度來識別和標注科研實體。另一方面,對科研實體進行歸一與規范。對于主要科研實體的規范文檔中存在的對同一科研實體的多個名稱或不同實體的重名等現象進行消歧和命名規范化處理,采用基于上下文的文本向量聚類方法,并充分考慮文本中詞與詞之間的關聯度及相互的語義關系,通過相似度算法,使其在大規模文獻資源中能夠自動選擇或生成一個最優的命名,實現科研實體命名規則的規范化。在科研實體的識別、標注、描述和命名規則研究基礎上,抽取科研實體,形成科研實體的知識庫,為基于關聯數據的科研實體語義描述奠定基礎。

3.2 基于關聯數據的科研關系語義描述框架研究

在現有的RDF、SKOS、OWL基礎上,針對科研實體及其關系的特殊性和復雜性,構建適用于科研關系的語義描述框架。在對科研實體及其關系特征分析的基礎上,利用RDA提供的數據元素定義、屬性關系描述、注冊取值詞表的控制等多種描述手段,定制并設計出不同科研情景下的RDA綱要,構造科研實體及其關系之間的邏輯關系。針對科研實體及其關系的多維性和復雜性,構建多維實體組配知識體系模型,實現與科研實體的關聯,實體概念與概念之間、概念與實例之間、實例與實例之間、引證關系、關聯關系、共現關系等多方面集成并能將其表征為可擴展的RDF有向網絡圖,使其具備關聯數據集基礎。

3.3 基于關聯數據的科研實體及其關系本體構建研究

選取骨架法、企業建模法、Methontology和Berneras et a.l等方法中的一種,利用Ontosaurus、Ontolingua、OILEd、Protege、OntoEdit等本體構建工具來對領域知識進行建模,然后從海量數字資源中抽取出科研實體,通過語義表征技術SKOS與OWL的語義遞進轉換,鏈接和集成規范數據與主題概念體系的表征,實現科研實體及其關系的語義化描述,從而構建科研本體。在本體構建過程中,要產生一份本體需求及規格說明的文檔,這份文檔在本體構建完成后有助于實現知識共享。

3.4 基于關聯數據的科研關系揭示服務研究

科研關系揭示不僅是理論問題,更是現實問題,其理論研究需要在實踐中進行驗證。在不同來源、不同結構和不同類型的海量數字資源中,進行科研實體的識別與抽取、語義框架描述、本體構建,配置發布服務器,解析每個實體的URI,根據內容協商原則返回正確的網頁描述和RDF描述,使其與外部資源形成關聯,在此基礎上開展基于面向用戶的深層次的知識檢索、基于關聯數據的智能導航服務和相關知識聚合推送服務等。

4 結語

海量數字資源中存在著大量分散的、異構的科研實體,對用戶快速、準確的檢索科研信息帶來不便。運用關聯數據技術進行科研關系揭示將有助于將分散的、異構的科研實體轉化成統一的結構化數據并對其進行標識和鏈接,從而構建一個大型的共享的科研關系網絡,最終為用戶提供更好的知識服務。

參考文獻:

[1] 曾建勛.知識鏈接及其服務研究[M].北京:科學技術文獻出版社,2012.

[2] Linked data FAQ[EB/OL].http://structureddynamics.com/linked_data.html.2015-03-05.

[3] W3C. Linking Open Data[EB/OL].http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenDate.2015-04-05.

[4] 歐亮.斯坦福大學關聯數據報告概述[J].重慶第二師范學院學報,2013(3):164-168.

[5] 沈志宏,張曉林.關聯數據及其應用現狀綜述[J].現代圖書情報技術,2010(11):1-9.

[6] 陶俊,孫坦,劉崢.關聯數據映射語言R2R[J].中國圖書館學報,2012(3):100-109.

[7] 游毅.面向館藏聚合的書目關聯數據實現[J].情報理論與實踐,2014(8):105-110.

[8] 司莉,李鑫.基于關聯數據的科學數據集成與共享研究——以Bio2RDF項目為例[J].圖書館學研究,2014(21):51-55.

[9] W3C Library Linked Data Incubator Group[EB/OL].http://www.w3.org/2005/Incubator/lld/2015-03-05.

[10] 趙雪芹.知識聚合與服務研究現狀及未來研究建議[J].情報理論與實踐,2015(2):132-135.

[11] 馬費成,趙紅斌,萬燕玲,楊東晨,賴潔.基于關聯數據的網絡信息資源集成[J].情報雜志,2011(2):167-170,175.

[12] 朝樂門,張勇,邢春曉,張健.數據驅動型知識地圖及其關鍵技術[J].圖書情報工作,2012(10):25-29,40.

[13] 鮮國建,趙瑞雪,朱亮,寇遠濤.農業科學敘詞表的SKOS轉化及其應用研究[J].現代圖書情報技術,2012(10):16-20.

[14] 崔春,畢強.關聯數據在數字人文領域中的應用剖析——以關聯爵士項目為例[J].圖書情報工作,2014(24):99-105.

[15] 丁楠,王鈺,潘有能.基于關聯數據的政府信息聚合研究[J].情報理論與實踐,2015(7):76-79,85.

[16] 夏翠娟,張磊.關聯數據在家譜數字人文服務中的應用[J].圖書館雜志,2016(10):26-34.

主站蜘蛛池模板: 欧美成人二区| 91精品视频在线播放| 国产人人射| 美女无遮挡拍拍拍免费视频| 国产成人综合日韩精品无码不卡| 欧美一区二区三区欧美日韩亚洲| 伊人激情综合网| 国产精品三区四区| 色综合久久88色综合天天提莫| 国产精品伦视频观看免费| 中文字幕在线欧美| 亚洲人成色77777在线观看| www.99精品视频在线播放| 思思热精品在线8| 亚洲无码精彩视频在线观看| 国产精品99r8在线观看| 国产高清不卡视频| 国产精品13页| 国产91视频免费观看| 一级一级特黄女人精品毛片| 久操线在视频在线观看| 成人毛片免费在线观看| 久久男人资源站| 国产免费精彩视频| 在线观看精品自拍视频| 99精品免费欧美成人小视频| 任我操在线视频| 五月婷婷欧美| 日韩在线播放中文字幕| 欧美性色综合网| 伊人精品视频免费在线| 精品国产美女福到在线不卡f| 亚洲综合专区| 国产午夜无码片在线观看网站 | 久久香蕉国产线看精品| 久久综合九色综合97网| 国产精品伦视频观看免费| 91区国产福利在线观看午夜| 国产一区二区三区免费观看| 日韩精品专区免费无码aⅴ| 日韩在线观看网站| 2020精品极品国产色在线观看 | 国产精品久久久久鬼色| 天堂成人av| 99视频全部免费| 亚洲国产成人精品一二区| 99久久性生片| 久久中文无码精品| AV不卡国产在线观看| 久久99蜜桃精品久久久久小说| AV网站中文| av天堂最新版在线| 国产成人艳妇AA视频在线| 免费高清自慰一区二区三区| 人妻无码中文字幕第一区| a亚洲视频| 蜜臀AVWWW国产天堂| 亚洲伊人久久精品影院| 久久99久久无码毛片一区二区| 一本一道波多野结衣av黑人在线| 欧美另类视频一区二区三区| 极品国产在线| 91欧美在线| 午夜不卡视频| 久久福利片| 91福利免费| 在线观看无码a∨| 国产亚洲欧美日韩在线观看一区二区 | 人妻中文久热无码丝袜| h网站在线播放| 亚洲人成网站日本片| 国产精品黑色丝袜的老师| 久久亚洲国产一区二区| 无码粉嫩虎白一线天在线观看| 人妻精品久久无码区| 精品少妇人妻一区二区| 国产午夜精品一区二区三| 五月天久久婷婷| 99精品福利视频| 91美女在线| 国产丝袜丝视频在线观看| 中文纯内无码H|