999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向科研信息資源整合的元數據協同方法研究

2017-08-30 23:28:07于薇
現代情報 2017年8期
關鍵詞:整合

于薇

〔摘 要〕針對科研信息資源整合利用問題,利用元數據協同的方法為已有科研信息資源系統的整合與共享利用提供解決方案。以論文、專利、科技報告為例,把表示相同語義的元數據整合到一個體系下,形成子體系,將多個子體系整合到一個網絡中,形成元數據映射網絡。結果表明,元數據協同方法在保持原有元數據標準不變的前提下,可以通過語義層面的映射來解決不同科研信息資源的整合與利用問題,對解決科研信息資源整合具有比較現實的意義。

〔關鍵詞〕科研信息資源;整合;元數據;協同方法

DOI:10.3969/j.issn.1008-0821.2017.08.010

〔中圖分類號〕G254.362 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)08-0074-07

〔Abstract〕Research information resource integration is the key for collaborative innovation. This paper used the method of information harmonization to resolve the problem of research information resource integration. This paper expressed the different metadata schemas in a semantic mapping network to integrate the paper,patent,scientific and technical report. The result showed that metadata harmonization provided a method to map the different metadata schemas on the semantic level,and provided a useful reference for research information integration.

〔Key words〕research information resource;integration;metadata;harmonization method

科研信息資源是數字資源中與科研活動相關的資源集合,是已經數字化的、與科研活動相關的科技管理政策、科研條件、科研活動中產生的論文、專著、專利、科研數據、科技報告及檔案等資源的總和,是科研活動的寶貴財富資源,是進行科技管理和知識服務的資源基礎,既是科研活動的產出成果,也是科研活動管理、實施和評價的重要參考,對于國家科技計劃管理部門、科研單位和研究者個人而言都有著非常重要的參考價值。

政府、科研機構、科技信息服務機構等科研活動主體由于使用目標不同、任務職責不同、參考和制定元數據規范不同等原因,導致科研信息資源的組織方式也存在差異,給科研信息資源的整合造成了困難。如何以盡量少的成本代價實現已有科研信息資源系統的整合與共享利用,是圖書情報學和信息資源管理等領域專家學者重點思考的問題。元數據協同是在一個系統中,多個元數據標準的組合互操作的能力,為解決不同元數據標準之間的語義差異問題而提出的新的研究思路。因此,本文以論文、專利、科技報告等科研信息資源為研究對象,探討元數據協同在科研信息資源整合中應用的問題和解決方案。

1 科研信息資源元數據研究現狀

1.1 從科研信息資源元數據創建者角度

隨著網絡技術的發展,元數據的創建已不僅僅是元數據信息管理人員的職責。NISO[1]提出研究人員、技術人員和信息專家在創建元數據時需要合作,例如由數字化或創建數字對象的技術人員負責創建管理元數據或結構元數據,由資源提供者負責描述元數據,共同完成元數據創建工作。

可見,元數據的創建者已經不再僅僅局限于信息資源管理與加工人員,資源的創建者也開始加入到元數據創建工作中來。因為元數據創建者來源的多樣性,就導致不同創建者對同一元數據元素定義不同的問題發生。當不同的信息資源系統進行整合和互操作時,大量的、多樣化的元數據標準規范將會阻礙信息資源整合的效率和質量。

1.2 從科研信息資源元數據標準類型角度

狹義的科研信息資源包括論文、專利、科學數據、科技報告等在科研活動過程中產生的信息資源,為了對這些信息資源進行組織和利用,科研機構和科技信息機構創建了描述不同類型信息資源的元數據標準規范。

國內已有的元數據標準從使用范圍看,有國家標準和行業標準之分;從資源類型看科技報告、檔案、信息與文獻、科學數據元數據之分。已經發布的各類元數據標準中(見表1),以“地理空間信息”為例,涉及城建、水利和測繪三種元數據標準,不同標準對于元數據元素含義的定義也不盡相同,造成資源間的整合利用的困難。

綜上,元數據仍然是對科研信息資源進行建設、組織、管理與利用的重要工具,國外的元數據研究從使用、標準、應用等多方面開展了廣泛的研究,國內更關注在具體科學領域的元數據標準建設方面,對于功能需求和應用的研究較少。目前國內對于科研信息資源元數據標準規范的研究多是面向信息資源組織管理,而較少從應用需求和資源共享整合的角度考慮元數據標準規范的建設。

2 元數據協同的研究現狀

關于元數據語義互操作的研究,自St. Pierre和LaPlant[2]在1998年提出元數據互通的語義協調開始,一直是元數據互操作研究領域的熱點。

為了解決元數據標準規范之間的語義互操作,學術界開始關注利用本體來描述元數據語義和利用本體映射來傳遞語義的研究。2000年左右,來自澳大利亞、英國和美國的研究人員建立了一個核心本體——ABC本體,用來描述元數據的語義特征,目的[3]在于提供一個用來理解和分析現有元數據本體與實例的概念基礎,為未來繼續調查和建立描述性本體提供指導,為元數據本體之間的自動映射提供概念性基礎。這個本體不僅描述了跨領域的基本概念,而且提供了建立專門領域的概念和術語的基本方法和框架。

在元數據語法一致性解決的前提下,需要建立一個統一的描述語義和語法相互關系的框架,即元數據的抽象模型。元數據的抽象模型對元數據的互操作有重要的影響。Devey M和Cote M[4]介紹了在加拿大政府元數據項目中遇到的元數據結構不一致帶來的困難。Nilsson Mikael[5]通過研究發現在E-learning領域,由于DC和LOM的抽象模型不同,合并DC和LOM元素會造成語法不一致的問題。

國際上已經有一些文化遺產項目將本體應用于現有的元數據系統中,解決公共數字文化資源的語義互操作問題。芬蘭的CultureSampo基于國際finnONTO本體框架構建了文化遺產語義門戶,利用KOKO本體的映射關系,解決了高度異質性與跨領域的文化遺產整合問題,將資源聚合到一個具備豐富語義的人機智能系統,可實現語義檢索與推薦、語義可視化等[6]。eCHASE項目采用CIDOC CRM和CRM核心本體作為元數據映射方案,解決文化遺產資源的語義整合與互操作問題[7]。Stasinopoulou T等提出基于本體的文化遺產領域的元數據整合方案,選擇CIDOC CRM本體作為中介促進元數據的語義真核,研究元數據向本體映射的問題及EAD和DC元數據到CIDOC CRM的映射方法,實現文化遺產領域的語義互操作[8]。Kakali C等提出了一種基于本體的元數據互操作框架,使用CIDOC CRM本體作為中介模型,研究將DC元數據及DCCAP映射其中的方法,構建基于本體的元數據語義整合機制[9]。國內肖希明[10]提出了基于本體的公共數字文化資源整合語義互操作模型。

綜上分析,通過引入領域本體可以解決元數據語義一致性問題,這為實現科研信息資源整合提供了思路,但是在科研信息資源整合領域還未見深入的探討與研究。

3 科研信息資源整合的元數據協同方法研究

科研信息資源是數字資源中與科研活動相關的一類數字資源的集合,隨著網絡和信息技術的發展,絕大部分科研信息資源已經轉變成數字的形式,存儲在不同系統中,例如我們平時使用的專著、論文和檔案數據庫等。還有一部分科研信息資源分散在網頁上,如學術會議信息、科研機構信息、科研人員的博客等,這些資源以HTML、XML、Excel、Word、PDF等格式存在。從數字資源組織的角度看,前一類科研信息資源屬于規范的資源,后一類科研信息資源數據非規范的資源。目前通過元數據標準組織管理的科研信息資源多屬于規范性數據庫。這類科研信息資源在一定程度上有序,不同資源之間又存在差異,這為科研信息資源整合提供了基礎,同時也提出了迫切需求。

3.1 科研信息資源的特征

科研信息資源具有以下特征:

1)在一定程度上的有序。經過元數據標引組織的科研信息資源在一定程度上是有序的,而這為科研信息資源整合提供了前提。

2)存在異構性。“異構”的含義比較廣泛,資源的異構性主要體現資源存儲系統的異構性、資源類型的異構、資源結構、語法上的異構、資源語義之間的異構。科研信息資源的異構性已成為知識服務的主要障礙之一,也使得科研信息資源整合成為一種迫切需要。

3)具有開放性。科研信息資源可以通過信息技術進行基于格式和內容的鏈接,實現異構資源之間的互操作。科研信息資源的這種開放性使得資源整合成為可能。

4)生長性。科研信息資源一方面為科研活動提供參考價值和研究基礎,另一方面科研活動又產生新的科研信息資源,是不斷膨脹和反復利用的過程。科研信息資源這種生長性,對元數據標準組織管理資源的能力提出了挑戰。

在分析了科研信息資源的分類和特征基礎上,我們可以看出科研信息資源的整合是一個系統性工程,在為協同創新提出知識服務的目標下,必須以系統科學和知識論為理論基礎,通過整合技術和方法,將不同科研資源內部的分散知識關聯組織成有效的知識網絡,從而提供有效的知識服務。

3.2 面向科研信息資源整合的科研本體

客觀描述科研活動的相關要素,并準確表示各要素之間的關系,對知識獲取和科研信息資源整合具有重要的應用意義。借鑒Ettorre等人提出的科研本體[11],本研究分析了科研活動中涉及的要素及其之間的關系,提出了為科研信息資源整合服務的本體對象和關系模型。

主要概念包括機構(organization)、科技計劃(plan)、科研人員(people)、科研產出(outcome)、科研項目(project)、研究領域(researchfield)。進一步又細分成更具體的概念,如在機構(organization)中,又包括管理機構、科研機構,在科研產出(outcome)中,又包括期刊論文(Paper)、專利(patent)、科技報告(S&T report)和產品(Product)等。

各主要概念之間存在著相互關系,如管理機構和科技計劃之間存在制定關系(Plans),科研機構與科研項目之間存在承擔關系(undertakes),科技計劃與科研項目之間存在資助關系(supports),科研項目與研究領域、科研人員與研究領域、科研產出與項目之間存在屬于關系(Belongs_to),科研人員與科研項目之間存在參與研究關系(Has_attendees),科研人員與科研單位之間存在隸屬關系(Has_position)。

主要概念和概念之間的關系組成了科研活動中相關要素的知識網絡如圖1:

每一個概念是一個類,每個類下均有實例。以“機構”這一類進行說明,“機構”的下位類分“管理機構”、“科研機構”和“企業”等。

3.3 基于語義的元數據協同映射模型

實現元數據的協同,首先需要構建適用于多數據源的映射模型。通過借鑒都柏林核心元數據以及對網絡信息的語義描述框架,可以幫助我們建立多元數據映射模型,采用一種普適的方法將多源數據映射到一個網絡中。在這個元數據協同映射模型中,映射可能存在多種形式,兩個不同元數據中“意義”相同的元素可能會使用不同的名稱,同時相同名稱的元素也有可能有不一樣的“意義”。

基于語義進行映射,通過初始設定的語義,將多個不同元數據通過初始設定的語義映射到同一元數據中。這樣,不同元數據中“意義”相同的元素將會賦予相同的名稱;不同數據源中相同名稱的元素也會因為本身所具有的“意義”不同而被賦予不同的名稱。

3.4 映射模型中的主體

通過構建基于語義的元數據協同映射模型,可以有效地實現元數據協同,進而實現科研信息資源的整合。元數據協同映射模型中的主體包括三個,分別是實體、元素和值。

3.4.1 實體

實體,表示的是科研信息資源中存在且可以互相區別的事物,由于科研信息資源中既包括人,也包括物,因此實體在這里既可以表示人,也可以表示物。同時實體也可以作為一個抽象概念被我們所理解。

通過對科研信息資源的分析,我們發現在科研信息資源中,實體由物理和抽象的構成。物理指的是在科研信息資源中,能夠在客觀世界中直接反應的實體,包括資料文檔、機構、人物等。抽象指的是在科研信息資源中,并不能在客觀世界中直接反應的實體,具有抽象的概念,包括學科、分類等。根據對實體的分類,我們做出基于科研信息資源的實體分類圖,如圖2所示。

從圖2我們可以發現,從科研論文、專利、科技報告三種科技數字資源出發,實體可以由Document(文檔)、Person(人物)、Institution(機構)、Discipline(學科)、Classification(分類)五個大類構成。文檔表示論文、專利、科技報告三種資源;人物表示論文、專利、科技報告中涉及的人物,包括作者、發明人、專利權人、科技報告提供者、科技報告作者等;機構包括論文、專利以及科技報告的所在機構可以是科研機構,也可以是企業,除此之外還可以是資助該項目所涉及的基金機構;學科包括論文、專利、科技報告所涉及內容的學科,這里的學科包括該內容涉及的主題,通過對主題的識別判斷學科內容;分類指的是論文、專利、科技報告中所涉及的相關研究方向的分類,其中論文可以通過中國圖書館分類法、中國科學院圖書館分類法等分類法進行分類、專利可以通過國際專利分類或者美國專利分類等方法進行分類,科技報告可以通過其學科所屬進行分類。

因此,實現元數據的協同,首先在于實體的劃分,如何劃分實體決定了協同后元數據的規范情況,本文將科研信息資源的實體劃分為文檔、人物、機構、學科以及分類五個方面,這種劃分有助于后期對元數據協同的實現。

3.4.2 元素

基于語義的元數據協同映射模型中,元素是對實體內容的描述。每一個元素都有一個描述性名稱,對實體內容相應部分進行描述性定義。

針對科研論文、專利以及科技報告的元數據,本文通過語義整理,提出適用于三種資源的核心元素,其中,針對文檔的科研信息資源元素規范如表3所示。

根據針對文檔的科研信息資源元素規范,本文分別對五個不同實體提出了其獨有的元數據規范,分別是基于科研信息資源中人物的核心元素,基于科研信息資源中機構的核心元素、基于科研信息資源中學科的核心元素以及基于科研信息資源中分類的核心元素。

3.4.3 值屬性

基于語義的元數據協同映射模型中,值是對每個元素內容的描述。在該模型中,值有兩種類型,數值型和文本型。

元數據元素的描述,是不同科研信息資源之間互操作性的基礎,對于不同科研信息資源之間不一致的描述,使用元數據可以很好地做到統一描述。這種基于元數據實現的元數據抽象模型,是設計元數據規范的重要工具之一,可以很好地解決前邊提到的不同元數據之間統一性問題。

3.5 元數據協同映射網絡

針對科研信息資源中的論文、專利以及科技報告元數據制作多個基于語義的元數據協同映射模型,并將多個基于語義的元數據協同模型結合起來,構成基于語義的元數據協同映射網絡,網絡如圖3所示。網絡中存在7個實體,17個元素以及每個元素所賦予的值,實體之間、元素之間以及實體與元素之間存在直接映射關系和間接映射關系。

從元數據協同映射網絡模型中可以看出,將所有元數據劃分成兩類,分別是Physical(物理)和Abstract(抽象),Physical對應Document(文獻)、Person(人物)和Institution(機構)三個子體系,Abstract對應Discipline(學科)和Classification(分類)兩個子體系。對于文獻來說,可以映射到文獻的子體系包括Type(類型)、Doi、Keyword(關鍵詞)、Publish year(出版年)、Topic(主題)、Publisher(出版商),該網絡末端為研究對象所共有或獨有的元數據。將從科研論文、專利、科技報告中抽取得到的元數據映射到該網絡中,映射后得到的元數據體系就是科研信息資源邏輯描述體系。

3.6 基于元數據協同的科研信息資源整合方法模型

基于元數據協同的科研信息資源整合方案由資源層、元數據標準協同層和服務層構成。資源層主要包括科研活動相關的科研管理類資源、科研條件類資源和科研成果類資源,這些資源原本相互獨立,分散存在于異構的數字資源系統中;元數據標協同層是將不同資源的元數據標準組合在一起,利用水平協同的方法將不同元數據標準中的元素集進行映射,利用垂直協同的方法XML作為編碼規則,以RDF表示元素關系,對不同元數據標準內部進行協同,通過前邊構建的科研本體對元數據標準集合進行知識結構的解釋,從而實現對不同科研信息資源的整合。

4 結語

元數據協同是元數據研究領域為解決不同元數據標準之間的語義差異問題而提出的新的研究思路,通過解決不同元數據標準的語義一致性問題,降低不同系統整合的成本。本文以論文、專利、科技報告等科研信息資源為研究對象,通過構建科研本體和元數據協同映射網絡,探討元數據協同方法解決解決科研信息資源整合的問題,具有比較現實的意義。但是對大規模科研信息資源構建元數據協同映射網絡,還有很多問題,比如系統存儲規模,推理能力,語義關系的準確性等。進一步引入本體來研究科研信息資源元數據協同的實現將是下一步研究的重點。

參 考 文 獻

[ 1 ] National Information Standards Organization. Understanding metadata[EB/OL]. [2014-8-22]. http://www.niso.org/publications/press/UnderstandingMetadata.pdf

[ 2 ] St. Pierre M,LaPLANT W P. Issues in Crosswalking Content Metadata Standards[EB/OL].(1998)[2009-21-12].http://www.niso.org/press/whitepapers/crosswalk.html

[ 3 ] LAGOZE C,HUNTER J. The ABC Ontology and Model[EB/OL]. Journal of Digital Information,2001(2).[2009-08-08].http://jod.ec3.ac.uk/Articles/v02/i02/Lagoze/

[ 4 ] Devey M,Cote M. the Development and Use of Metadata Application Profiles:the Government of Canada experience[J]. the Serials Librarian,2006,(2).

[ 5 ] Nilsson Mikael,Naeve Ambj?rn. Metadata Harmonization:a Roadmap for Standardization. http://kth.diva-portal.org/smash/record.jsf?pid=diva2:359449 ,2010.

[ 6 ] Hyvonen E,et al. CultureSampo—Finnish Culture on the Semantic Web2.0. Thematic Perspectives for the End-user[C]//Proceedings,Museums and the Web. 2009:15-18.

[ 7 ] Sinelair P,et al. Semantic Web Integration of Cultural Heritage Sources[C]//Proceedings of the 15th International Conference on World Wide Web. ACM,2006:1047-1048.

[ 8 ] Stainopoulou T,et al. Ontology-based Metadata Integration in the Cultural Heritage Domain[M]//Asian Digital Libraries. Looking Back 10 Years and Forging New Frontiers. Springer Berlin Heidelberg,2007:165-175.

[ 9 ] Kakali C,et al. Integration Dublin Core Metadata for Culture Heritage Collections Using Ontologies[C]//International Conference on Dublin Core and Metadata Applications. 2007:128-139.

[ 10 ] 肖希明,完顏盼盼. 基于本體的公共數字文化資源整合語義互操作研究[J]. 國家圖書館學刊,2015(3):43-49.

[ 11 ] Ettorre M,Pontieri P,Ruffolo M,et a1.A Prototypal Environmentfor Collaborative Work Within a Research Organization[C].In:Proceedings of the 14th International Workshop on Database and Ex—pert Systerw Applications,Ithaca,Greece.2003:274.

(本文責任編輯:馬卓)

猜你喜歡
整合
信息技術與數學課堂教學有機整合的認識和思考
新一代(2016年15期)2016-11-16 17:30:38
企業并購后的財務整合工作問題的思考
民俗文化 讓語文教學更精彩
論信息技術與初中歷史教學的整合
考試周刊(2016年85期)2016-11-11 02:01:15
新課程背景下小學語文與信息技術的整合
考試周刊(2016年85期)2016-11-11 00:56:41
談高職院校計算機教學中學生創新能力培養
淺析信息技術與小學數學教學整合
人間(2016年26期)2016-11-03 19:03:18
基于SWOT分析下的十堰市旅游資源整合探究
時代金融(2016年23期)2016-10-31 11:03:10
記初中英語詞匯教學的一次歸類、整合改革及反思
考試周刊(2016年76期)2016-10-09 08:23:04
音樂與科學有效整合的研究
成才之路(2016年26期)2016-10-08 11:39:33
主站蜘蛛池模板: 任我操在线视频| 久久久久无码精品| 国产毛片基地| 最新日韩AV网址在线观看| 欧美一区二区丝袜高跟鞋| 凹凸国产分类在线观看| 亚洲免费福利视频| 无遮挡一级毛片呦女视频| 欧美日本激情| 国产精品中文免费福利| 天天激情综合| 91久久国产成人免费观看| 手机看片1024久久精品你懂的| 九九香蕉视频| 久久久久夜色精品波多野结衣| 国产乱子伦精品视频| 欧美日韩91| 欧美天天干| 成人综合网址| 福利视频一区| 亚洲综合18p| 国产一区成人| AV在线天堂进入| 99在线观看视频免费| 国产传媒一区二区三区四区五区| 国产手机在线小视频免费观看| 国产一级视频久久| 福利小视频在线播放| 国产免费黄| 无码高潮喷水专区久久| 亚洲免费人成影院| 亚洲天堂首页| 无码啪啪精品天堂浪潮av| 亚洲无码精彩视频在线观看| 2022国产无码在线| 国产一级α片| 欧美人与牲动交a欧美精品| 99伊人精品| 精品国产电影久久九九| 色欲色欲久久综合网| 国产欧美日韩在线一区| 亚洲男女在线| 欧美日韩午夜| 91成人在线观看| 中文国产成人精品久久| 麻豆AV网站免费进入| 麻豆国产精品视频| 欧洲在线免费视频| 国产视频你懂得| 亚洲国产中文精品va在线播放| 伊人福利视频| 国产凹凸一区在线观看视频| 国产又大又粗又猛又爽的视频| 玩两个丰满老熟女久久网| 人人看人人鲁狠狠高清| 无码日韩精品91超碰| 亚洲精品色AV无码看| 国产乱人伦AV在线A| 91外围女在线观看| 亚洲国产日韩一区| 国产高清在线丝袜精品一区| 午夜国产不卡在线观看视频| 国产乱肥老妇精品视频| 亚洲欧美不卡视频| 第九色区aⅴ天堂久久香| 国产无码在线调教| 亚洲手机在线| 午夜福利在线观看成人| 亚洲三级影院| 国产三区二区| 国产综合另类小说色区色噜噜| 午夜三级在线| 亚洲欧美在线综合一区二区三区| 一边摸一边做爽的视频17国产| 久久一级电影| 九九视频在线免费观看| 日本中文字幕久久网站| 亚洲AV无码久久精品色欲| 亚洲欧洲日产国产无码AV| 又粗又大又爽又紧免费视频| 国产精品手机视频一区二区| 亚洲精品久综合蜜|