999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R2RML的醫(yī)學主題詞表RDF轉換實現*

2019-06-19 06:52:20吳思竹修曉蕾李艷梅
醫(yī)學信息學雜志 2019年5期
關鍵詞:語義

吳思竹 修曉蕾 李艷梅 錢 慶

(中國醫(yī)學科學院醫(yī)學信息研究所 北京 100020)

1 引言

2001年Bernerslee T 等人首次提出語義網概念[1]。隨著語義網的興起,關聯數據得到越來越多的發(fā)展[2],圖書館界已意識到關聯數據和語義網絡是公開集合數據更好的手段,而源描述框架(Resource Description Framework,RDF) 是更適合于語義網的數據模型。為將關系數據庫中的數據融入到語義網中需要將其轉換成RDF,這一轉換過程被稱為RDB2RDF。

作為國際上最具代表性、使用最廣泛的受控醫(yī)學綜合性敘詞表——醫(yī)學主題詞表(Medical Subject Headings,MeSH)[3],一些機構嘗試從不同出發(fā)點、利用不同轉換技術和語義模型進行MeSH的RDF轉換。2004年Van Assem等人利用簡單知識組織系統(tǒng)(Simple,SKOS)的RDF模型,首次將MeSH轉換成RDF[4],2006年科學共享研究人員對Van Assem轉換模型進行稍微修改,實現MeSH主題詞-副主題詞的組配[5],2006年Bio2RDF項目采用Web語義技術對MeSH轉換[6-7]及BioPortal對其進行嘗試。這些機構的嘗試僅涵蓋MeSH功能的一部分,缺少原始資源中一些細節(jié),如主題詞-副主題詞的組配、上下位關系等。2009年美國國立醫(yī)學圖書館(National Library of Medicine,NLM)的醫(yī)學本體研究組織(Medical Ontology Research,MOR),利用擴展樣式表轉換語言(Extensible Stylesheet Language Transformations,XSLT)將MeSH的可擴展標記語言(Extensible Markup Language,XML)表示形式轉換成RDF且對其定期維護更新至今[8]。該版本保留MeSH的 3級概念結構,實現上下位關系,具有一定的權威性和借鑒性。但MeSH結構太復雜,限制在XML版本中明確呈現MeSH特征的RDF表示方式不能很好地表達一些重要特征(包括主題詞之間的層級關系),也不能實現主題詞-副主題詞組配。

2 R2RML映射語言

2003年W3C發(fā)布了調查報告"Mapping Semantic Web Data with RDBMSes"[9],其中分析進行RDB2RDF需要解決的主要問題及現有解決方案和相關工具,指出RDB2RDF的關鍵是定義一種映射語言。2012年W3C推 薦 Direct Mapping和R2RML兩種映射語言。Direct Mapping為直接映射,將關系數據庫表結構和數據直接輸出為RDF圖,RDF圖中用于表示類和謂詞的術語與關系數據庫中的表名和字段名保持一致,完全是關系數據庫數據結構的反映,且不可更改[10];而R2RML則有高度的可定制性。R2RML映射是指從關系庫中檢索數據的邏輯表(LogicalTable),如基本表、視圖或有效結構化查詢語言(Structured Query Language,SQL)查詢,然后使用三元組映射(TriplesMap)將每個邏輯表映射為RDF[11]。三元組映射是指主語映射(SubjectMap)、謂語映射(PredicateMap)和賓語映射(RefObjectMap) 或引用客體映射(RefObjectMap)。R2RML邏輯框架,見圖1。

圖1 R2RML邏輯框架[5]

3 醫(yī)學主題詞表(MeSH)

3.1 結構

MeSH具有一套完整的數據體系結構,包括主題詞表、副主題詞表、增補概念詞表、樹形結構表等部分,采用3級概念結構模式進行組織,第1層由主題詞、副主題詞和補充概念記錄(SCR)組成,第2層由念的同義術語組成,第3層由術語組成。3級結構可以將MeSH的語義關系明確清晰地標識出來,描述信息也從原來的主題詞級別細分到主題詞、概念、術語級別。這種結構有利于計算機理解和處理,支持從多個維度組織和查詢生物醫(yī)學信息資源,有助于整體提升MeSH的易用性及性能。

3.2 解析

從NLH官網下載XML格式的MeSH詞表(2017版),通過解析MeSH的XML獲得主題詞表、副主題詞表、補充概念記錄表、概念表等多個詞表,導入數據庫中。為減少數據庫冗余度和RDB2RDF的時間消耗及避免空白節(jié)點,對MeSH數據庫的原始表格重新進行數據建模和適當的拆分合并,最終共建立21個表格。統(tǒng)計解析后的MeSH詞表,共有主題詞28 472個,副主題詞80個,主題詞術語115 845個,與官網數據相一致[12]。MeSH各個詞表數據關系,見圖2。其中descriptor1表存儲的是descriptor基本屬性中一對一的屬性,descriptor2表中存儲的是descriptor基本屬性中一對多或多對多的屬性;同理表concept1、concept2、scrs1和scrs2。這樣有利于減少節(jié)點冗余度和時間消耗。

圖2 MeSH各詞表數據關系

4 R2RML映射文檔

4.1 步驟

本實驗在將MeSH從RDB格式轉換RDF的過程中,借鑒NLM在利用XSLT將MeSH的XML表示形式轉換成RDF過程中對MeSH類和謂語的規(guī)定,通過R2RML映射規(guī)則將其轉換成RDF。根據MeSH體系結構規(guī)定16個類,各類之間的關系,見圖3。

圖3 MeSH各類之間的關系

根據MeSH的XML表示形式解析情況規(guī)定abbreviation、allowableQualifier、altLabel、annotation、broaderConcept、broaderDescriptor 等47個謂語。相較于NLM對MeSH謂語的規(guī)定,本實驗少了兩個謂語meshv:active和meshv:lastActiveYear。因查找MeSH的XML格式及XSD格式均未查到這兩個屬性。根據MeSH各詞表在關系數據庫中的存儲情況及上述規(guī)定的各個類和謂語,分別定義R2RML映射文檔,將存儲在關系數據庫表中的數據轉換為RDF數據。書寫映射文檔,首先需定義R2RML的命名空間rr以及MeSH醫(yī)學主題詞表數據描述使用的命名空間ex及RDF語法模式的命名空間rdf、rdfs等。在映射文檔中需要定義一系列RDF術語,如語言標簽rr:language、數據類型rr:datatype等。根據R2RML映射模式將數據庫中MeSH詞表的所有映射文檔分為4類。

4.2 一表對一表映射

即主題詞表、副主題詞表、補充概念記錄詞表、概念表等的基本屬性表,其無需與其他表進行關聯,現以term基本屬性表為例。模式1:為表創(chuàng)建三元組映射,指定表名對應rr:logicalTable的值。在TriplesMap中使用rr:template創(chuàng)建rr:subjectMap來定義每一行的URI template,具有映射文檔如下:

這是一個表映射的直接映射。對于表的本體類,用戶可以在主語映射rr:subjectMap中利用rr:class為映射表設置相應本體類(如),用戶也可以在謂語對象映射(rr:predicateObjectMap)中選擇指定表的特定本體類,如descriptor基本屬性表的映射:

4.3 一屬性對一屬性的映射

各MeSH詞表中無需與其他列進行關聯的各列的映射,如DateCreated、DateEstablished、DateRevised、HistoryNote等,現以treenumber表為例。模式2:給定一個TriplesMap,為該屬性創(chuàng)建rr:predicateObjectMap,對于本體屬性和rr:objectMap屬性只有一個rr:predicate,具有映射文檔如下:

這是屬性映射的一個直接映射,可為各個屬性自動生成一個唯一的本體屬性。

4.4 兩表之間含外鍵映射

MeSH中含外鍵的兩表之間的映射,如主題詞表、副主題表與概念表、術語表等之間的映射,主題詞表、副主題表均含有外鍵PreferredConcept、PreferredTerm,現以concept表與term表之間的映射為例。模式3:給定兩張表,一張表視為子類,另一張表則是父類。為每個表創(chuàng)建一個TriplesMap。給子類TripleMap創(chuàng)建一個rr:predicateObjectMap,除rr:predicate外還有一個rr:objectMap,其具有一個rr:parentTripleMap和一個rr:joinCondition。rr:parentTripleMap將指向父類TripleMap,rr:joinCondition將有一個rr:child和rr:parent,分別表示子表和父表中的連接屬性。具有映射文檔如下:

4.5 含外鍵的多表之間映射

模式4: 創(chuàng)建一個具有R2RML視圖的TriplesMap,該視圖由rr:logicalTable組成,rr:logicalTable包含一個rr:sqlQuery,其包含一個表示連接的SQL查詢,其R2RML映射模式如下:

如果是兩個表之間的映射可以使用模式4,但多個表之間的映射則必須使用模式4的SQL查詢。模式4與模式3不同的是:模式3用戶需要添加額外的三元組實例來映射連接兩表的屬性;而模式4用戶是通過修改SQL查詢來增加連接屬性。

4.6 鏈接多個表之間的映射

模式5:為多對多表創(chuàng)建TriplesMap。指定rr:logicalTable,其值對應于多對多表的表名。在TriplesMap中使用rr:template創(chuàng)建一個rr:subjectMap,以定義多對多關系中一個表的URI template。創(chuàng)建一個rr:predicateObjectMap實例,其具有本體屬性的rr:predicate。最后使用rr:template創(chuàng)建一個rr:objectMap來定義多對多關系的另一個表的URI template,具體如下:

5 系統(tǒng)實現

在進行數據轉換的過程中通過調研和比較選擇的編程語言是Java,數據庫服務器使用MySQL,轉換工具選擇第3方工具DB2Triples。DB2Triples[13]是由Antidot公司開發(fā)的用于從關系型數據庫中抽取數據并將其轉換為RDF三元組存儲的開源工具。其同時支持R2RML和Direct Mapping兩種映射語言標準。DB2Triples支持數據實體化的映射實現方式,但不提供數據查詢方式。實體化后的RDF圖可以RDF/XML、 N3、N-Triples或Turtle格式進行序列化。在Direct Mapping模式下可選擇使用來自SPARQL文件的查詢以轉換RDF圖。根據上述書寫好的R2RML映射規(guī)則,基于MySQL數據庫和Java編程語言,利用DB2Triples實現RDB2RDF的轉換。現以Descriptor表為例,簡單介紹其數據轉換過程:新建eclipse的工作區(qū)workplace和java project;將DB2Triples工具包導入eclipse。代碼如下:

將上述映射文檔descriptor1.ttl存儲在java project中;運行descriptor1.java代碼,輸出RDF文件descriptor1.n3。其RDF片段如下:

6 結語

本文基于R2RML映射語言,利用R2RML Tool工具實現醫(yī)學主題詞表的RDF轉換。無論關系數據庫表結構如何都可以進行映射轉換。關系數據庫相較于XML格式的數據存儲,其數據組織更加靈活。但正因如此原始的關系數據模型與RDF數據模型往往會存在不完全匹配的情況[13]。因此為達到更優(yōu)的映射效果,不僅需要構建好的映射規(guī)則,在應用R2RML映射規(guī)則進行RDB2RDF數據轉換之前不要受當前關系數據庫表結構的局限,根據所映射的RDF實體之間的關系適當對原有關系表進行拆分和合并,重新進行數據建模,做好關系數據庫的設計,構建好數據庫的主外鍵關聯關系,以通過R2RML標準映射規(guī)則的編寫達到相對合適的轉換要求,保證轉換效果。

R2RML提供一種將關系數據庫中數據結構映射為RDF數據模型的便捷方法,提高不同工具平臺之間的互操作性,有利于促進RDF數據以及關聯數據的產生和更廣泛的應用。R2RML映射規(guī)則還存在一定的不可移植性以及非健壯性[14],如當關系數據庫模式發(fā)生變化時R2RML映射文檔基本需要重新映射和修改。

猜你喜歡
語義
為什么字看久了就不認識了
語言與語義
“社會”一詞的語義流動與新陳代謝
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
“吃+NP”的語義生成機制研究
長江學術(2016年4期)2016-03-11 15:11:31
“V+了+NP1+NP2”中V的語義指向簡談
認知范疇模糊與語義模糊
“V+X+算+X”構式的語義功能及語義網絡——兼及與“V+X+是+X”構式的轉換
語言與翻譯(2014年2期)2014-07-12 15:49:25
“熊孩子”語義新探
語文知識(2014年2期)2014-02-28 21:59:18
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 91成人免费观看| 国产一区二区丝袜高跟鞋| 国产午夜小视频| 午夜视频日本| 国产二级毛片| 一区二区三区国产| 亚洲国产一成久久精品国产成人综合| 黄色成年视频| 国产后式a一视频| a级毛片在线免费| 久久午夜夜伦鲁鲁片无码免费 | 91视频国产高清| 亚洲va精品中文字幕| 91美女视频在线| 精品少妇人妻av无码久久| 国内丰满少妇猛烈精品播| 国产h视频在线观看视频| 日韩性网站| 激情综合五月网| 亚洲精品大秀视频| 曰韩免费无码AV一区二区| www.99在线观看| 99精品国产电影| 日韩欧美在线观看| 中文字幕欧美日韩高清| 超级碰免费视频91| 午夜在线不卡| 在线色国产| 全色黄大色大片免费久久老太| 国产本道久久一区二区三区| 黄色污网站在线观看| 亚洲精品无码成人片在线观看 | 99久久人妻精品免费二区| 欧美97欧美综合色伦图| www中文字幕在线观看| 欧美性天天| 国产精品黑色丝袜的老师| 欧美综合区自拍亚洲综合天堂| 理论片一区| 成人福利一区二区视频在线| 成人在线综合| 青青操国产| 一区二区影院| 老熟妇喷水一区二区三区| 亚洲天堂网2014| 亚洲 日韩 激情 无码 中出| 三级国产在线观看| 99热最新网址| 亚洲欧洲自拍拍偷午夜色| 丝袜国产一区| 人妻无码中文字幕第一区| 国产精品免费p区| 99在线观看国产| 亚洲国产精品一区二区高清无码久久 | 首页亚洲国产丝袜长腿综合| 丰满少妇αⅴ无码区| 欧美成人免费| 在线中文字幕日韩| 久草网视频在线| 日日噜噜夜夜狠狠视频| 日本人妻丰满熟妇区| a毛片在线免费观看| 亚洲精品麻豆| 国产精品手机在线播放| 91蝌蚪视频在线观看| 无码区日韩专区免费系列| 色九九视频| 亚洲精品无码专区在线观看| 国产精品刺激对白在线| 婷婷六月在线| 欧美精品成人一区二区视频一| 在线精品欧美日韩| 九色视频线上播放| 99视频全部免费| 国产激爽大片高清在线观看| 国产精品不卡永久免费| 久久成人国产精品免费软件| 这里只有精品在线播放| 小蝌蚪亚洲精品国产| 亚洲水蜜桃久久综合网站| 日韩高清欧美| 国产视频你懂得|