999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Virtuoso 的疾病知識(shí)RDF 描述與倉儲(chǔ)研究

2022-07-21 03:40:18李若宇
無線互聯(lián)科技 2022年9期
關(guān)鍵詞:數(shù)據(jù)庫方法

李若宇,陳 磊

(淮南師范學(xué)院 計(jì)算機(jī)學(xué)院,安徽 淮南 232001)

0 引言

隨著2020 年暴發(fā)的新冠肺炎疫情席卷全球,各種疾病知識(shí)已經(jīng)成為最有價(jià)值的信息之一,建立高質(zhì)量的疾病知識(shí)庫,有助于推進(jìn)醫(yī)學(xué)現(xiàn)代化,推進(jìn)全民醫(yī)學(xué)知識(shí)科普。 現(xiàn)階段傳統(tǒng)主流數(shù)據(jù)庫以關(guān)系型數(shù)據(jù)庫為主,在存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)時(shí)具有成熟的技術(shù)和良好的性能,但疾病知識(shí)擁有著明顯的樹狀結(jié)構(gòu)和拓?fù)浣Y(jié)構(gòu)特征,傳統(tǒng)關(guān)系型數(shù)據(jù)庫難以做到高效的存儲(chǔ)。

資源描述框架(Resource Description Framework,RDF)是Web3.0 時(shí)代語義網(wǎng)技術(shù)中的一個(gè)概念,表達(dá)為一種基于圖的數(shù)據(jù)類型,常作為知識(shí)圖譜的存儲(chǔ)介質(zhì)。 選用RDF 進(jìn)行疾病知識(shí)描述和倉儲(chǔ)具有查詢效率高、擴(kuò)展性強(qiáng)、對(duì)非結(jié)構(gòu)化非關(guān)系型數(shù)據(jù)兼容性較好等特點(diǎn)。 國內(nèi)外基于RDF 技術(shù)開發(fā)的知識(shí)庫有清華大學(xué)的Xlore、復(fù)旦大學(xué)的CN-Dbpedia、谷歌的Freebase 和維基的DBPedia。 Openlink 公司的Virtuoso 數(shù)據(jù)庫能夠?qū)崿F(xiàn)RDF 數(shù)據(jù)的倉儲(chǔ),并使用SPARQL 語句進(jìn)行數(shù)據(jù)的檢索和操作[1-2]。

1 知識(shí)描述

1.1 知識(shí)建模

作為語義網(wǎng)中的核心技術(shù),使用RDF 構(gòu)建知識(shí)工程時(shí),知識(shí)本體被當(dāng)作資源表示為URI,不同資源間的聯(lián)系以主謂賓的形式進(jìn)行描述,形成知識(shí)圖譜。 構(gòu)成RDF 的數(shù)據(jù)類型包括:(1)URI。 用于標(biāo)記資源,以網(wǎng)址的形式。 如在疾病知識(shí)中,知識(shí)本體“高血壓”被標(biāo)記為資源:。 (2)字面量。 表示具體值。 如字符串值: "腦動(dòng)脈粥樣硬化"。上述類型數(shù)據(jù)類型可構(gòu)成主謂賓三元組的RDF 原生數(shù)據(jù)形式[3-4]。 RDF 原生數(shù)據(jù)形式如表1 所示。

表1 RDF 原生數(shù)據(jù)形式

疾病知識(shí)具有明顯的醫(yī)學(xué)知識(shí)特征,有較規(guī)則的知識(shí)結(jié)構(gòu),例如大多數(shù)疾病都包含中英文名稱、就診科室、多發(fā)群體、病癥分類、常見癥狀、診斷方法、治療方法等共同屬性,因此根據(jù)屬性關(guān)系可以對(duì)疾病知識(shí)進(jìn)行有效組織。 對(duì)疾病知識(shí)進(jìn)行建模的步驟包括:(1)收集知識(shí)文檔。 可以從網(wǎng)絡(luò)百科、電子書籍等相對(duì)準(zhǔn)確的資料上收集資料,注意可以采用爬蟲的方式,但是需要對(duì)知識(shí)的準(zhǔn)確性進(jìn)行人工驗(yàn)核。 (2)抽取主要屬性。根據(jù)對(duì)大多數(shù)疾病知識(shí)的研究,歸納通用疾病屬性,建立數(shù)據(jù)字典。

在圖1 中,唯一編號(hào)的ds125 表示知識(shí)本體“冠心病”,ds125 下包含有一級(jí)屬性中文名、英文名、多發(fā)人群、就診科室、癥狀、治療方法、檢查方法。 值得注意的是,雖然RDF 數(shù)據(jù)模型中的屬性名類似于關(guān)系模型中的字段名,但這里的屬性名可自由搭配屬性值,如屬性“檢查方法”可以連接一個(gè)值,也可以連接若干個(gè)值。

圖1 知識(shí)本體“冠心病”的RDF 數(shù)據(jù)模型

1.2 RDF 數(shù)據(jù)描述

完成知識(shí)內(nèi)容建模以后,需要將知識(shí)內(nèi)容轉(zhuǎn)化為RDF 描述,轉(zhuǎn)化工作包括拼接前綴、格式化等工作,產(chǎn)出的結(jié)果應(yīng)該是規(guī)范的RDF 三元組文檔。

值得注意的是,賓語除了字面量以外,還可能是資源類型。 如“檢查方法”對(duì)應(yīng)的屬性值這里表示為資源而非字串字面量,一方面,因?yàn)榫唧w“檢查方法”更趨向于是一個(gè)術(shù)語,符合被定義成為RDF 中的資源;另一方面,一種“檢查方法”可能被多種疾病共享,如“心電圖”可以是多種疾病的“檢查方法”,這時(shí)與將“心電圖”作為“檢查方法”的疾病資源便建立了聯(lián)系。 如圖2 所示,讓數(shù)據(jù)實(shí)體之間(ds125 和ds126)建立豐富的聯(lián)系,體現(xiàn)關(guān)聯(lián)數(shù)據(jù)語義網(wǎng)的核心理念。

圖2 通過同一種檢查方法連接起來的兩個(gè)疾病實(shí)體

2 Virtuoso 數(shù)據(jù)倉儲(chǔ)

2.1 Virtuoso 數(shù)據(jù)庫簡介

RDF 數(shù)據(jù)具有明顯的“圖”結(jié)構(gòu),需要使用圖數(shù)據(jù)庫進(jìn)行組織和存儲(chǔ),單純的關(guān)系型數(shù)據(jù)庫并不便于存儲(chǔ)RDF 數(shù)據(jù)。 Openlink Virtuoso 數(shù)據(jù)庫支持以圖的形式存儲(chǔ)RDF 數(shù)據(jù),支持使用SPARQL 語句對(duì)RDF 數(shù)據(jù)進(jìn)行DML 和DQL 操作,兼容主流操作系統(tǒng),支持JDBC,ODBC,HTTP API 等主流數(shù)據(jù)訪問接口和多種編程語言,在海量數(shù)據(jù)存儲(chǔ)和處理方面有著不錯(cuò)的表現(xiàn),同時(shí)還支持將關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 數(shù)據(jù)的技術(shù)(RDB2RDF)。 除了Openlink Virtuoso 以外,MarkLogic,Jena,GraphDB 等數(shù)據(jù)庫在RDF 數(shù)據(jù)倉儲(chǔ)方面都有著優(yōu)秀特性[5]。

2.2 知識(shí)倉儲(chǔ)

知識(shí)倉儲(chǔ)在這里主要指將組織好的RDF 數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫,在將RDF 數(shù)據(jù)導(dǎo)入Virtuoso 數(shù)據(jù)庫時(shí),常常采用SPARQL-Update 語句的方式進(jìn)行。

(1)在Virtuoso 數(shù)據(jù)庫的namespace 定義命名空間和對(duì)應(yīng)的前綴,有助于減小輸入冗余。

@prefix knt:

@prefix kna:

此時(shí)知識(shí)本體可被表示為knt:ds125,屬性可以被表示為kna:屬性。

(2)SPARQL 語句支持RDF 縮寫形式,下面是相同主語和相同主謂兩種情況下的縮寫示例。 INSERT 語句同SQL 中,表示將數(shù)據(jù)插入數(shù)據(jù)庫,表示存儲(chǔ)數(shù)據(jù)的圖,這里的圖名可以理解成關(guān)系數(shù)據(jù)庫的庫名。

如圖3 所示,將寫好的SPARQL 語句插入Database>Interactive SQL 頁面中的輸入框,即可完成SPARQLUpdate 語句執(zhí)行,RDF 數(shù)據(jù)插入成功以后,數(shù)據(jù)庫系統(tǒng)會(huì)返回被更改的條目數(shù)量。

2.3 內(nèi)容檢索

RDF 數(shù)據(jù)的查詢是通過SPARQL-Query 語句執(zhí)行的,可以對(duì)已經(jīng)構(gòu)建好的疾病知識(shí)內(nèi)容進(jìn)行檢索。 進(jìn)入Virtuoso 數(shù)據(jù)庫,先后進(jìn)入Linked Data 標(biāo)簽和SPARQL 標(biāo)簽,即可執(zhí)行正確的SPARQL 語句。 如圖3所示的SPARQL 語句在單機(jī)Execute 按鈕后,可檢索按照上述規(guī)則構(gòu)建的“冠心病”的相關(guān)知識(shí)[6]。

圖3 對(duì)“冠心病”的知識(shí)進(jìn)行搜索

繼續(xù)使用SPARQL 語句:SELECT ? s ? o FROM WHERE{? s? o.},可查詢出庫中所有的疾病名稱,結(jié)果如圖4 所示。

圖4 對(duì)庫中所有疾病名稱進(jìn)行搜索

例如通過SPARQL 語句:SELECT COUNT(? s)FROM WHERE{? s ? o.},COUNT 關(guān)鍵詞可統(tǒng)計(jì)出收錄的所有的疾病條目數(shù)[7-10]。

3 結(jié)語

文中以疾病知識(shí)的描述和倉儲(chǔ)為研究對(duì)象,介紹了RDF 技術(shù)原理,針對(duì)疾病知識(shí)特點(diǎn)進(jìn)行分析和建模形成RDF 圖,隨后進(jìn)行RDF 描述形成有效的RDF 文檔,在Windows 平臺(tái)對(duì)Virtuoso 數(shù)據(jù)庫進(jìn)行部署,使用SPARQL 語言實(shí)現(xiàn)RDF 數(shù)據(jù)的導(dǎo)入和檢索,并簡要介紹了一些RDF 數(shù)據(jù)庫管理操作,如圖管理、命名空間管理等。 未來還可以使用Virtuoso 數(shù)據(jù)庫的編程接口,實(shí)現(xiàn)疾病知識(shí)應(yīng)用的設(shè)計(jì)與開發(fā)。

猜你喜歡
數(shù)據(jù)庫方法
學(xué)習(xí)方法
數(shù)據(jù)庫
數(shù)據(jù)庫
可能是方法不對(duì)
數(shù)據(jù)庫
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
數(shù)據(jù)庫
數(shù)據(jù)庫
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲日韩AV无码一区二区三区人| 一级毛片视频免费| 午夜视频免费试看| 亚卅精品无码久久毛片乌克兰 | 午夜啪啪网| 国产精品制服| 欧洲熟妇精品视频| 国产午夜无码片在线观看网站 | 欧洲成人在线观看| 国产在线八区| 国产成人禁片在线观看| 手机在线免费不卡一区二| 国国产a国产片免费麻豆| 欧美成人在线免费| 精品国产香蕉伊思人在线| 无码区日韩专区免费系列 | 亚洲成人一区二区| 国产剧情无码视频在线观看| 色欲不卡无码一区二区| 强奷白丝美女在线观看| 高清乱码精品福利在线视频| 亚洲欧美日韩另类| 一级爱做片免费观看久久| 国产性生交xxxxx免费| 麻豆精品在线视频| 国产在线自揄拍揄视频网站| 国产手机在线观看| 亚洲免费成人网| 国产精品成人久久| 久久综合AV免费观看| 这里只有精品在线| 国产一级视频久久| 亚洲高清日韩heyzo| 中文字幕1区2区| 国产在线观看第二页| 成人在线天堂| 91年精品国产福利线观看久久 | 久久久91人妻无码精品蜜桃HD | 精品视频一区二区三区在线播| 国产一区二区精品福利| 久久频这里精品99香蕉久网址| 91小视频在线观看免费版高清| 国产午夜不卡| 久久婷婷五月综合色一区二区| 毛片久久久| 中文字幕无码中文字幕有码在线| 成人福利免费在线观看| 欧美 国产 人人视频| 久久久亚洲国产美女国产盗摄| 久久亚洲天堂| 亚洲黄色片免费看| 在线无码av一区二区三区| 精品一区二区三区无码视频无码| 91极品美女高潮叫床在线观看| 又大又硬又爽免费视频| 91久久天天躁狠狠躁夜夜| 99久久国产综合精品2020| 91久久偷偷做嫩草影院精品| 美女被操91视频| 国产精品久久久久婷婷五月| 亚洲成a人片在线观看88| 玩两个丰满老熟女久久网| 国产丝袜啪啪| 天堂岛国av无码免费无禁网站| 久久久噜噜噜| 亚洲第一黄色网址| 国产精品 欧美激情 在线播放| 国产亚洲精品在天天在线麻豆 | 波多野结衣一区二区三视频| 无码aⅴ精品一区二区三区| 亚洲成人在线免费| 亚洲人成色在线观看| 精品国产中文一级毛片在线看| 69av免费视频| 成人亚洲国产| 欧美成人综合在线| 亚洲中文无码av永久伊人| 老熟妇喷水一区二区三区| www.精品视频| 中国特黄美女一级视频| 久久久久无码精品国产免费| 亚洲日韩精品伊甸|