999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Virtuoso 的疾病知識(shí)RDF 描述與倉儲(chǔ)研究

2022-07-21 03:40:18李若宇
無線互聯(lián)科技 2022年9期
關(guān)鍵詞:數(shù)據(jù)庫方法

李若宇,陳 磊

(淮南師范學(xué)院 計(jì)算機(jī)學(xué)院,安徽 淮南 232001)

0 引言

隨著2020 年暴發(fā)的新冠肺炎疫情席卷全球,各種疾病知識(shí)已經(jīng)成為最有價(jià)值的信息之一,建立高質(zhì)量的疾病知識(shí)庫,有助于推進(jìn)醫(yī)學(xué)現(xiàn)代化,推進(jìn)全民醫(yī)學(xué)知識(shí)科普。 現(xiàn)階段傳統(tǒng)主流數(shù)據(jù)庫以關(guān)系型數(shù)據(jù)庫為主,在存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)時(shí)具有成熟的技術(shù)和良好的性能,但疾病知識(shí)擁有著明顯的樹狀結(jié)構(gòu)和拓?fù)浣Y(jié)構(gòu)特征,傳統(tǒng)關(guān)系型數(shù)據(jù)庫難以做到高效的存儲(chǔ)。

資源描述框架(Resource Description Framework,RDF)是Web3.0 時(shí)代語義網(wǎng)技術(shù)中的一個(gè)概念,表達(dá)為一種基于圖的數(shù)據(jù)類型,常作為知識(shí)圖譜的存儲(chǔ)介質(zhì)。 選用RDF 進(jìn)行疾病知識(shí)描述和倉儲(chǔ)具有查詢效率高、擴(kuò)展性強(qiáng)、對(duì)非結(jié)構(gòu)化非關(guān)系型數(shù)據(jù)兼容性較好等特點(diǎn)。 國內(nèi)外基于RDF 技術(shù)開發(fā)的知識(shí)庫有清華大學(xué)的Xlore、復(fù)旦大學(xué)的CN-Dbpedia、谷歌的Freebase 和維基的DBPedia。 Openlink 公司的Virtuoso 數(shù)據(jù)庫能夠?qū)崿F(xiàn)RDF 數(shù)據(jù)的倉儲(chǔ),并使用SPARQL 語句進(jìn)行數(shù)據(jù)的檢索和操作[1-2]。

1 知識(shí)描述

1.1 知識(shí)建模

作為語義網(wǎng)中的核心技術(shù),使用RDF 構(gòu)建知識(shí)工程時(shí),知識(shí)本體被當(dāng)作資源表示為URI,不同資源間的聯(lián)系以主謂賓的形式進(jìn)行描述,形成知識(shí)圖譜。 構(gòu)成RDF 的數(shù)據(jù)類型包括:(1)URI。 用于標(biāo)記資源,以網(wǎng)址的形式。 如在疾病知識(shí)中,知識(shí)本體“高血壓”被標(biāo)記為資源:。 (2)字面量。 表示具體值。 如字符串值: "腦動(dòng)脈粥樣硬化"。上述類型數(shù)據(jù)類型可構(gòu)成主謂賓三元組的RDF 原生數(shù)據(jù)形式[3-4]。 RDF 原生數(shù)據(jù)形式如表1 所示。

表1 RDF 原生數(shù)據(jù)形式

疾病知識(shí)具有明顯的醫(yī)學(xué)知識(shí)特征,有較規(guī)則的知識(shí)結(jié)構(gòu),例如大多數(shù)疾病都包含中英文名稱、就診科室、多發(fā)群體、病癥分類、常見癥狀、診斷方法、治療方法等共同屬性,因此根據(jù)屬性關(guān)系可以對(duì)疾病知識(shí)進(jìn)行有效組織。 對(duì)疾病知識(shí)進(jìn)行建模的步驟包括:(1)收集知識(shí)文檔。 可以從網(wǎng)絡(luò)百科、電子書籍等相對(duì)準(zhǔn)確的資料上收集資料,注意可以采用爬蟲的方式,但是需要對(duì)知識(shí)的準(zhǔn)確性進(jìn)行人工驗(yàn)核。 (2)抽取主要屬性。根據(jù)對(duì)大多數(shù)疾病知識(shí)的研究,歸納通用疾病屬性,建立數(shù)據(jù)字典。

在圖1 中,唯一編號(hào)的ds125 表示知識(shí)本體“冠心病”,ds125 下包含有一級(jí)屬性中文名、英文名、多發(fā)人群、就診科室、癥狀、治療方法、檢查方法。 值得注意的是,雖然RDF 數(shù)據(jù)模型中的屬性名類似于關(guān)系模型中的字段名,但這里的屬性名可自由搭配屬性值,如屬性“檢查方法”可以連接一個(gè)值,也可以連接若干個(gè)值。

圖1 知識(shí)本體“冠心病”的RDF 數(shù)據(jù)模型

1.2 RDF 數(shù)據(jù)描述

完成知識(shí)內(nèi)容建模以后,需要將知識(shí)內(nèi)容轉(zhuǎn)化為RDF 描述,轉(zhuǎn)化工作包括拼接前綴、格式化等工作,產(chǎn)出的結(jié)果應(yīng)該是規(guī)范的RDF 三元組文檔。

值得注意的是,賓語除了字面量以外,還可能是資源類型。 如“檢查方法”對(duì)應(yīng)的屬性值這里表示為資源而非字串字面量,一方面,因?yàn)榫唧w“檢查方法”更趨向于是一個(gè)術(shù)語,符合被定義成為RDF 中的資源;另一方面,一種“檢查方法”可能被多種疾病共享,如“心電圖”可以是多種疾病的“檢查方法”,這時(shí)與將“心電圖”作為“檢查方法”的疾病資源便建立了聯(lián)系。 如圖2 所示,讓數(shù)據(jù)實(shí)體之間(ds125 和ds126)建立豐富的聯(lián)系,體現(xiàn)關(guān)聯(lián)數(shù)據(jù)語義網(wǎng)的核心理念。

圖2 通過同一種檢查方法連接起來的兩個(gè)疾病實(shí)體

2 Virtuoso 數(shù)據(jù)倉儲(chǔ)

2.1 Virtuoso 數(shù)據(jù)庫簡介

RDF 數(shù)據(jù)具有明顯的“圖”結(jié)構(gòu),需要使用圖數(shù)據(jù)庫進(jìn)行組織和存儲(chǔ),單純的關(guān)系型數(shù)據(jù)庫并不便于存儲(chǔ)RDF 數(shù)據(jù)。 Openlink Virtuoso 數(shù)據(jù)庫支持以圖的形式存儲(chǔ)RDF 數(shù)據(jù),支持使用SPARQL 語句對(duì)RDF 數(shù)據(jù)進(jìn)行DML 和DQL 操作,兼容主流操作系統(tǒng),支持JDBC,ODBC,HTTP API 等主流數(shù)據(jù)訪問接口和多種編程語言,在海量數(shù)據(jù)存儲(chǔ)和處理方面有著不錯(cuò)的表現(xiàn),同時(shí)還支持將關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 數(shù)據(jù)的技術(shù)(RDB2RDF)。 除了Openlink Virtuoso 以外,MarkLogic,Jena,GraphDB 等數(shù)據(jù)庫在RDF 數(shù)據(jù)倉儲(chǔ)方面都有著優(yōu)秀特性[5]。

2.2 知識(shí)倉儲(chǔ)

知識(shí)倉儲(chǔ)在這里主要指將組織好的RDF 數(shù)據(jù)存儲(chǔ)至數(shù)據(jù)庫,在將RDF 數(shù)據(jù)導(dǎo)入Virtuoso 數(shù)據(jù)庫時(shí),常常采用SPARQL-Update 語句的方式進(jìn)行。

(1)在Virtuoso 數(shù)據(jù)庫的namespace 定義命名空間和對(duì)應(yīng)的前綴,有助于減小輸入冗余。

@prefix knt:

@prefix kna:

此時(shí)知識(shí)本體可被表示為knt:ds125,屬性可以被表示為kna:屬性。

(2)SPARQL 語句支持RDF 縮寫形式,下面是相同主語和相同主謂兩種情況下的縮寫示例。 INSERT 語句同SQL 中,表示將數(shù)據(jù)插入數(shù)據(jù)庫,表示存儲(chǔ)數(shù)據(jù)的圖,這里的圖名可以理解成關(guān)系數(shù)據(jù)庫的庫名。

如圖3 所示,將寫好的SPARQL 語句插入Database>Interactive SQL 頁面中的輸入框,即可完成SPARQLUpdate 語句執(zhí)行,RDF 數(shù)據(jù)插入成功以后,數(shù)據(jù)庫系統(tǒng)會(huì)返回被更改的條目數(shù)量。

2.3 內(nèi)容檢索

RDF 數(shù)據(jù)的查詢是通過SPARQL-Query 語句執(zhí)行的,可以對(duì)已經(jīng)構(gòu)建好的疾病知識(shí)內(nèi)容進(jìn)行檢索。 進(jìn)入Virtuoso 數(shù)據(jù)庫,先后進(jìn)入Linked Data 標(biāo)簽和SPARQL 標(biāo)簽,即可執(zhí)行正確的SPARQL 語句。 如圖3所示的SPARQL 語句在單機(jī)Execute 按鈕后,可檢索按照上述規(guī)則構(gòu)建的“冠心病”的相關(guān)知識(shí)[6]。

圖3 對(duì)“冠心病”的知識(shí)進(jìn)行搜索

繼續(xù)使用SPARQL 語句:SELECT ? s ? o FROM WHERE{? s? o.},可查詢出庫中所有的疾病名稱,結(jié)果如圖4 所示。

圖4 對(duì)庫中所有疾病名稱進(jìn)行搜索

例如通過SPARQL 語句:SELECT COUNT(? s)FROM WHERE{? s ? o.},COUNT 關(guān)鍵詞可統(tǒng)計(jì)出收錄的所有的疾病條目數(shù)[7-10]。

3 結(jié)語

文中以疾病知識(shí)的描述和倉儲(chǔ)為研究對(duì)象,介紹了RDF 技術(shù)原理,針對(duì)疾病知識(shí)特點(diǎn)進(jìn)行分析和建模形成RDF 圖,隨后進(jìn)行RDF 描述形成有效的RDF 文檔,在Windows 平臺(tái)對(duì)Virtuoso 數(shù)據(jù)庫進(jìn)行部署,使用SPARQL 語言實(shí)現(xiàn)RDF 數(shù)據(jù)的導(dǎo)入和檢索,并簡要介紹了一些RDF 數(shù)據(jù)庫管理操作,如圖管理、命名空間管理等。 未來還可以使用Virtuoso 數(shù)據(jù)庫的編程接口,實(shí)現(xiàn)疾病知識(shí)應(yīng)用的設(shè)計(jì)與開發(fā)。

猜你喜歡
數(shù)據(jù)庫方法
學(xué)習(xí)方法
數(shù)據(jù)庫
數(shù)據(jù)庫
可能是方法不對(duì)
數(shù)據(jù)庫
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
數(shù)據(jù)庫
數(shù)據(jù)庫
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 婷婷六月激情综合一区| 国产簧片免费在线播放| 精品国产免费人成在线观看| 亚洲精品视频免费看| 亚洲一级无毛片无码在线免费视频| 毛片免费网址| 亚洲精品不卡午夜精品| 91精品久久久久久无码人妻| 久久久久人妻一区精品色奶水 | 国产原创演绎剧情有字幕的| 日本精品αv中文字幕| 2020最新国产精品视频| 成人一级免费视频| 重口调教一区二区视频| 国产系列在线| 国产国语一级毛片在线视频| 亚洲视频二| 国产精品女熟高潮视频| 色偷偷av男人的天堂不卡| www.国产福利| 在线观看国产小视频| 激情成人综合网| 中文字幕无线码一区| 成人免费一级片| 伊人久久大香线蕉影院| 国产在线精品人成导航| 亚洲日韩精品无码专区97| 久久特级毛片| 婷婷色一区二区三区| 91久久偷偷做嫩草影院免费看| 国产91在线|日本| 99热在线只有精品| 亚洲va视频| 国产精品嫩草影院av| www.youjizz.com久久| 午夜不卡视频| 亚洲经典在线中文字幕| 天天摸夜夜操| 玖玖精品在线| 午夜欧美理论2019理论| 国产熟女一级毛片| 丁香亚洲综合五月天婷婷| 国产精品第一区| 日本免费新一区视频| 国产香蕉97碰碰视频VA碰碰看| 在线观看国产网址你懂的| 国产91精品久久| 国产麻豆精品久久一二三| 久久综合干| 国产最爽的乱婬视频国语对白| 欧美亚洲国产精品久久蜜芽| 日韩小视频在线播放| 91www在线观看| 久久国产毛片| 色网在线视频| 日本不卡视频在线| 亚洲水蜜桃久久综合网站| 欧美色图久久| 婷五月综合| 国产综合另类小说色区色噜噜 | 无码中文字幕乱码免费2| 国产乱人伦精品一区二区| 在线观看国产精品第一区免费 | 美女无遮挡免费视频网站| 狠狠做深爱婷婷综合一区| 黄色a一级视频| 亚洲综合经典在线一区二区| 人人91人人澡人人妻人人爽| 久久a级片| 日韩免费毛片| 午夜毛片免费观看视频 | 亚洲swag精品自拍一区| 国产精品露脸视频| 2020精品极品国产色在线观看 | 伊人久久大香线蕉综合影视| 欧美福利在线| 国产久操视频| 国产幂在线无码精品| 久久96热在精品国产高清| 又猛又黄又爽无遮挡的视频网站| 久久青草精品一区二区三区| 久久96热在精品国产高清|