999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Neo4j 的《傷寒論》知識(shí)圖譜構(gòu)建研究?

2021-03-22 09:11:42王菁薇晏峻峰
關(guān)鍵詞:中醫(yī)藥數(shù)據(jù)庫

王菁薇 肖 莉 晏峻峰

(1.湖南中醫(yī)藥大學(xué)信息科學(xué)與工程學(xué)院 長沙 410208)(2.湖南中醫(yī)藥大學(xué)中醫(yī)學(xué)院 長沙 410208)

1 引言

隨著計(jì)算機(jī)相關(guān)技術(shù)的不斷完善和成熟,與各個(gè)領(lǐng)域都有了較高、有效的結(jié)合,其在中醫(yī)藥領(lǐng)域的應(yīng)用卻步履維艱。在浩如煙海的非結(jié)構(gòu)化形式的古籍中蘊(yùn)含著中醫(yī)藥領(lǐng)域豐富的知識(shí),將其抽取轉(zhuǎn)化為結(jié)構(gòu)化知識(shí),對(duì)中醫(yī)藥的傳承和發(fā)展具有一定的現(xiàn)實(shí)意義。

2 研究的背景和意義

2019 年12 月底,新型冠狀病毒引起的疫情以武漢為中心,進(jìn)而迅速向全國乃至全球蔓延。中醫(yī)較早介入了中國對(duì)新型冠狀病毒肺炎的防治,在第六、七版《新型肺炎診療方案》中推薦使用的“清肺排毒湯”是《傷寒論》相關(guān)經(jīng)方的融合創(chuàng)新運(yùn)用,其對(duì)新冠肺炎各階段患者均有明顯療效[1]。 由此可知,中醫(yī)藥古籍,如《傷寒論》,在當(dāng)前社會(huì)背景下仍具有重要的醫(yī)療價(jià)值。但面對(duì)諸多歷史性新機(jī)遇的同時(shí),中醫(yī)藥古籍的傳承模式也面臨著新的挑戰(zhàn)。構(gòu)建基于中醫(yī)藥古籍的知識(shí)圖譜是將中醫(yī)藥古籍中非結(jié)構(gòu)化的知識(shí)變成結(jié)構(gòu)化知識(shí)的過程,便于計(jì)算機(jī)相關(guān)技術(shù)更好地利用中醫(yī)藥古籍中豐富的知識(shí),是現(xiàn)代化醫(yī)療體系建設(shè)的要求。因此,對(duì)《傷寒論》知識(shí)圖譜構(gòu)建的研究不僅僅是對(duì)中華傳統(tǒng)文化的傳承與發(fā)展,也是對(duì)中國衛(wèi)生醫(yī)療的發(fā)展,同時(shí)對(duì)國家的發(fā)展也具有長遠(yuǎn)的意義。

3 研究現(xiàn)狀

3.1 知識(shí)圖譜

知識(shí)圖譜概念出現(xiàn)于20 世紀(jì)60 年代,是由谷歌在2012 年提出的,目的是為了更好地優(yōu)化搜索結(jié) 果[2]?!癊xploiting Linked Data and Knowledge Graphs in Large Organisations[3]”一書中對(duì)知識(shí)圖譜的定義:“A knowledge graph consists of a set of inter?connected typed entities and their attributes[4]”,即知識(shí)圖譜由一組相互連接的類型化實(shí)體及其屬性組成。

構(gòu)建知識(shí)圖譜的關(guān)鍵是信息抽取、知識(shí)融合以及知識(shí)計(jì)算[6]。信息抽取也稱知識(shí)抽取,指的是通過人工或自動(dòng)等方式從數(shù)據(jù)源中提取實(shí)體、屬性以及關(guān)系的技術(shù)[7]。從數(shù)據(jù)結(jié)構(gòu)的角度來看,數(shù)據(jù)源包括非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù)。相較于半結(jié)構(gòu)化數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù),對(duì)非結(jié)構(gòu)化數(shù)據(jù),如:文本、圖像、視頻等,的知識(shí)抽取能為知識(shí)圖譜提供大量較高質(zhì)量的三元組事實(shí)[7]。知識(shí)融合主要是對(duì)概念實(shí)體進(jìn)行鏈接,來自不同數(shù)據(jù)源的概念可能存在命名相同但指代不同實(shí)體,命名不同概念可能相同以及概念指代的粒度不同等問題[9]。為了解決以上問題,人們已經(jīng)提出了各種各樣的本體匹配算法,從最早的啟發(fā)式方法、概率方法,到現(xiàn)如今基于機(jī)器學(xué)習(xí)或是推理的方法[10]。知識(shí)計(jì)算主要是根據(jù)圖譜提供的信息得到更多隱含的知識(shí)[10],如數(shù)據(jù)中存在的隱含知識(shí)可以利用本體或者規(guī)則推理系列技術(shù)獲取,經(jīng)過不一致檢測技術(shù)發(fā)現(xiàn)數(shù)據(jù)中的燥聲和缺陷。

3.2 中醫(yī)藥知識(shí)圖譜現(xiàn)狀

中醫(yī)藥領(lǐng)域知識(shí)圖譜的應(yīng)用研究主要集中在中醫(yī)臨床病例醫(yī)案。阮彤等基于上海曙光醫(yī)院的信息系統(tǒng)以及知識(shí)庫數(shù)據(jù)構(gòu)造了中醫(yī)藥知識(shí)圖譜,提供了語義問答和輔助開方應(yīng)用[11]。朱玲等通過對(duì)中醫(yī)文獻(xiàn)中“哮喘”相關(guān)知識(shí)的提取,實(shí)現(xiàn)了哮喘相關(guān)知識(shí)的領(lǐng)域建模[12]。方芳等通過本體技術(shù)構(gòu)建了糖尿病醫(yī)案本體庫[13]。

4 《傷寒論》知識(shí)圖譜的構(gòu)建

4.1 中醫(yī)命名實(shí)體抽取

中醫(yī)命名實(shí)體抽取是將疾病、證候、癥狀等中醫(yī)詞匯從數(shù)據(jù)源中抽取出來。

1)實(shí)體抽取原則:本著“全面準(zhǔn)確、繼承發(fā)展”的理念,依據(jù)以下原則納入實(shí)體數(shù)據(jù)。

(1)全面收錄《傷寒論》中疾病、證候、癥狀、處方、藥物有關(guān)詞條;

(2)注重實(shí)體錄入的準(zhǔn)確性;

3.1 評(píng)估顳淺靜脈 經(jīng)顳淺靜脈置管前應(yīng)充分評(píng)估顳淺靜脈的可見度、充盈度及其走行方向。由于右側(cè)顳淺靜脈距離上腔靜脈近,故選常右側(cè)。將患兒頭偏向左側(cè),先觸摸血管是否搏動(dòng),觀察血管外形以防誤入動(dòng)脈,再評(píng)估靜脈充盈度,如顳淺靜脈明顯可直接備皮。顳淺靜脈不明顯可用大拇指在顳枕骨縫處橫向來回輕摸,觸到一條縱向凹槽,用左手拇指和食指輕按血管遠(yuǎn)近兩端,并緩慢內(nèi)聚數(shù)次,可見兩指間皮膚呈條索狀隆起,再備皮[1]。如右側(cè)顳淺靜脈顯露不清晰,且無法觸及凹槽時(shí),再同法選左側(cè)。

(3)錄入數(shù)據(jù)在《傷寒論》有據(jù)可依。

2)實(shí)體抽取方法:以《傷寒論》原文為研究對(duì)象,確定其中與疾病、證候、癥狀、處方、藥物相關(guān)的主題詞,如“太陽病”“中風(fēng)”“脈浮”“桂枝湯”“桂枝”等。對(duì)采集的數(shù)據(jù)人工錄入數(shù)據(jù)庫中,要求對(duì)每一條數(shù)據(jù)標(biāo)注所出自的《傷寒論》條文。

依據(jù)以上實(shí)體抽取準(zhǔn)則和方法以及《中醫(yī)臨床術(shù)語標(biāo)準(zhǔn)規(guī)范》等規(guī)范將《傷寒論》外感疾病演變過程的各種癥候群,區(qū)分為太陽、陽明、少陽、太陰、少陰、厥陰六經(jīng)?。?3],并對(duì)其進(jìn)行綜合分析,歸納其證候、癥狀、處方以及藥物組成,存儲(chǔ)在EXCEL 表格(《傷寒論》全數(shù)據(jù)庫.xlsx)中,實(shí)體數(shù)據(jù)格式要求如表1 所示。實(shí)體抽取結(jié)果,經(jīng)兩位中醫(yī)學(xué)博士進(jìn)行校對(duì)。

表1 實(shí)體數(shù)據(jù)格式要求

4.2 關(guān)系抽取

知識(shí)圖譜是一個(gè)語義網(wǎng)絡(luò),實(shí)體關(guān)系是它的重點(diǎn)[15]。本文在構(gòu)建知識(shí)圖譜的過程中,依據(jù)《傷寒論》的解讀,定義了三類實(shí)體關(guān)系:上下位關(guān)系、治愈關(guān)系以及整體與部分關(guān)系,具體如表2所示。

表2 實(shí)體關(guān)系表

4.3 《傷寒論》知識(shí)圖譜存儲(chǔ)

4.3.1 Neo4j存儲(chǔ)的優(yōu)點(diǎn)

目前知識(shí)圖譜的存儲(chǔ)方式主要有SQL 關(guān)系型數(shù)據(jù)庫和NoSQL 非關(guān)系型數(shù)據(jù)庫。在非關(guān)系數(shù)據(jù)庫中,Neo4j數(shù)據(jù)庫被廣泛使用。Neo4j圖數(shù)據(jù)庫是以圖形結(jié)構(gòu)的形式存儲(chǔ)信息,關(guān)聯(lián)數(shù)據(jù)本身就是它所包含的數(shù)據(jù),因此它可以直接顯示關(guān)聯(lián)數(shù)據(jù)特征。相較于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,Neo4j 的遍歷算法設(shè)計(jì)能夠運(yùn)用圖結(jié)構(gòu)的自然伸展特點(diǎn)來設(shè)計(jì),不需要復(fù)雜的連接運(yùn)算,因此數(shù)據(jù)的增加以及關(guān)系復(fù)雜程度的增加不會(huì)導(dǎo)致查詢效率的下降。

4.3.2 數(shù)據(jù)預(yù)處理

該部分實(shí)驗(yàn)是對(duì)人工抽取、整理并錄入得到的中醫(yī)命名實(shí)體數(shù)據(jù)——《傷寒論》全數(shù)據(jù)庫。xlsx進(jìn)行的。其目的是借助Python 相關(guān)工具將人工整理錄入的數(shù)據(jù)切分成符合Neo4j的導(dǎo)入要求的CSV文件,分別包括疾病、證候、癥狀、處方、藥物五個(gè)實(shí)體文件以及疾病與證候、疾病與癥狀、證候與癥狀、癥狀與處方、處方與藥物五個(gè)實(shí)體關(guān)系文件。

4.3.3 知識(shí)的導(dǎo)入

Neo4j 數(shù)據(jù)導(dǎo)入的方式有三種包括使用Cy?pher LOAD CSV 語句,使用Cypher Create 語句以及使用Neo4j-Import 工具。Cypher 語言的LOAD CSV語句可以適用于任何情況下數(shù)據(jù)的導(dǎo)入,本文通過這種方法將預(yù)處理后經(jīng)過標(biāo)準(zhǔn)化的實(shí)體文件以及實(shí)體間關(guān)系文件導(dǎo)入到Neo4j 數(shù)據(jù)庫中(需將導(dǎo)入文件預(yù)先放入Neo4J安裝目錄的import目錄下)。

1)節(jié)點(diǎn)的導(dǎo)入

節(jié) 點(diǎn) 導(dǎo) 入 模 型:(variable:Lable{key1:val?ue1,…,keyN:valueN})。

節(jié)點(diǎn)的標(biāo)簽(Lable)等同于關(guān)系型數(shù)據(jù)庫的表名,屬性相當(dāng)于關(guān)系數(shù)據(jù)庫中表的列。每個(gè)節(jié)點(diǎn)都有一個(gè)默認(rèn)的內(nèi)部屬性ID,當(dāng)生成新的節(jié)點(diǎn)時(shí),Neo4j 圖數(shù)據(jù)庫服務(wù)器會(huì)自動(dòng)為其分配一個(gè)整數(shù)ID。在默認(rèn)的情況下,節(jié)點(diǎn)的ID 屬性在圖數(shù)據(jù)庫中是自動(dòng)遞增且唯一的。以“疾病”和“證候”兩個(gè)結(jié)點(diǎn)的導(dǎo)入為例,具體Cypher語句如下:

LOAD CSV WITH HEADERS FROM“file:///disease.csv”AS line

MERGE(z:疾?。鹡ame:line.name})

LOAD CSV WITH HEADERS FROM“file:///syndrome.csv”AS line

create(z:證候{name:line.name,id:line.id})

2)關(guān)系的導(dǎo)入

關(guān)系構(gòu)建模型:

startNode-[variable:relationshipType{key1:val?ue1,…,keyN:valueN}]->endNode

與節(jié)點(diǎn)的語法類似,關(guān)系的方括號(hào)內(nèi)定義了關(guān)系的類型和屬性。關(guān)系的類型類似節(jié)點(diǎn)標(biāo)簽,在創(chuàng)建關(guān)系時(shí),關(guān)系類型的指定是必不可少的,但只能指定一個(gè)關(guān)系類型。在Cypher 語言中,關(guān)系可分為兩種:使用一對(duì)短橫線(即--)表示一個(gè)無方向的關(guān)系;若在無方向關(guān)系的一端加上箭頭(即-->或<--)表示一個(gè)有方向的關(guān)系以病名和證候的一對(duì)多的關(guān)系為例,具體設(shè)置如下:

load csv with headers from“file:///drs1.csv”as line

match(from:病名{name:line.from}),(to:證候{name:line.to})

merge(from)-[r:關(guān) 系{property:line.rela?tion}]->(to)

5 結(jié)語

通過人工抽取《傷寒論》原文的知識(shí),完成了《傷寒論》知識(shí)圖譜的構(gòu)建。目前知識(shí)庫中總共構(gòu)建了639 個(gè)實(shí)體,2076 條實(shí)體關(guān)系其中包括了6 個(gè)疾病類實(shí)體,43 個(gè)證候類實(shí)體,394 個(gè)癥狀類實(shí)體,106 個(gè)處方類實(shí)體,90 個(gè)藥物類實(shí)體,實(shí)體數(shù)量統(tǒng)計(jì)如表3所示。在圖數(shù)據(jù)庫Neo4j中,《傷寒論》知識(shí)圖譜采用圖節(jié)點(diǎn)和圖邊來存儲(chǔ)知識(shí)?!秱摗分R(shí)圖譜在Neo4j中的部分實(shí)體關(guān)系展示,如圖1所示。

表3 實(shí)體數(shù)量統(tǒng)計(jì)表

圖1 《傷寒論》知識(shí)圖譜部分實(shí)體關(guān)系圖

基于《傷寒論》知識(shí)圖譜的構(gòu)建將《傷寒論》中非結(jié)構(gòu)化知識(shí)轉(zhuǎn)換為結(jié)構(gòu)化知識(shí),為后期基于《傷寒論》知識(shí)圖譜的推薦系統(tǒng),問答系統(tǒng)以及基于中醫(yī)藥古籍的知識(shí)挖掘與機(jī)器學(xué)習(xí)的研究奠定了基礎(chǔ),為中醫(yī)藥現(xiàn)代化過程中對(duì)中醫(yī)藥古籍的傳承和發(fā)展提供了思路。

猜你喜歡
中醫(yī)藥數(shù)據(jù)庫
中醫(yī)藥在惡性腫瘤防治中的應(yīng)用
中醫(yī)藥在治療惡性腫瘤骨轉(zhuǎn)移中的應(yīng)用
重視中醫(yī)藥發(fā)展,發(fā)揮中醫(yī)藥作用
兩會(huì)聚焦:中醫(yī)藥戰(zhàn)“疫”收獲何種啟示
從《中醫(yī)藥法》看直銷
數(shù)據(jù)庫
數(shù)據(jù)庫
中醫(yī)藥立法:不是“管”而是“促”
數(shù)據(jù)庫
數(shù)據(jù)庫
主站蜘蛛池模板: 日韩精品一区二区三区免费| 国产欧美在线观看精品一区污| 国产欧美精品一区二区| 欧美成人午夜影院| 精品综合久久久久久97超人| 国产尤物视频网址导航| 99久久国产自偷自偷免费一区| 婷婷丁香在线观看| 国产凹凸一区在线观看视频| 国产真实乱子伦精品视手机观看 | 思思热在线视频精品| 欧美亚洲国产一区| 亚洲无码高清一区| 色婷婷国产精品视频| 色悠久久久| 亚洲精品日产精品乱码不卡| 亚洲精品高清视频| 欧美a√在线| 色悠久久综合| 亚洲天堂视频在线免费观看| 99精品免费在线| 毛片基地视频| 国产极品美女在线| 国内精品久久久久久久久久影视 | 日韩AV手机在线观看蜜芽| 精品福利视频导航| 久久久久人妻精品一区三寸蜜桃| 色婷婷亚洲综合五月| 国内精品久久久久鸭| 欧美色图久久| 国产午夜看片| 少妇极品熟妇人妻专区视频| 久久综合九色综合97婷婷| 在线播放真实国产乱子伦| 54pao国产成人免费视频| 精品一区二区无码av| 夜色爽爽影院18禁妓女影院| 熟女成人国产精品视频| 精品伊人久久久香线蕉| 乱人伦99久久| 国产欧美一区二区三区视频在线观看| 国产日产欧美精品| 欧美中文字幕一区二区三区| 日韩精品一区二区三区视频免费看| 亚洲人成网站在线播放2019| 尤物在线观看乱码| 国产精品第5页| 色呦呦手机在线精品| 中文字幕第4页| 亚洲经典在线中文字幕| 国产精品理论片| 在线观看视频99| 2022国产无码在线| 亚洲色无码专线精品观看| 97在线国产视频| 久久婷婷人人澡人人爱91| 日本不卡在线播放| 亚洲日韩久久综合中文字幕| 国产精品久线在线观看| 狠狠色综合久久狠狠色综合| 精品无码一区二区三区电影| 婷婷开心中文字幕| 久久精品娱乐亚洲领先| 国产剧情国内精品原创| 一本大道香蕉中文日本不卡高清二区| 亚洲欧美自拍一区| 婷婷色狠狠干| 亚洲视频二| 日本成人在线不卡视频| 亚洲清纯自偷自拍另类专区| 国产成人欧美| 亚洲综合在线网| 国产精品九九视频| 中文字幕有乳无码| 六月婷婷激情综合| 日韩在线网址| 人人艹人人爽| 精品三级网站| 在线观看欧美精品二区| AV老司机AV天堂| 亚洲天堂视频网站| 九九久久99精品|