999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識圖譜及其在中醫藥領域應用研究進展*

2020-03-13 03:09:20孫華君李海燕甄思圓
世界科學技術-中醫藥現代化 2020年6期
關鍵詞:語義中醫藥

孫華君,李海燕,聶 瑩,甄思圓

(中國中醫科學院中醫藥信息研究所 北京 100700)

1 引言

近年來,互聯網高速發展,我們迎來了大數據的時代。因為大數據存在體量大、增長速度快、種類多、價值密度低等特點,基于以上特征,如何有效地利用數據,是人們目前面臨的嚴峻挑戰,以及亟需解決的問題。自從知識圖譜在谷歌首次發布以來,世界研究的熱點逐漸聚焦到領域知識圖譜的構建。知識圖譜也隨著智能信息服務應用的不斷發展,逐漸被應用于中醫藥領域的智能搜索、深度問答、知識推薦、輔助決策等方面[1-2]。隨著我國經濟和科技的快速發展,中醫藥的發展也迎來了新的春天,發展過程中遇到的很多難題,都需要依靠科技的支持才能得到有效解決。同時中醫藥領域的知識存在量大且繁雜的特點,也決定了其在知識表示與存儲等方面的局限性,因此知識圖譜與中醫藥的結合已成為必然的趨勢。

2 知識圖譜的概述

2.1 知識圖譜的概念

知識圖譜在中醫藥領域的應用主要以中醫圖書情報領域的科學知識圖譜和知識工程領域的以本體為構建工具和方法的中醫藥領域知識圖譜兩種形式存在,本文主要對后者進行綜述。關于知識圖譜的定義,劉嶠等[3]指出知識圖譜本質上是表示實體之間的概念網絡,把實體和其屬性之間進行關系劃分并關聯,從而形成大規模的關系型知識庫。知識圖譜是指由相互關聯的廣義實體及其屬性構成,包括“實體、關系、實體”、“實體、屬性、屬性值”兩個類別的關系類型[4]。從圖的層面講,知識圖譜可以顯示知識之間的關系和知識發展進程,通過可視化技術可以對數據源知識進行簡單描述,然后通過數據挖掘、分析、構建、展示等環節實現知識的可視化[5-6]。李新龍等[7]認為知識圖譜主要通過數學算法構建知識結構和關系,利用可視化技術達到可視化的目的,是一種有效的知識管理工具。于彤等[8]提出知識圖譜是一種以語義網絡為核心,基于圖的知識表示與組織方法,通過關鍵技術對各種結構化知識、半結構化知識、非結構化的領域知識進行有效組織,最終實現知識的檢索、推薦、問答等可視化的智能應用。知識圖譜分為采用自底向上構建的通用知識圖譜和自頂向下構建的領域知識圖譜兩類,二者各有特點,通用知識圖譜包含多而廣的常識性知識,而領域知識圖譜包含更多精而準的知識,對行業發展具有重大的意義[9]。

2.2 知識圖譜的價值

知識圖譜作為大數據時代知識工程發展的代表性產物,富含實體、概念及其之間的各種語義關系,并通過一系列相關技術支持實現知識的深度利用,大大提高了知識的利用率和工作者的效率。知識圖譜的價值可以從研究價值和應用價值兩方面進行論述,知識圖譜的研究價值在于,它是在當前Web 基礎之上,構建一層覆蓋網絡,通過知識圖譜的構建,可以將各種數據源知識進行有效組織,從而建立概念實體之間的相關關系,最終形成有用的知識以供利用[3]。知識圖譜的應用價值在于通過知識推理的方式實現對概念的檢索,改變了之前的知識檢索方式;它以圖形化的形式將被分類整理的結構化知識加以可視化[3,10]。

知識圖譜具備以下特點:知識圖譜可以賦予字串新的定義;可以綜合各個學科領域的知識,從而保證搜索結果的連貫性;通過總結信息及相互間的關系為用戶提供更精準的信息;知識圖譜呈現給用戶的知識具有相對完整性[10-11]。

2.3 知識圖譜與本體的關系

知識圖譜與本體的概念內涵和構建目的有所區別,知識圖譜強調實體關系和實體屬性值,而本體更強調概念關系;知識圖譜的構建目的在于用圖譜的形式形象而準確地描述各種實體、概念及其關系;本體的構建目的主要體現在通過術語集和統一的術語概念提供檢索功能和模擬人腦構建領域內的知識體系,運用本體技術構建語義網絡的最終目的是實現知識共享[12]。

知識圖譜與本體之間的聯系緊密,本體的構建可以為知識圖譜奠定良好的基礎內容,而知識圖譜的構建則可以更好地體現本體關系。根據Gruber2001 年提出的定義,本體作為語義網的基礎,在描述基本概念的同時更重視描述概念之間的關系,隨著語義網技術的不斷推廣與應用,在各個領域都出現了共享的本體,尤其是在生物醫學領域,本體具有廣闊的應用前景[13],例如中醫藥本體服務系統能夠支持基于本體的知識展示、決策支持、知識發現等中醫藥領域的應用,這些知識應用的實現都離不開前期知識體系的構建作為支撐。知識圖譜在智能搜索方面,基于搜索引擎,儲存了大量的實體以及實體之間的關系,可以根據用戶查詢返回答案;在自動問答、知識推薦、決策支持方面,知識圖譜在各個領域已經有了相關的應用[14]。通過知識圖譜的構建,可以充分體現領域本體中的各種關系。

3 知識圖譜構建的關鍵技術

3.1 知識抽取技術

知識圖譜的數據源通常來自文本、圖像、視頻等,知識獲取的方法根據知識圖譜數據源的不同而有所差異,其目的是運用信息抽取的方式從文本等數據中抽取相對有意義的知識以供利用[15]。對知識圖譜數據源中的非結構化文本數據的信息抽取能夠為知識圖譜提供大量較高質量的三元組事實,但是其涉及的自然語言分析和處理技術難度較大,因此知識抽取是構建知識圖譜的核心技術[13]。

醫學數據作為大數據的一部分,其知識抽取同樣分為實體抽取、關系抽取和屬性抽取這三種類型。實體的抽取作為知識抽取最基本的內容,其抽取的準確率直接影響著最終形成的知識庫的質量,因此醫學實體的抽取在醫學知識圖譜的構建中起著關鍵性作用;醫學實體關系抽取的目的是為了解決實體間語義鏈接的問題,其方法也逐漸發展到建立醫學實體與實體之間的關系模型;根據實體與其屬性的名稱性關系可以認為醫學實體屬性抽取和實體關系抽取同理[16]。

3.2 知識表示技術

知識表示是基于知識的人工智能應用中的核心部分,Randall Davis 教授等[17]于1993 在AI Magazine 上發表了影響力極大的文章“What is a Knowledge Representation?”該文指出,知識表示作為一種高效計算的媒介,也是智能推理的一部分,其目的是不通過行動而是通過對實體的思考實現對世界的推理,從而產生與之相應的結果作為一種本體約定的集合。知識應用的難點在于知識體系的構建,知識體系構建的目的在于知識表示。目前,知識表示體系主要包括XML:可擴展標記語言(Extensible Markup Language)、RDF:資 源 描 述 框 架(Resource Description Framework)、OWL: 網 絡 本 體 語 言(Web Ontology Language)三個層次。

XML 作為最早的語義網表示語言,以文檔為單位進行表示,它的擴展版本XML Schema 定義了XML 文檔的結構,指出了XML 文檔元素的描述形式;RDF 一般作為語義網標準中的第一層,當前知識圖譜中的數據也采用RDF 數據模型進行描述,不同于RDF 的是RDFs 是一種描述RDF 的輕量級語言,主要關注類別和屬性的層次結構以及繼承關系等,但是RDF 局限于二元謂詞,RDFs 局限于子類和屬性層次及其屬性的定義域、值域;而OWL 解決了RDF 和RDFs 語言的局限性,在RDF 和RDFs 的基礎上自定義了包括頭部和主體兩部分的語法,本體是通過對象類型、屬性類型以及關系類型對領域知識進行形式化描述的模型,這種模型需要與之相適應的建模語言[13]。XML、RDF、OWL 等語言可以為描述概念之間的關聯關系提供豐富的建模元素[18],為后期知識體系的構建奠定基礎。

表1 知識圖譜在中醫藥領域的應用實例

3.3 知識推理技術

知識推理主要可以分為對實體屬性的推理和對實體關系的推理,因此所對應的推理規則也包括針對實體屬性的規則和針對實體關系的規則兩種[19]。知識推理不僅僅能夠應用于已有知識圖譜的補全,同時也可以直接應用于自動問答系統等相關智能應用。

知識推理的主要方法目前大致分為三種:基于傳統方法的推理、單步推理、多步推理?;旌隙嗖酵评肀然旌蠁尾酵评?,可以實現更好的推理結果[15]。徐增林等[2]將知識推理方法主要分為基于邏輯的推理與基于圖的推理兩種類型,部分研究者把跨知識庫的推理方法作為研究重點。知識推理技術作為知識圖譜的關鍵技術之一,在知識的深度挖掘和智能應用中起到了重要的作用,因此領域知識的推理過程中能獲取更多潛在的關系和內涵。

4 知識圖譜技術在中醫藥領域的應用

知識圖譜技術在中醫藥方面的應用主要體現在科學知識圖譜和領域知識圖譜,科學知識圖譜主要運用citespace、cytoscape 等工具實現對中醫情報領域的數據進行聚類分析和共引分析等相關應用,而本文主要討論基于本體的技術和方法建立中醫藥領域知識圖譜,通過對中醫基礎、中醫臨床、中醫養生保健等中醫藥知識圖譜的構建,從而實現智能搜索、自動問答、知識推薦、決策支持等智能醫療方面的應用。知識圖譜在中醫藥領域的應用實例歸納如表1所示。

4.1 中醫基礎

在中醫基礎研究方面,周孜恒等[20]基于本體的方法和構建工具protégé,以李東垣的《脾胃論》為例,在已有的“中醫方證研究與決策開發服務平臺”術語標準庫中提取用法、功用、中藥、病證和加減化裁等術語,并參照中醫藥一體化語言系統(TCMLS)中的語義關系,分析術語之間的內涵,選取《脾胃論》中的補中益氣湯為例,構建了完整的語義網絡,實現了中醫方劑本體構建方法的初步探索。

崔家鵬等[21]以脾臟象理論的相關古籍、中醫權威辭書、高校教材等為本體構建素材;確立脾臟象理論核心術語等領域概念,并通過人工知識抽取的方法構建脾臟象理論語義關系;構建了“生理”、“病理”、“診療”的脾臟象理論生理知識體系,然后利用本體構建工具protégé 構建脾臟象理論知識圖譜,為脾臟象理論的繼承和發展做出了貢獻。

田甜[22]基于本體技術通過對“肺與大腸相表里”的中醫藏象理論進行知識建模,將中醫認識方法、中醫生理、中醫病理、辨證論治之間的語義關系分為等級關系和相關關系,前期的中醫藥知識建模為后期的中醫藥知識挖掘與利用提供了良好的支撐。最終構建了以五臟為中心的中醫藥知識體系,并通過知識推理技術挖掘分析“肺與大腸相表里”的相關古籍醫案,得出肺與大腸在生理和病理上都相互關聯,相互影響,因此臨床治療中應用肺與大腸同治的治療方法。

王斯琪[23]以中醫診斷學為藍本,以本體論為指導理論和方法,采用本體構建的七步法等,將舌象之間、脈象之間的類和屬性值進行有效關聯,構建了舌象、脈象的本體庫,后期還對中醫舌象、脈象進行了本體驗證和相關應用,設計出中醫舌象脈象規范化輔助軟件。確保舌象、脈象的完整性和規范化的同時還可以促進中醫藥的標準化。

4.2 中醫臨床

在中醫臨床研究方面,可以利用知識圖譜的自動問答功能,將實體及其關系進行推理得到答案。阮彤等[24]在研究國內外通用和醫療行業專用知識圖譜的基礎上剖析中醫藥知識圖譜,并建立中醫藥知識圖譜的6 步構建流程,最終實現了中醫藥知識服務體系的建立。通過該流程構建了包括疾病庫、證庫、癥狀庫、中草藥庫和方劑庫的中醫藥知識圖譜[16]。最后將中醫藥知識圖譜數據與推理技術結合起來,從而實現中醫藥知識的智能應用--中醫藥知識問答和輔助開藥。

朱玲等[25]通過抽取中醫文獻中與“哮喘”相關的知識,并基于本體的技術和方法構建中醫哮喘領域知識體系,實現了哮喘這一疾病的領域知識建模,構建了中醫哮喘領域本體并實現知識的共享以及簡單的推理,基本實現了對中醫哮喘領域知識的語義化表達。

方芳等[26]基于本體的方法和技術,以中醫糖尿病醫案為例進行分析和描述,基于改進簡化的六步法,去除了插件相關的內容,加上了對本體的檢驗和存儲。通過搜集醫案書籍和相關資料獲取糖尿病相關領域的知識,定義糖尿病醫案的類、屬性及其關系,從而建立糖尿病醫案本體,最后實現了糖尿病醫案的語義化檢索并建立糖尿病醫案智能檢索平臺。

知識圖譜不僅能夠通過知識抽取、知識推理等過程精確地描述領域內的知識,還可以描述知識的演化過程和規律,從而為研究和決策提供準確、可推理的知識數據。聶莉莉等[27]運用自底向上的知識圖譜智能構建方法,直接從抽取到的數據中提取實體間的關系并更新到知識圖譜中,將疾病知識庫和癥候知識庫融合形成了以支氣管擴張癥為例的“疾?。Y候-特征”3 層結構模型的醫學診斷知識圖譜,然后通過自然語言處理方法自動構建醫學診斷知識圖譜。

李新霞等[28]基于本體的理論和方法,構建了“疾病”、“證候”、“癥狀”、“治法”、“病例”等本體。將醫學領域本體作為知識庫的表示方式,實現了有效的脾胃病輔助診斷方案。推理方面,在系統通用規則的基礎上,還自定義了疾病的推理規則、證候的推理規則、治法方藥規則等其他規則,更大程度上地提高了中醫輔助診斷系統的共享能力、推理能力和擴展能力。

在中醫師辨證論治個體化診療方面,何麗云等[29]運用知識建模技術將辨證論治知識體系中顯性知識與隱性知識綜合分析,在中醫師個體辨證論治及理、法、方、藥的知識體系基礎上,實現“病-證-治-效”等層面的個體診療規律,有利于提高中醫師辨證論治的水平,為名老中醫經驗傳承與創新的可視化研究奠定了良好的基礎。

4.3 中醫養生保健

在中醫養生方面,可以利用知識圖譜的知識推薦功能,通過對實體的關系分析向用戶推薦相關信息。于彤等[30]搜集整理了大量有關中醫養生相關的知識資源,運用知識圖譜這一知識管理技術實現了三大主要的應用:通過展示概念間的關聯關系,實現復雜知識體系的可視化;使知識檢索更加實體化、語義化和智能化;建立用戶個人健康信息模型與中醫藥知識體系之間的關聯,建立起科學的中醫養生知識推薦機制。

在中醫保健方面,郝偉學[31]介紹了構建知識圖譜的5 個環節和具體操作步驟,定義了“西醫疾病”、“證候”、“中藥”、“癥狀”4 類實體概念;實現了包括實體、屬性關系、語義關系3類數據獲??;將獲取的實體和關系有機地融合在一起;將融合后的數據生成本體;利用基于規則的知識推理方法,利用Jena 讀取規則,最終完成知識推理,實現中醫健康知識圖譜的構建。

在疾病防治和保健方面,曹馨宇等[32]參照統一醫學語言系統、醫學系統命名法-臨床術語、中醫臨床術語集中的規范化術語及術語間的語義關系,采集與中醫養生有關的多種信息來源,梳理面向中醫養生的與冠心病相關的語義關系,構建面向中醫養生的冠心病知識本體,對提高冠心病的診療水平和為老年人對冠心病的防治與保健都具有非常重要的意義。

4.4 其他

在中藥藥效關系的知識表示方面,朱彥等[33]以中藥藥效為研究目標總結出中藥藥效間相互作用的方式有協同,有抑制,有互不影響。根據中醫基礎理論和臨床醫師用藥配伍規律,分析概括出中藥功效概念間的促進、抑制、上下位、相似等4種語義關系;然后通過計算功效間語義距離的方法,完成功效語義網絡的構建。

朱玲[34]等采用美國斯坦福大學提出的七步法構建傳統針灸知識本體,參考古籍語言系統中的語義關系,建立針灸概念術語中復雜、多元的關聯關系,從而將針灸傳統知識結構化,層次化。在此基礎上對傳統針灸知識本體的應用進行了探索,開發出了相關的語義檢索軟件。

5 結語

在中醫藥領域中,隨著醫學信息化水平的顯著提高,積累了大量中醫藥數據,中醫藥數據的有效利用對精準醫療、疾病防治和中醫保健等工作具有非常重要的指導意義。構建中醫藥領域知識圖譜主要通過從大量中醫藥學古、現代文本和圖像中抽取結構化知識,通過這種方法可以充分利用中醫藥豐富的古籍資源。目前,知識圖譜在中醫基礎、中醫臨床、中醫養生保健等多個領域已經獲得了一些成果,但是,基于本體的中醫藥知識表示方面研究地比較多,而且較為深入。雖然有少量研究開展了知識問答、輔助決策等方面的探索,但從總體上來說,在中醫藥領域的應用還不夠廣泛和深入,例如中醫骨傷、中醫針灸推拿、中醫兒科、中醫急癥等方面的知識應用有待進一步開發。

猜你喜歡
語義中醫藥
中醫藥在惡性腫瘤防治中的應用
中醫藥在治療惡性腫瘤骨轉移中的應用
重視中醫藥發展,發揮中醫藥作用
兩會聚焦:中醫藥戰“疫”收獲何種啟示
語言與語義
從《中醫藥法》看直銷
中醫藥立法:不是“管”而是“促”
中國衛生(2016年11期)2016-11-12 13:29:24
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
主站蜘蛛池模板: 最近最新中文字幕在线第一页| 女人天堂av免费| 亚洲精品国产乱码不卡| 日韩第九页| 91福利片| 色噜噜综合网| 91精品小视频| 波多野结衣一区二区三区AV| 天天做天天爱夜夜爽毛片毛片| 日本高清免费一本在线观看| 亚洲综合片| 国产精品无码在线看| 国产人成在线视频| 国产精品女同一区三区五区| 国产在线97| a毛片免费看| 波多野一区| 日韩精品高清自在线| 日韩免费毛片| 国产精品视频免费网站| 精品欧美一区二区三区久久久| 中文字幕乱码中文乱码51精品| 国产欧美自拍视频| 成人日韩视频| 欧美日韩资源| 国产成人喷潮在线观看| 久久精品嫩草研究院| 无码啪啪精品天堂浪潮av| 国产精品黄色片| 97se亚洲综合在线天天| 免费无码AV片在线观看国产| 婷婷开心中文字幕| 大陆精大陆国产国语精品1024| 久久人妻xunleige无码| 亚洲欧美人成人让影院| 亚洲国产成人精品一二区| 美女国产在线| 欧美有码在线| 久久久久国色AV免费观看性色| 国产一区二区三区日韩精品| 免费女人18毛片a级毛片视频| 国产精品区视频中文字幕| 国产靠逼视频| 中文字幕久久波多野结衣| 久久亚洲高清国产| 亚洲日韩精品无码专区97| 天天操天天噜| 日本AⅤ精品一区二区三区日| 人人爽人人爽人人片| 亚洲丝袜中文字幕| 91偷拍一区| av手机版在线播放| 色丁丁毛片在线观看| 精品人妻一区二区三区蜜桃AⅤ| 国产精品三区四区| 一级毛片在线免费看| 亚洲国产精品无码AV| 国内老司机精品视频在线播出| 日韩色图区| 亚洲第一成年网| 国产电话自拍伊人| av在线手机播放| 久久黄色小视频| 亚洲欧美自拍中文| 午夜一区二区三区| 5388国产亚洲欧美在线观看| 91精品专区| 久久一本日韩精品中文字幕屁孩| 尤物精品视频一区二区三区| 亚洲天堂久久久| 91免费国产在线观看尤物| 亚洲av无码牛牛影视在线二区| 老色鬼欧美精品| 黑色丝袜高跟国产在线91| 久久久国产精品无码专区| 国产在线观看人成激情视频| 特级aaaaaaaaa毛片免费视频 | 久久亚洲欧美综合| 亚洲热线99精品视频| 亚洲成人黄色在线观看| 国产91无码福利在线| 国产一区二区人大臿蕉香蕉|