999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

嶺南溫病古籍知識庫構建的思路探討

2020-05-25 02:34:29湯偉平許堅李兵吳蕾
中國醫藥導報 2020年11期

湯偉平 許堅 李兵 吳蕾

[摘要] 嶺南溫病學是中醫藥學領域一個重要的學術流派,自晉代以降,古籍記載了大量嶺南溫病醫家的學術思想與病案。將本體引入古籍數字資源中,可將散在的信息集中并使其具有關聯性。本文在總結古籍知識庫研究現狀的基礎上,探討如何基于本體構建嶺南溫病古籍知識庫的思路,包括信息提取和轉換、自動語義標注、本體和本體知識庫的構建,以及信息挖掘等,進而探索古籍中的隱含知識,實現古籍文獻的知識提取、知識推理與知識發現。

[關鍵詞] 嶺南;溫病;古籍;知識庫

[中圖分類號] R2-09 ? ? ? ? ?[文獻標識碼] A ? ? ? ? ?[文章編號] 1673-7210(2020)04(b)-0136-04

Discussion on the construction idea of knowledge base of ancient books for Lingnan warm disease

TANG Weiping1 ? XU Jian1 ? LI Bing2 ? WU Lei1

1.Department of Respiration, the Second Clinical College of Guangzhou University of Chinese Medicine, Guangdong Province, Guangzhou ? 510120, China; 2.Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing ? 100700, China

[Abstract] Lingnan warm disease is an important academic school in the field of traditional Chinese medicine. Since the Jin Dynasty, ancient books have recorded a large number of academic thoughts and medical records of Lingnan warm disease doctors. Scattered information could be centralized and correlated through introducing ontology into the digital resources of ancient books. This manuscript summarizes the current research situation of the knowledge base of ancient books and discusses how to build the knowledge base of Lingnan warm disease of ancient books based on ontology. It includes information extraction and transformation, automatic semantic annotation, construction of ontology and ontology knowledge base, and information mining. Thus explore the implicit knowledge in ancient books and realize the knowledge extraction, knowledge reasoning and knowledge discovery of ancient books.

[Key words] Lingnan; Warm disease; Ancient books; Knowledge base

嶺南溫病學是中醫藥學領域一個重要的學術流派,其在繼承中醫學經典理論的基礎上,結合嶺南地區特點作出的創新,既發展了中醫藥學術,又充實了嶺南醫學的學術內涵[1]。嶺南溫病學起源于晉代至宋代,蛻變與更替于元明兩個朝代,獨立發展于清代;從民國時期至今,嶺南溫病學已形成成熟的學術體系[2]。嶺南位于我國南端,北枕五嶺,南瀕大海,主要包括廣東、海南兩省以及廣西壯族自治區的一部分[3]。其環境特點是炎熱多濕、地處卑下、植物繁茂、瘴癘蟲蛇侵襲[4],獨特的自然環境使溫病成為嶺南地區的多發病[5]。古代嶺南醫家對外感熱病的認識早到晉代葛洪,后至清代何夢瑤,對后世嶺南溫病學的發展均產生了深遠的影響。

古代文獻是古代醫家臨證思想光芒最直接的載體,在指導現代中醫臨床實踐中發揮著舉足輕重的作用。古籍數字化已成為保存、整理和利用古籍的必然趨勢,其功能不僅在于一般的信息查詢,更重要的是構建知識庫,實現古籍文獻中的知識發現和知識推理。因此,我們在古籍數字化和數據挖掘相關研究的基礎上,擬探討嶺南溫病古籍知識庫的構建思路,以推動嶺南溫病古籍中的診治知識更好地被挖掘和利用,從而更好地為臨床服務。

1 中醫藥古籍知識庫研究現狀

我國中醫古籍數字化資源建設工作始于20世紀80年代,已逐步有一些數字化成果產出,其中知識庫結合了數據庫與人工智能的特點,存入大量高度結構化的符號數據,能夠進行深入的數據挖掘,并實現不同的作者之間,以及目錄到全文等多個知識點之間的關聯檢索[6-7]。目前大部分中醫藥高校圖書館都在建設中醫古籍數據庫,但書目數據庫多,全文數據庫相對不足[8]。現代信息技術在古籍研究領域應用的主要難點在于古籍內容繁雜,各種關系的命題不清晰,復雜邏輯關系得不到充分表達,因此,對古籍知識的深度加工處理尤為重要[9]。

近年來研究者針對古籍知識庫開展了許多有益的探索,如賈鳳旭[10]提出基于知識類聚的古籍知識庫構建方法,包括對古籍的注疏文獻進行收集和關聯,與原文形成一個整體的知識系統,相互參考佐證;羅晨光等[11]提出在現有的古籍描述元數據著錄規則的基礎上,結合本體理論,將古籍元數據映射為一個基于本體的知識庫結構框架;李兵等[12]通過語義屬性關聯形成溫病古籍知識體系,描述溫病古籍所蘊含的知識及內在聯系,進而構建溫病古籍知識檢索系統;李芹[13]提出主題圖技術是一種描述知識的元數據格式,作為一項國際標準,可用于描述復雜的知識內容,構成相對完整的知識體系,并實現資源的有機整合,還以《傷寒論》為例探討了主題圖技術在中醫藥領域的應用;還有學者通過中醫古籍知識庫平臺,對草烏、山豆根的古代毒性記載、現代毒性研究及其臨床不良反應報道進行系統研究[14-15]。

2 嶺南溫病古籍知識庫的構建方法

2.1 書目選取、信息提取及數字化轉換

以電子檢索和手工檢索相結合,納入成書時間于1840年之前;作者籍貫屬嶺南并在嶺南行醫如《醫碥》作者何夢瑤,或作者籍貫不屬嶺南,但生平曾長期在嶺南行醫,如《肘后備急方》的作者葛洪;醫籍中包含了溫病診治的信息。檢出并獲取以上古籍后,提取以下信息:醫家、書名、年代、病名、病因病機、證候、治法、方藥、預后等。

按照本體構建和知識庫開發的數據格式要求進行數據的格式化規范處理和數據清洗。對原文中出現的錯誤進行校正,對提取的知識術語進行規范。以《中國中醫藥學主題詞表》《中醫藥學名詞》《中醫臨床診療術語》等作為基本術語庫,對以上檢出的文檔進行預處理,對前期提取的病名、醫籍、病因病機、診斷、治則治法、方藥、預后等知識術語進行規范和數據清洗,并以文本塊為單位,識別出包含一個概念的所有文本塊。根據知識庫構建和知識分析的數據格式要求,增加收錄古籍書目的范圍,對所提取的古籍文本進行結構化加工和段落屬性標注,能夠自由選擇按照不同的知識類型進行知識檢索和分析,增強知識庫的檢索和分析功能。

2.2 自動語義標注與本體構建

通過對語義數據云圖進行查詢,獲得概念在語義數據云圖中對應的具體類。再提取出這些類的屬性實例,以及和其他類之間的關系實例。依次提取概念名稱、類、屬性、關系后,在此基礎之上生成RDF文檔三元組,即概念1-關系-概念2。

構建中醫古籍知識庫既要基于數字化和結構化的古籍數據,又要有規范的知識概念、術語和語義詞表作為支撐[9]。為實現古籍知識的規范表達與利用,構建嶺南溫病古籍知識的本體框架,包括類知識的概念類型和概念關系定義,實現知識的規范表達和語義關聯,我們設計并開發了基于計算機的中醫古籍知識加工和語義標注工具(軟著登字第2562997號)。工具的主要功能:古籍文本的結構化加工,文本分詞與語義標注,知識分析,OWL本體生成,后臺管理及自定義設置,其應用流程見圖1。該工具能夠基于古籍原文數據和概念關系實現對文本數據進行結構化加工、段落及文本分詞,語義標注、新詞發現、本體和結構化數據的導出。通過概念術語及其語義關系建立溫病知識間的規范化本體表達,并生成和導出OWL本體描述語言,用于相關本體研究。

圖1 ? 中醫古籍知識標注工具應用流程

2.3 基于本體的嶺南溫病古籍知識庫構建

本體論原是一哲學分支,其研究方法是將世界諸個體按照一定的準則劃分為概念,探討各概念的屬性及其相互關系。本體通常被稱為領域模型或概念模型,是關于特定知識領域內各種對象、對象特性以及對象之間可能存在關系的理論[16],是某一領域共享的、概念化、形式化表示的知識體系[17]。領域本體是近年來計算機及相關領域普遍關注的一個研究熱點,能夠用于描述指定領域知識,給出了領域實體概念及相互關系領域活動以及該領域所具有的特征和規律的一種形式化描述,將人對現實世界的認識抽象出來,形成一個概念[18]。在古籍數字資源中引入“本體”,可使散在于各部古書以及各卷或各篇之間的某種特定信息具有某種關聯性,以重整資源,實現知識發現[19]。將本體論應用于中醫古籍知識表達的理論與方法,構建中醫古籍的領域本體,有助于突破深度利用古籍知識的困境[19]。

知識庫的構建分為對本體模型的建模與對關系模型的建模兩個部分。中醫本體是比較專業化的本體,描述的是中醫學科領域中概念與概念間的關系,并由此構成了中醫的知識組織模型;中醫學是一本龐大的學科,構建需要領域專家的參與,工作量巨大。為此,我們擬先確立古籍全文、結構化知識的層數據結構表,能夠實現古籍全文及知識詞表的關聯、管理和維護。再進行嶺南溫病中醫古籍知識庫的整體架構的方案設計,包括原文檢索閱讀、知識檢索、知識分析與可視化等部分。系統包括以下功能模塊:古籍文獻的全文閱讀模塊;古籍文獻全文檢索和段落閱讀;古籍文獻結構化數據識別、分詞;基于詞表實現內容的自動語義標注;溫病相關知識的關聯分析、網絡分析、結果導出;后臺數據管理與維護。在知識庫構建過程中可利用本體構建工具如Protege,建立了以疾病為核心的醫療知識本體模型,而知識庫的架構可采用Jena框架。

3 古籍的信息挖掘與知識發現

利用人工智能中的機器學習、知識處理和神經網絡等方法,可用通過對其內容的解析、標引、關聯、重組等知識組織實現中醫古籍中病、證、方、藥等知識的關聯檢索及交互檢索[11],可實現嶺南溫病古籍知識庫的知識因子的有序化和知識關聯的網絡化,從知識庫中挖掘信息和發現知識。例如基于無尺度網絡現象,選取藥物配伍網絡中的“Hub”藥物節點,尋找一定代表性和覆蓋度的共性處方配伍網絡。根據處方配伍網絡中的節點度分布,發現處方配伍網絡的核心節點,并根據這些節點在處方中的同現頻度計算其覆蓋度,從而推理出核心組方。此外,將反復出現的藥對關系連成網絡結構。通過對處方藥物功效、性味、歸經的分析,反向推論疾病某一階段的證候特征,進而推導中醫古籍中嶺南溫病的藥證關系。

4 小結與討論

嶺南溫病學是具有鮮明的地理、氣候、環境特點的中醫學術流派。嶺南名醫劉仕昌曾謂:“嶺南地區氣候炎熱,四季淫雨,濕熱特甚,加上人體陰虛內熱者多,脾胃濕困者多,故嶺南溫病具有明顯的熱象偏盛、易傷氣津和多兼濕困的特點。”近年來暴發的SARS、禽流感、甲流等在嶺南均有較高的發病率。挖掘和整理古代嶺南中醫家治療溫病的臨床經驗和學術思想,對嶺南地區急性傳染病的防控具有重要意義。

歷代中醫學家通過不斷的傳承、實踐和創新,形成日益成熟的學術思想和體系,對于現代中醫臨床仍發揮著重要的指導作用。古籍中記載了大量的病因病機和診治的信息,始終指導著中醫學的理論發展和臨床實踐,同時也賦予了現代研究無窮的啟示和靈感[20]。如獲得諾貝爾獎和國家最高科學技術獎的屠呦呦教授在研究“青蒿素”的提取方法時,正是受到中醫古籍《肘后備急方》中有關“青蒿截瘧”記載的啟發。中醫古籍中隱含的大量治法方藥、藥證關系等信息,如何借助信息技術手段進行更好的呈現,建立起能夠實現知識提取和知識推理的中醫古籍知識庫,已成為中醫文獻研究的熱點。

構建中醫古籍知識庫,在科研、教學、新藥開發等方面均有良好的應用前景。目前中醫古籍數字化雖然已經有了一定基礎,但深度的開發和利用不足,包括偏重于基礎理論研究,而對數字化應用中的系統分析不足,同時由于統一的數字化標準的缺乏,限制了深度開發和利用古籍[21]。因此,我們擬采用基于計算機的自動語義標注和本體構建工具,實現古籍知識的規范表達與利用,建立嶺南溫病古籍知識的本體框架,并通過信息技術手段構建基于本體的嶺南溫病古籍知識庫,使之能夠實現知識提取和知識推理,同時借助數據挖掘技術探索古籍中的核心組方、藥證關系等隱含知識,從而深度挖掘嶺南醫學特色與內涵,以更好地指導臨床診療與實踐。

[參考文獻]

[1] ?黃子天,劉小斌.嶺南醫家對葉天士溫病學術的傳承[J].中國中醫基礎醫學雜志,2016,22(2):156-159.

[2] ?黃子天,劉小斌.嶺南溫病學術源流[J].中華中醫藥雜志,2015,30(5):1585-1588.

[3] ?高日陽,劉小斌.嶺南醫籍考[M].廣州:廣東科技出版社,2011.

[4] ?劉小斌,鄭洪,靳士英.嶺南醫學史[M].廣州:廣東科技出版社,2010.

[5] ?黃子天,劉小斌.嶺南醫家辨治嶺南溫病[J].中國中醫基礎醫學雜志,2016,22(5):597-598.

[6] ?楊繼紅.中醫古籍數字化資源建設概述[J].現代情報,2008,28(5):136-138.

[7] ?劉毅.中醫古籍數字化與知識挖掘[J].圖書館工作與研究,2010,32(12):92-94.

[8] ?李兵,符永馳,張華敏,等.中醫藥行業古籍數據庫的建設與服務[J].西部中醫藥,2014,27(2):85-87.

[9] ?李兵,張華敏,李莎莎,等.中醫古籍知識深度利用方法與知識庫構建[J].中國數字醫學,2018,13(8):33-35.

[10] ?賈鳳旭.基于知識類聚的古籍知識庫構建方法[J].圖書館學刊,2015,37(5):45-48.

[11] ?羅晨光,山川,王珊.基于本體的古籍知識庫建設初探[J].現代圖書情報技術,2007(4):8-11.

[12] ?李兵,張華敏,符永馳,等.基于語義關聯的溫病古籍知識檢索系統的構建研究[J].遼寧中醫雜志,2012,39(2):2403-2404.

[13] ?李芹.主題圖技術在《傷寒論》知識組織中的應用研究[D].北京:中國中醫科學院,2017.

[14] ?王丹.基于文獻研究的中藥草烏安全性綜合評價[D].北京:北京中醫藥大學,2019.

[15] ?陸丹.山豆根安全性的文獻研究[D].北京:北京中醫藥大學,2018.

[16] ?甘健侯,姜躍,夏幼明.本體方法及其應用[M].北京:科學出版社,2011:5.

[17] ?Bollegala D,Matsuo Y,Ishizuka M. Relational duality:unsupervised extraction of semantic relations between entities on the Web [C]. 10 Proceedings of the 19th international conference on World wide web,2010:151-160.

[18] ?鄧仲華,黃鑫,陸穎雋,等.論中文古籍版本本體庫的構建[J].圖書情報知識,2014(4):80-93.

[19] ?孫海舒,符永馳,張華敏,等.基于本體論構建中醫古籍知識庫的探索[J].醫學信息學雜志,2011,32(3):64-68.

[20] ?劉邁蘭,吳曦,任玉蘭,等.借鑒循證醫學實踐方法研究中醫古籍的思考[J].時珍國醫國藥,2010,21(3):726-727.

[21] ?張文亮,敦楚男.近十年我國古籍數字化研究綜述[J].圖書館學刊,2017,39(3):126-130,137.

(收稿日期:2019-10-10 ?本文編輯:李亞聰)

主站蜘蛛池模板: 亚洲v日韩v欧美在线观看| 高清免费毛片| 精品国产网| 综合色在线| 国产精品浪潮Av| 午夜视频在线观看免费网站| 亚洲精品777| 亚洲狠狠婷婷综合久久久久| 国产成人综合久久精品尤物| 女人一级毛片| 国产成人高清精品免费软件| 永久成人无码激情视频免费| 国产天天色| 国产成人盗摄精品| 亚洲第一区在线| AV无码无在线观看免费| 亚洲国产成人超福利久久精品| 国产午夜福利亚洲第一| 亚洲女同一区二区| 国产精品亚洲专区一区| 91精品国产自产在线老师啪l| 久久99蜜桃精品久久久久小说| 国产精品30p| 欧美色图久久| 亚洲一区二区无码视频| 亚洲综合狠狠| 亚洲伦理一区二区| 99在线观看精品视频| 国产精品视频导航| 嫩草在线视频| 亚洲丝袜中文字幕| 亚洲欧美成人| 国产微拍一区| 国产剧情伊人| 亚洲欧美综合另类图片小说区| 国产成年无码AⅤ片在线 | 国产精品无码一区二区桃花视频| 色综合中文| 日韩色图区| 国内99精品激情视频精品| 97se亚洲综合在线韩国专区福利| 成人午夜久久| 尤物成AV人片在线观看| 亚洲综合二区| 国产精品尤物在线| 亚洲伊人天堂| 久久这里只有精品23| 91在线播放国产| 五月激激激综合网色播免费| 久操线在视频在线观看| 巨熟乳波霸若妻中文观看免费 | 最近最新中文字幕在线第一页| 奇米影视狠狠精品7777| 一本综合久久| 亚洲性一区| 国产aⅴ无码专区亚洲av综合网| 久久99国产精品成人欧美| 国产又黄又硬又粗| 亚洲日韩AV无码一区二区三区人| 国产69精品久久| 夜夜拍夜夜爽| 精品视频第一页| 女同久久精品国产99国| 伊人久久大香线蕉影院| 久久综合九九亚洲一区| 欧美性色综合网| 国产在线观看99| 色哟哟精品无码网站在线播放视频| 欧美区日韩区| 亚洲va视频| 欧美在线网| 久久人人97超碰人人澡爱香蕉| 热99精品视频| 久久综合亚洲色一区二区三区| 91人人妻人人做人人爽男同 | 五月天天天色| 成人日韩视频| 国产成人一二三| 色婷婷视频在线| 日韩欧美中文| 日本一本正道综合久久dvd | 午夜福利在线观看入口|