摘要:本文以\"中醫方證研究與新藥開發決策服務平臺\"的近11萬條病因病機術語為研究范圍,探討構建中醫病因病機本體的研究思路,從而促進中醫病因病機術語的規范化、標準化、信息化;加快中醫藥信息基礎數據庫的構建過程;提高文獻檢索的效率。
關鍵詞:中醫病因病機;本體;術語標準化研究
病機學的定義為:研究疾病發生、發展和變化的基本規律的中醫基礎學科,是具有中醫特色的病理學。根據這一定義,病機學的內容應包括病因學、發病學、病機的構成和分類、審察病機的原則和方法等[1]。
病因病機理論是中醫學關于人體疾病產生的原因及其發生、發展、變化、轉歸的機制和基本規律的理論,是中醫學基礎理論的重要組成部分[2]。在科學技術迅猛發展的今天,面對西醫學和其它傳統醫學的激烈競爭和挑戰,如何逐步實現中醫學現代化、標準化、信息化,是我們面臨的緊迫的戰略任務。
1國內外中醫病因病機術語標準化的研究現狀
據不完全統計,國內已經發表的中醫標準出版物共72個,其中標準機構制定的為9個,包括術語標準4個、醫療標準30個、針灸標準8個、管理標準30個[3]。
國外已開展的中醫標準化相關工作包括,世界衛生組織所制定的相關標準, 如W HO相關中醫標準、W H O 針灸標準等, FDA對針灸管理的相關標準, 一些國家開展的關于傳統醫藥標準的工作, 如英國、荷蘭、西班牙、菲律賓等[3]。
但上述標準中,大部分是針對疾病、征候以及治法術語進行分類,僅涉及了部分病因、病機術語,范圍較小。
2國內外醫學本體的研究進展
1998年,Studer為本體給出的定義為\"共享概念模型的明確的形式化規范說明\",這是迄今為止關于本體的獲得較多公認的規范定義[4]。在醫學領域,很早就引入了本體的概念。國外醫學術語研究已有較為成熟的醫學術語本體包括UMLS(Unified Medical Language System,一體化醫學語言系統)[5]、SNOMED CT(Systematized Nomenclature of Medicine -- Clinical Terms)醫學系統命名法-臨床術語[6]。
UMLS是美國國家醫學圖書館 (NLM)從1986年開始研究的一項長期開發項目,第13版約有來自60多醫學詞典系列的2百萬生物醫學術語。
UMLS的目標是幫助研究人員從大量的數據來源中查詢和整合電子生物醫學信息,并能容易地連接到單獨的信息系統的開發中去,例如:基于計算機的病人記錄,生物數據庫,事實數據庫和專家系統等。NLM正在將UMLS用于自己的PubMed文獻查詢數據庫和ClinicalTrials.gov臨床試驗系統。
SNOMED CT是當前國際上廣為使用的一種臨床醫學術語標準,收錄有超過344000個概念,涵蓋了臨床醫學的大多數方面,由美國病理學家協會的SNOMED-RT和英國國家衛生局的臨床術語標準合并而成。其經過系統組織編排,便于計算機處理的醫學術語,涵蓋大多數方面的臨床信息,如疾病、癥狀、操作、微生物、藥物等。采用該術語集,可以協調不同的學科、專業對于臨床數據的標引、存儲、檢索和聚合,有助于組織病歷。
上海中醫藥大學醫學信息化標準化研究室已經開展了中醫頂層本體[7]、證候本體的探索[8]、治則治法本體[9]、方劑本體的探索[10]等多項課題的研究。本研究是在我研究室原有的基礎上進一步構建病因病機本體。
3構建中醫病因病機本體
我們根據Gruber在1995年提出的5條本體構建的規則[11],結合中醫病因病機理論的特點,運用美國斯坦福大學開發的Protégé本體編輯器,以近11萬條病因病機術語為研究范圍,試著構建中醫病因病機本體。具體如下。
3.1本體構建原則 ①明確性和客觀性,②完整性,③一致性,④最大單向可擴展性,⑤最少約束性。
3.2本體構建方法與步驟
3.2.1確立本體的專業領域和范圍 本研究以\"中醫方證研究與新藥開發決策服務平臺\"[12](簡稱方證平臺)收集的近11萬條病因病機術語為研究對象。同時,以中醫病因病機術語相關的專著、標準等為規范病機術語標準,如《中醫臨床診療術語·疾病部分》和《中醫臨床診療術語·證候部分》中的病因病機術語1824條,《中醫大辭典》中的病因病機術語1288條等作為標準病因病機術語參考。
3.2.2建立本體概念框架 以中醫病因病機領域本體知識為基礎,構成中醫病因病機領域問題的理論框架。
3.2.3定義類和類的等級體系 按照中醫基礎理論將病因分為外感病因、內傷病因、病理性因素、其他病因;病機分為基本病機、系統病機,基本病機包括邪正盛衰、陰陽失調、氣血失調、津液失調,系統病機包括外感熱病病機、內生五氣病機、臟腑病機、經絡病機、疾病的傳變、疾病的轉歸等,見圖1。
圖1 病因病機本體的等級體系圖
3.2.4定義類的屬性 屬性體現的是概念之間的關系。屬性有兩種:對象屬性和數據屬性。對象屬性連接個體與個體(連接兩個類),數據屬性將個體(類)與XML框架中的具體數據類型關聯。以\"痰火擾心\"為例, 在病因病機本體中,如下定義\"痰火擾心\":\"痰火擾心\"有病位、病因、關系等屬性(對象屬性),其中病位的屬性值為\"心\"、病因的屬性值為\"痰\"和\"火\"、關系的屬性值為\"擾\"。病因病機本體中的其他術語概念都按照這一模式定義,具體實例,見圖2。
3.2.5創建實例 采用中醫藥文獻學研究、語義學研究及計算機數據分析、關聯及類聚等方法,將上述近11萬條病因病機術語導入SQL Server 2005數據庫。然后,參照相關的病因病機術語專著,以計算機本體理論為指導原則,通過計算機預處理與人工審核交替循環進行的方式。按照中醫學理論,逐條分析,對相關的病因病機術語進行語義分析、定義、定位,從描述性的中醫病因病機語句中標注、切割出規范化的單一語義的病因病機術語。參考UMLS、SNOMED CT等醫學本體,分析規范化后的中醫病因病機術語的分類體系和病因病機術語間的相互關系,運用本體構建工具protégé4.2等構建中醫病因病機本體。
4結論
中醫理論博大精深,浩如煙海,經過歷代的發展,存在某種程度的概念和表述的不統一、不規范問題,如何依托先進的信息技術,使中醫信息標準化、規范化,達到知識共享的目的,是近年來的熱點問題之一。
本體技術是一項興起于人工智能領域的新技術,其采用XML結構化和計算機可讀性語言有助于表達豐富的專業領域知識,將成為文本信息查詢、醫學自然文本處理、電子病歷數據開發、海量醫學信息挖掘等醫學信息學工程的有力的指導工具。
本文通過嘗試構建中醫病因病機本體,開展關于中醫病因病機標準化研究的探討,促進中醫疾病概念體系定義更加明確,結構更為清晰,層次更為清楚,有利于對中醫病因病機信息進行語義層面的檢索,提高中醫病因病機信息的查詢率,促進病因病機等中醫術語的規范化、信息化。
參考文獻:
[1]成肇智,等.病機學是中醫學理論體系的核心[J].中國醫藥學報.1994.9(5):5-8
[2]譚達全.中醫病因病機理論研究方法的再思考[J].湖南中醫雜志.2013.1(29):2-5
[3]崔蒙,等.中醫標準化發展戰略研究[J].世界科學技術-中醫藥現代化.2006.4(8):17-20
[4] Studer R, Benjamins V.R, Fensel D. Data and Knowledge Engineering [J]. Principles and Methods 1998, 25(12):161-197.
[5]National Institutes of Health Human Services .UMLS主頁 [EB/OL] .[2013-3-6].http://www.nlm.nih.gov/research/umls/quickst sdo.org /snomed-ct/.
[6] Jan-Eric Slot. SNOMED CT主頁[EB/OL] [2013-4].http://www.iht art.html.
[7]高成勉,包含飛,周強.本體構建原則及其在中醫頂層本體構建中的應用[J].醫學信息,2008,(05):581-583.
[8]李明,朱邦賢,周強,等.中醫證候本體表達模式的構建研究[J].上海中醫藥雜志,2013,47(1):7-11.
[9]侯玉,張昌林,周強,等.Protégé在構建中醫治則治法本體中的運用[J].醫學信息,2007,(11):1866-1871.
[10]于靜,孫秀麗,車立娟,等.中醫方劑本體構建過程中的概念形式化研究[J].數理醫藥學雜志,2011,(05):572-575.
[11]T.R. Gruber.Towards Principles For the Design of Ontologies Used for Knowledge Sharing [J].International Journal of Human Computer Studies, 1995,43:907-928.
[12]朱邦賢,包來發,陳曉,等.中醫方證現代研究服務平臺建設構想的實現[J].上海中醫藥雜志,2009,03:49-52.
編輯/張燕