于彤 楊碩 李敬華
構建中醫知識庫系統是指用人工智能技術把中醫藥理論和專家的經驗按規范化、標準化的格式,組建成知識庫,達到資源查詢和共享[1]。本文從構建方法、覆蓋范圍、應用情況等3方面對中醫藥知識庫系統的研究進展進行了綜述,以供中醫藥信息化領域的研究人員參考。
1.1 基于關系型數據庫的中醫藥知識庫系統 王連心等[2]提出以關系型數據庫為基礎構建中藥知識庫的方案。據此方案,中藥知識庫分為3個層次:第一個層次是事實數據層,包含存在于文獻資料中的原始數據;第二個層次是知識本體層,其內容是領域概念和領域規則;第三個層次是策略層,其內容是策略性的結論和規則。在中藥知識庫的構建中,可將關系型數據庫作為事實數據層,在其基礎上建立準則層和決策層,使中藥數據上升為中藥知識。陳國寧等[3]在構建中醫咳感癥診斷專家系統的過程中,采用關系數據庫作為知識庫的存儲組織形式,并實現了知識的增添、刪除、修改等操作,以支持推理機制和咨詢模塊。
1.2 基于本體技術的中醫藥知識庫系統 本體(Ontology)是一個源自哲學領域的術語,探討世間萬物如何存在。在計算機科學領域,本體是針對一個概念體系的正式而明確的規范[4]。本體一般針對特定領域和議題而建,它使交互各方對特定領域內共用的概念、詞匯以及概念分類等達成一致,從而支持知識的共享和重用。近年來,本體技術逐漸成為構建中醫藥知識庫系統的主流手段[5]。
徐彬鋒等[6]將本體技術引入到醫學知識組織當中,構建出包括中醫本體和西醫本體兩大分支的醫學本體框架。該本體定義了醫學領域的類、類間關系以及它們須滿足的約束。其中,中醫本體包括中醫疾病類、中醫證類、中醫舌診類、中醫脈診類、中醫病案類;西醫本體包括疾病屬性類、化學物質類、疾病類、診斷類和器官類。Protégé工具被用于構建和展示這一本體。這項工作展示了本體知識庫的可重用性和可擴展性等優點。
谷建軍[5]基于本體技術構建了一個中醫古籍知識庫。中醫古籍所蘊含的知識相當豐富,知識之間的關聯關系錯綜復雜,每一部中醫古籍都作為一個本體存在,將所有中醫古籍構成一個綜合本體的難度可想而知[6]。谷建軍[5]提出基于中醫古籍文獻敘詞表構建領域本體的方法,該敘詞表以一個樹狀結構表達了中醫古籍文獻的概念體系,其中的概念來自于中醫古籍內容。谷建軍[5]使用Protégé 2000工具將該敘詞表轉換為一個OWL本體,該本體繼承了敘詞表的概念結構,但對概念之間的語義關系進行了更為深入細致的描述,為建立文獻之間的知識關聯提供了可行的途徑。
此外,還有很多學者開展了構建中醫藥本體知識庫的探索工作。例如,車立娟等[7]以Protégé為工具,構建了用于表達“肺陰虛證”病機規則的本體知識庫;李新霞[8]以Jena為工具,構建了中醫脾胃病領域本體知識庫;孫海舒等[9]從規范控制、構建原則、本體構建工具、系統架構、術語規范化、構建本體模型等諸多方面,探討如何基于本體構建中醫古籍知識庫;易鋼等[10-11]基于本體,構建了一個中醫知識庫系統,其中包括中醫概念、關系、推理及中醫診斷等大量知識。這些工作初步驗證了將本體技術用于構建中醫藥知識庫的可行性,為中醫領域內的知識組織提供一種新的方法,但構建全面、完整、實用的中醫藥學本體仍是一個長期而復雜的過程。
1.3 基于神經網絡的中醫藥知識庫系統 中醫診斷學知識具有不確定性、復雜性、模糊性等特點,需要能夠充分模擬癥狀與證候之間的非線性映射關系的數據模型。人工神經網絡(Artificial Neural Network,ANN)是由大量處理單元(神經元,Neurons)互連而成的網絡,是對人腦的抽象、簡化和模擬[12]。ANN具有非線性映射功能,其通過對輸入輸出樣本的自動學習,能夠以任意精度逼近任意復雜的非線性映射,因此很適合模擬中醫診斷的推理過程。
吳蕓等[13]使用神經網絡方法,構建了面向中醫舌診八綱辨證的知識庫。該項研究基于“舌象”與中醫“八綱”(包括表、里、寒、熱、虛、實等)之間的對應關系,建立了“概率神經網絡”、“廣義回歸神經網絡”和“學習矢量量化神經網絡”等3種類型的神經網絡,并嘗試將其用于中醫診斷推理。另外,周金海等[12]也利用ANN算法構建了中醫舌診知識庫,它所預測的舌像與八綱辨證的關系與臨床診斷結果基本一致(個別屬性存在誤差)。這些工作說明采用神經網絡技術構建中醫診斷知識庫是可行的。
2.1 中醫人體知識庫 趙靜等[14]初步建立了一個“三維可視人中醫知識庫”,將經絡腧穴學等中醫知識融入三維可視人模型中,構成了具有中醫特色的人體三維醫學影像圖譜。該知識庫使用語義網絡方法,描述腧穴與經絡之間的歸屬關系,以及腧穴與解剖結構(包括肌肉、骨骼、內臟、血管、神經等)之間的對應關系。它還包含腧穴標準定位、功能主治、針刺方法、進針層次、毗鄰結構以及針刺意外等針灸臨床知識。這項工作為今后開發基于“中國虛擬人”的腧穴和經絡三維可視化模型提供了支持。另外,鄭雷[15]在三維人體可視化模型上對中醫腧穴進行了系統定位,并開發了能夠顯示中醫針灸針刺過程的三維影像瀏覽器。
2.2 中醫疾病和證候知識庫 在醫學知識中,最重要、最核心的知識是關于疾病的知識[1]。徐彬鋒等[6]以冠心病知識為例,建立了中西醫知識相結合的本體知識庫。該系統定義了“冠心病”及相關疾病的中英文名稱、定義、發病率、病因和主要治療方法等信息,并進一步定義了診斷學公理。這些公理是醫學元知識(即關于醫學知識的知識),比一般的醫學知識具有更高的抽象層次。例如,發病率大于0小于1;疾病的并發癥是一種疾病;疾病的人群死亡率小于發病率等。該系統再經完善、擴展后可用于中醫輔助診療。
谷建軍[5]建立以“病證”為中心的本體模型,將中醫古籍中的相關概念和知識加入本體之中。該本體包括證候、病位、病因、病機、鑒別診斷、治則、治法、用藥、處方、治療禁忌等類型,明確了類型的屬性和相互關系,能較為準確地反映中醫對“病癥”的理解和認識。
李新霞[8]以老中醫關于脾胃病的病案為基礎,建立了中醫脾胃病領域本體知識庫。該項目對中醫癥狀術語進行了規范化處理,將零散的中醫脾胃病知識組織起來,實現了疾病診斷、證候診斷、治法、方藥等方面的推理功能,以支持知識共享和疾病診療。
2.3 中醫醫案知識庫 中醫醫案是中醫臨床思維活動和辨證論治過程的記錄,是中醫理法方藥綜合應用的具體反映形式[16]。特別是名老中醫的醫案,對于中醫理論和方法的傳承具有重要意義。近年來,在名老中醫經驗傳承的背景下,中醫醫案知識庫的構建成為學術界的一個熱點。彭笑艷[16]采用本體、Agent等技術,構建了中醫醫案知識庫,其中主要包含中醫肝病、胃病等領域的醫學知識、材料和醫案,為用戶提供在線診療服務。曹宇峰[17]基于本體技術設計了中醫病案知識模型,構建了中醫病案的知識庫,以輔助學生通過大量病案實踐來鞏固所學的理論知識。
2.4 中藥知識庫 中藥知識是提高中醫臨床與學術水平的重要環節和文獻寶庫之一,值得當代醫家學習與研究[18]。王連心等[2]提出了一套中藥知識庫的設計方案,該知識庫的內容包括中藥的名稱、出處、劑量、性味、歸經、功效、主治、用藥宜忌等信息,以及方劑的處方來源、劑型、藥物組成、功效主治、制備方法、用法用量與禁忌等。這些知識通過對古典醫籍、學術專著、學術期刊和報紙、各種學術會議論文和報告以及相關指南等進行普查與篩選、分析與整理而獲得。該方案還對中藥命名、藥效和劑量的規范化問題進行了討論。
2.5 中醫養生知識庫 《黃帝內經》是中醫藥理論體系的奠基之作,其養生理論和方法對中醫養生學有著深遠的影響[3]。臧知明[19]采用Linux、MySQL、PHP等技術,初步構建了面向網絡應用的《黃帝內經》養生知識庫。臧知明[19]對《黃帝內經》的語言特點和思維方式進行了分析,提出了基于詞句的《黃帝內經》養生知識的表達模式,并提出了《黃帝內經》養生知識庫的框架。
3.1 面向中醫臨床診療的專家系統 中醫專家系統是指用計算機人工智能技術來模擬著名老中醫診療患者的臨床經驗,從而使該軟件具有專家水平的診治患者的能力[1]。知識庫是專家系統的核心部分,它決定系統設計的正確與否,也影響系統其他模塊設計的難易以及系統運行的效率[3]。馬斌榮[1]于1979年研制了“中醫關幼波診療肝病的計算機程序”。該系統開臨床診療專家系統之先河,并啟動了中醫信息化的進程。陳國寧等[3]采用產生式規則來表示專家知識,以知識庫的形式對這些知識進行組織,并實現了混合推理的機制,在此基礎上,實現了一個能對中醫咳感癥進行診治的專家系統。在中醫診療技術現代化的背景下,中醫專家系統、智能化輔助中醫診療系統的研發工作成為中醫藥信息化建設的熱點,中醫藥知識庫系統作為其中的支撐技術也得到了學術界的重視。
3.2 中醫計算機輔助教學系統 中醫藥知識庫能有效支撐領域知識的檢索、瀏覽和形象化展示,因此對于中醫教學工作具有良好的輔助作用。徐彬鋒等[6]將其開發的知識庫系統用于《醫學基礎》課程的教學工作,取得了良好的效果。學習者反映,使用這個系統可以迅速定位到系統所包含的概念,從而加速對相關概念的理解。但該系統的內容僅限于知識庫構建者所掌握的醫學知識,而未覆蓋所有的相關知識。為提升該系統在教學中的實際價值,尚需擴展其范圍并完善其功能。
中醫藥知識庫系統在中醫藥信息化和中醫藥知識工程等領域中都扮演著核心的角色。在中醫藥領域,關系型數據庫目前是實現知識庫最為實用的手段;領域本體則在復雜知識建模和推理等方面顯示了技術優勢,且其實現技術和工具日趨成熟;學者們也在探索使用人工神經網絡等機器學習和人工智能手段來實現知識庫,體現出了較大的潛力。知識庫系統已被用于中醫疾病、證候、醫案、中藥、養生和古籍等諸多領域,且在輔助臨床診療、輔助教學等方面取得了一些實際應用。但從現有的文獻來看,中醫藥知識庫系統的建設尚不成熟,還有很長的路要走。學者們尚需在術語規范化、知識建模方法、本體工程方法、知識獲取方法和推理機制等方面開展深入研究,并進一步開展中醫藥知識庫系統在中醫藥信息化中的實際應用。
[1]馬斌榮.中醫專家系統與中醫知識庫-中醫領域計算機軟件的開發與應用[M].北京:北京出版社,1997:68-98.
[2]王連心,孟慶剛,王志國,等.中藥知識庫設計淺析[J].世界中醫藥,2011,6(6):535-537.
[3]陳國寧,陳秋蓮.一個中醫咳感癥診斷專家系統的設計[J].廣西大學學報:自然科學版,2001,26(2):101-104.
[4]Liu L,Zsu M T.Encyclopedia of database systems[M].Taiwan:Springer Publishing Company,Incorporated,2009:1-60.
[5]谷建軍.基于敘詞表的中醫古籍文獻領域本體建模方法研究[D].北京:中國中醫科學院中國醫史文獻研究所,2006.
[6]徐彬鋒,溫志浩,羅小剛,等.基于本體的醫學知識庫構建及應用[J].北京生物醫學工程,2012,30(6):618-623.
[7]車立娟,王瑾德,周強,等.基于“肺陰虛證”本體的中醫證候知識庫構建方法研究[J].上海中醫藥大學學報,2009,23(4):18-20.
[8]李新霞.基于本體的中醫學脾胃病知識庫的構建[D].南京:南京理工大學,2008.
[9]孫海舒,符永馳,張華敏,等.基于本體論構建中醫古籍知識庫的探索[J].醫學信息學雜志,2011,32(3):64-68.
[10]易鋼,羅堯岳.基于本體的中醫知識庫系統的研究[J].醫學信息:上旬刊,2010,23(19):3516-3518.
[11]易鋼.應用Protégé構建中醫藥學本體方法研究[J].電腦知識與技術:學術交流,2012,8(1):223-225.
[12]周金海,楊濤,沈大慶,等.基于ANN的中醫舌診八綱辨證知識庫構建與應用[J].計算機應用研究,2010,27(5):1771-1772.
[13]吳蕓,周昌樂,張志楓.中醫舌診八綱辨證神經網絡知識庫構建[J].計算機應用研究,2006,23(6):188-189.
[14]趙靜,莊天戈,劉紅菊,等.基于語義網絡方法的三維可視人中醫知識庫[J].上海交通大學學報,2005,39(4):517-521.
[15]鄭雷.結合中醫針灸的三維醫學影像學研究[D].上海:上海交通大學,2004.
[16]彭笑艷.基于中醫醫案的知識庫構建[D].北京:北京科技大學,2009.
[17]曹宇峰.病案分析引導下的中醫智能教學的研究[D].北京:首都師范大學,2005.
[18]胡濱.中醫藥文獻檢索[M].上海:上海科技出版社,2007:33-45.
[19]臧知明.《黃帝內經》養生知識庫框架構建研究[D].廣西:廣西中醫學院,2005.