摘 要:以新安醫學防治中風病中新安醫家的診療醫案和方藥為研究對象, 采用多策略相似性檢索技術實現中醫辨證,以基于案例推理的智能決策技術實現中醫處方用藥的自動化。該設計過程符合醫學診斷的實際過程,現實、可行,有助于提高醫師診斷過程的自動化水平,有助于中醫研究的信息化、智能化和現代化。
關鍵詞:案例推理; 處方自動生成; 新安醫學; 中風
中圖分類號:TP 391
文獻標志碼:A
文章編號:1001-3695(2010)02-0544-04
doi:10.3969/j.issn.1001-3695.2010.02.039
TCM recipe automatic composing based on CBR andmulti-strategies similarity retrieval
LI Feng-gang1,2, NI Zhi-wei1, GAO Luan3
(1.Key Laboratory of Process Optimization Intelligent Decision-making for Ministry of Education, Hefei University of Technology, Hefei 230009,China; 2.School of Computer Science Technology, University of Science Technology of China, Hefei 230027, China; 3.Dept. of Clinical Medicine, Anhui College of TCM, Hefei 230038, China)
Abstract:This paper focused on medicine clinical cases and prescriptions of Xin’an medicine stroke treatment. Used mathematical modeling methods, and adopted the multi-strategies similarity retrieval technology. It presented the recipe automatic composing of TCM(traditional Chinese medicine) based on case-based reasoning (CBR) technology belonging to artificial intelligence. It is benefit to the informationization,intelligentization and modernization of TCM while provides references for clinicians.
Key words:case-based reasoning(CBR); recipe automatic composing; Xin’an medicine; stroke
0 引言
醫學信息學是醫學與信息科學相結合的產物,起源于傳統專家系統在醫學領域的應用,它涉及計算機科學、工程數學、認知科學、邏輯學、心理學、醫學等諸多學科。近年來由于人工智能、數據挖掘等技術的興起,其研究重新引起人們的興趣。它在西醫某些領域有較好的發展,如腫瘤學、肝臟病理學、泌尿學、甲狀腺病例診斷、風濕病學、craniostenosis綜合病診斷、皮膚病診斷、心臟病學、神經心理學、婦科醫學和圍產期學等。中醫前期在此方面研究較少,近年來由于認識到信息技術對各個領域巨大的推進作用,以及國家加大中醫藥研發方面的投入,中醫信息化引起了相關領域學者的普遍關注。
近年來對中醫信息化的研究,主要集中在中醫藥的數字化[1]、中醫藥數據庫的建立[2~4]、中醫藥規范化的描述[5]、證型診斷規律的挖掘[6,7]等,相關研究使用的方法主要是基于統計學的方法和數據挖掘技術,這些研究極大地拓展了傳統中醫的研究范圍。由于中醫診斷和用藥過程的獨特性,診斷與治療方案的確定需要醫師具有豐富的經驗。
早期與中醫信息化相關的研究主要集中在20世紀80年代起的醫學專家系統的研究上,如羅元凱痛經辨證施治系統,鄒云翔中醫腎系統疾病計算機診療、教學、護理和咨詢系統,姚貞白婦科專家診療系統及醫學智能通用編輯系統MTGIES-1,計算機模擬錢伯煊月經病診療經驗,梁宗翰兒科脾胃病專家診療系統,四逆散加味治療腹痛性疾病專家診療系統,李玉奇慢性胃炎辨證施治系統,孫同郊乙型肝炎專家診治系統等。北京中醫藥大學近年來研究人工智能、數據挖掘技術在中醫學中的應用。這些研究都有力地促進了祖國醫學的現代化、信息化和智能化。
國外在醫學智能系統方面的研究主要是從20世紀70年代開始,如斯坦福大學的Shortliffe等人用LISP語言開發的MYCIN系統,它是基于規則的以反向推理作為控制結構的系統,具有完成可信度計算和對推理過程進行解釋的能力。伊利諾伊斯大學的Rodewald開發的用于新生兒重癥監護的BABY系統。斯坦福大學的Mulsant等人開發的精神疾患的咨詢系統BLUE、BOX系統。由麻省理工學院Safran等人開發的用于輔助醫生對何杰金壓病患者選擇合適的治療措施的HDDSS系統,其基于貝葉斯理論,用LISP語言實現。
中醫學里面的核心問題則是證型診斷和處方用藥,而有關這方面信息化的研究則很少,中醫診斷過程的半自動化和方藥的自動生成,是中醫信息化研究中的難點。本文針對此問題以新安醫學中風病為對象展開研究。
中風,又稱卒中,是由各種血管性病因引起的腦部疾病的總稱,相當于現代醫學所說的腦血管病,嚴重威脅人類的健康。祖國醫學的研究歷史久遠,中風歷來都是醫家研究的重點。而新安醫學一直都很重視對心腦疾病的研究,僅用于治療和預防腦病的方劑就有400多張,如能充分挖掘利用,對于中風病的防治無疑是一項重大貢獻。
案例推理(case-based reasoning, CBR)[8]是人工智能中基于知識的問題求解和學習方法,是對人類思維經驗的一種模擬。它解決問題是通過重用或修改以前解決相似問題的方案來實現的。CBR研究方法源自人類的認知心理活動,緩解了常規的知識系統中知識獲取的瓶頸問題,它將定量分析與定性分析相結合,具有動態知識庫和增量學習的特點。案例推理技術用于西醫也有部分研究,Remm等人[9]研究了基于案例推理的絳蟲病風險評估,Holt等人[10]研究了案例推理在醫學中的最新應用,Bichindaritz等人[11,12]研究了在生物醫學數據中挖掘原型案例來構建案例庫和CBR在健康科學中的應用。
本課題組近年在醫學信息學方面開展了相關研究工作。借助現代計算機的智能化處理,以新安醫家的診療方藥為研究對象,初步建立了新安醫學防治中風病數據庫[4],提供多種檢索功能,基本實現了新安醫學防治中風信息化。在此基礎上, 采用專業的數據挖掘軟件,運用其中的K均值聚類分析方法以及關聯規則,初步得出了新安醫家防治中風的辨治及組方用藥規律[6]。經過反復臨床驗證,這些方藥行之有效。本文在既往研究的基礎上,基于新安醫學防治中風病數據庫,利用數學方法建模,以人工智能領域中基于案例推理的智能決策技術為支撐,采用多策略相似性檢索技術,研究中醫證型診斷過程自動化和處方用藥自動生成,為臨床醫生的診療提供借鑒。
1 研究方法
1.1 案例數據準備
其主要目的是形成對問題的明確描述,使之適合于用某種數據挖掘技術來處理。如何從紛繁復雜的醫案中提取出有效的數據,提取相關的內容特征和屬性,形成案例并組建成庫是一個關鍵問題。病案中記載的信息,包括大量模糊的、不完整的、帶有噪聲的和冗余的信息,因此,在處理時,必須對這些數據進行清理和過濾,以確保數據的一致性和確定性,將其變成適合案例系統處理的形式。
1)資料來源 病名診斷數據來源:安徽中醫學院第一附屬醫院神經內科。證型診斷數據來源:安徽中醫學院第一附屬醫院神經內科。處方用藥數據來源:運用查閱醫著、醫案、醫話等方法,調研與中風病防治的相關方藥,進行資料的調研整理。以《新安醫籍考》《新安醫籍叢刊》為主要資料來源,初步選擇165則新安醫學防治中風醫案。涉及醫家包括汪機、孫一奎、葉天士、吳楚、程茂先、王任之、洪桂等。
2)數據處理 數據的規范:依據《中風病證候診斷標準》,將相關資料轉換為計算機能夠處理的數據單元,在原始數據基礎上使之規范化、數字化。具體新安醫學防治中風數據庫的設計與實現參見文獻[4]。
1.2 概念設計
辨證論治是中醫診斷和治療疾病的主要手段之一。它分為辨證和論治兩個階段。所謂辨證,就是將四診(望、聞、問、切)所收集的資料、癥狀和體征,通過分析、綜合,辨清疾病的原因、性質、部位和邪正之間的關系,概況、判斷為某種證。論治,則是根據辨證的結果,確定相應的治療方法。辨證是確定治療方法的前提和依據,論治是辨證的目的,通過辨證論治的效果,可以檢驗辨證論治是否正確。
一般說來,中風病的中醫診療過程遵循以下過程:
病名診斷證型診斷治則治法處方用藥
正確的辨證論治必將產生更好的預后。方從法立,法從證出,不同的證候屬性,決定了不同的治法,惟其因證制宜,證藥結合,才能獲得滿意療效。因此,本系統正是基于中風病的辨證論治過程,專門設計了證型診斷、綜合診斷及處方用藥等功能模塊,較好地切合中醫診斷的過程。
對一條中風病案例,證型診斷是整個診斷過程中最為關鍵和復雜的一步,辨證是否準確,關系到用藥的方法和診斷的有效性。因此這一步也是系統設計過程中的關鍵。對證型診斷,采用多策略相似性檢索技術,為辨證過程提供智能支持。證型診斷對應的問題空間表示采用基于框架的修正技術。
對一條新安醫家診斷案例,依據證型診斷中是否呈現出某種證,將其解析成0,1編碼,如表 1 所示。
表1 新安醫家證型診斷案例二值化編碼
ID號新安醫家風證火熱證痰證氣虛證血瘀證陰虛陽亢證
00101005程有功100001
00101007程有功101000
00201002葉桂100001
00301007葉萬青110001
中風病診斷過程中,由于其涉及癥狀(屬性)繁多,有必要對其進行優化選擇,這也是系統設計過程中的一個關鍵點。
對每一條案例,相似性檢索既可提供基于單證的相似性檢索案例,也可提供綜合的相似性檢索案例,最后診斷結果由基于投票的策略結合專家經驗給出。
相似性計算:
sim(C1,C2)=1i∑isimi(C1,C2)
i={風證,火熱證,痰證,氣虛證,血瘀證,陰虛陽亢證}(1)
simi(C1,C2)=1-d(C1,C2)30(2)
式(2)中,d(C1,C2)的計算采用歐氏距離來度量。
2 基于多策略相似性檢索的中醫辨證
一條案例的證型可由各證具體得分值準確地反映。每一證型項目,其最高積分為30分,最低為0分,由各癥狀取值得出。例如,對病案號為10759的患者,其各證得分如表2所示。
表2 診斷各證定量得分
病案號風證火熱證痰證氣虛證血瘀證陰虛陽亢證
1075924515218
1892528543424
診斷系統中同時融入專家知識。證型辨證項目中,0~6分,不定;7~14分,輕型;15~22分,中型;23~30分,重型。對表2定量得分,依據證型輕重劃分專家知識,可得到表3的定性結果。
表3 診斷各證定性表
病案號風證火熱證痰證氣虛證血瘀證陰虛陽亢證
10759重型不定不定不定不定中型
18925重型不定不定不定不定重型
對以往的每一條診斷案例都有處方用藥的記錄,也有關于治則治法的記錄,這可為案例推理提供案例源。依據上述得分或醫生直接診斷結果,患者10759的綜合辨證結果如表4第一條所示。
表4 綜合辨證和相似檢索表
病案號綜合辨證
10759陰虛陽亢,肝風內動
18925陰虛陽亢,肝風內動
案例推理過程既可依據各證得分在同一個醫生既往的案例記錄中進行檢索,尋找相似性案例,也可依據各證綜合辨證的結果在新安醫家案例庫中進行相似性檢索,尋找古代醫家流傳下來的名方。
2.1 基于醫生本人既往案例的相似性檢索
針對案例10759,基于式(1)在系統中檢索醫生本人關于中風病的診斷案例,得到病案號為18925患者的案例,如表1 第二條所示,并檢索出其綜合證型為:陰虛陽亢,肝風內動。案例10759的綜合證型建議結果也為:陰虛陽亢,肝風內動。當然,醫生也可直接依據專業知識和經驗給出綜合辨證結果。
計算表1中案例10759和18925的綜合相似性,其值為
sim(10759,18925)=16×∑6i=1simi(10759,18925)=
16×∑6i=1(1-di(10759,18925)30)=
1-16×30∑6i=1di(10759,18925)=
1-16×30(4+0+3+2+2+6)=0.905 6
即案例10759和18925的綜合相似性值為0.905 6。相似性值最大為1.0,最小為0。
2.2 基于單證的相似性檢索
在相似性檢索中,對某證候達到中型以上的案例,也可以按照相似性檢索式計算出此證候的相似性值,并進行相似性檢索,這樣做是有意義的。對某條案例的某個證候,當其為輕型或不定時,雖然有與此案例此證候最相似的案例,但其意義并不大。例如表2中,患者10759,其火熱證得分為5分,如果按照單證相似性公式來檢索,雖然可以找到基于此單證最相似的案例,但由于其得分低于6分,證型不定,很可能檢索到的案例對診斷意義不大。由于證型辨證涉及癥狀很多,每一個癥狀又可以取多個值,整個過程非常復雜,并且證型辨證是中醫診斷過程中極其重要的一個環節,關系到組方用藥。
2.3 基于綜合辨證的相似性檢索
這一步是依據證型綜合辨證結果,在新安醫學案例庫中進行相似性檢索。對新安醫學案例庫,每一條病案案例都與一條處方用藥案例相對應。在系統中,案例適配既包括證型診斷案例的適配,也包括處方用藥案例的適配。而案例修正主要是對處方用藥案例的修正,由醫生根據患者的具體情況結合當時的實際情況作一些調整。
對每一條新安醫學病案案例都按照證型,即按照風證、火熱證、痰證、氣虛證、血瘀證、陰虛陽亢證六大證型作解析。另外,由于新安醫學的特殊性,在中醫專家的建議下,專門設置一個精血兩虧證型。如果病案具有某種證型,則其對應的取值為真(true)。這樣,一條案例就是由具有某種或某幾種證型的案例所構成。系統在推理過程中,默認對證型值達到中型(23分)及以上的證型作為推理選擇的條件,在新安醫學案例庫中作相似性檢索。同時系統設置了可選項,用戶也可基于自己的偏好選擇推理的條件,這樣,案例檢索的結果會發生一定的變化。當然,有時會有一些重復案例出現。如果以所有證型都選中作為檢索條件,此時為最嚴格的檢索條件,很可能檢索不到相似性案例,可放寬約束,重新檢索。如果在最嚴格的檢索條件下檢索到案例,則其在很大程度上是最相似的案例,適配性能可能最高。
3 基于案例推理的中醫處方自動生成
案例推理過程可以劃分為四個主要階段,即案例檢索(retrieve)、案例適配(reuse)、案例修正(revise)和案例保存(retain)。其構成了案例推理的核心,體現了案例推理技術知識獲取容易、增量學習等特點。
3.1 案例檢索
案例檢索的目的是根據給定的決策問題和決策環境的特征描述,快速而有效地從有關的案例庫中查到待求解的問題最有幫助的決策案例。對案例10759,由于其風證和陰虛陽亢證取值超過15分,達到中型以上,以其為檢索條件,在新安醫學中風病案例庫中作相似性檢索,系統給出其建議解決方案,如表5 所示。
表5 相似性檢索診斷結果
ID號書名醫家證候規范后證候治法規范后治法
00101005馮塘醫案程有功肝腎精血皆虧,水不涵木水不涵木柔肝息風柔肝息風
00101007馮塘醫案程有功水不涵木,風火生痰風、痰先清痰熄風,后補益氣血清痰、熄風
00201001臨證指南醫案葉桂肝腎虛內風動水不涵木柔肝息風柔肝息風
00201023臨證指南醫案葉桂陽邪襲經絡、艾灸絡熱血熱清涼,柔之息風涼血、熄風
00301002評點葉案存真類編葉萬青水不涵木水不涵木滋肝養血熄風柔肝息風
00401005洪桂醫案洪桂中風襲絡水不涵木和陽熄風宣行營衛滋液柔肝息風
3.2 案例適配
由此,系統進入案例適配階段,這個過程可以直接選取相似度最大的第一個案例作為初步解決方案,也可依用戶的個人偏好或既往經驗選擇其中一個。例如,對案例10759,選擇的適配案例為00101005,如表6所示,其對應的組方用藥如表7所示。
表6 案例適配診斷結果
ID號書名醫家證候規范后證候治法規范后治法
00101005馮塘醫案程有功肝腎精血皆虧,水不涵木水不涵木柔肝息風柔肝息風
表7 案例適配處方結果
方劑代號藥品1藥品2藥品3藥品4藥品5藥品6藥品7藥品8藥品9
00101005野料豆石決明牡蠣桑葉南蝕子當歸鉤藤沙苑天麻
3.3 案例修正
案例的修正是對檢索出的案例中所應用的決策問題求解方法進行適當修改,使其適合于當前要求解的問題,形成決策支持方案。現有的CBR修正方法是利用修正知識庫或領域模型。一般地,案例的調整都需要面向具體領域,沒有一個通用的案例修正方法。在案例修正階段,基于對用戶選取或系統建議的新安醫學案例,可以給出患者10759處方用藥。用戶可以查閱到系統給出的解決方案案例的詳細描述,同時依據患者的具體情況作出案例的修正。考慮到該患者年事已高、陰液虧虛,故在方藥中加入養陰之品,如制首烏、枸杞子、生地。最終案例修正處方用藥結果如表 8 所示。
表8 案例修正處方結果
方劑代號藥品1藥品2藥品3藥品4藥品5藥品6
10759野料豆石決明牡蠣桑葉南蝕子當歸
方劑代號藥品7藥品8藥品9藥品10藥品11藥品12
10759鉤藤沙苑天麻制首烏枸杞子生地
3.4 案例保存
案例保存即是案例推理技術中案例學習的重要組成部分。將上述得到的決策方法應用到相應的決策環境中,并對執行過程與結果加以評價,完成案例的描述、索引等過程,形成新的案例加到案例庫中,此乃CBR學習過程。學習過程把新決策案例中有意義的部分保存到系統的知識庫中。隨著案例的積累,案例歸納可以確定出特定案例群主要特征的原型案例,且原型可與特定案例存儲在一起,提高系統運行的效率和準確性。以上即完成了對患者10759在診療過程中,基于案例推理的處方自動生成過程。
4 診斷過程和處方用藥分析
整個診斷過程和處方用藥的過程實現了半自動化,其突出的特點是:
a)解決醫學診斷過程中的半結構化和非結構化問題。由于中醫自身的特點,醫案的記載通常是非結構化的數據,需要將相關證型規范化,整理到數據庫中,形成相對規范化和結構化的數據。
b)將定性問題定量化。為了實現案例推理過程中的推理和相似性檢索,本文將定性的各證量化為定量的數值。
c)集醫生本人的經驗和古代名家的診斷經驗于一體。基于案例推理技術,將醫生本人診斷案例存于案例庫1,古代名家案例存于案例庫2,形成多案例庫系統。
d)采用多策略相似性檢索技術,即基于各證綜合得分的綜合相似性檢索、基于各證得分的單項相似性檢索、基于綜合辨證的相似性檢索策略。
e)診斷過程同時融入專家知識。系統在診斷的過程中具有人機交互功能,將專家知識融入診斷過程中,集成多種智慧。
5 結束語
本文以中醫診斷過程為依據,以案例推理技術和多策略相似性檢索技術為支撐,研究中醫證型診斷過程智能化和處方生成自動化,并具體以新安醫學防治中風病智能診斷治療系統的構造過程展開研究。根據中風病醫學診斷的一般過程,應用基于案例推理的技術,克服傳統專家系統知識獲取的困難,避免知識獲取的瓶頸。采用多策略相似性檢索,通過動態知識庫,增量式學習,不斷提高系統的效率。該設計過程符合醫學診斷的實際過程,現實、可行,有助于提高醫師診斷過程的自動化水平,有助于中醫研究的信息化、智能化和現代化。將來的研究可以結合現代信息資源組織技術實現對結構化和半結構化的中醫案例和組方的組織與管理。
參考文獻:
[1]梅燦華,孟慶全.數字化中醫胃病診斷方法研究[J].安徽中醫學院學報,2008,27(3):7-9.
[2]胡雪琴,周昌樂,李紹滋.中醫醫案數據庫的構建和數據處理研究[J].情報雜志,2008,27(8):127-129.
[3]張啟明,王永炎,張志斌,等.中醫歷代醫案數據庫的建立與統計方法[J].山東中醫藥大學學報,2005,29(4):298-299.
[4]李鋒剛,郜巒,楊柳. 新安醫學防治中風數據庫的設計與實現[J].中醫藥臨床雜志,2007,19(1):88-90.
[5]李建生,胡金亮,王永炎.基于2型糖尿病數據挖掘的中醫證候診斷標準模型建立研究[J]. 中國中醫基礎醫學雜志,2008,14(5):367-370.
[6]郜巒,李鋒剛.基于聚類分析的新安醫家防治中風辨治規律探索[J].中國中醫藥信息雜志,2007,14(12):92-94.
[7]李建生,余學慶,王至婉,等.基于文獻的肺炎中醫證素組合規律研究[J].中華中醫藥雜志,2008,23(5):379-383.
[8]MARIO L, BRIGITTE B S,BURKHARD H D, et al. Case-based reasoning technology:from foundations to applications[M]. Berlin: Springer-Verlag,1998:1-15.
[9]REMM M,REMM K.Case-based estimation of the risk of enterobiasis[J]. Artificial Intelligence in Medicine,2008,43(3):167-177.
[10]HOLT A, BICHINDARITZ I, SCHMIDT R. Medical applications in case-based reasoning[J]. The Knowledge Engineering Review, 2005, 20(3):289-292.
[11]BICHINDARITZ I, MONTANI S, PORTINALE L.Special issue on case-based reasoning in the health sciences[J].Applied Intelligence, 2008, 28(3):207-209.
[12]BICHINDARITZ I.Prototypical case mining from biomedical literature for bootstrapping a case base[J]. Applied Intelligence, 2008, 28(3):222-237.