韋昌法 羅麗琴 晏峻峰



〔摘要〕 中醫數字辨證是中醫智能輔助診斷的核心,辨證模型的質量直接影響辨證的準確度和效率。為了建立中醫數字辨證模型并驗證其準確度,需要準備大量的配套醫案。根據中醫數字辨證模型對醫案的需求,設計了中醫數字辨證配套醫案智能采集與分析系統,利用人工智能技術和Python編程技術實現了醫案采集、醫案展示、醫案檢索、數據統計分析及可視化等功能,有助于快速采集并篩選出符合條件的中醫醫案,提高中醫數字辨證模型的創建效率和質量。
〔關鍵詞〕 中醫數字辨證;人工智能;醫案采集;醫案分析
〔中圖分類號〕R2-03? ? ? ?〔文獻標志碼〕A? ? ? ?〔文章編號〕doi:10.3969/j.issn.1674-070X.2020.01.016
〔Abstract〕 The digital syndrome differentiation of TCM is the core of intelligent assistant diagnosis of TCM. The quality of syndrome differentiation model directly affects the accuracy and efficiency of syndrome differentiation. In order to establish the digital syndrome differentiation model of TCM and verify its accuracy, a large number of supporting medical cases need to be prepared. According to the requirement of TCM digital syndrome differentiation model for medical cases, an intelligent acquisition and analysis system of supporting medical cases for TCM digital syndrome differentiation was designed. Using artificial intelligence technology and Python programming technology, the functions of medical cases collection, medical cases display, medical cases retrieval, data statistical analysis and visualization were realized, which are helpful to quickly collect and screen qualified TCM medical cases, and to improve the efficiency and quality of the establishment of TCM digital syndrome differentiation model.
〔Keywords〕 traditional Chinese medicine digital syndrome differentiation; artificial intelligence; medical cases acquisition; medical cases analysis
辨證論治是中醫學認識疾病和治療疾病的基本原則。中醫數字辨證指的是在研究中醫辨證論治規律的基礎上,建立辨證過程的數字模型,通過計算機程序對患者病情資料進行分析判斷,最終得出辨證結果[1-3]。國學大師章太炎先生曾說:“中醫之成績,醫案最著,欲求前人之經驗心得,醫案最有線索可尋,循此鉆研,事半功倍。”[4]為了建立中醫數字辨證模型并驗證其準確度,往往需要準備大量的配套醫案,構建中醫數字辨證配套醫案智能采集與分析系統,有助于快速采集滿足需求的中醫醫案。
1 中醫數字辨證模型對醫案的需求
在辨證論治中,辨證是論治(立法、處方、用藥)的前提,辨證準確與否,是臨床療效的關鍵[5]。中醫數字辨證是中醫智能輔助診斷的核心,辨證模型在系統中起著關鍵性的作用,模型的質量直接影響辨證的準確度和效率。因此,辨證模型也成為基于人工智能的中醫診斷研究者普遍關注的熱點問題。
我國的研究者從上世紀70年代中后期就開展了以中醫專家系統為代表的中醫智能輔助診療系統的研發,先后研發出關幼波中醫肝病診斷處方專家系統、中醫數字辨證機等一大批中醫專家系統。40多年來,許多人工智能方法被應用于構建中醫數字辨證模型,不同的辨證模型采用了不同的知識表示和知識推理方法,它們對醫案的需求也不盡相同。中醫醫案是醫生對所診治病證的發生、發展及其轉歸的真實記錄,是對疾病辨證分析、治療過程的真實記載,對醫案進行研究和分析有助于挖掘中醫專家的診療經驗[6]。中醫數字辨證模型對醫案的需求主要集中在兩大方面,一方面需要從醫案中挖掘出中醫專家的辨證經驗,將這些經驗嵌入到中醫數字辨證模型中,使數字辨證模型能集成中醫專家的經驗來開展辨證;另一方面,在驗證數字辨證模型的準確率時,也需要大量的醫案來評估數字辨證模型的辨證結果與中醫專家的辨證結果的一致程度。
中醫數辨證配套醫案的來源有很多,其中一個重要的來源是中醫名家的醫案集,這些醫案集中的醫案質量較高,在中醫數字辨證模型的創建及驗證過程中具有重要的作用。因此,筆者開展了面向醫案集的中醫醫案智能采集與分析系統構建研究,以期為中醫數字辨證研究提供快速獲取高質量配套醫案的工具。
2 中醫數字辨證配套醫案智能采集與分析系統的設計
中醫數字辨證配套醫案智能采集與分析系統擬利用光學字符識別(optical character recognition,OCR)技術將醫案集的醫案圖片轉換成醫案文本,存儲到醫案數據庫中,進而對醫案文本信息進行自動校驗和結構化處理,最后對醫案數據進行統計分析及可視化處理,并通過web頁面將醫案數據和相應的統計分析及可視化結果予以直觀展示,以供用戶查看、篩選和導出醫案。
中醫數字辨證配套醫案智能采集與分析系統可分為4個主要模塊:醫案采集模塊、醫案展示模塊、醫案檢索模塊、數據統計分析及可視化模塊,系統功能模塊圖如圖1所示,系統業務流程圖如圖2所示。
醫案采集模塊利用OCR技術將醫案集的醫案圖片轉換成醫案文本,并利用人工智能分詞技術和模糊匹配技術實現對醫案數據進行自動校驗,以確保通過OCR技術轉換出來的醫案文本內容與原始的醫案圖片內容是一致的。醫案采集模塊利用正則表達式匹配技術對醫案文本信息進行結構化處理,得到醫案基本信息:患者性別、年齡、初診信息、辨證結果、治法、方藥、其他診次信息等內容,并存儲到醫案數據庫中。
醫案展示模塊將已采集的醫案數據展示出來,用戶在瀏覽醫案數據時,可以對醫案數據進行人工校驗,比對醫案數據與原始醫案圖片是否一致。因為醫案采集模塊已提供了醫案數據自動校驗功能,故人工校驗功能不是必須的,但是它可以增強用戶對系統的認可度和信任度。
醫案檢索模塊負責根據用戶的需要對醫案數據進行檢索,用戶可以在性別、年齡段、辨證結果、治法信息和方藥信息等字段中輸入要檢索的關鍵詞,系統根據用戶輸入的條件對數據庫中的醫案數據進行精確或模糊檢索,并將檢索結果直觀展示出來。
數據統計分析及可視化模塊負責對已采集的醫案數據進行統計分析,生成相應的統計圖表和詞云圖,使用戶可以更直觀地了解數據庫中的醫案數據特征,為他們的科研和臨床工作提供參考。系統根據用戶的統計需求,從醫案數據庫中讀取相應的數據,進行數據可視化相關的參數設置,最終生成相應的統計圖表。系統還可以在數據統計分析的基礎上,對辨證結果、治法信息和方藥信息等內容生成詞云圖,讓用戶更直觀地了解統計分析結果。
3 中醫數字辨證配套醫案智能采集與分析系統的實現
課題組研究團隊采用Python編程語言開發實現了中醫數字辨證配套醫案智能采集與分析系統,并以郁病醫案為例,開展了醫案智能采集與分析工作,成功采集了一大批郁病醫案的基本信息:患者性別和年齡信息、初診信息、辨證結果、治法信息、方藥信息、其他診次信息等內容,并從辨證結果、治法信息、方藥信息、性別、年齡、醫生和醫案來源七個角度對所采集的醫案數據進行統計分析,得出相應的統計分析圖表和詞云圖,使用戶可以更直觀地了解醫案數據特征,以便篩選出符合要求的醫案來開展中醫數字辨證研究。
3.1? 醫案采集模塊的實現
醫案智能采集與分析系統所采集的醫案可能來源于不同的醫案集,這些醫案集對醫案信息的組織結構不盡相同,為了支持從不同的醫案集中采集醫案,系統引入了醫案采集模板的概念,用戶可以為不同的醫案集建立相應的醫案采集模板。進行醫案采集時,系統根據用戶指定的醫案采集模板將醫案集的醫案圖片轉換成醫案文本,進而對醫案數據進行自動校驗和結構化處理,并將醫案信息存儲到醫案數據庫中。系統采集到的醫案信息如圖3所示,醫案信息中的辨證結果、治法信息和方藥信息如圖4所示。
3.2? 醫案展示模塊的實現
醫案展示模塊將醫案數據庫中的醫案數據展示出來,用戶可以分頁查看所有的醫案,醫案信息包括患者基本信息、初診信息、辨證結果、治法信息、方藥信息、醫生和醫案來源等內容,醫案展示界面如圖5所示。在瀏覽醫案信息時,用戶還可以對醫案數據進行人工校驗,校驗界面如圖6所示,該界面的左半部分顯示了醫案圖片,右半部分顯示了系統采集并結構化處理后得到的醫案信息,如果用戶在校驗過程中發現醫案信息與圖片中的信息不一致,可以即時修正。如前所述,因為醫案采集模塊已提供了醫案數據自動校驗功能,故人工校驗功能不是必須的,但是它提供了一個備用的校驗渠道,使得系統更加完善。
3.3? 醫案檢索模塊的實現
醫案檢索模塊根據患者性別、辨證結果、治法信息、方藥信息、醫生信息等檢索條件對醫案數據進行檢索,將用戶所需的醫案篩選出來予以直觀展示。例如,可以在醫案數據中檢索辨證結果包含“肝氣郁結”的醫案,其結果如圖7所示。
3.4? 醫案數據統計分析及可視化模塊的實現
數據統計分析及可視化模塊根據用戶的需求對醫案數據進行統計分析,生成相應的統計圖表和詞云圖,使用戶可以更直觀地了解醫案數據特征,以便篩選出符合要求的醫案來開展中醫數字辨證研究。該模塊可以細分為辨證結果統計及可視化模塊、治法信息統計及可視化模塊、方藥信息統計及可視化模塊、性別和年齡統計及可視化模塊、醫生和醫案來源統計及可視化模塊,部分實現效果如圖8、圖9和圖10所示。
4 結論
為了建立中醫數字辨證模型并驗證其準確度,需要準備大量的配套醫案。本文分析了中醫數字辨證模型對醫案的需求,設計并實現了中醫數字辨證配套醫案智能采集與分析系統,并以郁病醫案為例開展了醫案智能采集與分析工作,從辨證結果、治法信息、方藥信息、性別、年齡、醫生和醫案來源七個角度對所采集的醫案數據進行了統計分析,得出相應的統計分析圖表和詞云圖,使用戶可以更直觀地了解醫案數據特征,有助于快速采集并篩選出符合要求的醫案來開展中醫數字辨證研究,提高中醫數字辨證模型的創建效率和質量。
參考文獻
[1] 朱文鋒.《中醫數字辨證機》研究技術報告(醫理部分)[J].湖南中醫學院學報,1980(1):1-11.
[2] 韋昌法,晏峻峰.從知識表示與推理方法探討中醫數字辨證發展[J].中華中醫藥雜志,2019,34(10):4471-4473.
[3] 黃惠勇.證素辨證與數字中醫藥[J].湖南中醫藥大學學報,2012,32(11):3-6.
[4] 盛增秀,陳永燦.借古鑒今寫好醫案[J].浙江中醫雜志,2018,53(7):469-471.
[5] 朱文鋒.證素辨證學[M].北京:人民衛生出版社,2008:1.
[6] 張家瑋,魯兆麟.也談中醫醫案研究的價值與意義[J].國際中醫中藥雜志,2011,33(1):63-65.
(本文編輯? 李路丹)