孔維蓮,徐麗麗,薛燕星,劉保延,王映輝,周雪忠*,張潤順
(1.北京交通大學計算機與信息技術學院 北京 100044;2.中國中醫科學院中醫藥信息研究所北京 100700;3.中國中醫科學院廣安門醫院 北京 100053;4.中國中醫科學院中醫藥數據中心 北京 100700)
基于復雜網絡的薛伯壽教授臨床處方用藥規律分析研究*
孔維蓮1**,徐麗麗2**,薛燕星3***,劉保延4,王映輝2,周雪忠1***,張潤順3***
(1.北京交通大學計算機與信息技術學院 北京 100044;2.中國中醫科學院中醫藥信息研究所北京 100700;3.中國中醫科學院廣安門醫院 北京 100053;4.中國中醫科學院中醫藥數據中心 北京 100700)
目的:如何從中醫藥學長期醫療實踐中積累的大量處方數據中進行知識發現是中醫藥現代化研究的重要內容之一。本研究擬從薛伯壽教授多年臨床實踐的處方數據出發,探索基于復雜網絡的中藥網絡與處方網絡相結合發現薛教授常用復方核心藥物組合的方法。方法:基于薛教授在中國中醫科學院廣安門醫院門診系統中的9 584個處方數據,依據處方構成的相似性和藥物的同現關系分別構建處方網絡和藥物網絡,利用社團分析等復雜網絡方法進行處方及藥物配伍分析,由薛老及其傳承人評價分析結果。結果:通過復雜網絡分析,得到126個處方模塊,4個中藥模塊。其中,1個處方模塊的核心藥物組合為小柴胡湯、銀翹散、升降散復方加減,與前期利用完整回顧性醫案挖掘的外感熱病處方中藥組成一致。結論:針對處方數據,利用社團分析等復雜網絡方法具有一定的優勢,可以得到薛教授治療不同疾病的常用復方核心藥物組合,可為進一步繼承和挖掘名老中醫臨床經驗方提供基礎。
快速模塊性優化 模塊劃分 核心藥物組合 復雜網絡 數據挖掘 薛伯壽
真實世界研究是利用臨床實際數據開展的臨床研究,從大規模數據中歸納獲得臨床有用或具有理論意義的知識,是形成創新知識和臨床決策的有效技術手段[1],已成為中醫領域的熱點研究方向[2]。利用數據挖掘技術對名老中醫臨床數據進行研究,解析用藥規律,總結學術思想和臨證經驗,實現名醫經驗的有效總結和傳承,是當前的中醫藥傳承研究熱點之一。
薛伯壽教授從事中醫臨床及教學50余年,早年師從著名中醫蒲輔周先生,深得蒲老心傳,以擅治各科疑難雜癥及外感熱病而著稱。本研究部分作者在前期研究中基于薛教授回顧的完整外感發熱醫案數據,采用中藥復雜網絡挖掘出利用小柴胡湯、升降散、銀翹散復方加減治療外感熱病[3]。但是,由于收集完整醫案需要花費大量時間和人力,亟待找到更高效的信息收集技術和方法。隨著醫院信息化建設的發展,醫院信息系統(Hospital Information System,HIS)積累了大量的處方數據,利用這些處方數據,開展名老中醫選方用藥規律、有效方藥發現研究對于傳承名老中醫經驗具有重要價值。目前的處方分類研究中有的是針對小樣本處方數據[4],或按照已知方劑組成標準[5]進行分析。本研究擬采用社團分析等復雜網絡方法針對大樣本處方數據探索發現薛教授常用復方核心藥物組合,從而驗證與前期研究的一致性。
1.1 研究對象
數據來源于中國中醫科學院廣安門醫院HIS系統中薛教授自2008年7月1日至2014年7月29日的全部門診處方信息。
1.2 研究方法
1.2.1 病例資料內容
在本研究中,處方數據的納入標準為:患者基本信息、就診信息和處方信息完整的臨床資料。
1.2.2 數據整理與規范
將HIS中的相關數據導入中醫臨床數據倉庫,確認導入后的處方與HIS中原始處方數據一致,保證數據完整、準確。再利用中醫臨床數據預處理系統(Extract-Transform-Load,ETL)按照《中國藥典》與《北京市中藥飲片調劑規程》進行中藥名稱規范化處理[6]。
1.2.3 數據分析方法
基于古方及當代臨床復方數據的分析表明,中醫藥理論指導下的復方配伍過程具有無尺度復雜網絡現象[7],表明中醫處方中存在核心的組織結構,這些組織結構代表了醫生臨床處方的思維結構、知識貯備和臨床經驗。無尺度網絡的主要特征是網絡中大部分節點只和很少節點連接。
本研究通過處方藥物組成發現核心藥物配伍的思路是,先從大量數據中找到結構相似的處方,再從某類相似處方中分析核心藥物組成(研究方法示意圖見圖1),分別從處方和中藥兩方面挖掘核心藥物組合。首先,利用杰卡德相似系數來計算處方藥物組成的相似性,杰卡德相似系數等于兩個樣本集交集與并集的比值,是衡量兩個集合相似度的一種指標,相似性的值越大說明兩個處方之間的藥物組成越相似。選擇一定閾值以上的處方,利用Gephi[8]軟件中的快速模塊性優化方法(Fast Unfolding algorithm)[9]構建處方之間的網絡,如公式(1)所示,并進行模塊劃分。快速模塊性優化方法是一種基于模塊度的迭代算法,其主要目標是不斷劃分模塊使得最終網絡的模塊度值不斷增大,該算法結合局部優化與多層次聚類技術,對于稀疏網絡具有線性時間復雜度,同時可獲得非常高的聚類質量。

圖1 分析方法示意圖

依據中藥同時出現在同一處方中的頻次構建以中藥為節點的網絡,兩個中藥同時出現的處方越多,這兩個中藥所連接的邊的權重值就越大,表明兩個中藥關系越緊密。
在研究過程中還利用多尺度骨干網(Multiscale backbone)[12]篩選重要的邊。針對顯著的處方模塊和中藥整體網絡,利用分層網絡(Hierarchical Networks)挖掘核心處方。主要利用Liquorice(該軟件的理論是基于J Pittman 提出的復雜網絡分析方法)軟件[10-12]和Gephi實現。
2.1 數據基本信息
2.1.1 患者基本信息
共有5 551例患者10 110診次,經審核去除重復及少數錯誤的處方信息,共有9 584個處方信息。

圖2 350種中藥在9584個處方中的使用頻次分布圖

表1 全部處方中藥使用頻次及劑量分布/g
2.1.2 處方基本信息
9 584個處方中的350種中藥共使用頻次為139 250次,少數中藥使用頻次較高(圖2)。頻次在2 000次以上的中藥有15種(表1)。每張處方平均含有15±2種藥,平均重量為157.9±30.7 g。

圖3 9 584次處方以藥為節點的度分布和權重分布

表2 9 584次處方之間運算的相似值分布
2.2 處方特點分析
2.2.1 中藥網絡特點
以中藥為節點的網絡包含中藥350種,共有24 003條邊,其中度分布和邊的權重分布均符合冪律分布(圖3)。由圖3可以看出,薛教授臨床用藥存在優先選擇的核心藥物及其藥物配伍。利用多尺度骨干網(置信度為0.95)篩選出比較重要的3 525條邊進行后續分析。

圖4 9 584個處方運算相似值分布
2.2.2 以處方相似性劃分的處方群及核心藥物組合分析
9 584個處方運算的相似性值分布見表2、圖4。處方之間相似度偏低,提示薛教授辨證施治,中藥配伍使用靈活。將處方間相似值≥0.5以上的9 063個處方,利用快速模塊性優化方法得到126個模塊,即處方群。將其中處方數目較大的處方群利用分層網絡,取Layer=3,Degree coefficient=1.9得到復方核心藥物組合(表3),處方群編號為軟件根據運算編排。圖5為處方群20的核心藥物組合網絡圖,該方為小柴胡湯、銀翹散、升降散加減構成,主治外感發熱咽痛等病證。

表3 數目較大處方群信息及其核心藥物組合
2.2.3 以中藥配伍緊密程度劃分的核心藥物組合分析
采用快速模塊性優化方法,將中藥配伍緊密程度將全部處方中的350種中藥劃分為4個模塊,即中藥群(表4、圖6)。中藥群內部的中藥配伍程度比中藥群外部的中藥配伍更加緊密。因處方中包含內外婦兒各類病證,該方法分析出3個具有明顯不同治療作用的中藥群,其中的中藥群1比例較大。
中藥群1中按配伍藥味數≥50的中藥群為小柴胡湯、銀翹散、升降散、黃芪赤風湯加減構成,以藥測證分析,主要功效為辛涼解表、清熱解毒,主要治療外感病證。
2.2.4 中藥核心配伍
針對全部處方(9 584個),利用點式互信息法挖掘350種藥之間的核心配伍關系,其中北柴胡、炙甘草、茯苓、麩炒枳殼、大棗、法半夏等之間的配伍強度均較高,配伍頻度在前20對的頻度及配伍強度見表5。
利用分層網絡對9 584個處方以中藥為節點形成的網絡中比較重要的3 525條邊挖掘的核心藥物組合,該組合由北柴胡、茯苓、麩炒枳殼、炒白芍、當歸、防風、炙甘草、法半夏、黃芪、麩炒白術組成,可以看出薛老常用處方為小柴胡湯、四逆散、黃芪赤風湯等加減,藥物組成及藥物配伍藥味數分布(圖7)。

圖5 處方群20的核心藥物組合

圖6 9 584個處方以中藥配伍緊密程度劃分的中藥群

表4 以中藥配伍緊密程度劃分的中藥數及代表中藥(配伍藥味數≥50)/個

表5 中藥核心配伍及相關系數信息(頻度/個)

圖7 9 584個處方的核心藥物組合及配伍藥味數分布
經薛教授本人及其弟子確認,針對9 584個處方,利用快速模塊性優化方法和分層網絡結合挖掘的復方核心藥物組合體現了薛老的處方的總體用藥特色。在治療不同病證時喜用經典名方配合運用,中藥群1中藥物多為治療外感熱病的常用藥。其中,因薛教授治療外感病時,善調暢氣血,喜用黃芪赤風湯,故黃芪也被劃分在中藥群1中。處方群20的復方核心藥物組合以小柴胡湯、銀翹散、升降散加減,主要治療外感發熱咽痛等癥,與薛教授用藥經驗相吻合,體現了薛教授外感熱病首要方法是以不同透邪之法,逐邪外出,疏透表氣郁閉,使邪毒有外出之路的學術思想[13]。
目前,可采用多種不同算法進行處方分析。如李文林等[4]采用模糊聚類方法分析疾病群方特色,該方法簡單直觀,適用于小樣本數據。孫燕等[5]采用支持向量機實現中醫方劑按照不同要求標準的機器自動分類,該方法在解決小樣本、非線性及高維模式識別問題中具有特有的優勢,但其屬于有監督學習方法,必須預先明確各類別的信息。針對薛教授多年積累的大量臨床處方數據,本研究依據處方構成的相似性和藥物的同現關系分別構建處方網絡和藥物網絡,采用基于模塊度的快速模塊性優化方法和分層網絡得到常用復方的核心藥物組合。該方法執行速度快、效率高,并且無需預先設定模塊的大小和分類數,適用于大樣本數據。此外,分層網絡[14,15]除了可以得到核心藥物組合,還可以得到與核心藥物組合相應的加減用藥,因篇幅有限,在本研究中未述。
本研究中處方相似性的構建以中藥藥物組成為主,下一步將結合藥物劑量、處方藥物的君臣佐使關系來深入研究。同時,針對復方的核心藥物組合的適應癥等信息將結合臨床病歷、臨床評價等信息,分析獲得具有隨癥加減的個體化臨床處方治療方法,為薛教授臨床處方的精準治療[16]應用提供基礎。同時,以人機結合的方式,形成可推廣應用的名老中醫有效經驗方臨床分析應用方法。
致謝:感謝中國中醫科學院廣安門醫院薛伯壽教授為本研究提供的珍貴臨床資料,并在百忙中給予指導!
1 劉保延. 真實世界的中醫臨床科研范式. 中醫雜志,2013,54(6):451-455.
2 邵明義,劉保延,謝琪,等. 中醫藥臨床科研數據的發展現狀和趨勢探討. 世界科學技術—中醫藥現代化, 2015,17(8):1743-1747.
3 薛燕星. 基于信息挖掘技術的蒲輔周外感熱病辨治規律及傳承研究. 中國中醫科學院碩士學位論文,2012:67.
4 李文林,陳滌平,曾莉,等. 基于模糊聚類方法分析干祖望教授診治耳鳴耳聾疾病群方特色. 中國實驗方劑學雜志,2012,18(23):4-8.
5 孫燕,臧傳新,任廷革,等. 支持向量機分類器在中醫方劑模式識別中的應用研究. 中醫藥管理雜志,2006,14(11):25-28.
6 周霞繼,張潤順,王映輝,等. 基于多區域處方的中藥數據規范化整理的問題及對策. 世界科學技術—中醫藥現代化, 2015, 17(3):417-421.
7 周雪忠,劉保延,王映輝,等.復方藥物配伍的復雜網絡方法研究.中國中醫藥信息雜志, 2008,15(11):98-100.
8 M. Bastian, S. Heymann, M. Jacomy. Gephi: An open source software for exploring and manipulating networks. In Proceedings of 3rd International AAAI Conference on Weblogs and Social Media, 2009.
9 Blondel V D, Guillaume J L, Lambiotte R,et al. Fast unfolding of communities in large networks.J Stat Mech-Theory E, 2008, 2008(10):155-168.
10 Pittman J, Berger J O. Integrated modeling of clinical and gene expressioninformation for personalized prediction of disease outcomes.P Natl Acad Sci USA, 2004,101(22):8431-8436.
11 Zhou X, Chen S, Liu B,et al. Development of traditional Chinese medicine clinical data warehouse for medical knowledge discovery and decision support.ArtifIntell Med,2010,48(2-3):139-152.
12 Zhou X, Liu B. Network Analysis System for Traditional Chinese Medicine Clinical Data. International Conference on Biomedical Engineering and Informatics.IEEE, 2009:1-5.
13 徐麗麗,薛燕星,張潤順,等. 名老中醫有效經驗方發現研究的探索與實踐. 中國實驗方劑學雜志, 2015, 21(7):1-4.
14 張潤順,周雪忠,姚乃禮,等. 基于復雜網絡分析的肝脾不調證的配伍特點研究. 世界科學技術—中醫藥現代化, 2010,12(6):882-887.
15 Zhou X, Zhang X. Extraction of Hierarchical Core Structures from Traditional Chinese Medicine Herb Combination Network.2008高等智能國際會議, 中國人工智能學會, 2008.
16 陳健,陳啟龍,蘇式兵. 中醫藥精準醫療的思考與探索. 世界科學技術—中醫藥現代化, 2016, 18(4):557-562.
A Research on the Discovery Methods in Prescription and Medication Based on Professor Xue Boshou's Clinical Prescription Data
Kong Weilian1, Xu Lili2, Xue Yanxing3, Liu Baoyan4, Wang Yinghui2, Zhou Xuezhong1, Zhang Runshun3
(1. College of Computer Science and Information Technology / Beijing Key Lab of Traffic Data Analysis and Mining, Beijing Jiaotong University, Beijing 100044, China; 2. Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 3. Guang'anmen Hospital, China Academy of Chinese Medical Sciences, Beijing 100053, China; 4. National Data Center of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences,Beijing 100700, China)
How to discover the valuable knowledge from the large amount of prescription data accumulated in the long-term medical practice of traditional Chinese medicine (TCM) is one of the important contents of TCM modernization. Based on the prescription data of Xue’s clinical practice of many years, this paper explored the method of combining TCM network and prescription network to find out Xue’s common core drug combination. Based on 9,584 prescriptions in the Hospital Information System of Guang′anmen Hospital of China Academy of Chinese Medical Sciences, prescription network and drug network were constructed according to the similarity of prescription composition and drug co-occurrence relationship. Using the complex network analysis methods, such as community analysis method, to analyze the prescription and drug compatibility, the results were evaluated and analyzed by Xue and his successors. As a result, through complex network analysis, 126 modular prescriptions and 4 TCM modules were obtained. One of the core components of the prescription module included Xiao Chai Hu decoction, Yin Qiao powder, and Sheng Jiang powder compound addition and subtraction. It was in consistent with the drug composition of exogenous febrile prescriptions excavated earlier. In conclusion, using the complex network methods, we can get some core drug combinations prescribed by Prof. Xue, and achieve the common compound core drug combination for treating diseases with certain vantages, laying a foundation for further inheriting and excavating Xue’s effective experience.
Fast unfolding algorithm, module partitioning, core drug combination, complex network, data mining,Xue Boshou
10.11842/wst.2017.01.008
R249
A
(責任編輯:朱黎婷,責任譯審:朱黎婷)
2016-12-28
修回日期:2017-01-06
* 科學技術部“十二五”國家科技支撐計劃項目(2013BAI13B04):名老中醫特色有效方藥傳承研究,負責人:張潤順;國家中醫藥管理局“十二五”中醫藥重點學科:中醫臨床信息學,主持人:王映輝;國家中醫藥管理局2014年中醫藥行業科研專項(201407001): 中醫綜合調養方案對慢性腎臟病進展高危因素干預的數據分析挖掘方法研究,負責人:王映輝;國家中醫藥管理局2015年度國家中醫臨床研究基地業務建設第二批科研專項(JDZX2015170): 慢性肝病病案資料數據審編方案設計、質量控制關鍵技術研究,負責人:張潤順;國家中醫藥管理局2015年度國家中醫臨床研究基地業務建設第二批科研專項(JDZX2015171): 肝病回顧性病例表型信息抽取方法與分析研究,負責人:周雪忠。
** 孔維蓮和徐麗麗為共同第一作者。
*** 通訊作者:薛燕星,主任醫師,主要研究方向:外感熱病防治、名老中醫經驗傳承研究;周雪忠,本刊編委,教授,主要研究方向:復雜網絡、數據倉庫、數據挖掘;張潤順,主任醫師,主要研究方向:中醫藥防治消化系統疾病研究、名老中醫經驗傳承研究。