吳嘉瑞 金燕萍 張 冰 張 月 周 唯北京中醫藥大學中藥學院,北京100012
基于關聯規則與熵聚類的化瘀類中成藥組方規律研究
吳嘉瑞金燕萍張冰張月周唯
北京中醫藥大學中藥學院,北京100012
目的探討常用化瘀類中成藥的組方規律。方法收錄《新編國家中成藥》中的化瘀類中成藥處方,采用關聯規則apriori算法和復雜系統熵聚類等方法,確定處方中藥物的使用頻次及藥物之間的關聯規則等。結果高頻次藥物包括丹參、紅花、當歸、川芎、三七等;高頻次藥物組合包括“沒藥,乳香”、“當歸,紅花”、“川芎,當歸”等;置信度較高的關聯規則包括“當歸,沒藥→乳香”、“乳香→沒藥”等。結論處方用藥中除常見的化瘀類中藥外,尚包括具有補血益氣作用的部分補益藥、清熱涼血藥及其他類藥物。
化瘀藥;關聯規則;熵聚類
中醫理論認為“瘀”為“積血”,“瘀證”為“積血之病”[1]。而瘀血的形成多由于氣滯或血虛使得血行不暢和凝滯,也有因外傷及其他原因造成的內出血不能消散和排出,也有因寒在血脈、血凝而成,而瘀血形成后又反過來影響全身氣血運行[2-4]。化瘀藥依據其特點與臨床應用的不同,又有化瘀調經藥,如丹參、紅花、益母草等,主治血行不暢所致的月經不調,痛經等;化瘀散結藥,如莪術、三棱等,主要適用于跌打損傷、瘀腫疼痛、骨折筋損、金瘡出血等傷科疾患;化瘀止痛藥,如土鱉蟲、骨碎補、血竭等,主治瘀血時間長、程度重的癥瘕積聚,多配伍行氣藥或攻下藥共同使用;化瘀止血藥,如沉香、延胡索等,主治氣血瘀滯所致的各種痛證。化瘀類中成藥種類較多,除上述常見的活血止痛、活血療傷外,還有諸多其他類別藥物,如化瘀解毒、化瘀通絡等,而其配伍規律值得深入探討。本研究收集《新編國家中成藥》中的化瘀類中成藥處方,在構建數據庫的基礎上,應用關聯規則和熵聚類算法進行處方用藥規律的研究。
1.1處方來源與篩選
本研究以《新編國家中成藥》(第2版)[5]為來源,共篩選出化瘀藥處方393首。
1.2分析軟件
“中醫傳承輔助系統(V2.0)”軟件[6]由中國中醫科學院中藥研究所提供。該軟件集“數據錄入、數據管理、數據查詢、數據分析、網絡可視化展示”為一體,可以有效實現病案、疾病、證候、中藥、方劑、四診等信息的管理、查詢、綜合分析等功能,可用于方劑組方規律分析及新藥處方發現等領域[7-10]。
1.3處方的錄入與核對
將篩選后的處方錄入“中醫傳承輔助系統(V2.0)”,錄入完成后,由雙人負責數據的審核,以確保數據的準確性。
1.4數據分析
1.4.1頻次統計分析將化瘀方劑中每味藥的出現頻次從大到小排序,并將“頻次統計”結果導出。
1.4.2組方規律分析經過預實驗,確定在支持度個數為30、置信度≥0.6條件下開展研究,按藥物組合出現頻次從大到小的順序進行排序,利用軟件中“規則分析”功能運算關聯規則。
1.4.3新方分析在相關度為8、懲罰度為4的條件下,應用改進的互信息法和復雜系統熵聚類方法發現核心組合與新組方,并實現網絡可視化展示。
2.1用藥頻次
將藥物按使用頻次從高到低進行排序,前三位分別是丹參、紅花和當歸,頻次前30位的藥物情況見表1。

表1 處方中使用頻次前30位的藥物情況表
2.2基于關聯規則的組方規律分析?
按照藥物組合出現頻次由高到低排序,前3位分別是“沒藥,乳香”、“當歸,紅花”、“川芎,當歸”,出現頻次30次以上的藥物組合見表2。在支持度個數為30、置信度≥0.6條件下,分析所得藥對的用藥規則,結果見表3,關聯規則見圖1。

表2 處方中高頻次藥物組合情況

表3 處方中藥物組合關聯規則(置信度≥0.6)

圖1 支持度個數為30、置信度≥0.6條件下的關聯規則網絡展示圖
2.3基于熵聚類的方劑組方規律分析
2.3.1基于改進的互信息法的藥物間關聯度分析依據處方數量,結合經驗判斷和不同參數提取數據的預讀,設置相關度為8,懲罰度為4,進行聚類分析,得到處方中兩兩藥物間的關聯度,將關聯系數0.02以上的藥對列表,見表4。

表4 基于改進的互信息法的藥物間關聯度分析
2.3.2基于復雜系統熵聚類的藥物核心組合與新處方分析以改進的互信息法的藥物間關聯度分析結果為基礎,按照相關度與懲罰度約束,基于復雜系統熵聚類,演化出3~4味藥物核心組合,具體見表5。在核心組合提取的基礎上,運用無監督熵層次聚類算法,得到12個新處方,具體見表6。

表5 基于復雜系統熵聚類的藥物核心組合

表6 基于熵層次聚類的新處方
本研究應用關聯規則和聚類算法系統分析了《新編國家中成藥》中化瘀類中成藥的用藥規律。以下結合研究結果,對處方中高頻次藥物進行分析。丹參是出現頻次最高的單味中藥,其味苦,性微寒,歸心、心包、肝經,功能活血調經,祛瘀止痛,有“一味丹參散,功同四物湯”之說,既能祛瘀生新而不傷正,善調經水,為婦科調經常用藥;又善行血脈,廣泛應用于各種瘀血病癥;還能涼血消癰,常配伍清熱解毒藥用于熱毒瘀阻引起的瘡癰腫毒,兼有除煩安神,活血養血以安定神志。紅花出現頻次僅次于丹參,其味辛性溫,歸心肝經,有活血通經,祛瘀止痛之效。其辛散溫通,是婦產科瘀血病證的常用藥。當歸味甘辛,性溫,歸肝心脾經,具有補血調經,活血止痛的功效。其甘溫質潤,長于補血,為補血之圣藥;且能活血調經止痛,常與補血調經藥同用,如四物湯,既為補血之要劑,又為婦科調經的基礎方;兼其辛行溫通,為活血行瘀之要藥。川芎辛溫,功能活血行氣,祛風止痛。其辛溫香竄,一往直前,走而不守,能上達頭癲,下達血海,外徹皮毛,旁通四肢,為血中之氣藥,為各類血瘀證要藥,又為各類頭痛要藥。三七味甘微苦,性溫,既長于止血又善于化瘀,有止血而不留瘀、化瘀不傷正的特點,為血證良藥,又為活血消腫止痛要藥。
本研究所得的藥物間關聯規則有助于分析藥物間的關聯程度,如“當歸,沒藥→乳香”(置信度為0.9706)含義為,處方中有當歸、沒藥時,有乳香的概率為97.06%;“當歸,紅花,乳香→沒藥”(置信度為0.9615)含義為,處方中有當歸、紅花、乳香時,有沒藥的概率為96.15%;“乳香→沒藥”(置信度為0.9194)含義為,處方中有乳香時,有沒藥的概率為91.94%。又如關聯規則網絡圖中共12味藥物,以血府逐瘀湯中川芎、桃仁、紅花、赤芍、當歸為主要藥物進行加減,根據病性的寒熱虛實而酌配相應的藥物。可見中成藥處方中高關聯度藥物組合與中醫經典名方的一致性,這也在一定程度上體現了中醫理論的傳承與延續。
再者本研究應用復雜系統熵聚類方法得出的新處方不乏啟迪意義,如“血竭,沒藥,冰片,乳香,骨碎補,續斷”的配伍處方,血竭散瘀止痛;乳香活血活血行氣止痛,與沒藥相須為用;冰片清熱止痛消腫;骨碎補活血散瘀,入腎治骨;續斷補肝腎而療傷。諸藥合用既能活血化瘀止痛,又可補肝腎,行血脈。且這幾味中藥多歸肝經,唐代醫家王冰說:“肝藏血,心行之,人動則血運行于諸經,人靜則血歸于肝臟。”故中醫學稱“肝為血海”。由此可知肝藏血的功能對防止出血、制約和涵養肝陽及婦女月經的調節等意義重大。
綜上所述,本研究應用數據挖掘方法對《新編國家中成藥》中的化瘀類處方用藥規律進行研究,獲得[參考文獻]
了傳統統計學研究未獲得的新知識、新信息,為化瘀類處方的深入挖掘和組方規律探尋提供了參考。當然,應用關聯規則和熵聚類研究得的組方規則等還需進一步臨床驗證,數據挖掘方法亦有其局限性,需結合中醫藥理論與實踐綜合分析、評價[11-13]。
[1]高沖,劉璐,胡愛菊,等.活血化瘀中藥的藥理作用研究進展[J].藥物評價研究,2013,36(1):64-68.
[2]吳世君.活血化瘀類中成藥的合理使用[J].海峽藥學,2013,25(1):235-237.
[3]唐仕歡,陳建新,楊洪軍,等.證-熵-方——中醫藥研究的新領域[J].中國中醫基礎醫學雜志,2010,16(4):267-270.
[4]唐仕歡,楊洪軍.中醫組方用藥規律研究進展述評[J].中國實驗方劑學雜志,2013,19(5):359-363.
[5]宋民憲,楊明.新編國家中成藥[M].2版.北京:人民衛生出版社,2011.
[6]盧朋,李健,唐仕歡,等.中醫傳承輔助系統軟件開發與應用[J].中國實驗方劑學雜志,2012,18(9):1-4.
[7]楊洪軍,趙亞麗,唐仕歡,等.基于熵方法分析中風病處方中藥物之間的關聯度[J].中國中醫基礎醫學雜志,2005,11(9):706-709.
[8]唐仕歡,陳建新,楊洪軍,等.基于復雜系統熵聚類方法的中藥新藥處方發現研究思路[J].世界科學技術-中醫藥現代化,2009,11(2):225-228.
[9]吳嘉瑞,唐仕歡,郭位先,等.基于數據挖掘的名老中醫經驗傳承研究述評[J].中國中藥雜志,2014,39(4):614-617.
[10]盛倩,劉紹燕,莊曾淵,等.基于中醫傳承輔助系統的李東垣眼病方劑用藥規律研究[J].中國中醫眼科雜志,2014,24(3):177-180.
[11]李健,盧朋,唐仕歡,等.基于中醫傳承輔助平臺的治療肺癰方劑組方規律分析[J].中國實驗方劑學雜志,2012,18(2):254.
[12]盧笑暉,單崎瑋.基于中醫傳承輔助平臺分析盧尚嶺教授治療頭風病用藥經驗[J].中國實驗方劑學雜志,2012,18(9):5.
[13]吳嘉瑞,郭位先,張冰,等.基于數據挖掘的國醫大師顏正華含陳皮處方用藥規律研究[J].中國中藥雜志,2014,39(4):618-622.
Analysis on com position rules of stasis-resolving Chinese patent drugs based on association rules and entropy clustering
WU Jiarui JIN Yanping ZHANG Bing ZHANG Yue ZHOUWei
TCM College,Beijing University of Chinese Medicine,Beijing 100012,China
Objective To investigate composition rules of stasis-resolving Chinese patent drugs.M ethods The prescriptions of stasis-resolving Chinese patent drugs in The New National Chinese Patent Drugs were collected to build a database.Themethods of association rules with apriori algorithm and complex system entropy clustering were used to achieve the frequency ofmedicines and association rules between drugs.Resu lts The data-mining results indicated that in the prescriptions of stasis-resolving Chinese patent drugs,the most frequency used drugs were Salvia miltiorrhiza,Carthamus tinctorius,Angelica sinensis,Ligusticum wallichii,Panax notoginseng,and so on.The most frequently drug combinationswere“myrrh,libanotus”,“Angelica sinensis,Carthamus tinctorius”,“Ligusticum wallichii,Angelica sinensis”and so on.The drugs with a high degree confidence coefficient of association rules included“Angelica sinensis,myrrh→libanotus”,“libanotus→myrrh”.Conclusion From the analysis above,we can find that in the prescriptions of Chinese patent drugs,there are not only stasis-resolving drugs,but also part tonic with blood and Qi,heat clearing drug and other drugs.
Stasis-resolving drug;Association rules;Entropy clustering
R289.5
A
1673-7210(2015)05(a)-0117-04
2015-01-12本文編輯:張瑜杰)
國家科技支撐計劃課題(2007BAI10B01);北京市中醫藥科技項目(JJ-2010-70);北京中醫藥大學大學生科研項目質量工程項目(BJGJ1420);北京中醫藥大學與北京灸道堂中醫研究院橫向合作課題。
吳嘉瑞,博士,副教授,碩士研究生導師,從事臨床中藥學研究。