封繼宏 張鵬宇
[摘要] 數據挖掘是一門新興學科,優勢在于從龐大的數據庫中提取、分析潛在的規律,并從不同側面反映事物的本質。數據挖掘技術的應用可以使中醫藥信息更加直觀,有助于從大量文獻中快速獲取中醫藥知識資源,發現新的問題,拓寬研究思路。本文分析了近年來中醫學領域多位學者運用數據挖掘技術的研究成果,總結了數據挖掘技術在中藥、方劑、證候、治法、名家經驗、古典醫籍以及疾病預防等多方面應用情況,以期為其在中醫藥研究中的進一步應用提供參考。
[關鍵詞] 數據挖掘;中醫藥;應用;綜述
[中圖分類號] R2-03? ? ? ? ? [文獻標識碼] A? ? ? ? ? [文章編號] 1673-7210(2020)05(a)-0054-04
Application progress of data mining in modern Chinese medicine research
FENG Jihong1? ?ZHANG Pengyu2
1.Department of Respiratory, the Second Affiliated Hospital of Tianjin University of Traditional Chinese Medicine, Tianjin? ?300143, China; 2.Yaqian Town Community Health Service Center of Xiaoshan District in Hangzhou City, Zhejiang Province, Hangzhou? ?311209, China
[Abstract] Data mining is an emerging discipline. Its advantage lies in extracting and analyzing potential laws from huge databases and reflecting the essence of things from different aspects. The application of data mining technology can make traditional Chinese medicine information more intuitive, help to quickly obtain traditional Chinese medicine knowledge resources from a large number of literatures, discover new problems, and broaden research ideas. This paper analyzes the research results of data mining technology used in the field of traditional Chinese medicine in recent years by many scholars, and summarizes the application of data mining technology in traditional Chinese medicine, prescriptions, syndromes, treatment methods, famous experts′ experience, classic medical records and disease prevention, in order to provide reference for its further application.
[Key words] Data mining; Traditional Chinese medicine; Application; Review
中華文明源遠流長,在五千年的華夏文明中形成了自己獨有的醫學體系——中醫。文獻作為中醫傳承的重要載體,是歷代醫家通過長期的臨床實踐及不斷地探索所凝聚的智慧結晶,同時也是了解醫學思想的重要途徑。但由于百家爭鳴,論著眾多,使后世對于中醫藥文獻的研究步履維艱。隨著社會的發展,科技的進步,大量新興科技應用于文獻研究中,其中,數據挖掘技術發揮了重要作用,極大提高了文獻研究的效率。數據挖掘是一門誕生于20世紀80年代的新興學科,最早面向商業用人工智能領域,它試圖從龐大的數據庫中提取、分析一些潛在的規律,從而獲得輔助決策的關鍵信息。數據挖掘技術的特點在于可處理巨大數據量以及不可預知性,擅長于從海量的數據信息中找到新的具有意義的關系、模式或趨勢[1],并從不同側面反映事物的本質。目前中醫藥的信息數據挖掘大致可分為關聯、分類、聚類、預測四大類。通過數據挖掘的應用,可以使中醫藥信息更加直觀,有助于從浩如煙海的文獻中快速獲取中醫藥知識資源,發現新的問題,拓寬研究思路。
1 數據挖掘在中醫證候研究中的應用
辨證論治是運用中醫理論辨析有關疾病的臨床資料從而確立治法方藥的過程,是中醫理論體系的重要指導原則,也是中醫學的基本特點。近來年應用數據挖掘方法進行的中醫證候研究越來越多,通過對中醫證候數據的分類研究,可以得到某證候的核心及預測因子,對反復采集的證候信息進行分析,建立模型,使中醫辨證更加規范化、客觀化。雷蕾等[2]采用數據挖掘的方法分析名老中醫在治療慢性腎衰竭時的組方規律,發現脾腎氣虛證為慢性腎衰竭的主要本證,而濕濁、血瘀為主要兼證。
2 數據挖掘在中藥研究中的應用
張玉嬌等[3]通過循證方法評價數據挖掘在中藥性效研究中的應用發現,與“回歸判別分析”相比,“支持向量機”在中藥藥性判別中的預測效果更具優勢。彭琳[4]用100首常用藥方為研究基礎,對方中常用的中草藥特點進行分析,采用K近鄰的中醫藥藥方分類方法,發現其可有效地反映中醫藥用藥規律與治療效果的關聯性。數據挖掘的研究內容主要集中在中藥配伍規律的相互聯系及某類疾病治療中的用藥頻率探索,單獨的中藥研究較少。
藥對是指臨床常用的相對固定且療效顯著的一對藥物。呂建軍等[5]對“桔梗-甘草”這一藥對進行統計分析,發現其治療疾病88種,包括感冒、咳嗽等,主治證候89種,主要包括風熱犯表證、風寒束表證,存在于315首方劑中,包括銀翹散、杏蘇散、藿香正氣散等,對臨床應用及新藥開發提供了依據。
3 數據挖掘在方劑研究中的應用
方劑是連接中醫基礎與臨床的“橋梁”,通過數據挖掘從“方”入手,可以通過用藥規律的分析,指導臨床應用及中藥新藥的研發[6]。數據挖掘技術與重要組方規律的結合是必然趨勢。數據挖掘在中藥方劑中的應用主要通過關聯分析和聚類方法來實現。
李廷保等[7]在對敦煌醫方的用藥規律探討中發現,敦煌醫方在臨證用藥中注重補血益氣、益氣養陰、清熱解毒。甘草、桂枝為應用頻次較高的藥物,同時為治療天行病小陰旦湯的主要藥物,為桂枝湯的方劑演變。雖然數據挖掘在方劑應用中取得了一定成就,但仍存在局限性,如數據挖掘領域及結果分析深度的局限性,有待今后進一步的進步與完善。
4 數據挖掘在名家用藥規律研究中的應用
名老中醫學術思想及臨床用藥經驗是中醫學的寶貴財富,通過數據挖掘可將隱性的規律進行總結,實現“可言傳、可驗證”的目的。通過文獻計量分析,發現對于名老中醫經驗的數據挖掘,主要從某一疾病的用藥規律出發,約占87.43%[8]。目前主要為定性與定量研究并重,驗證性與探索性相結合。
王文龍等[9]通過對國醫大師梅國強251個病案、179個處方的統計及挖掘,分析其治療肺系病證的用藥,發現梅老重視整體觀念,效法傷寒,注重使用清熱解表、止咳化痰類中藥,同時擅于配伍蟲類藥。張維駿等[10]運用數據挖掘技術探討國醫大師路至正治療肺癌的用藥規律,發現中藥使用頻次由高到低依此為仙鶴草、炙甘草、姜半夏、大棗、澤漆。根據關聯規則分析,信度最高為石見穿、澤漆,支持最高的藥物組合為姜半夏、仙鶴草。由此可見,用數據挖掘方法探討中醫用藥規律具有一定的意義。楊聰賓等[11]通過名老中醫學術思想挖掘平臺,總結出張燕萍教授診斷支氣管擴張的主要證型為痰熱郁肺證,治法為清熱化痰,主用千金葦莖湯為基礎方進行加減,常用冬瓜子、蘆根、魚腥草、桔梗等,遵循“通利肺道”“火郁發之”之意。李曉輝等[12]應用中醫傳承輔助平臺進行藥物及藥物關聯分析,總結出劉愛東教授在胸痹的治療中多采用四物湯及四君子湯化裁,補中有行,通中寓補,借助數據挖掘的方法客觀展現了劉教授的用藥經驗,為優化胸痹的臨床診療提供了依據,具有一定的指導意義。
5 數據挖掘在治法研究中的應用
文獻挖掘在研究疾病的治療方面較為完善成熟,包括該疾病的主要病因病機、證候特點、治法治則、方藥分析等。以疾病為核心,以數據挖掘為手段,總結出此類疾病的常見用藥及方劑,為臨床治療該疾病提供相對客觀、規范的理論指導。在中國古代常無西醫病名,主要以西醫的臨床癥狀命名,此可以劃分為西醫病名的中醫文獻研究,或者某一中醫病名的文獻研究。
潘家文等[13]通過對近十年中藥治療老年肺炎的文獻研究發現,常用藥為甘草、茯苓、苦杏仁、桔梗等,主要歸經為肺、脾、胃經,以健脾益胃、清熱化痰、止咳平喘為主。王莉新等[14]運用關聯算法,探討肺癌與用藥規律之間的聯系,發現治療肺癌的用藥主要以補益藥為主,其中關聯較強的藥物為人參與甘草、人參與茯苓、人參與白術,提示這些藥對可優先應用于臨床,為臨床治療肺癌的方藥選擇提供了參考。張浩洋等[15]通過頻數、因子、聚類、關聯等分析方法得出,肺間質疾病的主要治療以扶正祛邪為主,運用溫陽益氣、滋陰養血以補虛,清熱、化痰、止咳、解表以瀉實,常用甘草、茯苓、桔梗、人參,其中茯苓與人參、桔梗與甘草關聯性強,對臨床應用具有指導作用。張稚鯤等[16]運用Apriori算法,對比古今文獻治療肺系疾病的用藥特點,得出古今用藥的相似在于多用清熱藥,并配伍解表、化痰、理氣藥,不同在于古代更多使用辛散之藥,有散邪治疫的特點,而現代更注重清瀉熱邪為主。楊勤軍等[17]使用中醫傳承輔助平臺系統,得出咳嗽以風、痰、寒、熱所致的急性咳嗽最為常見,常用中成藥為丸、散劑,常用藥為陳皮、茯苓、甘草。譚麗博等[18]運用聚類分析及關聯規則分析,總結中醫藥治療失眠的用藥規律,發現中藥治失眠以補益安神為主,兼以清熱、祛濕、活血、理氣等為主要治法。多以酸棗仁作為君藥,甘草作為使藥,常用藥物組合有遠志配伍酸棗仁、夜交藤配伍酸棗仁、茯神配伍酸棗仁、遠志聯合甘草配伍酸棗仁等,并得出中醫藥治療失眠多從心、肝論治。該研究借助數據挖掘的方法,得以對中醫藥治療失眠的相關文獻進行較為全面的分析,因而其研究結果較為可信,對臨床實踐及新藥物的研發具有一定的參考價值。孫遠等[19]應用文獻數據挖掘方法,分析明清醫家在癭病治療中的用藥規律,發現其治療以祛邪為主,且邪正兼顧,多用理氣、化痰、散瘀之品,且多用含碘豐富的藥物,如海藻、昆布、海蛤殼等,對現代臨床治療甲狀腺疾病具有重要指導意義。阮哲等[20]通過中醫傳承輔助平臺,分析中藥外用治療痛風性關節炎的用藥規律,得出中藥外用治療痛風性關節炎以祛邪為主,較少采用扶正、補虛等藥物,以清熱除濕,活血止痛為主要治法,并借助數據挖掘技術得到了4條新的處方,為日后的臨床實踐及科研提供了新的思路。
6 數據挖掘在古典醫籍研究中的應用
從古至今,對古代醫家的用藥分析及學術思想多為主觀分析,現通過數據挖掘技術可以將學術經驗的傳承更加標準化、客觀化。王炳權等[21]通過復雜系統聚類分析《濕熱病篇》的用藥規律,發現薛生白治療濕熱病以化濕藥、行氣藥為主,不忌用溫藥,其用藥核心為劉完素所創的六一散,即滑石與甘草。李付平等[22]通過采用頻次分析、關聯規則和復雜聚類分析對《脾胃論》的研究,發現李東垣的用藥核心以補中益氣湯為核心,其藥物配伍為甘溫益氣藥和辛散升陽藥,常用藥物為炙甘草、陳皮、升麻、人參、當歸、白術、黃芪、柴胡等,并根據無監督層次聚類分析結果演化出4首新的方劑。田玉君等[23]通過規則分析、關聯分析、熵層次聚類分析等數據挖掘方法分析清代葉天士《臨證指南醫案》中嘔吐病的用藥規律,總結出葉氏治療嘔吐注重溫通,長于使用辛開苦降以及甘補之法,并通過系統分析演化得到了治療嘔吐的5個新處方,這些新處方的發現拓寬了臨床診療與科學研究的思路。王曉琳等[24]整理《名醫類案》中內傷濕熱病的方藥信息,挖掘其中規律,得出《名醫類案》中治療該病證以健脾運濕為主,輔以祛風、利水、清熱,兼以和胃助運、通脈活血,為現代臨床治療內傷濕熱病證的處方用藥提供了參考。
7 數據挖掘在疾病預防研究中的應用
運用數據挖掘技術可以更加方便快捷地總結中醫學在疾病治療中的遣方用藥特點及醫家經驗,因而也便于快速研究一些新發疾病,以期為其及時預防提供參考。2019年12月以來,新型冠狀病毒肺炎疫情的迅速傳播,對人民健康造成較大威脅。
趙新等[25]收集了全國17省市的中醫藥預防方案,對其中的中藥處方進行數據挖掘,發現各地多以補虛扶正之法預防新型冠狀病毒肺炎,多從肺、脾、胃著手,并得到8個常用藥物組合及7個潛在新方。李衍達等[26]采集了2019年12月8日至2月10日各中醫專家團隊方案及相關中醫專業文獻,通過數據挖掘總結出甘草、蒼術、藿香等高頻使用藥物,以及芳香避穢、清熱瀉肺、解毒通腑等主要治法。白明等[27]則整理了中醫古籍中相似疾病的組方,通過數據挖掘總結其中規律,尋找潛在的中藥配伍規律,得到甘草與桔梗、甘草與防風、甘草與羌活等關聯度較高的藥對12個。這些研究一定程度上可以為新型冠狀病毒肺炎的預防提供思路與參考。
綜上所述,數據挖掘技術近年來取得了長足進步,已在中醫藥研究中廣泛應用,相關方法眾多,有聚類、關聯、分類分析等,這些高效的數據處理技術為中醫藥數據分析提供了更豐富的途徑與手段,在中藥、方劑、證候、治法、名家經驗、古典醫籍以及疾病預防等多方面的研究中都發揮著舉足輕重的作用,為指導臨床實踐提供了寶貴的參考。同時,數據挖掘技術在中醫藥研究中的應用尚有一定的局限。其一,數據挖掘技術的最大優勢在于發現隱藏在大量信息中的共性規律,研究結果往往與中醫普適性理論較為相近,對中醫藥個體化診療的幫助有限。其二,在醫學領域中,一些發病率不高的疾病從文獻中可以獲得的信息較少,目前的數據挖掘技術不適于此類疾病信息的分析與總結。若可以進行一定的改良,則無疑會在醫藥研究的領域發揮更為強大的作用,這些也是今后繼續探索研究的方向。
[參考文獻]
[1]? 周秀娟,富曉旭,雷遠洪,等.基于數據挖掘對中藥復方治療代謝綜合征用藥規律分析[J].遼寧中醫雜志,2019, 46(3):449-453,669.
[2]? 雷蕾,駱言,任靜,等.基于數據挖掘對中醫治療慢性腎衰竭組方規律的分析[J].中成藥,2019,41(12):3079-3082.
[3]? 張玉嬌,章新友,談榮珍,等.基于循證的中藥藥性判別數據挖掘方法評價[J].中華中醫藥雜志,2019,34(3):1223-1226.
[4]? 彭琳.基于數據挖掘的中醫藥治療效果與用藥規律關聯性分析[J].科技通,2019,35(1):77-81.
[5]? 呂建軍,郝瑞春,門九章,等.基于數據挖掘探討含“桔梗-甘草”藥對成方制劑的證治規律[J].中國藥房,2018, 29(20):2813-2816.
[6]? 鄒天駿,林江,童遠明,等.數據挖掘技術在方劑學研究中的應用[J].廣西醫學,2018,40(24):2936-2937,2948.
[7]? 李廷保,尚菁,張花治,等.基于數據挖掘的敦煌醫方用藥規律研究[J].中國中醫藥信息雜志,2019,26(2):102-105.
[8]? 王海燕.名老中醫經驗數據挖掘文獻計量分析[J].世界中西醫結合雜志,2019,14(2):166-170.
[9]? 王文龍,向慶東,齊鳳軍,等.基于數據挖掘探索梅國強教授治療肺系疾病用藥規律[J].中國臨床研究,2019,32(2):250-255,259.
[10]? 張維駿,劉潤蘭,崔長虹,等.國醫大師路志正教授治療肺癌專方研究之數據挖掘[J].世界中西醫結合雜志,2019,14(1):9-12.
[11]? 楊聰賓,樊茂蓉,張燕萍,等.基于數據挖掘方法總結張燕萍教授治療支氣管擴張癥用藥經驗[J].河北中醫,2018,40(11):1609-1613.
[12]? 李曉輝,劉迎輝,辛宇嚀,等.基于數據挖掘技術對劉愛東教授治療胸痹用藥規律分析[J].吉林中醫藥,2020, 40(1):117-120.
[13]? 潘家文,劉瓊,鄭升鵬,等.基于數據挖掘的老年肺炎用藥規律研究[J].山東中醫雜志,2019,38(2):135-139.
[14]? 王莉新,李明,吳文斌.基于數據挖掘方法研究中醫治療肺癌方藥的用藥規律[J].數理醫藥學雜志,2018,31(10):1423-1426.
[15]? 張浩洋,龐立健,劉創,等.基于數據挖掘中藥復方治療肺間質疾病用藥規律探究[J].遼寧中醫藥大學學報,2018, 20(7):109-113.
[16]? 張稚鯤,王若堯,陳仁壽.古今肺系疫病方配伍特點對比研究[J].中醫藥息,2018,35(4):73-76.
[17]? 楊勤軍,李澤庚,胡健,等.基于數據挖掘的新安醫家治療咳嗽用藥規律及特色研究[J].中國中醫基礎醫學雜志,2018,24(6):828-831.
[18]? 譚麗博,劉燕,吳鳳芝,等.基于文獻數據探討中藥治療失眠的用藥規律[J].現代中醫臨床,2020,27(1):35-42.
[19]? 孫遠,徐祿玉,黃桃,等.基于數據挖掘分析明清醫家治療癭病用藥規律[J].河南中醫,2020,40(2):258-261.
[20]? 阮哲,覃文儀,劉明嶺,等.基于數據挖掘的治療痛風性關節炎外用方劑組方規律研究[J].中國中醫急癥,2019, 28(12):2088-2090,2121.
[21]? 王炳權,劉春柳.基于數據挖掘的《濕熱病篇》組方用藥規律研究[J].亞太傳統醫藥,2019,15(1):164-166.
[22]? 李付平,康立英,楊貴真,等.基于數據挖掘分析《脾胃論》用藥組方規律[J].廣州中醫藥大學學報,2019,36(2):288-291.
[23]? 田玉君,范發才.基于數據挖掘的《臨證指南醫案》嘔吐病用藥規律研究[J].光明中醫,2020,35(2):183-185.
[24]? 王曉琳,呼興華,禹思宏,等.基于數據挖掘的《名醫類案》內傷濕熱病證組方用藥規律[J].陜西中醫,2020,41(3):394-397.
[25]? 趙新,張林旭,路雪婧.基于數據挖掘初探預防新型冠狀病毒肺炎中醫方藥[J/OL].中草藥:1-6[2020-03-11].http://kns.cnki.net/kcms/detail/12.1108.R.20200228.1909. 004.html.
[26]? 李衍達,趙振宇,孫嘉惠.基于數據挖掘的新型冠狀病毒肺炎用藥規律研究[J/OL].中國現代中藥:1-16[2020-03-11].https://doi.org/10.13313/j.issn.1673-4890.202002 18007.
[27]? 白明,李楊波,苗明三.基于古籍數據挖掘的中醫防治疫病用藥規律分析[J/OL].中藥藥理與臨床:1-15[2020-03-11].https://doi.org/10.13412/j.cnki.zyyl.20200228.001.
(收稿日期:2020-03-19? 本文編輯:李亞聰)