陳桂芬(福建中醫藥大學管理學院,福建 福州 350122)
周常恩(福建中醫藥大學中醫學院,福建 福州 350122)
李德森(福建中醫藥大學藥學院,福建 福州 350122)
《千金方》是中國唐朝孫思邈的臨床醫學著作,記載了大量的中醫養生方劑。作為中國最早臨床醫學百科全書,擁有豐富的中藥信息資源,一直為中醫界所推崇。雖然有學者對《千金方》養生規律進行研究,但目前還沒有利用現代信息技術篩選整理養生方劑的成果報道。數據挖掘是近些年隨著數據庫和人工智能發展起來的一門新興技術,是從大量數據中發現有效的、新穎的、潛在有用并且最終可理解的知識的過程。通過篩選整理養生方劑、構建數據庫、運用數據挖掘方法,可以發現《千金方》中養生方劑配伍規律。
本研究篩選整理《千金方》[1]中629首養生方劑,用藥總頻數達2157次,涉及中藥共300味。在此基礎上構建包含藥物、方名、主治組成等字段的方劑數據庫,分別作藥物頻數分析、用藥關聯規則和分類關聯規則挖掘等研究。本文利用數據挖掘方法從多角度探討養生方用藥規律,最后經關聯規則挖掘后給出了所發現的養生方常用藥對和藥組。
關聯規則挖掘發現大量數據中項集之間有趣的關聯或相關聯系,從大量事務記錄中發現有趣的關聯關系,幫助我們更好地分析事務。
在關聯規則中,設I=(I1,I2,…,In)是項的集合。任務相關的數據D是數據庫事務的集合,其中每個事務T是項的集合,T?I。每個事務有一個標識符,稱為TID。設A是一個項集,事務T包含A且僅當A?T。關聯規則是形如A?B的蘊含式,其中A?I,B?I,A∩B=Φ。規則A?B在事務中成立,具有支持度S為:support(A?B)=P(A∪B)。其中P(A∪B)表示A,B同時出現的概率,既為(A,B同時出現的次數)/事務的總數。包含k個項的項集稱為k—項集。支持計數supportNumber是包含項集的事務數;滿足最小支持度的項集稱為頻繁項集[2]。
Apriori算法是一種最有影響的挖掘布爾關聯規則頻繁項集的算法[3]。其核心是基于兩階段頻集思想的遞推算法。該關聯規則在分類上屬于單維、單層、布爾關聯規則。在這里,所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集。該算法的基本思想是:首先找出所有的頻集,這些項集出現的頻繁性至少和預定義的最小支持度一樣。然后由頻集產生強關聯規則,這些規則必須滿足最小支持度和最小可信度。然后使用第1步找到的頻集產生期望的規則,產生只包含集合的項的所有規則,其中每一條規則的右部只有一項,這里采用的是中規則的定義。一旦這些規則被生成,那么只有那些大于用戶給定的最小可信度的規則才被留下來。為了生成所有頻集,使用了遞歸的方法[4]。
基于方證分析的準確性,首先對《千金方》中的養生方劑進行臟腑分類,分為補肺、補脾、補心、補肝腎四類養生方劑,通過對中藥性、味進行聚類分析共篩選出具有完整組成養生方劑共629首,其中補肺方劑127首、補脾方劑177首、補心方劑119首和補肝腎方劑206首。然后對挑出的方劑進行規范化處理:依據《中國藥典》、《中藥大辭典》和《中華本草》對所選方劑藥名及功效進行處理[5-7]。629首方劑共涉及300味中藥,考察各藥物的出現頻數,刪除藥物支持度小于2%的藥物,僅對較高支持度藥物做關聯規則挖掘。其次建立補肺、補脾、補心、補肝腎四類養生方劑數據倉庫。研究中構建了方劑庫、藥物庫、主治庫等,各數據庫依其自身關聯建立相應數據鏈接,同時應用SPSS軟件進行中藥的頻數分析。
在中醫觀點中,很多癥狀的診斷之間是存在著關聯性。而在藥方的搭配上,也同樣存在著很多關聯性。以關聯規則為主要算法的數據挖掘,是分析中藥關聯性的有效方法。關聯規則(R)是形如R:A?B的規則,滿足A∩B=Φ&sup(R)≥min_sup &conf(R)≥min_conf。其中,A、B為項目(或屬性)集合;sup(R)為規則R的支持度;min_sup為最小支持度閾值;conf(R)為規則R的置信度;min_conf為最小置信度閾值[8]。規則R的支持度(support)和置信度(confidence)定義如下:

支持度和置信度是描述關聯規則關聯性的兩項重要指標,支持度反映規則的普遍性,置信度反映規則的可靠性,通常選擇支持度和置信度均較高的規則作為發現有意義的模式。

其中,“菟絲子 五味子 巴戟天”為規則前件;“肉蓯蓉”為規則后件。規則前件頻數為菟絲子、五味子、巴戟天三味中藥同時出現在206首肝腎養生方中的頻數;規則頻數指菟絲子、五味子、巴戟天、肉蓯蓉四味中藥同時出現在206首肝腎養生方中的頻數。因206首肝腎養生方中有32首方劑同時出現菟絲子、五味子、巴戟天、肉蓯蓉四味中藥,故規則(3)的支持度為0.1553;因32首同時出現菟絲子、五味子、巴戟天三味中藥的肝腎養生方中有32首方劑同時出現肉蓯蓉這味藥,故規則(3)的置信度為1。
本研究運用挖掘布爾關聯規則頻繁項集的Apriori算法建立關聯關系研究中藥配伍規律,經C++編程實現,最小支持度閾值取10%,最小置信度閾值取60%。
2.3.1 頻數分析結果 見表1~4。

表1 高頻補肺中藥

表3 高頻補心中藥

表2 高頻補脾中藥

表4 高頻補肝腎中藥
2.3.2 數據挖掘結果 見表5~8。

表5 補肺中藥配伍規則集

表6 補脾中藥配伍規則集
補肺藥中如表1所示出現頻次最高的是:溫里、益氣、收斂、養陰、止咳平喘藥,如表5所示補肺藥的規則集中出現最多的是五味子、桂心、干姜、人參配伍。如《素問·咳論篇》中提到“其寒飲食入胃,從肺脈上至于肺,則肺寒,肺寒則內外合邪,因而客之,則為肺咳”,“五臟六腑皆令人咳,非獨肺也”。從挖掘結果說明,《千金方》在補肺方劑中重視如下方面:①溫中散寒,溫肺化飲,如五味子、桂心配伍;五味子、干姜配伍;細辛、桂心、干姜、附子配伍。②益氣健脾而間接達到補肺效果,即培土生金法,體現在配伍中加入人參、茯苓、大棗、甘草、桂心;③養陰益肺,如人參、麥冬、五味子配伍。
補脾藥中如表2所示出現頻次最高的是:溫里、益氣藥,部分有清熱燥濕藥物。如表6所示補脾藥的規則集中出現最多的是附子、干姜、桂心、人參配伍,說明《千金方》注重溫陽健脾,上能溫心陽,下能補命火,中暖脾土而散寒。人參、茯苓配伍,桂心、人參配伍,人參、附子配伍,白術、干姜配伍,體現《千金方》重視益氣健脾溫中。黃連、干姜配伍,出自《傷寒論》,辛開苦降,主治因寒熱互結而致心下痞滿疼痛癥。

表7 補心中藥配伍規則集

表8 補肝腎中藥配伍規則集
補心藥中如表3所示出現頻次最高的是:溫中、益氣、養血、化痰安神藥,如表7所示補心藥的規則集中出現最多的是人參、茯苓、甘草、干姜、桂心之間配伍。心臟的主要功能是:主血脈、主神志。如《素問·靈蘭秘典論》中提到“心者,君主之官,神明出焉。”體現心臟的重要性。《千金方》中人參、茯苓、甘草、干姜、桂心、麥冬這些藥物的配伍,旨在達到溫中益氣、養血,使氣血生化有源,心的氣血充足,運行順暢,則神有所養,五臟六腑精氣皆能充盈的功效。遠志、人參配伍,益氣化痰安神,神養痰化則神志清明,心神充足則能統御精與氣。
在補肝腎藥中如表4所示出現頻次最高的是:溫陽、養陰、溫中、益氣藥。在《素問·陰陽應象大論》提到“腎生骨髓,髓生肝”。在傳統中醫理論中肝藏血,腎藏精,精血同生,肝腎同源。臨床上肝與腎虛實密切相關,相互制約,治療上多兼顧二臟。如《千金要方》指出下焦病的治療應“熱則瀉于肝,寒則補于腎”。如表8所示補肝腎的規則集中巴戟天、肉蓯蓉、菟絲子為基本配伍,體現《千金方》重視溫補肝腎。在藥物配伍中加上山茱萸既能益精,又可助陽,能增加其補益肝腎作用;加上石斛則平胃氣而補腎虛,養陰清熱;加上當歸、干地黃則補血養肝,益精填髓;加上五味子、人參、甘草則大補元氣,又有補腎寧心之功。桂心、附子、白術、人參、茯苓等配伍,重在使氣血生化有源,后天補先天。
綜合以上補肺、脾、心、肝、腎藥物,出現頻次最高的為桂心、人參、甘草和茯苓。在《神農本草經》中這四味藥均列為上品,且均能久服輕身延年,各自藥性介紹如下。牡桂(一名桂心):味辛溫,主上氣咳逆,結氣喉痹,利關節,補中益氣;人參:主補五臟,安精神,定魂魄,止驚悸,除邪氣,明目,開心益智;甘草:主五臟六腑寒熱邪氣,堅筋骨,長肌肉,倍力,金創,解毒;茯苓:主胸脅逆氣,憂恚,驚邪,恐悸,心下結痛,寒熱煩滿,咳逆,口焦舌干,利小便。這四味藥配伍重在健脾養心,補中益氣。如《素問·玉機真臟論》提到“脾脈者土也,孤臟以溉四傍者也。”體現《千金方》重視補脾土。如《素問·太陰陽明論》提到“四肢皆稟氣于胃而不得至經,必因于脾乃得稟也”。意思為五臟六腑不能得到脾的運化水液之精微充養,則人體臟腑氣血就虧虛,心、肝、肺、腎后天乏源必欠滋養而致虛損。因此,從《千金方》補五臟藥中這四味藥配伍出現的概率最高可以看出,孫氏重視補脾,脾不足,百病乃因之變化而生,補五臟應重視健脾。
基于關聯規則挖掘技術分析《千金方》中養生方劑配伍規律,揭示方劑與中藥(包括食物)交叉錯綜關聯與對應的模式性和規律性,發現中醫養生規律知識、學術思想,不僅對豐富和發展養生方劑學理論具有重要的意義,同時也為有效指導臨床遣藥組方和中藥養生新藥的研發提供重要依據。
[1]高文柱.藥王千金方[M].北京:華夏出版社,2004.
[2]Oladipupo OO,Oyelade OJ.Knowledge Discovery from Students’Result Repository:Association Rule Mining Approach[J].International Journal of Computer Science and Security,2010,4(2):199-207.
[3]Wilhelmiina H?m?l?inen.StatApriori:an efficient algorithm for searching statistically significant association rules[J].Knowledge and Information Systems,2010,23(3):373-399.
[4]Sandeep Singh Rawat,Lakshmi Rajamani.Discovering Rare Association Rules Using Probability Apriori in Grid Environments[J].Advances in Intelligent and Soft Computing,2012 ,131:527-539.
[5]中國藥典委員會.中華人民共和國藥典[M].北京:電子工業出版社,2009.
[6]江蘇新醫學院.中藥大辭典[M].上海:上海科學技術出版社,2002.
[7]國家中醫藥管理局《中華本草》編委會.中華本草[M].上海:上海科學技術出版社,1999.
[8]Somboon Anekritmongkol,ML.Kulthon KasamsanBoolean Algebra and Compression Technique for Association Rule Mining[J].Advanced Data Mining and Applications,2010,6441:150-157.