王 鷹 楊永超
(中國中醫科學院臨床所,北京 100700)
現有的中藥分類法多基于臨床經驗,分類依據多來自于長期的實踐或醫生個人的經驗,缺少客觀依據、統一的劃分標準和客觀指標。現代的統計學方法中的聚類分析為中藥分類客觀化等方面提供了一個新的思路和方法,筆者通過小樣本的示范性研究探索分析聚類分析方法在中藥分類方面應用的可行性,對其存在的缺陷和問題進行改進,以此來探索能夠科學、客觀地對中藥進行分類的科學方法,以便更好地指導中藥臨床應用。
1.1 中藥資料的搜集、整理和規范 選擇《中藥學》第7版中解表、瀉下、化濕藥共51味中藥及其性、味、歸經、功效等因素。中藥的性、味、歸經及功效的規范化處理,對相同或相似的功效進行合并,對于藥味單一具有的功效予以剔除。最終形成了解表、利水、化痰、散寒、和中、行氣、溫中、止咳、化濕、祛風、透疹、止痛、通鼻竅、解毒、清利頭目、利咽、疏肝、明目、平抑肝陽、清熱、升陽、止瀉、通便、殺蟲、散結、療瘡、逐水、去積、消腫、解暑、止嘔等功效。中藥藥味數需大于中藥的性、味、歸經及功效等因素的數量。
1.2 數據庫的建立 采用SPSS16.0統計軟件包進行統計,將51味中藥作為觀測變量;藥味的性、味、歸經及功效作為反映分類特征的變量。由于中藥藥性和功效的描述是文字性語言,電腦無法直接識別,故必須對其經過量化處理。各因素的量化采用二值量化和數值量化相結合的形式,具有某一特征即記為1,不具有時記為0。當藥味的這一特征顯著時記為1.5,特征比較弱則記為0.5。如熱為1,大熱為1.5(附子),溫記為0.5。破血記為活血1.5。
1.3 統計學處理 對上述數據進行聚類分析中的分層聚類,分層聚類的方法選用樣本聚類(Q型),以歐氏距離平方作為度量方法,離差平方和作為聚類方法。選擇凝聚狀態表生成聚類樹形圖表。
2.1 聚類樹形圖表 見圖1。

圖1 聚類樹形圖表
2.2 51味中藥分類 以上51味中藥分為4類。第1組:豆蔻、草豆蔻、砂仁、厚樸、草果、蒼術、藿香、佩蘭、香薷;第2組:羌活、藁本、防風、白芷、細辛、紫蘇、生姜、蔥白、胡荽、辛夷、淡豆豉、蒼耳子、鵝不食草、荊芥、檉柳、麻黃、浮萍、桂枝;第3組:桑葉、菊花、木賊、蟬蛻、蔓荊子、柴胡、薄荷、升麻、葛根、牛蒡子;第4組:甘遂、商陸、京大戟、芫花、巴豆、千金子、大黃、芒硝、火麻仁、郁李仁、番瀉葉、蘆薈、牽牛子、松子仁。第1組為化濕藥,所有化濕藥都聚為一類;第2組大部分為發散風寒藥,其中只有浮萍和淡豆豉為發散風熱藥;第3組為發散風熱藥;第4組為瀉下藥。
從聚類樹形圖中可以直觀地看到中藥藥味的聚類情況和相似程度:聚類樹形圖可以顯示聚類過程中每一步合并及被合并的兩項之間的距離以及觀測量或變量加入到一類的類水平,因此可以根據此圖跟蹤聚類過程;由于接近的兩類先聚為一類,因此可以通過聚類過程仔細地查看哪些觀測量更接近[1]。從聚類樹形圖中可以看出,發散風寒藥和發散風熱藥被分為兩類,并且發散風寒藥在聚類樹形圖中和第一類化濕藥隨后又歸為一類,表明其更接近。這是由于兩類藥味性味都偏于辛溫而使其關系較近。在其后的分類中第2組發散風寒藥中還包含了淡豆豉、浮萍這兩味發散風熱藥,這是由于我們采用的凝聚狀態的聚類樹形圖是一種自底向上的策略。首先將每個對象作為一個簇,然后合并這些原子簇為越來越大的簇,直到所有的對象都在一個簇中[2]。淡豆豉和辛夷、胡荽、蔥白的歸經極其相似,都歸肺、胃經,所以其先歸為一簇。浮萍與麻黃利水消腫的功效相同,先聚為一簇,又由這一類共同的特性與發散風寒藥共聚為一簇。
從以上結果看,使用聚類分析方法可以對不同類別中藥進行簡單的劃分,其結果和傳統分類方法大體一致,比如上文中的化濕藥、瀉下藥和大部分的發散風寒和發散風熱藥最先聚為一類。但是也有一些和傳統分類方法不同的結論,例如樹形聚類圖中解表藥中的發散風寒藥和化濕藥的關系比其與發散風熱藥的關系更近。又例如淡豆豉和浮萍在分類中優先和發散風寒藥聚為一類的情況。
這種情況可能是受藥味本身因素的影響或者是我們在因素的處理上出現了技術或人為的偏差,這需要我們仔細分析后才能得出結論。當我們排除了技術和人為因素的偏差,數據所得結果與傳統結論的不同正是我們需要思考和進一步研究的方向。
[1]李茵,楊曉敏.活血化瘀藥的模糊聚類分析[J].中國藥房,2008,19(9):715-716.
[2]趙丹丹,于景偉.聚類分析方法研究及在中醫藥領域的應用探索[J].電腦知識與技術,2007,20(9):712-713.