馬寧,郝秀霞,邢俊鳳,郭靜霞
(內蒙古科技大學包頭醫學院計算機科學與技術學院,內蒙古 包頭 014040)
分析方劑中的用藥配伍規律,對揭示中醫理論體系、樹立科學配伍標準、開發復方用藥等具有重要的作用。當前常用的方劑用藥規律分析方法包括基于出現頻率的統計學方法、關聯規則方法和基于復雜網絡的相關聚類方法,但這些方法大部分主要依賴于一個或多個藥物組在方劑中出現的頻次進行分析,結果有一定的不足之處。第一,方劑中如甘草、大棗等藥物作為佐使藥經常出現,因此頻率較高,在挖掘結果中經常出現,但佐使藥對于某一病癥的作用相對較弱,這對結果分析造成了一定的干擾。第二,基于頻次的分析方法忽略了藥物內在及其之間的脈絡關系,根據方劑學理論,藥物性味、歸經、相互間七情合和關系以及方劑中君臣佐使作用在治療中都有著重要的影響,而基于頻次的分析方法鮮少將這些屬性和方法進行有效結合,發現過程相對膚淺和偏重表層。第三,關聯規則挖掘結果只局限于方劑內部,無法向方劑外部延伸。
近年來,憑借良好的擴展性和內在發掘機制,復雜網絡分析方法已成為用藥配伍規律分析的有效手段[1]。同時該方法也在持續改進,特別是在實際應用角度,如周偉等[2]從藥物與病癥關系角度提出藥物效用度的概念,并進行組網和核心藥物配伍規律挖掘;梁力偉等[3]定義藥物節點影響力進行核心藥物社區的發現。這些改進使得復雜網絡分析方法在應用效果和針對性上有了很大的提升。此外,不斷有研究者嘗試將藥物的相關屬性與復雜網絡相結合進行挖掘,旨在加強挖掘結果的內涵和潛在關系。李茹等[4]以“性味”“歸經”“功效”等屬性作為屬性節點并納入到復雜網絡中進行用藥規律的挖掘;何菊等[5]將“性味”“歸經”“功效”整合為屬性向量來設置屬性的相似度從而應用到社團發現過程當中。本文基于藥物的各類屬性特點,通過建立多維復雜網絡模型,將藥物的性味、歸經、功效等部署在不同的維度空間,通過綜合計算不同維度空間中藥物相似關聯關系,進而實現藥物配伍規律的發掘。
傳統的復雜網絡模型是以實體為節點、實體間聯系為邊建立的二維拓撲網絡結構,但在現實世界中很多網絡關系不僅局限在二維空間下,例如人際關系網絡在不同時間維度下是不一致的,交通運輸網絡在運輸方式上又可劃分為海運、空運和陸運等多個維度,多維度的出現對于最終計算結果有著重要的影響[6]。由于中醫用藥不僅在方劑內部存在聯系,藥物之間在性味、歸經、功效等方面也普遍存在共性和聯系,為有效獲取這些關系,加強中藥配伍規律的挖掘深度和潛在聯系,將傳統以藥物作為節點的中藥復雜網絡模型擴展到多維空間,以藥物間功效、性味、歸經關系作為擴展維度空間,建立中醫方劑用藥多維復雜網絡模型。見圖1。
1.1.1 建立藥物基空間
該空間以方劑中藥物作為節點,如果藥物在同一方劑中出現,則兩藥物之間建立連邊構建“藥物”復雜網絡模型(如圖1實心節點及連邊),將該網絡模型定義為基空間,因為其他維度空間中節點聯系需要依賴于該空間上的藥物節點,同時復雜網絡模型社團發現的過程也是基于該網絡模型來實現。
由于方劑中部分藥物出現次數過低,對于結果證明的說服力不強,同時為了降低網絡的復雜度,如果節點出現次數小于3 則刪除該節點及它與其他節點的連邊。此外,為體現方劑中核心藥物的重要性,使得結果圍繞核心藥物有效聚集,采用文獻[7]中對應的思想,以方劑中藥物君臣佐使的作用,來區分藥物重要程度,即構建方劑子網。以方劑中藥物作為節點,如果藥物為君臣藥,則與其他藥物均建立連邊,如果兩藥物為佐使藥,則節點之間不建立連邊。例如一首方劑中有4 味藥物,作用分別是君臣佐使,則其建立的方劑子網如圖2所示,可以明顯看出方劑中核心藥物(君臣藥)節點的度要大于非核心藥物(佐使藥)節點的度。
定義方劑中藥物數量為N,第i 味藥物的度為di,則該藥物的權重wi可如下定義:

藥物基空間復雜網絡中節點的核心度值可定義該藥物在所有出現的方劑子網中權重的和,如下公式所示:

1.1.2 建立“性味”“歸經”“功效”等屬性維度空間
在構建藥物屬性維度空間之前需要對“性味”“歸經”“功效”等屬性進行規范和分類,這里采用文獻[8]對應的方法進行標準化和分類過程。見表1~表3,“性味”屬性可按四氣五味分為溫、熱、寒、涼等21 類,“歸經”屬性可分為肝、肺、心、脾等14 類,功效可在歸納整理的基礎上分為“止痛”“清熱”“祛風”等255類。

表1 性味分類表

表2 歸經分類表

表3 功效分類表
以“歸經”維度空間建立過程為例,按照歸經類別在該空間中建立歸經節點(如圖1所示,左側平面代表“歸經”維度空間,該平面上空心節點代表歸經節點),屬性維度空間中節點之間不需要建立邊連接關系,因此在各屬性空間中均是以獨立節點的形式存在,“性味”“功效”空間的建立過程同理,這里不再詳細敘述。
1.1.3 建立基空間藥物節點與各屬性維度空間的關系
確定藥物與各維度空間中分類節點的歸屬聯系,如果存在歸屬關系,則建立連邊。以“歸經”維度空間為例,將藥物與所屬歸經節點之間建立空間外部連邊(如圖1所示淺色虛線),由于一種藥物可能有多個歸經,因此藥物節點針對“歸經”空間中節點的度值≥1。“性味”“功效”等維度空間也按照相同的規則建立空間聯系。通過該方法建立起來的多維復雜網絡模型可利用節點與擴展空間所連接的相鄰節點數量來確定節點間的相近關系。
藥物節點相似度即在多維復雜網絡中藥物節點對之間的相似程度,該相似度依賴于藥物在不同屬性維度之間的關聯性,以節點對之間在某一維度的相鄰節點為計算依據。在中藥復雜網絡中,每個藥物之間在“歸經”“性味”“功效”等屬性方面有可能存在共同點,即兩個節點共同鄰居多,則相似度高,反之則低。采用Jaccard 相似度方法來計算節點之間的相似度,如公式(3)所示,其中u∩v代表維度空間k上與藥物節點u和v都相連的節點個數,u∪v代表維度空間k上與藥物節點u或v相連的節點個數和,由該公式可以得出若藥物u和v在某一屬性維度空間上分類完全相同,則相似度值達到最大值1,若完全不同則相似度值為0。

進而可定義多維網絡空間內藥物節點相似度,這里采用文獻[9]中簡單疊加模型,即將所有一維網絡相似度進行簡單相加求和得到多維網絡節點相似度,其相似度模型如公式(4)所示,其中n代表屬性維度空間的個數。

由于一種藥物有可能出現在多個組合結果當中,因此采用重疊社團發現算法來挖掘中藥配伍規律,常用的重疊社團發現算法包括派系過濾算法、標簽傳遞算法和最大適應度算法等。本文選擇穩定性相對較高,同時空間和時間占用率相對較低的最大適應度算法FLM(fit local fitness)來進行社團發現。FLM 是一種貪心算法,以期望模塊度最大來完成社團的組合過程,根據中藥配伍的思想,藥物組合應當依賴于藥物之間的連接緊密度關系以及藥物在各屬性上的共性,這里定義社團局部密度函數如下:

|ε|表示社團C內部連邊的個數,|C|表示社團C內部節點個數,若C 當中n個節點均兩兩相連,則ε 的值為n(n-1)/2,δ(C)將達到最大值1。
定義社團藥物屬性共性函數如下:

其中Sim(u,v)表示社團C當中任意兩節點相似度值,如公式(4)定義。因此可定義如下的適應度函數f(C),其中對γ(C)取對數是為了抑制該值過快增長,導致權重過大。

定義在當前社團加入新節點j后,適應度函數的差值△f(C+j)如下,即加入新節點后適應度函數與加入新節點之前適應度函數的差值。

整個算法的具體計算過程見圖3。

圖3 整個算法的具體計算過程
搜集《中藥方劑大辭典》中關于治療小兒脾疳的方劑用藥數據信息共計131 首,包含藥物151 種,對相關數據進行整理與規范,包括統一名稱,明確藥用、性味、歸經、功效的分類,在此基礎上構建小兒脾疳方劑用藥的知識數據庫。
按照“1.1”項中根據藥物作用確定的治療小兒脾疳的方劑核心藥物度值≥15 的核心藥物共計24 個,見表4。

表4 小兒脾疳核心藥物信息表
建立“藥物”基空間復雜網絡結構圖,同時刪除小于2的邊及獨立的藥物節點,最終形成的復雜網絡模型共包含96個藥物節點,758條邊,平均度值7.34。見圖4。

圖4 “藥物”基空間復雜網絡結構圖
其他維度空間的網絡結構以矩陣形式呈現和保存,其中每一行代表一種藥物,每一列代表一類歸經,如果藥物i歸屬于歸經j,則對應矩陣中第i行第j列的值Cij=1,否則Cij=0。圖5為“歸經”維度空間的矩陣存儲結構,該網絡空間中共包含藥物96個,歸經13類,故對應矩陣C性味為一個96×13 的關系矩陣,同理可建立“性味”“功效”的矩陣存儲結構。

圖5 “歸經”維度空間的矩陣存儲結構圖
基于本文構建的方劑多維復雜網絡模型,利用Java 語言自編程實現本文提出的社團發現算法,圍繞表4確定的核心藥物節點產生的計算。見表5。

表5 復雜網絡社團發現方法挖掘結果統計
脾疳是嬰幼兒較常見的疾病,尤其是1~5 歲兒童最常見,多因喂養不合理、生病用藥過傷、蟲積為患等導致脾胃受損而引起。臨床表現為小兒面黃肌瘦、困倦懶言、食少納呆、挑食、食后腹脹、四肢無力、少氣自汗、大便時干時稀等癥狀,與西醫所謂小兒慢性營養不良癥相似[10]。中醫學認為本病多因脾胃虛弱,乳食過度,積滯不消,蘊結生熱而致[11]。通過表4數據結果可知,黃連、使君子、木香、陳皮、胡黃連、蘆薈、神曲、檳榔等是出現頻率較高的藥物,其中黃連、胡黃連等清熱降燥,使君子、蘆薈等殺蟲療疳,神曲、山楂等消食化積,陳皮、木香等行氣化滯,通過表中數據可分析得出治療小兒脾疳的藥物以清熱降燥、消積理氣、消疳殺蟲藥為主,輔以補氣、消食、解毒等藥物。
通過表5的藥物組合可以看出,其結果是圍繞一味或多味核心藥物產生的聚類結果。例如{黃連、神曲、麥芽、木香}的組合,其中黃連清熱降燥,神曲消食健脾,搭配麥芽、木香可治脘腹脹痛、消化不良,此組合可見于《痘疹傳心錄》所載治療小兒疳疾的“六味肥兒丸”方中,亦可見于《楊氏家藏方》中治療小兒疳證的“祛疳消食丸”方中。又如{木香、黃連、丁香、蕪荑}的組合,其中木香行氣止痛、健脾消食,配黃連可祛積止痛,輔以丁香散寒止痛,蕪荑驅蟲療疳,此組合可見于《醫統》中用于治療小兒脾胃受疳、面黃腹脹、多睡的“捉疳丸”方中。上述研究成果說明了本研究成果的有效性和合理性。
本研究利用方劑中藥物的作用及使用劑量設計了一種基于核心藥物度的方劑用藥規律挖掘方法,其計算結果圍繞君臣藥及劑量大的藥物產生了眾多新穎的藥物組合規律,雖然本法還存在諸多不足之處,例如缺乏與證候、性味、歸經等的有效結合,但研究結果可以為總結用藥規律,指導中藥復方開發提供一定參考。本研究方法也可作為一種新的分析中醫用藥規律的工具和手段,為揭示配伍的科學內涵和中醫臨床用藥特點提供有力的支撐。此外,本研究也有待進一步的完善,如證候、癥狀等信息也可作為藥物屬性維度納入多維復雜網絡模型當中進行構建;前期君臣佐使、性味、歸經、功效等數據的劃分需要較多的人工輔助處理,未來可建立對應的數據字典,通過計算機自動完成識別與分類;多維復雜網絡各維度空間中節點之間也可建立聯系等。