摘 要:根據證候,辨別證素,組成證名,是中醫辨證的規律與過程。中醫辨證是非線性的復雜巨系統,為解決辨證研究中診斷權值的確定這個關鍵問題,在頻數統計基礎上,實行“雙層頻權剪叉”算法,獲得了準確的辨證參數,在非線性、多變量分析上探索出了一種新的運算方式。
關鍵詞:辨證;證素;證候;數據挖掘;頻權剪叉算法
中圖分類號:R2-03文獻標識碼:A文章編號:1673-2197(2007)09-023-03
中醫辨證是非線性的復雜巨系統,對辨證的研究應該建立在數據挖掘的理念上,以證素為信息分析的核心,運用復雜系統分析方法,探索從證候確認證素的有效方法。
1 中醫辨證規律與體系
在中醫學中,“證”相對于“病”來說,是對疾病中機體整體反應狀態的階段性病理本質概括。疾病中患者的癥狀、體征等各種病理信息,中醫稱為證候;中醫辨證的目的,是為了明確病位與病性等辨證要素,簡稱證素;各證素的相互組合,可概括成完整的證名診斷。“辨證”就是根據中醫學理論,通過對證候(癥狀等)進行分析,而確定其病理本質——證素,并作出證名診斷的思維認識過程[1]。
“根據證候,辨別證素,組成證名”,既是辨證的原則、規律,也是辨證思維過程中的三個臺階、三個步驟。證候—證素—證名之間存在著極其復雜的網絡關系,構成以證素為核心的辨證體系。中醫不是依賴個別“金指標”對病情作出判斷,不是從局部處理不確定性,而是強調從整體進行分析,即從各方面綜合診察疾病中機體現階段的整體反應狀態。因此,中醫辨證是非線性的復雜巨系統。
臨床上常見的“證候”,如發熱、頭痛、心慌、盜汗、頭暈、食欲不振、小便短黃、面色晦暗、舌胖嫩、苔膩、脈弦等,約有1000個。通常確定的“證素”,如心、肺、脾、肝、腎、胃、胞宮、表、經絡等病位,寒、火熱、濕、痰、氣虛、氣滯、血瘀、陰虛等病性,約為50項。由50項證素組合成的“證名”,如脾胃氣虛證、腎陰虛證、肝膽濕熱證、肝郁脾虛證等,多達數千個。對證候、證素、證名三個層次的辨別判斷,共同構成中醫辨證體系。
2 雙層頻權剪叉算法原理
中醫辨證研究應該建立在數據挖掘的理念上,相應數理模型和算法的建立,是實現從定性描述到定量分析這一途徑的必要方法。由于中醫辨證是非線性復雜系統,現有的數據處理方法,尚不能完全反映中醫辨證的規律,尚難解決在證的多變量信息分析中諸如有效因素組合爆炸之類的問題。因此,找到一種適合要求的數據挖掘方法,對于中醫辨證的研究至關重要。
中醫臨床辨證的實踐提示,從證候辨別證素具有多維復雜性,每個癥狀對各證素判斷的貢獻度,并不是簡單的以出現頻次的多少為依據,有些證候臨床出現的頻次雖然很高,但其對證素的判斷能力并不強,與之相反,某些證候臨床發生的頻次雖然不高,但其對證素的診斷具有很強的特征性。為了避免一些變量的頻次范圍過大,另一些變量的頻次范圍過小,而形成的局部優化、判別偏移,必須將頻次轉化成權值,即根據證候的不同屬性,擬定各證候的標準化權值、各證素的標準化權值。為使每個證候納入判斷的機遇相等、每項證素納入判斷的機遇相等,因而應當是高頻次變量的權值輕、低頻次變量的權值重的原則,這就是“頻權剪叉”(如圖1所示)。據“頻權剪叉”原理,對證素所見證候的權值進行分配,將各癥狀對各證素、證型的貢獻度進行分配,形成證候標準化權值、證素標準化權值,故為“雙層”。

權值擬定的方法是:(1)從“中醫辨證數據庫”[2]中將證候、證素出現的頻次(證候總頻次、證素總頻次,各證候發生相關證素的頻次、各證素發生相關證候的頻次)進行累計;(2)按高頻變量權輕,低頻變量權重的原理,根據各證候的總頻次計算出各自的權重、根據各證素的總頻次合理分配出各自的權重;(3)將某證候在某證素中出現的頻次乘以該證候的權值、乘以該證素的權值,即為該證候對相關證素的判別系數。
3 驗證舉例
我們在所建“中醫辨證數據庫”的基礎上,采用“雙層頻權剪叉”算法,能夠提取證素、證型的特征證候,獲得中醫辨證的準確參數。
3.1 證素特征癥的提取
從“中醫辨證數據庫”中提取指定證素的證候頻次。證候頻次×證候權值×證素權值=證素的證候系數。如證素“寒”的主要證候系數及排序見表1。
采用雙層頻權剪叉算法,提取出病性證素“寒”的特征證候,與《現代中醫臨床診斷學》[3]所說“以新起惡寒,無汗,頭身、肢體、脘腹或腰部等處冷痛,得溫痛減,形體蜷臥,分泌物或排泄物清稀,舌苔白,脈緊、弦遲或伏等為主要表現者,其病性可辨屬于(實)寒。”的論述非常相似。
3.2 常見證型的特征癥提取
從“中醫辨證數據庫”中提取指定常見證型所含證素的證候頻次。證候頻次×證候權值×證素權值=指定證型主要證候系數。如心血瘀阻證主要證候系數及排序,見表2。
采用雙層頻權剪叉算法,提取出心血瘀阻證的證候特征,已將心血瘀阻證“以胸悶心悸,心痛如刺、痛引肩背內臂,唇舌紫暗,脈細澀或結代等”[3]的證候概括其中。
3.3 證候辨證權值提取
從“中醫辨證數據庫”中提取指定證候的頻次。證候頻次×證候權值×證素權值=指定證候的辨證權值。如“盜汗”辨證素的權值及排序,見表3。

3.4 辨證檢驗舉例
臨床辨證時,將所出現的證候,按照“雙層頻權剪叉”算法原理,確定各癥映射相關證素的系數;再按證素進行系數累加,系數達到及超過閾值以上的證素診斷成立。如1334號病例的辨證計算,見表4。
據上述計算,取系數80以上的證素——陽虛、陽浮,從而診斷為虛陽浮越證。虛陽浮越證在臨床上頗難辨別,而本例辨證非常準確。
4 結論
只有原始資料的豐富完整,才能從中挖掘出有意義的信息。從大量的數據中進行辨證特征的規則提取,能夠抽提出比較全面的內在規律。“中醫辨證數據庫”中的資料(癥狀、證素等),入庫時首先經過規范化處理,保證了原始資料的準確,從而為辨證參數的獲取奠定了基礎。
在中醫辨證體系的框架下,以臨床信息為對象,采用雙層頻權剪叉算法,從雜亂無章的數據中,找出了確認證素、證型的科學方法。合理度量了變量間的相關性,能明確證素、常見證的特征證候,能明確各癥狀的診斷貢獻度,建立起證候與證素、證型間的非線性映射函數,對認識證候與證素、證型間復雜的非線性關系具有重要意義。“雙層頻權剪叉算法”克服了神經網絡、貝葉斯網絡等算法的某些不足,為中醫辨證研究找到了一種簡便、準確的運算方式。
參考文獻:
[1] 海霞.朱文鋒教授談證素辨證新體系[N].中國中醫藥報,2004-04-06.
[2] 朱文鋒.證候辨證量表制定的科學性要求[J].中國中醫藥信息雜志,2005,12(8):11-13.
[3] 朱文鋒,何清湖.現代中醫臨床診斷學[M].北京:人民衛生出版社,2003.
New Information Disposal for TCM Syndrome Differentiatin
——Introduction on Algorithm of Double Levels of Frequency and Weight
Zhu Wenfeng,Huang Biqun,He Junfeng
(Hunan college of TCM,Changsha,410007,China)
Abstract: According to syndroms and signs, differentiating syndrome factor and forming syndrome type, which is the rule and process for forming the TCM syndrome differentiation. TCM syndrome differentiation is a nolinear complex giant system, in order to solve the key problem for determination on diagnose weight value of syndrome factor differentiation, based on the analysis of frequency statistics, a new algorithm of double levels of frequency and weight was applied, and the accurate syndrome differentiation parameters acquired. Therefore, based on the nonlinear and multivariate analysis, a new algorithm of calculating diagnostics for syndrome factor differentiation was established.
Key word: Syndrome differentiation; Syndrome factor; Symptoms and signs; Data research; Algorithm of double levels of frequency and weight