郭志忠 魏 濱 孫繼佳,3 王文海 蘇式兵
(1 上海中醫藥大學中醫復雜系統研究中心,上海,201203; 2 河南中醫學院第二附屬醫院腫瘤內科,鄭州,410100; 3 上海中醫藥大學中藥學院數理教研室,上海,201203; 4 上海中醫藥大學附屬第七人民醫院腫瘤科,上海,200137)
?
基于信息熵的乙肝后肝硬化證素提取及病機分析
郭志忠1,2魏 濱1孫繼佳1,3王文海4蘇式兵1
(1 上海中醫藥大學中醫復雜系統研究中心,上海,201203; 2 河南中醫學院第二附屬醫院腫瘤內科,鄭州,410100; 3 上海中醫藥大學中藥學院數理教研室,上海,201203; 4 上海中醫藥大學附屬第七人民醫院腫瘤科,上海,200137)
目的:提取乙肝后肝硬化證候要素(證素)并分析其組成及分布規律,探討肝硬化的病機特點。方法:收集294例病毒性乙型肝炎(乙肝)后肝硬化患者的四診資料,采用基于信息熵的復雜系統劃分方法(信息熵法)提取證候要素(證素),確定癥狀貢獻度,并通過診斷閾值,分析乙肝后肝硬化證素組成及分布規律。結果:乙肝后肝硬化患者存在著脾虛、腎氣虛、肝陰虛、痰濕、氣滯、肝郁、濕熱7個主要證素,并有1個至多個證素存在,其中脾虛、氣滯、濕熱出現頻率較高。結論:信息熵法可以用于乙肝后肝硬化證候要素的提取。乙肝后肝硬化的病機復雜,其中脾虛、氣滯、濕熱可能是其主要的病機因素。
證素;辨證;信息熵;病機;乙肝后肝硬化
證候是中醫對疾病認識、臨床診療和療效評價的核心基礎[1],現代中醫臨床實踐表明,在“病證結合、辨證施治”的理論指導下,中醫藥治療慢性肝病等復雜難治性疾病具有明顯的特色優勢[2]。然而,中醫證候是一個非線性的復雜系統,證候研究需要合適于復雜系統的研究方法。以往的研究[3-4]提出,在闡明中醫辨證規律和原理的基礎上,構建以證候要素(證素)為核心的辨證新體系,是完善中醫辨證方法、提高中醫辨證水平的有效途徑。因此,本研究通過運用基于信息熵的復雜系統劃分方法[5-6](簡稱信息熵法),采集并分析慢性病毒性乙型肝炎(乙肝)后肝硬化的臨床癥候信息,提取證素,并分析證素的組合與分布規律,探討其病機特點。
1.1 臨床資料 全部病例來源于上海市傳染病醫院、上海中醫藥大學附屬曙光醫院及龍華醫院、普陀區中心醫院的住院部及門診部。將2002—2006年收集的臨床表征信息和實驗室檢查數據等臨床資料完整的294例乙肝后肝硬化患者作為研究對象。
1.2 中醫四診信息的采集 根據調查要求,制定“乙肝后肝硬化患者中醫四診信息調查表”,信息采集內容包括臨床癥狀、體征等資料,包括神疲乏力、畏寒肢冷、盜汗、自汗、五心煩熱、皮膚癢、抑郁、急躁易怒、多夢寐差、視物模糊、兩目干澀、耳鳴、口干苦、口臭、脘脹腹脹、兩脅不適、惡心嘔吐、泛酸、噯氣、頭重、目眩、尿少、夜尿多、便秘、便溏、齒齦衄、鼻衄、肌衄、納谷不馨、肢體困重、腰膝酸軟、腹痛、脘痛、脅脹痛、下肢水腫、身黃、目黃、尿黃、蜘蛛痣、朱砂掌、面萎黃、面晦暗、舌色淡白、舌色淡紅、舌色紅、舌色絳、舌色紫暗、舌色瘀斑、舌色暗紅、舌苔薄白、苔白厚膩、苔白薄膩、苔薄黃、苔黃厚、苔薄黃膩、苔黃厚膩、苔質花剝、齒痕、脾大、脈沉、脈儒、脈數、脈滑、脈弦、脈細。
1.3 數據的處理與分析
1.3.1 癥狀術語的規范化與數據的錄入 參照《常見癥狀中醫鑒別診療學》的癥狀標準術語進行規范化。由專人負責采集相關資料和四診信息,將所有的數據輸入電腦,采用Access數據管理,建立乙肝后肝硬化中醫四診信息數據庫,將輸入的數據逐項核對無誤后,用Matlab工程軟件進行分析處理。
1.3.2 變量的處理 將收集癥狀、體征、舌象、脈象設為自變量矩陣X,癥狀分4級賦值量化,無癥狀者為0,有癥狀者根據輕、中、重賦予1、2、3分。體征、舌象、脈象有者為1分,無者0分。

1.3.4 診斷閾值的建立 我們用癥狀貢獻度分值進行癥狀的賦分,并計算各證型中癥狀總積分,以專家辨證作為狀態變量(由2位副主任或主任中醫師一致性診斷確定),證素癥狀得分作為檢驗變量,將數據輸入Matlab軟件,利用診斷性試驗受試者工作特征曲線建立各證素診斷閾值。診斷閾值(限定值)被設定為0.13。
1.3.5 統計學方法 根據診斷閾值對294例乙肝后肝硬化患者的四診信息實施證素辨證,并且對證候要素進行描述性統計分析(統計軟件SPSS 15.0)。
2.1 證素提取結果 通過對經過量化的294例肝炎后肝硬化病例中的65個癥狀進行信息熵計算,提取出證素相關的癥狀熵值矩陣見表1。
從無監督的原始癥狀關聯度分析來提取乙肝后肝硬化證素,發現乙肝后肝硬化存在肝郁、氣滯、濕熱、痰濕、脾虛、肝陰虛、腎氣虛7個主要證素。根據熵值所提取出乙肝后肝硬化證素及其閾值見表2。
2.2 乙肝后肝硬化證素組合與分布頻率 提取的證素在乙肝后肝硬化患者中的組合與分布頻率見表3。其中,294例乙肝后肝硬化患者中脾虛、濕熱、氣滯為最多,分別為244例(83%)、189例(64.3%)、177例(60.2%),而腎氣虛95例(32.3%)、肝郁87例(29.6%)、肝陰虛74例(25.2%)、痰濕71例(24.27%),這4種證素所占比例較為相近。
如表3所示,乙肝后肝硬化可出現單一證素,也可表現為2個、3個或4個證素,最多可見7個證素并存。其中單個證素45例(15.3%),2個證素52例(17.7%),3個證素64例(21.8%),4個證素41例(14%),5個證素31例(10.5%),6個證素23例(7.8%),7個證素20例(6.8%),無法辯別證素的有18例(6.1%)。

表1 證素相關癥狀的熵值上三角相似矩陣
注:限定值≥0.13;“-”表示小于限定值。

表2 采用信息熵方法提取的證素及其熵值
注:限定值≥0.13。

表3 294例乙肝后肝硬化患者的證素分布
辨證論治又稱辨證論施治,是中醫認識疾病和治療疾病的根本原則,辨證論治就是根據收集的四診信息,辨別證候,并針對其證候,確定治療方法的過程。只有在明確證候才能有效的論治,準確的辨證是施治的前提條件。上個世紀80年代,朱文峰等[3-4]提出了以證素為核心的辨證體系。證素是通過辨識癥狀、體征等臨床四診信息,對疾病的病因、性質、部位以及邪正之間的關系等的概括及判斷。證素是辨證的基本診斷單元,臨床所作的具體證名診斷都是由證素相互組合而構成的。因此,證素是辨證的核心。把握每一證素的臨床表現及其證候屬性,認識各證候對相關證素的診斷貢獻度,是準確辨證的重要環節[7]。以證素辨別為核心,構建新的中醫辨證體系,闡明中醫辨證的規律,不僅能夠促進中醫證候的研究,而且可以為中醫臨床辨證提供簡便易行的方法,符合中醫臨床的需要。
“熵”是指體系混亂的程度又稱混沌度,是系統內部無序結構的總量,被廣泛用于熱物理學、信息論、控制論、概率論、數論、天體物理、生命科學等領域的復雜系統研究和應用。1856年由德國物理學家克勞修斯首次提出,用來表示任何一種能量在空間中分布的均勻程度。1948年香農在《通信的數學原理》中,把通信過程中信息源的信號不確定性稱為信息熵,將熵的概念引入了信息論。信息熵法是信息論中熵方法在非線性相關模式識別領域的具體應用[5]。
前期的中醫證候研究發現,與聚類分析比較,信息熵法可以按照數據內在關聯進行自主聚類,能夠無監督地處理來源于中醫四診信息的多變量、多層次復雜數據,對于提取證素相關癥狀,分析其癥狀間的非線性關系有重要應用價值[8]。孫繼佳等[9-10]采用信息熵方法研究中醫證候與季節之間的關聯,同時利用熵權來確定評價指標的權重,從而減少了評價中的主觀因素。賈振華等[11]采用信息熵對冠心病心絞痛證候診斷良好標準進行了研究。王天芳等[12]通過運用信息熵關聯度系數分析方法對1 787例抑郁癥、慢性乙型肝炎、慢性腎功能衰竭患者的37個四診癥數據進行分析,獲取的一些癥狀組合可為中醫常見證候及證候要素的研究提供依據。唐仕歡等提出了用熵的理論方法研究證候、方劑的相關性(證-熵-方)。余江維等提出了用術語頻率-逆文檔頻率(TF-IDF)相對熵作為證候量化的表示方法,顯示了一個癥狀在腎陽虛證、肝氣郁結證、脾氣虛證和肝脾不調證中出現的頻率越高,則區分該證候方面的能力越強,反之在所有證候中出現的范圍越廣,它區分某證候的能力就越低。余學杰等[13]使用信息熵算法建立決策樹的工具,進行了專家辨證與證候的規律知識有效的獲取。
在本研究中,我們運用信息熵法提取294例乙肝后肝硬化患者的證候要素,研究結果發現,在單一證候要素中,脾虛證最為常見,為28例,占62.2%,其他證素分布無明顯差別,說明在乙肝后肝硬化早期,患者脾虛是其主要病機特點,現代醫學也標明了在早期乙肝后肝硬化患者中,免疫功能低下是其主要矛盾。在具有2個證素中的患者中,脾虛患者為44例,占84.6%,而濕熱、氣滯也分別達到了28例,占51.9%和20例,占38.5%,提示我們在臨床上患者在脾虛的基礎上,往往較多合并濕熱、氣滯,從而出現虛實夾雜的病機特點。
隨著病程日久,患者兼有證素增加,患者肝陰虛和腎氣虛明顯增加,說明隨著病程延長及病情復雜程度的加重,所謂久病則虛。乙肝后肝硬化存在氣滯(郁)生熱化火,濕熱傷陰,脾氣虧虛日久導致腎氣虧虛的病機轉變。由此可見,乙肝后肝硬化病機特點屬本虛標實,在疾病早期是以脾氣虛為主要表現,中期則在脾虛基礎上出現氣滯、濕熱等虛中夾實的特點,而疾病后期在上述病機特點上可出現肝陰虛、脾腎虧虛等虛實錯雜的病理特點。
然而,由于樣本量的偏少、采集臨床癥候信息方案設計的不足以及研究方法的局限性導致一些很有希望提取的證素在研究中未能顯現出來。例如,肝火證素,我們發現便秘與兩目干澀(0.11)、口干苦(0.10)、五心煩熱(0.09)有較強的關聯,但是未能達到診斷閾值,我們推測可能與樣本量偏小、數據失真有關;又如,血瘀證素,舌色紫暗與脅脹痛、五心煩熱、肌衄有較強的關聯度,但是也未能達到診斷閾值,我們推測在早期課題設計中,癥狀收集僅有脘痛、腹痛、脅脹痛,從而導致血瘀的主要癥狀脅刺痛固定不移的信息部分散埋在上述癥狀之中,至使信息不易被挖掘出來。因此,如何依據中醫思維的特點,把握中醫癥候信息的采集質量,是探討證素及證候演變規律的前提和保證。而且,研究中還有18例未提取出合適的證素,提示我們基于信息熵的復雜系統劃分方法在證素提取使用中的局限性。
本研究表明基于信息熵的復雜系統劃分方法能夠用于乙肝后肝硬化患者的證素提取,且有可能推廣應用于其他疾病的中醫臨床辨證。乙肝后肝硬化的病機復雜,其中脾虛、氣滯、濕熱可能是其主要的病機因素。隨著中醫辨證研究方法探索的不斷深入,科研設計的不斷完善,并通過開展多中心、大樣本的臨床研究,我們將進一步證明中醫辨證的多維性、復雜性及科學性。
[1]Su SB,Lu A,Li S,et al.Evidence-based ZHENG:a traditional Chinese medicine Syndrome[J].Evid Based Complement Alternat Med,2012:246538.
[2]Song YN,Sun JJ,Lu YY,et al.Therapeutic effect of Fuzheng-Huayu tablet based traditional Chinese medicine syndrome differentiation on hepatitis B caused cirrhosis[J].Evid Based Complement Alternat Med,2013:709305.
[3]朱文鋒.創立以證素為核心的辨證新體系[J].湖南中醫學院學報,2004,24(6):38.
[4]朱文鋒.構建“證素辨證”新體系的意義[J].浙江中醫藥大學學報,2006,30(2):135.
[5]西廣成.復雜系統分劃的熵方法[J].自動化學報,1987,13(3):216-220.
[6]孫占全,西廣成,易建強,等.基于熵的廣義指標建立方法在中醫學中的應用[J].北京中醫藥大學學報,2006,29(6):370-373.
[7]朱文鋒,晏峻峰,黃碧群.貝葉斯網絡在中醫證素辨證體系中的應用[J].中西醫結合學報,2006,4(6):567-571.
[8]陳靜,西廣成,易建強,等.中醫復雜系統中兩類分劃方法的比較[J].煙臺大學學報:自然科學與工程版,2006,19(專集):430-434.
[9]孫繼佳,蔣健,朱蕾蕾,等.基于信息熵的中醫證候與季節氣候關聯性評價方法[J].中西醫結合學報,2007,5(5):502-505.[10]孫繼佳,蔣健,嚴廣樂,等.多屬性決策方法在中醫學研究中的應用[J].數理醫藥學雜志,2009,22(1):9-12.
[11]賈振華,吳以嶺,高懷林,等.基于熵的復雜系統分劃方法與冠心病心絞痛證候量化診斷標準研究[J].中醫雜志,2008,49(5):459-461.
[12]王天芳,吳秀艷,陳建新,等.基于信息熵關聯度系數法的證候/證候要素提取研究[J].天津中醫藥,2009,26(4):274-276.
[13]余學杰,李書珍,李曉燕,等.基于決策樹技術分析證候與四診信息關聯的初步研究[J].中醫學報,2014,29(B07):60-61.
(2015-12-22收稿 責任編輯:徐穎)
Syndrome Element Summary and Pathogenesis Analysis of Hepatitis B Caused Cirrhosis Based on the Information Entropy
Guo Zhizhong1, 2, Wei Bin1, Sun Jijia1,3, Wang Wenhai4, Su Shibing1
(1ResearchCenterforTraditionalChineseMedicineComplexitySystem,ShanghaiUniversityofTraditionalChineseMedicine,Shanghai201203,China; 2SecondAffiliatedHospitalofHenanUniversityofTraditionalChineseMedicine,Zhengzhou410100,China; 3CollegeofChinesePharmacology,ShanghaiUniversityofTraditionalChineseMedicine,Shanghai201203,China; 4No.7People′sHospitalofShanghaiUniversityofTraditionalChineseMedicine,Shanghai200137,China)
Objective:To summarize the syndrome elements of hepatitis B-caused cirrhosis (HBC), to analyze its composition and distribution and to explore the characteristics of its pathogenesis in HBC patients. Methods:The four-diagnostic information of 294 HBC cases was collected. The summary of syndrome elements and the symptoms contribution degree were carried out by an entropy-based complex systematic classification method and the composition and distribution rules were analyzed according to the diagnostic threshold value. Results:There were7 syndrome elements in HBC, namely spleen deficiency, kidney qi deficiency, liver yin deficiency, dampness-phlegm, qi stagnation, liver depression and dampness-heat. Moreover, at least one or more syndrome elements can be concluded from one patient. Spleen deficiency, qi stagnation and dampness-heat were those with highest frequency. Conclusion:The entropy-based complex system method may be used to summarize syndrome elements for HBC. The pathogenesis of HBC is complicated and its main factors may be related to spleen deficiency, qi stagnation and dampness-heat.
Syndrome element; Pattern identification; Entropy; Pathogenesis; Hepatitis B-caused cirrhosis
國家自然科學基金重點項目(編號:81330084);上海市中醫臨床重點學科建設項目(編號:ZYXK202010);浦東新區衛生系統重點學科群建設項目(編號:PWZxq2014-12)
R241
A
10.3969/j.issn.1673-7202.2016.10.063