999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中醫證候規范化研究中無監督方法探討

2016-03-24 13:54:22張世君齊冬梅李運倫聶文婷朱麗娟
長春中醫藥大學學報 2016年1期
關鍵詞:中醫證候分類

張世君,齊冬梅*,李運倫,2,聶文婷,朱麗娟

(1.山東中醫藥大學,濟南 250355;2.山東中醫藥大學附屬醫院 高血壓國家中醫臨床研究基地,濟南 250014)

?

論著

中醫證候規范化研究中無監督方法探討

張世君1,齊冬梅1*,李運倫1,2,聶文婷1,朱麗娟1

(1.山東中醫藥大學,濟南 250355;2.山東中醫藥大學附屬醫院 高血壓國家中醫臨床研究基地,濟南 250014)

摘要:中醫證候規范化研究應用的方法主要包括有監督數據分析方法和無監督數據分析方法,中醫證候規范化研究中常見的無監督數據分析方法主要包括多維尺度分析、主成分分析、因子分析、聚類分析、關聯規則、隱結構模型、結構方程模型和信息熵,不同的無監督數據分析方法根據不同的分析思想和原理,解釋的癥狀關系的方向不同,反映不同的問題。在進行中醫證候的規范化研究中需要注意嚴格控制數據質量,選擇合適的分析方法,并由專業研究人員對數據結果進行提煉和詮釋。

關鍵詞:中醫證候;規范化研究;無監督數據分析方法;分類

中醫證候體系是一個繁瑣的非線性系統[1],因具有大量非量化的數據變量,從而區別于其他觀測數據[2]。此種特點提示了在進行中醫證候研究時,在單純應用線性的、單一化的統計分析方法的基礎之上,需特別重視非量化數據的分析處理。近年來,許多學者對證候研究進行了深入探討,但始終沒有取得重大突破,隨著現代科學技術的發展,多學科的交叉滲透,信息技術的不斷改革、更新,為中醫證候的規范化進一步的深入研究提供了技術支撐。盡管中醫證候規范化研究的分析方法日趨增多,仍未找到完全適合中醫證候復雜化特點的特異性研究方法[3]。

目前常用中醫證候規范化研究的數據分析方法分為兩類,即無監督方法(unsupervised method)和有監督方法(supervised method)[4]:無監督方法[5]是通過將含有相似特征的原始數據信息分門別類,再經可視化技術進行直觀展現,以進一步探索未知數據特征的研究方法;有監督方法[5]則是依據已有知識體系創建信息組,并通過信息組對未知數據的特征進行辨識、歸類和預測。中醫臨床四診信息存在多維度、相互關聯廣泛、個體化強、主觀性高等特點,數據分析的結果是對癥狀的組合,而證候規范化研究的目標是建立證候的辨證標準,二者間尚存在一個提煉、轉化、詮釋的過程[6]。相較之下,無監督方法的分析原理及方法角度更符合當前證候研究需要[4],故此進行專題探討以滿足證候研究的需要。

1中醫證候規范化研究中常見的無監督數據分析方法

常見的中醫證候規范化研究的無監督數據分析方法主要有以下幾種[6-9]:多維尺度分析、主成分分析和因子分析、聚類分析、關聯規則、隱結構模型、結構方程模型、信息熵等。

1.1多維尺度分析多維尺度分析(multidimensional scaling)[10]是通過對研究對象在一個低維空間形象表示出的多相似性或距離進行聚類或唯獨內含分析,并用圖示表達的一種方法。各癥狀在二維平面圖中分布特點可以通過多維尺度分析進行形象的描述,根據癥狀二維分布的歐氏型距離陣,為辨證分析提供一定的數據分析依據。

1.2主成分分析與因子分析主成分分析(principal components analysis)是運用降維思想分析多個數值變量之間的相互關系,將多個變量/指標化為幾個不相關的綜合變量/指標的統計方法[11],以便對數據進行精簡及詮釋。因子分析(factor analysis)則是探索多個原始變量/指標的相關關系之間的潛在變量,以闡釋原始變量/指標間的相關性或協方差關系的多元統計分析方法[11]。

上述兩種分析方法之間雖有密切聯系[12-13],均可以對證候進行降維分析,從而消除證候的多元共線性,但兩者各有所偏重:主成分分析是綜合原始變量的信息,重在討論原始變量的信息;因子分析是解釋原始變量(公因子與特殊因子的線性組合)之間的關系,重在研究原始變量之間的關系,此外,主成分分析能夠準確得出各主成分的得分,而因子分析只能估計各公因子得分。

1.3聚類分析聚類分析(clustering analysis)又稱集群分析,是對尚未明確分類方法的數據信息,嘗試依靠數理統計尋找適用于現有集資料中研究對象的一種歸類方法[14]。該方法利用研究個體/變量之間的親疏關系,通過盡可能降低類間相似性,并提高類內相似性,以達到聚集數據成類的目的[15],在對已按相似程度分為幾大類別的基礎之上,再將各大類中關系相近的對象聚合成一個較小的分類單位,直至將所有的對象都聚合完畢,從而形成一個由小到大的聚類系統,并用譜系圖的形式直觀展現所有對象的親疏關系。

1.4關聯規則關聯是指兩個或兩個以上變量之間存在的一定的潛在的規律,關聯分析則是由數據庫中找出表或屬性間隱藏的關聯網,在此基礎上,依靠關聯規則(association rule)尋找數據庫中一組事物之間的某種相互關聯的關系,進而揭示一個事物與其他事物之間的存在的關聯性和相互依存性,由于中醫證候數據庫數據繁瑣,可采用關聯規則尋找相關聯的數據,對未知問題進行推理分析[16],從而根據某類癥狀同步出現頻率,反映某種證型規律[17]。

1.5隱結構模型隱結構模型(latent structure models)根據某病的流行病學調查資料,將收集到的患者的癥狀或體征信息進行量化處理,利用隱結構模型分析數據,以挖掘癥狀或體征的同步出現規律,并依據同組數據同步出現頻率的高低劃分數據,每組劃分分別反映患者在該病情某側面的客觀分布情況。

1.6結構方程模型結構方程模型(structural equation model)是利用引入潛在變量,通過估計、檢驗因果關系模型,以此探討多個抽象變量間因果結構關系的研究方法[18]。結構方程模型能夠分析隱變量與顯變量、隱變量與隱變量之間可能存在的因果關系[19],是分析隱變量的有力工具。

1.7信息熵信息熵(information entropy)作為信息論中對“不確定性”的一種度量指標[20],是根據信息熵的關聯度進行基于熵的復雜系統分化方法。因本法無需對數據作剛性先行分割,而是遵循數據的內在聯系進行自主聚類,是信息論中有關熵方法及熵語言在非線性相關模式識別領域的應用形式。

2無監督分析方法在中醫證候研究中的應用

2.1多維尺度分析研究者利用多維尺度分析所得的癥狀二維空間距離分類圖,描述性地將變量或樣本進行分類,可對隱藏在原始數據背后的維度做出相應的判斷,多維尺度分析僅作為對數據形象描述的工具,其分類、結果尚需與其他數據分析的結果進行比較討論[6]。周萍等[21]采用頻數分析法對古代情志心身疾病醫案數據庫開展研究,利用多維尺度分析對使用頻次大于50次以上的54種藥物進行分析,總結了心身疾病的用藥特點。陳濤等[22]薈萃4 400例當代名醫醫案,分析其中有關舌象、脈象的分布頻數,挖掘出如霉醬苔最多見于情志病等數據信息以指導臨床診療。

2.2主成分分析和因子分析在中醫證候研究的實踐中,主成分分析多作為一種中間手段用于數據預處理,隨后再配合其他統計方法深入分析。王佳笑等[23]運用因子分析法探索2型糖尿病合并高血壓病的證候要素主要有陰虛、陽虛、氣虛、熱盛、陽亢、血瘀、痰濕等7個基本證候要素,為中醫的客觀化研究提供了有效途徑。劉玥等[24]運用因子分析法對腦梗死后認知障礙患者癥狀進行分析,得出腦梗死后認知障礙的中醫證候要素為陰虛、陽虛、氣虛、火、痰、血瘀。

2.3聚類分析因聚類分析可在缺少先驗知識的前提下對數據資料分類,故此種方法對研究中醫證候的癥狀組合規律及證候規律等具有一定的推動作用。盧焯明等[25]為分析廣州地區106例兒童中間型β地中海貧血患者情況,通過觀察表收集信息,運用聚類分析等研究方法,發現此類患兒的中醫證候分布特點以氣血兩虛證為最多,其余為肝腎陰虛證、脾腎陽虛證、陰陽兩虛證。李毅等[26]運用系統聚類法,分析乙肝后肝硬化的癥狀、體征,得出濕熱內蘊證、脾虛濕盛證、血瘀證、脾腎陽虛證、氣(陽)虛證、肝腎陰虛證、肝郁脾虛證等7類基本證候。

2.4關聯規則關聯規則主要應用于探討多因素對特定疾病癥狀的影響規律以及研究中醫的“證“與疾病診斷的關系。黃文金等[27]采用數據挖掘中的關聯規則的Apriori算法對證素之間、證素及證候之間進行關聯規則,發現證素之間有9條規則,證候和證素之間有25條診斷關聯規則,為中醫兒科臨床診療提供參考。車立娟等[28]利用關聯規則算法進行分析,找到證素對證候的貢獻權重,形成了“證素—證型”診斷量表,為慢性乙型肝炎的中醫證型診斷提供了參考。

2.5隱結構模型在證候研究領域,隱結構模型用于研究癥狀之間及癥狀與證候間的復雜關系,挖掘證候的主癥與次癥,定量評估各癥狀的診斷價值[29]。王天芳等[30]運用隱結構模型分析法,對抑郁癥證候進行了探索,根據統計分析顯性證候發生的概率,對隱變量的狀態進行分類,依據中醫傳統理論對隱變量進行解釋與性質分類。張連文等[31]為研究中醫腎虛證辨證標準,使用隱結構模型篩取67個變量,并深入分析其中35個重要癥狀以指導辨證。

2.6結構方程模型結構方程模型作為檢驗四診信息與證候間的因果關系以及證候間的內在結構關系的統計學方法,是進行證候診斷標準建立及證候量化診斷等研究的重要方法學參考。施學忠等[32]為研究艾滋病中醫證候與四診信息、中醫證候與臨床分型歸屬性問題,構建結構方程模型,為該病的辨證論治提供了理論及數據支持。王利敏等[33]借助結構方程模型,根據通徑系數反映不同證候間的影響差異,并依據載荷系數展現亞健康狀態下各證候中不同癥狀的權重程度,為分析亞健康狀態各維度及不同中醫證候間的關系提供了一定的理論指導。

2.7信息熵信息熵是研究代表證候要素的癥狀,并分析這些癥狀間的非線性關系的主要方法,在中醫證候規范化應用中有極高價值。王階等[34]經由復雜系統熵聚堆法,從冠心病心絞痛患者的癥狀中提取出9種常見組合形式,以此推測冠心病、心絞痛的核心病機是氣虛、血瘀、痰濁。王天芳等[35]對601例慢性腎衰竭患者進行臨床癥狀采集,采用信息熵關聯度系數法分析所得的108個癥狀,通過詮釋癥狀的組合規律,挖掘出心氣虛、脾氣虛、脾胃氣虛、腎陽虛、氣陰兩虛、肝氣郁結等常見中醫證候類型,確定可通過信息熵關聯度系數分析方法為該病的常見證候及證候要素研究提供證據。

3無監督數據方法在中醫證候規范化研究中應用的注意事項

3.1選擇合適的無監督數據分析方法目前中醫證候規范化研究中使用不同的無監督數據分析方法,是根據不同的分析原理與指導思想對數據進行分析,各有利弊,因此正確選擇分析方法是數據分析成功的前提與基礎。在進行證候研究數據分析前必須明確研究方向以及研究目的,結合數據特點,選取合適的分析方法進行處理、分析,必要時可聯合應用統計分析方法以充分發揮各方法的優點,使數據分析結果更加準確、恰當。

3.2嚴格控制數據的質量數據處理和分析過程中會涉及到重要數據的設置問題,不同的數據經過同樣的處理、分析會得出不同的結果。因此,在進行處理和分析時,要對數據質量進行嚴格控制。必要時可將臨床研究的盲法原則引入到數據分析中,如委托專業信息學研究人員進行分析,中醫學專業研究人員負責詮釋數據結果,分析過程中由兩方人員共同協商,以保證數據分析結果的客觀性與真實性,提高研究的質量與可信度。

3.3對分析結果的提煉與詮釋進行證候規范化研究的目的就是將辨證進行信息學語言的提煉、重現。從四診收集到數據處理,運用現代數據挖掘方法,尋找潛在的聯系和規律,建立并探討各個癥狀間的相互組合關系,并與中醫基礎理論相結合,形成證候要素及證候的診斷模型標準(數學模型)。由于中醫臨床四診信息存在獨立性強、主觀性高、關聯廣泛、多維度等特點,臨床癥狀間的關系具有高度復雜化、組合隨機化的特征,不同的無監督數據分析方法的分析原理不同,故解釋的癥狀信息間的相互關系的方向不同,建立癥狀組合的意義不同,反映出問題的不同方面[6]。因此,合理使用無監督數據分析方法,對癥狀關聯模型的評價以及對各種結果的異同點系統詮釋,是證候規范化研究中的重要環節。

參考文獻:

[1]王永炎.完善中醫辨證方法體系的建議[J].中醫雜志,2004,45(10):729-731.

[2]史希來.屬性數據分析引論[M].北京:北京大學出版社,2006:237.

[3]戴霞,郭偉星.中醫證候診斷標準規范化研究概況[J].中醫雜志,2011,52(2):168-171.

[4]趙燕,薛曉林,吳秀艷,等.無監督數據分析方法在證候研究中的應用[C]//中華中醫藥學會中醫診斷學分會2007年會論文集,2007.

[5]邱德紅,陳傳波.融合無監督和監督學習策略生成的多分類決策樹[J].小型微型計算機系統,2004,25(4):555-559.

[6]趙燕.基于多種無監督數據分析方法的抑郁癥證候要素研究[D].北京:北京中醫藥大學,2007.

[7]于春光.基于多種數據分析方法的慢性乙型肝炎證候要素的研究[D].北京:北京中醫藥大學,2007.

[8]李志更.基于多種數據分析方法的慢性腎功能衰竭證候要素研究[D].北京:北京中醫藥大學,2007.

[9]TREVOR H,ROBERT T,J E J.統計學習基礎-數據挖掘,推測與預測[M].北京:電子工業出版社,2004.

[10]張凡帆.下肢動脈硬化閉塞癥證候要素診斷量表的研制[D].北京:北京中醫藥大學,2012.

[11]孫振球,徐勇勇.醫學統計學[M].北京:人民衛生出版社,2002.

[12]黃粵,高穎,馬斌.中醫證候研究常用數據挖掘方法述評[J].中醫藥學報,2010,38(3):6-10.

[13]張琳婷,張明雪.多元分析法在中醫證候研究中的應用[J].實用中醫內科雜志,2012(12):91-93.

[14]查青林,林色奇,呂愛平.多元統計分析在中醫證候研究中的應用探析[J].江西中醫學院學報,2004,16(6):79-80.

[15]鄭舞,劉國萍.常見數據挖掘方法在中醫診斷領域的應用概況[J].中國中醫藥信息雜志,2013,20(4):103-107.

[16]黃山,郭立瑋.數據挖掘技術在中醫藥研究中的應用[J].中華中醫藥學刊,2008,26(2):357-359.

[17]龔燕冰,倪青,王永炎.中醫證候研究的現代方法學述評(一)[J].北京中醫藥大學學報,2006,29(12):797-801.

[18]宇文亞,謝雁鳴,耿直,等.基于因果模型的中醫證候研究探討[J].世界科學技術:中醫藥現代化,2007,9(5):30-33,44.

[19]黃粵,高穎.數據挖掘技術在中醫證候研究中的應用概述[J].上海中醫藥大學學報,2010,30(1):85-87.

[20]王瑞祥,崔利銳.基于貝葉斯網絡的中醫專家系統構建方法[J].中國醫藥導報,2007,4(7):58,73.

[21]周萍,肖小燕,王斌.計算機輔助心身疾病相關醫案的用藥規律研究[J].中醫藥臨床雜志,2008,20(3):254-256.

[22]陳濤,李克乾,陳茂華,等.4 400例當代名醫醫案的舌象分布頻數分析[J].遼寧中醫雜志,2007,34(9):1217-1220.

[23]王佳笑,趙時鵬,倪青,等.運用因子分析法探索2型糖尿病合并高血壓病中醫證候要素分布特點[J].陜西中醫,2015,36(2):155-157.

[24]劉玥,金香蘭,薛斐然,等.基于因子分析腦梗死后認知障礙中醫證候要素研究[J].北京中醫藥,2015,42(2):83-87.

[25]盧焯明,錢新華.以聚類分析法研究兒童中間型β地中海貧血的中醫證候分布規律[J].中華中醫藥雜志,2012,27(3):607-611.

[26]李毅,劉艷,寇小妮,等.乙肝后肝硬化癥狀學聚類研究[J].中醫藥導報,2012,18(2):14-16.

[27]黃文金,姚明龍,葉云金,等.關聯規則在中醫兒科學證素診斷中的應用[J].中醫藥臨床雜志,2015,13(3):329-331.

[28]車立娟,馬利莊,胡義揚.基于關聯規則算法的慢性乙型肝炎證型診斷量表多中心研究[J].上海中醫藥雜志,2014,35(5):11-14.

[29]李海霞,王階,胡元會,等.基于信息熵的關聯度的血瘀證量化研究[J].世界科學技術:中醫藥現代化,2007,9(4):18-21.

[30]王天芳,張連文,趙燕,等.隱結構模型及其在中醫證候研究中的應用[J].北京中醫藥大學學報,2009,32(8):519-526.

[31]張連文,袁世宏,陳弢,等.隱結構模型與中醫辨證研究(Ⅱ)——腎虛數據分析[J].北京中醫藥大學學報,2008,31(9):584-587.

[32]施學忠,楊永利,時松和,等.HIV/AIDS中醫實證與四診信息的結構方程建模[J].中國衛生統計,2011,28(5):495-496.

[33]王利敏,曲彬彬,趙歆,等.基于結構方程模型的亞健康狀態中醫證候量化分析研究[J].中華中醫藥雜志,2011,26(5):1033-1036.

[34]王階,邢雁偉,陳建新,等.復雜系統熵聚堆方法對1 069例冠心病心絞痛證候要素提取和應證組合規律研究[J].中國中醫基礎醫學雜志,2008,14(3):211-213.

[35]王天芳,李志更,吳秀艷,等.基于信息熵關聯度系數法的慢性腎衰竭中醫癥狀組合的探索[J].北京中醫藥大學學報,2010,33(7):493-495.

Unsupervised methods in TCM syndrome standardization study

ZHANG Shijun1,QI Dongmei1*,LI Yunlun1,2,NIE Wenting1,ZHU Lijuan1

(1.Shangdong University of TCM,Jinan 250355,China;2.The Hospital Affiliated to Shandong University of TCM,Jinan 250014,China)

Abstract:The methods of TCM Syndrome Standardization Study include the Supervised method and the Unsupervised method.The common Unsupervised methods in the study of TCM syndrome standardization include Multidimensional Scaling,Principal Components Analysis,Factor Analysis,Clustering Analysis,Association Rule,Latent Structure Models,Structural Equation Model and Information Entropy,the explanation of the relationship between the symptoms have a different direction since different unsupervised method based on the different thought and principle,so the different results can reflecting the different problems.During the study of the standardization of TCM syndrome study,there are three aspects need to pay attention:the quality of the data should be strictly controlled,the analysis method should be selected properly and the data results should be refined and interpreted by professional researchers.

Keywords:TCM syndrome standardization;unsupervised methods;classification;application

(收稿日期:2015-06-06)

文章編號:2095-6258(2016)01-0001-05

中圖分類號:R241.2

文獻標志碼:A

*通信作者:齊冬梅,女,博士,教授,電話-(0531)89628063,電子信箱-qidm119@163.com

作者簡介:張世君(1988-),女,碩士研究生,主要從事中醫內科學(中醫治療心系疾病)研究。

基金項目:國家自然科學基金“正常高值血壓中醫證候宏觀量化診斷標準的建立及其代謝機制”(81373515)。

DOI:10.13463/j.cnki.cczyy.2016.01.001

·學術探討·

猜你喜歡
中醫證候分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
帕羅西汀聯合柴胡加龍骨牡蠣湯加味治療抑郁癥42例
麻黃附子細辛湯合右歸丸加減治療緩慢性心律失常臨床觀察
口干是否類風濕關節炎中醫陰虛證候關鍵指標的臨床研究
雙唑泰棉栓聯合中藥沖洗、定君生治療霉菌性陰道炎的臨床分析
心血管多重危險因素與中醫“風痰毒瘀虛”診斷結合的研究
主站蜘蛛池模板: 久久中文电影| 亚洲人成色在线观看| 国产高清不卡视频| 免费不卡视频| 超碰免费91| 1024国产在线| 欧美精品一二三区| a亚洲视频| 中文字幕 日韩 欧美| av在线无码浏览| 91精品视频在线播放| 永久免费av网站可以直接看的| 亚洲h视频在线| 91麻豆国产在线| 欧美在线精品怡红院| 精品国产91爱| 精品国产免费观看一区| 久久免费观看视频| 亚洲成人手机在线| 国产综合欧美| 成人午夜免费视频| 狠狠色综合网| 91丝袜乱伦| 精品一区二区三区自慰喷水| 欧美性精品不卡在线观看| 国模视频一区二区| 国产欧美日韩在线在线不卡视频| 欧美在线观看不卡| 欧美天天干| 精品一区二区三区波多野结衣| 亚洲永久色| 亚洲精品黄| 99在线视频免费| 国产一区二区三区免费| 亚洲无码日韩一区| 精品国产www| 9久久伊人精品综合| 国产精品无码一二三视频| 国产va在线| 日韩精品毛片人妻AV不卡| 国产性生大片免费观看性欧美| 精品一区二区三区四区五区| 97国产精品视频人人做人人爱| 亚洲色偷偷偷鲁综合| 亚洲国产黄色| 国产精品自拍合集| 日韩精品高清自在线| 色欲综合久久中文字幕网| 欧美日韩国产综合视频在线观看| 亚洲成人高清在线观看| 手机在线免费不卡一区二| 欧美精品成人| 99re在线视频观看| 99精品影院| 亚洲天堂久久| 免费又爽又刺激高潮网址| 色哟哟国产精品一区二区| a欧美在线| 91视频日本| 亚洲精品成人福利在线电影| 91蜜芽尤物福利在线观看| 中文纯内无码H| 四虎国产精品永久一区| 亚洲永久色| 亚洲啪啪网| 国产呦精品一区二区三区下载| 狂欢视频在线观看不卡| 国产精品久久自在自2021| 毛片网站免费在线观看| 国产swag在线观看| 日本免费a视频| 99热在线只有精品| 国产精品浪潮Av| 亚洲an第二区国产精品| 2020极品精品国产 | 精品午夜国产福利观看| 自偷自拍三级全三级视频| 久久 午夜福利 张柏芝| 亚洲精品视频网| 欧美精品xx| 中文无码精品A∨在线观看不卡| 99久久99视频|