999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在中醫文獻研究中的應用

2017-07-12 15:12:50張勝男車立娟李明
醫學信息 2017年13期
關鍵詞:中醫數據挖掘

張勝男+車立娟+李明

摘要:大數據時代,數據挖掘作為有效地信息處理技術,可以在中醫文獻中提煉出潛在的、有用的信息。數據挖掘廣泛應用于特定疾病、方劑、醫案、名老專家臨床經驗與針灸的文獻研究中。本文簡要介紹了關聯規則分析、聚類分析、決策樹算法和神經網絡數據挖掘方法,以及在中醫文獻研究中的應用情況。

關鍵詞:中醫;數據挖掘;文獻研究

中圖分類號:R2-03 文獻標識碼:A 文章編號:1006-1959(2017)13-0022-03

Abstract:The era of big data,data mining as an effective information processing technology,in the literature of traditional Chinese medicine extract potential and useful information.Data mining is widely applied to specific diseases,prescriptions,medical records,literature research and clinical experience of senior experts of acupuncture.This paper briefly introduces the association rules analysis,cluster analysis,decision making tree algorithm and neural network data mining method,and application in TCM literature research.

Key words:Traditional Chinese medicine;Data mining;Literature research

“大數據”已成為互聯網信息技術行業的流行詞匯。大數據時代,人們不再追求精準和因果關系,而是更為關注相關關系[1]。中醫學也迎來了大數據時代,從海量中醫數據中提取有用的信息也變得更加困難,數據挖掘作為有效地信息處理技術,可以幫助中醫研究者挖掘海量數據中有用的信息。數據挖掘(Data Mining,DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中、不為人知但又是潛在有用的信息和知識的過程[2],數據挖掘也被稱為數據庫中知識發現,即從一個大的數據堆中找出有用的知識,從數據中挖掘知識[3]。這是一個從大量不完整的數據中發現、抽取有意義數據的過程。數據庫知識發現技術最早是在1989年的美國人工智能協會第11屆年會上提出的[4],而后漸漸成為人們在海量數據中尋找有效知識的一個必備方法。在中醫文獻研究中,常用的數據挖掘方法有關聯規則分析、聚類分析、決策樹算法和神經網絡,尤其是關聯規則分析和聚類分析最為常用。也有很多中醫文獻研究需要綜合應用多種數據挖掘方法。

1 關聯規則分析

關聯規則分析又稱為購物籃分析,目的是在一定的支持度和置信度限制下尋找事務之間的內在的聯系。它是由Agrawal等人于1993年提出來的。關聯規則里的重要概念[5]:項集、支持度、頻繁項集、置信度。支持度是度量一個項集出現的頻率,例如項集{A,B}的支持度是由同時包含A和B的事務總數組成的。頻繁項集是在數據集中出現頻率高的那些項集,利用這些頻繁集創建描述關聯關系的規則[6],這是關聯規則的核心部分。頻率的閾值是用支持度來定義的。概率(Probability)是關聯規則的屬性,規則A=>B的概率是使用{A}的支持度除項集{A,B}的支持度計算的,該概率在數據挖掘研究領域中也稱置信度。關聯規則分析是數據挖掘領域中最活躍和成熟的方法之一,在中醫文獻研究中,關聯規則分析常用在組方用藥規律研究、病機的研究、針灸用穴規律的研究中,值得關注的是,關聯規則分析在方證研究領域中也有所發展。關聯規則在用藥規律研究中旨在尋找有用的藥對、藥組、藥癥,甚至可以發現新方;關聯規則在癥候病機的研究中著重挖掘病機與病機之間、癥候與病機之間的關聯;關聯規則在針灸用穴研究中,著重發現特定疾病選穴與經絡之間的聯系;關聯規則在方證研究中,旨在尋找經方里的規律,幫助臨床更好的應用經方。

1.1組方用藥規律的研究

甘永康等[7]應用數據挖掘方法對葉天士《臨證指南醫案》治療泄瀉方劑的組方規律進行分析,得到葉天士治療泄瀉常用的藥物、核心組合及發現新方,這為臨床選方用藥提供了新思路。

有些學者采用古今文獻對比的思路研究了某病用藥規律,沈劼等[8]運用關聯規則分析并對比了古今醫家治療卵巢早衰的用藥規律。挖掘出古代中醫治療卵巢早衰的核心藥物是當歸、川芎、白芍、茯苓、熟地黃等,為八珍湯基礎方加減。得到關聯度比較好的藥對為當歸-川芎、當歸-白芍等。現代中醫治療卵巢早衰的核心藥物是當歸、熟地黃、菟絲子、枸杞子、山藥等。得到關聯度較好的藥對為當歸-熟地黃、熟地黃-菟絲子等;古代中醫和現代中醫治療卵巢早衰共同選擇的核心藥物為當歸、熟地黃、白芍、茯苓,核心藥對為當歸-熟地黃。在分析古今醫家治療卵巢早衰時,得到支持度最高的藥物為當歸,可以認為古今醫家均視陰血虧虛為本病的一個病理基礎,但用藥有一定區別,古代方用藥立足于補益氣血,現代方用藥以滋補肝腎陰血為主。

1.2 癥候病機的研究

簡維雄等[9]在基于現代文獻研究高血壓的證型病機特征時,運用了關聯規則方法,得出高血壓病機以肝腎陰虛為本,痰濁,瘀血為標,風陽內動為像。瘀血與痰濁、陽亢、肝陽化風、肝腎陰虛、陰虛陽亢、肝火上炎等病機關聯;痰濁與瘀血、肝陽化風、肝火上炎、肝腎陰虛、陽亢、陰虛陽亢、氣虛、陰虛等病機關聯;肝腎陰虛證與病機瘀血傾向關聯;肝腎陰虛證和肝陽上亢證時與病機痰濁、肝陽化風、瘀血傾向關聯;血瘀證與瘀血傾向關聯。

1.3針灸用穴規律研究

章薇等[10]運用關聯規則探析古代針灸治療尿失禁的用穴規律,得出治療尿失禁多選陰經,重視手足三陰經腧穴偏重特定穴,陰經又以足厥陰肝經取穴最多,五輸穴與其他特定穴配伍最為常用,原穴配伍五輸穴支持度最高;而且發現古代醫家治療尿失禁不取膀胱經募穴中極。這說明數據挖掘技術也可以用來研究針灸的用穴規律。

1.4方證研究

在方證研究領域中,徐建虎等[11]運用數據挖掘技術分析古今醫案專著、臨床經驗專著及期刊雜志中的小柴胡湯醫案,發現小柴胡湯證臨床病證規律。子午二個時辰定時發作的病變常采用小柴胡湯治療;少陽提綱證(口苦、咽干、目眩) 和小柴胡湯四大主癥(往來寒熱、胸脅苦滿、嘿(mo)嘿不欲飲食、心煩喜嘔) 具有診斷小柴胡湯證的指標意義;“但見一證”指往來寒熱、胸脅苦滿、心煩喜嘔、嘿嘿不欲飲食四者之一;小柴胡湯證主脈是弦脈。

2 聚類分析

聚類是指將物理或抽象對象集合構成為由類似的對象組成的多個類的過程[12],聚類分析是將數據進行類似對象組的劃分,從而實現類的分析過程。在人類的行為中是一項非常重要的分析方法,也是一種常見的數據挖掘方法。聚類分析可分為R型聚類和Q型聚類。R型聚類可以把有線性關系的變量歸到一類,然后讓研究者自己去根據變量的情況判斷選擇代表性指標。而Q型聚類主要根據對象相似度,把整體分成若干類別,研究者在不同類別中尋找共同規律。無論是R型還是Q型聚類分析,都僅僅歸類而不呈現結論,需要完成下一步分析,屬于探索性分析[4]。多用于疾病的中醫證候分類,為中醫臨床辨證論治依據提供分型的方法學[13],也應用于方劑中的用藥規律、用藥方案篩選等相關研究中。

劉嘉輝等[14]探討名老中醫治療原發性肝癌的用藥規律,搜集首屆國醫大師及首批國家級名老中醫的醫案提取方藥信息,應用聚類分析和關聯規則分析進行數據挖掘。聚類分析顯示名老中醫治療原發性肝癌的藥物可歸為5類:補益氣血類、理氣活血類、解毒軟堅類、利水滲濕類和健脾消食類。關聯規則分析顯示:關聯性強的主要為益氣健脾藥和理氣藥、活血藥、清熱解毒藥、消食藥的配伍組合。名老中醫治療原發性肝癌謹守“正虛邪實”的病機本質,在扶正健脾基礎上辨證運用清熱解毒、疏肝理氣、活血散結等治法。陳欣然[15]利用聚類分析和關聯規則對近15年的反流性食管炎中醫臨床期刊文獻進行了用藥規律和證候研究。藥物聚類組得出7種證型,與《實用中醫消化病學》中該病的5種分類證型比較,少1種脾虛胃熱型,多出4種證型脾胃濕熱證、氣郁痰阻證、痰熱互結證和脾虛痰濕證,證明臨床用藥的趨向已經改變。在藥物的研究中發現大部分排名靠前的藥對中藥物功能相近,如穿山甲、桃仁,穿山甲、紅花均可活血化瘀、通絡止痛;還有沿用經典用藥配伍,如石青、寒水石出自《素問病機氣宜保命集》中的雙玉散等等。對于藥癥研究,大便艱難與玉竹相關性最高,白花蛇舌草、太子參、丁香、大棗、檳榔、黃芪、竹茹均與燒心相關聯,說明主癥燒心的用藥多選擇扶正祛邪、清熱解毒、軟堅散結的藥物。

3 決策樹算法

決策樹算法是利用信息論中的信息增益,以尋找數據庫中具有最大信息量的屬性字段,建立一個決策樹的節點,而后根據字段不同取之建立分支[4]。這種方法以樹狀結構表示模型,容易理解。國際上最早的最有影響的決策樹算法是ID3算法。決策樹算法在基于臨床病例數據探索辨證規則的研究中使用較多,可以是研究專家的辨證規律,也可以是臨床專病的辨證規則研究。決策樹算法可用于中醫臨床疾病辨證的輔助診斷。

余學杰等[16]使用決策樹算法將中醫專家的臨床診斷數據逐步分類以獲得專家的辯證規律,研究者成功獲取了多種證名與證候的規則,這說明利用決策樹算法研究專家的辯證規律是可行的。黃嘉韻等[17]收集臨床鼻鼽病例資料,建立了鼻鼽辯證分型決策樹模型,并且獲得了較高的準確率。通過決策樹算法探索專病辨證規律具有可行性,在中醫臨床辨證過程中將會起到輔助診斷的作用。

4 神經網絡

神經網路又稱為人工神經網絡,是模仿人腦神經元而產生的一種仿生物技術類數據挖掘方法[4]。神經網絡的目的在于提取規則,在證候分類、證候診斷規則以及預測研究中經常使用,神經網絡對已知證候與癥狀的關系或者對于建立專家系統都是有益的,但對某一個疾病的證候規律研究往往有局限性。有學者將神經網絡運用在診斷學中四診的研究,例如張康等[18]通過神經網絡對舌圖像進行胖舌,瘦舌和正常舌的自動歸類。

5 總結與展望

數據挖掘技術在中醫文獻研究中已經得到廣泛應用,在某一項研究中可以使用多種挖掘技術,這些挖掘技術不僅相互交叉又相互補充。其中關聯規則在中醫文獻研究中使用較多,也趨漸成熟。聚類分析在中醫文獻研究中的使用頻率也慢慢增多,然而在數據挖掘軟件中,聚類分析呈現出的結果僅僅是歸類而無結論,這就需要研究者深入探索再分析。在數據預處理方面,數據首先要規范化才能進行數據挖掘,其中癥狀的標準化一直是一個難點,需要我們研究人員深入探索,在癥狀標準化方面作進一步的研究。數據挖掘已經在中醫文獻研究領域中有很大的嘗試,但有些數據量不夠大,隨著時代的進步,數據挖掘在中醫文獻研究領域中有更深的探索。

參考文獻:

[1]張華敏,王永炎.高概念大數據時代中醫理論研究的機遇[J].中國中醫基礎醫學志,2015,21(1):4-6.

[2]劉興方,韓學杰.數據挖掘技術在醫案研究中的應用與討論[J].中國實驗方劑學志,2014,20(9):247-250.

[3]JiaweiHan,MichelineKamber,JianPei,等.數據挖掘:概念與技術[M].機械工業出版社,2012.

[4]郝峰.消化性潰瘍近15年中醫文獻研究[D].北京中醫藥大學,2012.

[5]JamieMacLennan,ZhaohuiTang,BogdanCrivat,等.數據挖掘原理與應用(第2版):SQL Server 2008數據庫[M].清華大學出版社,2010.

[6]陳文偉,黃金才.數據倉庫與數據挖掘[M].北京:人民郵電出版社,2004.

[7]甘永康,劉華一,劉惠.基于數據挖掘的《臨證指南醫案》治療泄瀉用藥規律分析[J].中國中醫基礎醫學雜志,2016,22(1):115-116,130.

[8]沈劼,王旭東,李新霞,等.卵巢早衰古今用藥規律探析[J].中國中醫藥現代遠程教育,2016,14(21):42-45.

[9]簡維雄,陳偶英,張穩,等.基于高血壓病中醫藥現代文獻證型、病機特征研究[J].中華中醫藥學刊,2015,33(12):2871-2874.

[10]章薇,譚志高,曹卷舒,等.基于數據挖掘技術探析古代針灸治療尿失禁的用穴規律[J].中國針灸,2015,35(12):1299-1303.

[11]徐建虎,陳甲秀,張琦,等.基于2898則古今醫案的數據挖掘探討小柴胡湯病證規律[J].時珍國醫國藥,2014,25(8):2026-2029.

[12]王欣,徐騰飛,唐連章.SQL Server 2005數據挖掘實例分析[M].中國水利水電出版社,2008:185.

[13]蘇曉宇.數據挖掘聚類分析方法在中醫臨床中的運用[J].實用中西醫結合臨床,2010,10(6):90-93.

[14]劉嘉輝,韋志輝,呂東勇,等.基于數據挖掘的名老中醫治療原發性肝癌用藥規律研究[J].中華中醫藥雜志,2016,31(1):58-61.

[15]陳欣然.基于數據挖掘技術的近15年反流性食管炎中醫臨床期刊文獻研究[D].北京中醫藥大學,2014.

[16]余學杰,李書珍,李曉燕,等.基于決策樹提取中醫專家辨證規律初探[J].遼寧中醫雜志,2015,42(1):19-24.

[17]黃嘉韻,郭宏,鄺艷萍.基于決策樹算法的鼻鼽辨證規律初步研究[J].中華中醫藥雜志,2016,31(11):4770-4773.

[18]張康,張鶴林,金石,等.基于神經網絡的舌體胖瘦分析[J].中華中醫藥雜志,2014,29(10):3111-3114.

編輯/成森

猜你喜歡
中醫數據挖掘
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
糖尿病患者的中醫飲食護理相關問題分析
數據挖掘技術在中醫診療數據分析中的應用
引產術后胎盤殘留的中醫治療方法
今日健康(2016年12期)2016-11-17 14:53:45
中醫英譯的誤譯現象探析
社區中醫干預初產婦產后焦慮及抑郁的效果
上海醫藥(2016年20期)2016-11-09 21:19:04
芻議中醫養生理念在瑜伽教學中的融入
體育時空(2016年8期)2016-10-25 20:56:21
關于中西醫結合治療乳腺增生病38例臨床觀察
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产精品网址在线观看你懂的| 成人va亚洲va欧美天堂| 国产一区二区三区夜色| 国产嫩草在线观看| 91破解版在线亚洲| 日韩a在线观看免费观看| 91麻豆精品国产91久久久久| 又猛又黄又爽无遮挡的视频网站| 精品一区二区三区中文字幕| 久久精品无码中文字幕| 成人午夜视频在线| 在线精品自拍| 波多野结衣无码AV在线| 2022国产91精品久久久久久| 99一级毛片| 伊人精品成人久久综合| 婷婷成人综合| 国产精品亚欧美一区二区| 成人福利免费在线观看| 在线日本国产成人免费的| 国产91av在线| 精品福利一区二区免费视频| 国产一级做美女做受视频| 在线观看欧美精品二区| 久久精品波多野结衣| 日本午夜影院| 热久久这里是精品6免费观看| 久久狠狠色噜噜狠狠狠狠97视色| 性欧美久久| 喷潮白浆直流在线播放| 国产欧美视频在线| 午夜激情福利视频| 日韩人妻无码制服丝袜视频| 尤物在线观看乱码| 免费av一区二区三区在线| 国产精品污污在线观看网站| 日韩国产黄色网站| 国产香蕉在线视频| 一本大道视频精品人妻| 特级毛片免费视频| 欧美精品不卡| 综合天天色| 国产主播喷水| 高清久久精品亚洲日韩Av| 国产在线拍偷自揄观看视频网站| 午夜日本永久乱码免费播放片| 97久久免费视频| 久久综合丝袜日本网| a级毛片毛片免费观看久潮| 噜噜噜久久| 91娇喘视频| 伊人久久婷婷| 婷五月综合| 亚洲男人的天堂网| 狠狠色噜噜狠狠狠狠色综合久| 亚洲欧美成人在线视频| 国产精品乱偷免费视频| 好久久免费视频高清| 国产不卡网| 国产一二三区视频| 国产自视频| 91偷拍一区| 国产一级无码不卡视频| 在线观看网站国产| 国产精品无码一二三视频| 精品一区二区三区水蜜桃| 久久精品视频亚洲| 美女被操91视频| 91精品国产丝袜| 性色在线视频精品| 人妻一本久道久久综合久久鬼色| 国产精品视频观看裸模| 黄色网址手机国内免费在线观看| 免费人欧美成又黄又爽的视频| 国产精品三区四区| 国产精品无码AV片在线观看播放| 久久精品嫩草研究院| 免费看a毛片| 自偷自拍三级全三级视频| 亚洲精品麻豆| 久久精品免费国产大片| 999国产精品永久免费视频精品久久|