999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)在中醫(yī)處方經(jīng)驗研究中的應(yīng)用

2016-03-29 05:34:36周旭郭倩白璐徐晶
電子產(chǎn)品世界 2016年2期
關(guān)鍵詞:中醫(yī)數(shù)據(jù)挖掘

周旭 郭倩 白璐 徐晶

摘要:傳統(tǒng)的中醫(yī)藥科學(xué)在長期的醫(yī)療實踐中積累了海量的處方數(shù)據(jù),數(shù)據(jù)挖掘是目前最有效的數(shù)據(jù)分析手段之一,利用數(shù)據(jù)挖掘技術(shù)從這些海量數(shù)據(jù)中發(fā)現(xiàn)蘊含其中的中醫(yī)藥知識,是一項極有價值的研究工作。本文主要采用數(shù)據(jù)挖掘中的Apriori關(guān)聯(lián)規(guī)則算法,對中醫(yī)處方數(shù)據(jù)進(jìn)行挖掘和總結(jié):首先對采集的中醫(yī)藥數(shù)據(jù)進(jìn)行數(shù)字特征化處理;然后對中醫(yī)處方中藥物的頻繁項集和藥物之間的關(guān)聯(lián)關(guān)系進(jìn)行研究,并獲得了普通處方分析較難獲得的用藥規(guī)律及經(jīng)驗信息。研究成果對中醫(yī)臨床工作具有重要的指導(dǎo)意義。

關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;數(shù)字特征化;中醫(yī)

DOI:10.3969/j.issn.1005-5517.2016.2.009

信息技術(shù)正在經(jīng)歷著一次新的變革,互聯(lián)網(wǎng)、大數(shù)據(jù)等各種技術(shù)正在潛移默化的改變著人們的生活,數(shù)字化和數(shù)據(jù)化更是深深地影響著各行各業(yè)的每一個細(xì)節(jié)。很多信息早已開始儲存于各種類型的數(shù)據(jù)庫或者其他載體里,人們也已經(jīng)開始從眾多數(shù)據(jù)中,找出有益的規(guī)律。人們的關(guān)注點已經(jīng)由數(shù)據(jù)間的因果關(guān)系漸漸轉(zhuǎn)變?yōu)榭梢詭椭覀儾东@現(xiàn)在和預(yù)測未來的相關(guān)關(guān)系,即挖掘事物之間的關(guān)聯(lián)性.中醫(yī)在長期的醫(yī)療實踐中積累了海量的處方數(shù)據(jù),如何有效的分析這些數(shù)據(jù)并發(fā)現(xiàn)規(guī)律以指導(dǎo)臨床應(yīng)用,成為中醫(yī)藥現(xiàn)代化研究中亟待解決的問題.數(shù)據(jù)挖掘作為一種有效的數(shù)據(jù)分析手段,已經(jīng)在中醫(yī)藥領(lǐng)域中得到廣泛應(yīng)用。

1數(shù)據(jù)挖掘技術(shù)

1.1數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘有趣模式和知識的過程。從廣義上說,數(shù)據(jù)挖掘是對數(shù)據(jù)庫知識發(fā)現(xiàn)(KnowledgeDiscovery in Databases,KDD)的一個過程。作為一種通用技術(shù),數(shù)據(jù)挖掘可以用于任何類型的數(shù)據(jù),只要數(shù)據(jù)對目標(biāo)應(yīng)用是有意義的,數(shù)據(jù)源可以包括數(shù)據(jù)庫、數(shù)據(jù)倉庫、web、其他信息存儲庫或動態(tài)的流入系統(tǒng)的數(shù)據(jù)。

1.2中醫(yī)藥數(shù)據(jù)挖掘的意義

中醫(yī)藥領(lǐng)域的處方中通常包含大量的藥物及其劑量組成,伴隨著醫(yī)院信息化建設(shè)的大力推進(jìn),這些藥方多以數(shù)據(jù)庫形式被保存,運用數(shù)據(jù)挖掘技術(shù)對中藥數(shù)據(jù)進(jìn)行科學(xué)分析,從而發(fā)現(xiàn)其中的配伍特點和規(guī)律成為很有現(xiàn)實意義的一項工作。

中醫(yī)藥數(shù)據(jù)挖掘的目的是通過對中醫(yī)處方中的中藥數(shù)據(jù)建立合適的模型,從而尋找藥物之間的頻繁模式和關(guān)聯(lián)規(guī)則,可以實現(xiàn)中醫(yī)用藥經(jīng)驗的有效總結(jié)和傳承。

1.3關(guān)聯(lián)規(guī)則算法

數(shù)據(jù)挖掘有很多模式,常見有關(guān)聯(lián)規(guī)則、聚類算法、分類算法等。關(guān)聯(lián)規(guī)則挖掘最初僅限于事務(wù)數(shù)據(jù)庫的布爾型關(guān)聯(lián)規(guī)則,近年來廣泛應(yīng)用于關(guān)系數(shù)據(jù)庫。關(guān)聯(lián)規(guī)則反映一個事物與其他事物之間的相互依存性和關(guān)聯(lián)性。如果兩個或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個事物就能夠通過其他事物預(yù)測到。

關(guān)聯(lián)規(guī)則就是支持度和信任度分別滿足用戶給定閾值的規(guī)則。Aprior是關(guān)聯(lián)規(guī)則模型中的經(jīng)典算法。本文主要使用基于頻繁項集的Apriori算法進(jìn)行數(shù)據(jù)建模,用以發(fā)現(xiàn)中藥配伍中的規(guī)律性。發(fā)現(xiàn)關(guān)聯(lián)規(guī)則需要經(jīng)歷如下兩個步驟:

步驟一:通過迭代,檢索出事務(wù)數(shù)據(jù)庫中的所有頻繁項集,即支持度不低于用戶設(shè)定的閾值的項集;

步驟二:利用頻繁項集構(gòu)造出滿足用戶最小信任度的規(guī)則。

2數(shù)據(jù)特征化和預(yù)處理

2.1實驗數(shù)據(jù)集

本文實驗數(shù)據(jù)來自河北中醫(yī)學(xué)院附屬醫(yī)院腎內(nèi)科陳志強(qiáng)教授于2014年5月至2015年7月診治的早中期慢性腎衰竭患者的病案。采集的病案內(nèi)容包括患者姓名、性別、年齡、原發(fā)病、癥狀、體征、腎功能指標(biāo)、中醫(yī)證候、中藥處方等。摘取其中的中藥信息,按照《中藥大辭典》統(tǒng)一藥物名稱。

2.2數(shù)據(jù)特征化

統(tǒng)計數(shù)據(jù)集的全部223條中醫(yī)處方,共出現(xiàn)中藥194味,根據(jù)專業(yè)經(jīng)驗,我們選取頻數(shù)在10%以上的中藥(視為高頻藥物)進(jìn)行數(shù)據(jù)挖掘。由于中藥處方中的中藥名稱以中文形式表示,因此需要將其進(jìn)行易于數(shù)據(jù)挖掘算法識別的數(shù)據(jù)特征化處理,方法如下:

(一)藥物表的特征化方法

根據(jù)醫(yī)務(wù)工作者的經(jīng)驗,將治療該病癥的常見中藥分為活血化瘀通經(jīng)類、清熱祛濕泄?jié)犷悺⑿袣庠餄窕殿悺⒁鏆饨∑仃栴悺⒀a(bǔ)益脾腎之陽類、滋養(yǎng)肝腎之陰類等六大類。將高頻藥物分別歸于這六大類中,針對每大類建立相應(yīng)的數(shù)據(jù)表。每條數(shù)據(jù)采用布爾常量的表示形式如圖1所示。

其中,第一項表示病人編號,每一條記錄表示一位病人的用藥信息,編號之后的每一位布爾數(shù)據(jù)表示某味中藥是否在該處方中出現(xiàn),1表示出現(xiàn),0表示未出現(xiàn)。

(二)類別表的特征化方法

為了進(jìn)一步分析各大類之間的關(guān)聯(lián)性,建立一個數(shù)據(jù)類別表(同一條處方中出現(xiàn)某一類藥物中兩味或兩味以上,即判定使用了該類別中藥)。每條記錄表示一位病人用藥的類別信息,其中第一項表示病人編號,編號之后的每一位表示該類別藥物是否在該處方中使用,1表示使用,0表示未使用。

按照上述方法建成中藥藥物數(shù)據(jù)庫,其中包括:包含所有藥物的處方數(shù)據(jù)集、統(tǒng)計藥物頻次的藥物計數(shù)數(shù)據(jù)集、由專業(yè)醫(yī)生按照性味、功用劃分的六種不同類別的高頻藥物數(shù)據(jù)集以及判斷處方中是否使用某類藥物的類別數(shù)據(jù)集。

3中醫(yī)處方經(jīng)驗的挖掘方法

3.1對每一類藥物中包含的各味中藥進(jìn)行關(guān)聯(lián)規(guī)則建模

首先對數(shù)據(jù)庫中的藥物進(jìn)行頻數(shù)統(tǒng)計,即在處方中出現(xiàn)的次數(shù);然后將數(shù)據(jù)庫中所有同類別的藥物按照其在整體處方中出現(xiàn)的頻數(shù)降序排列。如果藥物排列靠前說明其在處方中出現(xiàn)頻率較高,為醫(yī)生的常用中藥,具有較高的參考價值。同時,參考專業(yè)醫(yī)生的經(jīng)驗,本文將支持度和置信度的閾值均設(shè)置為10%.將其視為指導(dǎo)臨床應(yīng)用意義較大.對各類藥物數(shù)據(jù)采用Apriori算法建模,生成每一類別中藥間的關(guān)聯(lián)規(guī)則。

3.2對六類藥物之間進(jìn)行關(guān)聯(lián)性規(guī)則建模

逐條分析223條中藥處方中所包含的藥物類別(同一條處方中出現(xiàn)某一類藥物兩味或兩味以上,即認(rèn)定含有該類別中藥),統(tǒng)計223條中藥處方中每一類別藥物的應(yīng)用頻數(shù),將其在數(shù)據(jù)庫中由高到低依次排列.根據(jù)專業(yè)醫(yī)生的經(jīng)驗,設(shè)置支持度和置信度的閾值均為10%,將其視為指導(dǎo)臨床應(yīng)用意義較大.對類別數(shù)據(jù)采用Apriori算法建模,生成六類中藥其類別之間的關(guān)聯(lián)規(guī)則.

4關(guān)聯(lián)性分析

4.1同類別中藥的關(guān)聯(lián)分析

將關(guān)聯(lián)規(guī)則按照支持度降序排序,體現(xiàn)出常用藥對以及多味中藥同時出現(xiàn)的規(guī)律.以第一大類藥物為例,通過對關(guān)聯(lián)規(guī)則的統(tǒng)計分析發(fā)現(xiàn):在此類中藥處方中,三味中藥同時出現(xiàn)的概率高達(dá)65%;四味中藥中藥同時出現(xiàn)的概率大約在31%左右;五味中藥同時出現(xiàn)的概率減少到14%左右;六味中藥同時出現(xiàn)的概率驟減到1%;而七味及以上中藥同時出現(xiàn)的概率則為0。第一類藥物的部分關(guān)聯(lián)規(guī)則如表P。

對同一類藥物,本文采用定向網(wǎng)絡(luò)關(guān)系圖表示藥對之間的關(guān)系。連接兩位中藥之間的連線越粗,表明這個藥對出現(xiàn)在處方中的頻數(shù)越高;越細(xì)就表明這個藥對出現(xiàn)在處方中的頻率越低.圖2所示為輸出第一類藥物中頻數(shù)最高的中藥與其它各味中藥的關(guān)聯(lián)關(guān)系的定向網(wǎng)絡(luò)圖。

結(jié)論分析:

縱觀全部類別的所有頻繁項集,發(fā)現(xiàn)在各類藥物中,往往是同類別藥物多味聯(lián)用,以增強(qiáng)其功效;而在聯(lián)用時,又會有一定的味數(shù)限制,數(shù)目通常為三味至五味為多。通過定向網(wǎng)絡(luò)圖可以分析出針對某一種藥物與其它中藥成對出現(xiàn)的規(guī)律:由處方中頻數(shù)高的藥物組成的藥對,其之間的關(guān)聯(lián)關(guān)系更為密切。

4.2不同類別藥物之間的關(guān)聯(lián)性分析

在223條有效的類別數(shù)據(jù)記錄中,生成的規(guī)則總數(shù)為154條,為了便于結(jié)果分析,將其按照支持度降序排列。通過對關(guān)聯(lián)規(guī)則的統(tǒng)計分析得出:前兩類藥的支持度高達(dá)95.5%;前三類藥的支持度為89%;前四類藥的支持度為70.9%;前五類藥的支持度驟減到25.6%;而全部六類藥的支持度僅為5.8%。現(xiàn)僅摘取前項含有前兩類中藥的關(guān)聯(lián)規(guī)則見表2。

結(jié)論分析:

前四類中藥之間的相互關(guān)系最為密切,其次是這四類中藥分別與第五、六類之間的關(guān)系,而第五、六類中藥之間關(guān)系的密切程度則大大降低。從關(guān)聯(lián)規(guī)則的結(jié)果可以分析得出前四個類別的藥物屬于常用和聯(lián)用的藥物。

5結(jié)語

本文通過對中藥數(shù)據(jù)集的特征化處理,采用基于頻繁項集的Apriori經(jīng)典關(guān)聯(lián)規(guī)則算法,對中醫(yī)處方中藥物的頻繁項集和藥物之間的關(guān)聯(lián)關(guān)系進(jìn)行了有益的探索,發(fā)現(xiàn)了常用藥物組合及配伍特點,獲得了普通處方分析較難獲得的處方經(jīng)驗信息.實驗結(jié)果證明:使用關(guān)聯(lián)規(guī)則對中藥數(shù)據(jù)庫建模,可以挖掘出中醫(yī)在治療某種疾病方面的用藥特點,為研究臨床用藥規(guī)律提供了有效方法。

猜你喜歡
中醫(yī)數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
糖尿病患者的中醫(yī)飲食護(hù)理相關(guān)問題分析
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
引產(chǎn)術(shù)后胎盤殘留的中醫(yī)治療方法
今日健康(2016年12期)2016-11-17 14:53:45
中醫(yī)英譯的誤譯現(xiàn)象探析
社區(qū)中醫(yī)干預(yù)初產(chǎn)婦產(chǎn)后焦慮及抑郁的效果
芻議中醫(yī)養(yǎng)生理念在瑜伽教學(xué)中的融入
體育時空(2016年8期)2016-10-25 20:56:21
關(guān)于中西醫(yī)結(jié)合治療乳腺增生病38例臨床觀察
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 日韩国产亚洲一区二区在线观看| 久久精品这里只有国产中文精品| 看看一级毛片| 亚洲成人免费看| 91久久精品国产| 久久国产亚洲偷自| 国产精品原创不卡在线| 色丁丁毛片在线观看| 亚洲AV无码精品无码久久蜜桃| 久久鸭综合久久国产| 国内精品91| 免费又黄又爽又猛大片午夜| 国产亚洲日韩av在线| 97se亚洲综合在线天天| 久久久久国产精品熟女影院| 在线观看无码av免费不卡网站| 国产区福利小视频在线观看尤物| 亚洲无限乱码| 日本精品一在线观看视频| 亚洲区第一页| 91黄视频在线观看| 亚洲美女视频一区| 婷五月综合| 国产在线第二页| 免费xxxxx在线观看网站| 亚洲美女一区| 欧美区国产区| 少妇精品网站| 久久久久亚洲av成人网人人软件| 成人亚洲视频| 久久综合AV免费观看| 午夜精品区| 亚洲精品中文字幕无乱码| 国模极品一区二区三区| 九九九九热精品视频| 久久精品国产免费观看频道| 欧美日韩国产成人高清视频| 亚洲精品777| 免费看av在线网站网址| 中文字幕亚洲综久久2021| 成人一区在线| 色悠久久综合| 成人综合在线观看| 欧美日一级片| 亚洲欧美一区二区三区麻豆| 无码精品一区二区久久久| 亚洲国内精品自在自线官| 婷婷六月综合| 亚洲女同一区二区| 极品私人尤物在线精品首页| 日本亚洲欧美在线| 亚洲欧美人成人让影院| 国产精品久久久精品三级| 日本在线欧美在线| 久久国产av麻豆| 日韩大片免费观看视频播放| 中日韩欧亚无码视频| 欧美激情视频二区| 九色国产在线| 狼友视频国产精品首页| 在线网站18禁| 午夜啪啪网| 国产XXXX做受性欧美88| 欧美日韩理论| 亚洲成人免费在线| 五月天香蕉视频国产亚| 日韩在线欧美在线| 欧美天堂久久| 日韩精品资源| 久久国产精品娇妻素人| 91精品专区国产盗摄| 99久久精品免费看国产免费软件| 女人一级毛片| 日本一本正道综合久久dvd | 亚洲第一成年网| 制服丝袜在线视频香蕉| 台湾AV国片精品女同性| 日本高清成本人视频一区| 日本草草视频在线观看| 欧美精品H在线播放| 亚洲九九视频| 欧美a级在线|