999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘的疾病預(yù)測模型的構(gòu)建與分析

2016-09-20 05:46:04李奮華趙潤林運城學(xué)院計算機科學(xué)與技術(shù)系運城044000中國科學(xué)院大學(xué)北京0090
現(xiàn)代計算機 2016年18期
關(guān)鍵詞:數(shù)據(jù)挖掘模型研究

李奮華,趙潤林(.運城學(xué)院計算機科學(xué)與技術(shù)系,運城 044000 2.中國科學(xué)院大學(xué),北京 0090)

基于數(shù)據(jù)挖掘的疾病預(yù)測模型的構(gòu)建與分析

李奮華1,2,趙潤林1
(1.運城學(xué)院計算機科學(xué)與技術(shù)系,運城044000 2.中國科學(xué)院大學(xué),北京100190)

0 引言

自從1995年數(shù)據(jù)挖掘的概念提出以來,數(shù)據(jù)挖掘技術(shù)的發(fā)展雖然僅有二十多年的歷史,但其在商業(yè)、工程、電信等領(lǐng)域已經(jīng)獲得了廣泛的應(yīng)用,并取得了可觀的經(jīng)濟效益和社會效益。然而,數(shù)據(jù)挖掘技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用尚處于起步階段。在信息爆炸的大數(shù)據(jù)時代,由于硬件和信息技術(shù)的迅猛發(fā)展,各行各業(yè)每時每刻都會產(chǎn)生大量的數(shù)據(jù),人們被淹沒在數(shù)據(jù)的海洋中,如何從這些海量的數(shù)據(jù)中發(fā)現(xiàn)潛在、有價值的信息難度很大。

在醫(yī)療行業(yè),隨著醫(yī)院信息系統(tǒng)(HIS)在全國各大醫(yī)院的逐步推廣和應(yīng)用,醫(yī)院每天都會產(chǎn)生大量與病人相關(guān)的臨床數(shù)據(jù),而且這些數(shù)據(jù)的規(guī)模越來越大,在這些真實的數(shù)據(jù)中蘊含著許多對病人和醫(yī)生來說潛在、有價值的信息[1]。如何有效地利用這些真實的臨床數(shù)據(jù),并從中發(fā)現(xiàn)一些對病人治療和醫(yī)生診斷有價值的規(guī)律和信息十分關(guān)鍵,也是當(dāng)前醫(yī)學(xué)信息處理研究中一個亟待解決的難題。上述問題的解決不僅能在一定程度上緩解當(dāng)前社會上存在的緊張醫(yī)患關(guān)系,而且還能有效地輔助醫(yī)生診斷、決策和治療,提高醫(yī)生的工作效率,進而提高醫(yī)院的醫(yī)療服務(wù)質(zhì)量和競爭力[2]。

本文將據(jù)挖掘技術(shù)引入到醫(yī)學(xué)數(shù)據(jù)分析中,提出了一種基于決策樹的疾病預(yù)測模型,并在實際的醫(yī)學(xué)疾病數(shù)據(jù)集上驗證了其效果。第2節(jié)簡要地介紹了決策樹算法的原理,在此基礎(chǔ)上,第3節(jié)提出一種基于決策樹的疾病預(yù)測模型,并在真實醫(yī)學(xué)數(shù)據(jù)集上(二型糖尿病臨床數(shù)據(jù))進行了實驗驗證,預(yù)測效果良好。

1 決策樹算法的基本原理

決策樹算法是數(shù)據(jù)挖掘技術(shù)中常用的一種分類和預(yù)測方法[3]。該算法以研究對象的屬性為基礎(chǔ),根據(jù)信息論的原理,通過多次遞歸的方式選擇信息增益最大的屬性來作為決策樹的當(dāng)前節(jié)點(即:最佳節(jié)點),在決策樹構(gòu)建過程中,已經(jīng)使用過的屬性在決策樹的后續(xù)構(gòu)建時不能再作為節(jié)點來使用,即:研究對象的每個屬性在決策樹中當(dāng)且僅當(dāng)出現(xiàn)一次。在決策樹的構(gòu)建過程中,遞歸過程的終止情況有下列三種:

(1)當(dāng)前節(jié)點對應(yīng)的所有研究對象均屬于同一類別。

(2)沒有剩余屬性被用來進一步對當(dāng)前研究對象進行分類。

(3)當(dāng)前節(jié)點所對應(yīng)的屬性值對應(yīng)的研究對象個數(shù)為0。

假設(shè)M、m分別表示研究對象集合和該集合中包含對象的個數(shù)。L={l1,l2,l3,…,ln}表示研究對象的類別集合。mi表示類別 li中研究對象的個數(shù),那么,根據(jù)信息論原理,對一個研究對象進行分類需要的信息量如下:

其中,pi=mi/m表示一個研究對象輸入類別li的概率。

設(shè)一個屬性 X的取值集合為X={x1,x2,…,xs}。屬性X能夠把研究對象集合M劃分為s個子集{M1,M2,…,Ms},其中Mi表示屬性X=xi的研究對象的集合。如果屬性 X被選為決策樹的當(dāng)前節(jié)點,mij表示子集 Mj中屬于li類別的研究對象的個數(shù),因此,采用屬 X對當(dāng)前研究對象集合進行劃分所需信息熵的計算公式如下:

其中,pij=mi/(|Mj|)表示研究對象子集Mj中任意一個對象屬于類別 li的概率。由公式(1)和(2)可知,通過屬性對相應(yīng)研究對象集合進行劃分的信息增益計算公式如下:

具體的決策樹算法描述如下:

2 基于決策樹的疾病預(yù)測模型的構(gòu)建與分析

針對醫(yī)療行業(yè)的現(xiàn)狀,為提高醫(yī)生疾病診斷的效率和緩解醫(yī)患矛盾,在數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上,本文提出了一種基于決策樹的疾病預(yù)測模型,如圖1所示,并在真實醫(yī)學(xué)數(shù)據(jù)集上(即:二型糖尿病臨床數(shù)據(jù))進行了實驗。

圖1 基于決策樹的疾病預(yù)測模型

本文采用Clementine 12數(shù)據(jù)挖掘工具來構(gòu)建疾病預(yù)測模型,并在二型糖尿病臨床數(shù)據(jù)集上進行了有效實驗[4]。該數(shù)據(jù)集包含8個與二型糖尿病相關(guān)的臨床檢查病癥,共768條記錄,如圖2所示[5]。

在實驗過程中,本文把上述實驗數(shù)據(jù)集分為訓(xùn)練集和測試集兩部分,通過訓(xùn)練集來構(gòu)建和提取決策樹規(guī)則,利用測試集來對該模型在實際應(yīng)用中的效果進行驗證,預(yù)測效果如圖3所示。從圖3中,我們發(fā)現(xiàn)該疾病預(yù)測模型的預(yù)測正確率是74.52%,預(yù)測錯誤率是25.48%,這也有效地驗證了基于決策樹的疾病預(yù)測模型的有效性。實驗證明,該模型可以有效地輔助醫(yī)生進行疾病的診斷,提高醫(yī)生工作的效率,在一定程度上緩解病人看病難、排隊時間長的問題,具有一定的實用價值。

圖2 二型糖尿病臨床數(shù)據(jù)集

3 結(jié)語

針對醫(yī)療領(lǐng)域存在的問題,從數(shù)據(jù)挖掘的角度出發(fā),本文提出了一種基于決策樹的疾病預(yù)測模型,在真實醫(yī)學(xué)數(shù)據(jù)集——二型糖尿病數(shù)據(jù)上進行了實驗,預(yù)測效果較明顯,能夠有效地輔助醫(yī)生進行疾病的診斷,提高醫(yī)生疾病診斷的效率,具有一定的實際意義。

圖3 二型糖尿病數(shù)據(jù)預(yù)測效果

[1]徐剛,袁兆康.?dāng)?shù)據(jù)挖掘在醫(yī)學(xué)領(lǐng)域的應(yīng)用和展望[J].實用臨床醫(yī)學(xué),2006,7(13):11-15.

[2]石義芳,孔令人.數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)在病人流量分析中的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學(xué),2006,33(02),p23-25.[3]邵峰晶,于忠清.?dāng)?shù)據(jù)挖掘原理與算法[M].北京:科學(xué)出版社,2009.

[4]熊平.?dāng)?shù)據(jù)挖掘算法與Clementine實踐[M].北京:清華大學(xué)出版社,2011.

[5]張承紅.醫(yī)學(xué)數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:中國中醫(yī)藥出版社,2008.

Big Data;Data Mining;HIS;Disease Prediction

Design and Analysis of Disease Prediction Model Based on Data Mining

LI Feng-hua1,2,ZHAO Run-lin2
(1.Department of Computer Science and Technology,Yuncheng University,Yuncheng 044000;2.University of Chinese Academy of Sciences,Beijing 100190)

國家自然科學(xué)基金項目(No.61272480)

李奮華(1977-),男,山西昔陽縣人,博士,講師,研究方向為數(shù)據(jù)挖掘、社會計算和電子健康

2016-05-02

2016-06-20

在大數(shù)據(jù)時代,HIS在全國絕大多數(shù)醫(yī)院得到有效推廣,這在一定程度上提高醫(yī)院的工作效率,但是也產(chǎn)生一個亟待解決的重要問題:如何能在HIS的海量醫(yī)學(xué)數(shù)據(jù)中發(fā)現(xiàn)潛在、有價值的信息,從而有效地支持醫(yī)生進行疾病的診斷與決策,進而緩解當(dāng)前緊張的醫(yī)患關(guān)系。把數(shù)據(jù)挖掘技術(shù)引入到海量醫(yī)學(xué)數(shù)據(jù)的分析中,提出一種基于決策樹的疾病預(yù)測模型,并在實際的醫(yī)學(xué)疾病數(shù)據(jù)集上進行驗證,能取得較好的預(yù)測效果。

大數(shù)據(jù);數(shù)據(jù)挖掘;醫(yī)院信息系統(tǒng);疾病預(yù)測

趙潤林(1960-),男,山西運城人,本科,副教授,研究方向為計算機系統(tǒng)結(jié)構(gòu)

In big data era,HIS is applied in many hospitals of our country in order to improve their work efficiency.But there is a challenging problem to solve:how to find some latent and valuable information or principles from the massive data in HIS is very important,because this not only can support the disease diagnosis and decision of doctors in some extent,but also can relieve the tense relationships between doctors and patients.Applies data mining technologies to the analysis of massive medical data,proposes a disease prediction model based on decision tree method.Through the experiments of real medical datasets,some empirical studies are shown to demonstrate the effectiveness of this model on real medical data sets.

猜你喜歡
數(shù)據(jù)挖掘模型研究
一半模型
FMS與YBT相關(guān)性的實證研究
遼代千人邑研究述論
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
3D打印中的模型分割與打包
主站蜘蛛池模板: 人妻91无码色偷偷色噜噜噜| 久久精品国产在热久久2019| 免费一级毛片在线观看| 国产真实乱子伦精品视手机观看| 国产老女人精品免费视频| 91色国产在线| 久久狠狠色噜噜狠狠狠狠97视色| 国产黄色片在线看| v天堂中文在线| 免费一级毛片不卡在线播放| 欧美色亚洲| 亚洲精品视频网| 久久国语对白| 国产精品极品美女自在线看免费一区二区| 国产精品亚洲欧美日韩久久| 欧美成人手机在线视频| 亚欧美国产综合| 日韩欧美国产中文| 欧美精品导航| 美女视频黄频a免费高清不卡| a毛片免费在线观看| 亚洲精品福利视频| 在线观看欧美国产| 亚洲三级成人| 亚洲精品成人7777在线观看| 国产精品一区二区不卡的视频| 欧美精品啪啪| 亚洲AV成人一区国产精品| 伊人久久精品无码麻豆精品| 婷婷亚洲视频| 国产美女无遮挡免费视频| www.国产福利| 少妇精品网站| 园内精品自拍视频在线播放| 伊人久久精品亚洲午夜| 九九久久精品免费观看| 国产成人精品在线| 精品国产99久久| 色丁丁毛片在线观看| 国产在线视频导航| 黄色网址手机国内免费在线观看| 伊人久久福利中文字幕| 91福利在线看| 岛国精品一区免费视频在线观看 | 亚洲国产成人超福利久久精品| 人妻精品久久无码区| 欧美激情第一欧美在线| 国产成人毛片| 美女一区二区在线观看| 99尹人香蕉国产免费天天拍| 免费不卡视频| 国产尤物jk自慰制服喷水| 亚洲AV成人一区国产精品| 国产99免费视频| 成人综合网址| 中文字幕天无码久久精品视频免费| 青青国产视频| 中国美女**毛片录像在线| 国产欧美日韩精品第二区| 国产精品免费p区| 欧美日韩国产一级| 这里只有精品在线| 久久精品丝袜| 亚洲欧美精品一中文字幕| 欧美日韩国产成人高清视频| 国产精品无码一区二区桃花视频| 99精品这里只有精品高清视频| 欧美曰批视频免费播放免费| 色呦呦手机在线精品| 亚洲综合香蕉| 毛片在线播放网址| 午夜福利网址| 视频二区亚洲精品| 毛片在线播放网址| 国产毛片高清一级国语| 国产又色又爽又黄| 免费黄色国产视频| 国产特级毛片| 成人国产三级在线播放| 国产精品观看视频免费完整版| 亚洲综合激情另类专区| 青青操国产|