999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹算法的小兒肺炎臨床辨證分類模型研究

2013-09-14 08:06:52馬凌燕魏本征
電子測試 2013年5期
關鍵詞:數據挖掘小兒分類

岳 路 馬凌燕 魏本征

(山東中醫藥大學,山東濟南 250355)

1 引言

目前醫院都在推行信息管理系統,為患者建立電子病歷,隨著電子病歷的普及,存儲的數據量急劇增加,這些數據內部存在著各種千絲萬縷的聯系,如何對這些海量數據進行篩選、分析,并發現其中未知的規律是一個非常有研究價值的方向。數據挖掘就是一種用于在大規模數據中發現知識的常用技術,在對病歷數據進行挖掘的過程中,最關鍵的問題是能否選擇適用于挖掘環境的數據挖掘算法,能否建立恰當的分類模型。

肺炎是一種危害嬰幼兒健康和生命安全的常見病,是導致5歲以下嬰幼兒死亡的主要病因,中醫對于肺炎辯證和治療有獨有的特點和手段,在小兒肺炎的中醫辯證中,要搜集小兒的各種病理表現參數,這些參數在肺炎辯證中具有重要的作用。如小兒肺炎指紋,是指從虎口到食指內側的橈側淺靜脈,由于小兒皮膚很薄,所以這條小靜脈的形狀、顏色、顯露程度可以反應出小兒的血液運行情況和身體狀況,為辯證提供有力依據,故在臨床中,觀察小兒指紋是一種常用的診斷手法。目前,采用數據挖掘技術對小兒肺炎指紋圖像進行研究還處于探索階段,本文以小兒肺炎中醫辨證理論為基礎,結合小兒肺炎指紋圖像,采用決策樹算法構造小兒肺炎分類模型。

2 辨證分類模型算法設計

決策樹是一種典型的分類算法,起源于概念學習系統CLS(Concept Learning System),其方法就是利用信息論中的信息增益尋找具有最大信息量的分類字段,可以從一組無次序、無規則的事例中推理出可視的分類規則,它具有分類和測試速度快,可以選擇重要的決策屬性,分類準確率比較高等優點。

2.1 數據采集

本文涉及到的所有數據來源于山東中醫藥大學附屬醫院兒科臨床病例,共選取300例已經確診的病兒信息作為研究對象,每例含有29個數據項。包括食指內側的橈側淺靜脈的顯露部位、顯露程度、是否流暢、色澤特點、病兒的體溫、咳嗽的特點、舌象、鼻咽部癥狀、消化道癥狀、睡眠狀況、三凹征、是否存在氣促、肺部聽診結果、面部色澤、大便特點、小便特點、變癥等。

2.2 數據預處理

對于臨床采集的數據,難免會產生不完整性、不一致性和噪聲等現象。因此,必須對原始數據進行數據預處理,盡可能提高數據的質量。經過數據預處理,在臨床采集表中共選取目標樣本300個,其中100個樣本作為訓練集,其余200個作為檢驗集。每個樣本提取與分類結果關聯性較強的22個指標屬性,對原始數據中每個分類變量指標數量化,對分類變量指標的可能屬性賦值,例如“指紋顏色”屬性用1表示“淡紅隱隱”,用2表示“紫紅”(見表1);小兒肺炎辨證分類空間共有7個不同取值,如表2所示。

表1 對小兒肺炎辨證有影響的指標屬性

R12 口渴 無(1) 口渴(2)R13 口唇 發紺(1) 紅赤(2) 干燥(3) 紅潤(4)R14 乏力 乏力(1) 無(2)R15 汗出 微汗(1) 多汗(2) 無汗(3)R16 消化道癥狀 腹脹(1) 惡心(2) 嘔吐(3) 無(4)R17 飲食 正常(1) 食少納呆(2)食欲不振(3)R18 大便 正常(1) 溏薄(2) 干結(3)R19 小便 清長(1) 黃赤(2) 正常(3)R20 舌色 淡紅(1) 紅(2) 淡白(3)R21 舌苔厚薄 厚(1) 薄(2) 剝脫苔(3)少苔(4)R22 舌苔顏色 白(1) 黃(2)

表2 小兒肺炎的分類

2.3 生成決策樹

(1)選擇決策樹算法

本文采用的算法采取一系列局部最優決策來構造決策樹。即通過將訓練集相繼劃分成較純的子集,以遞歸方式建立決策樹。設Dt是與結點相關聯的訓練記錄集,而 Y ={y1,y2 ,...,y c}是類標號,遞歸定義如下:

1)如果Dt中所有的記錄都屬于同一個類yt,則t是葉結點,用yt標記。

2)如果Dt中包含屬于多個類的記錄,則選擇一個屬性測試條件(attribute test condition),將記錄劃分成較小的子集,對于測試條件的每個輸出,創造一個子女結點,并根據測試結果將Dt中的記錄分布到子女結點中,然后,對于每個子女結點,遞歸的調用該算法。

建立決策樹的偽代碼描述如下:

(2) 選擇最佳劃分的度量

設 P (i|t)表示給定結點t中屬于類i的記錄所占的比例。選擇最佳劃分的度量可以參照劃分后子女結點不純性的程度。

對某組訓練模型中的結點,需計算每個屬性值的Gini系數,多路劃分的總Gini系數等于子女節點的不純度量的加權平均值。如:當選擇根結點為R1(鼻部癥狀)時,R1產生4路分支,分別是 R1=1(鼻塞),R2=2(黃涕),R3=3(白涕),R4=4(鼻孔干燥)。計算得到:

圖1 小兒肺炎中醫辨證分類的決策樹模型

3 結論

決策樹模型建立后,用200個病歷作為測試樣本進行測試,得出小兒肺炎的辨證分類準確率為82.3%。具有較廣泛的實用價值,可用于小兒肺炎中醫臨床辨證的輔助診斷。

[1] 葉晨洲,楊杰,狄道穎.應用數據挖掘技術從大腦膠質瘤病例中獲取診斷知識.生物醫學工程學雜志,2002,19(3):426-430

[2] 馮少榮,肖文俊.基于樣本選取的決策樹改進算法,西南交通大學學報,2009,5

[3] 龔德平,高穎,唐濤,基于數據挖掘的數字化中醫診斷系統,中國醫學影像技術,2003

猜你喜歡
數據挖掘小兒分類
分類算一算
探討人工智能與數據挖掘發展趨勢
夜盜小兒(下)
幽默大師(2020年11期)2020-11-26 06:12:18
夜盜小兒
幽默大師(2020年10期)2020-11-10 09:07:20
小兒涵之三事
海峽姐妹(2019年12期)2020-01-14 03:24:46
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 三上悠亚精品二区在线观看| 综合色天天| 综合天天色| 国产高清在线丝袜精品一区| 91精品网站| 亚洲伊人天堂| 国产精品第一区| 黄色国产在线| 欧美一区二区福利视频| 中国毛片网| 中文字幕永久视频| 在线观看亚洲天堂| 91原创视频在线| 一级不卡毛片| 亚洲精品在线影院| 国产综合无码一区二区色蜜蜜| 欧美成人看片一区二区三区 | 国产精品三级av及在线观看| 亚洲欧洲日本在线| 欧美亚洲综合免费精品高清在线观看| 成人年鲁鲁在线观看视频| 日韩AV无码免费一二三区| hezyo加勒比一区二区三区| 亚洲福利片无码最新在线播放 | 日本人妻一区二区三区不卡影院| 欧美在线一二区| 九九九精品成人免费视频7| 久久精品视频亚洲| 精品无码一区二区在线观看| 成人国产精品网站在线看 | 美女被操黄色视频网站| a级免费视频| 国产91线观看| 日韩a级毛片| 日本草草视频在线观看| 国产视频a| 国产精品亚洲va在线观看| 97成人在线视频| 91在线视频福利| 激情无码字幕综合| 狠狠综合久久久久综| 中文字幕无码av专区久久| 中文精品久久久久国产网址| 91免费国产在线观看尤物| 久久国产精品影院| 国内精品久久久久鸭| 国产微拍一区二区三区四区| 精品国产亚洲人成在线| 久久99国产综合精品女同| 91亚洲视频下载| 日本欧美一二三区色视频| 国产欧美日韩精品综合在线| 福利片91| 秋霞一区二区三区| 亚洲无线国产观看| 热这里只有精品国产热门精品| 波多野结衣无码视频在线观看| 久久五月天综合| 一区二区自拍| 免费人成网站在线观看欧美| 国产一级无码不卡视频| 在线观看无码av五月花| 欧美视频免费一区二区三区 | 99手机在线视频| 国产精品va| 中文字幕亚洲综久久2021| 精品一區二區久久久久久久網站| 5388国产亚洲欧美在线观看| 亚洲一区二区三区国产精品| 无码精品一区二区久久久| 久操中文在线| 国产精品综合色区在线观看| 天堂成人av| 中国毛片网| 久久久久久尹人网香蕉| 在线观看亚洲天堂| 国产91久久久久久| 手机成人午夜在线视频| 激情无码视频在线看| 91成人试看福利体验区| 国产在线91在线电影| 好吊色国产欧美日韩免费观看|