999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

任務(wù)驅(qū)動(dòng)法在醫(yī)學(xué)數(shù)據(jù)挖掘中的應(yīng)用
——以帕金森綜合征的預(yù)測(cè)為例

2021-01-11 09:29:16肖偉昌聶小英
科教導(dǎo)刊·電子版 2020年33期
關(guān)鍵詞:數(shù)據(jù)挖掘模型

余 維 肖偉昌 聶小英 彭 微

(湖北科技學(xué)院 湖北·咸寧 437100)

0 引言

目前,很多高校結(jié)合自己的優(yōu)勢(shì)進(jìn)行轉(zhuǎn)型發(fā)展,其中不乏向應(yīng)用型進(jìn)行轉(zhuǎn)型,更加注重培養(yǎng)應(yīng)用型人才。針對(duì)理工多學(xué)科交叉專(zhuān)業(yè),比如醫(yī)學(xué)信息工程專(zhuān)業(yè)的專(zhuān)業(yè)課教學(xué),傳統(tǒng)的理論教學(xué)面臨重大的挑戰(zhàn)。傳統(tǒng)的理論教學(xué)往往是學(xué)生被動(dòng)填鴨式的接受知識(shí),雖然能讓學(xué)生學(xué)到很多理論知識(shí),但是在解決實(shí)際問(wèn)題時(shí)十分茫然,不能做到舉一反三。因此有必要以任務(wù)驅(qū)動(dòng)為導(dǎo)向,在結(jié)合案例教學(xué)的基礎(chǔ)上增加學(xué)生的主動(dòng)性,將教師與學(xué)生的角色互換,充分發(fā)揮學(xué)生的主觀能動(dòng)性,讓學(xué)生享受學(xué)習(xí)的過(guò)程,在提高學(xué)習(xí)成效的同時(shí)提高理論與實(shí)踐應(yīng)用的能力。

目前,人口老年化一直呈現(xiàn)出上升趨勢(shì),而帕金森綜合征是一種常見(jiàn)的神經(jīng)系統(tǒng)退行性疾病,常見(jiàn)于老年人。發(fā)病平均年齡約為60歲,帕金森病在40歲以下的年輕人中很少見(jiàn)。大多數(shù)帕金森病患者是散發(fā)性的,只有不到10%的人有家族病史。

本文從加州大學(xué)歐文分校(UCI)的機(jī)器學(xué)習(xí)庫(kù)①中的帕金森綜合征數(shù)據(jù)集入手,對(duì)其數(shù)據(jù)進(jìn)行分析并構(gòu)建一個(gè)帕金森綜合征預(yù)測(cè)模型,以供決策者提高診斷效率及準(zhǔn)確率。根據(jù)所要解決的問(wèn)題,按照數(shù)據(jù)挖掘的流程,本文所得到預(yù)測(cè)帕金森綜合征的分類(lèi)模型是通過(guò)數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、挖掘建模、模型評(píng)估等幾個(gè)階段完成的。通過(guò)對(duì)理論與實(shí)踐操作,學(xué)生能對(duì)數(shù)據(jù)挖掘過(guò)程中的每個(gè)階段有更深刻的認(rèn)識(shí)。

1 數(shù)據(jù)挖掘過(guò)程

1.1 數(shù)據(jù)獲取

本文選取的公開(kāi)數(shù)據(jù)集來(lái)自伊斯坦布爾大學(xué)醫(yī)學(xué)院神經(jīng)內(nèi)科188例帕金森綜合征患者(男性107例,女性81例),年齡從33歲到87歲不等(65.1±10.9)歲。對(duì)照組為64例健康人(男23例,女41例),年齡41-82歲(61.1±8.9)歲。在數(shù)據(jù)收集過(guò)程中,麥克風(fēng)設(shè)置為44.1kHz,并根據(jù)醫(yī)生的檢查,從每個(gè)受試者中收集元音/a/的持續(xù)發(fā)音,并進(jìn)行三次重復(fù)(見(jiàn)表1)。

表1:帕金森病分類(lèi)數(shù)據(jù)集

1.2 數(shù)據(jù)預(yù)處理

對(duì)于龐大的數(shù)據(jù)量,原始數(shù)據(jù)集中的數(shù)據(jù)或多或少是存在質(zhì)量下降的現(xiàn)象,直接利用該數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,不僅會(huì)增加挖掘工作的難度,還會(huì)影響挖掘效果的準(zhǔn)確性。為了減輕影響數(shù)據(jù)挖掘的多種因素,提高用來(lái)挖掘的數(shù)據(jù)質(zhì)量,通常獲取數(shù)據(jù)后需對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,以使混亂無(wú)序的數(shù)據(jù)變?yōu)槿菀追治鎏幚淼臄?shù)據(jù)。對(duì)獲取的數(shù)據(jù)進(jìn)行預(yù)處理步驟通常包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)精簡(jiǎn)等。

1.3 算法建模

要解決的問(wèn)題是通過(guò)對(duì)帕金森綜合征數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘,分類(lèi)得到能有效判斷罹患帕金森綜合征的預(yù)測(cè)模型。基于python的第三方工具庫(kù)中,sklearn作為機(jī)器學(xué)習(xí)領(lǐng)域知名的模塊之一,包含了很多重要的數(shù)據(jù)挖掘算法。鑒于此,考慮選用兩種常用分類(lèi)算法(如KNN算法和決策樹(shù)算法)對(duì)帕金森綜合征數(shù)據(jù)集進(jìn)行分析預(yù)測(cè),并在python語(yǔ)言編程環(huán)境下結(jié)合sklearn庫(kù)進(jìn)行建模②。

1.3.1 決策樹(shù)算法建模

將采集到的188例帕金森綜合征患者數(shù)據(jù)分成兩部分:一部分作為訓(xùn)練集,用來(lái)構(gòu)建模型;另一部分作為測(cè)試集,用來(lái)評(píng)估模型的準(zhǔn)確性。利用sklearn庫(kù)中的train_test_split生成訓(xùn)練集和測(cè)試集,利用sklearn庫(kù)中的Decision Tree Classifier生成決策樹(shù),得到?jīng)Q策樹(shù)模型的核心代碼如下:

1.3.2 KNN算法建模

與上述決策樹(shù)算法建模操作相似,將188例帕金森綜合征患者數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集,利用sklearn庫(kù)中的train_test_split生成訓(xùn)練集和測(cè)試集,利用sklearn的KNeighbors-Classifier方法對(duì)KNN算法進(jìn)行建模,得到KNN算法模型的核心代碼如下:

1.4 模型評(píng)估

利用1.3節(jié)對(duì)188例帕金森綜合征患者數(shù)據(jù)集分離出的訓(xùn)練集生成出對(duì)應(yīng)的決策樹(shù)算法模型和KNN算法模型后,用相應(yīng)的測(cè)試集對(duì)生成的兩種模型進(jìn)行精確度評(píng)估。通過(guò)驗(yàn)證,得到兩種不同模型的預(yù)測(cè)精度。

1.4.1 決策樹(shù)算法模型評(píng)估

利用predict對(duì)測(cè)試數(shù)據(jù)集x_test進(jìn)行預(yù)測(cè),y_predict為預(yù)測(cè)結(jié)果,借助y_test,利用sklearn庫(kù)中的metrics.confusion_matrix生成混淆矩陣結(jié)果并對(duì)y_predict進(jìn)行分析,核心代碼如下:

結(jié)果見(jiàn)表2決策樹(shù)算法模型混淆矩陣表。通過(guò)表2所示的混淆矩陣,計(jì)算出模型的準(zhǔn)確率和錯(cuò)誤率見(jiàn)表4。

表2:決策樹(shù)算法模型混淆矩陣表

1.4.2 KNN算法模型評(píng)估

與1.4.1節(jié)類(lèi)似,通過(guò)測(cè)試集對(duì)模型進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析,核心代碼如下:

結(jié)果見(jiàn)表3 KNN算法模型混淆矩陣表。通過(guò)表3所示的混淆矩陣,計(jì)算出模型的準(zhǔn)確率和錯(cuò)誤率見(jiàn)表4。

表3:KNN算法模型混淆矩陣表

表4:算法模型準(zhǔn)確率和錯(cuò)誤率

由表4能看出,兩種不同的模型中,決策樹(shù)模型對(duì)帕金森綜合征的預(yù)測(cè)更加準(zhǔn)確。

2 小結(jié)

通過(guò)對(duì)公開(kāi)的帕金森綜合征數(shù)據(jù)集入手,對(duì)目標(biāo)任務(wù)進(jìn)行分析,構(gòu)建一個(gè)帕金森綜合征預(yù)測(cè)模型。針對(duì)該分類(lèi)問(wèn)題,本文利用python編程環(huán)境和相關(guān)工具庫(kù)完成了帕金森綜合征數(shù)據(jù)挖掘,包括數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、算法建模與模型評(píng)估等四個(gè)階段。利用機(jī)器學(xué)習(xí)領(lǐng)域著名的 sklearn庫(kù)實(shí)現(xiàn)了決策樹(shù)算法模型和KNN算法模型,并對(duì)188例帕金森綜合征數(shù)據(jù)集分離出的測(cè)試集進(jìn)行模型評(píng)估。通過(guò)對(duì)比決策樹(shù)模型和KNN模型的精確度,能夠得出決策樹(shù)算法在帕金森綜合征數(shù)據(jù)挖掘上的應(yīng)用優(yōu)于KNN算法的結(jié)果。與單純理論教學(xué)相比,課堂學(xué)習(xí)中,將實(shí)踐與理論結(jié)合,使學(xué)生在學(xué)習(xí)理論的同時(shí)加強(qiáng)編程的練習(xí),能有效提高學(xué)生理解并掌握所學(xué)的數(shù)據(jù)挖掘方法在臨床工作中的應(yīng)用。

注釋

① http://archive.ics.uci.edu/ml/index.php

② https://scikit-learn.org/stable/

猜你喜歡
數(shù)據(jù)挖掘模型
一半模型
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
3D打印中的模型分割與打包
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 国产爽妇精品| 97视频在线观看免费视频| 欧美特黄一级大黄录像| 91福利在线看| 成人午夜视频免费看欧美| 亚洲无码91视频| 一级黄色网站在线免费看| 91破解版在线亚洲| 精品超清无码视频在线观看| 国产精品爽爽va在线无码观看| 午夜欧美理论2019理论| 精品无码日韩国产不卡av| 久久国产精品麻豆系列| 午夜福利网址| 日韩二区三区| 国产成人无码综合亚洲日韩不卡| 免费又爽又刺激高潮网址| 免费无遮挡AV| av一区二区三区高清久久| 精品国产自| 久久人搡人人玩人妻精品| 亚洲美女视频一区| 欧美成人日韩| 亚洲水蜜桃久久综合网站| 成年午夜精品久久精品| 国产精品私拍99pans大尺度| 国产精品第| 国产亚洲视频免费播放| 久久毛片免费基地| 久久国产免费观看| 欧美日韩在线成人| 国产成人久久综合一区| 亚洲码在线中文在线观看| 丰满人妻一区二区三区视频| 亚洲欧洲日产国产无码AV| 午夜成人在线视频| 久久a级片| 伊人激情综合| 久久久久久久久18禁秘| 欧洲精品视频在线观看| 亚洲精品麻豆| 亚洲色图欧美| 不卡无码网| 最新无码专区超级碰碰碰| 国产成人区在线观看视频| 欧美中文字幕一区| 天堂成人在线| 亚洲日本在线免费观看| jizz在线观看| 亚洲av无码专区久久蜜芽| 精品91视频| 亚洲大尺码专区影院| 国产一区二区三区在线观看免费| 欧美笫一页| 日韩欧美国产精品| 欧美日韩国产在线人成app| 亚洲无码免费黄色网址| 啦啦啦网站在线观看a毛片| 人妻精品久久久无码区色视| 2024av在线无码中文最新| 成人综合网址| 人妻丰满熟妇αv无码| 992Tv视频国产精品| 91视频日本| 毛片手机在线看| 三级毛片在线播放| 中文字幕有乳无码| 国产传媒一区二区三区四区五区| 影音先锋亚洲无码| 精品国产成人三级在线观看| 亚洲乱码在线视频| 欧洲熟妇精品视频| 粗大猛烈进出高潮视频无码| 国产一级无码不卡视频| 久久国产精品国产自线拍| 午夜电影在线观看国产1区| 婷婷激情五月网| 免费av一区二区三区在线| 国产人成午夜免费看| 天天躁狠狠躁| 亚洲色图欧美| 深爱婷婷激情网|