999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

任務驅動法在醫學數據挖掘中的應用
——以帕金森綜合征的預測為例

2021-01-11 09:29:16肖偉昌聶小英
科教導刊·電子版 2020年33期
關鍵詞:數據挖掘模型

余 維 肖偉昌 聶小英 彭 微

(湖北科技學院 湖北·咸寧 437100)

0 引言

目前,很多高校結合自己的優勢進行轉型發展,其中不乏向應用型進行轉型,更加注重培養應用型人才。針對理工多學科交叉專業,比如醫學信息工程專業的專業課教學,傳統的理論教學面臨重大的挑戰。傳統的理論教學往往是學生被動填鴨式的接受知識,雖然能讓學生學到很多理論知識,但是在解決實際問題時十分茫然,不能做到舉一反三。因此有必要以任務驅動為導向,在結合案例教學的基礎上增加學生的主動性,將教師與學生的角色互換,充分發揮學生的主觀能動性,讓學生享受學習的過程,在提高學習成效的同時提高理論與實踐應用的能力。

目前,人口老年化一直呈現出上升趨勢,而帕金森綜合征是一種常見的神經系統退行性疾病,常見于老年人。發病平均年齡約為60歲,帕金森病在40歲以下的年輕人中很少見。大多數帕金森病患者是散發性的,只有不到10%的人有家族病史。

本文從加州大學歐文分校(UCI)的機器學習庫①中的帕金森綜合征數據集入手,對其數據進行分析并構建一個帕金森綜合征預測模型,以供決策者提高診斷效率及準確率。根據所要解決的問題,按照數據挖掘的流程,本文所得到預測帕金森綜合征的分類模型是通過數據獲取、數據預處理、挖掘建模、模型評估等幾個階段完成的。通過對理論與實踐操作,學生能對數據挖掘過程中的每個階段有更深刻的認識。

1 數據挖掘過程

1.1 數據獲取

本文選取的公開數據集來自伊斯坦布爾大學醫學院神經內科188例帕金森綜合征患者(男性107例,女性81例),年齡從33歲到87歲不等(65.1±10.9)歲。對照組為64例健康人(男23例,女41例),年齡41-82歲(61.1±8.9)歲。在數據收集過程中,麥克風設置為44.1kHz,并根據醫生的檢查,從每個受試者中收集元音/a/的持續發音,并進行三次重復(見表1)。

表1:帕金森病分類數據集

1.2 數據預處理

對于龐大的數據量,原始數據集中的數據或多或少是存在質量下降的現象,直接利用該數據進行數據挖掘,不僅會增加挖掘工作的難度,還會影響挖掘效果的準確性。為了減輕影響數據挖掘的多種因素,提高用來挖掘的數據質量,通常獲取數據后需對數據集進行預處理,以使混亂無序的數據變為容易分析處理的數據。對獲取的數據進行預處理步驟通常包括數據清洗、數據集成、數據變換、數據精簡等。

1.3 算法建模

要解決的問題是通過對帕金森綜合征數據集進行數據挖掘,分類得到能有效判斷罹患帕金森綜合征的預測模型。基于python的第三方工具庫中,sklearn作為機器學習領域知名的模塊之一,包含了很多重要的數據挖掘算法。鑒于此,考慮選用兩種常用分類算法(如KNN算法和決策樹算法)對帕金森綜合征數據集進行分析預測,并在python語言編程環境下結合sklearn庫進行建模②。

1.3.1 決策樹算法建模

將采集到的188例帕金森綜合征患者數據分成兩部分:一部分作為訓練集,用來構建模型;另一部分作為測試集,用來評估模型的準確性。利用sklearn庫中的train_test_split生成訓練集和測試集,利用sklearn庫中的Decision Tree Classifier生成決策樹,得到決策樹模型的核心代碼如下:

1.3.2 KNN算法建模

與上述決策樹算法建模操作相似,將188例帕金森綜合征患者數據集分成訓練集和測試集,利用sklearn庫中的train_test_split生成訓練集和測試集,利用sklearn的KNeighbors-Classifier方法對KNN算法進行建模,得到KNN算法模型的核心代碼如下:

1.4 模型評估

利用1.3節對188例帕金森綜合征患者數據集分離出的訓練集生成出對應的決策樹算法模型和KNN算法模型后,用相應的測試集對生成的兩種模型進行精確度評估。通過驗證,得到兩種不同模型的預測精度。

1.4.1 決策樹算法模型評估

利用predict對測試數據集x_test進行預測,y_predict為預測結果,借助y_test,利用sklearn庫中的metrics.confusion_matrix生成混淆矩陣結果并對y_predict進行分析,核心代碼如下:

結果見表2決策樹算法模型混淆矩陣表。通過表2所示的混淆矩陣,計算出模型的準確率和錯誤率見表4。

表2:決策樹算法模型混淆矩陣表

1.4.2 KNN算法模型評估

與1.4.1節類似,通過測試集對模型進行預測,并對預測結果進行分析,核心代碼如下:

結果見表3 KNN算法模型混淆矩陣表。通過表3所示的混淆矩陣,計算出模型的準確率和錯誤率見表4。

表3:KNN算法模型混淆矩陣表

表4:算法模型準確率和錯誤率

由表4能看出,兩種不同的模型中,決策樹模型對帕金森綜合征的預測更加準確。

2 小結

通過對公開的帕金森綜合征數據集入手,對目標任務進行分析,構建一個帕金森綜合征預測模型。針對該分類問題,本文利用python編程環境和相關工具庫完成了帕金森綜合征數據挖掘,包括數據獲取、數據預處理、算法建模與模型評估等四個階段。利用機器學習領域著名的 sklearn庫實現了決策樹算法模型和KNN算法模型,并對188例帕金森綜合征數據集分離出的測試集進行模型評估。通過對比決策樹模型和KNN模型的精確度,能夠得出決策樹算法在帕金森綜合征數據挖掘上的應用優于KNN算法的結果。與單純理論教學相比,課堂學習中,將實踐與理論結合,使學生在學習理論的同時加強編程的練習,能有效提高學生理解并掌握所學的數據挖掘方法在臨床工作中的應用。

注釋

① http://archive.ics.uci.edu/ml/index.php

② https://scikit-learn.org/stable/

猜你喜歡
數據挖掘模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 无码高潮喷水专区久久| 欧美不卡在线视频| 女人18一级毛片免费观看| 热久久国产| 亚洲熟女中文字幕男人总站| 国产97视频在线| 成人国产一区二区三区| 色AV色 综合网站| 亚洲人妖在线| 狠狠v日韩v欧美v| 18禁影院亚洲专区| 国产欧美又粗又猛又爽老| 免费又爽又刺激高潮网址| 91口爆吞精国产对白第三集 | 一级毛片在线直接观看| WWW丫丫国产成人精品| 囯产av无码片毛片一级| 亚洲精品无码久久久久苍井空| 国产精品欧美激情| 久热中文字幕在线| 亚洲v日韩v欧美在线观看| 欧洲成人免费视频| 亚洲热线99精品视频| 亚洲天堂区| 国产拍在线| 国产91导航| 久久精品国产免费观看频道| 激情六月丁香婷婷| 自拍中文字幕| 国模极品一区二区三区| 国产在线观看91精品亚瑟| 日韩国产一区二区三区无码| 亚洲三级视频在线观看| 99热精品久久| 无码精品福利一区二区三区| 亚洲 欧美 日韩综合一区| 国产成人一区在线播放| 91无码国产视频| 亚洲一区黄色| 欧美一区二区精品久久久| 国产麻豆精品久久一二三| 亚洲AV无码一二区三区在线播放| 亚洲美女久久| 日韩欧美国产三级| 亚洲人成在线精品| 福利一区在线| 欧美精品黑人粗大| 鲁鲁鲁爽爽爽在线视频观看 | 国产99精品久久| 中文字幕亚洲乱码熟女1区2区| 日本精品一在线观看视频| 精品视频福利| 国产精品爆乳99久久| 精品久久人人爽人人玩人人妻| 亚洲av无码片一区二区三区| 精品伊人久久久久7777人| 91麻豆国产视频| 国产亚洲视频免费播放| 性网站在线观看| 香蕉视频在线精品| 狠狠做深爱婷婷综合一区| 99久久精品国产麻豆婷婷| 伊人久久综在合线亚洲2019| 日韩国产一区二区三区无码| 乱系列中文字幕在线视频| 呦系列视频一区二区三区| 国产精品三区四区| 日本一区二区不卡视频| 亚洲第一页在线观看| 无码aaa视频| 国产91线观看| 性喷潮久久久久久久久| 免费国产不卡午夜福在线观看| 亚欧美国产综合| 天天色天天操综合网| 91小视频版在线观看www| 国产毛片高清一级国语| 色婷婷丁香| 亚洲香蕉在线| 精品国产女同疯狂摩擦2| 亚洲动漫h| 国产黑丝一区|