999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

典型機器學習算法在脂肪肝分類預測研究中的實現與比較△

2019-01-14 07:45:52余秋燕孫繼佳邵建華
數理醫藥學雜志 2019年1期
關鍵詞:分類模型

余秋燕 趙 瑩 孫繼佳 邵建華

(上海中醫藥大學中藥學院數理教研室 上海 201203)

脂肪肝(Fatty Livers)是由多種疾病和病因所導致的肝臟脂肪代謝功能障礙,進而使肝內脂質蓄積過多的一種病理變化,也是一種臨床常見病癥。現代醫學認為,脂肪肝不是一個獨立的疾病,常見的一些導致脂肪肝疾病因素有肥胖、酒精中毒、高脂血癥等[1],而甘油三酯、體重、舒張壓等危險因素指標是形成脂肪肝的主要危險因素[2]。雖然目前針對脂肪肝發生的危險因素研究有很多,但是脂肪肝的發病機制仍然不夠完全明確,通過應用數據科學的方法,尋找對脂肪肝影響的因素是科學且有效的。

機器學習可以通過自動學習大量輸入的數據樣本內在結構和規則,進而對新樣本進行智能的辨識,甚至實現對未來的預測[3]。隨著機器學習與大數據的結合,如今,越來越多的科研人員運用機器學習方法對醫藥領域進行探索,推動著疾病診療規范化的發展[4]。

本文根據所收集到的實際臨床體檢數據資料,應用5種典型的機器學習建模方法,對脂肪肝分類辯證進行分類預測和比較分析,旨在為脂肪肝分類辯證提供客觀、標準和規范的算法模型。

1 資料與方法

1.1 資料來源

原始臨床數據來源于2017年上海市浦東新區某地段醫院60歲以上2337例老年人體檢的實際臨床資料。

1.2 臨床數據預處理

首先,對2337例原始數據進行初步篩選,剔除部分有缺失和不完全等模糊的臨床記錄,通過篩選剩余1956例。研究中選取一些重點關注的臨床指標,運用R語言,通過主成分分析(PCA)進行降維并提取主成分,得到:臀圍(HIP)、總膽固醇(TC)、谷草轉氨酶(AST)、肌酐(CR)、收縮壓(SBP)、甘油三酯(TG)、白蛋白(ALB),總共7個主成分。將所有主成分臨床指標作為參數自變量,脂肪肝分類判別(FL)作為結果變量建立模型。同時,將脂肪肝分類當中的輕度脂肪、中度脂肪、脂肪歸為“有脂肪肝”,將無歸為“無脂肪肝”,分別編號1和0。資料顯示,有脂肪肝的病例為1044例,無脂肪肝的病例為912例。

數據預處理后,再對數據進行標準化,本文采用“0-1標準化”,即公式(1)所示:

(1)

1.3 5種模型在R語言的應用程序包

本文將通過R語言機器學習相關工具包實現模型構建和預測,分別使用到:C5.0(決策樹)、nnet(神經網絡)、e1071(支持向量機)、bnlearn(貝葉斯網絡)和randomForest(隨機森林)等5種R語言包。

2 結果

2.1 5種機器學習模型分類預測結果

本研究通過應用R語言來實現機器學習模型的建立,安裝加載“gmodels”添加包以輸出混淆矩陣,通過R包中的CrossTable()函數查看結果,例如,決策樹(Decision Tree, DT)模型預測結果如表1所示。

表1 決策樹DT的預測結果

Actual FLPredicted FL01Row Total0125(25.56%)105(21.47%)230141 (8.38%)218(44.58%)259Column Total166323489

2.2 模型的評估與比較

在1956例臨床體檢數據中,模型的訓練集取75%,即1467例樣本用于訓練;測試集取25%,即489例樣本用于預測,五類機器學習模型的效度評價如表2所示。

觀察數據,發現決策樹模型的預測準確率最高,達到了70%以上,支持向量機和神經網絡模型次之,處于68%左右的水平,而貝葉斯網絡模型的預測性能最低,僅有62.17%。由此可見,決策樹模型的分類預測效果最優,應用在小樣本數據上有優勢;同時,觀察貝葉斯網絡結構圖(圖1)和重要性評分,發現臀圍(HIP)和甘油三酯(TG)對脂肪肝分類的重要性評分最高,關聯密切,且對脂肪肝分類預測有直接和間接的影響因素。

表2 5類機器學習模型的效度評價

模型FL預測準確率(%)決策樹(Decision Tree, DT)70.14神經網絡(Neural Network, NN)68.30支持向量機(Support Vector Machine, SVM)68.71貝葉斯網絡(Bayesian Network, BN)62.17隨機森林(Random Forest, RF)66.05

圖1 貝葉斯網絡結構圖

3 討論

在脂肪肝分類預測研究中,機器學習方法的應用是研究的一個重要方向,而且也被廣泛應用在臨床研究當中。例如,呂航等[5]運用決策樹模型來探討糖尿病伴發非酒精性脂肪肝病的預測作用,構建風險模型;權蔚蔚等[6]將BP神經網絡引入到脂肪肝的圖形識別中;韓秀芝等[7]使用LBP特征提取肝臟超聲圖像特征后,采用了支持向量機對脂肪肝等肝病進行了分類;張永媛[8]采用了貝葉斯網絡即概率圖模型,對非酒精性脂肪肝與代謝綜合癥之間的潛在雙向因果關系進行了推斷;白江梁等[9]探討了隨機森林在體檢人群糖尿病、脂肪肝的風險預測中的應用等。

本文所運用的5種典型機器學習算法在數據挖掘領域中是比較成熟且穩定的,我們將其模型運用到體檢數據研究當中,提取了重要的指標作為參數并進行了比較分析,基于預測結果的準確率,驗證了各個模型的有效性和可行性,為脂肪肝疾病預測提供了基于數據科學的研究方法。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: www.国产福利| 欧美成人国产| 欧美精品亚洲精品日韩专区| 无码专区国产精品第一页| 日韩午夜伦| 亚洲一级毛片在线观| 最新亚洲av女人的天堂| 91无码视频在线观看| 亚洲无码精彩视频在线观看| 91丝袜乱伦| 中文字幕日韩欧美| 久久国产高潮流白浆免费观看| 精品少妇人妻av无码久久| 91探花国产综合在线精品| 91精品国产福利| 91国内在线观看| 久久这里只有精品免费| 欧美三级视频在线播放| 精品国产自在在线在线观看| 欧美日韩va| 夜夜爽免费视频| 欧美另类图片视频无弹跳第一页| 成人毛片免费在线观看| 在线观看亚洲天堂| 亚洲人视频在线观看| 污网站在线观看视频| 亚洲第一黄色网| 久久久久青草大香线综合精品| 欧美人在线一区二区三区| 国产自视频| 91啦中文字幕| 午夜国产精品视频黄 | 国产成人精品免费视频大全五级| 亚洲国产一区在线观看| 激情在线网| 77777亚洲午夜久久多人| 亚洲精品欧美日本中文字幕| 3344在线观看无码| 高清无码手机在线观看| 大陆国产精品视频| 在线五月婷婷| 婷婷亚洲最大| 国产一级妓女av网站| 亚洲色图欧美视频| 欧美日一级片| 狠狠色狠狠综合久久| 国产无码在线调教| 秋霞国产在线| 国产乱子伦视频在线播放| 天堂成人av| 激情综合婷婷丁香五月尤物| 国产成人一区| 久久久久久久蜜桃| 91原创视频在线| 国产69精品久久久久孕妇大杂乱| 国产在线一区视频| 人妻21p大胆| 在线欧美一区| 国产亚洲精品91| 国产手机在线ΑⅤ片无码观看| 精品亚洲欧美中文字幕在线看| 国产成人夜色91| 国产午夜小视频| 国产真实乱子伦视频播放| 国产欧美日韩91| 亚洲欧美激情另类| 欧美日韩国产在线观看一区二区三区| 亚洲人精品亚洲人成在线| 国产菊爆视频在线观看| 亚洲精品天堂在线观看| 欧美在线视频不卡| 中文字幕在线日韩91| 欧美日韩成人在线观看 | 最新国产精品鲁鲁免费视频| 国产精品大尺度尺度视频| 777午夜精品电影免费看| 一本大道东京热无码av | 久久这里只有精品2| 中文字幕日韩欧美| 亚洲日韩高清无码| 亚洲国产黄色| 亚洲一区二区三区香蕉|