999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類算法在醫(yī)療大數(shù)據(jù)上的應(yīng)用研究

2020-07-22 09:55:45王艷娥張拓楊倩
電腦知識與技術(shù) 2020年12期

王艷娥 張拓 楊倩

摘要:隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,醫(yī)療大數(shù)據(jù)的研究也成為我國醫(yī)療建設(shè)的重要一環(huán),聚類能夠挖掘出醫(yī)療大數(shù)據(jù)中潛在隱藏的信息,協(xié)助醫(yī)生、醫(yī)療管理部門、科研所進行有效工作。研究分析聚類算法K-means和K-medoids在醫(yī)療大數(shù)據(jù)的應(yīng)用,從優(yōu)化聚類算法降低時間復(fù)雜度、對高維醫(yī)療大數(shù)據(jù)進行特征提取降低維度、通過并行處理平臺加速醫(yī)療數(shù)據(jù)的處理速度方面出發(fā),闡明聚類算法在醫(yī)療大數(shù)據(jù)的數(shù)據(jù)預(yù)處理、數(shù)據(jù)分類、疾病預(yù)測等方面都廣泛的應(yīng)用。隨著并行處理平臺的建設(shè),聚類算法在醫(yī)療大數(shù)據(jù)的應(yīng)用也將越來越廣泛。

關(guān)鍵詞:聚類算法;K-means;K-medoids;醫(yī)療大數(shù)據(jù)

中圖分類號:TP181 文獻標(biāo)識碼:A

文章編號:1009-3044(2020)12-0012-02

1聚類與醫(yī)療大數(shù)據(jù)

聚類是數(shù)據(jù)挖掘中無監(jiān)督學(xué)習(xí)分析數(shù)據(jù)常用的方法之一,通過聚類能夠挖掘出數(shù)據(jù)集中隱藏的內(nèi)在的聯(lián)系。醫(yī)療大數(shù)據(jù)的研究是我國醫(yī)療健康必經(jīng)之路,通過聚類對醫(yī)療大數(shù)據(jù)進行分析,有效挖掘其隱藏的關(guān)聯(lián)為臨床診斷和醫(yī)療研究等提供有效的信息。根據(jù)聚類原理的不同,聚類可分為層次聚類、劃分式聚類、基于密度聚類和基于模型的方法,其中劃分式聚類算法因為原理簡單易于實現(xiàn)得到廣泛的應(yīng)用。劃分式聚類算法是按照相似性和相異性原則將數(shù)據(jù)集劃分為k類。采用劃分式聚類算法分析數(shù)據(jù)時需要提前知道數(shù)據(jù)集的類數(shù)k,初始情況下,隨機選擇k個數(shù)據(jù)作為初始聚類中心,再按照相似行原則將其余數(shù)據(jù)劃分給不同的類,然后根據(jù)優(yōu)化目標(biāo)重新選擇新的聚類中心,直到滿足給定的條件為止。K-means算法和K-medoids算法是劃分式聚類算法的典型代表,其中K-means算法因為運行速度快,在醫(yī)療大數(shù)據(jù)的應(yīng)用中得到廣泛的應(yīng)用,K-medoids算法對噪聲點的處理具有較好的效果也得到廣泛的應(yīng)用。原理簡單、易實現(xiàn)得到廣泛的應(yīng)用。

1.1聚類算法

K-means算法和K-medoid算法的算法原理基本相同。K-means算法原理是隨機選擇K個數(shù)據(jù)點作為初始聚類中心,再根據(jù)相似性原則進行分類,使用同類數(shù)據(jù)的均值作為新的聚類中心,如此不斷迭代,直到滿足聚類目標(biāo)結(jié)束。K-medoids算法原理也是隨機選擇K個數(shù)據(jù)作為初始聚類中心,再根據(jù)相似性原則進行分類,使用同類中的最接近中心的實際數(shù)據(jù)作為初始聚類中心,直到滿足聚類目標(biāo)結(jié)束。兩者的相同點是聚類前需要提前告知聚類的類數(shù)K,且初始聚類中心都是隨機選擇。不同點在是K-means算法在迭代聚類中心是選擇的是同類數(shù)據(jù)的均值,從而導(dǎo)致噪聲點對聚類結(jié)果的影響大。K-medoid算法在迭代聚類中心是選擇的是實際的數(shù)據(jù),使得噪聲點的影響較小。傳統(tǒng)的K-means算法和K-medoids算法因為其缺陷,往往不直接應(yīng)用在數(shù)據(jù)處理中,很多研究學(xué)者將這兩種算法進行優(yōu)化,再將其使用在醫(yī)療大數(shù)據(jù)中。

1.2醫(yī)療大數(shù)據(jù)

醫(yī)療大數(shù)據(jù)是大數(shù)據(jù)的一種,具有大數(shù)據(jù)的4V特性:Volume體量大、velocity實時性、variety多樣性、veracity不確定性。醫(yī)療大數(shù)據(jù)的研究對我國臨床醫(yī)療、藥物研究、健康醫(yī)療和基因研究都有著重要的作用。2018年國家衛(wèi)生健康委印發(fā)了《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》,對醫(yī)療健康大數(shù)據(jù)行業(yè)從規(guī)范管理和開發(fā)利用的角度出發(fā)進行規(guī)范。據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布的《中國醫(yī)療信息化行業(yè)市場前瞻與投資戰(zhàn)略規(guī)劃分析報告》統(tǒng)計數(shù)據(jù)顯示截止至2017年我國醫(yī)療信息化市場規(guī)模為448億元,同比增長17.59%。預(yù)測2019年我國醫(yī)療信息化市場規(guī)模將接近600億元。醫(yī)療大數(shù)據(jù)的研究是未來研究的熱點內(nèi)容。

關(guān)于醫(yī)療大數(shù)據(jù)的研究復(fù)雜性主要也是從大數(shù)據(jù)的4V特性出發(fā)。聚類算法在醫(yī)療大數(shù)據(jù)的應(yīng)用涉及醫(yī)療圖像處理、醫(yī)療費用分析、疾病預(yù)測、醫(yī)療數(shù)據(jù)關(guān)鍵性的特征提取等方面。

2聚類算法在醫(yī)療大數(shù)據(jù)中的應(yīng)用

使用聚類算法在處理醫(yī)療大數(shù)據(jù)集,主要的問題是醫(yī)療數(shù)據(jù)體量大。但隨著數(shù)據(jù)并行處理的不斷發(fā)展,對于醫(yī)療大數(shù)據(jù)的可計算問題主要從串行處理和并行處理出發(fā)。其中串行處理主要從優(yōu)化聚類算法提高算法的減少算法運行的時間復(fù)雜度或者通過分析醫(yī)療大數(shù)據(jù)的屬性,進行特征提取方法減少醫(yī)療大數(shù)據(jù)的體量,然后進行聚類等;并行處理主要在hadoop環(huán)境性使用Mapreduce、spark或者storm計算框架進行并行處理,實現(xiàn)對醫(yī)療大數(shù)據(jù)的聚類分析。

2.1基于串行處理的聚類算法在醫(yī)療大數(shù)據(jù)中的應(yīng)用

文獻[3-9]通過對聚類算法進行優(yōu)化,提高算法的運行速度。文獻[3]將優(yōu)化的k-means算法和K-medoids算法應(yīng)用在紅斑鱗狀皮膚病的數(shù)據(jù)中,在提高聚類算法運行速度的同時提高分析的精確度,分析效果良好。文獻[4]將優(yōu)化的K-means算法應(yīng)用在檢測膽固醇高低的真實數(shù)據(jù)集中,優(yōu)化的k-means算法減少時間復(fù)雜度,使K-means算法應(yīng)用在醫(yī)療大數(shù)據(jù)中,同時聚類效果良好。文獻[5]在癌胚抗原數(shù)據(jù)中采用優(yōu)化K-means算法,獲取有價值的診斷信息,協(xié)助癌癥的預(yù)測和防御。文獻[6]針對乳腺癌組織病理中的關(guān)鍵因素腺管密度進行分析,將k-means算法與隨機森林分類算法結(jié)合,能夠?qū)θ橄侔┑淖詣臃诸愡_到較優(yōu)的效果。文獻[7]針對醫(yī)學(xué)圖像中含有重要信息的孤立節(jié)點,通過聚類算法將醫(yī)學(xué)圖片進行分割,將相互孤立的結(jié)點轉(zhuǎn)換為直觀有價值的圖像區(qū)域,實現(xiàn)對孤立結(jié)點的處理,解決醫(yī)療圖像中因為疲勞而對影像出現(xiàn)的一些誤診,提高診斷的準(zhǔn)確率。文獻[8]將聚類算法K-means算法應(yīng)用在醫(yī)療費的分析中,分析出影響醫(yī)療費用的幾個關(guān)鍵因素,通過優(yōu)化關(guān)鍵因素,可以是醫(yī)療費用的使用更加合理有效。文獻[9]針對社會醫(yī)療保險欺詐行為,通過K-means算法建立醫(yī)保欺詐識別的有效模型,有效確認醫(yī)保中的欺騙行為。

醫(yī)療數(shù)據(jù)體量大的一個重要因素是很多醫(yī)療數(shù)據(jù)的維度很高,針對高維度的醫(yī)療大數(shù)據(jù)可以通過特征提取減少醫(yī)療數(shù)據(jù)的體量。文獻[10-12]通過使用聚類算法分析醫(yī)療大數(shù)據(jù)的屬性,針對預(yù)定的目標(biāo)分析出關(guān)系緊密的屬性,進行特征提取,從而減少醫(yī)療大數(shù)據(jù)的體量。文獻[10]針對醫(yī)療大數(shù)據(jù)中不同屬性具有不同的重要性,將部分對聚類結(jié)果沒有或有較少影響的屬性進行約簡,減少醫(yī)療大數(shù)據(jù)的維度,加快醫(yī)療大數(shù)據(jù)的處理速度,同時提高醫(yī)療大數(shù)據(jù)的處理精度。文獻[11]針對大腸早癌研究其診斷方法,通過分析數(shù)據(jù)特征、數(shù)據(jù)預(yù)處理、訓(xùn)練數(shù)據(jù)和分類預(yù)測等方面進行研究,在數(shù)據(jù)特征提取這方面先對聚類算法進行優(yōu)化,再將優(yōu)化的算法應(yīng)用于數(shù)據(jù)集的特征提取中,取得較好效果。文獻[12]針對醫(yī)療大數(shù)據(jù)的高維度,將聚類算法K-means與粗糙集進行結(jié)合,實現(xiàn)醫(yī)療大數(shù)據(jù)的特征提取,并將算法應(yīng)用在乳腺癌數(shù)據(jù)集中,取得良好的效果。

2.2并行處理平臺下聚類算法在醫(yī)療大數(shù)據(jù)上的應(yīng)用

文獻[13-15]是基于Hadoop平臺或Spark平臺下,對k-means算法或k-medoids算法進行優(yōu)化,處理醫(yī)療大數(shù)據(jù)。文獻[13]針對我國醫(yī)療質(zhì)量評價體系存在的問題,基于X-means進行優(yōu)化建立Hadoop平臺,在面對大量醫(yī)療數(shù)據(jù)時能夠快速分析和提高醫(yī)療質(zhì)量評價的精確度。文獻[14]針對K-means算法在Hadoop平臺上許多次遍歷所有數(shù)據(jù)問題,提出優(yōu)化的M+Kmeans算法,該算法對所有數(shù)據(jù)秩序遍歷一次,從而加快算法的運行時間,便于醫(yī)療大數(shù)據(jù)的處理。文獻[15]構(gòu)建Hadoop平臺,在該平臺上對K-means算法進行優(yōu)化,降低算法時間復(fù)雜度、提高算法精確度,使之能夠?qū)A康臄?shù)據(jù)進行分析和處理。隨著并行處理技術(shù)的不斷發(fā)展和平臺建設(shè)的不斷完善,基于并行處理醫(yī)療大數(shù)據(jù)的聚類算法將會越來越多。

3應(yīng)用展望

聚類算法能夠有效挖掘醫(yī)療大數(shù)據(jù)中隱藏的重要信息。隨著國家對醫(yī)療數(shù)據(jù)的標(biāo)準(zhǔn)化、醫(yī)療大數(shù)據(jù)平臺的不斷建設(shè),聚類算法在并行化處理平臺上的應(yīng)用將是未來研究的熱點。

主站蜘蛛池模板: 日本草草视频在线观看| 老司机午夜精品网站在线观看| 国产在线观看一区二区三区| 无码精品一区二区久久久| 久久婷婷五月综合色一区二区| 色吊丝av中文字幕| 中文纯内无码H| 伊人91在线| 夜夜拍夜夜爽| 99人妻碰碰碰久久久久禁片| 欧美在线天堂| 国产视频欧美| 91一级片| 97色伦色在线综合视频| 尤物午夜福利视频| 啪啪永久免费av| 亚洲精品久综合蜜| 一级毛片免费观看不卡视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 久996视频精品免费观看| 亚洲人成成无码网WWW| 久久香蕉国产线看观| 国产福利微拍精品一区二区| 国产成人亚洲欧美激情| 制服丝袜一区| 免费在线a视频| 国产视频 第一页| 中文字幕中文字字幕码一二区| 国产无码网站在线观看| 国产极品美女在线观看| 日本精品一在线观看视频| 国产精品综合久久久| 国产成人综合网在线观看| 老熟妇喷水一区二区三区| 国产精品成人一区二区不卡| 国产主播在线观看| 国产资源站| 欧美一区福利| 少妇精品网站| 毛片大全免费观看| 2021无码专区人妻系列日韩| av午夜福利一片免费看| 国产精品久久自在自2021| 国产性生大片免费观看性欧美| 国产精品理论片| 欧美日韩国产高清一区二区三区| 国产成人精品视频一区二区电影| 亚洲午夜国产片在线观看| 在线欧美日韩国产| 午夜无码一区二区三区| 亚洲精品片911| 久久久久青草线综合超碰| 女人毛片a级大学毛片免费| 亚洲精品第五页| 免费在线色| 网友自拍视频精品区| 亚洲中文字幕av无码区| 亚洲成人在线免费| 欧美在线导航| 国产国语一级毛片在线视频| 久久久久久尹人网香蕉| 国产成年女人特黄特色毛片免| 91成人在线免费视频| 丰满人妻久久中文字幕| 天天躁日日躁狠狠躁中文字幕| 国产精品免费p区| 99视频精品在线观看| 97人妻精品专区久久久久| 青青青草国产| 亚洲最黄视频| 毛片大全免费观看| 国产无码制服丝袜| 久久精品人人做人人爽电影蜜月| 亚洲国产91人成在线| 国产亚洲欧美日韩在线观看一区二区| 精品第一国产综合精品Aⅴ| 综合天天色| 亚洲一区无码在线| 亚洲第一综合天堂另类专| 四虎影视8848永久精品| 久久semm亚洲国产| 亚洲日本精品一区二区|