999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模糊K-means聚類算法的區域數據智能分析方法

2022-05-24 11:43:54支建勛
電子設計工程 2022年10期
關鍵詞:數據挖掘分類

支建勛

(河北北方學院附屬第一醫院,河北 張家口 075000)

隨著我國社會經濟的發展,醫療保險制度建設不斷完善,社會矛盾得到了有效緩解。但在現階段,醫保的報銷流程中眾多不規范的問題時有發生,醫療保險監管體系亟待完善[1-4]。因此,需要推動信息技術的應用,為智能化的規范管控提供有力的技術保障[5-12]。

文中對醫療行業的區域化群體數據挖掘方法進行了研究,采用模糊K-means 算法對醫療數據進行處理,然后篩選出異常數據。另一方面,針對醫保數據量級的不斷增長,造成算法運行效率低下的問題,引入Hadoop 平臺和MapReduce 編程模型,對算法進行并行化處理,從而提升數據分析的效率[13-14]。

1 理論基礎

1.1 K-means算法原理

K-means 是機器學習領域常見的一種無監督學習模型,其將距離作為相似性評價指標。在K-means算法中,將距離較近的同類數據點放入一個簇內,且它們之間的距離應盡可能地接近;而不同簇中心的距離則應盡可能地遠,圖1 所示為K-means 算法的原理示意圖[15-16]。

圖1 K-means算法原理示意圖

在K-means 算法中,定義輸入數據{x1,x2,…,xn}的最終聚類數目為k,最終的簇中心為{c1,c2,…,ck},采用歐式距離計算每個數據點與簇中心cj的距離為:

當D(xi,cj)滿足式(2)時,則數據xi的分類標記為cj。當所有數據的分類完畢后,計算新的聚類中心為:

接著在新聚類中心下計算誤差平方和準則函數:

當|J*-J|<ξ時,表示當前的準則函數收斂,當前聚類中心即為各個數據的最終類別;否則,算法將重新搜索新的聚類中心,直至J收斂。

圖2 給出了K-means 算法的流程圖。相較于其他的聚類算法,K-means 在計算時是相對可伸縮和高效的,所以在計算大型數據集時具有更優的適應性。但由于算法在聚類時需要先進行聚類中心的初始化,所以會導致聚類的不穩定;又因為每次迭代前都需要重新計算聚類中心,因此增加了算法的時間復雜度。針對以上問題,文中引入了模糊聚類的概念對算法進行改進。

圖2 K-means算法流程

1.2 模糊K-means算法

在K-means算法下,每一個數據點x在分類時,均會被嚴格地放入某一個類別中。但在實際的分類過程中,這一個數據點x卻難以嚴格地被劃分到同一個類別中,其可能是以不同的隸屬度劃分到某一類。此時,對每一個分類結果均可用一個模糊分類矩陣表示:

其中,uij∈[0,1]表示某個數據點對于該類別的隸屬度。定義模糊分類下的誤差平方準則函數為:

在計算聚類中心時,也需要進行模糊化處理:

在迭代過程中,也需要對模糊矩陣進行修正:

1.3 模糊K-means的并行化

通過對模糊K-means 算法運行的流程分析可以看出,算法的運行時間大多消耗在迭代計算上。而每次迭代需要完成兩步計算:1)對每個數據樣本計算距離;2)確認新的計算中心。這意味著K-means 算法的運行耗時與數據規模的大小呈正相關。對于醫保數據,由于涉及人數眾多且數據量極大,需要采用并行化的手段提升數據挖掘的效率。

文中通過MapReduce 對模糊K-means 算法進行并行化處理,具體流程如圖3 所示。

圖3 模糊K-means的并行化流程

并行化K-means 算法的核心在于對群體醫療數據的切分,首先將數據劃分為不同的數據切片;然后將每個切片發送至不同的運算節點,在不同的計算節點進行聚類。根據MapReduce 的編程模型可知,整個算法包含Map、Combine 和Reduce 3 個過程。

1)Map:在該過程中,將數據劃分為若干個數據塊,計算數據對象到所有聚類中心的距離,并選擇距離最小的聚類中心點,最終形成<數據對象,聚類中心>的key/value 鍵值對形式。

2)Combine:其是對Map 過程的中間結果進行本地化Reduce 的過程,將屬于同一聚類中心的數據對歸類到一起。然后計算屬于同一聚類中心的數據對象之和,從而得到同一簇的聚類結果,最終的輸出結果為<聚類ID,各維坐標的累加和>。

3)Reduce:其是將Combine 得到的結果進行局部聚類,進而得到全局的聚類結果。在Reduce 的過程中,對所有簇的局部結果進行匯總,計算所有簇的新聚類中心。當結果收斂時,算法將該聚類中心作為最終的分類結果。

2 方法實現

2.1 仿真環境設計

為了實現模糊K-means 算法的并行化處理,首先需要搭建Hadoop 計算集群。在Hadoop 平臺下,MapReduce 是分布式編程模型,該模型需要分布式文件系統HDFS 的支撐。在HDFS 文件系統下,需要搭建一個NameNode 和若干個DataNode 計算節點。文中的計算節點統一配置為如表1 所示的虛擬機。

表1 計算節點配置

每個節點的機器名、IP 地址和用途如表2 所示。

表2 Hadoop環境配置

在每臺虛擬機安裝Hadoop 并進行格式化后,啟動守護進程。將每臺虛擬機的Localhost 修改為表2所示的IP 地址,并在conf/.目錄下將Hadoop 的參數按照表3 進行設置。

表3 Hadoop參數配置

2.2 仿真分析

文中設計的并行化模糊K-means 算法的應用場景是醫療群體數據的挖掘與分析,以河北省某地區2020 年的醫保數據集作為樣本。該數據共包含藥品費、檢查費、手術費、掛號費、床位費等73 個維度的就診數據,就診人數共323 213 人。其中,標記的醫保失信行為數據約占4.36%,醫保失信數據被標記為過度醫療、用藥不符、虛假支付、偽造票據、掛名診療、虛假套現等6 類。

在進行數據分析仿真時,首先對文中設計的模糊K-means 算法的性能進行分析,算法的相關參數設置如表4 所示。

表4 相關參數設置

由于原始的數據集較大,在使用K-means 算法時計算耗時較長,文中在評估算法性能時采用隨機抽樣的方式,選取了1 000 人的醫保數據進行演算。將串行化的模糊K-means 算法和傳統K-means 算法的結果進行了對比,串行化算法的性能指標如表5所示。

表5 串行化算法的性能指標

文中對并行化的模糊K-means 算法進行分析。表6 給出了隨著DataNode 的增加,算法相關指標的變化情況。

表6 并行化算法的性能指標

表6 中,算法的運行時間隨著節點數量s的變大而不斷減小,這說明對模糊K-means 的并行化切實提升了算法的運行速度,算法具有較好的擴展性。Speedup 是算法的加速比,該指標為算法在一臺計算機上的運行時間與在s臺計算機上運行時間的比值,這意味著多計算節點的引入可以縮短算法的運行時間;Scaleup 是算法在計算節點上執行效率的評價指標。從表中可以看出,隨著計算節點數量的增長,Scaleup不斷降低,說明每個新增的節點計算資源均未浪費,并行后的算法對于數據集具有較強的適應性。

3 結束語

文中對當前醫療環境下,提升醫保流程智能度、規范度的相關數據算法進行了研究。通過引入模糊K-means 算法,提升數據挖掘算法的數據處理精度;通過借助分布式文件存儲和MapReduce 編程模型,實現模糊K-means 算法的并行化,提升了數據挖掘算法的處理速度。經過在實際醫療數據上的仿真驗證可知,文中的研究內容對于醫療群體數據的處理精度和處理效率均有明顯的提高,為醫療大數據分析方法提供了參考。

猜你喜歡
數據挖掘分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
給塑料分分類吧
主站蜘蛛池模板: 亚洲无码在线午夜电影| 亚洲精品黄| 国产麻豆aⅴ精品无码| 在线国产91| AV在线天堂进入| 国产精品视频猛进猛出| 精品伊人久久久久7777人| 日韩精品毛片人妻AV不卡| 无码日韩视频| 中文字幕亚洲另类天堂| 在线视频精品一区| 又粗又大又爽又紧免费视频| 国产欧美日韩视频怡春院| 99视频精品全国免费品| 波多野结衣中文字幕一区| 欧美亚洲日韩不卡在线在线观看| 亚洲第一香蕉视频| 亚洲中文字幕久久无码精品A| 国产尹人香蕉综合在线电影| 久久午夜夜伦鲁鲁片不卡| 亚洲va精品中文字幕| 精品无码国产一区二区三区AV| 日本成人精品视频| 在线综合亚洲欧美网站| 日韩欧美中文字幕一本| 国产丝袜精品| 91在线播放免费不卡无毒| 亚洲男人在线| 99福利视频导航| 999精品色在线观看| 日韩性网站| 欧美三级日韩三级| 国产日韩欧美在线播放| 国产精品免费久久久久影院无码| 成人毛片免费在线观看| 日韩123欧美字幕| 亚洲精品va| 青青国产视频| 香蕉久人久人青草青草| 精品视频福利| 国产微拍精品| 国产激情无码一区二区免费 | 亚洲国产精品一区二区高清无码久久| 99热国产在线精品99| 欧美日韩理论| 91在线激情在线观看| 国产成人免费高清AⅤ| 人人爽人人爽人人片| 欧美翘臀一区二区三区| 国产一区二区视频在线| 国产精品一老牛影视频| 99精品这里只有精品高清视频| 一级毛片免费观看久| 亚洲日韩高清无码| 国产综合欧美| 亚洲一级无毛片无码在线免费视频 | 欧美国产视频| 成人在线综合| 人妻21p大胆| 国产91丝袜在线观看| 国产美女91呻吟求| 成人福利在线观看| 99热最新网址| 最新亚洲人成网站在线观看| 激情乱人伦| 伊人丁香五月天久久综合 | 99视频精品在线观看| 波多野结衣久久高清免费| 人妻夜夜爽天天爽| 这里只有精品在线| 国产成人精彩在线视频50| 亚洲色大成网站www国产| 亚洲最大情网站在线观看| 一个色综合久久| 久久人与动人物A级毛片| 日本少妇又色又爽又高潮| 国产一级毛片在线| 伊人久久久久久久| 久久综合色播五月男人的天堂| 69av在线| 国产在线小视频| 亚洲精品视频免费观看|