999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于hadoop平臺的分布式數據挖掘系統的設計探討

2017-04-25 12:12:09陳志雄
數字技術與應用 2017年1期
關鍵詞:數據挖掘

陳志雄

摘要:在社會經濟快速發展的情況下,網絡信息技術的更新速度越來越快,如今,促進了大數據時代的進一步發展,而Hadoop作為分布式系統的代表,也成為大數據挖掘系統的重要組成部分之一。分布式數據挖掘系統的主要任務是利用Hadoop搭建分布式集群環境,然后在該環境上部署相應的數據挖掘任務,前提是要對分布式文件系統HDFS和MapReduce的并行編程模式原理進行深入的分析研究,同時選擇運用K-means聚類算法,使Hadoop平臺的數據挖掘系統的任務具有良好的發展效率,同時也能顯示其計算能力的擴展性能。下面就Hadoop平臺的分布式數據挖掘系統的設計進行深入的分析探討,進而促進信息數據系統的進一步發展。

關鍵詞:Hadoop平臺;數據挖掘;系統設計;K-means

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)01-0179-01

1 數據挖掘的簡單概述

Hadoop是一個分布式系統基礎架構,它實現了一個分布式文件系統,具有極高的容錯性,在因特網上是最受歡迎的搜索關鍵字的內容分類工具,能夠解決許多具有伸縮性的問題,能提高文件搜索效率[1]。而數據挖掘系統是在Hadoop平臺建立的,因此,數據挖掘系統的發展與Hadoop平臺緊密結合。數據挖掘主要是在大量數據中尋找有價值的信息技術,主要由以下三個階段組成,數據準備階段,需要對大量的信息進行清理,并對數據整合,同時還對數據格式進行轉換;數據挖掘階段,根據相應的智能算法對數據進行分析,然后形成一定的數據模式;結果評估階段,主要根據挖掘出的數據模式的運行效果進行評判,對沒有任何效果的評估模式全部排除。

2 數據挖掘的主要任務與具體計算方法

2.1 數據挖掘基本任務分析

數據挖掘的任務是由大數據發展的方向決定的,同時為數據挖掘工作提供了方向,由于數據挖掘以尋找數據模式為主,并且數據模式也是隨著數據的應用領域不同而發生變化,因此,在數據挖掘期間,其任務主要分為描述性挖掘和預測性挖掘兩種。描述性挖掘任務主要根據數據的一般特征,對數據庫中的數據進行概括、總結,然后尋找數據之間的關系和類型,最終形成固定的數據模式;對于預測性挖掘主要根據接觸的數據做出相應的判斷,并加入與之相對應的新的數據的模式[2]。

2.2 數據挖掘的具體計算方法

數據聚類算法是對數據進行拆分合并同類項計算,也就是將數據項劃分為多層次的子集,對具有相似特性的數據項進行歸類,然后對同一個子集中的數據進行計算,該計算方法主要根據數據自身的特性來劃分。具體如下所示:

在數據庫B中,所有數據的集合為未知數X={X1,X2,X3……Xn},而在許多的X中有一部分具有相似性,因而Xi(i=1,2,3……n)。其中對于一個整體集合X,被許多具有相似的X組合分割成m個子集,出現了許多的C1,C2,C3……Cn。同時每一個子集還要滿足一定的條件:①每一個子集不能為零;②所有的子集整合后必須恰好等于集合X;③每一個子集不能有共同交集;④i必須不等于零。

聚類法是數據挖掘算法的重要組成部分,而K-m eans算法是最常用的最基本的聚類算法。主要根據空間中K個中心點對相對應的數據對象進行聚類,當然這個點不是固定不變的,而是設定一個或幾個點后進行逐一的變換更新,在不斷更新分配數據時,就能尋找到符合條件的聚類結果[3]。經過長期的更新分配之后,根據數據聚類的規律總結數據模式,然后將這一模式作為數據挖掘系統的固定函數模式,在以后的數據挖掘計算中只需要代入相關的數據就可以快速獲取結果。

如上述的函數式,在數據挖掘計算中,需要對Ck固定,就可以選擇出最優的Xk;對Xk固定后,就能選擇最優的Ck,他們選擇的結果都是花費代價最小的時候。采用K-means計算法可以獲得一個最優解的值,這個值會使得挖掘的數據接近最優,并且在數據挖掘中的優勢非常的顯著。

3 結語

Hadoop是一個能夠對大數據進行分布式處理的軟件平臺,具有極高的可靠性和高效性,因而在數據挖掘系統設計方面能夠提供很好的幫助,尤其在數據挖掘計算方法方面,能夠根據數據挖掘的數據模式建立比較固定優越的計算模式。

參考文獻

[1]郭建偉,李瑛,杜麗萍,趙桂芬,蔣繼婭.基于hadoop平臺的分布式數據挖掘系統研究[J].中國科技信息,2013,13:81-83.

[2]羅剛.基于HADOOP的數據挖掘平臺分析與設計[J].電子世界,2013,18:16-17.

[3]樊龍,萬定生,顧昕辰.基于Hadoop云平臺的水利普查數據挖掘系統的設計和實現[J].計算機與數字工程,2014,05:831-834+875.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚亚洲乱码一二三四区| 成人午夜免费视频| 女人一级毛片| 国产成人1024精品| 亚洲无码视频图片| 五月天福利视频| 国产熟睡乱子伦视频网站| 丁香五月亚洲综合在线 | 免费在线色| 国产免费羞羞视频| 欧美劲爆第一页| 99免费视频观看| 日韩av电影一区二区三区四区| 婷婷色婷婷| 亚洲另类色| 蜜桃视频一区| 国产无套粉嫩白浆| 亚洲aaa视频| 亚洲第一av网站| 97国产成人无码精品久久久| 国产日产欧美精品| 国产亚洲欧美在线专区| 欧美日韩第三页| 亚洲av综合网| 色婷婷天天综合在线| 熟妇丰满人妻av无码区| 亚洲欧美国产视频| 99热6这里只有精品| 亚洲av色吊丝无码| 白浆免费视频国产精品视频| 亚洲 欧美 日韩综合一区| 鲁鲁鲁爽爽爽在线视频观看| 在线观看精品国产入口| 国产91特黄特色A级毛片| 国产一区在线视频观看| 国产精品分类视频分类一区| 日本妇乱子伦视频| 国产精品亚洲片在线va| 19国产精品麻豆免费观看| 免费观看男人免费桶女人视频| 丰满人妻久久中文字幕| 国产AV无码专区亚洲精品网站| 日韩大片免费观看视频播放| 一级毛片视频免费| 国产人成在线观看| 亚洲最新在线| 91偷拍一区| 国产欧美视频在线观看| 国产精品久久久久久久久| 国产欧美视频在线观看| 狠狠色丁婷婷综合久久| 国产一国产一有一级毛片视频| 亚洲国产亚洲综合在线尤物| 无码 在线 在线| 婷婷亚洲天堂| 九九热这里只有国产精品| 国产欧美自拍视频| 亚洲成A人V欧美综合| 成人av专区精品无码国产 | 在线一级毛片| 国产精品亚洲综合久久小说| 亚洲精品无码AⅤ片青青在线观看| 日本91视频| 色综合综合网| 日韩精品亚洲人旧成在线| 国产美女在线免费观看| 久久影院一区二区h| 亚洲视频色图| 国产一区亚洲一区| 免费xxxxx在线观看网站| 直接黄91麻豆网站| 欧美区国产区| 欧美五月婷婷| 国产午夜无码专区喷水| 波多野结衣一区二区三区AV| 亚洲综合专区| 免费人成网站在线观看欧美| 国产乱码精品一区二区三区中文 | 热re99久久精品国99热| 欧美三级视频网站| 欧美亚洲欧美区| 欧美国产综合视频|