999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于hadoop平臺的分布式數據挖掘系統的設計探討

2017-04-25 12:12:09陳志雄
數字技術與應用 2017年1期
關鍵詞:數據挖掘

陳志雄

摘要:在社會經濟快速發展的情況下,網絡信息技術的更新速度越來越快,如今,促進了大數據時代的進一步發展,而Hadoop作為分布式系統的代表,也成為大數據挖掘系統的重要組成部分之一。分布式數據挖掘系統的主要任務是利用Hadoop搭建分布式集群環境,然后在該環境上部署相應的數據挖掘任務,前提是要對分布式文件系統HDFS和MapReduce的并行編程模式原理進行深入的分析研究,同時選擇運用K-means聚類算法,使Hadoop平臺的數據挖掘系統的任務具有良好的發展效率,同時也能顯示其計算能力的擴展性能。下面就Hadoop平臺的分布式數據挖掘系統的設計進行深入的分析探討,進而促進信息數據系統的進一步發展。

關鍵詞:Hadoop平臺;數據挖掘;系統設計;K-means

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)01-0179-01

1 數據挖掘的簡單概述

Hadoop是一個分布式系統基礎架構,它實現了一個分布式文件系統,具有極高的容錯性,在因特網上是最受歡迎的搜索關鍵字的內容分類工具,能夠解決許多具有伸縮性的問題,能提高文件搜索效率[1]。而數據挖掘系統是在Hadoop平臺建立的,因此,數據挖掘系統的發展與Hadoop平臺緊密結合。數據挖掘主要是在大量數據中尋找有價值的信息技術,主要由以下三個階段組成,數據準備階段,需要對大量的信息進行清理,并對數據整合,同時還對數據格式進行轉換;數據挖掘階段,根據相應的智能算法對數據進行分析,然后形成一定的數據模式;結果評估階段,主要根據挖掘出的數據模式的運行效果進行評判,對沒有任何效果的評估模式全部排除。

2 數據挖掘的主要任務與具體計算方法

2.1 數據挖掘基本任務分析

數據挖掘的任務是由大數據發展的方向決定的,同時為數據挖掘工作提供了方向,由于數據挖掘以尋找數據模式為主,并且數據模式也是隨著數據的應用領域不同而發生變化,因此,在數據挖掘期間,其任務主要分為描述性挖掘和預測性挖掘兩種。描述性挖掘任務主要根據數據的一般特征,對數據庫中的數據進行概括、總結,然后尋找數據之間的關系和類型,最終形成固定的數據模式;對于預測性挖掘主要根據接觸的數據做出相應的判斷,并加入與之相對應的新的數據的模式[2]。

2.2 數據挖掘的具體計算方法

數據聚類算法是對數據進行拆分合并同類項計算,也就是將數據項劃分為多層次的子集,對具有相似特性的數據項進行歸類,然后對同一個子集中的數據進行計算,該計算方法主要根據數據自身的特性來劃分。具體如下所示:

在數據庫B中,所有數據的集合為未知數X={X1,X2,X3……Xn},而在許多的X中有一部分具有相似性,因而Xi(i=1,2,3……n)。其中對于一個整體集合X,被許多具有相似的X組合分割成m個子集,出現了許多的C1,C2,C3……Cn。同時每一個子集還要滿足一定的條件:①每一個子集不能為零;②所有的子集整合后必須恰好等于集合X;③每一個子集不能有共同交集;④i必須不等于零。

聚類法是數據挖掘算法的重要組成部分,而K-m eans算法是最常用的最基本的聚類算法。主要根據空間中K個中心點對相對應的數據對象進行聚類,當然這個點不是固定不變的,而是設定一個或幾個點后進行逐一的變換更新,在不斷更新分配數據時,就能尋找到符合條件的聚類結果[3]。經過長期的更新分配之后,根據數據聚類的規律總結數據模式,然后將這一模式作為數據挖掘系統的固定函數模式,在以后的數據挖掘計算中只需要代入相關的數據就可以快速獲取結果。

如上述的函數式,在數據挖掘計算中,需要對Ck固定,就可以選擇出最優的Xk;對Xk固定后,就能選擇最優的Ck,他們選擇的結果都是花費代價最小的時候。采用K-means計算法可以獲得一個最優解的值,這個值會使得挖掘的數據接近最優,并且在數據挖掘中的優勢非常的顯著。

3 結語

Hadoop是一個能夠對大數據進行分布式處理的軟件平臺,具有極高的可靠性和高效性,因而在數據挖掘系統設計方面能夠提供很好的幫助,尤其在數據挖掘計算方法方面,能夠根據數據挖掘的數據模式建立比較固定優越的計算模式。

參考文獻

[1]郭建偉,李瑛,杜麗萍,趙桂芬,蔣繼婭.基于hadoop平臺的分布式數據挖掘系統研究[J].中國科技信息,2013,13:81-83.

[2]羅剛.基于HADOOP的數據挖掘平臺分析與設計[J].電子世界,2013,18:16-17.

[3]樊龍,萬定生,顧昕辰.基于Hadoop云平臺的水利普查數據挖掘系統的設計和實現[J].計算機與數字工程,2014,05:831-834+875.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产区在线观看视频| 欧美日本在线播放| 91福利国产成人精品导航| 四虎精品黑人视频| 伊人久综合| 国产精品第一区| 99免费在线观看视频| 在线精品视频成人网| AV天堂资源福利在线观看| 色窝窝免费一区二区三区 | 国产一级二级三级毛片| 99久久亚洲精品影院| 波多野结衣无码中文字幕在线观看一区二区 | 亚洲午夜福利精品无码不卡 | 亚洲国产无码有码| 美女被操黄色视频网站| 91精品国产91久无码网站| 特级做a爰片毛片免费69| 日本成人精品视频| 国产一区二区三区在线无码| 色综合激情网| 1级黄色毛片| 久久99精品久久久久纯品| 第九色区aⅴ天堂久久香| 国产十八禁在线观看免费| 欧美成人亚洲综合精品欧美激情 | 欧美一区日韩一区中文字幕页| 国产清纯在线一区二区WWW| 日韩A级毛片一区二区三区| 青青青伊人色综合久久| 波多野结衣视频网站| 9久久伊人精品综合| 国产精品亚洲а∨天堂免下载| 国产在线视频导航| 青青草国产精品久久久久| 91小视频在线播放| 欧美亚洲欧美区| 国产精品七七在线播放| 精品无码一区二区在线观看| 色久综合在线| 青草国产在线视频| 91丝袜乱伦| 成人韩免费网站| 欧美爱爱网| 在线欧美日韩国产| 亚洲国内精品自在自线官| 红杏AV在线无码| 亚洲爱婷婷色69堂| 午夜福利亚洲精品| 亚洲精品国产综合99| 欧美在线导航| 国产在线日本| 一级毛片高清| 91娇喘视频| 成人91在线| 亚洲综合18p| 狠狠做深爱婷婷久久一区| 国产成人凹凸视频在线| 一级一级一片免费| 国产激爽爽爽大片在线观看| 亚洲综合色婷婷中文字幕| 伊人色天堂| 久久99这里精品8国产| 就去吻亚洲精品国产欧美| 国产精品视频白浆免费视频| 欧美三级视频网站| 特级做a爰片毛片免费69| 青草精品视频| 99热免费在线| 亚洲精品你懂的| 伊人久久大香线蕉综合影视| 成年人国产视频| 久久99国产视频| 999国内精品久久免费视频| 色吊丝av中文字幕| 最新国语自产精品视频在| 婷婷色婷婷| 国内毛片视频| 国产高清自拍视频| 91精品视频网站| 成人免费午间影院在线观看| 99精品久久精品|