999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計算的海量數據挖掘算法

2015-03-18 00:54:58王曉燕
產業與科技論壇 2015年16期
關鍵詞:數據挖掘分類資源

□趙 慧 王曉燕

一、云計算的含義

云計算(Cloud Computing)是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。云是網絡、互聯網的一種比喻說法。云計算甚至可以讓你體驗每秒10萬億次的運算能力,擁有這么強大的計算能力可以模擬核爆炸、預測氣候變化和市場發展趨勢。用戶通過電腦、筆記本、手機等方式接入數據中心,按自己的需求進行運算。

對于到底什么是云計算,至少可以找到100種解釋。現階段廣為接受的是美國國家標準與技術研究院(NIST)定義:云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡,服務器,存儲,應用軟件,服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。

二、云計算的特點和分類

(一)云計算具有的特點。一是超大規模。云計算的超大規模能賦予用戶強大的計算能力。二是虛擬化。可以支持用戶在任意位置使用各種終端獲取服務。三是高可靠性。使用了計算節點同構可互換等措施來保障服務的高可靠性。四是通用性。可以支撐不同的應用同時運作。五是高可伸縮性。可以滿足應用和用戶規模增長的需要動態伸縮。六是按需服務。用戶按需購買“云”中的資源,按量計費。七是高性價比。

(二)云計算的分類。一些研究專家把云計算分為三類:一是公有云。由第三方提供者為用戶提供的共享的資源和服務,但用戶并不擁有云計算的資源。二是私有云。單獨客戶專用的云計算平臺,因而提供對數據、安全性和服務質量的最有效控制;具有軟硬件資源利用率高、數據安全、質量可靠等優點。三是混合云。混合云是近年來云計算的主要模式和發展方向,融合了公有云和私有云。

三、海量數據挖掘的現狀與發展

以數據挖掘作為主體的國際會議主要有:2003年,KDD第四次會議;2004年,KDD第五次會議;2005年,ADMA第一屆國際會議;2005年,PAKDD第九屆國際會議;2005年,ICDE第21屆國際會議;典型的數據挖掘系統有IBM公司的InterligentMiner等。

國外的典型的數據挖掘系統有:Intelligent Miner、社會科學統計軟件包(SPSS)、See5、Neural network Browser、DB Miner、CBR Express等。

我國在該領域的研究始于20世紀90年代中期,目前,數據挖掘基礎理論以及應用的研究已經進入一個成熟階段。1997年,國內正式期刊開始發表數據挖據的文章。1998年,劉小虎等學者提出了改進的優化算法;2005年,國內學者提出了基于關聯度函數的決策樹分類算法,不僅克服了多支偏向的問題,還保證了精確、高效的分類正確率。

綜上可知,無論國內還是國外,數據挖據在現代科技社會有著廣泛的應用發展前景。在未來十年,對人類產生重大影響的十大新興技術中數據挖掘排列第三。

四、云計算支持下的數據挖掘算法

數據挖掘中引入云計算可以進行分布式計算,實現實時高效的挖掘,利于發現更多的有利信息。基于云計算的數據挖掘底層被屏蔽掉后,用戶不需要考慮數據分配到節點、數據的劃分等問題,使得開發更加方便。并行化的處理,大大提高了處理大規模數據的能力,基于云計算的數據挖掘使得海量數據挖掘更加方便快捷。為解決數據挖掘面臨的海量數據處理問題,基于云計算的海量數據挖掘算法主要是利用云計算的并行處理和海量存儲能力。

專業的數據挖掘廠商SGI、軟件及數據庫服務商如Oracle、IBM、Microsoft等都可以提供數據挖掘產品和方案。目前國內外還并未出現完整而且成熟的基于云計算的數據挖掘產品,大多數都還停留在分析或者研究階段。而基于云計算的海量數據存儲技術已經頗為成熟,更進一步的發展則是基于云計算或云存儲之上的能夠提供數據高可靠性、高性能的海量數據的存儲、分析、處理及挖掘。

數據挖掘的算法很多,比如經典的關聯規則算法Apriori算法及聚類分析K-Means算法。云計算支持下的數據挖掘算法,必須在Map/Reduce框架中進行并行化處理的基礎上,再對數據挖掘算法進行云計算化。

關聯規則Apriori算法:數據遍歷,然后找出所有的頻繁項集,再將所有規則提取出來,之后排除掉置信度小于預設值的規則,對Apriori算法完成了并行化處理后,將其移植到云計算框架下,在Map/Reduce框架下降低了原算法并行化后的耦合性,使得資源的浪費大大減少。

聚類分析K-Means算法:基于云計算首先要做并行化處理,將數據、環境、設置初始化,生成K個初始聚類中心,將數據分塊分配給計算節點,每個節點通過Map、Combine、Reduce三個過程進行聚類計算后獲得最終的聚類,就可以在云計算支持下進行數據挖掘的信息處理了。

在數據挖掘領域還有很多經典的算法,比如關聯規則、貝葉斯分類、Canopy聚類、Nearest-Neighbor分類等等,數據挖掘很多經典算法都可以在進行Map/Reduce化后在云計算平臺上運行。

五、結語

隨著大數據時代的到來,尤其是云計算的出現,網絡數據尤其是采用分布式存儲的數據更加多樣化、數據量日益龐大。海量數據的極速增長,從中提取出有價值的知識和信息,有著極為重要的意義。數據挖掘算法的好壞將直接關系到數據挖掘的效率和精確度以及對數據的利用效果。數據挖掘領域中海量數據處理和海量數據計算成為一個極為重要的問題。基于云計算的海量數據挖掘能夠超越傳統的數據挖掘所不適應的問題,并且能夠不斷增長高效、可靠、可信的數據信息。大數據時代,基于云計算的海量數據挖掘技術將有著更為廣泛的應用前景。

[1]云計算的概念和內涵[EB/OL].中國云計算,2014-2-26

[2]云計算是什么意思,什么是云計算[EB/OL].云創存儲,2014-4-2

[3]2014年云計算大會云計算標準化體系草案形成[EB/OL].中國云計算,2014-3-5

[4]十種方法保持云中數據安全[EB/OL].TechTarget云計算,2013-8-23

[5]劉小虎,李生.決策樹優化算法[J].軟件學報,1998

[6]韓松來,張輝,周華平.基于關聯度函數的決策樹分類算法[J].計算機應用,2005

[7]何元.基于云計算的海量數據挖掘分類算法研究[D].電子科技大學,2011

猜你喜歡
數據挖掘分類資源
基礎教育資源展示
分類算一算
探討人工智能與數據挖掘發展趨勢
一樣的資源,不一樣的收獲
分類討論求坐標
資源回收
數據分析中的分類討論
教你一招:數的分類
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
主站蜘蛛池模板: 亚洲视频免费在线看| 香蕉在线视频网站| 亚洲高清中文字幕在线看不卡| 欧美翘臀一区二区三区| 天堂在线亚洲| www.狠狠| aaa国产一级毛片| 手机精品视频在线观看免费| 国产v欧美v日韩v综合精品| 久久网综合| 免费国产高清视频| 亚洲成人高清在线观看| 国产三级精品三级在线观看| 亚洲av成人无码网站在线观看| 四虎AV麻豆| 国产原创第一页在线观看| 亚洲天堂视频在线观看免费| 亚洲一道AV无码午夜福利| 大学生久久香蕉国产线观看 | 国产精品免费入口视频| 中文字幕免费视频| 国产靠逼视频| 久久久国产精品无码专区| 国产成人a毛片在线| 无码专区国产精品一区| 国产69精品久久久久孕妇大杂乱 | 国产精品成| 久久毛片免费基地| 日本影院一区| 精品国产黑色丝袜高跟鞋| 女人18毛片久久| 91香蕉国产亚洲一二三区 | 国产精品欧美亚洲韩国日本不卡| 精品国产美女福到在线不卡f| 欧美视频在线第一页| 日韩无码视频播放| 国产色婷婷视频在线观看| 2020极品精品国产| 91免费在线看| 呦系列视频一区二区三区| 精品无码国产一区二区三区AV| 青青操视频在线| 18黑白丝水手服自慰喷水网站| 人妻中文久热无码丝袜| 国产精品黄色片| 免费毛片网站在线观看| 久久亚洲日本不卡一区二区| 亚洲日产2021三区在线| 国产精品亚洲va在线观看| 999精品视频在线| 91福利国产成人精品导航| 国产一区二区三区精品久久呦| 99精品在线视频观看| 日韩人妻少妇一区二区| 欧美激情福利| 午夜老司机永久免费看片| 亚洲无码高清免费视频亚洲| 久操中文在线| 国产靠逼视频| 国产男人的天堂| 中文精品久久久久国产网址| 欧美日韩成人| 久青草网站| 99久久国产综合精品女同| 精品人妻AV区| 亚洲视频免| 伊人色在线视频| 福利视频一区| 欧美A级V片在线观看| 国产精品内射视频| 午夜视频免费一区二区在线看| 亚洲综合欧美在线一区在线播放| 久久精品国产精品青草app| 在线视频精品一区| 国产精品.com| 日韩精品免费一线在线观看| 亚洲欧美精品日韩欧美| 久久香蕉国产线看观看精品蕉| 免费看a级毛片| 免费人成又黄又爽的视频网站| 日本在线亚洲| 中文字幕佐山爱一区二区免费|