999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計算技術的數據挖掘平臺建設策略

2020-12-07 17:37:48張智駒
魅力中國 2020年42期
關鍵詞:數據挖掘信息

張智駒

(重慶航天職業技術學院,重慶 400021)

引言

伴隨著數據挖掘平臺的容量不斷增加,很多數據分析和數據計算都要站在更高的層面上探究。云計算技術的運用能夠對數據挖掘平臺提供更多的服務,在一系列的問題解決和調整層面上,告別了傳統技術的不足。但是,二者共同融合、共同服務的時候,必須加強制度的優化和平臺管理的創新,保持數據挖掘平臺的穩定運行。

一、云計算技術和大數據挖掘介紹

云計算技術是一種以互聯網為基礎的計算模式,通過虛擬化的方式處理信息資源,并進行計算云計算技術具有強大的儲存功能,能夠有效提高用戶使用的便捷性,云計算是并行計算和分布式計算的發展結果。數據挖掘是指從大量數據中挖掘具有價值數據的過程,通過數據挖掘能夠發現大數據中所隱藏的價值和知識,并對用戶進行指導作用,目前數據挖掘技術并用到了多個領域的決策指導中。數據挖掘主要包括預測任務和描述任務兩種預測任務是指根據屬性對目標屬性做出預測描述,任務則是將數據間隱藏的聯系所描述出來。在大數據中應用數據挖掘能夠獲取更大價值的信息數據,從而為各行各業創造出更大的效益。

二、基于云計算的大數據挖掘分析

(一)大數據挖掘

在數量龐大的數據中隱藏著具有很高價值的數據信息,同時數據類型也存在多樣化的特點,比如說文本形式,數據信息,圖片,視頻形式的數據信息。大數據挖掘就是指從這些海量的數據中挖掘出具有價值的數據信息,然后為用戶提供所需的數據由于大數據數量龐大,價值密度低,導致傳統的數據挖掘,無法快速高效率的挖掘數據。因此全新的大數據挖掘技術就此出現并發揮出了積極的作用,大數據挖掘具有廣泛性,主動性和復雜性的特點,廣泛性是指大數據挖掘過程中,挖掘的數據源十分廣泛,主動性是指大數據挖掘使用收集數據的方式,主動進行數據收集,復雜性則是指大數據挖掘過程中挖掘的數據類型十分復雜。

(二)基于云計算的大數據挖掘

近年來我國互聯網技術在不斷的發展,數據傳輸的速度變得極快,因此產生的數據量也越來越多,對于用戶來說信息需求較大,這種時候大數據技術和云計算技術得到了快速的發展,以此來滿足用戶的需求。在大數據時代傳統的數據挖掘已經無法滿足用戶需求,需要通過基于云計算的大數據挖掘來解決數據挖掘存在的問題,不僅能夠彌補傳統數據挖掘中的漏洞,還能夠有效地提高數據處理的速度和效率,實現大數據挖掘。基于云計算的大數據挖掘具有眾多的優勢,能夠在海量數據中挖掘出有價值的信息,并將數據信息高度應用,這是傳統數據挖掘技術的創新發展,能夠實現大數據時代的快速傳遞和處理。

三、于云計算的數據挖掘系統

(一)系統框架

本文提出基于云計算的數據挖掘系統,以應對日益暴增的數據。該系統由云計算平臺和數據挖掘算法兩個部分組成。云計算平臺采用SPARK 框架,之所以不選擇HADOOP,主要是因為SPARK 相比HADOOP 具有更高的效率,適合迭代運算,并且用戶只需要定義好算法邏輯,即可,其余的如大數據處理的底層交互、節點通信、數據運算等都可以由SPARK 框架自由實現。數據挖掘算法方面則有很多種實現方法,比如分類決策樹算法,該算法的核心是ID3 算法,屬于機器學習算法中的一類,分類決策樹發揚了ID3 算法的長處,實現了用信息增益率來選擇屬性,可在決策樹構造中進行剪枝,可以對連續屬性進行離散化處理,可以對不完整數據進行處理。該算法實際上并不高效,因為其在構造決策樹的過程中需要對數據集進行多次順序掃描以及排序,而且僅適合可以駐留在內存中的數據集,如果數據集大,會導致宕機。猶如K-means 算法,該算法在1967 年便已經出現,后續經過版本更替,其算法描寫可以敘述為輸入簇的數目K,包含N 個對象的數據集D,輸出K 個簇的集合。

(二)云計算平臺

云計算平臺通過SPARK 框架來進行架構,在SPARK 框架下,主要是講數據以分區方式存儲,即RDD,在數據處理中,SPARK 需要先對待處理數據創建一個RDD,然后對RDD 施加轉換和行動操作。轉換的主要目的是促使RDD 迭代,即利用某些函數來促使舊的RDD 迭代為新的RDD,然后行動操作利用具體的算法來將RDD 中的數據進行計算,進而返回計算結果。RDD 默認情況下是存儲在內存當中,對內存的要求非常高,當然實際上可以通過調整設置,將RDD 存儲在存儲器當中,但運算速度會比較慢,一些經常使用的RDD 若存儲在存儲器當中,在運算時需要將其調用至內存中,多了一個過程,導致變慢,所以可以將一些常用的RDD 保存在內存中?;赟PARK 的云計算平臺架構,用戶采取自定義程序的方式,先定義好應用程序,然后提交至SPARK 集群,主節點上啟動進程MASTER,子節點上則啟動進程WORKER,主節點進程MASTER 會在子節點的WORKER 上啟動一個任務管理程序DRIVER。在DRIVER 中,任務的復雜程度由SPARKCONTEXT 進行判別并向主節點申請處理器和內存的資源。

結語

隨著科技的發展和時代的進步,云計算與數據挖掘平臺結合以后,實現了平臺的全面創新,整體上的工作安排比較符合預期目標,在技術的創新效果上非常顯著。但是,云計算的運用也是不斷革新,在二者的功能融合和技術聯動過程中,需要對數據挖掘平臺的風險、云計算的風險開展深度的評估,站在不同的層面上進行探究,提高數據挖掘平臺的可靠性。

猜你喜歡
數據挖掘信息
探討人工智能與數據挖掘發展趨勢
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 免费黄色国产视频| 精品成人一区二区三区电影| 日本一区二区三区精品视频| 中国国产高清免费AV片| 国产喷水视频| 九月婷婷亚洲综合在线| 在线观看免费AV网| 国产超薄肉色丝袜网站| 在线免费亚洲无码视频| 亚洲视频在线青青| 久久精品国产精品青草app| 日本人妻一区二区三区不卡影院| 亚洲一区二区约美女探花| 欧美亚洲激情| 天天躁夜夜躁狠狠躁图片| 国产成人精品18| 国产精品lululu在线观看| 欧美一区精品| 国产九九精品视频| 国产成+人+综合+亚洲欧美 | 91av国产在线| 97在线公开视频| 久爱午夜精品免费视频| 在线视频亚洲色图| av午夜福利一片免费看| 欧美www在线观看| 亚洲国产精品美女| 国产成人免费观看在线视频| 欧美特黄一级大黄录像| 欧美国产视频| 久久精品aⅴ无码中文字幕| AV天堂资源福利在线观看| 国产精品久久久久鬼色| 婷婷六月在线| 亚洲欧美一区二区三区图片| 一级香蕉视频在线观看| 日韩第一页在线| 中文成人在线视频| 日本色综合网| 国产精品亚洲一区二区三区z| 亚洲日韩日本中文在线| 国产欧美视频在线观看| 日韩无码一二三区| 国产精品久久久久久久伊一| 尤物成AV人片在线观看| 亚洲日本中文字幕乱码中文| 欧美影院久久| 精品国产成人av免费| 麻豆国产精品| 欧美性精品| 亚洲床戏一区| 久久久亚洲色| 最新国产在线| 日韩无码视频播放| 欧美精品亚洲二区| 九九九久久国产精品| 国产00高中生在线播放| 久久精品国产精品国产一区| 国产成人精品高清在线| 日本一本正道综合久久dvd| 在线五月婷婷| 噜噜噜综合亚洲| 99久久精品国产自免费| 国产拍揄自揄精品视频网站| 青青草原国产一区二区| 三区在线视频| 国产精品午夜电影| 午夜啪啪福利| AV网站中文| 黑色丝袜高跟国产在线91| 91色在线观看| 激情综合图区| 亚洲va在线观看| 1769国产精品免费视频| 国产黄网永久免费| 亚洲第一区欧美国产综合 | 香蕉久人久人青草青草| 性做久久久久久久免费看| 国产精品无码AⅤ在线观看播放| 国产免费黄| 日韩午夜福利在线观看| 91福利免费|