999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計算技術的數據挖掘平臺建設策略

2020-12-07 17:37:48張智駒
魅力中國 2020年42期
關鍵詞:數據挖掘信息

張智駒

(重慶航天職業技術學院,重慶 400021)

引言

伴隨著數據挖掘平臺的容量不斷增加,很多數據分析和數據計算都要站在更高的層面上探究。云計算技術的運用能夠對數據挖掘平臺提供更多的服務,在一系列的問題解決和調整層面上,告別了傳統技術的不足。但是,二者共同融合、共同服務的時候,必須加強制度的優化和平臺管理的創新,保持數據挖掘平臺的穩定運行。

一、云計算技術和大數據挖掘介紹

云計算技術是一種以互聯網為基礎的計算模式,通過虛擬化的方式處理信息資源,并進行計算云計算技術具有強大的儲存功能,能夠有效提高用戶使用的便捷性,云計算是并行計算和分布式計算的發展結果。數據挖掘是指從大量數據中挖掘具有價值數據的過程,通過數據挖掘能夠發現大數據中所隱藏的價值和知識,并對用戶進行指導作用,目前數據挖掘技術并用到了多個領域的決策指導中。數據挖掘主要包括預測任務和描述任務兩種預測任務是指根據屬性對目標屬性做出預測描述,任務則是將數據間隱藏的聯系所描述出來。在大數據中應用數據挖掘能夠獲取更大價值的信息數據,從而為各行各業創造出更大的效益。

二、基于云計算的大數據挖掘分析

(一)大數據挖掘

在數量龐大的數據中隱藏著具有很高價值的數據信息,同時數據類型也存在多樣化的特點,比如說文本形式,數據信息,圖片,視頻形式的數據信息。大數據挖掘就是指從這些海量的數據中挖掘出具有價值的數據信息,然后為用戶提供所需的數據由于大數據數量龐大,價值密度低,導致傳統的數據挖掘,無法快速高效率的挖掘數據。因此全新的大數據挖掘技術就此出現并發揮出了積極的作用,大數據挖掘具有廣泛性,主動性和復雜性的特點,廣泛性是指大數據挖掘過程中,挖掘的數據源十分廣泛,主動性是指大數據挖掘使用收集數據的方式,主動進行數據收集,復雜性則是指大數據挖掘過程中挖掘的數據類型十分復雜。

(二)基于云計算的大數據挖掘

近年來我國互聯網技術在不斷的發展,數據傳輸的速度變得極快,因此產生的數據量也越來越多,對于用戶來說信息需求較大,這種時候大數據技術和云計算技術得到了快速的發展,以此來滿足用戶的需求。在大數據時代傳統的數據挖掘已經無法滿足用戶需求,需要通過基于云計算的大數據挖掘來解決數據挖掘存在的問題,不僅能夠彌補傳統數據挖掘中的漏洞,還能夠有效地提高數據處理的速度和效率,實現大數據挖掘。基于云計算的大數據挖掘具有眾多的優勢,能夠在海量數據中挖掘出有價值的信息,并將數據信息高度應用,這是傳統數據挖掘技術的創新發展,能夠實現大數據時代的快速傳遞和處理。

三、于云計算的數據挖掘系統

(一)系統框架

本文提出基于云計算的數據挖掘系統,以應對日益暴增的數據。該系統由云計算平臺和數據挖掘算法兩個部分組成。云計算平臺采用SPARK 框架,之所以不選擇HADOOP,主要是因為SPARK 相比HADOOP 具有更高的效率,適合迭代運算,并且用戶只需要定義好算法邏輯,即可,其余的如大數據處理的底層交互、節點通信、數據運算等都可以由SPARK 框架自由實現。數據挖掘算法方面則有很多種實現方法,比如分類決策樹算法,該算法的核心是ID3 算法,屬于機器學習算法中的一類,分類決策樹發揚了ID3 算法的長處,實現了用信息增益率來選擇屬性,可在決策樹構造中進行剪枝,可以對連續屬性進行離散化處理,可以對不完整數據進行處理。該算法實際上并不高效,因為其在構造決策樹的過程中需要對數據集進行多次順序掃描以及排序,而且僅適合可以駐留在內存中的數據集,如果數據集大,會導致宕機。猶如K-means 算法,該算法在1967 年便已經出現,后續經過版本更替,其算法描寫可以敘述為輸入簇的數目K,包含N 個對象的數據集D,輸出K 個簇的集合。

(二)云計算平臺

云計算平臺通過SPARK 框架來進行架構,在SPARK 框架下,主要是講數據以分區方式存儲,即RDD,在數據處理中,SPARK 需要先對待處理數據創建一個RDD,然后對RDD 施加轉換和行動操作。轉換的主要目的是促使RDD 迭代,即利用某些函數來促使舊的RDD 迭代為新的RDD,然后行動操作利用具體的算法來將RDD 中的數據進行計算,進而返回計算結果。RDD 默認情況下是存儲在內存當中,對內存的要求非常高,當然實際上可以通過調整設置,將RDD 存儲在存儲器當中,但運算速度會比較慢,一些經常使用的RDD 若存儲在存儲器當中,在運算時需要將其調用至內存中,多了一個過程,導致變慢,所以可以將一些常用的RDD 保存在內存中。基于SPARK 的云計算平臺架構,用戶采取自定義程序的方式,先定義好應用程序,然后提交至SPARK 集群,主節點上啟動進程MASTER,子節點上則啟動進程WORKER,主節點進程MASTER 會在子節點的WORKER 上啟動一個任務管理程序DRIVER。在DRIVER 中,任務的復雜程度由SPARKCONTEXT 進行判別并向主節點申請處理器和內存的資源。

結語

隨著科技的發展和時代的進步,云計算與數據挖掘平臺結合以后,實現了平臺的全面創新,整體上的工作安排比較符合預期目標,在技術的創新效果上非常顯著。但是,云計算的運用也是不斷革新,在二者的功能融合和技術聯動過程中,需要對數據挖掘平臺的風險、云計算的風險開展深度的評估,站在不同的層面上進行探究,提高數據挖掘平臺的可靠性。

猜你喜歡
數據挖掘信息
探討人工智能與數據挖掘發展趨勢
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 噜噜噜久久| 99ri国产在线| 五月婷婷精品| 亚洲天堂福利视频| 四虎永久在线精品国产免费| 一级片一区| 午夜啪啪福利| 久青草免费在线视频| 在线观看国产精品第一区免费| 成人免费网站久久久| 欧美日韩国产在线观看一区二区三区| 日本国产精品一区久久久| 一级毛片中文字幕| 国产在线观看精品| 2021精品国产自在现线看| 亚洲国产成人无码AV在线影院L| 国产精品制服| 中国一级毛片免费观看| 亚洲国产欧美国产综合久久| 欧美视频在线第一页| 日韩无码视频播放| 美女无遮挡免费视频网站| 最新无码专区超级碰碰碰| 97se综合| 99热精品久久| 亚洲免费人成影院| 国产成人精品高清在线| 黄片一区二区三区| 日本人妻丰满熟妇区| 国产精品女在线观看| 日本高清成本人视频一区| 亚洲福利视频一区二区| 欧美激情伊人| 国产无码在线调教| 亚洲精品视频免费| 精品欧美日韩国产日漫一区不卡| 亚洲精品另类| 亚洲男人的天堂久久香蕉网| 亚洲美女高潮久久久久久久| 免费在线a视频| 久久婷婷五月综合色一区二区| 亚洲综合网在线观看| 久久超级碰| 色婷婷电影网| 日韩毛片在线播放| 亚洲第一极品精品无码| 日本免费一区视频| 午夜a级毛片| 国产欧美日韩免费| 国内精品久久九九国产精品| 国产视频你懂得| 夜色爽爽影院18禁妓女影院| 色综合狠狠操| 91久久偷偷做嫩草影院精品| 中文字幕欧美日韩高清| 欧美成人午夜影院| 久久久噜噜噜久久中文字幕色伊伊 | 日韩最新中文字幕| 日韩黄色在线| 国产日本视频91| 乱系列中文字幕在线视频| 精品人妻一区二区三区蜜桃AⅤ| 国产精品视频系列专区 | 天天综合色网| 18禁黄无遮挡免费动漫网站| 2020精品极品国产色在线观看| 四虎成人精品| 亚洲日韩久久综合中文字幕| 天天躁夜夜躁狠狠躁图片| 国产一级α片| 中文字幕va| 美女内射视频WWW网站午夜 | 日韩成人免费网站| 伊人无码视屏| 国产成人久视频免费| 亚洲精品卡2卡3卡4卡5卡区| 亚洲男人天堂网址| 日韩精品成人在线| 日韩精品亚洲人旧成在线| 免费xxxxx在线观看网站| 国产国拍精品视频免费看 | 免费看黄片一区二区三区|