999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計(jì)算的大數(shù)據(jù)挖掘探討

2017-09-03 10:02:59白玲玲
關(guān)鍵詞:數(shù)據(jù)挖掘可視化

白玲玲

(中共阜陽市委黨校教務(wù)處,安徽阜陽 236000)

基于云計(jì)算的大數(shù)據(jù)挖掘探討

白玲玲

(中共阜陽市委黨校教務(wù)處,安徽阜陽 236000)

隨著科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步,各種復(fù)雜的數(shù)據(jù)也隨之增長。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)由于人為因素,使數(shù)據(jù)受到的干擾程度比較大。將云計(jì)算與大數(shù)據(jù)進(jìn)行有機(jī)的結(jié)合,可以很好地彌補(bǔ)這一缺陷,基于云計(jì)算的大數(shù)據(jù)挖掘具有潛在的發(fā)展優(yōu)勢。

云計(jì)算;大數(shù)據(jù)挖掘

1 大數(shù)據(jù)挖掘

大數(shù)據(jù)挖掘是從類型豐富、儲量較大的大數(shù)據(jù)中挖掘出有相關(guān)需求和價(jià)值的信息和知識,并提供給客戶的服務(wù)方式。相比傳統(tǒng)的數(shù)據(jù)挖掘,雖然目的相同,但就技術(shù)發(fā)展的程度以及挖掘的深度和速度來說,兩者的差異還是比較大的。

1.1 發(fā)展背景

在數(shù)據(jù)庫以及互聯(lián)網(wǎng)不斷發(fā)展的背景下,能夠?qū)崿F(xiàn)從獨(dú)立、橫向到縱向的數(shù)據(jù)挖掘,主要得益于云計(jì)算以及智能終端等先進(jìn)技術(shù)的產(chǎn)生和完善[1]。相比傳統(tǒng)的數(shù)據(jù)挖掘,這種技術(shù)還在進(jìn)一步的完善中。

1.2 處理對象

由于面臨的數(shù)據(jù)背景不同,大數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)挖掘的處理對象存在一定差異。傳統(tǒng)的數(shù)據(jù)挖掘主要針對從某個(gè)特指的范圍管理信息的系統(tǒng)中產(chǎn)生的數(shù)據(jù),這個(gè)過程中是被動(dòng)的需求,主要數(shù)據(jù)類型為結(jié)構(gòu)化數(shù)據(jù)。而大數(shù)據(jù)挖掘的數(shù)據(jù)來源更加廣泛,類型更加豐富,不僅包括管理信息系統(tǒng)數(shù)據(jù),還包括傳感設(shè)備自動(dòng)產(chǎn)生的仿真數(shù)據(jù)[2]。與此同時(shí),由于采集范圍更加全面,大數(shù)據(jù)挖掘在采集中不會處于被動(dòng),這使得處理的實(shí)效性以及速度都能夠提升。

1.3 挖掘程度

傳統(tǒng)的數(shù)據(jù)挖掘處理技術(shù)具有局限性,類型較為單一[3],導(dǎo)致對很多數(shù)據(jù)的獲取和處理受到限制。目前大數(shù)據(jù)的類型以及結(jié)構(gòu)都比較復(fù)雜,相互之間難免有交集和融合。大數(shù)據(jù)挖掘得益于云計(jì)算,能夠?qū)︻愋蛷?fù)雜、數(shù)量龐雜的數(shù)據(jù)進(jìn)行處理,從多個(gè)維度進(jìn)行分析,處理數(shù)據(jù)的范圍更廣泛,對數(shù)據(jù)的挖掘也更全面和深入。

2 基于云計(jì)算的大數(shù)據(jù)挖掘體系

2.1 云計(jì)算

由于擴(kuò)展比較高,有虛擬化的計(jì)算模式,云計(jì)算為大數(shù)據(jù)挖掘處理提供了動(dòng)力支持。分布式的存儲與計(jì)算是云計(jì)算的核心技術(shù),分布式文件系統(tǒng)具有高容錯(cuò)率和高吞吐率,多適用于一些大型或類型多樣的數(shù)據(jù),不適于一些單點(diǎn)的故障問題[4]。在面對多個(gè)領(lǐng)域內(nèi)的數(shù)據(jù)分享和挖掘的適用性等一系統(tǒng)問題時(shí),還需要進(jìn)行深入分析,找到相應(yīng)的解決方案實(shí)現(xiàn)進(jìn)一步融合。

2.2 大數(shù)據(jù)挖掘架構(gòu)

大數(shù)據(jù)的挖掘架構(gòu)包含了多種計(jì)算方式、存儲模式以及分析功能,如圖1所示。(1)支撐平臺層是大數(shù)據(jù)挖掘的動(dòng)力支撐,能夠?qū)⒋髷?shù)據(jù)與資源豐富的元環(huán)境進(jìn)行融合,向外界提供數(shù)據(jù)信息和知識等資源。而且,還可以計(jì)算數(shù)據(jù)的移動(dòng)方式,為復(fù)雜數(shù)據(jù)的處理和分析提供更強(qiáng)大的動(dòng)力。(2)功能層能夠依據(jù)用戶需求進(jìn)行分析和挖掘,它依托云平臺的存儲與計(jì)算能力,具有較好的伸展性。(3)服務(wù)層,大數(shù)據(jù)挖掘通過服務(wù)平臺,將服務(wù)提供者與用戶連接起來,對其所需數(shù)據(jù)進(jìn)行處理,并通過服務(wù)層將數(shù)據(jù)提供給用戶。這三者之間不是獨(dú)立存在的,而是相互融合的。

圖1 大數(shù)據(jù)挖掘框架

3 基于Hadoop的大數(shù)據(jù)挖掘平臺

基于Hadoop的大數(shù)據(jù)挖掘平臺分為三層,即數(shù)據(jù)源、大數(shù)據(jù)挖掘平臺和用戶層(圖2)。它們各有分工,數(shù)據(jù)源主要對不同結(jié)構(gòu)數(shù)據(jù)形成的對象進(jìn)行處理;大數(shù)據(jù)挖掘平臺是對數(shù)據(jù)進(jìn)行實(shí)時(shí)的分析和處理;用戶層則是通過相關(guān)的平臺進(jìn)行認(rèn)知并接受服務(wù)提供者的服務(wù)。

3.1 數(shù)據(jù)預(yù)處理

傳統(tǒng)的數(shù)據(jù)挖掘是先有相關(guān)模式,而后才能夠從數(shù)據(jù)源中獲取數(shù)據(jù)。通過相關(guān)工具查詢和更新,進(jìn)行數(shù)據(jù)預(yù)處理,此過程中比較重視數(shù)據(jù)的完整性和準(zhǔn)確性,確保處理的數(shù)據(jù)質(zhì)量比較高。而大數(shù)據(jù)挖掘不是在進(jìn)行數(shù)據(jù)處理時(shí)確立某種模式,而是隨著數(shù)據(jù)的變化,相應(yīng)地改變其模式。數(shù)據(jù)預(yù)處理基于MapReduce進(jìn)行融合,從而對這些復(fù)雜和多樣類型的數(shù)據(jù)進(jìn)行實(shí)時(shí)的處理和識別,以此提高預(yù)處理過程中對于數(shù)據(jù)的計(jì)算能力以及共享能力。利用計(jì)算機(jī)技術(shù)和相關(guān)數(shù)據(jù)處理技術(shù)對數(shù)據(jù)進(jìn)行傳輸和遷移,可以實(shí)現(xiàn)對相關(guān)數(shù)據(jù)的同步處理,提高對數(shù)據(jù)的處理效率[5]。

3.2 數(shù)據(jù)的存儲

傳統(tǒng)的數(shù)據(jù)挖掘存儲管理,以相應(yīng)的數(shù)據(jù)庫以及一些文件系統(tǒng)為主,將靜態(tài)或已確定結(jié)構(gòu)的數(shù)據(jù)進(jìn)行存儲,這樣的存儲方式比較被動(dòng),一般是由系統(tǒng)內(nèi)部進(jìn)行機(jī)械定義,靈活性較差,可擴(kuò)展性不足,容錯(cuò)能力不強(qiáng)。而大數(shù)據(jù)挖掘的存儲還包括了分布式、可存儲以及結(jié)構(gòu)式或者混合式的存儲,這種存儲模式是由系統(tǒng)內(nèi)部來實(shí)現(xiàn)的,具有很強(qiáng)的擴(kuò)展性,但受到一些因素的影響,數(shù)據(jù)不能對應(yīng)一致,導(dǎo)致兼容性存在問題。對于一些不確定的數(shù)據(jù),大數(shù)據(jù)存儲能夠以不確定的類型進(jìn)行存儲,實(shí)現(xiàn)不確定數(shù)據(jù)的直接存儲和處理。

3.3 數(shù)據(jù)的計(jì)算和分析

相對于傳統(tǒng)的數(shù)據(jù)挖掘來說,大數(shù)據(jù)挖掘能夠以與計(jì)算模式相融合的方式對數(shù)據(jù)進(jìn)行處理和分布。對于維度比較少的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)挖掘次數(shù)比較多,查詢相對精準(zhǔn),具有一定的靈活性和處理能力,呈現(xiàn)出較高的性能。但是在面對維度繁多且立方體龐大的數(shù)據(jù)時(shí),傳統(tǒng)數(shù)據(jù)挖掘的處理速度、效率和質(zhì)量都差強(qiáng)人意。針對傳統(tǒng)數(shù)據(jù)挖掘分析工具擴(kuò)展性的不足,大數(shù)據(jù)挖掘與已有的系統(tǒng)功能相融合,提高計(jì)算能力。對于一些動(dòng)態(tài)圖的數(shù)據(jù)以及數(shù)據(jù)流,可基于內(nèi)存分布式的數(shù)據(jù)通過滑動(dòng)窗口模型的方式,進(jìn)行連續(xù)處理。除了傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的語言查詢功能外,大數(shù)據(jù)挖掘具備自身相應(yīng)的查詢語言,其擴(kuò)展性和靈活性比較出眾,但查詢性能比較低,對資源的利用率相對不足。

3.4 數(shù)據(jù)的顯示

在傳統(tǒng)的數(shù)據(jù)挖掘中,數(shù)據(jù)結(jié)果集的展示僅適用于數(shù)量比較小且維度相對較低的數(shù)據(jù),展示方式主要以文本、圖表以及可視化圖形(餅狀圖、散點(diǎn)圖、ROC圖等)的形式對數(shù)據(jù)的理論效果和相關(guān)性能進(jìn)行呈現(xiàn)和挖掘。但是,在面對多維度、類型多樣、數(shù)目繁多的數(shù)據(jù),由于技術(shù)的限制,導(dǎo)致擴(kuò)展性不足且對數(shù)據(jù)的利用比較被動(dòng),難以找出數(shù)據(jù)相互之間的關(guān)聯(lián)性,可視化效果不佳。而大數(shù)據(jù)挖掘?qū)τ跀?shù)據(jù)的展示,是以圖像或者動(dòng)畫的形式,通過人機(jī)交互的可視化方式進(jìn)行直觀的解釋。在這個(gè)過程中可通過輔助的可視化分析,幫助用戶理清數(shù)據(jù)之間的相互關(guān)系,降低數(shù)據(jù)的理解難度,使用戶能夠在探索的基礎(chǔ)上進(jìn)行理解。利用可視化技術(shù)表現(xiàn)較為復(fù)雜的圖像,如宇宙星球、集群成員的分配等,以此來反映事物的變化和空間的信息流等,使數(shù)據(jù)的流線化、管道和任務(wù)以及數(shù)據(jù)的并行化等并行算法技術(shù)成為現(xiàn)實(shí)。

[1]林昕.基于云計(jì)算的大數(shù)據(jù)挖掘平臺構(gòu)建研究[J].山東工業(yè)技術(shù),2015(17):104.

[2]張毅,崔曉燕.基于云計(jì)算平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究[J].軟件,2014(1):108-111.

[3]郭杰鋒,王琳琳.探究基于云計(jì)算的大數(shù)據(jù)挖掘平臺[J].科技經(jīng)濟(jì)市場,2015(6):176.

[4]劉猛.一種基于云計(jì)算的高效數(shù)據(jù)挖掘框架研究[J].微型電腦應(yīng)用,2015(6):15-19.

[5]王勃,徐靜.基于云計(jì)算的Web數(shù)據(jù)挖掘Map/Reduce算法的研究[J].計(jì)算機(jī)與數(shù)字工程,2014(7):1157-1159,1164.

Discussion of Data Mining Based on Cloud Computing

BAI Ling-ling

(CPC Fuyang Municipal Party Committee, Fuyang Anhui 236000,China)

With the development of economy and constant progress of science and technology, all sorts of complex data has risen as well. Due to human factors of traditional data mining techniques,data will be interfered. This paper combined cloud computing and big data to fill gaps, and it has a great deal of potential advantages for developing data mining.

cloud computing; data mining

2017-03-04

阜陽市2016年社科規(guī)劃課題“網(wǎng)絡(luò)倫理視域下領(lǐng)導(dǎo)干部網(wǎng)絡(luò)能力建設(shè)問題研究”(FSK2016007)。

白玲玲(1981- ),女,講師,碩士,從事計(jì)算機(jī)應(yīng)用研究。

TP311

A

2095-7602(2017)08-0059-03

猜你喜歡
數(shù)據(jù)挖掘可視化
自然資源可視化決策系統(tǒng)
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統(tǒng)
北京測繪(2021年7期)2021-07-28 07:01:18
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 亚洲国产成人麻豆精品| 国产一级妓女av网站| 久久精品欧美一区二区| 国产99欧美精品久久精品久久| 国产日本欧美亚洲精品视| 亚洲精品无码AⅤ片青青在线观看| 国产最爽的乱婬视频国语对白 | 91成人在线观看| 一级香蕉人体视频| 麻豆AV网站免费进入| 国产精鲁鲁网在线视频| 成人午夜网址| 一级毛片不卡片免费观看| 国产夜色视频| 狼友视频国产精品首页| 99er这里只有精品| 米奇精品一区二区三区| 欧美成a人片在线观看| 国产二级毛片| 97国产精品视频人人做人人爱| 久久精品这里只有精99品| 日本三级欧美三级| 欧美亚洲激情| 好紧太爽了视频免费无码| 免费看a毛片| 成人综合久久综合| 国产成人亚洲欧美激情| 91啪在线| 91精品综合| 最新加勒比隔壁人妻| 国产人妖视频一区在线观看| 亚洲一区二区黄色| 色综合综合网| 激情综合网址| 麻豆AV网站免费进入| 国产自产视频一区二区三区| 丰满人妻久久中文字幕| 国产门事件在线| 国产一线在线| 中文字幕2区| 激情在线网| 亚洲免费福利视频| 日韩人妻无码制服丝袜视频| …亚洲 欧洲 另类 春色| 婷婷综合缴情亚洲五月伊| 国产精品视频免费网站| 狠狠色综合网| 国产你懂得| 久久国产精品波多野结衣| 久久精品免费国产大片| 国产嫩草在线观看| 免费无码AV片在线观看国产| 人妻精品久久无码区| 久久综合丝袜日本网| 久久青草精品一区二区三区| 亚洲黄网在线| 国产性爱网站| 国产真实自在自线免费精品| 亚洲国模精品一区| 国产综合网站| 一级毛片在线直接观看| 国产a网站| 中文字幕在线一区二区在线| 亚洲欧美国产五月天综合| 久热精品免费| 福利一区三区| 色老头综合网| 久久9966精品国产免费| 久久久噜噜噜久久中文字幕色伊伊 | 精品久久久久成人码免费动漫| 2021国产乱人伦在线播放| 国产一级毛片网站| 中文字幕1区2区| 91丝袜乱伦| 热伊人99re久久精品最新地| 欧美a在线视频| 无码丝袜人妻| 99伊人精品| 欧美成人亚洲综合精品欧美激情| 国产草草影院18成年视频| 国产久操视频| 亚洲日韩每日更新|