999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

MapReduce并行編程模型在大數據處理中的應用

2018-11-23 06:10:32
福建質量管理 2018年21期
關鍵詞:數據處理作業分析

(宿州學院信息工程學院 安徽 宿州 234000)

大數據作為一項技術發展已不再新奇,雖然現在淘汰也很迅速,但是基于大數據技術的應用早幾年就非常火熱,而且作為一項發展前景廣闊的技術,熱度目前還會持續上升還不會下降,所以做大數據處理是很有研究價值的。

此次研究目的是將大量的數據進行分析統計利用將該技術在功能上、精確性等方面還有待進一步完善,我們將Hadoop采取在Centos7下將分部式集群搭建完成。啟用hdfs來存儲數據,將要處理的數據存入hdfs中。在Centos7中安裝eclipse及搭建相關java環境,將Hadoop的包導入java項目中。在Hadoop中使用MapReduce類來處理數據。

一、大數據應用情況

數據量越來越大,在大量的數據中發掘有用的信息顯得越來越重要。人類的活動越來越依賴數據:(1)人類的日常生活已經與數據密不可分;(2)科學研究進入了“數據科學”時代;(3)各行各業開展工作也越來越依賴大數據手段。

二、MapReduce

(一)MapReduce的概述

MapReduce是一種分布式計算模型,而對于Hadoop來說,MapReduce是一個分布式計算框架。概括來說MapReduce的主要是想是把大的任務分解成很多小的任務,來并執行的這些小的任務,從而達到能能快速處理完這些任務的目的。

(二)MapReduce的組成

MapReduce的組成有兩個階段

map():任務分解。

reduce():結果匯總。

map、reduce這兩個函數的形參是key、value。

(三)MapReduce的任務

Map Reduce根據需要有兩種任務模式。一個是用Reducer實現的本地模式。另一個是用Runner實現的Yarn模式。其主要任務是在客戶端啟動一個作業,提交作業到資源管理任務調試請求一個Job ID,將運行所需資源文件復制到HDFS,用多個Map將數據分解處理,再到Reduce里整理處理的數據,存放到HDFS,每隔一段時間完成一次運行。

三、函數

mapper中,定義的map通過處理hive中或者本地的數據解析成鍵/值對來產生多個鍵/值對結果。鍵/值的處理效率是很高的,選擇對MapReduce作業的完成效率來說非常重要。鍵是分組的依據,值是分析的數據。

reduce是將mapper處理的數據作為輸入,依次為每個鍵對應分組執行此函數。reduce函數的輸入是鍵以及此鍵對應的迭代器。

四、HDFS

(一)HDFS的概述

1.一個HDFS集群是由一個NameNode和若干個DataNode組成。

2.NameNode作為主服務器管理整個文件系統的命名空間和客戶端訪問操作。

3.DataNode管理存儲數據塊。

4.文件會按照固定的大小(blocksize)切成若干塊后分布式存儲在若干臺datanode上。

5.每一個文件塊可以有多個副本,并存放在不同的datanode上。

6.Datanode會定期向Namenode匯報自身所保存的文件block信息,而namenode則會負責保持文件的副本數量。

7.HDFS的內部工作機制對客戶端保持透明,客戶端請求訪問HDFS都是通過向namenode申請來。

五、MapReduce案例

(一)統計單詞個數,通過MapReduce處理,對文本內容按行讀取

查看文件

[root@hadoop11 ~]# cat /simple/words.txt

all at once

all but

all of a sudden

all over again

all over

運算結果

[root@hadoop11 ~]# hdfs dfs -cat /output14/part-r-0000

a 1

again 1

all 5

at 1

but 1

of 1

over 2

once 1

sudden 1

結束語

社會進步需要大數據、云計算的發展。在推動數據資源共享開放和開發應用上大數據處理技術都占著很大的地位。超大規模計算和海量數據的分析將可以在大數據開發過程中實現,復雜度較高、精密度較高的信息處理都可以在短時間內完成。下一步我們將繼續深度研究數據處理,而像分析、成功率計算等都將會更加準確。并且可以根據客戶需求高度自由的數據互動,通過分析數模預測進行推送。Hadoop技術雖然已經被廣泛應用,不管是在功能上還是穩定性等方面,此技術還有待進一步改進。因此我們不論是在開發的過程中還是升級維護中,都將有新的功能不斷地添加和引入。

猜你喜歡
數據處理作業分析
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
隱蔽失效適航要求符合性驗證分析
快來寫作業
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
作業
故事大王(2016年7期)2016-09-22 17:30:08
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
我想要自由
基于POS AV610與PPP的車輛導航數據處理
主站蜘蛛池模板: 日韩中文欧美| 九色国产在线| 污网站在线观看视频| 亚洲欧美另类视频| 97人人做人人爽香蕉精品| 欧美第一页在线| 亚洲欧洲自拍拍偷午夜色| 免费AV在线播放观看18禁强制| 呦女精品网站| 久久综合九九亚洲一区| 国产色婷婷视频在线观看| 国产精品浪潮Av| 亚洲国产91人成在线| 国产 在线视频无码| 亚洲av日韩av制服丝袜| 丁香婷婷综合激情| 亚洲欧美日韩精品专区| 国产欧美日本在线观看| 国产日韩精品欧美一区喷| 日韩精品少妇无码受不了| 免费看一级毛片波多结衣| 精品91在线| 欧美一级在线播放| 亚洲成肉网| 色妞永久免费视频| 亚洲一区二区三区国产精品| 福利视频久久| 国产美女视频黄a视频全免费网站| 国产95在线 | 久久大香伊蕉在人线观看热2| 91九色视频网| 亚洲无码A视频在线| 亚洲AV无码不卡无码| 欧美精品亚洲日韩a| 六月婷婷综合| 中文字幕在线观| 国产精品成| 99久久国产综合精品女同| 99精品在线看| 天堂在线www网亚洲| 国产午夜无码片在线观看网站| 中文字幕 91| 亚洲欧美精品一中文字幕| 青青青亚洲精品国产| 久久久久人妻一区精品| 114级毛片免费观看| 99这里只有精品6| 黄色网在线| 免费一级大毛片a一观看不卡| 成人在线欧美| 国产欧美日韩资源在线观看| 國產尤物AV尤物在線觀看| 欧美成人a∨视频免费观看| 手机在线免费不卡一区二| 99热这里只有免费国产精品| 小说区 亚洲 自拍 另类| 中文字幕日韩欧美| 久久大香伊蕉在人线观看热2| 真实国产乱子伦视频| 国产精品刺激对白在线| 亚洲国内精品自在自线官| 亚洲欧美色中文字幕| 国产一区二区三区在线观看免费| 色AV色 综合网站| 欧美色伊人| 激情乱人伦| 91精选国产大片| 中文字幕在线一区二区在线| 一级香蕉人体视频| 欧美成人A视频| 久久一色本道亚洲| a色毛片免费视频| 欧美在线综合视频| 欧洲极品无码一区二区三区| 国产免费人成视频网| 亚洲精品中文字幕无乱码| 国产亚洲精久久久久久无码AV| 天天爽免费视频| 四虎精品国产AV二区| 四虎亚洲精品| 午夜不卡视频| 亚洲中文字幕久久精品无码一区|