999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Mapreduce模型及支撐系統(tǒng)概述

2017-10-09 06:54:44李煒賀麗娟陜西國防工業(yè)職業(yè)技術(shù)學(xué)院陜西西安710300
電子測試 2017年17期
關(guān)鍵詞:數(shù)據(jù)處理模型系統(tǒng)

李煒,賀麗娟(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西西安,710300)

Mapreduce模型及支撐系統(tǒng)概述

李煒,賀麗娟
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西西安,710300)

MapReduce是由并行編程模型及相關(guān)支撐系統(tǒng)組成的數(shù)據(jù)處理框架,通過定義接口和運(yùn)行時(shí)支持庫, 通過定義良好的接口和運(yùn)行時(shí)支持庫,能夠自動(dòng)并行執(zhí)行大規(guī)模計(jì)算任務(wù),通過隱藏底層實(shí)現(xiàn)細(xì)節(jié),降低實(shí)現(xiàn)并行編程的難度,Hadoop 是目前MapReduce 框架最流行的開源實(shí)現(xiàn)。文章首先介紹了 MapReduce 并行編程模型及其hadoop的運(yùn)行原理、運(yùn)行機(jī)制, 深入研究了 MapReduce 計(jì)算任務(wù)在 Hadoop 系統(tǒng)中的運(yùn)行過程。

大數(shù)據(jù);MapReduce;hadoop;HDFS

0 引言

MapReduce 由Google公司于2004提出的一種最為成功的面向數(shù)據(jù)的并行編程模型[1],該模型給程序員在復(fù)雜的分布式集群平臺(tái)上提供了簡單的編程接口和強(qiáng)大的支撐系統(tǒng),使海量數(shù)據(jù)的并行編程模型變得簡單易學(xué)、大大的降低并行編程難度,讓程序員只需要了解應(yīng)用程序的業(yè)務(wù)邏輯實(shí)現(xiàn)。MapReduce 模型的支撐系統(tǒng)來自行處理以下工作:(1)任務(wù)調(diào)度并行(2)彈性分布(3)系統(tǒng)負(fù)載均衡和容錯(cuò)等問題。

首先在數(shù)據(jù)預(yù)處理階段,Hadoop系統(tǒng)把數(shù)據(jù)先載入到分布式存儲(chǔ)文件中;其次數(shù)據(jù)處理階段,在Hadoop實(shí)現(xiàn)大規(guī)模并行數(shù)據(jù)處理時(shí),可使用Python、java、HiveQL 和 Pig Latin 等編程語言簡化并協(xié)助對于數(shù)據(jù)的處理,提高數(shù)據(jù)處理的 能力與效率[2]。

1 MapReduce 編程模型及Hadoop系統(tǒng)

1.1 MapReduce編程模型

MapReduce編程模型的核心是map和reduce兩個(gè)指定函數(shù)的定義和執(zhí)行,map()責(zé)分塊數(shù)據(jù)的處理,reduce()函數(shù)負(fù)責(zé)對分塊數(shù)據(jù)處理的中間結(jié)果進(jìn)行歸約。MapReduce其實(shí)就是Divide/Conquer 的過程, map階段將輸入數(shù)據(jù)U<keys,values>,然后對這些值進(jìn)行map操作,得到中間數(shù)據(jù)[3]。接著對這些拆分后的數(shù)據(jù)進(jìn)行高度并行的map運(yùn)算, 最后將 Map 后的結(jié)果進(jìn)行 Reduce, 得到最終的結(jié)果。 有時(shí),由于數(shù)據(jù)的原因,需要將原始數(shù)據(jù)分解成多個(gè)MapReduce過程。其處理對于數(shù)據(jù)的處理流程示意圖如圖1所示。

1.2 Hadoop系統(tǒng)

Hadoop 它是由Apache基金會(huì)所開發(fā)的以MapReduce編程模型為核心的開源分布式的系統(tǒng)基礎(chǔ)架構(gòu)計(jì)算框架項(xiàng)目[4]。其中HDFS和MapReduce為Hadoop的框架的核心設(shè)計(jì)。HDFS為海量大數(shù)據(jù)的存儲(chǔ)提供了可行性的技術(shù)支持,MapReduce則為海數(shù)據(jù)的計(jì)算提供了可能。Hadoop它是一個(gè)可以實(shí)現(xiàn)對大量數(shù)據(jù)進(jìn)行分布式處理的一種軟件框架,以高效、可伸縮、可靠的、高錯(cuò)容、低成本的方式對數(shù)據(jù)進(jìn)行處理。

1.2.1 Hadoop的組織架構(gòu)

Hadoop 系統(tǒng)對大規(guī)模機(jī)器集群以主從的組織方式進(jìn)行管理,即把各處理節(jié)點(diǎn)劃分為一個(gè)Master節(jié)點(diǎn)和若干個(gè)Slave節(jié)點(diǎn),如圖 2-2。主節(jié)點(diǎn)上運(yùn)行守護(hù)程序,守護(hù)程序主要負(fù)責(zé)對整個(gè)計(jì)算任務(wù)執(zhí)行過程的統(tǒng)一管理,并且把計(jì)算任務(wù)分解成可并行執(zhí)行的若干個(gè)子任務(wù),同時(shí)分配到各從節(jié)點(diǎn)中。節(jié)點(diǎn)上運(yùn)行守護(hù)程序,從節(jié)點(diǎn)的任務(wù)是負(fù)責(zé)調(diào)度各從節(jié)點(diǎn)中的處理機(jī)資源,并完成各子任務(wù)的具體執(zhí)行。具體執(zhí)行過程如下圖2所示。

圖2 Hadoop的組織架構(gòu)

1.2.2 分布式文件系統(tǒng) HDFS

HDFS采用master/slave架構(gòu),是Hadoop系統(tǒng)的重要組成。一個(gè)獨(dú)立的HDFS集群由一個(gè)Namenode和若干個(gè)Datanodes組成。其中,Namenode是負(fù)責(zé)管理文件系統(tǒng)namespace以及客戶端對文件的訪問的中心服務(wù)器。集群中的Datanode一般是負(fù)責(zé)管理它所在節(jié)點(diǎn)上存儲(chǔ)的一個(gè)節(jié)點(diǎn)。其處理流程圖如圖3所示。

圖3 HDFS數(shù)據(jù)處理流程

2 MapReduce任務(wù)計(jì)算過程

一般給定系統(tǒng)集群資源后單個(gè) MapReduce 計(jì)算任務(wù)的具體執(zhí)行步驟如下。

(1)計(jì)算任務(wù)的提交

把用戶提交的數(shù)據(jù)集的數(shù)據(jù)劃分為若干個(gè)數(shù)據(jù)塊,同時(shí)把各數(shù)據(jù)塊載入到 Hadoop集群的各從節(jié)點(diǎn),HDFS 文件系統(tǒng)的 DatatNode 和 NameNode 負(fù)責(zé)數(shù)據(jù)的管理和存儲(chǔ)。程序集被送到主節(jié)點(diǎn)負(fù)責(zé)完成對程序的調(diào)度執(zhí)行,主要通過主節(jié)點(diǎn)中的JobTracker 和多個(gè)從節(jié)點(diǎn)中的 TaskTracker實(shí)現(xiàn)完成。

(2)Map子任務(wù)的執(zhí)行

主節(jié)點(diǎn)中的JobTracker把map函數(shù)的執(zhí)行代碼傳輸分配到選定的從節(jié)點(diǎn)中,再由從節(jié)點(diǎn)上的TaskTracker對節(jié)點(diǎn)或附近節(jié)點(diǎn)的數(shù)據(jù)塊調(diào)度執(zhí)行map函數(shù),形成多個(gè)Map子任務(wù)。

(3)Reduce子任務(wù)的執(zhí)行

部分Map子任務(wù)執(zhí)行完畢時(shí),選定的節(jié)點(diǎn)開始執(zhí)行reduce函數(shù),開始對由Map子任務(wù)產(chǎn)生的中間數(shù)據(jù)鍵值對<u2,v2>進(jìn)行處理。Reduce的子任務(wù)數(shù)可以為一個(gè)或若干個(gè)。

(4)結(jié)果返回階段

把存儲(chǔ)在HDFS中計(jì)算任務(wù)的執(zhí)行結(jié)果提交給用戶。

本文主要介紹mapreduce模型及其支撐系統(tǒng)的模型,分別對mapreuce編程模型、hadoop的結(jié)構(gòu)及Hdfs進(jìn)行了簡單的介紹,對于在實(shí)際系統(tǒng)中影響系統(tǒng)執(zhí)行效果的資源優(yōu)化配置如:系統(tǒng)容錯(cuò)、系統(tǒng)的任務(wù)調(diào)度及負(fù)載均衡等由于篇幅關(guān)系這里不在介紹。總之,隨著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,對于mapreduce及其支撐系統(tǒng)的研究具有非常重大的意義。

3 總結(jié)

[1]Dean J, Ghemawat S. MapReduce: Simplified data processingon large clusters. Communications of the ACM, 2008, 51(1):107-113.

[2]韓海雯.MapReduce計(jì)算任務(wù)調(diào)度旳資源配置優(yōu)化研究[D].華南理工大學(xué),2013.10.

[3]應(yīng)毅.MapReduce 并行計(jì)算技術(shù)發(fā)展綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014.

[4]Tom White 著.周敏奇,王曉玲,金澈清等譯.Hadoop權(quán)威指南(第二版)[M].北京:清華大學(xué)出版社,2011.

Overview graphs model and support system

Li Wei,He Lijuan
(Shanxi instiute of technology,Xi’an Shaanxi,710300)

MapReduce is composed of parallel programming model and its support system data processing framework, through the definition of interface support library and runtime support library, through the definition of a good interface and operation, capable of automatic parallel execution of large-scale computing tasks, by hiding the underlying implementation details, reduce the difficulty of parallel programming, Hadoop is currently the most popular MapReduce framework open source implementation. Firstly, this paper introduces the MapReduce parallel programming model and the operation principle and operation mechanism of Hadoop, and deeply studies the operation process of MapReduce computing task in Hadoop system. Key words: big data; graphs; hadoop; HDFS

李煒(1990.9),男,漢族,籍貫陜西禮泉,助教,碩士研究生,研究方向人工智能大數(shù)據(jù)。

猜你喜歡
數(shù)據(jù)處理模型系統(tǒng)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
3D打印中的模型分割與打包
主站蜘蛛池模板: 在线国产资源| 久操中文在线| 色妺妺在线视频喷水| 国产极品美女在线观看| 亚洲国产午夜精华无码福利| 伊人网址在线| 在线观看精品自拍视频| 国产91丝袜在线播放动漫 | 成·人免费午夜无码视频在线观看| 久久a级片| 亚洲第一成人在线| 2021无码专区人妻系列日韩| 波多野一区| 茄子视频毛片免费观看| 国产午夜人做人免费视频中文| 亚洲日本中文字幕乱码中文| 国产jizz| 最新国产精品第1页| 伊人久综合| 日韩人妻无码制服丝袜视频| 天天色综网| 免费毛片全部不收费的| 婷婷六月综合| 中文无码精品A∨在线观看不卡| 国产成人啪视频一区二区三区| 国产波多野结衣中文在线播放| 亚洲日本精品一区二区| 日韩区欧美国产区在线观看| 午夜免费小视频| 九九九精品视频| 国产男人天堂| 亚洲欧美在线综合一区二区三区| 国产日韩欧美视频| 中文字幕免费播放| 97久久精品人人做人人爽| AV在线天堂进入| 中文字幕亚洲第一| 91色老久久精品偷偷蜜臀| 久久综合AV免费观看| 免费欧美一级| 狠狠色香婷婷久久亚洲精品| 91人妻日韩人妻无码专区精品| 伊人久久大线影院首页| 久久国产亚洲偷自| 亚洲区欧美区| 一本色道久久88| 91福利在线看| 欧美视频免费一区二区三区| 日本成人精品视频| 99热6这里只有精品| 91最新精品视频发布页| 国产精品吹潮在线观看中文| 四虎影视8848永久精品| 久久精品欧美一区二区| V一区无码内射国产| 欧美福利在线观看| 国产系列在线| 伊伊人成亚洲综合人网7777| 69av免费视频| 精品黑人一区二区三区| 久久综合色88| 亚洲女同一区二区| 欧美一区二区啪啪| 亚洲欧美日韩综合二区三区| 播五月综合| 国产日韩欧美视频| 91探花在线观看国产最新| 女同国产精品一区二区| 亚洲精品天堂在线观看| 无码中文字幕乱码免费2| 伊人福利视频| 日本国产一区在线观看| 91色国产在线| 午夜爽爽视频| 免费观看成人久久网免费观看| 免费人成网站在线观看欧美| 九九九精品成人免费视频7| 国产亚洲一区二区三区在线| 国产精品理论片| 久久香蕉国产线看观看精品蕉| 波多野结衣国产精品| 国产嫖妓91东北老熟女久久一|