999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Mapreduce模型及支撐系統(tǒng)概述

2017-10-09 06:54:44李煒賀麗娟陜西國防工業(yè)職業(yè)技術(shù)學(xué)院陜西西安710300
電子測(cè)試 2017年17期
關(guān)鍵詞:數(shù)據(jù)處理模型系統(tǒng)

李煒,賀麗娟(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西西安,710300)

Mapreduce模型及支撐系統(tǒng)概述

李煒,賀麗娟
(陜西國防工業(yè)職業(yè)技術(shù)學(xué)院,陜西西安,710300)

MapReduce是由并行編程模型及相關(guān)支撐系統(tǒng)組成的數(shù)據(jù)處理框架,通過定義接口和運(yùn)行時(shí)支持庫, 通過定義良好的接口和運(yùn)行時(shí)支持庫,能夠自動(dòng)并行執(zhí)行大規(guī)模計(jì)算任務(wù),通過隱藏底層實(shí)現(xiàn)細(xì)節(jié),降低實(shí)現(xiàn)并行編程的難度,Hadoop 是目前MapReduce 框架最流行的開源實(shí)現(xiàn)。文章首先介紹了 MapReduce 并行編程模型及其hadoop的運(yùn)行原理、運(yùn)行機(jī)制, 深入研究了 MapReduce 計(jì)算任務(wù)在 Hadoop 系統(tǒng)中的運(yùn)行過程。

大數(shù)據(jù);MapReduce;hadoop;HDFS

0 引言

MapReduce 由Google公司于2004提出的一種最為成功的面向數(shù)據(jù)的并行編程模型[1],該模型給程序員在復(fù)雜的分布式集群平臺(tái)上提供了簡(jiǎn)單的編程接口和強(qiáng)大的支撐系統(tǒng),使海量數(shù)據(jù)的并行編程模型變得簡(jiǎn)單易學(xué)、大大的降低并行編程難度,讓程序員只需要了解應(yīng)用程序的業(yè)務(wù)邏輯實(shí)現(xiàn)。MapReduce 模型的支撐系統(tǒng)來自行處理以下工作:(1)任務(wù)調(diào)度并行(2)彈性分布(3)系統(tǒng)負(fù)載均衡和容錯(cuò)等問題。

首先在數(shù)據(jù)預(yù)處理階段,Hadoop系統(tǒng)把數(shù)據(jù)先載入到分布式存儲(chǔ)文件中;其次數(shù)據(jù)處理階段,在Hadoop實(shí)現(xiàn)大規(guī)模并行數(shù)據(jù)處理時(shí),可使用Python、java、HiveQL 和 Pig Latin 等編程語言簡(jiǎn)化并協(xié)助對(duì)于數(shù)據(jù)的處理,提高數(shù)據(jù)處理的 能力與效率[2]。

1 MapReduce 編程模型及Hadoop系統(tǒng)

1.1 MapReduce編程模型

MapReduce編程模型的核心是map和reduce兩個(gè)指定函數(shù)的定義和執(zhí)行,map()責(zé)分塊數(shù)據(jù)的處理,reduce()函數(shù)負(fù)責(zé)對(duì)分塊數(shù)據(jù)處理的中間結(jié)果進(jìn)行歸約。MapReduce其實(shí)就是Divide/Conquer 的過程, map階段將輸入數(shù)據(jù)U<keys,values>,然后對(duì)這些值進(jìn)行map操作,得到中間數(shù)據(jù)[3]。接著對(duì)這些拆分后的數(shù)據(jù)進(jìn)行高度并行的map運(yùn)算, 最后將 Map 后的結(jié)果進(jìn)行 Reduce, 得到最終的結(jié)果。 有時(shí),由于數(shù)據(jù)的原因,需要將原始數(shù)據(jù)分解成多個(gè)MapReduce過程。其處理對(duì)于數(shù)據(jù)的處理流程示意圖如圖1所示。

1.2 Hadoop系統(tǒng)

Hadoop 它是由Apache基金會(huì)所開發(fā)的以MapReduce編程模型為核心的開源分布式的系統(tǒng)基礎(chǔ)架構(gòu)計(jì)算框架項(xiàng)目[4]。其中HDFS和MapReduce為Hadoop的框架的核心設(shè)計(jì)。HDFS為海量大數(shù)據(jù)的存儲(chǔ)提供了可行性的技術(shù)支持,MapReduce則為海數(shù)據(jù)的計(jì)算提供了可能。Hadoop它是一個(gè)可以實(shí)現(xiàn)對(duì)大量數(shù)據(jù)進(jìn)行分布式處理的一種軟件框架,以高效、可伸縮、可靠的、高錯(cuò)容、低成本的方式對(duì)數(shù)據(jù)進(jìn)行處理。

1.2.1 Hadoop的組織架構(gòu)

Hadoop 系統(tǒng)對(duì)大規(guī)模機(jī)器集群以主從的組織方式進(jìn)行管理,即把各處理節(jié)點(diǎn)劃分為一個(gè)Master節(jié)點(diǎn)和若干個(gè)Slave節(jié)點(diǎn),如圖 2-2。主節(jié)點(diǎn)上運(yùn)行守護(hù)程序,守護(hù)程序主要負(fù)責(zé)對(duì)整個(gè)計(jì)算任務(wù)執(zhí)行過程的統(tǒng)一管理,并且把計(jì)算任務(wù)分解成可并行執(zhí)行的若干個(gè)子任務(wù),同時(shí)分配到各從節(jié)點(diǎn)中。節(jié)點(diǎn)上運(yùn)行守護(hù)程序,從節(jié)點(diǎn)的任務(wù)是負(fù)責(zé)調(diào)度各從節(jié)點(diǎn)中的處理機(jī)資源,并完成各子任務(wù)的具體執(zhí)行。具體執(zhí)行過程如下圖2所示。

圖2 Hadoop的組織架構(gòu)

1.2.2 分布式文件系統(tǒng) HDFS

HDFS采用master/slave架構(gòu),是Hadoop系統(tǒng)的重要組成。一個(gè)獨(dú)立的HDFS集群由一個(gè)Namenode和若干個(gè)Datanodes組成。其中,Namenode是負(fù)責(zé)管理文件系統(tǒng)namespace以及客戶端對(duì)文件的訪問的中心服務(wù)器。集群中的Datanode一般是負(fù)責(zé)管理它所在節(jié)點(diǎn)上存儲(chǔ)的一個(gè)節(jié)點(diǎn)。其處理流程圖如圖3所示。

圖3 HDFS數(shù)據(jù)處理流程

2 MapReduce任務(wù)計(jì)算過程

一般給定系統(tǒng)集群資源后單個(gè) MapReduce 計(jì)算任務(wù)的具體執(zhí)行步驟如下。

(1)計(jì)算任務(wù)的提交

把用戶提交的數(shù)據(jù)集的數(shù)據(jù)劃分為若干個(gè)數(shù)據(jù)塊,同時(shí)把各數(shù)據(jù)塊載入到 Hadoop集群的各從節(jié)點(diǎn),HDFS 文件系統(tǒng)的 DatatNode 和 NameNode 負(fù)責(zé)數(shù)據(jù)的管理和存儲(chǔ)。程序集被送到主節(jié)點(diǎn)負(fù)責(zé)完成對(duì)程序的調(diào)度執(zhí)行,主要通過主節(jié)點(diǎn)中的JobTracker 和多個(gè)從節(jié)點(diǎn)中的 TaskTracker實(shí)現(xiàn)完成。

(2)Map子任務(wù)的執(zhí)行

主節(jié)點(diǎn)中的JobTracker把map函數(shù)的執(zhí)行代碼傳輸分配到選定的從節(jié)點(diǎn)中,再由從節(jié)點(diǎn)上的TaskTracker對(duì)節(jié)點(diǎn)或附近節(jié)點(diǎn)的數(shù)據(jù)塊調(diào)度執(zhí)行map函數(shù),形成多個(gè)Map子任務(wù)。

(3)Reduce子任務(wù)的執(zhí)行

部分Map子任務(wù)執(zhí)行完畢時(shí),選定的節(jié)點(diǎn)開始執(zhí)行reduce函數(shù),開始對(duì)由Map子任務(wù)產(chǎn)生的中間數(shù)據(jù)鍵值對(duì)<u2,v2>進(jìn)行處理。Reduce的子任務(wù)數(shù)可以為一個(gè)或若干個(gè)。

(4)結(jié)果返回階段

把存儲(chǔ)在HDFS中計(jì)算任務(wù)的執(zhí)行結(jié)果提交給用戶。

本文主要介紹mapreduce模型及其支撐系統(tǒng)的模型,分別對(duì)mapreuce編程模型、hadoop的結(jié)構(gòu)及Hdfs進(jìn)行了簡(jiǎn)單的介紹,對(duì)于在實(shí)際系統(tǒng)中影響系統(tǒng)執(zhí)行效果的資源優(yōu)化配置如:系統(tǒng)容錯(cuò)、系統(tǒng)的任務(wù)調(diào)度及負(fù)載均衡等由于篇幅關(guān)系這里不在介紹。總之,隨著大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,對(duì)于mapreduce及其支撐系統(tǒng)的研究具有非常重大的意義。

3 總結(jié)

[1]Dean J, Ghemawat S. MapReduce: Simplified data processingon large clusters. Communications of the ACM, 2008, 51(1):107-113.

[2]韓海雯.MapReduce計(jì)算任務(wù)調(diào)度旳資源配置優(yōu)化研究[D].華南理工大學(xué),2013.10.

[3]應(yīng)毅.MapReduce 并行計(jì)算技術(shù)發(fā)展綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014.

[4]Tom White 著.周敏奇,王曉玲,金澈清等譯.Hadoop權(quán)威指南(第二版)[M].北京:清華大學(xué)出版社,2011.

Overview graphs model and support system

Li Wei,He Lijuan
(Shanxi instiute of technology,Xi’an Shaanxi,710300)

MapReduce is composed of parallel programming model and its support system data processing framework, through the definition of interface support library and runtime support library, through the definition of a good interface and operation, capable of automatic parallel execution of large-scale computing tasks, by hiding the underlying implementation details, reduce the difficulty of parallel programming, Hadoop is currently the most popular MapReduce framework open source implementation. Firstly, this paper introduces the MapReduce parallel programming model and the operation principle and operation mechanism of Hadoop, and deeply studies the operation process of MapReduce computing task in Hadoop system. Key words: big data; graphs; hadoop; HDFS

李煒(1990.9),男,漢族,籍貫陜西禮泉,助教,碩士研究生,研究方向人工智能大數(shù)據(jù)。

猜你喜歡
數(shù)據(jù)處理模型系統(tǒng)
一半模型
Smartflower POP 一體式光伏系統(tǒng)
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
3D打印中的模型分割與打包
主站蜘蛛池模板: 91色在线观看| 久久国产精品影院| 亚洲男人的天堂网| 激情综合五月网| 国产办公室秘书无码精品| 成人福利免费在线观看| 成人a免费α片在线视频网站| 自慰网址在线观看| 国产精品女人呻吟在线观看| 午夜视频免费一区二区在线看| 色哟哟精品无码网站在线播放视频| 久久国产免费观看| 一本大道香蕉高清久久| 国产精选自拍| 久久伊人久久亚洲综合| 日韩美毛片| 亚洲第一成人在线| 亚洲国产高清精品线久久| 亚洲AV电影不卡在线观看| 大香网伊人久久综合网2020| 久久www视频| 91精品综合| 黄片一区二区三区| 视频二区国产精品职场同事| 中文字幕在线观看日本| 欧美精品成人一区二区在线观看| 色欲色欲久久综合网| 国产成人毛片| 国产黑丝一区| 伦精品一区二区三区视频| 亚洲精品欧美日韩在线| 国产大片黄在线观看| 日本在线欧美在线| 国内精自线i品一区202| 福利视频一区| 伊人色天堂| 中文字幕 91| 色哟哟国产精品| 天天色天天综合| 国产jizzjizz视频| 9cao视频精品| 久久人与动人物A级毛片| 在线中文字幕日韩| 在线播放国产一区| 国产精品亚欧美一区二区三区| 国产精品理论片| 亚洲乱码视频| 五月婷婷亚洲综合| 青青草原国产免费av观看| 午夜性刺激在线观看免费| 色婷婷综合激情视频免费看 | 精品国产女同疯狂摩擦2| 男女精品视频| 国产成人精品亚洲日本对白优播| 国产黑丝一区| 久久伊人操| 在线中文字幕网| 高清免费毛片| 自拍偷拍欧美日韩| 国产成人无码AV在线播放动漫| 国产日产欧美精品| 久草中文网| 美女一级毛片无遮挡内谢| 亚洲资源在线视频| 2021国产精品自拍| 国产亚洲精久久久久久久91| 五月婷婷丁香色| 91系列在线观看| аⅴ资源中文在线天堂| 亚洲福利视频一区二区| 亚洲无码高清一区| 无码精品福利一区二区三区| 天天激情综合| 日本www色视频| 伊人中文网| 日韩在线2020专区| 亚洲无码高清免费视频亚洲| 久久这里只有精品66| 刘亦菲一区二区在线观看| 国产一区二区三区精品久久呦| 人妻无码一区二区视频| 国产欧美专区在线观看|