999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的海量數據處理平臺

2021-09-10 15:40:08國標丁帥男吳雨桐
客聯 2021年4期
關鍵詞:數據處理

國標 丁帥男 吳雨桐

【摘 要】近幾年,云計算產業飛速發展,大數據處理技術也在不斷成熟。與此同時,國內移動互聯網市場規模不斷擴大,用戶數量己經超過5億,并帶來了海量的移動互聯網流量數據。在此背景下,如何基于云計算大數據處理技術來承載海量網絡數據處理業務,是一個非常有研究價值的課題。

【關鍵詞】流量數據;Hadoop;數據處理

一、MapReduce分布式處理技術

Hadoop平臺的MapReduce框架采用主從架構,由一個JobTracker主節點和多個TaskTracker從節點構成。JobTracker模塊負責MapReduce作業的調度,包括分配用戶提交的作業執行順序、Map任務和Reduce任務的分配和執行,推測性任務的執行等,從節點中TaskTracker模塊負責處理主節點指派的任務,包括執行Map任務、Reduce任務和推測性任務。MapReduce框架運行流程如下。

(一)用戶提交作業。用戶編寫自己的MapReduce程序并在客戶端節點上運行,作業客戶端實例化后,向JobTracke:模塊提交該作業信息,申請分配作業的ID號。然后作業客戶端在驗證本次作業相關信V、無誤的情況下,將作業資源存放到分布式文件系統中,默認情況下,Hadoop使用HDFS作為其文件存儲系統。最后客戶端向JobTracker模塊提交作業執行請求。

(二)JobTracker初始化用戶作業。JobTracker收到用戶提交的作業后,創建該作業實例對象并配置相關數據,包括該作業使用的Jar包存放位置、輸入數據分塊信J自、以及作業對應的配置文件信息、等等。然后JobTracker根據其配置的一調度算法(默認為先進先出調度算法)將該作業放入其作業對待,用于后續分配。

(三)任務分配。當前MapReduce的機制中使用心跳通信機制來進行任務分配。即從節點中的TaskTracke:模塊定時向.lobTracker發送心跳通信,JobTracker的作業隊列若有待分配的作業,則其根據收到的信息、決定是否向該TaskTracker分配任務。當從節點上TaskTracker模塊的Map任務槽有空閑時,JobTracker節點根據感知策略向該節點分配合適的Map任務。需要說明的是,JobTracker在分配任務時,優先往TaskTracker分配Map任務,只有在TaskTracker模塊上Map任務槽無空閑時才分配Reduce任務。

(四)TaskTracker執行Map任務。TaskTracker在執行Map或者Reduce任務時,每執行一個任務均會啟動一個Java子進程來運行該任務。當啟動子進程之前,TaskTracker模塊首先從HDFS中讀取該作業客戶端之前存放的作業相關信息,然后再創建一個Java子進程來執行用戶自己編寫的Map任務。Map任務運行后會定期輸出數據緩存在內存中。當緩存數據超過指定限額時,Map任務會將數據緩存到該從節點的磁盤中。

(五)TaskTracke:執行Reduce任務。當有Map任務執行完畢,同時有TaskTracker模塊存在空閑Reduce槽的情況下,當該TaskTracker從節點與JobTracker通信時,JobTracker會分配該作業對應的Reduce任務給該從節點。需要說明的是,由于Reduce任務的輸入數據來源于各個Map任務的輸出,沒有本地數據的概念,因此JobTracker直接分配隊列中的Reduce任務即可。Reduce任務運行時,首先從對應的Map任務所在的節點讀取中間數據。當Reduce任務得到其所需的數據后開始執行用戶編寫的Reduce任務程序。Reduce任務運行時,

將其輸出結果存放到HDFS中。

(六)完成一次作業運行。Reduce任務全部完成后,輸出結果根據用戶指定的目錄存放。JobTracker根據各個TaskTracker發送的心跳信息知道該作業已經運行完畢,設置該作業的完成標記,同時向作業客戶端發送作業完成的通知和相關統計數據。需要說明的是,在作業運行期間,用戶客戶端從持續收到作業運行的進度信息。

二、結語

本章節介紹了在當前移動互聯網及其引發的網絡業務快速增長的現狀下,本文使用Hadoop技術來進行網絡流量數據處理的必要性。并對基于Hadoop的海量網絡數據處理平臺的總體架構,以及該平臺所使用的數據采集和傳輸技術,基于HDFS的海量網絡數據存儲技術和基于MapReduce的海量數據處理技術等關鍵技術進行了詳細介紹。此外,本章節對海量網絡數據處理平臺當前需要重點解決的技術問題進行了詳細分析。從而為本文后續開展的研究工作進行了鋪墊,打下良好的基礎。

【參考文獻】

[1]劉軍,Hadoop大數據處理人民郵電出版社,2013

[2]趙衛中,馬慧芳,傅燕翔等,基于云計算平臺Hadoop的并行K-Mean聚類算法設計研

究,計算機科學,38(10) 2011, 166-168

[3]Xue S J, Pan W B, Fang W, A Novel Approach in Improving I/O Performance of SrnallMeteorological Files on HDFS, Applied Mechanics and Materials, 1172012 1759-1765.

[4]Yazd S A, Venkatesan S, Mittal N, Energy Efficient Hadoop Using MirroredReplication Policy, Reliable Distributed Systems (SRDS), 2012 IEEE 31st Symposium on:457-462.Data BlockIEEE, 2012

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 久久精品66| 91精品国产情侣高潮露脸| 亚洲区一区| 亚洲免费毛片| 999福利激情视频| 4虎影视国产在线观看精品| 少妇极品熟妇人妻专区视频| 中文字幕久久波多野结衣| 国产精品对白刺激| 色综合日本| 成人精品午夜福利在线播放| 少妇精品网站| lhav亚洲精品| 国产在线97| 久久久久亚洲AV成人人电影软件| 在线精品亚洲一区二区古装| 91日本在线观看亚洲精品| 久久99热66这里只有精品一| 亚洲中文字幕国产av| 久久青草免费91观看| 国产在线视频自拍| 久久一日本道色综合久久| 亚洲系列无码专区偷窥无码| 玖玖精品视频在线观看| 婷婷六月激情综合一区| 韩国福利一区| 欧美国产在线看| 免费毛片网站在线观看| 欧美亚洲国产一区| 国产精品va| 国产全黄a一级毛片| 动漫精品啪啪一区二区三区| 免费看美女自慰的网站| 色妞www精品视频一级下载| 欧美激情视频一区二区三区免费| 欧美三级视频在线播放| 中文字幕乱码二三区免费| 欧美国产菊爆免费观看 | 欧美午夜久久| 91福利片| 老色鬼久久亚洲AV综合| 亚洲无码A视频在线| 国产在线日本| 先锋资源久久| 天天婬欲婬香婬色婬视频播放| 一级爱做片免费观看久久| 91香蕉国产亚洲一二三区| 亚洲色欲色欲www在线观看| 中文字幕天无码久久精品视频免费 | 亚洲人成网站在线观看播放不卡| 久久青草免费91观看| 国产主播福利在线观看| 91精品国产一区自在线拍| 九九久久精品国产av片囯产区| 一级毛片在线免费看| 亚洲精品色AV无码看| 国产精品亚欧美一区二区三区| 自偷自拍三级全三级视频| 国产成人一区在线播放| 伊人成人在线| a毛片在线免费观看| 一级看片免费视频| 色欲色欲久久综合网| 欧美精品成人一区二区在线观看| 天天色天天操综合网| 亚洲首页在线观看| 台湾AV国片精品女同性| 白浆视频在线观看| 福利一区在线| AV熟女乱| 欧美一级专区免费大片| 99ri精品视频在线观看播放| 国产精品亚洲一区二区三区在线观看| 色噜噜狠狠狠综合曰曰曰| 久久91精品牛牛| 国产一级精品毛片基地| 一级毛片高清| 97av视频在线观看| 日本一区二区三区精品国产| 国产自产视频一区二区三区| 伊人91在线| 97超级碰碰碰碰精品|