999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hadoop集群實(shí)現(xiàn)詞頻統(tǒng)計(jì)應(yīng)用

2021-07-20 08:14:58羅利
關(guān)鍵詞:單詞案例環(huán)境

◆羅利

(湖南信息職業(yè)技術(shù)學(xué)院 湖南 410299)

Hadoop 是Apache 基金會(huì)支持,采用Java 語言開發(fā)[1],以分布式文件系統(tǒng)HDFS 和分布式計(jì)算框架MapReduce 為核心[2],以及一些其他子項(xiàng)目組成的分布式系統(tǒng)架構(gòu)。詞頻統(tǒng)計(jì)是大數(shù)據(jù)分析中經(jīng)常要使用的功能,利用Hadoop 平臺可以實(shí)現(xiàn)詞頻統(tǒng)計(jì),Wordcount 案例是Hadoop 的經(jīng)典案例之一,以空格的形式對英文進(jìn)行詞頻統(tǒng)計(jì),初學(xué)者在學(xué)習(xí)Mapreduce 編程時(shí)都是以Wordcount 案例作為入門。本文利用Hadoop 分布式數(shù)據(jù)處理,實(shí)現(xiàn)Wordcount 案例統(tǒng)計(jì)單詞出現(xiàn)次數(shù)的功能。

1 Hadoop 集群搭建

1.1 環(huán)境配置

本實(shí)驗(yàn)Hadoop 完全分布式集群搭建環(huán)境由3 臺服務(wù)器構(gòu)成,需要的軟件和系統(tǒng)環(huán)境要求如表1所示。

表1 集群環(huán)境信息

1.2 集群搭建

Hadoop 集群主要有一個(gè)NameNode 節(jié)點(diǎn)和3 個(gè)DataNode 節(jié)點(diǎn)構(gòu)成,搭建主要步驟如下:

(1)安裝Centos7 操作系統(tǒng)的虛擬機(jī)。

(2)安裝JDK。

(3)安裝Hadoop 2.7.2。

(4)SSH 免密登錄。

(5)配置集群。

(6)啟動(dòng)集群。

2 詞頻統(tǒng)計(jì)實(shí)現(xiàn)

2.1 開發(fā)環(huán)境配置

用于開發(fā)的電腦需要安裝JDK 和hadoop2.7.2(本文在Win10 中開發(fā)),同時(shí)把hadoop2.7.2/bin 目錄下的hadooo.dll 文件拷貝到C:WindowsSystem32 目錄下。然后添加環(huán)境變量HADOOP_HOME,變量值為HADOOP 安裝路徑:E:hadoop-2.7.2。并在Path 環(huán)境變量中添加%HADOOP_HOME%in。在Windows 的控制臺下java-version、hadoop version 出現(xiàn)正確的jdk 版本和Hadoop 版本,說明環(huán)境準(zhǔn)備成功。

然后在Eclipse 中配置Hadoop 開發(fā)環(huán)境,將下載的hadoop 插件hadoop-eclipse-plugin-2.7.2.jar 復(fù)制到eclipse 安裝目錄下的plugins 目錄下,重啟eclipse。

接著打開 Eclipse,增加 Map/Reduce 功能區(qū),打開Window-Perspective-open Perspective-other,選擇Map/Reduce 選項(xiàng),添加進(jìn)來。然后導(dǎo)入 MapReduce 運(yùn)行依賴的 jar 包,打開Window-Preferences,選擇 Hadoop Map/Reduce,瀏覽hadoop 的安裝路徑,點(diǎn)擊Apply,如圖1所示。

圖1 Hadoop 依賴設(shè)置

2.2 詞頻統(tǒng)計(jì)原理

把需要統(tǒng)計(jì)的文檔放入目錄src_data 中,運(yùn)行程序,文檔執(zhí)行Map 和Reduce 兩個(gè)階段。Map 和Reduce 階段的輸入輸出形式為鍵值對。Map 階段以單詞之間的空格分隔符作為分割,Map 階段輸入:Key 是行偏移量,Value 是一行的內(nèi)容;Map 階段輸出:Key 是單詞,Key 是標(biāo)記1;Map 階段完成后,進(jìn)行Shuffle 過程,Shuffle 對< Key,Value >進(jìn)行排序、歸并,將相同的鍵歸并到一起。reduce 函數(shù)接收一個(gè)如形式的輸入,然后對這個(gè)value 集合進(jìn)行合并,即將1 的個(gè)數(shù)累加。Reduce 結(jié)束后返回程序的輸出,輸出形式為<單詞,統(tǒng)計(jì)次數(shù)>。

2.3 代碼實(shí)現(xiàn)

啟動(dòng)hadoop 集群,Eclipse 連接集群編寫mapreduce 程序(基于Java 語言)統(tǒng)計(jì)單詞出現(xiàn)次數(shù)。改寫Mapper 類和Reducer 類,核心代碼如下:

編寫 WordcountMapper 、 WordcountReducer 類后,編寫WordcountDriver 驅(qū)動(dòng)類(主類),然后設(shè)置輸入輸出目錄在Windows系統(tǒng)上,調(diào)試程序是否正確。

3 HDFS 上測試程序

在Eclipse 中導(dǎo)出wordcount 工程為wordcount.jar 包,將其放到HDFS 系統(tǒng)上運(yùn)行。

(1)將wordcount.jar 放入/opt/module/hadoop2.7.2 下。

(2)新建目錄。在Linux 本地/opt/module/hadoop2.7.2 下新建目錄winput,在該目錄下創(chuàng)建測試文件word.txt,并寫入相應(yīng)內(nèi)容,代碼如下:

[root@master hadoop-2.7.2]# mkdir winput

[root@maste hadoop-2.7.2]# cd winput/

[root@maste winput]# touch word.txt

[root@master winput]# cat word.txt

hadoop hdfs yarn mapreduce

spark hbase hdfs

hadoop hadoop spark

(3)HDFS 系統(tǒng)上新建目錄。在HDFS 的根目錄下創(chuàng)建目錄testinput,代碼如下:

圖2 HDFS 查看輸出文件

圖3 單詞統(tǒng)計(jì)結(jié)果

至此,統(tǒng)計(jì)出了word.txt 文件中每個(gè)單詞出現(xiàn)的次數(shù)。Hadoop分布式集群的搭建、配置、運(yùn)行測試全部完成。

猜你喜歡
單詞案例環(huán)境
長期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
案例4 奔跑吧,少年!
孕期遠(yuǎn)離容易致畸的環(huán)境
單詞連一連
隨機(jī)變量分布及統(tǒng)計(jì)案例拔高卷
環(huán)境
看圖填單詞
發(fā)生在你我身邊的那些治超案例
中國公路(2017年7期)2017-07-24 13:56:38
一個(gè)模擬案例引發(fā)的多重思考
主站蜘蛛池模板: 全部免费毛片免费播放 | 性网站在线观看| 日韩精品无码免费专网站| 99偷拍视频精品一区二区| 在线播放精品一区二区啪视频| 亚洲欧美综合在线观看| 亚洲国产理论片在线播放| 尤物在线观看乱码| 亚洲VA中文字幕| 综合色区亚洲熟妇在线| 国产第一页免费浮力影院| 国产免费久久精品99re丫丫一 | 97视频精品全国在线观看| 亚洲乱码在线播放| 日本黄色不卡视频| 99热国产这里只有精品9九| 久久免费成人| 一本无码在线观看| 久久婷婷色综合老司机| 色天天综合| 国产国产人成免费视频77777 | 美女视频黄又黄又免费高清| www.99在线观看| 国产成人精品视频一区视频二区| 中文字幕在线不卡视频| 在线看AV天堂| 九色视频线上播放| 国产一二三区在线| 午夜a级毛片| 国产一区二区免费播放| 国产91av在线| 国产微拍精品| 中文字幕免费播放| 国产一区成人| 亚洲人成人无码www| 国产sm重味一区二区三区| 99在线观看视频免费| 日韩天堂视频| 国产一级无码不卡视频| 精品伊人久久久香线蕉 | 国产在线观看精品| 国产 在线视频无码| 2018日日摸夜夜添狠狠躁| 激情综合激情| 伊人久久大香线蕉成人综合网| 国产在线视频二区| 无码网站免费观看| 国产va视频| 国产亚洲精品自在久久不卡| 欧美.成人.综合在线| 国产精品所毛片视频| 亚洲日本www| 免费在线国产一区二区三区精品 | 免费看久久精品99| 亚洲国产亚综合在线区| 日韩小视频网站hq| 嫩草影院在线观看精品视频| 美女一区二区在线观看| 真实国产乱子伦视频| 国产又粗又猛又爽| 久久久久国色AV免费观看性色| 国产毛片高清一级国语 | 在线播放91| 精品国产福利在线| 国产浮力第一页永久地址| 97视频免费在线观看| 日韩亚洲综合在线| 一级片一区| 午夜人性色福利无码视频在线观看| 日韩成人高清无码| 久久综合色视频| 国产精品极品美女自在线| 欧美性猛交一区二区三区| 亚洲V日韩V无码一区二区| 91久久偷偷做嫩草影院免费看| 欧美成a人片在线观看| 视频一本大道香蕉久在线播放| 日韩无码一二三区| 午夜精品区| 呦系列视频一区二区三区| 在线观看免费国产| 亚洲一区无码在线|