999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hadoop參數(shù)優(yōu)化研究

2021-09-10 07:22:44王薇
電子樂園·中旬刊 2021年1期
關(guān)鍵詞:排序優(yōu)化實(shí)驗(yàn)

王薇

摘要:為了更好的驗(yàn)證通過參數(shù)的優(yōu)化可以提高Hadoop性能,我們可以采用的測試方法有:基準(zhǔn)測試、穩(wěn)定性測試、高可用測試、擴(kuò)展性測試、安全性測試等。本文以基準(zhǔn)測試方法為主來驗(yàn)證參數(shù)優(yōu)化后,實(shí)現(xiàn)對Hadoop性能的調(diào)優(yōu)。本文主要針對hadoop內(nèi)部的17個(gè)參數(shù)進(jìn)行優(yōu)化,通過基準(zhǔn)測試中terasort和WordCount的復(fù)合算法的執(zhí)行時(shí)間來校驗(yàn)參數(shù)的優(yōu)化情況,實(shí)驗(yàn)過程中搜集系統(tǒng)的cpu和內(nèi)存使用率,磁盤io和網(wǎng)絡(luò)io的吞吐量等指標(biāo)。圖1-3充分說明了參數(shù)默認(rèn)值與參數(shù)調(diào)整后的對比情況。實(shí)驗(yàn)結(jié)果表明,hadoop參數(shù)調(diào)整優(yōu)化后,在一定情況下實(shí)現(xiàn)了hadoop的性能調(diào)優(yōu)。

關(guān)鍵字:Hadoop;參數(shù)優(yōu)化;性能調(diào)優(yōu)

引言

大數(shù)據(jù)軟件平臺主要由分布式文件系統(tǒng)、分布式計(jì)算系統(tǒng)、NoSQL 數(shù)據(jù)庫、分布式數(shù)據(jù)倉庫、分布式數(shù)據(jù)庫等構(gòu)成,能夠提供大數(shù)據(jù)的存儲(chǔ)、管理和計(jì)算能力。大數(shù)據(jù)軟件平臺主要包括開源的Hadoop、Spark等,一般部署在通用硬件平臺上[1-2]。

由于Hadoop自身包含的參數(shù)比較多,參數(shù)之間的關(guān)系也比較復(fù)雜。經(jīng)過簡單的實(shí)驗(yàn)驗(yàn)證,本文主要對表1中的17個(gè)參數(shù)進(jìn)行優(yōu)化,并且參數(shù)優(yōu)化是遵循順序、疊加的方式,從而到達(dá)Hadoop的性能調(diào)優(yōu)。

實(shí)驗(yàn)設(shè)計(jì)和算法研究

為了更好的驗(yàn)證通過參數(shù)的優(yōu)化可以提高Hadoop性能,我們可以采用的測試方法有:基準(zhǔn)測試、穩(wěn)定性測試、高可用測試、擴(kuò)展性測試、安全性測試等。本文以基準(zhǔn)測試方法為主來驗(yàn)證參數(shù)優(yōu)化后,實(shí)現(xiàn)對Hadoop性能的調(diào)優(yōu)。

基準(zhǔn)測試是一種測量和評估軟件性能指標(biāo)的活動(dòng)。可以在某個(gè)時(shí)間通過基準(zhǔn)測試建立一個(gè)已知的性能水平(稱為基準(zhǔn)線)[3],當(dāng)系統(tǒng)的軟硬件環(huán)境發(fā)生變化之后再進(jìn)行一次基準(zhǔn)測試以確定那些變化對性能的影響。

基準(zhǔn)測試的測試方法有很多種,根據(jù)Hadoop的Map Reduce過程,本文主要以TeraSort算法和WordCount算法來驗(yàn)證表1中的17個(gè)參數(shù)調(diào)整后,對Hadoop性能在特定條件下影響及優(yōu)化。

本實(shí)驗(yàn)中hadoop測試環(huán)境是采用1個(gè)Name Node節(jié)點(diǎn),4個(gè)Date Node節(jié)點(diǎn)的模式進(jìn)行。

算法研究:

1)TeraSort 算法

Terasort算法的工作原理需要以下幾個(gè)步驟:

首先,采樣;

其次,map task對于數(shù)據(jù)記錄做標(biāo)記-

最后reduce局部排序,再順序輸出。

1TB排序通常用于衡量分布式數(shù)據(jù)處理框架的數(shù)據(jù)處理能力。Terasort是Hadoop中的一個(gè)排序作業(yè),在2008年,Hadoop在1TB排序基準(zhǔn)評估中贏得第一名,耗時(shí)209秒。TeraSort巧妙的利用了Hadoop的MapReduce機(jī)制來實(shí)現(xiàn)了Sort的目的,與Hadoop機(jī)制的完美結(jié)合也許是它優(yōu)異排序成績的一個(gè)重要原因。而也正因?yàn)槿绱耍覀兛梢栽诩荷侠肨eraSort來測試Hadoop,它將具有很高的測試?yán)脙r(jià)值[4]。

Terasort的特點(diǎn)是混合型的,它的數(shù)據(jù)類型為文本,測試過程中所需的數(shù)據(jù)來源為Hadoop 自帶TeraGen生成。

TeraSort只是一個(gè)小工具,比起生產(chǎn)應(yīng)用作業(yè),可能是微不足道了。但一個(gè)小工具,如果能夠挖掘到底,背后也會(huì)有大價(jià)值;尤其對測試來講,如果能夠?qū)Ρ尘爸R有更多的了解,一個(gè)小工具可以轉(zhuǎn)換成眾多方便且有價(jià)值的測試用例;并且,如果能對一個(gè)小工具舉一反三,也能夠?yàn)槠渌胤降臏y試提供價(jià)值。

2)WordCount算法

(1) 將文件拆分為多個(gè)文件。 由于測試文件比較小,每個(gè)文件都是一個(gè)split,把文件分割成行,形成<key, value>對,再分割成<key, value>對。 移交用戶定義的map方法,生成新的<key, value>對,如圖1所示。

(2)Mapper得到map方法輸出的<key, value>對后,會(huì)根據(jù)key的值對它們進(jìn)行排序,并執(zhí)行Combine過程,將key累加到相同的值,得到Mapper的最終輸出 . 如圖2所示。

(3) Reducer首先對從Mapper接收到的數(shù)據(jù)進(jìn)行排序,然后通過用戶自定義的reduce方法進(jìn)行處理,得到一個(gè)新的<key, value>對,輸出結(jié)果為WordCount,如圖3所示。

本文首先根據(jù)terasort算法對17個(gè)參數(shù)進(jìn)行調(diào)優(yōu),然后根據(jù)WordCount算法繼續(xù)進(jìn)行參數(shù)調(diào)整,以達(dá)到性能在一定情況下達(dá)到最佳狀態(tài)。在實(shí)驗(yàn)過程中,主要根據(jù)算法的執(zhí)行時(shí)間來驗(yàn)證了參數(shù)調(diào)整的正確性。同時(shí)采用PAT工具監(jiān)控算法執(zhí)行過程中系統(tǒng)的CPU、內(nèi)存、磁盤IO和網(wǎng)絡(luò)IO等參數(shù)。

實(shí)驗(yàn)數(shù)據(jù)中單個(gè)文件大小為1G,文件數(shù)量為512,總文件大小為512G。

實(shí)驗(yàn)結(jié)果

通過實(shí)驗(yàn),我們可以了解到參數(shù)之間存在著互相影響的關(guān)系,測試后發(fā)現(xiàn)隨著參數(shù)調(diào)整,算法的執(zhí)行時(shí)間在減少,充分的說明了隨著參數(shù)的優(yōu)化,hadoop性能實(shí)現(xiàn)一定的優(yōu)化。

我們可以了解到隨著調(diào)整17個(gè)參數(shù)的默認(rèn)值,算法的執(zhí)行時(shí)間有明顯的縮短,在17個(gè)參數(shù)都處于默認(rèn)值的情況下,算法的執(zhí)行時(shí)間為21776秒。圖1展現(xiàn)了參數(shù)默認(rèn)值與參數(shù)調(diào)整后算法的執(zhí)行時(shí)間的對比情況,參數(shù)優(yōu)化后,極大的提高了算法的執(zhí)行時(shí)間。圖2清晰的展現(xiàn)了參數(shù)默認(rèn)值與參數(shù)調(diào)整后算法的執(zhí)行過程中,hadoop對服務(wù)器的cpu/內(nèi)存的使用率對比情況,cpu的占用率明顯有所增大,內(nèi)存的使用率也有所增大。圖3清晰的展現(xiàn)了參數(shù)默認(rèn)值與參數(shù)調(diào)整后算法的執(zhí)行過程中,hadoop對服務(wù)器的磁盤IO,網(wǎng)絡(luò) IO吞吐量明顯有所增大。

經(jīng)過驗(yàn)證,說明參數(shù)調(diào)整后在一定程度上提高了性能。

總結(jié)

本文主要是通過基準(zhǔn)測試中TeraSort算法和WordCount算法相結(jié)合復(fù)合算法的運(yùn)行時(shí)間來驗(yàn)證對Hadoop的參數(shù)進(jìn)行調(diào)優(yōu),進(jìn)而優(yōu)化hadoop的性能。Hadoop性能調(diào)優(yōu)不僅涉及到Hadoop本身的性能調(diào)優(yōu),還涉及更底層的硬件、操作系統(tǒng)和Java虛擬機(jī)等系統(tǒng)的調(diào)優(yōu)。為了更好的使用Hadoop,我們應(yīng)根據(jù)實(shí)際應(yīng)用場景及要求,對hadoop參數(shù)進(jìn)行優(yōu)化,使hadoop性能在特定情況下達(dá)到最優(yōu)。

參考文獻(xiàn)references

[1]Saravanan S, Karthick K E, Balaji A, et al. Performance Comparison of Apache Spark and Hadoop Based Large Scale Content Based Recommender System[M]// Intelligent Systems Technologies and Applications. 2018:66-73.

[2]Ashlesha S, R. M. A Review of Hadoop Ecosystem for BigData[J]. International Journal of Computer Applications, 2018, 180(14):35-40.

[3]Trivedi M, Nambiar R. Lessons Learned: Performance Tuning for Hadoop Systems[M]// Performance Evaluation and Benchmarking. Traditional - Big Data - Interest of Things. 2017.

[4]Pahl C. Performance and Energy Optimization on Terasort Algorithm by Task Self-Resizing[J]. Information Technology & Control, 2014, 44(1):30-40.

猜你喜歡
排序優(yōu)化實(shí)驗(yàn)
記一次有趣的實(shí)驗(yàn)
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
排序不等式
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
恐怖排序
做個(gè)怪怪長實(shí)驗(yàn)
節(jié)日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
主站蜘蛛池模板: 91系列在线观看| 国产成人啪视频一区二区三区 | 亚洲乱码精品久久久久..| 国产欧美视频一区二区三区| 免费99精品国产自在现线| 国产69精品久久久久孕妇大杂乱| 毛片手机在线看| 99视频在线看| 99在线免费播放| 一级毛片在线播放| 一本一道波多野结衣av黑人在线| 国产精品亚欧美一区二区| 欧美区一区| 欧美日韩一区二区三区四区在线观看 | 伊人久久综在合线亚洲2019| 欧美成人午夜在线全部免费| 国产亚洲欧美日韩在线一区| 久草视频精品| 国产成人精品一区二区三区| 综合色区亚洲熟妇在线| 国产在线视频欧美亚综合| 无码免费的亚洲视频| Jizz国产色系免费| 国产爽歪歪免费视频在线观看| 亚洲无线一二三四区男男| 最新亚洲av女人的天堂| 国产精品 欧美激情 在线播放| 91欧美亚洲国产五月天| 国产成人在线无码免费视频| 欧美激情视频一区二区三区免费| 五月六月伊人狠狠丁香网| 天天综合天天综合| 久久人人妻人人爽人人卡片av| 国产免费网址| a级毛片网| 青青草国产免费国产| 亚洲国产精品人久久电影| 国产一区二区三区日韩精品| 亚洲中文字幕av无码区| 九色视频线上播放| 久久亚洲AⅤ无码精品午夜麻豆| 日韩av手机在线| 国产亚洲欧美在线人成aaaa| 久久这里只有精品国产99| 91精品小视频| 国产激情在线视频| 久久人体视频| 亚洲综合天堂网| 99久久精品国产精品亚洲| 欧美一区福利| 香蕉久久国产超碰青草| 九色最新网址| 又爽又大又黄a级毛片在线视频| 成人亚洲视频| 77777亚洲午夜久久多人| 精品久久国产综合精麻豆| 成年片色大黄全免费网站久久| 国产人前露出系列视频| 国产一区二区三区免费观看| 一区二区欧美日韩高清免费 | 国产v欧美v日韩v综合精品| 在线日韩一区二区| 91丝袜在线观看| 国产另类乱子伦精品免费女| 国产欧美成人不卡视频| 国产情精品嫩草影院88av| 亚洲色图欧美视频| 天堂岛国av无码免费无禁网站 | 国产精品一区二区久久精品无码| 在线观看精品国产入口| 狠狠色综合久久狠狠色综合| 欧美日韩在线亚洲国产人| 一级毛片免费高清视频| 国产91高清视频| 国产91视频观看| 久久免费视频6| 欧美一区日韩一区中文字幕页| 中国精品久久| 亚洲美女视频一区| 免费在线看黄网址| 三上悠亚在线精品二区| 欧美一区二区啪啪|