999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據為何離不開Hadoop

2017-12-18 17:36:29李榮富
大眾科學 2017年10期
關鍵詞:數據處理成本系統

李榮富

Hadoop是如今大數據革命的代表性技術,做Hadoop相關產品有很多,其中有很多不一樣的選擇和變種,比較知名的有Cloudera、Hortonwork、亞馬遜EMR、Storm和Spark。這些都是Hadoop的忠實“粉絲”。

想要搞清楚大數據和Hadoop的關系,我們還得先認識一下Hadoop。

一種數據存儲和分析的方法

如何理解Hadoop呢?官方給的定義是這樣的:作為一種軟件庫,Hadoop允許在集群服務器上使用簡單的編程模型對大數據集進行分布式處理。它被設計成能夠從單臺服務器擴展到數以千計的服務器,每臺服務器都有本地的計算和存儲資源。Hadoop的高可用性并不依賴硬件,其代碼庫自身就能在應用層偵測并處理硬件故障,因此能基于服務器集群提供高可用性的服務。

對于非專業人員,這個解釋顯得比較晦澀,我們從“系統”這個角度來理解。Hadoop是一個分布式系統,這種系統的結構特點是表面上看起來是一個整體,實際上它的各個模塊和數據都具有高度的自治獨立性,系統中的若干臺計算機可以互相協作來完成一個共同的任務,或者說一個程序可以分布在幾臺計算機上并行地運行。比如說我們平時使用的萬維網就是一個很好的分布式系統的例子,表面看起來它是一個整體,實際上網頁中很多不同的部分都是獨立工作的。

具體到Hadoop中,我們會發現它的“獨立性”做得更徹底, Hadoop中幾乎所有的功能都是獨立模塊化的,也就是說具體在應用中使用者可以用其他軟件抽掉或替代那些不需要的模塊,這使得Hadoop的“兼容性”變得很高。

如果Hadoop還是沒給你留下深刻的印象的話,那么你只要記住,這個系統是由兩個部分構成的,一個是數據處理框架,另一個是分布式數據存儲文件系統(HDFS)。大數據存在HDFS中,需要用的時候就從這里拿到數據處理框架里面處理。

大數據為何離不開它

我們這里說的“大數據離不開Hadoop”其實是相對而言的,從技術上來說,大數據的處理非得Hadoop嗎?那倒不是,在Hadoop出現之前很多企業已經開始處理大數據啦。不過,這些企業僅限于大企業,因為只有他們有能力購買處理大數據的大型機器。

但是,大數據要想做出更多貢獻,必須讓更多的組織機構參與進來,在時代的呼喚下,一種成本相對較低的能夠處理大數據的系統就呼之欲出。這時候Google站了出來,他們的工程師經過多番探討實踐,最后做出了Hadoop!

Hadoop的出現在大數據發展史上是有里程碑意義的,因為它的出現把大數據的應用從小眾變成了大眾。最直接的體現就是它降低了大數據處理成本!

首先,企業不用花太多錢在服務器硬件成本上,一般廉價的服務器也足以支撐起Hadoop。

其次,在軟件使用上Hadoop不像是昂貴的“大型機”——昂貴且很多東西不開放。Hadoop不僅對用戶開放源代碼和協議,可供自由修改,最主要的是,這些東西的使用時成本相對低廉的。

再次,Hadoop出自Google工程師之手,工程師們使用的時候都是二次開發,其本身的結構合理性、安全性都有保障,在日常維護上的成本低了很多。當然,這里還有一個“后天”累計而成的優勢不得不提,Hadoop自從出現之后就受到了熱捧,目前工程師們已經自發的形成了非常熱鬧的討論社區,新手在入門的時候可以享受到友好的學習環境和進階環境。

缺陷:不適合處理實時數據

Twitter在使用了Hadoop處理大數據后,他們又推出了自己的自己的另外一個系統——Storm,因為Hadoop并不適合處理實時大數據,但在Twitter上用戶每天就要生成1.4億條新的推文。

相比較起來,雖然Hadoop吞吐數據的量比Storm大,但Storm在時延上比要比Hadoop優得多,在實時數據較多的業務場景下,當然是Storm比較合適。這還得從它們的工作本質說起。

Storm 與Hadoop之間不同之處在于它們的工作處理方式。Hadoop在本質上是一個批處理系統,數據被引入 Hadoop 文件系統 (HDFS) 并分發到各個節點進行處理。當處理完成時,結果數據返回到 HDFS 供始發者使用。Storm 支持創建拓撲結構來轉換沒有終點的數據流,這些轉換從不停止,它們會持續處理到達的數據。

當然,我們在說Hadoop不適合處理實時數據的時候也得加上一個前提,那就是這個需要被處理的實時數據得足夠大,如果只是一般量的話,Hadoop還是應付得了的。(編輯/有慶)

猜你喜歡
數據處理成本系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
2021年最新酒駕成本清單
河南電力(2021年5期)2021-05-29 02:10:00
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
溫子仁,你還是適合拍小成本
電影(2018年12期)2018-12-23 02:18:48
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
基于POS AV610與PPP的車輛導航數據處理
主站蜘蛛池模板: 中文字幕调教一区二区视频| 亚洲天堂自拍| 青青热久免费精品视频6| 亚洲国产精品成人久久综合影院| 美女被操黄色视频网站| 免费a级毛片18以上观看精品| 热伊人99re久久精品最新地| h网址在线观看| 国产乱人伦AV在线A| 精品国产香蕉伊思人在线| 91美女视频在线| 久久性视频| 欧美精品1区2区| 国产精品成人第一区| 亚洲日本精品一区二区| 夜夜爽免费视频| 欧美日韩精品一区二区在线线| 在线免费观看AV| 国产成人精品一区二区免费看京| 欧美一区二区啪啪| 国产亚洲精品无码专| 免费无码又爽又刺激高| 高清免费毛片| 夜精品a一区二区三区| 欧美精品在线观看视频| h视频在线播放| 国产一区二区免费播放| 亚洲黄色片免费看| 国产精品私拍99pans大尺度| 乱人伦99久久| 国产欧美日韩精品第二区| 中文字幕色站| 欧美午夜网| 国产真实乱了在线播放| 亚洲国产理论片在线播放| 亚洲精品色AV无码看| 粉嫩国产白浆在线观看| 特级精品毛片免费观看| 天天躁狠狠躁| 欧美日韩导航| 亚洲一区二区三区香蕉| 国产白浆视频| 国产人妖视频一区在线观看| 亚洲欧美成人综合| 乱人伦视频中文字幕在线| 欧美成在线视频| 色AV色 综合网站| av一区二区无码在线| aⅴ免费在线观看| 99中文字幕亚洲一区二区| 婷五月综合| 日韩二区三区无| 日本成人福利视频| 国产网友愉拍精品视频| 国产网站免费看| 在线看AV天堂| 亚洲性日韩精品一区二区| 99久久精彩视频| 五月丁香伊人啪啪手机免费观看| 一本大道在线一本久道| 国产欧美日韩视频怡春院| 久久青草免费91观看| 国产丝袜91| 国产区精品高清在线观看| 午夜不卡视频| 波多野结衣第一页| 国产白浆在线| 国产肉感大码AV无码| 国产精品区网红主播在线观看| 国产精品永久在线| 又爽又黄又无遮挡网站| 99草精品视频| 亚洲精品无码高潮喷水A| 一本久道热中字伊人| 91亚洲国产视频| 青青草91视频| 国产成人综合亚洲欧洲色就色| 四虎精品黑人视频| 波多野吉衣一区二区三区av| 亚洲美女久久| 色综合综合网| 成人国产小视频|