999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論Storm分布式實時計算工具

2014-04-16 02:14:51沈超鄧彩鳳
中國科技縱橫 2014年3期
關鍵詞:數據處理系統

沈超 鄧彩鳳

(1.大慶油田工程建設有限公司化建公司,黑龍江大慶 163159;2.中國石油大港油田分公司對外合作項目部,天津 300280)

論Storm分布式實時計算工具

沈超1鄧彩鳳2

(1.大慶油田工程建設有限公司化建公司,黑龍江大慶 163159;2.中國石油大港油田分公司對外合作項目部,天津 300280)

互聯網的應用催生了一大批新的數據處理技術,storm分布式實時處理工具以其強大的數據處理能力、可靠性高、擴展性好等特點,在近幾年得到越來越廣泛的關注和應用。

分布式 實時計算 流處理

1 背景及特點

互聯網的應用正在越來越深入的改變人們的生活,互聯網技術也在不斷發展,尤其是大數據處理技術,過去的十年是大數據處理技術變革的十年,MapReduce,Hadoop以及一些相關的技術使得我們能處理的數據量比以前要大得多得多。但是這些數據處理技術都不是實時的系統,或者說,它們設計的目的也不是為了實時計算。沒有什么辦法可以簡單地把hadoop變成一個實時計算系統。實時數據處理系統和批量數據處理系統在需求上有著本質的差別。

然而大規模的實時數據處理已經越來越成為一種業務需求了,而缺少一個“實時版本的hadoop”已經成為數據處理整個生態系統的一個巨大缺失。而storm的出現填補了這個缺失。Storm出現之前,互聯網技術人員可能需要自己手動維護一個由消息隊列和消息處理者所組成的實時處理網絡,消息處理者從消息隊列取出一個消息進行處理,更新數據庫,發送消息給其它隊列等等。不幸的是,這種方式有以下幾個缺陷:

單調乏味:技術人員花費了絕大部分開發時間去配置把消息發送到哪里,部署消息處理者,部署中間消息節點—設計者的大部分時間花在設計,配置這個數據處理框架上,而真正關心的消息處理邏輯在代碼里面占的比例很少。

脆弱:不夠健壯,設計者要自己寫代碼保證所有的消息處理者和消息隊列正常運行。

伸縮性差:當一個消息處理者的消息量達到閥值,需要對這些數據進行分流,配置這些新的處理者以讓他們處理分流的消息。

Storm定義了一批實時計算的原語。如同hadoop大大簡化了并行批量數據處理,storm的這些原語大大簡化了并行實時數據處理。storm的一些關鍵特性如下:

適用場景廣泛:storm可以用來處理消息和更新數據庫(消息流處理),對一個數據量進行持續的查詢并返回客戶端(持續計算),對一個耗資源的查詢作實時并行化的處理(分布式方法調用),storm的這些基礎原語可以滿足大量的場景。

可伸縮性高:Storm的可伸縮性可以讓storm每秒可以處理的消息量達到很高。Storm使用ZooKeeper來協調集群內的各種配置使得Storm的集群可以很容易的擴展很大。

保證無數據丟失:實時系統必須保證所有的數據被成功的處理。那些會丟失數據的系統的適用場景非常窄,而storm保證每一條消息都會被處理,這一點和S4相比有巨大的反差。

異常健壯:不像Hadoop—出了名的難管理,storm集群非常容易管理。容易管理是storm的設計目標之一。

語言無關性:健壯性和可伸縮性不應該局限于一個平臺。Storm的topology和消息處理組件可以用任何語言來定義,這一點使得任何人都可以使用storm。

2 storm的關鍵概念

計算拓補:Topologies

一個實時計算應用程序的邏輯在storm里面被封裝到topology對象里面,我把它叫做計算拓補。Storm里面的topology相當于Hadoop里面的一個MapReduce Job,它們的關鍵區別是:一個MapReduce Job最終總是會結束的,然而一個storm的topoloy會一直運行—除非你顯式的殺死它。一個Topology是Spouts和Bolts組成的圖狀結構,而鏈接Spouts和Bolts的則是Streamgroupings。

消息流:Streams

消息流是storm里面的最關鍵的抽象。一個消息流是一個沒有邊界的tuple序列,而這些tuples會被以一種分布式的方式并行地創建和處理。對消息流的定義主要是對消息流里面的tuple的定義,我們會給tuple里的每個字段一個名字。并且不同tuple的對應字段的類型必須一樣。也就是說:兩個tuple的第一個字段的類型必須一樣,第二個字段的類型必須一樣,但是第一個字段和第二個字段可以有不同的類型。在默認的情況下,tuple的字段類型可以是:integer,long,short,byte,string,double,float,boolean和bytearray。你還可以自定義類型—只要你實現對應的序列化器。

3 storm應用及前景

根據storm的特點,大致有兩個應用模式:(1)實時流處理;(2)drpc調用;前者就是通過消息隊列等方式將數據源源不斷的發送給storm集群來處理,而后者,類似于開啟一個服務,客戶端方面可以遠程的發送數據給storm并同步或異步的接收到處理結果。

storm的應用場景非常廣泛,具體如下:

監控系統:監控整個集群的狀態,當出現異常log的時候進行分析,對異常進行分類并實時發出報警,提示運維人員來維護。并且可以進一步考慮。這樣可以對整個系統的做一個很好的監控和反應。

安全系統:在信息安全領域中,做實時的流量分析,異常過濾、惡意攻擊檢測等。

實時計算:根據之前數據分析人員分析計算的數學模型,如點擊量預估模型、用戶付費預期計算模型、好友推薦算法,放到storm的拓撲中,通過topology來計算,可以幫助實時為用戶提供服務、及時發現問題、極大的提高工作效率,而不必受制于老的計算模式,如一天計算一次、一小時計算一次等。

Storm0.7系列的版本已經在各大公司得到了廣泛使用,最近發布的0.8版本中引入了State,使得其從一個純計算框架演變成了一個包含存儲和計算的實時計算新利器,還有剛才提到的Trident,提供更加友好的接口,同時可定制scheduler的特性也為其針對不同的應用場景做優化提供了更便利的手段,也有人已經在基于storm的實時ql(query language)上邁出了腳本。在服務化方面,storm一直在朝著融入mesos框架的方向努力。同時,storm也在實現細節上不斷地優化,使用很多優秀的開源產品,包括kryo,Disruptor,curator等等。可以想象,當storm發展到1.0版本時,一定是一款無比杰出的產品。

猜你喜歡
數據處理系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
MATLAB在化學工程與工藝實驗數據處理中的應用
Matlab在密立根油滴實驗數據處理中的應用
主站蜘蛛池模板: 亚洲欧美另类色图| 无码不卡的中文字幕视频| 久久精品国产在热久久2019| 在线观看免费AV网| 日韩精品久久久久久久电影蜜臀| 国产69囗曝护士吞精在线视频| 日韩无码视频网站| 免费AV在线播放观看18禁强制| 国产女同自拍视频| 日本午夜精品一本在线观看| 大陆国产精品视频| 五月天在线网站| 中文毛片无遮挡播放免费| 日韩无码视频专区| 国产免费久久精品44| 91精品国产福利| 欧美日一级片| 91亚洲国产视频| 精品撒尿视频一区二区三区| 欧美一区国产| 99久久人妻精品免费二区| 人妻一区二区三区无码精品一区 | 激情网址在线观看| 夜夜爽免费视频| 国产鲁鲁视频在线观看| 亚洲天堂啪啪| 欧洲av毛片| 青青国产在线| 久久精品人人做人人爽97| 日本爱爱精品一区二区| 91午夜福利在线观看| 在线无码av一区二区三区| 丁香五月婷婷激情基地| 日本欧美视频在线观看| 国产一区二区影院| 91成人精品视频| 国产亚洲精久久久久久无码AV| 四虎永久免费在线| 中文字幕精品一区二区三区视频| 日韩不卡免费视频| 久久精品丝袜| 亚洲国产精品美女| 在线五月婷婷| 久久精品中文字幕免费| 好紧好深好大乳无码中文字幕| 亚洲无线一二三四区男男| 亚洲视频一区在线| 欧美成人午夜视频免看| 精久久久久无码区中文字幕| 无码精品福利一区二区三区| 国产成人综合网| 午夜小视频在线| 香蕉国产精品视频| 国产真实乱人视频| 欧美三级日韩三级| 成人欧美在线观看| 88av在线| 2020最新国产精品视频| 国产91精品调教在线播放| 99热这里只有精品国产99| 国产免费网址| 狠狠干欧美| 午夜天堂视频| 亚洲—日韩aV在线| 国产香蕉在线| 婷婷色婷婷| 亚洲人网站| 中文无码精品a∨在线观看| 欧美成人怡春院在线激情| 久久成人免费| 天天摸天天操免费播放小视频| 三级毛片在线播放| 日韩在线成年视频人网站观看| 日韩黄色精品| 国产微拍一区| 国产经典三级在线| 国产福利观看| 国产成人综合久久| 无码专区国产精品第一页| 国产一级无码不卡视频| 在线观看网站国产| 久久狠狠色噜噜狠狠狠狠97视色|