999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據實時計算平臺技術綜述

2017-04-10 19:41:54周志陽陳飛
中國新通信 2017年4期
關鍵詞:背景

周志陽+陳飛

【摘要】 隨著互聯網和互聯網技術的快速發展,每天產生的數據正以指數級的速度增長,對這些大量數據的處理與分析具有巨大的應用價值。以Hadoop為代表的大數據技術的出現,可以很好的解決大量靜態數據集的數據處理與分析,但是很多數據都是實時產生的,人們希望可以實時的處理這些數據,這就需要流計算處理技術來實時處理這些數據,及時產出應用價值。

【關鍵字】 實時計算 大數據 Storm Spark streaming Apache Flink

引言

在當前大數據背景下,優化發展應用實時計算平臺技術,可以有助于解決現有計算平臺處理海量數據實時響應能力差的問題,提升計算平臺處理大數據的速度[1-2],確保在大數據背景下,可以應用實時計算平臺技術勝任數據挖掘任務,實時處理大數據。具體綜述內容如下所示:

一、相關研究

流數據一般在線實時產生的,通常是以元組為單位,源源不斷的元組就構成了流式數據。當前,大數據背景下的流數據通常具有流量巨大、流速特別快、難以快速存儲與恢復等特性,即包含結構化的數據也包含半結構化和非結構化的數據。結構化的數據一般遵守固定的格式,很少含有或不含有冗余信息,比如sql數據庫中的數據一般都是結構化的數據;半結構化和非結構化的數據一般無法用二維屬性表來表示,辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等[1]。

二、實時計算相關技術及開源平臺

這里主要介紹流計算開源平臺,介紹他們的框架與原理,介紹目前處理大數據常用的實時計算平臺中的Storm、Spark streaming、Apache Flink技術。

2.1 Storm實時計算平臺技術

Storm是當下最流行的實時計算平臺之一,它的計算模型中主要有Spout和Bolt兩種角色,Bolt一般會按照一定的流分組策略訂閱上游的Spout。Spout把數據以Tuple為單位源源不斷發送給訂閱它的Bolt,Bolt一般負責數據的具體處理,處理后的數據即可以保存到外部數據庫又可以繼續發送給下游的Bolt。

在大數據背景下,通過引入Storm分布式實時計算平臺,進行大規模數據的分類分析,設計了基于Storm框架的KNN分類算法。該算法將整個過程分為數據接入、分類分析、結果輸出等階段,在框架預定義的組件中分別編程實現,各組件通過數據流連通形成任務實體,提交到集群運行完成。通過對比分析和性能監測,驗證了所提方案具有低延遲和高吞吐量的優勢,集群運行狀況良好,負載均衡。相關研究實驗表明,基于Storm平臺處理海量數據實時性較高,能夠勝任大數據背景下的數據挖掘任務。

2.2 spark streaming實時計算平臺技術

Spark Streaming是大規模流式數據處理的新貴,將流式計算分解成一系列短小的批處理作業。在大數據環境中,優化設計應用實時計算平臺技術, 基于可伸縮的實時虛擬機調度策略,能夠利用分布式計算系統Spark,構建可擴展的虛擬機系統,提升處理數據的性能,可以實現虛擬機在線遷移與動態擴容。Spark Streaming是將流式計算分解成一系列短小的批處理作業。這里的批處理引擎是Spark,也就是把Spark Streaming的輸入數據按照batch size(如1秒)分成一段一段的數據(Discretized Stream),每一段數據都轉換成Spark中的RDD(Resilient Distributed Dataset),然后將Spark Streaming中對DStream的Transformation操作變為針對Spark中對RDD的Transformation操作,將RDD經過操作變成中間結果保存在內存中。整個流式計算根據業務的需求可以對中間的結果進行疊加,或者存儲到外部設備[2]。

2.3 Apache Flink實時計算平臺技術

Flink 是一個針對流數據和批數據的分布式處理引擎。它主要是由 Java 代碼實現。目前主要還是依靠開源社區的貢獻而發展。Flink所要處理的主要場景就是流數據,批數據只是流數據的一個極限特例而已。Flink 會把所有任務當成流來處理,這也是其最大的特點。Flink 可以支持本地的快速迭代,以及一些環形的迭代任務。并且 Flink 可以定制化內存管理,Flink 并沒有將內存完全交給應用層, Flink處理大數據速度快,滿足大數據背景下應用實時計算平臺的需求。

三、結束語

綜上所述,通過以上內容分析,可以在當前處理大數據中,可以優化應用實時計算平臺技術,不僅可以進一步提升處理大數據的速度,也可以提升實時計算平臺的運行效率;在實際應用實時計算平臺技術處理大數據過程中,可以在Storm、Spark streaming以及Flink平臺技術中選擇合適的實時計算平臺技術,對促進未來實施推廣大數據實時計算平臺技術,發揮積極影響。

參 考 文 獻

[1] 王銘坤,袁少光,朱永利等.基于Storm的海量數據實時聚類[J].計算機應用,2014,34(11):3078-3081.

[2] 王志平,李小勇.基于實時計算平臺的虛擬機調度策略[J].計算機工程,2016,42(5):30-34,41.

猜你喜歡
背景
“三新”背景下關于高考一輪復習策略的思考
“新四化”背景下汽車NVH的發展趨勢
《論持久戰》的寫作背景
當代陜西(2020年14期)2021-01-08 09:30:42
黑洞背景知識
基于高考背景下的高中數學教學探討
活力(2019年21期)2019-04-01 12:18:06
I ROBOT AI背景下的2018火人節
晚清外語翻譯人才培養的背景
背景鏈接
從背景出發還是從文本出發
語文知識(2015年11期)2015-02-28 22:01:59
“雙背景”院長獲認同
中國衛生(2014年10期)2014-11-12 13:10:16
主站蜘蛛池模板: 久草视频精品| 久久窝窝国产精品午夜看片| 国产视频只有无码精品| 欧美亚洲日韩中文| 精品一区二区久久久久网站| 第一页亚洲| 国产欧美日韩18| 日本久久久久久免费网络| 久久综合丝袜日本网| 亚洲日本精品一区二区| 亚洲天堂视频在线播放| 亚洲性一区| 国产在线精品香蕉麻豆| 中文国产成人精品久久| 波多野结衣视频网站| 9久久伊人精品综合| 免费在线播放毛片| 高潮爽到爆的喷水女主播视频| 中国特黄美女一级视频| 日韩成人午夜| 在线人成精品免费视频| 亚洲全网成人资源在线观看| 91精品国产一区自在线拍| 久久99精品国产麻豆宅宅| 国产黄色视频综合| 亚洲福利视频网址| 91视频青青草| 五月天福利视频| 国内99精品激情视频精品| 97成人在线视频| 国产区免费| 丰满人妻被猛烈进入无码| 日韩在线影院| 18禁色诱爆乳网站| 91小视频在线观看| 日韩在线2020专区| 国产一区二区三区视频| 日本在线欧美在线| 色吊丝av中文字幕| 国产精品lululu在线观看| 99无码中文字幕视频| 国产成人久久综合777777麻豆| 国产精品女熟高潮视频| 色播五月婷婷| 亚洲一区二区在线无码| 中文国产成人久久精品小说| 国产无套粉嫩白浆| 国产91av在线| 国产亚洲精久久久久久无码AV| 欧美乱妇高清无乱码免费| 91色国产在线| 四虎亚洲精品| 亚洲人成电影在线播放| 亚洲精品综合一二三区在线| 亚洲精品爱草草视频在线| 综合色亚洲| 人妻无码AⅤ中文字| 久久综合色播五月男人的天堂| 黄色网址免费在线| 黄色福利在线| 亚洲香蕉伊综合在人在线| 99国产精品国产| 中文字幕无码av专区久久| 国产久操视频| 亚洲日韩每日更新| 亚洲国产在一区二区三区| 伊人久久青草青青综合| 久久人搡人人玩人妻精品| 欧美日韩高清在线| 国产午夜看片| 久久亚洲AⅤ无码精品午夜麻豆| 色婷婷亚洲十月十月色天| 欧美激情网址| 午夜日韩久久影院| 无码国产偷倩在线播放老年人| hezyo加勒比一区二区三区| 一级毛片中文字幕| 日韩美毛片| 91网在线| 黄色a一级视频| 亚洲视频一区| 欧美a网站|