999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

開源模式:促進大數據發展的主導力量

2016-05-14 10:34:36蒲松濤
中國計算機報 2016年41期
關鍵詞:數據處理生態發展

蒲松濤

從云計算、大數據、物聯網、人工智能等新一代信息技術創新歷程可以清晰地看出,開源模式活躍在各個領域,更為重要的是,隨著全球各大科技巨頭的競相加入,開源模式正逐漸成為推動大數據等各領域技術創新的主導力量。

開源已成為大數據技術創新的主要模式

大數據源于開源,并基于開源不斷演進發展,自身就已具備了開源基因。經過若干年的發展,開源軟件和開源工具已經覆蓋了大數據產業發展的各個環節,基于開源軟件,企業可以快速構建大數據應用平臺,提供豐富的大數據開發和應用工具。當前,從小型初創企業到行業科技巨頭,各種規模的企業都在使用開源軟件和工具做大數據處理和基于數據的預測分析。由此可見,開源不僅驅動著大數據技術的創新演進,也推動著大數據產業的不斷進步,對繁榮大數據應用生態起到了不可忽視的作用。

嚴格來說,大數據并不是一個產業或市場,而是一類問題,或者一種思維。從這些思維和問題中獲得價值,需要完整的信息基礎設施,并配套以相關的技術和工具,這些共同構成大數據應用的生態。因此,把大數據當作產業來看待,其生態體系的外延是非常廣闊的。

狹義來看,按照應用流程,大數據生態鏈包括數據采集、數據存儲、數據應用和數據可視化等環節;從廣義來看,大數據生態鏈貫穿數據的整個生命周期,包括各種基礎設施和軟件系統,從數據的產生到采集、傳輸、分享到存儲,再到分析挖掘,直至最終的呈現與應用。從技術的應用范圍和重要性可以看出,數據的存儲、數據處理、價值挖掘和數據可視化等是大數據產業環節中的重點領域。

開源技術創新引領大數據基礎平臺演進

對于云計算發展而言,開源基礎平臺如OpenStack、CloudStack的發展是推動云計算技術創新和行業應用的關鍵。與之類似,大數據的發展與開源軟件的不斷創新密切相關,在大數據處理平臺這個基礎性并處于核心地位的環節,開源技術的創新成為了引領其不斷演進的主要動力。

Hadoop是推動大數據應用的基礎平臺,是基于GFS和Mapreduce的開源實現。盡管在Hadoop之前也有一些類似的分布式存儲和計算平臺,但真正能實現工業級應用、大幅降低應用門檻、帶動各行業大規模部署的無疑當屬Hadoop。受益于MapReduce框架的易用性和容錯性,以及對先進存儲系統和計算系統的集成,Hadoop成為大數據處理平臺的主要基石。

在大數據產業發展的初期,Hadoop可滿足90%以上的離線存儲和離線計算需求,它成為各大公司早期大數據平臺的首選??梢哉f,沒有Hadoop就沒有今天的大數據產業發展。自Hadoop起,大數據平臺幾經升級及更替,發展出兩主線、多支線的演進態勢,但不管是主線亦或是支線,開源都是大數據平臺技術創新的主要模式,開源軟件始終是大數據基礎平臺的重要屬性。

主線一是Hadoop生態,主要組成包括Hadoop、Pig、HBase、ZooKeeper、Hive、Yarn和Impala,主要組件提出于2008年之前,Yarn和Impala分別提出于2011年和2012年。Pig是一種開源編程語言,可加載數據、表達轉換數據和存儲最終結果,其內置操作可處理半結構化數據;HBase是一個分布式的、面向列的開源數據庫,在Hadoop之上提供了類似于Bigtable的能力,是一個適合于非結構化數據存儲的數據庫;ZooKeeper是一個分布式的開源分布式應用程序協調服務,可提供配置維護、名字服務、分布式同步、組服務等功能;Hive是一個基于Hadoop的數據倉庫工具,可以將結構化的數據文件映射為數據庫表,并提供簡單的SQL查詢功能;Yarn是一個全新的MapReduce框架,可為從根本上解決傳統MapReduce框架的性能瓶頸,對促進Hadoop框架應用發展發揮重要作用;Impala可以直接為Hadoop數據提供快速,交互式的SQL查詢。

主線二是Spark生態,包括Spark、Shark、SparkStreaming、Bagel、GraphX、SparkSQL等,Spark提出于2009年,主要生態組成提出于2011年至2014年。

Spark是開源類Hadoop框架,可將中間輸出結果保存在內存中,因此計算速度較Hadoop有幾倍到幾十倍的提升,在成熟之后得到了迅速普及;Shark可通過Hive的HQL解析將其翻譯成Spark上的RDD操作,具有運算速度快、兼容性強等特點;Spark Streaming、Bagel、GraphX、Spark SQL等開源軟件均以Spark為基礎,從實時計算框架、圖計算模型、圖模型API、數據查詢等方面對原有平臺進行了優化或補充。

除Hadoop、Spark之外,還涌現出了一批支線平臺,絕大多數是開源的,主要代表有Hypertable、Cassandra、Dryad、S4、Kalka、Haloop和Storm。其中,Storm完全擺脫了MapReduce架構,重新設計了一個適用于流式計算的架構,以數據流為驅動觸發計算,計算時效性高,適應有向無環圖計算拓撲的設計,計算方式較為靈活,在業界得到了一定的部署應用。

科技企業是大數據開源軟件發展的主要力量

表面上看,大數據基礎平臺和主要環節的技術創新均是基于開源模式推動的,全球各界人士均有平等的參與和應用機會。但是,從技術演進的確定權和影響力來看,大數據領域的技術創新離不開全球主要科技企業的參與。

科技企業既是大數據技術創新的主要力量,同時也圍繞開源世界的游戲規則不斷擴大行業影響力,緊抓技術創新前沿,搶占大數據技術發展和標準制定的話語權,培育發展形成以企業核心競爭力為中心、以開源為主要方式的新型產業生態。

猜你喜歡
數據處理生態發展
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
邁上十四五發展“新跑道”,打好可持續發展的“未來牌”
中國核電(2021年3期)2021-08-13 08:56:36
“生態養生”娛晚年
保健醫苑(2021年7期)2021-08-13 08:48:02
住進呆萌生態房
學生天地(2020年36期)2020-06-09 03:12:30
生態之旅
砥礪奮進 共享發展
華人時刊(2017年21期)2018-01-31 02:24:01
改性瀝青的應用與發展
北方交通(2016年12期)2017-01-15 13:52:53
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
生態
領導文萃(2015年4期)2015-02-28 09:19:05
主站蜘蛛池模板: 免费国产不卡午夜福在线观看| 国产91成人| 国产成人免费| 午夜福利在线观看成人| 午夜丁香婷婷| 啊嗯不日本网站| 麻豆国产原创视频在线播放| 亚洲人成影院午夜网站| 中文字幕av无码不卡免费 | 国产一在线观看| 国产成人高清精品免费| 亚洲黄网视频| 国产va免费精品| 狠狠五月天中文字幕| 91在线国内在线播放老师 | 91无码人妻精品一区| 99re视频在线| 亚洲AV无码精品无码久久蜜桃| 亚洲国产高清精品线久久| 欧美日韩中文字幕二区三区| 2018日日摸夜夜添狠狠躁| 国产欧美亚洲精品第3页在线| 又黄又湿又爽的视频| 亚洲人成成无码网WWW| 青青久久91| 国产欧美日韩综合在线第一| 亚洲黄色成人| 日韩欧美视频第一区在线观看| 国产亚洲精品资源在线26u| 大学生久久香蕉国产线观看 | 九九精品在线观看| 久久久波多野结衣av一区二区| 亚洲国产日韩在线成人蜜芽| 国产福利一区视频| 欧美日韩91| 欧美成人午夜视频| 亚洲视频在线网| 成人免费一区二区三区| 91人妻在线视频| 国产91久久久久久| 国产精品私拍99pans大尺度| 丝袜国产一区| 久久亚洲中文字幕精品一区| 无码'专区第一页| 精品国产成人国产在线| 国产一级在线观看www色| 无码综合天天久久综合网| 日韩大乳视频中文字幕| 日韩美一区二区| 欧美中日韩在线| 永久免费av网站可以直接看的 | 中文字幕66页| 91精品福利自产拍在线观看| 国产簧片免费在线播放| 日韩视频免费| 波多野结衣第一页| 日韩高清一区 | 国产杨幂丝袜av在线播放| 女人18毛片一级毛片在线| 啪啪免费视频一区二区| 国产黄在线免费观看| 99久久这里只精品麻豆| 99久久精品免费看国产电影| 国产一区自拍视频| 午夜老司机永久免费看片| 婷婷色中文| 久久精品无码一区二区国产区 | 91网红精品在线观看| 亚洲成人在线免费| 老熟妇喷水一区二区三区| 欧美h在线观看| 午夜丁香婷婷| 四虎永久免费地址在线网站 | 精品免费在线视频| 国产精品视频导航| 免费在线播放毛片| 九九久久精品免费观看| 国产永久在线观看| 全部毛片免费看| 九九久久精品免费观看| 久久大香香蕉国产免费网站| 97无码免费人妻超级碰碰碰|