999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Hadoop集群實現之原理初步探討

2019-05-24 14:13:16張衛
電腦知識與技術 2019年11期
關鍵詞:大數據

張衛

摘要:隨著信息技術的持續發展,大數據技術、AI技術成為時代的主流,大量數據的存儲成為當前技術分析面臨的第一個問題,存儲數據,分析數據,是IT技術的核心,那么如何迅速存儲海量數據,現在主要采用hadoop技術,該文在研究當下主要的hadoop技術的架構下,對技術原理做出論述。

關鍵詞:hadoop;分布式存儲;大數據;集群

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2019)11-0071-02

隨著大數據時代的到來,各種大數據相關產業和技術也營運而生,那么什么是大數據呢?大數據歸根結底就是很多的數據,那么多少數據謂之多呢,本來沒有一個相對量化的概念,但是在如今各種個人電腦性能極大提高的近日,數據量很小如幾個G等似乎都很容易被個人電腦輕松應對。但是現在各種行業,各種設備都會產生數據,數據動輒多少T字節,甚至網Z字節動蕩。所以有人說,少于50T的數據都不能算是大數據。那50T是一個什么樣的概念呢,一般一本長篇電子書也就是3~4MB的容量的樣子,那么往大了說按5M算的話,1G就是200本以上的長篇小說,50T相當于10240000本長篇小說,試想如果在數千萬本《紅樓夢》或者《三國演義》這樣的小說中去查找信息,工作量可想而知。但是如果僅僅是查找的話人力不可為,或許你會說計算機對于這樣簡單性質的比對還是比較能勝任,不錯,計算機做簡單的數學或者邏輯判斷是擅長的快速的。但是如果這些信息是數千萬張照片或者視頻等形式的信息,近年來雖然智能識別如人臉識別等技術的發展,即使計算機的性能也有很大的提高,這些識別算法還是比較消耗性能的,何況是海量的數據那么難度和挑戰肯定還是并存的。

1 什么是大數據

大數據(Big Data),是指無法在一定的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能有更強的決策力、洞察發現力和流程優化能力的海量、高速增長的多樣化信息資產1。

在以往鑒于人的精力和設備的局限性,對一些數據處理都是抽樣處理,而大數據不是對數據進行抽樣處理,而是所有數據,處理要得到的結論是不再是簡單的精確匹配或者計算,而是在多個維度上進行復雜的相互關系的分析。IBM公司提出數據的5V特點, Volumn、Velocity、Varity、Value、Veracity分別指其在容量、速度、變化、價值、真實性等方面的要求。需要在快速的時間內手機大量的真實的信息,跟蹤數據的變化,得到有價值的建議。

2 大數據的工作意義及過程

數據如果放在哪里不用就沒有任何價值,甚至如果垃圾還占了大量的空間,大數據歸根結底還是要從數據中提取信息,通俗講,大數據就是處理大數據,其過程可以通過以下流程圖來描述:

大數據就是從海量數據中去除無用數據,經過各種算法給客戶提供決策信息的過程。

3 什么是Hadoop

Hadoop是一個由Apatch基金開發的分布式系統基礎架構。提供給用戶分布式程序,利用集群資源進行高速數據處理、運算、存儲的服務。Hadoop框架的核心有HDFS和MapReduce,HDFS(hadoop distributed file system),分布式文件系統,通過高容錯、低成本提供大數據集。而MapReduce為這些大數據集提供了處理能力。

總的來說,haddoop核心包括兩大塊,mapreduce提供任務分解和結果匯總,hdfs提供namenode文件管理和datanode文件存儲功能,由client進行文件的獲取。

3.1 HDFS 分布式文件系統

HDFS是hadoop框架中數據存儲和管理的支撐,它高度容錯,能檢測和應對硬件故障,在低成本的硬件上提供了高性價比的數據存儲和管理功能,通過流式數據訪問提高吞吐量等應用程序性能給一些大型數據集應用程序提供數據資源。

Client提供切片訪問,與HDFS和數據主節點DataNode交互,讀取或者寫入文件,在datanode中有一個主節點Masternode即NameNode,NameNode用來管理HDFS的名稱空間和數據集塊映射信息。

3.2 Mapreduce

MapReduce用以進行大數據量的計算2,通過Map對數據集上的獨立元素進行特定操作,將數據加工成K-V(Key-Value)對,reduce對這個K-V對進行規定約束以得到最終的結果。

其中TaskTracker作為從節點,主要運行Map任務和Reduce任務,將結果與主節點JobTracker交互,通信任務狀態。主節點JobTracker將作業任務分解成一系列的任務,并分派給TasckTracker,運行后負責管理監督所有作業,對作業發生的錯誤進行處理。

每個TasckTracker的Map Task完成每條數據記錄的解析傳遞給用戶編寫的Map函數執行,將結果寫入本地磁盤或者HDFS。而Reduce Task則從MapTask的執行結果中,遠程讀入數據,對數據進行排序并分組傳遞給用戶編寫的reduce函數執行。

4 Hadoop的應用與展望

國際上Yahoo是Hadoop的最大支持者,截至2012年,Yahoo的Hadoop機器總節點數目超過420000個,有超過10萬的核心CPU在運行Hadoop。Facebook使用Hadoop存儲內部日志與多維數據,并以此作為報告、分析和機器學習的數據源。目前Hadoop集群的機器節點超過1400臺,共計11?200個核心CPU,超過15PB原始存儲容量,每個商用機器節點配置了8核CPU,12TB數據存儲3。在國內,百度、360、阿里巴巴等軟件巨頭也在Hadoop應用領域做了深入研究和開發,主要應用與數據挖掘和分析,日志分析、數據倉儲、推薦引擎、用戶行為分析等。

Hadoop在有效利用現有資源,對其進行整合以達到高性能運行服務的框架為企業和各行業客戶提供了極大的便利,作為一種技術性方向作用非常重要,在后期必定會吸引更多的資源加入hadoop的研究和拓展。

注釋:

1.百度百科https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=aladdin#reference-[1]-13647476-wrap

2.http://lib.csdn.net/article/hadoop/50993

3.https://blog.csdn.net/lienen/article/details/50460243

參考文獻:

[1] Sanger F.Nicklen S. DNA sequencing with chain-terminating[P]. 1977,74:5463–5467.

[2] Struster SC.Next-generation sequencing transform todays biology[J].Nat Methods, 2008,5(1):16-18.

[3] 解增言,林俊華,譚軍,舒坤賢. DNA測序技術的發展歷史與最新進展[J].生物技術通報, 2010(08).

[4] Rusk N. Cheap third-generation sequecing[J]. Nature, 2011,6(4): 244-245.

[5] J. Craig Venter, Mark D. Adams, Eugene W. Myers. The Sequence of the Human Genome[J]. Science, 2001, 291(5507): 1304-1351.

[6] 于聘飛,王英,葛芹玉.高通量DNA測序技術及其應用進展[J].南京曉莊學院學報,2010(5).

【通聯編輯:代影】

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 亚洲精品国产首次亮相| 美女国内精品自产拍在线播放 | 在线精品亚洲一区二区古装| 亚洲视频四区| 2021精品国产自在现线看| 亚洲午夜福利在线| 91啦中文字幕| 一级毛片a女人刺激视频免费| 日韩一级毛一欧美一国产| 国产精品视频猛进猛出| 精品国产91爱| 亚洲成a人片在线观看88| 精品国产免费第一区二区三区日韩| 亚洲国产成人久久77| 国产成人高清精品免费5388| www.日韩三级| 人与鲁专区| 一级看片免费视频| 亚洲首页在线观看| 日本一本在线视频| 伊人久久久久久久久久| 精品国产成人av免费| 91在线播放国产| 少妇精品在线| 国产成人久视频免费| 亚洲欧美不卡视频| 免费黄色国产视频| 真人免费一级毛片一区二区| 久久中文无码精品| 亚洲成a人片| 国产xxxxx免费视频| 国产精品一区二区不卡的视频| 亚洲综合色婷婷中文字幕| 亚洲成人网在线观看| 毛片手机在线看| 国产欧美视频在线观看| 看看一级毛片| 成年女人a毛片免费视频| 91久久偷偷做嫩草影院| 中文字幕亚洲无线码一区女同| 玩两个丰满老熟女久久网| 无遮挡一级毛片呦女视频| 91久久国产综合精品女同我| 思思热在线视频精品| 国产人成网线在线播放va| 91成人免费观看在线观看| 欧美高清日韩| 国产日本欧美亚洲精品视| 亚洲视频色图| 色综合久久88| 热思思久久免费视频| 国产清纯在线一区二区WWW| 免费高清a毛片| 国产清纯在线一区二区WWW| 国产一级在线观看www色| 夜色爽爽影院18禁妓女影院| 亚洲精品免费网站| 亚洲第一黄片大全| 亚洲中文字幕手机在线第一页| 亚洲一区波多野结衣二区三区| 日本a∨在线观看| 蜜桃臀无码内射一区二区三区| 亚洲婷婷六月| 国产乱人视频免费观看| 99爱视频精品免视看| 亚洲人成成无码网WWW| 亚洲成a人片77777在线播放| 91丝袜在线观看| 欧美激情伊人| 五月激情婷婷综合| 伊在人亞洲香蕉精品區| 又粗又硬又大又爽免费视频播放| 国产主播喷水| 手机看片1024久久精品你懂的| 亚洲欧美日本国产综合在线| 国产成人免费视频精品一区二区| 国产91小视频| 热热久久狠狠偷偷色男同| 专干老肥熟女视频网站| 亚洲视频免费播放| 国产日韩欧美黄色片免费观看| 91精选国产大片|