999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop的海量數據處理平臺的架構與研究

2019-08-29 02:57:44關金金未培莊彥
科技視界 2019年20期

關金金 未培 莊彥

【摘 要】大數據時代的來臨,成就了海量數據的衍生,但如何快速聚類高價值數據,深度挖掘電商行業客戶和服務數據,搭建海量數據服務著陸平臺,監測行業數據輿情,提升公共服務水平,拓寬數據資源應用市場是“互聯網+”行業轉型的關鍵。借助Hadoop分布式存儲與計算平臺,以高效、可靠、可伸縮的方式維護數據精確度、緩解數據冷啟動問題,增強數據多樣化推薦。

【關鍵詞】Hadoop平臺;海量數據;服務處理平臺;HDFS架構

中圖分類號: TP391 文獻標識碼: A 文章編號: 2095-2457(2019)20-0099-002

DOI:10.19694/j.cnki.issn2095-2457.2019.20.046

0 概述

多元化的數據來源,井噴式的數據增長,龐冗雜的數據規模正預示著大數據時代的來臨,擺脫了傳統數據庫儲存、管理和分析的約束,大數據正朝著深度學習、數據關聯、數據過濾,分布式計算、推薦算法等體現其時效價值性的方向發展。面對海量數據,如何快速挖掘,過濾分析、決策處理成為各大“互聯網+”公司轉型的關鍵,而基于Hadoop分布式存儲與計算機平臺的誕生正是為改善企業數據資源的高效運用,提升品牌價值市場競爭力而服務[1]。

1 Hadoop集群的偽分布環境的架構

Hadoop分布式存儲與分布式計算環境,是基于JAVA語言開發的,需要部署在計算機集群中,因此可以首先在載有CentOS系統的master虛擬機器中,借助xshell和xftp工具完成主-虛兩機JAVA語言編程環境安裝。接著完成CentOS克隆,構建三臺Hadoop基礎集群計算機,三臺VM機之間實現SSH免密碼登錄,在master機器上修改Hadoop組件后,將Hadoop安裝目錄拷貝到兩個salve node節點上,修改$Hadoop Home/etc/hadoop目錄下的配置文件core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml內容,完成配置,直至三個節點均安裝語言編程環境[1-2]。

2 海量數據分析

以電商網站為例,供應商通過將企業商品和開放網絡彼此關聯為客戶提供了商用數據服務, 運用智能算法深度挖掘Web站點內容和結構,構建模型,運用平臺推薦系統,聚類高價值信息,規范關聯數據格式,形成個性化數據訂閱,提供精準服務,拓寬銷售渠道,提升平臺價值和品牌效應。海量數據來源廣泛,包括電商平臺交易數據,互聯網關聯數據,傳感器數據等,數據類型包括非結構化數據,結構化數據,異化半結構數據,但處理流程基本一致,主要有 “數據采集-數據分析-數據過濾-數據標準化-數據應用”五個步驟,具體如圖1。

面向Hadoop平臺能夠快速獲取豐富的信息資源,但不可避免的會遇到“信息過載”和“信息失效”問題,及時過濾冗余數據,篩選出對用戶有用的數據,提供個性化和類似群體的信息推薦,識別潛在隱藏用戶,產生良好的推薦策略,引導用戶訪問和消費,提升電商平臺公共服務能力,完善網站精準數據評估[3-4]。圖2給出了海量數據服務著陸平臺的架設。

3 基于Hadoop平臺的海量數據處理關鍵技術

Hadoop兩大大數據核心技術,其一MapReduce分布式存儲框架遵循主-從結構,主-從節點中的數據一般屬于同一個命名空間(namespace)即文件系統的目錄結構。主節點是用戶操作的入口,負責接收操作的各種請求信息,維護命名空間;而從節點主要負責存儲數據。其二HDFS分布式計算框架,存儲在其中的文件會被分割成若干塊(Block),然后這些塊會復制到多個計算機節點中,計算框架內部之間的通信基于TCP/IP協議,Hdfs文件在各存儲節點間讀和寫的流程如下圖3[5]。

HDFS中的NameNode節點讀取從客戶端Client發送過來的路徑,將文件的元數據信息返回給請求客戶,Client端之后會根據這些信息找到對應的DataNode獲取Block塊并在本地端整合數據還原文件內容。

而客戶端Client向HDFS寫數據時,在獲得和NameNode節點通信確認ACK信息后,接收文件Block的DataNode信息,按序將Block傳遞給對應的DataNode,DataNode-1和DataNode-2之間傳遞Block副本。

4 小結

海量數據信息量龐、冗、雜,為快速獲取關鍵數據、避免在分布式存儲和計算過程中出現數據稀疏、數據傾斜和數據失真,考慮通過加入正則表達式匹配防止數據堆棧溢出,清洗出有價值數據,挖掘數據關聯,引入推薦系統,跨域提供精準決策,豐富客戶需求,提升電商行業的數據資源競爭力,從而拓寬行業服務平臺。

【參考文獻】

[1]張趁香.基于Hadoop平臺的海量數據分析和處理[J].數據庫與信息管理.2019,01:95-97.

[2]申晉祥,鮑美英.基于Hadoop、平臺的優化協同過濾推薦算法研究[J].軟件.2018,39(12):1-5.

[3]孫輝,馬躍,楊海波.一種相似度改進的用戶聚類系統過濾算法[J].小型微型計算機系統,2014,35(9):1967-1970.

[4]王文賢,陳興蜀,王海舟,等.一種基于Solr的HBase海量數據二級索引方案[J].信息網絡安全.2017(8):39-44.

[5]宋陽.高校大數據存儲方案探索[J].中小企業管理與科技.2018(11):82-83.

主站蜘蛛池模板: 日韩成人在线网站| 国产最新无码专区在线| 成人精品免费视频| www.亚洲一区| 久久综合九色综合97婷婷| 在线观看精品自拍视频| 国产福利在线免费| 亚洲丝袜中文字幕| 亚洲国产精品日韩av专区| 丁香六月综合网| 亚洲国产成人无码AV在线影院L| 免费国产黄线在线观看| 亚洲欧洲自拍拍偷午夜色| 丰满少妇αⅴ无码区| 国产一国产一有一级毛片视频| 久久中文字幕av不卡一区二区| 久久国产精品娇妻素人| 国产在线视频欧美亚综合| 美女潮喷出白浆在线观看视频| 欧洲亚洲一区| 免费看a毛片| 国产视频只有无码精品| 亚洲精品片911| 亚洲中文精品人人永久免费| 国产一区二区精品福利| 久久综合丝袜长腿丝袜| 欧美亚洲国产精品久久蜜芽| 欧美另类第一页| 国产美女无遮挡免费视频网站 | 久久频这里精品99香蕉久网址| 久久99国产视频| 日韩人妻少妇一区二区| 亚洲国产精品人久久电影| 亚洲欧美在线综合图区| 日本高清有码人妻| 久久综合丝袜日本网| 国产精品综合久久久| 欧美亚洲一二三区| 在线中文字幕网| 亚洲永久精品ww47国产| 亚洲无卡视频| 国产精品性| 亚洲视频在线网| 小蝌蚪亚洲精品国产| 国产精品私拍在线爆乳| 国产欧美日韩综合一区在线播放| 精品福利一区二区免费视频| 伊人激情久久综合中文字幕| 手机永久AV在线播放| 免费网站成人亚洲| 亚洲成人免费在线| 久久99精品久久久大学生| 久久中文字幕av不卡一区二区| 欧美在线精品怡红院| 日韩欧美中文字幕在线精品| 中文字幕久久精品波多野结| 国产欧美视频在线| 欧美激情,国产精品| 亚洲欧美日韩成人在线| 亚洲综合色婷婷| 91在线丝袜| 中文字幕永久在线观看| 国产91色在线| 永久免费AⅤ无码网站在线观看| 亚洲av无码人妻| 欧美福利在线观看| 欧美精品色视频| 欧美69视频在线| 午夜无码一区二区三区在线app| 91久久夜色精品| 97成人在线视频| 久久久久免费看成人影片| 伊人狠狠丁香婷婷综合色| 欧美天天干| 国产剧情无码视频在线观看| 国产成人免费视频精品一区二区| 日韩无码白| 亚洲天堂在线视频| 欧美日本中文| 毛片免费视频| 亚洲男人的天堂网| 国产精品熟女亚洲AV麻豆|