999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據技術分析與應用案例

2020-06-24 03:06:44包訓宇
中國新通信 2020年2期
關鍵詞:大數據

摘要:互聯網的快速發展帶來了海量數據的產生,現如今在生活中,我們無時無刻地創造著網絡數據。大數據時代的到來,已經影響了社會生活方方面面,要想把握住信息時代的潮流,我們就應該懂得大數據并且學會利用大數據技術來服務于日常的工作。本文首先說明大數據的價值,其次介紹一些大數據的關鍵技術,最后結合實際應用案例展現出大數據給我們帶來的好處。

關鍵詞:大數據;Hadoop;大數據分析

自2012年開始,“大數據”一詞逐漸被人們熟知,這種技術不僅僅是用在互聯網領域上,也與人們的實際生活中加速融合。大數據技術的發展與人類社會的進步相輔相成。一方面,人們從傳統手工生產方式轉向信息自動化生產方式,使得數據來源越來越廣泛,促進了海量數據局面的形成;另一方面,人們能夠利用大數據技術在錯綜復雜的信息面前規劃、分析并得出真正有價值的結果。大數據時代的到來,讓我們每一個人都身處其中,其帶來的價值已經不單單是技術層面上的突破與進步,更多的是在與其他領域融合中帶來的巨大經濟效益和社會效益。那么對于當代社會需要的復合型人才,掌握必要的大數據知識、學會大數據分析本領對今后的日常工作也顯得極為重要。本文在此背景下,結合具體應用案例呈現出大數據技術給我們日常工作帶來的便捷性。

一、大數據關鍵技術

想要處理好數以萬計的數據信息,就必須要掌握大數據處理技術,而Hadoop就是一種眾人熟知的對海量數據進行處理的分布式系統架構。Hadoop框架最核心的技術就是:HDFS和MapReduce。

HDFS就是Hadoop分布式文件系統的英文縮寫,在實際應用中通常采用主-從的架構形式。在HDFS集群里,一般采用拓撲結構,即單個中心節點NameNode和多個存儲節點DataNode,在中心節點的統一部署管理下,滿足對海量數據的存儲、增刪等要求。

MapReduce,簡單來說就是一種分布式離線的計算框架,其采用鍵值的處理方式來解決大規模集群的數據。其核心思想是用Mapper將一個復雜的項目分解成多個“簡單”的小任務,并且能夠允許這些小任務并行計算,其次利用Reducer將Map階段的各種小任務結果進行有目的地匯總一起,從而達到人們所需求的最終結果或者某一狀態下的中間結果。

其實Hadoop發展時至今日,已經不單純是上面兩個技術,而是逐漸成為一個Hadoop生態。在Hadoop生態圈里,我們能夠利用這些技術輕松的處理TB級別以上的數據量。下面介紹幾個經常用到的技術:

Hive是一種數據倉庫工具。簡單的來說,它能夠利用HQL語句實現數據管理工作,因此對于熟悉數據庫使用者來說非常友好,這樣一來會使得學習成本大大降低。

Yarn是Hadoop的資源管理器。我們可以通過它對資源的使用情況有一個清晰的掌握,監測Mapper下的每一個小任務資源消耗情況,從而起到平衡資源、提高集群利用率。

Flume是一種實時日志收集系統。在其廣泛的應用發展下,不僅能夠數據收集,還能對信息進行簡單的處理并寫進接收方。

二、大數據應用——以分析日活躍用戶為例

如今人們可以通過使用各種終端設備輕松上網,用戶的上網行為都可以被一一記錄下來。數據分析師通過后臺日志獲取用戶日常上網的數據,分析用戶上網行為之后,能夠得出用戶上網習慣以及可以定向給用戶推送他們喜歡的內容。下面作者對用戶登陸某一軟件時活躍的情況進行分析,闡述大數據技術是如何應用在實際生活工作中的。

用戶通過終端設備登陸軟件并進行各種操作時,可以將這些信息和行為都存儲在后臺日志中,數據分析員可以每天定時清洗這些數據,拿到清洗的數據后存入到HDFS上并建立清洗后的數據表進行分析。技術路線如圖1所示。

2.1數據清洗

數據清洗的目的就是要把一些缺省值、異常值或者此次分析不需要用到的數據排除在外。本案例使用JAVA語言,在eclipse工具上編寫數據清洗代碼。利用Flume技術把日志文件中的數據導入到HDFS中,然后將預處理程序代碼打成jar包,再把jar包上傳到對應的HDFS節點上,之后編寫預處理腳本如下:

以上工作準備就緒后,啟動清洗腳本,開始清洗數據。

2.2日活躍用戶統計分析

根據關鍵字段建立數據總表general_log,并一一對應導入數據,至此用戶的基本Hive表已經建立。如何分析日活躍用戶,那么就再建立一張活躍用戶數據表user_active_day。從general_log數據總表的當天分區中,抽取當日的日活用戶信息插入日活用戶信息表user_active_day(插入的是每個活躍用戶當天所有記錄中時間最早的那條),主要SQL語句如下:

為了使信息更加清晰明了,我們可以采取多維度分析,創建多維度分析表dim_user_active_day,利用多重insert語法來統計各種維度組合的日活用戶數,并插入到dim_user_active_day表的各分區中,得到日活躍用戶統計結果如表1所示。

從表1中,我們可以一目了然的得出使用此軟件的總用戶數量是多少,具體某一城市的用戶有多少以及具體某一城市哪一個國家用戶有多少的數量,這對今后進一步劃分用戶、分析用戶黏性程度等都提供了便捷性的幫助。此案例中作者使用的數據量僅僅是GB級別,如果是TB、PB級別以上,可想而知工作量的復雜和龐大,因此通過大數據技術的分析,可以讓我們在海量數據中快速、準確地獲得信息,大大降低了我們日常工作的成本。

三、總結

綜上所述,利用Hadoop平臺能夠對海量數據進行快速簡單的處理,方便工作上各種統計分析工作。Hadoop平臺本身具有的低成本、高效率、易擴展等優點,已經成為大數據領域發展方向。未來伴隨著人工智能、5G通信技術等新型產業的蓬勃發展,大數據引領下的各行各業將全面實現數字經濟化。現在我們可以通過學習大數據技術,掌握大數據分析本領,今后將會在各自領域內推動大數據產業進一步發展。

參考文獻:

[1]李曉瑋.淺談大數據Hadoop技術[J].電腦知識與技術,2017,13(32):10-11.

[2]李文航,余恒奇.基于Hadoop平臺的數據分析和應用[J].微型電腦應用,2019,35(11):134-136+146.

作者簡介:

包訓宇(1997-),漢,男,江蘇徐州人,碩士,研究方向:云計算、大數據分析。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产女人18水真多毛片18精品| 免费女人18毛片a级毛片视频| 2020国产精品视频| 婷婷综合在线观看丁香| 欧美午夜视频在线| 国产69精品久久| 亚洲视频影院| 看看一级毛片| 国产精品制服| www.91中文字幕| 国产人成在线视频| 国产成人无码AV在线播放动漫| 性网站在线观看| 久久美女精品| 欧美视频免费一区二区三区| 黄色网站在线观看无码| 国产成人精品视频一区二区电影| 成人免费黄色小视频| 久久无码高潮喷水| 国产第一页免费浮力影院| 久久国产乱子| 欧洲亚洲一区| 国产成人高清精品免费软件| 国产精品免费电影| 国产美女在线观看| 中文字幕人成人乱码亚洲电影| 好吊妞欧美视频免费| 呦女亚洲一区精品| 欧美成人亚洲综合精品欧美激情| a级毛片免费看| 久久婷婷国产综合尤物精品| 中文字幕亚洲乱码熟女1区2区| 久久96热在精品国产高清| 国产精品开放后亚洲| 91麻豆精品国产高清在线| 国产女人在线视频| 高清乱码精品福利在线视频| 欧美天堂在线| 国产丝袜丝视频在线观看| 亚洲精品无码久久久久苍井空| 超碰色了色| 99人妻碰碰碰久久久久禁片| 一级毛片在线免费视频| 一区二区三区国产| 青草视频网站在线观看| 欧美日韩国产一级| 午夜啪啪网| 九色最新网址| 青青青草国产| 国产亚洲欧美在线中文bt天堂 | 国产精品三区四区| 茄子视频毛片免费观看| 免费在线国产一区二区三区精品| 少妇被粗大的猛烈进出免费视频| 26uuu国产精品视频| 女人毛片a级大学毛片免费| 思思热精品在线8| 国产第八页| 免费人成视频在线观看网站| 亚洲精品你懂的| 国产日韩欧美一区二区三区在线| 国产91成人| 91在线一9|永久视频在线| 97久久免费视频| 国产美女视频黄a视频全免费网站| 麻豆精品久久久久久久99蜜桃| 国产精品一区二区不卡的视频| 久操线在视频在线观看| 国产精品亚洲专区一区| 91网红精品在线观看| 国产成熟女人性满足视频| 91av国产在线| 国产aⅴ无码专区亚洲av综合网| 亚洲综合精品香蕉久久网| 夜夜拍夜夜爽| 国产精品亚洲一区二区三区z| 国产麻豆精品手机在线观看| 欧美午夜网| 夜夜操天天摸| 成人免费午夜视频| 国内精品久久人妻无码大片高| 一本大道无码高清|