999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于Hadoop的數據展示研究

2016-05-04 02:09:42任修仕邵劍飛
新技術新工藝 2016年1期
關鍵詞:大數據

任修仕,邵劍飛

(昆明理工大學 信息與自動化院,云南 昆明 650504)

?

一種基于Hadoop的數據展示研究

任修仕,邵劍飛

(昆明理工大學 信息與自動化院,云南 昆明 650504)

摘要:大數據時代已經到來,體現出數據量大、類型繁多、價值密度低、速度快和時效高等特點。數據由簡單的使用對象開始轉變為一種基礎性資源,而大數據的規模效應給數據庫存儲數據和數據分析帶來了很大挑戰,更好地從數量級很多的數據中得到所需數據并展示已經成為關注焦點。順應數據管理方式的變革,首先對大數據的基本概念進行剖析,在此基礎上模擬了一個二手車大數據文本作為初始數據,然后把大數據數據倉庫框架與數據庫分表相結合,從而找出所需要的精細數據,最后利用了前端框架把得到的數據展示出來,讓大數據能夠真正應用于人們的生活中。

關鍵詞:大數據;數據倉庫;數據展示

大數據是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合。對大數據的分析是一個具有很大挑戰性的問題。MapReduce框架成為對海量的數據或應用程序有效處理的關鍵點。在過去幾年中,MapReduce已成為最流行的大數據模式,其具有并行計算、批量式和大數據量分析等特點[1]。MapReduce通過把對數據集的大規模操作分發給網絡上的每個節點;每個節點會周期性地返回它所完成的工作和最新的狀態[2]。密集型數據的快速處理成為目前數據庫處理方向的重中之重。它需要所設計的算法能夠擴展到現實世界的數據集。目前,已經有相當大的規模在研究MapReduce對于大規模數據分析的范式。它的靈感來自于函數式編程,允許表達式分布對海量數據的計算,因為它允許在集群上運行大規模數據處理商品硬件[3-4]。而Hadoop 由許多元素構成,其最底部是HDFS(Hadoop Distributed File System),它存儲了Hadoop集群中所有存儲節點上的文件。

1數據來源

本文利用一個國內市場的所有二手車的數據文本,來研究大數據的展示。按照月份、平臺、省份、城市級別、城市、汽車類別、汽車品牌、商家、平臺歸屬、商家類別、汽車型號、使用車齡、行駛里程、報價和價格段的格式,提前整理好所需的大量數據(見圖1),所取數據在數據庫中的顯示如圖2所示。

圖1 所取的數據格式

圖2 所取數據在數據庫中的展示

2數據倉庫與數據庫的結合

一般來說,如果數據量小的話,保存在數據庫中的數據可以直接用基本的SQL語句查詢出來,比如:select 字段名,from 表名,group by 條件,order by 順序。經過筆者測試,當數據量在250萬條以上時,查詢起來非常得慢,等待時間>1 min。為了大幅度提高查詢的效率,可以把一張類似于圖1的主表分解成只與查詢有相關連的字段,也就是把主表分成若干子表,其中的一項子表如圖3所示。

圖3 子表age_carcount_platform

由于人們想得到在不同平臺下某一二手車使用年限下汽車的數量,所以只需要用到圖3中的一些字段[5]。當然查詢效率提高的同時,必然有其他問題出現,除了建多張表比較麻煩以外,其中子表的數據怎么有效地導入進來是一個大問題。如果數據量小,用數據庫工具可以直接導入過來,但是如果數據量過大,以本次實驗的數據為例,導入到子表數據有可能>30 min,這是一個可怕的問題,而Hadoop的出現,解決了這個難題。

Hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行運行[6]。 其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析;但Hive 不支持更新操作,只能覆蓋數據,所以,人們只能一張表一張表地進行,然而同樣的數據處理(見圖4),利用了Hadoop,則只用了42.864 s。

3數據的展示

由于在本研究中不存在一般程序所包含的事務,所以也就用不到最常見的ssh框架,本文研究的后臺程序僅僅包含了controller、entity、pojo和repository層,從而最簡單直接地達到了所要求的效果。而前端則利用最近比較新的Angularjs 框架來展示(見圖5),得到了所需要的特定數據信息[7-8]。

圖5 展示出所要得到的數據

4結語

本文研究的目的是把數據量很大的數據分解成若干所需求的數據,并且直觀地用圖表展示出來,從而讓人們在大數據時代能夠快速、直觀地找出所需要的信息,為人們對大數據的進一步分析提供了有效的方法。

參考文獻

[1] Weichert T. Big data, gesundheit und der datenschutz[J]. Datenschutz und Datensicherheit-DuD, 2014, 38(12):831-838.

[2] Labrinidis A, Jagadish H V. Challenges and opportunities with big data[J]. Challenges and Opportunities with Big Data-ResearchGate, 2012, 5(12):2032-2033.

[3] Agrawal D, Bernstein P, Bertino E, et al. Challenges and opportunities with big data[J]. Challenges and Opportunities with Big Data-ResearchGate, 2012,6(12):2032-2033.

[4] 王元卓,靳小龍, 程學旗. 網絡大數據:現狀與展望[J]. 計算機學報, 2013, 36(6):1125-1138.

[5] 楊德仁,馬曉燕. 大型數據庫優化設計方案[J]. 計算機系統應用, 2001(5):16-18.

[6] Thusoo A, Sarma J S, Jain N, et al. Hive: a warehousing solution over a map-reduce framework[J]. Vldb Proceedings of the Vldb Endowment, 2009, 2(2):1626-1629.

[7] 王貫飛. 動態web 應用程序開發框架 AngularJS 的特性分析[J]. 電子技術與軟件工程, 2014(6):268-268.

[8] 董英茹. 簡談AngularJS在下一代Web開發中的應用[J]. 軟件工程師, 2015(5):30-31.

責任編輯彭光宇

Research on Data Display based on Hadoop

REN Xiushi, SHAO Jianfei

(Faculty of Information and Automation, Kunming University of Science and Technology, Kunming 650504, China)

Abstract:Big data era has arrived, the data volume is big, the type is various, the value density is low and the speed of the time is high. The data is transformed into a basic resource, and the scale effect of big data has brought a great challenge to the database storage data and data analysis. How to get the data you want from a number of data and display it has become a common concern. The data management mode of the reform is brewing and occurred, the basic concept of large data is analyzed, and the simulation is dove based on a second-hand car big data text taken as the initial data, then the big data warehouse framework and database table are connected to find out the required data. Finally, use the front frame to get the data show, so that the big data can really be applied to the people life.

Key words:big data, data warehouse, data display

收稿日期:2015-07-03

作者簡介:任修仕(1990-),男,碩士研究生,主要從事無線通信與web開發等方面的研究。

中圖分類號:TP 301.6

文獻標志碼:A

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产精品无码AⅤ在线观看播放| 日本人又色又爽的视频| 亚洲综合色婷婷| 国产无码性爱一区二区三区| 国产精品污污在线观看网站| 久久综合丝袜长腿丝袜| 97se亚洲| 国产v精品成人免费视频71pao| 97超碰精品成人国产| 黄片一区二区三区| 少妇被粗大的猛烈进出免费视频| 日本一本在线视频| 亚洲精品制服丝袜二区| 国产精品黑色丝袜的老师| 久久青青草原亚洲av无码| 一区二区三区国产精品视频| 国产一区二区色淫影院| 日本精品一在线观看视频| 国产精品开放后亚洲| 色噜噜狠狠狠综合曰曰曰| 国产剧情国内精品原创| 熟妇丰满人妻| 99资源在线| 欧美成人一级| 在线看片国产| 亚洲一级毛片在线观播放| 国产人免费人成免费视频| 精品无码专区亚洲| 久久无码免费束人妻| 91香蕉国产亚洲一二三区 | 91视频99| 久久狠狠色噜噜狠狠狠狠97视色| 国产伦精品一区二区三区视频优播 | 狼友视频一区二区三区| 亚洲日本一本dvd高清| 黄色网站在线观看无码| 她的性爱视频| 国产成人高清精品免费软件| 国产精品免费电影| 日韩欧美中文亚洲高清在线| 99精品视频九九精品| 第一页亚洲| 色综合成人| 国产乱肥老妇精品视频| a级毛片毛片免费观看久潮| 久久国产精品麻豆系列| 麻豆AV网站免费进入| 成年人国产网站| 国产欧美网站| 真人免费一级毛片一区二区| 日韩第九页| 动漫精品中文字幕无码| 国产高清又黄又嫩的免费视频网站| 97视频精品全国免费观看| 亚洲精品男人天堂| 丁香五月婷婷激情基地| 99在线小视频| 国产粉嫩粉嫩的18在线播放91| 亚洲中文字幕手机在线第一页| 91人妻日韩人妻无码专区精品| 嫩草在线视频| 青青青草国产| 男人的天堂久久精品激情| 99久久精品国产麻豆婷婷| 国产精品视频999| 成年网址网站在线观看| 国产精品一老牛影视频| 黄色污网站在线观看| 2019年国产精品自拍不卡| 一级毛片免费播放视频| 国产成人三级| 国产高颜值露脸在线观看| 欧美一级特黄aaaaaa在线看片| 在线播放国产99re| 手机在线免费不卡一区二| 情侣午夜国产在线一区无码| 精品亚洲国产成人AV| 亚洲综合二区| 亚洲精品无码高潮喷水A| 欧美国产成人在线| 免费人成在线观看成人片| 国产成人毛片|