999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種大數據智能分析平臺的數據分析方法及實現技術

2017-05-17 10:13:30藍科李婧
數字技術與應用 2017年3期
關鍵詞:數據分析數據挖掘大數據

藍科+李婧

摘要:文章介紹了一種用于大數據智能分析平臺的數據分析方法及實現技術,介紹了這種方法的需求和意義;和該方法的總體架構,以及在數據傳輸、數據清洗和數據分析的實現;概述了這種技術高并發、大數據量的優化措施和跨平臺的實現。

關鍵詞:大數據;數據分析;數據挖掘

中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2017)03-0104-02

1 綜述

1.1 簡介

在數字化時代,需要新一代系統架構提升業務創新能力。在新一代系統架構中,大數據是核心要素。業務應用能否自主發現與自助獲得高質量的大數據,就成為業務創新成敗的關鍵。這就要在搭建大數據平臺時,就著手大數據治理相關建設。

1.2 需求和意義

從某種意義上說大數據治理架構需要以元數據為核心、提高大數據質量、透明化大數據資產、自助化數據開發、自動化數據發布、智能化數據安全,提升大數據平臺服務能力,讓大數據平臺變得易使用、易獲得、高質量。

但是,目前很多技術解決方案存在諸多安全和效率隱患:業務系統多,監管力度大;數據量龐大且呈碎片化分布,急需提升大數據質量;數據格式不規范、難以在短時間內找到所需數據;數據在各階段的應用角度不同,需要降低系統間的集成復雜度。

2 功能設計

2.1 總體架構

本文講述的數據分析方法及實現技術是建立在Hadoop/Spark技術生態圈的基礎之上,以實現用戶集成處理、、清理、分析的一個統一的數據處理平臺;按數據類別分為線數據、歸檔數據;按數據格式分為非結構化數據、結構化數據;按數據模型分類為范式化模型數據、維度模型數據;按數據采集頻度分為非實時數據、準實時數據處理架構;并提供數據中心平臺與安全管理方案,為企業級用戶建立一個通用數據處理和分析中心。如圖1所示。

2.2 在線數據

在線數據在線通過接口去獲得的數據,一般要求為秒級或速度更快。首先應當將數據進行區分:在線數據、或歸檔數據。本平臺中采用:Storm或Spark Streaming框架進行實現。Spark Streaming將數據切分成片段,變成小批量時間間隔處理,Spark抽象一個持續的數據流稱為DStream(離散流),一個DStream是RDD彈性分布式數據集的micro-batch微批次,RDD是分布式集合能夠并行地被任何函數操作,也可以通過一個滑動窗口的數據進行變換。

2.3 歸檔數據

歸檔數據是在線存儲周期超過數據生命周期規劃的數據,處理的要求一般在分鐘級或速度更慢。通常歸檔數據的計算量、數據量、數據復雜度均超過試試數據處理。本平臺中采用:Hadoop、Spark技術生態體系內的框架進行計算,這里不詳細闡述。

2.4 非結構化數據

通常非結構化的數據不一定具備字段,即使具備字段其長度也不固定,并且字段的又可是由可不可重復和重復的子字段組成,不僅可以包含結構化數據,更適合處理非結構化數據。常見的非結構化數據包括XML、文本、圖象、聲音、影音、各類應用軟件產生的文件。

針對包含文字、數據的為結構化數據應當先利用數據清洗、數據治理工具進行提取,這項工作目前仍依賴技術員進行操作,由于格式的復雜性所以難以使用自動化方式進行較為高效的批處理。在治理數據的過程中,需要根據情況對數據本身額外建立描述數據結構的元數據、以及檢索數據的索引服務,以便后續更佳深度利用數據。

2.5 結構化數據

結構化數據具備特定的數據結構,通常可以轉換后最終用二維的結構的數據,并且其字段的含義明確,是挖掘數據價值的主要對象。

本平臺中主要使用Hadoop Impala和Spark SQL來進行結構化數據的處理。Impale底層采用C++實現,而非Hadoop的基于Java的Map-Reduce機制,將性能提高了1-2個數量級。而Spark SQL提供很好的性能并且與Shark、Hive兼容。提供了對結構化數據的簡便的narrow-waist操作,為高級的數據分析統一了SQL結構化查詢語言與命令式語言的混合使用。

結構化數據根據采集頻度可以繼續分類為:非實時數據、準實時數據。

2.6 準實時數據

通常準實時數據是指數據存儲在平臺本身,但更新頻率接近于接口調用數據源的數據。適合用于支持數據和信息的查詢,但數據的再處理度不高,具有計算并發度高、數據規模大、結果可靠性較高的特點。通常使用分布式數據處理提高數據規模、使用內存數據進行計算過程緩沖和優化。本平臺主要采用Spark SQL結合高速緩存Redis的技術來實現。Spark SQL作為大數據的基本查詢框架,Redis作為高速緩存去緩存數據熱區,減小高并發下的系統負載。

2.7 非實時數據

非實時數據主要應用于支持分析型應用,時效性較低。通常用于數據的深度利用和挖掘,例如:因素分析、信息分類、語義網絡、圖計算、數值擬合等。

非實時數據根據數據模型可繼續分類為:范式化模型數據、維度模型數據。

2.8 范式化模型

范式化模型主要是針對關系型數據庫設計范式,通常數據是采用第三范式3NF或更高范式。面向近源數據查詢、數據主題的整合。范式化模型數據的數據存儲區,建議使用并行MPP數據庫集群,既具備關系型數據庫的優點,又兼顧了大數據下的處理。

2.9 基于維度模型

維度模型數據主要應用于業務系統的數據挖掘和分析。過去多維度數據處理主要依賴OLAP、BI等中間件技術,而在大數據和開源框架的時代下,本技術平臺采用Hadoop Impala來進行實現。Impala并沒有使用MapReduce這種不太適合做SQL查詢的范式,而是參考了MPP并行數據庫的思想另起爐灶,省掉不必要的shuffle、sort等開銷,使運算得到優化。

3 應用效果

本系統在不同的業務領域上都可以應用,以2016年在某銀行的應用案例為例:該銀行已完成數據倉庫建設,但眾多數據質量問題嚴重影響了數據應用的效果,以不同的數據存儲方式,以更高的要求去進行數據的統一管理。通過組織、制度、流程三個方面的實施,以元數據、數據標準、數據質量平臺為支撐,實現了數據管控在50多個分支,60個局,1000余處的全面推廣,實現了全行的覆蓋;管理了120個系統和數據倉庫,顯著提升了新系統的快速接入能力;通過14個數據規范和流程明確了數據管控的分工;數據考核機制的實施,使其在數據質量評比中名列前茅。

4 結語

本文介紹了大數據下數據分析方法及實現技術的大體設計和思路,從需求分析、總體架構和數據處理以及數據分析這幾個方面來介紹。文章在最后介紹出了這種平臺的應用效果。筆者相信這些思路和技術能夠在業務中能得到很好的應用。

參考文獻

[1]孫明,李素蕊.高性能計算機的海量數據處理平臺實現與評測[J].電子技術與軟件工程,2015(04).

[2]李學龍,龔海剛.大數據系統綜述[J].中國科學:信息科學,2015(01).

猜你喜歡
數據分析數據挖掘大數據
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 精品视频福利| 国产福利一区二区在线观看| 亚洲第七页| 国产一级片网址| 国产91av在线| 亚洲啪啪网| www.亚洲一区| 欧美日韩国产一级| 国产精品99久久久| 伊人成人在线视频| 久久久久人妻一区精品| 国产精品免费p区| 国产 在线视频无码| 亚洲精选无码久久久| av在线无码浏览| аv天堂最新中文在线| 美女一级毛片无遮挡内谢| 97se亚洲综合| 国产精品亚欧美一区二区三区| 亚洲国产综合自在线另类| 久久久91人妻无码精品蜜桃HD| 欧美精品v| 久久国产精品电影| 日韩在线第三页| 亚洲中文字幕久久无码精品A| 国产成人啪视频一区二区三区| 麻豆国产在线不卡一区二区| 风韵丰满熟妇啪啪区老熟熟女| 凹凸精品免费精品视频| 久久久久青草线综合超碰| 重口调教一区二区视频| 免费不卡视频| 亚洲男人的天堂久久香蕉网| 国产精品美女在线| 91蜜芽尤物福利在线观看| 四虎永久免费地址| 国产免费精彩视频| 99久久精品免费视频| 成人福利在线免费观看| 免费观看男人免费桶女人视频| 国产男女免费视频| 国产精品yjizz视频网一二区| 亚洲AV无码一区二区三区牲色| 国产成人夜色91| 亚洲中文字幕无码爆乳| 中文字幕欧美日韩高清| 人妻无码中文字幕第一区| 欧美亚洲欧美| 国产精品视屏| 99久久精彩视频| 日韩精品一区二区三区视频免费看| 极品尤物av美乳在线观看| 另类重口100页在线播放| 国产香蕉国产精品偷在线观看| 熟妇丰满人妻av无码区| 日本成人精品视频| 99热6这里只有精品| 久久国产乱子| 亚洲国产综合精品一区| 麻豆国产在线不卡一区二区| 亚洲精品无码高潮喷水A| 国产成人高清精品免费软件| 国产福利微拍精品一区二区| 亚洲二三区| 国产欧美日韩在线在线不卡视频| 成年人国产网站| 91精品专区| 国产成人精品亚洲日本对白优播| 久久久久国色AV免费观看性色| 欧美激情二区三区| 92午夜福利影院一区二区三区| 丰满人妻久久中文字幕| 久久a毛片| 欧美成人看片一区二区三区 | 久久亚洲综合伊人| 在线欧美国产| 激情無極限的亚洲一区免费| 久久99精品久久久久久不卡| 无码在线激情片| 免费国产一级 片内射老| 丝袜国产一区| 色天天综合久久久久综合片|