999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)倉庫元數(shù)據(jù)管理系統(tǒng)

2019-07-08 03:36:55羅小洪
神州·中旬刊 2019年6期
關(guān)鍵詞:大數(shù)據(jù)

羅小洪

摘要:本文首先對元數(shù)據(jù)的基本概念和作用進行了介紹,然后對元數(shù)據(jù)系統(tǒng)的軟件架構(gòu)進行了設(shè)計,并對用到的關(guān)鍵技術(shù)進行了說明,用到的關(guān)鍵技術(shù)包括:“血緣關(guān)系”,元數(shù)據(jù)抽取、轉(zhuǎn)換、加載以及SQL數(shù)據(jù)的埋點、采集等。實現(xiàn)了將數(shù)據(jù)界面化展示,可完成數(shù)據(jù)字典查詢、表對象查詢等,使用戶可以很輕松的獲取想要的數(shù)據(jù),大大地提高了開發(fā)的效率。

關(guān)鍵詞:元數(shù)據(jù);元數(shù)據(jù)系統(tǒng);數(shù)據(jù)倉庫hive;大數(shù)據(jù)

ABSTRACT:Abstract:This paper first introduces the basic concepts and functions of metadata, and then designs the software architecture of the metadata system, and introduces? key technologies such as“blood relationship”, metadata extraction, metadata conversion, metadata loading, as well as the burying and collecting of SQL data, the article also realizes the interface display of data, it can complete data dictionary query, table object query, etc., so that users can easily obtain the desired data, greatly improving the developments efficiency.

Keywords:metadata,Metadata System,data warehouse hive,big data

引言

元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),在數(shù)據(jù)倉庫的建設(shè)中,是不可忽略的一環(huán)。其作用在于對數(shù)據(jù)的治理、提高數(shù)據(jù)使用效率和數(shù)據(jù)管理效率,到達數(shù)據(jù)利用的準確及高效[1]。由于數(shù)據(jù)的海量性,數(shù)據(jù)的管理需要借助一個可視化的界面供開發(fā)人員的使用,為此需要建立一個可視化的元數(shù)據(jù)原理系統(tǒng)來幫助使用者開發(fā)、維護、使用、管理元數(shù)據(jù)。

元數(shù)據(jù)打通了數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)應用,記錄了數(shù)據(jù)從產(chǎn)生到消費的完整鏈路。元數(shù)據(jù)包含:靜態(tài)的表、列、分區(qū)信息(也就是MetaStore);動態(tài)的任務、表依賴映射關(guān)系;數(shù)據(jù)倉庫的模型定義、數(shù)據(jù)生命周期;以及ETL任務調(diào)度信息、輸入輸出等

元數(shù)據(jù)是數(shù)據(jù)管理、數(shù)據(jù)內(nèi)容、數(shù)據(jù)應用的基礎(chǔ)。例如可以利用元數(shù)據(jù):構(gòu)建任務、表、列、用戶之間的數(shù)據(jù)圖譜;構(gòu)建任務DAG依賴關(guān)系,編排任務執(zhí)行序列;構(gòu)建任務畫像,進行任務質(zhì)量治理;數(shù)據(jù)分析時,使用數(shù)據(jù)圖譜進行字典檢索;根據(jù)表名查看表詳情,以及每張表的來源、去向,每個字段的加工邏輯;提供個人或BU的資產(chǎn)管理、計算資源消耗概覽等。

在業(yè)務量并不是很大的時候,對應的開發(fā)者對業(yè)務較為熟悉,查看元數(shù)據(jù)信息都是通過訪問元數(shù)據(jù)庫進行查詢,但當并非專業(yè)人士,如數(shù)據(jù)分析師需要查看元數(shù)據(jù)信息時,就困難重重,尤其是當業(yè)務數(shù)據(jù)不斷擴張時,即便是專業(yè)的開發(fā)者想要隨時拿到想要的數(shù)據(jù)也并不容易,所以元數(shù)據(jù)系統(tǒng)應運而生。

1.軟件架構(gòu)設(shè)計

·DB保存任務的sql數(shù)據(jù)、任務基礎(chǔ)信息、執(zhí)行引擎上下文信息

·Extract循環(huán)抽取sql并解析成表、列級血緣Lineage

·DataSet包含Lineage關(guān)系數(shù)據(jù)+任務信息+引擎上下文

·將DataSet數(shù)據(jù)集保存到Neo4j,并提供關(guān)系查詢;保存ES,提供表、字段等信息檢索

2.關(guān)鍵技術(shù)

2.1血緣關(guān)系

“表”是元數(shù)據(jù)系統(tǒng)的后臺邏輯核心,數(shù)據(jù)倉庫是構(gòu)建在Hive之上的,而Hive元數(shù)據(jù)來自于生產(chǎn)系統(tǒng),也可能會把計算的結(jié)果導出到外部存儲。Hive表、mysql表、hbase表、BI報表都是“表”,這些“表”間關(guān)系是一個DAG,也就是血緣關(guān)系。

2.2 SQL埋點、采集

sql數(shù)據(jù),以執(zhí)行中采集為主+保存前submit為輔。因為任務的sql可能包含一些時間變量,比如dt、hour,以及任務可能是天調(diào)度、小時調(diào)度。執(zhí)行中采集sql實時性更高,也更容易處理EDW是任務調(diào)度系統(tǒng),類比開源的AirFlow,調(diào)度系統(tǒng)執(zhí)行任務,并將任務相關(guān)的信息比如appId、jobId、owner、sql等信息存入DB。

計算引擎實現(xiàn)相關(guān)的監(jiān)聽接口,比如Hive實現(xiàn)Execute WithHookContext接口;Spark實現(xiàn)SparkListener接口;Presto實現(xiàn)EventListener接口。將計算引擎相關(guān)的上下文Context、元數(shù)據(jù)MetaData、統(tǒng)計Statistics等信息存入DB。

解析sql的方案,以hive為例。先定義詞法規(guī)則和語法規(guī)則文件,然后使用Antlr實現(xiàn)sql的詞法和語法解析,生成AST語法樹,遍歷AST語法樹完成后續(xù)操作。

但對于SELECT*、CTAS等操作,直接遍歷AST,不去獲取Schema信息來檢查表名、列名,就無法判定sql的正確性,從而導致數(shù)據(jù)污染。

綜上所述,本系統(tǒng)的SQL解析方案,直接參考Hive的底層源碼實現(xiàn)。經(jīng)過SemanticAnalyzerFactory類進行語法分析,再根據(jù)Schema生成執(zhí)行計劃QueryPlan。關(guān)于表、列的血緣,可以從LineageInfo、LineageLogger類中獲得解決方案。

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 免费a级毛片18以上观看精品| 精品亚洲国产成人AV| 国产精品密蕾丝视频| 免费无码在线观看| 中文字幕乱码二三区免费| 亚洲色图欧美视频| 亚洲人成网站色7777| 毛片免费在线视频| 免费日韩在线视频| 999精品色在线观看| 中日韩一区二区三区中文免费视频| 亚洲精品自在线拍| 亚洲无码在线午夜电影| 日韩国产 在线| 超薄丝袜足j国产在线视频| 日韩精品成人在线| 亚洲欧洲日韩综合| 亚洲成综合人影院在院播放| 在线播放91| 日韩在线网址| 久久毛片免费基地| 色播五月婷婷| 久久精品人人做人人综合试看| 国产成人亚洲无码淙合青草| lhav亚洲精品| 国产精品久久久久无码网站| 91久久精品国产| 毛片大全免费观看| www.狠狠| 国产精品手机视频一区二区| 国产精品短篇二区| 欧美翘臀一区二区三区| 亚洲色偷偷偷鲁综合| 本亚洲精品网站| 波多野结衣国产精品| 国产美女在线观看| 国产精品亚洲欧美日韩久久| 国产日韩精品欧美一区喷| 久久综合伊人 六十路| 不卡无码网| 国产青青操| 亚洲国内精品自在自线官| 日本免费新一区视频| 欧美a级在线| 99视频在线免费| 久久婷婷六月| 秋霞国产在线| 亚洲色精品国产一区二区三区| 原味小视频在线www国产| 国产99免费视频| 久久综合五月| 免费毛片视频| 2024av在线无码中文最新| 国内精品小视频在线| 99热国产这里只有精品无卡顿"| 国产激情影院| 亚洲人成网站观看在线观看| 国产第三区| 亚洲精品免费网站| 国产91色| 久久综合婷婷| 女人爽到高潮免费视频大全| 99性视频| 久久精品波多野结衣| 亚洲第一成年人网站| 亚洲精品无码AV电影在线播放| 久久香蕉国产线看精品| 77777亚洲午夜久久多人| 日本免费a视频| 国产精品一线天| 日韩免费毛片| 精品99在线观看| 亚洲swag精品自拍一区| 国国产a国产片免费麻豆| 色国产视频| 久久鸭综合久久国产| 久久无码av三级| 丁香亚洲综合五月天婷婷| 日日摸夜夜爽无码| 久久精品国产亚洲麻豆| 色妞www精品视频一级下载| 久久黄色免费电影|