999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

充分運用ETL工具,構建完整的數據倉庫體系結構

2015-05-30 00:38:44潘敏
科技創新與應用 2015年17期
關鍵詞:數據處理

潘敏

摘 要:隨著信息技術的發展和大量業務數據的積累,數據倉庫的開發建設受到越來越多的關注和重視。但是,數據倉庫涉及到很多計算機理論和技術,而且在設計、規劃和實施等階段中,也會遇到各種困難和風險。文章針對數據存儲和處理這個關鍵環節,來介紹構建完整的企業級數據倉庫將面臨的技術難點,并根據實際項目經驗,給出如何利用ETL工具解決問題的實踐思路和方法。

關鍵詞:數據倉庫;數據處理;ETL;ODI;接口

1 數據倉庫的體系結構

數據倉庫是面向主題的、集成的、相對穩定的、反映歷史變化的數據集合。它通常是指一個數據環境,通過提供當前和歷史數據來輔助決策支持。數據倉庫的組成部分有:數據倉庫數據庫、ETL工具、元數據、訪問工具、數據集市、數據倉庫管理等。通過對多個異構數據源進行有效的集成,并按照應用主題進行數據重組和展示,就形成了數據倉庫系統。由此,根據應用需求的不同,數據倉庫的體系結構可以分為以下四種:

(1)兩層結構:源數據系統經過處理直接加載到數據倉庫;(2)獨立型數據集市:加工成多個獨立的數據集市來滿足多種應用需求;(3)依賴型數據集市和操作型數據存儲:完整的數據倉庫,多個源數據系統先集成到操作型數據存儲(ODS),再轉換、加載到數據倉庫,最后形成部門級數據集市。文章描述的就是此體系結構的構建過程。它的特點是:整合多個復雜的源數據系統;實現各種復雜的數據轉換處理;提供多層次的數據訪問;滿足多部門的即獨立又交叉的應用需求;(4)邏輯型數據集市和實時數據倉庫:沒有獨立的數據集市,體現數據加工的實時性。

2 數據倉庫的ETL過程

ETL過程是數據加工處理過程的統稱,包括三個部分:抽取、轉換和加載。它的目的是為決策支持應用提供一個單一的、權威的數據源。數據倉庫的ETL過程是整個系統實施的關鍵環節,關系到數據倉庫的建設成效。無論從理論上還是從實踐上來說,運用ETL工具是一個必需的、明智的選擇。文章以Oracle公司的軟件產品ODI 11g來講解。

3 ETL的技術難點

數據倉庫的數據存儲有四個層次,即源數據系統、ODS、企業級數據倉庫和數據集市。運用ETL工具就是實現數據在這四個層次中逐層遞進的三級加工處理過程。雖然每一級處理都具有抽取、轉換、加載的處理,但是它們的側重點還是有區別的。

(1)源數據系統到ODS過程:將多個異構數據源集成到統一的數據集結區ODS,重點是抽取處理,兼有字符集轉換、數據類型轉換等處理。(2)ODS到企業級數據倉庫過程:將操作型數據轉換成事件型數據,重點是轉換處理,包含清洗、調和、導出、匹配、合并等多種復雜處理。(3)企業級數據倉庫到數據集市過程:將數據按照應用需求進行組合,重點是加載處理,還涉及到索引、更新等處理。

下面,結合三級處理,從四個方面描述常見的技術難點及應對。

3.1 數據抽取

(1)靜態抽取:為了保證源數據的一致性和完整性,應該抽取操作型數據相關的代碼數據和編碼數據。這些數據特點是量小,變化小,可以采用全量刷新方法。ODI工具中,編制一個接口,指定源表和目標表,確定LKM和IKM,即可實現。此方法也適用于初次抽取操作型數據。(2)增量抽取:源數據系統包含大量的業務數據,必須通過增量更新的方法才能做到有效的抽取。因此,增量更新問題是一個最重要、最根本的技術問題。ODI工具內置的變化數據捕獲機制(CDC)能有效地解決這個問題。實現思路如下:為源表指定日記知識模塊JKM;將源表添加到CDC列表,并啟動日記;編制接口時,勾選日記記錄的數據,并指定增量模式的IKM。此外,還可以通過編制ODI過程代碼來利用現有的物化視圖實現增量更新。

3.2 數據轉換

(1)關鍵維度的統一:多個源數據系統集成后,首先面臨的問題就是關鍵維度的統一。不同的業務系統有各自不同的關鍵維度(如納稅人識別號,納稅人電子檔案號),這就必須統一到唯一的維度。解決這個問題,可以采用對照表的方法。實現思路如下:選定主要的、核心的業務系統的關鍵維度;以此維度為主,建立其他業務系統的維度對照表;ODI工具中,編寫接口時,增加連接維度對照表,增加字段映射。

(2)數據表的合并:業務系統中可能存在同一事件信息存儲于不同的數據表中的情況。ETL過程需要將分散的數據轉換到一個數據表。雖然可以編寫多個ODI接口實現,但是不可避免地存在數據完整性風險,且編制繁瑣、執行效率低下。建議采用多個源數據集來實現,思路如下:在ODI接口中,配置多個源數據集,并設置數據集的順序和關系;以第一順序數據集為主,分別設置目標數據項映射關系;指定帶有多數據集功能的標準LKM和IKM。

(3)數據表的拆分:業務系統的單一數據表中可能包含同一維度下的不同粒度的數據,這時就需要將源表數據拆分成多個目標表。常見的情況是,納稅人財務報表數據表中同時包含月報、季報和年報。由于ODI 11G版本中限定每一個接口只能有一個目標數據存儲,所以必須采用新的方法來處理。這里,介紹兩種方法來實現。a.編制多個接口,封裝在一個程序包中。步驟如下:分別編制多個接口對應多個目標表,將最后一個接口的“清除日記表”選項設置為真,其余接口該項為假;建立程序包,按順序導入這批接口。b.改造標準IKM,添加插入數據步驟。步驟如下:編制普通的ODI接口,實現一個目標表的加工;模擬執行接口,并分析執行語句和順序;獲取與目標表相關的語句;復制IKM,并編輯,按照原目標表語句增加其余目標表的執行步驟;指定新的IKM。此方法優點是執行效率高,缺點是改造IKM需要一定的技術儲備,且增加了項目的整體復雜度。

(4)最新有效數據的問題:分析源數據系統的業務規則時,會發現有多次記錄業務操作數據的情況,例如更正申報。這就要求在數據轉換時,應以操作時間最新或者操作序號最大的記錄作為有效數據。解決的方法有兩種:a.編寫2個接口,利用臨時表存儲最新操作時間或最大操作序號,然后再關聯源表數據,最后將2個接口依次導入程序包。b.改造IKM接口,增加2個新步驟,修改1個原步驟,具體如下:新增步驟-創建臨時表;新增步驟-在臨時表中插入滿足業務邏輯的最新有效憑據(時間或序號);修改步驟-在目標表中插入關聯到臨時表的源表數據。

3.3 數據加載

(1)創建目標表主鍵:雖然在接口中可以指定目標表的主鍵,但是標準的ODI處理并不能自動生成該主鍵。為此,改造IKM來實現這個重要功能:選擇適當的IKM,為其增加一個選項,并指定類型和默認值;在原IKM步驟中,增加一個創建主鍵的新步驟,并在此步驟的選項欄次中勾選新增選項。

此方法的原理是通過一個自定義選項來控制IKM的邏輯判斷,由用戶通過配置來決定是否執行此步驟。

(2)實現增量的全量加載在企業級數據倉庫和數據集市中,常常需要對不同粒度的數據進行加載,例如將月度數據加載到年度分析中。為此,文章提出以增量的全量方式加載數據,提高效率。具體思路如下:獲取增量中所有的月度;刪除目標表中包含這些月度的年度數據;重新獲取源表中包含這些月度的數據,并加工成年度數據;加載年度數據到目標表。

數據倉庫是包含一系列理論和技術的綜合環境,它的目的是為數據分析和決策支持提供歷史的、豐富的、可用的數據。由此,數據的存儲和處理也緊緊圍繞這一目的而展開。在這個過程中,工具軟件有著不可替代的重要作用。很多開發建設理念就集成在工具軟件的應用中。只有充分理解其基礎功能,將其不斷改造完善,才能使這些理念和規則落地,支撐起整個數據倉庫。

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 无码乱人伦一区二区亚洲一| 亚洲日韩每日更新| 国产精品综合久久久| 一级毛片基地| 国产微拍一区二区三区四区| 国产区人妖精品人妖精品视频| 91成人在线免费视频| 精品少妇三级亚洲| 久久精品亚洲专区| 欧美色99| 国产真实乱子伦精品视手机观看| 国产综合在线观看视频| 国产在线98福利播放视频免费| 欧美色亚洲| 伊人激情综合网| 国产亚洲美日韩AV中文字幕无码成人| 亚洲成人www| 久久99国产乱子伦精品免| 国产精品人成在线播放| 人人妻人人澡人人爽欧美一区| 91在线丝袜| 亚洲国产AV无码综合原创| 亚洲综合婷婷激情| 好吊妞欧美视频免费| 国产97公开成人免费视频| 99热最新在线| 免费在线不卡视频| 国产十八禁在线观看免费| 在线精品亚洲国产| 亚洲91精品视频| 波多野结衣亚洲一区| 婷婷午夜影院| 亚洲嫩模喷白浆| 人妻无码中文字幕第一区| 久久久久久久97| 国产福利免费视频| 2019国产在线| 欧美日韩在线成人| 91啦中文字幕| 亚洲午夜久久久精品电影院| 国产噜噜噜视频在线观看 | 精品国产欧美精品v| 国产va视频| 成年人视频一区二区| 中文字幕亚洲综久久2021| 大学生久久香蕉国产线观看| 色欲色欲久久综合网| 99re经典视频在线| 国产精品99在线观看| av天堂最新版在线| 国产网站免费观看| 日韩国产 在线| 毛片基地视频| 在线永久免费观看的毛片| 国产成人艳妇AA视频在线| 欧美人在线一区二区三区| yjizz视频最新网站在线| 超碰aⅴ人人做人人爽欧美 | 国产成人亚洲精品色欲AV| 欧洲免费精品视频在线| 国产呦精品一区二区三区下载| 一个色综合久久| 国产在线一区二区视频| 国产无码性爱一区二区三区| 亚瑟天堂久久一区二区影院| 日本在线亚洲| 国产91色在线| jijzzizz老师出水喷水喷出| 久久黄色一级片| 国产成人1024精品| 免费三A级毛片视频| 玖玖精品在线| 亚洲日本中文字幕乱码中文 | 国产欧美中文字幕| 国产91成人| 亚洲综合九九| 国产福利影院在线观看| 国产91视频免费观看| 成人免费网站久久久| 91福利片| 伊人久久婷婷| 伊人蕉久影院|