摘要:在進(jìn)行商務(wù)運(yùn)作當(dāng)中,數(shù)據(jù)倉庫可以提供相應(yīng)的工具和結(jié)構(gòu),從而能夠系統(tǒng)的使用、理解和組織數(shù)據(jù)進(jìn)行決策。通過對(duì)大量的組織機(jī)構(gòu)進(jìn)行研究了解,在迅速法和和競爭力強(qiáng)的世界當(dāng)中,數(shù)據(jù)倉庫是以具備一定價(jià)值的工具存在。本文通過對(duì)數(shù)據(jù)倉庫進(jìn)行相關(guān)探索研究,相信本文對(duì)數(shù)據(jù)倉庫的研究有著一定的現(xiàn)實(shí)意義。
關(guān)鍵詞:數(shù)據(jù)倉庫;商務(wù)運(yùn)作;集成
中圖分類號(hào):TP274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-7712 (2012) 06-0077-01
通常來說,對(duì)數(shù)據(jù)倉庫進(jìn)行建立的過程就是對(duì)數(shù)據(jù)倉庫進(jìn)行構(gòu)造和使用,在構(gòu)造數(shù)據(jù)倉庫時(shí)必須做到數(shù)據(jù)的統(tǒng)一、清理和集成。在對(duì)數(shù)據(jù)倉庫進(jìn)行利用的時(shí)候必須要借助于決策支持技術(shù),這就使得主管、經(jīng)理和分析人員等這些知識(shí)工人能對(duì)數(shù)據(jù)倉庫進(jìn)行使用,數(shù)據(jù)的總體視圖可以方便和快捷的得到,進(jìn)行決策的時(shí)候可以按照數(shù)據(jù)倉庫中的信息得出。有些研究者在進(jìn)行數(shù)據(jù)倉庫構(gòu)造的過程會(huì)選取術(shù)語“建立數(shù)據(jù)倉庫”來進(jìn)行標(biāo)示,使用和管理數(shù)據(jù)倉庫則選取術(shù)語“倉庫DBMS”標(biāo)示,在本文的研究中對(duì)兩者不進(jìn)行區(qū)分。目前已經(jīng)有很多的組織機(jī)構(gòu)進(jìn)行商務(wù)決策活動(dòng)的時(shí)候使用這些信息進(jìn)行支持,其主要內(nèi)容包括:對(duì)顧客關(guān)注度增加,包含購買時(shí)間、消費(fèi)習(xí)慣、購買愛好、預(yù)算周期等顧客購買模式進(jìn)行分析;依據(jù)地區(qū)、年度、季度等劃分對(duì)營銷情況做好比較,對(duì)管理投資和產(chǎn)品進(jìn)行重新配置,做好生產(chǎn)策略的調(diào)整;對(duì)利潤源進(jìn)行查找和對(duì)運(yùn)作進(jìn)行分析;做好顧客關(guān)系進(jìn)行管理,做好環(huán)境調(diào)整,進(jìn)行合股人的資產(chǎn)開銷情況進(jìn)行管理。立足于異種數(shù)據(jù)庫集成,這使得有著十分有效的作用在數(shù)據(jù)倉庫上。目前有著許多的組織對(duì)各種數(shù)據(jù)進(jìn)行收集,并且有著分布、自治和異種等數(shù)據(jù)源對(duì)大型數(shù)據(jù)庫進(jìn)行維護(hù)。通過對(duì)這些數(shù)據(jù)進(jìn)行集成,這就會(huì)有著很大的希望提供有效和簡便的訪問,這也可以作為機(jī)遇而存在。目前數(shù)據(jù)庫研究界和工業(yè)界都竭盡全力為實(shí)現(xiàn)這個(gè)目標(biāo)。
而集成異種數(shù)據(jù)庫,依據(jù)傳統(tǒng)的數(shù)據(jù)庫做法就是立足于多個(gè)異種數(shù)據(jù)庫,通過集成程序和包裝程序進(jìn)行建立。折疊門的例子主要包括Informix的數(shù)據(jù)刀和IBM的數(shù)據(jù)連接程序。當(dāng)有著查詢給客戶站點(diǎn)提交,首要的就是通過元數(shù)據(jù)字典轉(zhuǎn)換查詢,從而實(shí)現(xiàn)相應(yīng)異種站點(diǎn)上的查詢轉(zhuǎn)換。在此基礎(chǔ)上,映射和發(fā)送這些查詢到局部查詢處理器。集成不同站點(diǎn)所返回來的結(jié)果成為全局回答。而這種查詢驅(qū)動(dòng)的方法進(jìn)行信息過濾和集成處理顯得比較復(fù)雜,并且做到局部數(shù)據(jù)源上的競爭資源的處理。由于這種方法從功效上顯得比較低效,并且進(jìn)行頻繁查詢的時(shí)候,特別是在聚集操作查詢,要有著很大的開銷。
數(shù)據(jù)庫為傳統(tǒng)的異種數(shù)據(jù)庫集成方法提供者有趣替代方案,在數(shù)據(jù)庫當(dāng)中通過更新驅(qū)動(dòng)這種方法的使用,而擯棄以往的驅(qū)動(dòng)查詢的方法。這就使得出現(xiàn)預(yù)先集成在多個(gè)異種源的信息,并且在數(shù)據(jù)倉庫當(dāng)中進(jìn)行存儲(chǔ),以便提供進(jìn)行查詢和分析。和聯(lián)機(jī)事務(wù)處理數(shù)據(jù)庫進(jìn)行對(duì)比發(fā)現(xiàn)差異性是最近的信息不包含在數(shù)據(jù)倉庫當(dāng)中。但是數(shù)據(jù)倉庫能夠提供高性能在集成的異種數(shù)據(jù)庫系統(tǒng)當(dāng)中,這主要是由于拷貝、集成、預(yù)處理、注釋和匯總數(shù)據(jù),并且經(jīng)過重新的組織成為一個(gè)語義一致的數(shù)據(jù)進(jìn)行存儲(chǔ)。查詢?cè)跀?shù)據(jù)庫當(dāng)中部隊(duì)處理局部源產(chǎn)生影響。另外就是通過對(duì)歷史信息存儲(chǔ)和集成在數(shù)據(jù)倉庫當(dāng)中,對(duì)多維的復(fù)雜查詢進(jìn)行支持。這樣在工業(yè)界就非常流行進(jìn)行數(shù)據(jù)倉庫的建立。
通過與大家耳熟能詳?shù)纳唐逢P(guān)系數(shù)據(jù)庫系統(tǒng)進(jìn)行比較,就會(huì)對(duì)數(shù)據(jù)倉庫很容易進(jìn)行了解。對(duì)查詢處理和聯(lián)機(jī)事務(wù)進(jìn)行執(zhí)行這是聯(lián)機(jī)操作數(shù)據(jù)庫系統(tǒng)所具備的主要任務(wù)。通常將這種系統(tǒng)稱之為聯(lián)機(jī)事務(wù)處理系統(tǒng)。該系統(tǒng)通過對(duì)組織中的大部分諸如記賬、注冊(cè)、工資、銀行、制造、庫存、購買等日常操作。從另外的層面上來講,數(shù)據(jù)倉庫系統(tǒng)通過決策方面和數(shù)據(jù)分析使得服務(wù)于用戶或者是“知識(shí)工人”。而在這個(gè)體系當(dāng)中所使用不同的格式進(jìn)行數(shù)據(jù)的組織和提供,以便因用戶的不同從而不同需求的滿足。通常將這種系統(tǒng)稱為聯(lián)機(jī)分析處理系統(tǒng)。聯(lián)機(jī)事務(wù)處理系統(tǒng)也稱之為OLTP,聯(lián)機(jī)分析處理系統(tǒng)稱為OLAP,兩者之間的區(qū)別為:
一是用戶和系統(tǒng)的面向性:OLTP是面向顧客的,用于辦事員、客戶、和信息技術(shù)專業(yè)人員的事務(wù)和查詢處理。OLAP是面向市場的,用于知識(shí)工人(包括經(jīng)理、主管、和分析人員)的數(shù)據(jù)分析。
二是數(shù)據(jù)內(nèi)容:OLTP系統(tǒng)管理當(dāng)前數(shù)據(jù)。通常,這種數(shù)據(jù)太瑣碎,難以方便地用于決策。OLAP系統(tǒng)管理大量歷史數(shù)據(jù),提供匯總和聚集機(jī)制,并在不同的粒度級(jí)別上存儲(chǔ)和管理信息。這些特點(diǎn)使得數(shù)據(jù)容易用于見多識(shí)廣的決策。
三是數(shù)據(jù)庫設(shè)計(jì):通常,OLTP系統(tǒng)采用實(shí)體-聯(lián)系(ER)模型和面向應(yīng)用的數(shù)據(jù)庫設(shè)計(jì)。而OLAP系統(tǒng)通常采用星形或雪花模型和面向主題的數(shù)據(jù)庫設(shè)計(jì)。
四是視圖:OLTP系統(tǒng)主要關(guān)注一個(gè)企業(yè)或部門內(nèi)部的當(dāng)前數(shù)據(jù),而不涉及歷史數(shù)據(jù)或不同組織的數(shù)據(jù)。相比之下,由于組織的變化,OLAP系統(tǒng)常常跨越數(shù)據(jù)庫模式的多個(gè)版本。OLAP系統(tǒng)也處理來自不同組織的信息,由多個(gè)數(shù)據(jù)存儲(chǔ)集成的信息。由于數(shù)據(jù)量巨大,OLAP數(shù)據(jù)也存放在多個(gè)存儲(chǔ)介質(zhì)上。
五是訪問模式:OLTP系統(tǒng)的訪問主要由短的、原子事務(wù)組成。這種系統(tǒng)需要并行控制和恢復(fù)機(jī)制。然而,對(duì)OLAP系統(tǒng)的訪問大部分是只讀操作(由于大部分?jǐn)?shù)據(jù)倉庫存放歷史數(shù)據(jù),而不是當(dāng)前數(shù)據(jù)),盡管許多可能是復(fù)雜的查詢。
OLTP和OLAP的其它區(qū)別包括數(shù)據(jù)庫大小、操作的頻繁程度、性能度量等。