文|朱煥亮,張佩民
企業(yè)數(shù)據(jù)架構(gòu)規(guī)劃和治理淺析
文|朱煥亮,張佩民
在闡述數(shù)據(jù)架構(gòu)的定義之前,先明確復(fù)雜組織體的概念。
TOGAF將“復(fù)雜組織體”定義為具有一系列共同目標(biāo)的組織集合。一個(gè)復(fù)雜組織體可能是政府機(jī)構(gòu)或者整個(gè)公司,當(dāng)今的擴(kuò)展型復(fù)雜組織體往往還包括合作伙伴、供應(yīng)商和客戶等。復(fù)雜組織體架構(gòu)是根據(jù)復(fù)雜組織體戰(zhàn)略架構(gòu),站在全業(yè)務(wù)視角的信息化的總體設(shè)計(jì),屬于頂層設(shè)計(jì)。
復(fù)雜組織體架構(gòu)包括四個(gè)架構(gòu)域:業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)、應(yīng)用架構(gòu)和技術(shù)架構(gòu)。
◆ 業(yè)務(wù)架構(gòu)定義業(yè)務(wù)策略、治理、組織和關(guān)鍵業(yè)務(wù)流程。
◆ 數(shù)據(jù)架構(gòu)是對復(fù)雜組織體的主要數(shù)據(jù)類型及來源、邏輯數(shù)據(jù)資產(chǎn)、物理數(shù)據(jù)資產(chǎn)以及數(shù)據(jù)管理資源的結(jié)構(gòu)及交互的描述。
◆ 應(yīng)用架構(gòu)提供包含待部署的獨(dú)立應(yīng)用、應(yīng)用之間交互及其與組織的核心業(yè)務(wù)流程間的關(guān)系的藍(lán)圖。
◆ 技術(shù)架構(gòu)描述支持業(yè)務(wù)、數(shù)據(jù)和應(yīng)用服務(wù)部署所需的邏輯的軟件與硬件能力。這包括IT基礎(chǔ)設(shè)施、中間件、網(wǎng)絡(luò)、通信、處理和標(biāo)準(zhǔn)等。
數(shù)據(jù)架構(gòu)規(guī)劃是企業(yè)對數(shù)據(jù)架構(gòu)比較全面長遠(yuǎn)的發(fā)展計(jì)劃,是對未來整體性、長期性、基本性問題的思考和考量,也是設(shè)計(jì)數(shù)據(jù)相關(guān)活動的方案。數(shù)據(jù)架構(gòu)規(guī)劃的目標(biāo)是為了實(shí)現(xiàn)企業(yè)數(shù)據(jù)的規(guī)范化、一致性、準(zhǔn)確性和完整性,并在此基礎(chǔ)上,充分挖掘數(shù)據(jù)的價(jià)值,有效支持企業(yè)的數(shù)據(jù)管理和經(jīng)營決策分析。
數(shù)據(jù)架構(gòu)治理是開展數(shù)據(jù)架構(gòu)規(guī)劃必需的原則、規(guī)范、規(guī)則和決策程序等,具體體現(xiàn)為數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)治理組織、管控流程和技術(shù)工具等。
中國企業(yè)信息化經(jīng)歷了三十多年的快速發(fā)展,這三十年的發(fā)展,積累了很多的經(jīng)驗(yàn),也產(chǎn)生了很多的教訓(xùn)。隨著信息化建設(shè)的快速發(fā)展,很多企業(yè)都面臨著越來越多的數(shù)據(jù)方面的問題。這些問題包括:
缺乏全業(yè)務(wù)視角的數(shù)據(jù)總體設(shè)計(jì)。很多所謂的信息系統(tǒng)實(shí)際上是一些互不關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)和程序的堆砌,盡管企業(yè)信息系統(tǒng)繁多,但數(shù)據(jù)被分散在眾多應(yīng)用系統(tǒng)之間,信息孤島林立,核心業(yè)務(wù)覆蓋不完整;數(shù)據(jù)集成共享困難,數(shù)據(jù)核對、清理、映射工作量巨大,集成成本高。
缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。企業(yè)內(nèi)數(shù)據(jù)入口眾多,數(shù)據(jù)標(biāo)準(zhǔn)、規(guī)則不一致,關(guān)鍵基礎(chǔ)數(shù)據(jù)被多頭管理,數(shù)據(jù)分散混亂質(zhì)量差,數(shù)據(jù)過時(shí)和數(shù)據(jù)缺失的情況普遍存在。嚴(yán)重影響了業(yè)務(wù)報(bào)表、統(tǒng)計(jì)、分析的準(zhǔn)確性,使寶貴的數(shù)據(jù)資源無法得到高效利用。
缺乏有效的數(shù)據(jù)治理機(jī)制。很多企業(yè)還沒有建立完整的數(shù)據(jù)規(guī)范、管控流程和技術(shù)工具來確保數(shù)據(jù)的有效性、一致性、準(zhǔn)確性。治理的缺失加重了管理的混亂,影響了信息系統(tǒng)的擴(kuò)充能力,也無法快速滿足業(yè)務(wù)發(fā)展的要求。
綜上所述,對很多企業(yè)來說,低質(zhì)量的數(shù)據(jù)資產(chǎn)已經(jīng)成為信息化與業(yè)務(wù)深度融合過程中的關(guān)鍵制約因素。
數(shù)據(jù)架構(gòu)規(guī)劃是全局性、基礎(chǔ)性構(gòu)想,因此它對于統(tǒng)一企業(yè)核心業(yè)務(wù)概念,規(guī)范數(shù)據(jù)模型,在數(shù)據(jù)層面達(dá)成統(tǒng)一認(rèn)知能夠起到重要的作用,這將為充分利用和挖掘數(shù)據(jù)價(jià)值打牢基礎(chǔ)。數(shù)據(jù)架構(gòu)能夠指導(dǎo)企業(yè)進(jìn)行數(shù)據(jù)存儲、訪問、整合和分析;其內(nèi)容需要包含數(shù)據(jù)的靜態(tài)架構(gòu),如數(shù)據(jù)模型、數(shù)據(jù)、DBMS及其相關(guān)軟件、硬件和網(wǎng)絡(luò)基礎(chǔ)設(shè)施等,又包含數(shù)據(jù)的動態(tài)架構(gòu),如數(shù)據(jù)整理、清洗、轉(zhuǎn)換和傳輸,數(shù)據(jù)集成,信息訪問服務(wù)等。因此數(shù)據(jù)架構(gòu)的內(nèi)容要包含數(shù)據(jù)定義、數(shù)據(jù)管理、數(shù)據(jù)使用、數(shù)據(jù)治理四個(gè)方面。數(shù)據(jù)架構(gòu)內(nèi)容模型如圖1所示。
◆ 數(shù)據(jù)定義是數(shù)據(jù)架構(gòu)中的基礎(chǔ)內(nèi)容,描述了業(yè)務(wù)對象及其關(guān)系、模型、特性、約束、分析規(guī)則等;
◆ 數(shù)據(jù)管理描述了數(shù)據(jù)架構(gòu)規(guī)劃中對于數(shù)據(jù)管理、數(shù)據(jù)維護(hù)方面的內(nèi)容;
◆ 數(shù)據(jù)使用包含數(shù)據(jù)在企業(yè)范圍內(nèi)、外使用的情況,對于大多數(shù)應(yīng)用系統(tǒng)來說,它們一方面是數(shù)據(jù)服務(wù)的提供者,一方面又是數(shù)據(jù)服務(wù)的使用者;
◆ 數(shù)據(jù)治理包括為了規(guī)范數(shù)據(jù)標(biāo)準(zhǔn)、提高數(shù)據(jù)質(zhì)量和保證數(shù)據(jù)安全而建立的標(biāo)準(zhǔn)、規(guī)范、流程、工具和評價(jià)考核體系等。
數(shù)據(jù)架構(gòu)規(guī)劃工作方法包括:參考數(shù)據(jù)架構(gòu)的原則,在深入分析數(shù)據(jù)架構(gòu)現(xiàn)狀的基礎(chǔ)上,結(jié)合企業(yè)需求,借鑒行業(yè)先進(jìn)實(shí)踐,根據(jù)企業(yè)的實(shí)際情況裁剪數(shù)據(jù)架構(gòu)內(nèi)容模型、配置數(shù)據(jù)治理機(jī)制,進(jìn)行目標(biāo)數(shù)據(jù)架構(gòu)的規(guī)劃。如圖2所示。

圖1 數(shù)據(jù)架構(gòu)內(nèi)容模型

圖2 數(shù)據(jù)架構(gòu)規(guī)劃的工作方法
數(shù)據(jù)架構(gòu)規(guī)劃過程的本質(zhì)是設(shè)計(jì)過程,設(shè)計(jì)存在根據(jù)具體場景進(jìn)行調(diào)整、適應(yīng)和妥協(xié)的情況;在數(shù)據(jù)架構(gòu)規(guī)劃過程中進(jìn)行適應(yīng)、妥協(xié)時(shí),需要依據(jù)數(shù)據(jù)架構(gòu)原則決策。因此企業(yè)在開展數(shù)據(jù)架構(gòu)規(guī)劃時(shí),應(yīng)該制定適合企業(yè)實(shí)際情況的數(shù)據(jù)架構(gòu)原則,例如:
(一)靈活性原則:數(shù)據(jù)架構(gòu)要充分考慮靈活性,滿足企業(yè)內(nèi)不同的業(yè)務(wù)需求,并適應(yīng)業(yè)務(wù)的變更;
(二)高效性原則:保證數(shù)據(jù)校驗(yàn)、加載、遷移、加工的高效性,支持?jǐn)?shù)據(jù)服務(wù)的快速生成;
(三)可擴(kuò)展性原則:數(shù)據(jù)架構(gòu)需要考慮未來的可擴(kuò)展性,減少需求變更對數(shù)據(jù)架構(gòu)的沖擊。
數(shù)據(jù)架構(gòu)規(guī)劃主要依據(jù)數(shù)據(jù)架構(gòu)規(guī)劃工作方法展開,可以分為數(shù)據(jù)需求要點(diǎn)收集、數(shù)據(jù)架構(gòu)現(xiàn)狀分析、數(shù)據(jù)架構(gòu)內(nèi)容模型裁剪、目標(biāo)數(shù)據(jù)架構(gòu)規(guī)劃四部分。其中數(shù)據(jù)需求要點(diǎn)收集、數(shù)據(jù)架構(gòu)內(nèi)容模型裁剪與具體的架構(gòu)愿景有關(guān),不再詳述;主要闡述數(shù)據(jù)架構(gòu)現(xiàn)狀分析和目標(biāo)數(shù)據(jù)架構(gòu)規(guī)劃的方法。
在進(jìn)行目標(biāo)數(shù)據(jù)架構(gòu)規(guī)劃之前,深入進(jìn)行現(xiàn)狀分析是非常重要的,通過現(xiàn)狀分析可以摸清企業(yè)數(shù)據(jù)架構(gòu)和數(shù)據(jù)資源“家底”,發(fā)現(xiàn)存在的問題,并籍此明確未來的改進(jìn)方向。
數(shù)據(jù)架構(gòu)現(xiàn)狀分析可以通過現(xiàn)狀調(diào)研、資料分析、業(yè)務(wù)訪談、同行比較等途徑實(shí)現(xiàn)。現(xiàn)狀分析結(jié)合數(shù)據(jù)架構(gòu)內(nèi)容模型,以發(fā)現(xiàn)問題、理解問題、分析問題為主。數(shù)據(jù)架構(gòu)現(xiàn)狀分析的問題和數(shù)據(jù)架構(gòu)改進(jìn)方向,將成為未來數(shù)據(jù)架構(gòu)規(guī)劃的重要依據(jù)和輸入。
數(shù)據(jù)架構(gòu)現(xiàn)狀分析建議包括的內(nèi)容如表1所示。

表1 數(shù)據(jù)架構(gòu)現(xiàn)狀分析建議包含的內(nèi)容

2.0. 主題域分析主題域是較高層次上的對業(yè)務(wù)的抽象和歸納,主題域劃分應(yīng)該考慮業(yè)務(wù)的可擴(kuò)展性。通過主題域分析、主題分析、數(shù)據(jù)實(shí)體關(guān)系的分析,形成現(xiàn)狀的“數(shù)據(jù)實(shí)體目錄(Data Entity Directory)”和“數(shù)據(jù)實(shí)體關(guān)系圖(Data Entity Relation Diagram)”2.1. 主題分析主題是同一主題域內(nèi),按照業(yè)務(wù)特性進(jìn)行的進(jìn)一步的細(xì)分。2.2. 數(shù)據(jù)實(shí)體關(guān)系分析梳理數(shù)據(jù)實(shí)體關(guān)系有助于理清數(shù)據(jù)、約束流轉(zhuǎn)關(guān)系等。3.0. 數(shù)據(jù)分布現(xiàn)狀分析通過對現(xiàn)有應(yīng)用系統(tǒng)的梳理,理清數(shù)據(jù)實(shí)體在現(xiàn)有應(yīng)用和數(shù)據(jù)庫中的分布情況。形成現(xiàn)狀的“數(shù)據(jù)/應(yīng)用矩陣(Data /Application Matrix)”和現(xiàn)狀的“數(shù)據(jù)/數(shù)據(jù)庫矩陣(Data /Database Matrix)”,并形成數(shù)據(jù)的物理模型圖,倒推概念模型圖。數(shù)據(jù)分布現(xiàn)狀分析,有助于理清現(xiàn)有業(yè)務(wù)和信息系統(tǒng)的對應(yīng)情況,掌握第一手的數(shù)據(jù)模型資料,發(fā)現(xiàn)數(shù)據(jù)源及數(shù)據(jù)副本,掌握企業(yè)數(shù)據(jù)冗余情況,發(fā)現(xiàn)有歧義的業(yè)務(wù)對象等。4.0. 數(shù)據(jù)流轉(zhuǎn)現(xiàn)狀分析由于缺乏完善、良好的數(shù)據(jù)架構(gòu)規(guī)劃,很多企業(yè)“因事設(shè)庫”現(xiàn)象比較突出。通過數(shù)據(jù)流轉(zhuǎn)分析,可以發(fā)現(xiàn)數(shù)據(jù)加載、整合、變動、遷移、流動的鏈條;不合理的鏈條會影響業(yè)務(wù)效率,并增加出錯(cuò)的幾率。通過數(shù)據(jù)流轉(zhuǎn)現(xiàn)狀分析,形成現(xiàn)狀的“跨系統(tǒng)數(shù)據(jù)流圖(Cross System Data Flow Diagram)”5.0. 數(shù)據(jù)處理現(xiàn)狀分析數(shù)據(jù)處理現(xiàn)狀分析可以從數(shù)據(jù)源層、數(shù)據(jù)交換層、數(shù)據(jù)基礎(chǔ)層、數(shù)據(jù)加工層和應(yīng)用層幾個(gè)方面來進(jìn)行。5.1. 數(shù)據(jù)采集現(xiàn)狀分析數(shù)據(jù)采集現(xiàn)狀分析分為數(shù)據(jù)生成、報(bào)送和上傳的現(xiàn)狀,包括采集的分類、數(shù)據(jù)的類型、生成數(shù)據(jù)大小、采集的頻率和傳輸方式等內(nèi)容。形成現(xiàn)狀的“數(shù)據(jù)采集信息表(Data Acquisition Information List)”。數(shù)據(jù)采集信息有助于理清數(shù)據(jù)源頭,包括數(shù)據(jù)的創(chuàng)建源頭和生成源頭。5.2. 數(shù)據(jù)加載現(xiàn)狀分析除統(tǒng)計(jì)分析類系統(tǒng)外,系統(tǒng)之間的數(shù)據(jù)批量加載行為,意味著其耦合度較高。形成現(xiàn)狀的“數(shù)據(jù)加載情況表(Data Loading Situation List)”,可指導(dǎo)未來的應(yīng)用系統(tǒng)設(shè)計(jì)調(diào)整。

5.3. 數(shù)據(jù)加工現(xiàn)狀分析數(shù)據(jù)加工現(xiàn)狀關(guān)注數(shù)據(jù)的加工和整合過程,涵蓋數(shù)據(jù)編碼、數(shù)據(jù)內(nèi)容變換、數(shù)據(jù)放大、數(shù)據(jù)合并等,主要用于主數(shù)據(jù)和核心業(yè)務(wù)數(shù)據(jù)的分析。形成現(xiàn)狀的“數(shù)據(jù)加工情況表(Data Processing List)”。5.4. 數(shù)據(jù)遷移現(xiàn)狀分析數(shù)據(jù)遷移是一種離線存儲與在線存儲融合的技術(shù),在數(shù)據(jù)的全生命周期管理過程中,有可能涉及多次數(shù)據(jù)遷移過程。形成現(xiàn)狀的“數(shù)據(jù)遷移情況表(Data Migration List)”,有助于快速理解和掌握數(shù)據(jù)的生命周期階段。6.0. 數(shù)據(jù)治理現(xiàn)狀分析數(shù)據(jù)治理現(xiàn)狀分析一般可以從數(shù)據(jù)治理機(jī)制和數(shù)據(jù)治理領(lǐng)域兩個(gè)方面來進(jìn)行。數(shù)據(jù)治理機(jī)制包括政策、組織、流程和技術(shù)工具等;數(shù)據(jù)治理領(lǐng)域包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)安全等。6.1. 數(shù)據(jù)質(zhì)量管理現(xiàn)狀分析通過對數(shù)據(jù)質(zhì)量管理政策、數(shù)據(jù)質(zhì)量管理組織、數(shù)據(jù)質(zhì)量管理流程、數(shù)據(jù)質(zhì)量管理工具等的分析,形成現(xiàn)狀的“數(shù)據(jù)質(zhì)量管理報(bào)告(Data Quality Management Report)”。6.2. 數(shù)據(jù)標(biāo)準(zhǔn)管理現(xiàn)狀分析數(shù)據(jù)標(biāo)準(zhǔn)是企業(yè)級的定義,是企業(yè)所有系統(tǒng)都要遵守和執(zhí)行的數(shù)據(jù)標(biāo)準(zhǔn)。形成現(xiàn)狀的“數(shù)據(jù)標(biāo)準(zhǔn)管理報(bào)告(Data Standard Management Report)”。6.3. 數(shù)據(jù)安全管理現(xiàn)狀分析數(shù)據(jù)安全包括數(shù)據(jù)處理中保密設(shè)計(jì),傳輸及存儲中的加密、安全隔離,以及數(shù)據(jù)銷毀策略等。數(shù)據(jù)安全是不可逾越的紅線。形成現(xiàn)狀的“數(shù)據(jù)安全管理報(bào)告(Data Security Management Report)”。
通過上述的數(shù)據(jù)架構(gòu)現(xiàn)狀梳理,可以掌握比較全面的企業(yè)數(shù)據(jù)架構(gòu)問題,為進(jìn)一步的改進(jìn)和優(yōu)化做好準(zhǔn)備。
目標(biāo)數(shù)據(jù)架構(gòu)是企業(yè)未來的數(shù)據(jù)架構(gòu)藍(lán)圖,是企業(yè)信息化改造的方向;目標(biāo)數(shù)據(jù)架構(gòu)將幫助企業(yè)獲得更優(yōu)質(zhì)的數(shù)據(jù)資源,并從數(shù)據(jù)資源中挖掘更大的商業(yè)價(jià)值。目標(biāo)數(shù)據(jù)架構(gòu)規(guī)劃的要點(diǎn)在于:
1. 遵照企業(yè)業(yè)務(wù)戰(zhàn)略,統(tǒng)一進(jìn)行數(shù)據(jù)架構(gòu)規(guī)劃,建立企業(yè)范圍內(nèi)共同遵守、執(zhí)行的標(biāo)準(zhǔn)和規(guī)范;
2. 結(jié)合數(shù)據(jù)架構(gòu)內(nèi)容模型,以及現(xiàn)有數(shù)據(jù)架構(gòu)存在的問題,制定改進(jìn)的方向,在目標(biāo)數(shù)據(jù)架構(gòu)規(guī)劃中予以優(yōu)化;
3. 建立數(shù)據(jù)架構(gòu)治理機(jī)制,落實(shí)監(jiān)管,提升數(shù)據(jù)架構(gòu)各個(gè)層次的管控及協(xié)作能力,使優(yōu)化不斷持續(xù)進(jìn)行;
這里需要反復(fù)強(qiáng)調(diào)的是,一定要統(tǒng)一進(jìn)行數(shù)據(jù)架構(gòu)規(guī)劃,進(jìn)行全業(yè)務(wù)視角的總體設(shè)計(jì),而不是從單獨(dú)的項(xiàng)目或業(yè)務(wù)局部出發(fā);另外,數(shù)據(jù)架構(gòu)規(guī)劃是個(gè)持續(xù)的過程,應(yīng)該伴隨著企業(yè)的發(fā)展、及企業(yè)對數(shù)據(jù)的要求持續(xù)演進(jìn)。
由于企業(yè)內(nèi)的數(shù)據(jù)紛繁復(fù)雜,種類繁多;不同的企業(yè)面向不同的業(yè)務(wù)領(lǐng)域,數(shù)據(jù)特征差別很大,企業(yè)在進(jìn)行數(shù)據(jù)架構(gòu)規(guī)劃時(shí),往往會感覺千頭萬緒,問題眾多,無從下手。因此找準(zhǔn)合適的切入點(diǎn),明確著力點(diǎn),逐步理順和規(guī)劃顯得尤為重要。
通過分析電信、銀行的一些數(shù)據(jù)架構(gòu)規(guī)劃案例可以看出,數(shù)據(jù)架構(gòu)規(guī)劃可以按照不同的數(shù)據(jù)分類、不同的數(shù)據(jù)架構(gòu)目標(biāo)分階段、分步驟,循序漸進(jìn)的展開。一般來說,可以把數(shù)據(jù)架構(gòu)規(guī)劃過程分為這樣幾個(gè)階段:
1. 數(shù)據(jù)資源規(guī)劃階段:配合業(yè)務(wù)架構(gòu)過程,結(jié)合數(shù)據(jù)架構(gòu)內(nèi)容模型進(jìn)行初步梳理,結(jié)合企業(yè)發(fā)展戰(zhàn)略和未來需求,擬定數(shù)據(jù)架構(gòu)優(yōu)化設(shè)計(jì),指導(dǎo)未來IT建設(shè)。
2. 規(guī)范主數(shù)據(jù)管理階段:在數(shù)據(jù)資源規(guī)劃的成果基礎(chǔ)上,聚焦于標(biāo)準(zhǔn)化企業(yè)主數(shù)據(jù),統(tǒng)一規(guī)劃、平滑過渡、分步實(shí)施,建立企業(yè)主數(shù)據(jù)標(biāo)準(zhǔn),實(shí)現(xiàn)主數(shù)據(jù)的一致性、完整性、相關(guān)性和精確性。主數(shù)據(jù)管理可以增強(qiáng) IT 結(jié)構(gòu)的靈活性,構(gòu)建覆蓋整個(gè)企業(yè)范圍內(nèi)的數(shù)據(jù)管理基礎(chǔ)和相應(yīng)規(guī)范,并且更靈活地適應(yīng)企業(yè)業(yè)務(wù)需求的擴(kuò)展和變化。
3. 數(shù)據(jù)集成或信息集成階段:在企業(yè)主數(shù)據(jù)已經(jīng)標(biāo)準(zhǔn)化的基礎(chǔ)上,對企業(yè)信息系統(tǒng)不斷的、持續(xù)的進(jìn)行改造和優(yōu)化,使信息系統(tǒng)從功能、粒度、響應(yīng)速度等方面、更符合業(yè)務(wù)架構(gòu)快速發(fā)展的要求;信息系統(tǒng)的物理模型進(jìn)一步規(guī)范,符合企業(yè)級模型的要求;并通過數(shù)據(jù)集成和信息集成的規(guī)范、方法和工具,解決企業(yè)內(nèi)的信息孤島現(xiàn)象,使相關(guān)的多元信息有機(jī)融合并優(yōu)化使用。集成的核心是以數(shù)據(jù)資源作為大系統(tǒng),在規(guī)范的指導(dǎo)下,采取技術(shù)手段進(jìn)行整合,實(shí)現(xiàn)資源共享。
4. 商業(yè)智能階段:在數(shù)據(jù)資源整合的基礎(chǔ)上,充分利用數(shù)據(jù)的核心資產(chǎn)價(jià)值,應(yīng)用數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和分析、數(shù)據(jù)可視化分析、大數(shù)據(jù)等技術(shù),發(fā)揮信息化對業(yè)務(wù)的引領(lǐng)作用,增強(qiáng)企業(yè)的競爭力和領(lǐng)導(dǎo)層的決策能力,為客戶提供個(gè)性化服務(wù)。
由于數(shù)據(jù)架構(gòu)規(guī)劃一般要伴隨業(yè)務(wù)架構(gòu)規(guī)劃展開;并且是在企業(yè)信息化發(fā)展的特定階段和合適的時(shí)機(jī),才能釋放巨大的效力,所以根據(jù)企業(yè)的實(shí)際情況,選擇具體的階段和步驟,有側(cè)重點(diǎn)的開展工作,能夠取得較好的效果。
(1) 數(shù)據(jù)資源規(guī)劃階段
數(shù)據(jù)資源規(guī)劃適合于具有以下特點(diǎn)的企業(yè):
◆ 已經(jīng)擁有大量的信息系統(tǒng),卻從來沒有全面、有效梳理、規(guī)劃過企業(yè)的業(yè)務(wù)架構(gòu)和數(shù)據(jù)架構(gòu);
◆ 歷史上有關(guān)信息化的企業(yè)決策主要受軟件供應(yīng)商的營銷能力影響;
◆ 企業(yè)仍在持續(xù)快速發(fā)展,但I(xiàn)T無法與業(yè)務(wù)取得一致,IT成為企業(yè)戰(zhàn)略落地的阻礙。
對于這一類的企業(yè),在開展數(shù)據(jù)架構(gòu)規(guī)劃時(shí),應(yīng)首先側(cè)重于梳理企業(yè)的數(shù)據(jù)資源,了解基本面。通過數(shù)據(jù)資源規(guī)劃,在摸清核心業(yè)務(wù)數(shù)據(jù)現(xiàn)狀、數(shù)據(jù)模型及數(shù)據(jù)分布情況的基礎(chǔ)上,結(jié)合當(dāng)前的業(yè)務(wù)需求和未來的業(yè)務(wù)需求,重新定義符合企業(yè)發(fā)展戰(zhàn)略的數(shù)據(jù)模型,規(guī)劃數(shù)據(jù)分布,定義數(shù)據(jù)標(biāo)準(zhǔn),建設(shè)數(shù)據(jù)治理和數(shù)據(jù)管理組織,“盤活”數(shù)據(jù)資產(chǎn)。
數(shù)據(jù)資源規(guī)劃階段的輸出物包括以下內(nèi)容,如表2所示。

表2 數(shù)據(jù)資源規(guī)劃階段的輸出物
(2) 規(guī)范主數(shù)據(jù)管理階段
規(guī)范主數(shù)據(jù)管理適用于具有以下特點(diǎn)的企業(yè):
◆ 已經(jīng)進(jìn)行過數(shù)據(jù)資源規(guī)劃的全面梳理;
◆ 企業(yè)應(yīng)用架構(gòu)已經(jīng)能夠按照外部交互層、分析決策層、管理支持層、業(yè)務(wù)運(yùn)營層、內(nèi)部協(xié)作層五個(gè)層次進(jìn)行基本的劃分,業(yè)務(wù)系統(tǒng)雖然有能力重疊或覆蓋不全的問題,但基本上有著比較清晰的功能定位和特定的使用者。
主數(shù)據(jù)管理使企業(yè)能夠集中管理主數(shù)據(jù),在分散的系統(tǒng)間保證公共基礎(chǔ)數(shù)據(jù)的一致性、準(zhǔn)確性和完整性;增強(qiáng)快速部署新應(yīng)用、擴(kuò)展業(yè)務(wù)需求的能力,改善系統(tǒng)的業(yè)務(wù)敏捷性。主數(shù)據(jù)管理的任務(wù)就是從企業(yè)的業(yè)務(wù)數(shù)據(jù)中分離、整合公共基礎(chǔ)數(shù)據(jù),集中統(tǒng)一進(jìn)行主數(shù)據(jù)的清洗和整合,并且以服務(wù)的方式把統(tǒng)一的、完整的、準(zhǔn)確的、具有權(quán)威性的共享數(shù)據(jù)分發(fā)給企業(yè)范圍內(nèi)需要使用這些數(shù)據(jù)的交易型系統(tǒng)和分析型系統(tǒng)。
規(guī)范主數(shù)據(jù)管理階段的主要步驟包括:建立主數(shù)據(jù)管理標(biāo)準(zhǔn)、主數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、建立主數(shù)據(jù)管理組織、標(biāo)準(zhǔn)化主數(shù)據(jù)工作流程、構(gòu)建主數(shù)據(jù)管理系統(tǒng)及相關(guān)工具等。
(3) 數(shù)據(jù)集成或信息集成階段
對于進(jìn)入到數(shù)據(jù)集成或信息集成階段的企業(yè)來說,公共基礎(chǔ)數(shù)據(jù)已經(jīng)在企業(yè)范圍內(nèi)實(shí)現(xiàn)了標(biāo)準(zhǔn)化和一致性,伴隨著信息化系統(tǒng)的不斷改造和完善,IT技術(shù)創(chuàng)新與企業(yè)業(yè)務(wù)創(chuàng)新相融合。在這種情況下,以數(shù)據(jù)資源作為大系統(tǒng),在規(guī)范的指導(dǎo)下,采取技術(shù)手段進(jìn)行整合,實(shí)現(xiàn)資源共享,將會釋放數(shù)據(jù)作為企業(yè)核心資源的價(jià)值。
這一階段的主要步驟包括:建立企業(yè)范圍內(nèi)的數(shù)據(jù)集成規(guī)范和標(biāo)準(zhǔn)、構(gòu)建數(shù)據(jù)集成平臺或信息集成平臺等。
(4) 商業(yè)智能階段
商業(yè)智能幫助數(shù)據(jù)使用者把數(shù)據(jù)轉(zhuǎn)換成具有商業(yè)價(jià)值的、可以快速獲取的信息和知識;并以適當(dāng)?shù)男问胶蜁r(shí)機(jī),傳遞給數(shù)據(jù)使用者。從技術(shù)的角度來說,商業(yè)智能是綜合利用大數(shù)據(jù)、數(shù)據(jù)倉庫、數(shù)據(jù)分析和挖掘等技術(shù),以抽取、轉(zhuǎn)換、查詢、運(yùn)算、分析和預(yù)測為主要方法,幫助企業(yè)完成決策分析的解決方案。
影響商業(yè)智能項(xiàng)目成功的因素很多,但分析一些失敗的商業(yè)智能項(xiàng)目案例,可以發(fā)現(xiàn)失敗的商業(yè)智能項(xiàng)目具有這樣一些特點(diǎn):
◆ 數(shù)據(jù)挖掘和分析所需的大量的數(shù)據(jù)來自不同的業(yè)務(wù)系統(tǒng);而不同業(yè)務(wù)系統(tǒng)之間業(yè)務(wù)對象概念不統(tǒng)一,含義不一致,造成數(shù)據(jù)混亂、質(zhì)量低下,影響數(shù)據(jù)分析的準(zhǔn)確性;
◆ 基礎(chǔ)數(shù)據(jù)不規(guī)范、不統(tǒng)一、不完整,造成數(shù)據(jù)抽取和集成困難;
◆ 企業(yè)應(yīng)用的數(shù)據(jù)集成能力薄弱,商業(yè)智能項(xiàng)目中的大量時(shí)間和資金用于解決最基礎(chǔ)的數(shù)據(jù)集成問題;
從以上造成商業(yè)智能項(xiàng)目失敗的原因可以看出,要想讓數(shù)據(jù)資源產(chǎn)生價(jià)值,完成高質(zhì)量的數(shù)據(jù)資源規(guī)劃梳理、建設(shè)主數(shù)據(jù)管理規(guī)范和數(shù)據(jù)集成機(jī)制仍然是非常基本、非常重要的必修課;數(shù)據(jù)架構(gòu)規(guī)劃過程需要一步一個(gè)腳印的扎實(shí)推進(jìn)。
對于企業(yè)而言,真實(shí)的數(shù)據(jù)架構(gòu)也許從來都不是完美的。數(shù)據(jù)架構(gòu)規(guī)劃內(nèi)容模型和數(shù)據(jù)架構(gòu)規(guī)劃工作方法,提供了一致的模型和方法來幫助企業(yè)聚焦數(shù)據(jù)架構(gòu)關(guān)注點(diǎn)、定位數(shù)據(jù)架構(gòu)中存在的各種問題,進(jìn)而改進(jìn)或優(yōu)化數(shù)據(jù)架構(gòu)。為了避免風(fēng)險(xiǎn)和重復(fù)投資,企業(yè)信息化發(fā)展到一定的階段,尤其是大型企業(yè),對IT建設(shè)進(jìn)行長期和短期規(guī)劃是必要的。數(shù)據(jù)架構(gòu)規(guī)劃內(nèi)容模型和數(shù)據(jù)架構(gòu)工作方法可以為企業(yè)數(shù)據(jù)架構(gòu)的規(guī)劃提供方向性指導(dǎo);另外,在數(shù)據(jù)架構(gòu)規(guī)劃過程中,企業(yè)應(yīng)根據(jù)自身的實(shí)際情況,分階段、有側(cè)重點(diǎn)的踏實(shí)推進(jìn)。
朱煥亮,中航工業(yè)信息技術(shù)中心研發(fā)中心;張佩民,金航數(shù)碼西安公司