范葉平
?
企業級數據中心優化治理體系的研究與應用
范葉平
摘要:數據逐步成為企業的核心資產,企業管理的核心是決策,而決策的依據是數據,只有準確掌握企業核心信息和數據,才能為企業的生產運營狀況掌舵。針對數據中心資源管理及應用現狀,以數據中心資源為研究對象,通過分析產生數據質量問題的原因,提出數據中心優化治理目標,明確數據管理職責,最終從組織、標準、管理和技術4方面構建數據中心優化治理體系模型,加強數據中心數據管控的執行力,形成公司數據管控常態化運作機制,保障數據中心的數據質量,充分發揮數據中心數據資產的價值,提升數據中心的服務能力。
關鍵詞:治理體系;數據管控;數據質量;數據資產
國家“十一五、十二五”計劃期間電力企業信息化取得了跨越式發展,建成了一體化企業級集成平臺,搭建數據中心軟硬件平臺,支撐了數據橫向共享與縱向貫通、決策分析等應用,在數據管理、共享、分析等方面取得了一定成果,但在數據字典管理、數據資源管理、數據中心規范化建設、數據運維能力等方面仍存在不足。
1)數據字典缺乏統一管控
業務系統數據字典缺乏統一管控,數據字典設計不規范,未形成統一審核流程,一方面不利于企業數據架構的統一管控,信息的全面共享;另一方面當業務系統數據字典變更時,未及時通知數據中心,導致數據中心與業務系統的數據接口異常,影響數據中心數據的采集、共享利用。
2)數據中心數據資源缺乏統一管理
隨著業務系統的不斷接入,數據中心數據資源的不斷豐富,同時數據中心根據需求建立了多個數據存儲區域(如運營監測、輔助決策、綜合查詢等),數據資源多處存儲,但由于缺乏對這些數據資源的統一管理,業務部門無法了解到數據中心存儲了哪些數據、多少數據、存在哪里,不利于數據資源的統一檢索、共享利用。
3)數據中心建設規范化有待提升
根據業務應用需求,各單位基于數據中心實現了業務數據接入、存儲、共享使用,但在建設模式上統推、自建并存,存在數據重復接入、重復存儲、模型不統一、編碼不統一等現象,影響數據共享融合的數據質量。
4)數據運維能力有待提升
現有各單位數據中心運維團隊主要以技術運維為主,可滿足日常技術運維,但在數據中心數據資源統一管理、數據中心規范化建設方面支撐能力不足。
為了適應SG-ERP和“三集五大”的建設要求,更好地發揮和利用好數據中心的功能,提升數據中心的服務能力,用好、保護好、增值好企業數據資產,迫切需要開展數據中心優化治理,建立健全技術支撐體系和管理支撐體系工作。
企業級數據中心的優化治理體系[1-4]以保障公司核心業務為目標,將分散、多樣化的核心數據通過標準化、質量探查、清洗、集成、監控和信息挖掘等操作進行優化,形成企業內部數據管控體系,將數據管理與公司組織機構相結合,以管理績效為手段,加強保障數據質量管控的執行力,形成數據管控常態化運作機制,使數據治理在企業內部持續運行,保障數據的數據質量,為數據的集成和挖掘應用提供有力保障。
數據中心優化治理工作包括問題調研與現狀梳理分析、工作思路及目標、組織保障、綜合治理和形成常態化運作機制5個步驟,主要從問題調研與現狀梳理、工作組織保障、數據管理組織、健全數據中心管理規范[5-8]、數據管控平臺、常態化運作機制6個方面開展工作,形成“一個流程、兩個維度、一個平臺、一個機制”的數據治理體系,如圖1所示:

圖1 數據中心優化治理體系的內涵
“一個流程”----數據的全生命周期管理
數據的全生命周期一般指數據的產生、存儲、交換、加工到歸檔的全過程,屬于技術管理領域的概念。而本成果對數據全生命周期的定義側重于在數據管理和應用的視角,將周期的起點從業務系統數據進入數據中心ODS,即“數據接入”,從源頭上保障數據的質量;終點不止于數據的歸檔,而是數據的應用,數據的價值只有在應用中才能得到體現;“數據集成”環節強調對企業級數據加工及再加工過程的統一和整體的管理,即做到有數據質量保障的數據集中與共享,進而為下一環節“數據應用”奠定基礎。
“兩個維度”----管理與技術雙管齊下
數據管理工作是一項極具挑戰性的復雜工作,該項工作既涉及管理領域的內容,又涉及技術領域的內容,為了更好地指導工作,我們對“一個流程”中的3個環節從管理和技術兩個視角進行細分。如,將“數據接入”的內容從管理視角劃分為數據接口管理、數據檢查規則管理、監督檢查、數據的變更和維護等。然而要做到對數據接入的精細化、專業化管理,就要從技術視角確立了數據接入方面的工作內容,包括數據完整性驗證、數據精度驗證、業務邏輯驗證技術工具的建設、數據接入在IT系統落地過程中需要完成的業務系統和外圍系統改造工作等。其他環節的管理維度與技術維度工作內容的劃分,與此類似。
“一個平臺”----數據管控平臺
數據管理工作是一項巨大且龐雜的工作,為了有效落實數據管理各項工作要求,必須依靠系統化的工具和手段來進行數據管理維護工作。因此,需要構建數據管控平臺實現組織、制度和流程體系的有機融合。
“一個機制”----常態化運作機制
數據治理體系橫跨“一個流程、兩大維度”,為了保障數據中心優化治理工作持續有效,必須搭建一套符合數據中心優化治理工作的“常態化運作機制”。
2.1開展調研梳理,找準問題關鍵
2.1.1問題調研
信息通信分公司組織調研,深入業務部門、基層一線運維,通過訪談、系統操作、問卷調研,全面了解數據中心管理、應用中存在的問題。通過全面調研,共計收集問題245項,除部分問題得到直接快速解決外,最終需要集中統一解決的問題共計185項。
2.1.2問題分析
經過分析,問題主要體現在4個方面。1)數據管理問題:數據未實現全面在線生成,數據的及時性和真實性得不到保證;部分信息系統設計、開發和實施質量不高,影響系統應用和數據生成;數據質量有待提升,數據準確性、完整性還有差距;各專業的業務數據未實現有效關聯與集成,數據開放共享程度不夠,數據結構和編碼標準存在差異,給數據管理與利用帶來困難。2)管理規范問題:公司依然存在專業管理壁壘,導致數據共享程度不夠;業務部門主導各專業系統建設,導致系統功能重復及數據標準不一致;缺乏數據長效管理機制,導致數據治理治標不治本;未形成明確的數據問題整改流程,導致數據問題責任不清,難以持續改進。3)技術問題:缺乏企業級的數據標準,導致數據共享困難;未形成有效的面向服務的系統架構(SOA),導致系統集成困難;數據中心軟硬件容量和性能不足,導致數據處理能力受限;數據授權訪問沒有有效的監控,存在潛在的安全隱患;面臨不斷增加的大量的數據問題,缺乏溯源支撐,難以快速定位。4)集成問題:數據接口不穩定,數據重復錄入,業務流程未實現跨系統貫通等。
2.2理清工作思路,確定總體目標
工作目標:在 “SG186”、SG-ERP建設成果的基礎上,總結、理清中心基礎環境、應用和數據現狀,構建并完善數據中心數據治理體系、服務能力、資源狀況的全局視圖,全面監控數據中心核心要素的運行狀況,為各級決策者、管理者、執行者提供全方位、多角度的可視化展示和數據分析服務,支撐精細化管理,對數據中心做到“心中有數”。
總體思路:以保障公司核心業務為目標,以兩級數據中心建成投運、各項業務順暢運轉、功能發揮為重點,以數據中心的指標數據、業務應用、基礎環境深化梳理、數據管理體系建立健全為支撐,以數據中心管控平臺建設成果驗收、數據全生命周期流程監測為抓手,加強數據中心數據管控的執行力,形成公司數據管控常態化運作機制,保障數據中心的數據質量,充分發揮數據中心數據資產的價值,提升數據中心的服務能力。
2.3建立工作組織,落實保障機制
成立組織機構,明確職責劃分,保障數據中心優化治理工作順利進行。領導小組由科信部領導、信息通信分公司領導擔任組長,負責指導開展數據中心優化治理項目建設,開展方案審核、督導檢查和總結驗收工作,協調解決重大問題。項目管控組由信息部門項目專員、建設團隊項目經理、信通運維團隊負責人擔任組長,負責組織開展數據服務質量管理項目建設工作;負責把控整體建設進度與項目質量;負責協調需求管理、系統部署、系統集成和外圍接口組之間的問題解決;負責定期向領導小組匯報項目整體工作進展情況。項目建設團隊負責梳理調研數據中心環境、ODS數據情況,提出優化和治理方案,制定數據中心管理規范。配合團隊由信息通信分公司運維專職和各業務系統運維廠商組成,配合數據中心梳理工作,協助項目建設團隊完成數據中心運維管理規范。
2.4構建治理體系,實現治理優化
為了實現企業數據中心優化治理目標,構建完整的企業級數據中心優化治理體系,必須從組織、標準、管理和技術保障四個方面建立支撐體系。明確數據中心數據組織架構和角色職能劃分可以有效地保障企業級數據中心優化治理目標的落實;數據標準是數據中心優化治理體系的基礎;數據中心優化治理體系管理規范定義了數據管理應當遵循的規范;技術平臺的建設和優化為數據中心優化治理體系規范管理提供支撐。這四方面構成了完整的數據中心優化治理體系,保證數據管理有標準、有制度、有稽核、有手段,使得各項優化治理工作能夠得到有效落實,達到數據中心優化治理的目標。
2.4.1優化數據管理組織,明確數據管理職責
為了實現企業級數據中心優化治理目標和主要工作內容,必須優化數據管理組織,明確數據管理職責,數據管理具體角色和職能的劃分,如圖2所示:

圖2 據中心數據管理組織機構
2.4.2完善數據中心模型,完備數據資源梳理
依據公司SG-CIM模型、主數據標準,結合公司數據中心建設及應用現狀,通過收集數據中心相關設計文檔,制定數據梳理模板,采用人工和技術監控相結合的梳理方法,對數據中心的數據字典管理、數據資源進行梳理。
1)信息系統相關設計文檔核查:依據《公司信息化項目竣工驗收管理辦法》在IRS系統中核查業務系統的《需求說明書》、《系統概要設計報告》、《數據字典》或《數據庫設計說明書》。
2)數據字典梳理:梳理數據字典是否與系統實際開發情況一致,需確保數據字典的全面、完整、準確。數據字典梳理內容包括數據庫信息、物理實體、實體屬性,如圖3所示:

圖3 字典梳理信息及關系
3)數據資源梳理:在數據字典梳理工作基礎上,根據統一模版梳理數據中心指標數據、明細數據、數據接口,形成數據中心指標數據資源手冊、明細數據資源手冊、數據接口資源手冊。
經過梳理,減少無效模型55個、完善無注釋模型1239個、消除重復模型36個,優化接口22個,涉及接口對象692個,完善了數據中心模型及數據中心接口,形成了企業級數據中心數據資源全景視圖及優化指導手冊。
2.4.3規范數據管理流程,健全運維管理體系
通過對數據中心優化治理工作,依據公司上下線管理辦法,結合公司數據中心日常運維實際,項目搭建了“兩大制度、六大流程”,如圖4所示:

圖4 大制度、六大流程
建立了數據中心“全閉環制度體系”,其范圍涵蓋了企業級數據全生命管理,為數據中心數據管理提供了完善的制度流程保障,豐富了數據中心運維管理體系。
2.4.4筑牢數據管控基石,鞏固技術支撐體系
數據管控平臺作為數據管控的基石,是面向企業級數據中心的數據質量管理的全過程管理工具,從數據源頭到數據接口加工過程處理、到數據質量診斷、再到數據質量評估、最后到數據質量問題分析與處理;采用全鏈分析方法,根據數據血統關系獲得數據的來源與加工過程,根據數據影響關系,對數據質量問題快速定位,從而實現該數據對象的全景展示;具體包括以下內容:
1)對企業數據中心的數據集成全過程的質量問題管理與監控,包括業務系統數據進入數據中心前數據質量規則檢查(如完整性檢查、及時性檢查等)、數據中心內部管理及數據加工處理過程中的數據接口監控(如ETL過程監控、OGG處理過程監控、DBlink處理過程監控)、數據中心外部應用,如圖5所示;

圖5 數據管控平臺
2)通過數據血統關系、數據影響關系建立企業數據全鏈關系圖譜并基于此提供質量問題歸并;
3)建立數據質量規則庫,并從完整性、準確性、一致性、及時性四方面進行數據質量度量,基于規則識別數據質量問題,并根據具體的數據質量診斷任務,定時進行數據質量診斷并生成數據質量診斷結果;
4)以元數據描述了企業數據血統關系圖譜、數據影響關系圖譜及數據全鏈關系圖譜,對外提供統一的數據描述及全景視圖,主要包括數據全景視圖、應用全景視圖、基礎環境全景視圖。
2.5形成常態運作,強化管理效果
2.5.1完善數據梳理方法,形成常態化梳理機制
在“一個流程、兩個維度、一個平臺”數據中心優化治理的運行過程中,不斷完善梳理方法,結合技術手段,鞏固和完善數據中心資源梳理方法論,形成常態化梳理工作,豐富數據中心全景視圖。
2.5.2構建數據監控機制,提升異常數據處理效率
為確保未來新建系統或系統重大改造后,也同樣能滿足業務系統進入數據中心的“數據質量高、數據價值大”的目標要求,根據數據中心管理辦法,結合數據中心基于規則的數據質量評價標準,建立有效的數據質量監控機制,在數據中心數據處理主要階段設置數據質量檢測點,實現源系統核心數據稽核、源系統維表稽核、數據實體檢查、處理過程檢查和關鍵指標檢查,實現從源系統接口層到數據應用層的全流程數據質量監控,便于數據質量問題提前發現和及時處理。同時,管理在數據質量監控中產生的告警信息,并集成元數據信息,實現拓撲呈現,提供數據中心數據處理狀態和質量狀況的全局視圖。
2.5.3建立日常例會制度,加強組織內部溝通協調
針對數據中心深化應用形成周例會、月度例會制度,以例會形式反映數據管控中遇到的問題,會議由公司領導主持,各相關業務部門、系統運維單位、系統使用單位相關人員參加,在例會上,對所收集的問題、數據管控的情況進行分析討論,屬于各部門流程問題的,由各業務部門安排進行治理。屬于數據中心運維單位原因導致問題的,由科信部牽頭組織處理。對于涉及多個部門的問題,在會議中進行協調處理。
3.1完善管理體系,提升運維水平
通過本次數據中心優化治理工作,制定了2大制度、發布了《國網江西省電力公司數據中心數據質量管理辦法》、完善了6項制度流程,優化了數據中心制度規范,構建了執行、監督為一體的數據中心運維管理體系,完善了數據中心運維管理體系,有效地提升了數據中心運維管理水平,實現了數據中心運營安全價值保障。具體效益如下:
1)管理覆蓋企業數據從數據源頭到數據接口加工過程處理、到數據質量診斷、再到數據質量評估、最后到數據質量問題分析與處理策略的全過程,涵蓋數據的產生、加工、應用的全過程。對企業級數據中心的數據質量的全方位控制與提升可以起到有益的促進效果;
2)設計開發的數據全鏈圖譜關系及數據質量診斷規則引擎使得用戶通過簡單的規則配置即可實現數據質量問題的自動診斷與報告,極大的減輕了企業數據質量管理人員的工作量,提高了效率;
3)成果實施后,信通分公司2014年數據治理、集成、維護等相關信息化項目較2013年節約資金726.07萬元。省公司所屬百余家單位僅在財務結算、物資招投標、生產設備
管理、人力資源報表管理、項目工程管理等方面因數據整理的人工費用每年可節約近千萬。
3.2創新數據管控,樹立行業典范
依據“一個流程、兩個維度、一個平臺、一個機制”數據治理體系設計開發的數據管控平臺,針對數據中心相關的硬件系統、網絡系統、系統級軟件、應用程序和數據等六大類組成要素,收集、整理基礎技術參數、性能指標、廠商信息、業務屬性、關聯關系、管理屬性等信息,完善擴充檔案信息,可對數據中心硬件、應用和數據的性能及運行狀態進行全面深入監控,可視化集成并自動告警,提升各級管理人員對數據中心的把控能力及精益化管理水平。在此基礎上,從運營維護、技術管理、業務管控、輔助決策等工作維度出發,構建多層次多視角的數據中心全景視圖,形成動態管控管理機制。
“一個流程、兩個維度、一個平臺、一個機制”的數據治理體系從數據全生命周期的角度闡述了數據治理工作各個環節的內容與結構,貫穿了數據接入、數據集成和數據應用等各項數據治理工作的重要環節,通過對企業數據中心優化治理實施,證明該體系具有科學性和可實施性。經過該體系的實施,實現了數據中心管理工作規范化、制度化、常態化,有抓手、可控制,為公司利用信息化手段管理數據質量提供有效支撐,從而提高其數據資產的價值,提升企業對外服務能力。
參考文獻
[1] 中信銀行股份有限公司數據治理工作組.商業銀行數據治理體系構建思考[J].中國金融電腦,2012(2):23-27.
[2] 李閩一,范小贊.中國聯通數據管理體系規劃與建設[J].業務與運營,2009,6:27-31.
[3] 李謙,白曉明,張林,等.供電企業數據資產管理與數據化運營[J].華東電力,2014,42(3):0488-0490.
[4] 匡紅剛,王濤,唐融,等.數據質量閉環管控框架數據估值的應用研究大數據時代[J].華東電力,2013,41(3):0547-0549.
[5] 孟慶.大規模數據整合的難點與數據中心優化方向[J].信息化建設,2012,5(255):12-13.
[6] 施超.數據中心安全隱患分析與治理[J].智慧城市,2012:37-38.
[7] 席敏暉.淺談企業級數據中心運維管理[J].信息技術,2014,12:46-47.
[8] 琛江,谷和啟.淺析企業級數據中心運維管理[J].系統管理, 2013,8:63-67.
收稿日期:(2015.06.06)
作者簡介:范葉平(1979-),男,安徽南瑞繼遠軟件有限公司,工程師,研究方向:電力行業信息化管理、架構設計,合肥,230088
文章編號:1007-757X(2015)12-0051-03
中圖分類號:TP3
文獻標志碼:A