◎謝定芬
大數據時代企業的主數據管理
◎謝定芬
本文討論主數據管理系統在大數據時代的意義與作用,以及主數據管理系統如何在企業中通過數據整合以及數據清理從而幫助后臺技術人員向高層管理人員及前端業務人員提供數據支持。本文同時將探討主數據管理系統的循環過程,并展望了將主數據管理系統建立在云端以及移動平臺的可能性。
如今,數據已經滲透到每個行業和業務職能領域,成為重要的生產因素。當今的信息化時代主要是由數據主導的,因此企業若想做大做強必須首先掌握核心的業務數據,這有利于企業通過分析這些核心數據從而獲得最大限度的價值,并借用數據來對企業的品牌管理進行優化改造,拓寬市場渠道增加市場份額,最終實現企業核心競爭力的提升,然而這一切的主要手段被稱作主數據管理(Master Date Management,簡稱MDM)。
所謂主數據管理,主要是指用以確保企業的業務數據特定的范圍內保持一致、完整、互相關聯以及精準的一組規程、技術和解決方案。簡而言之,主數據管理的主要作用在于使企業從零零散散的業務系統中提取到所需要的核心數據或最需要共享的數據(主數據),并把這些數據集中起來,進行統一的篩選、整合和提煉,最終形成具有權威的主數據,再以服務的方式將這些完整統一、準確無誤的主數據面向企業當中需要使用這些數據的系統或應用進行分發。主數據管理主要用于強化企業各業務系統的共性數據當中的實體和模型的管理,可以有效避免出現大的業務概念不一致的現象,同時可以有效的降低應用孤島、數據孤島出現的幾率,因此可以作為企業的數據標準。
現今,企業已經逐步認識到了核心數據具有重要的資源價值。作為一種具有稀缺性和差異性的核心數據資源,主數據管理將逐漸成為企業的重大競爭優勢之一。主數據管理對企業而言主要有以下幾個方面的價值:
和大數據相輔相成。這兩者的都是以數據為核心的,僅僅在關注點上各不相同。大數據主要的關注點在于數據的體量和類型,主數據主要的關注點在于數據的組織結構?,F代化的企業為適應市場的需求,必須將主數據作為核心,以此作為線索將各類大數據進行有效的串聯,通過主數據獲取企業的預期效益和價值。具有良好結構的主數據可以在很大規模上幫助相關數據分析師在建模之前節省清理、組織數據的時間。由于大數據系統下的數據多具有無組織、雜亂、缺乏實際應用意義,主數據分析師可以根據本企業或本行業內部情況,通過配套的主數據管理系統對這類數據定義賦值,從而向數據用戶提供全方位的商業定義。
業務價值廣泛。通過主數據管理,企業可以為主數據建立完整統一的訪問端口,以及完整統一的、內容豐富的、純凈無雜質的數據中心。其業務價值不僅在于可以為企業的每個業務部門提供有效的共享信息平臺,還可以為企業的業務流程以及經營決策提供切實可靠的數據載體。通常來說,在數據孤島的情形下,各部門各自擁有一套數據系統,且這些數據系統中的數據大多具有非統一以及無序的特性,比如某產品在財務部門的數據系統中編號為89002-FA,但是在銷售部門的數據系統中編號為89002-SA。高層管理人員在對此產品進行季度分析時,將會看到財務和銷售兩個部門提供的兩個不同產品編號,從而被誤導而做出可能導致錯誤的決定。然而,一個優良的主數據管理系統可以對各部門的數據系統進行審計并整合,對重復、多余的數據進行合并處理和統一編號,然后依據各部門人員的職能分配在統一的主數據倉庫中調取和觀測數據的權限,從而為各個部門提供統完整的數據共享平臺。
增強IT建設靈活性。主數據管理可以增強IT結構的靈活性,構建覆蓋整個企業范圍內的數據管理基礎和相應規范,并且更靈活地適應企業業務需求的變化,同時,降低接口成本、數據清洗和維護成本等,使企業有效降低成本。
盡管目前的許多企業越來越重視主數據的實際價值,但對于如何發揮主數據的作用還并不十分了解。為確保企業實施的項目能夠按部就班的進行,企業可以從規劃方法論出發,從不同的階段開展工作。比如information MDM產品解決方案,將主數據的生命周期劃分為九個階段:一是訪問,對主數據的來源和現狀進行探索,實現不同數據源和應用程序的數據集成方案,這是主數據獲取的入口。二是發現,探索數據內容以及內在結構,并從中發覺到異常情況,對數據的優勢和劣勢進行精確的分析,對于其中出現的數據錯誤和問題要明確的指出。三是建模,建立正確、靈活的MDM業務及數據模型,其目標在于有效面對企業隨時可能發生的變化以及困難,項目的順利完成離不開正確的數據模型。四是清洗,對于整個系統數據出現兩種或兩種以上的定義或者使用方法時,我們需要對錯誤以及矛盾進行解決,建立信息正確以及結構完整的主數據。五是識別,迅速對數據進行配對,刪除重復數據并最大限度的防止出現重復。六是解決,對數據中重復的部分進行整合,確保數據的唯一性和真實性。七是關聯,要對企業內外部的合作伙伴系統或第三方軟件,乃至于外部產品的廣泛數據做出有效關聯。八是治理,對主數據進行創建、使用、管理和監控,確保對數據問題進行跟蹤,同時保證長期滿足數據質量預期。九是交付,通過服務的方式,將具有統一性、完整性和準確的主數據分別發放給企業當中一定范圍內的業務系統以及其他系統,以滿足各類系統的需要。
云計算、社交計算、移動計算被并稱為大數據的三大驅動。從當前形勢來看,部分主流MDM軟件可以對云中數據、社交數據、移動數據等不同類型的數據進行有效的管理。由此可見,未來必將支持不同的移動終端接入,采用云中部署、混合部署等新模式的主數據管理多域部署情況將更加普遍。
未來,MDM平臺將逐步實現與大數據的無縫集成,為大數據提供一系列全面、先進、成熟的數據管理解決方案,為企業用戶迎接“集成化的大數據時代”做好了準備。新形勢下的大數據時代,大數據目前所存在的最重要的問題不在于龐大的數量,而是在于高質量。大數據背景下的企業數據治理和提升數據質量的工具將由主數據管理解決方案擔負,不但保證了核心數據的真實可靠和較高的質量,還可以使企業精準的發掘到業務數據中所隱含的各種價值,真正把大數據轉化為大機遇。
(作者系中國建材集團合肥水泥研究設計院工程設計公司土建室主任,高級工程師、國家一級注冊結構師,MBA畢業)