首鋼京唐鋼鐵聯合有限責任公司信息計量部 范文娟 郭亮
鋼鐵企業的生產制造與經營管理活動中積累了大量的信息化數據,這些數據除了支持企業的業務流程外,越來越多地被用于專業分析、經營決策中。基于鋼鐵行業生產的運營特點,數據產生時的質量高低直接影響企業內部業務的運作效率和成本。本文闡述以數據質量提升和價值挖掘為核心的企業數據架構實踐,深入推進信息系統數據資產管理,管控數據風險,挖掘數據價值,提高業務運行和管理效率,通過對數據資產進行高效盤點,高效診斷數據質量問題并有效治理,優化業務流程。
數據作為一種新的生產要素,在企業構筑競爭優勢的過程中起著重要作用,企業應將數據作為一種戰略資產進行管理。數據從業務中產生,在IT 系統中承載,要對數據進行有效治理,構筑一套企業級的數據綜合治理體系,開展以數據質量提升和價值挖掘為核心的企業數據架構實踐,才能確保關鍵數據資產有清晰的業務管理責任,IT 建設有穩定的原則和依據,作業人員有規范的流程和指導。構建數據綜合治理體系,數據質量得到有效保障,數據的價值才能真正發揮出來。
企業信息化建設中,在產品的設計、開發、生產、管理、經營和銷售的各個環節中應用信息化技術,實現了“專業集中、流程一貫、產銷一體、高效協同”的信息化實施效果。為了進一步提升數據價值,將分散、多樣化的核心數據通過標準化、質量探查、清洗、集成及監控等技術手段進行優化,保證數據的真實性、有效性、一致性等,開展數據治理工作勢在必行。同時,結合企業組織結構,整合IT 與業務部門的知識和意見,形成企業內的數據治理體系,在企業內部持續運行,挖掘并提升數據的應用價值[1]。
通過開展數據治理,主要解決以下幾個核心問題(如圖1 所示):

圖1 常見的數據問題Fig.1 Common data problems
(1)數據關系復雜,數據產生方式無法追蹤,無鏈路解析;數據采集、分布、流轉及應用的規劃存在不合理現象,出現數據問題無法定位是哪里出現問題以及會影響哪些后續的應用。
(2)數據標準缺乏統一定義:各部門、各系統、各業務對數據標準不統一,影響數據使用;業務代碼差異化,不遵從“已有標準”;業務認知程度不同等問題,不僅難以建立全面、準確、完整地反映企業運行狀況的單一數據視圖,也難以做到數據的邏輯集合而不僅僅是物理集中。
(3)缺乏數據質量管理:數據質量無法監控,丟數、異常值、冗余等問題無法監管,缺乏規范的數據質量治理流程和機制,不能及時發現數據質量問題,或缺乏有效解決途徑。
堅持“業務導向,數據驅動”方針,基于數據資產平臺的建設與使用,形成“質量檢核、現狀分析、問題診斷、治理優化、效果反饋”的閉環管理,規范業務流程,管控數據風險,提升數據質量,挖掘數據價值。為業務流程優化與創新提供精準的數據支持,建立“質量檢核、現狀分析、問題診斷、治理優化、效果反饋”的數據資產治理閉環管理體系[2]。
(1)定目標,引領數據治理實施。基于數據實現企業的管理升級和業務創新,以數據拓展新業務、構建新業態、探索新模式。實施數據治理工作,以“深化元數據管理、建立數據標準、提升數據質量”為核心展開,構建“數據資產管理平臺”。
(2)明機制,建立歸口責任制。首先是建立由公司高層和各相關部門組成的網絡安全和信息化委員會,統一領導數據治理工作,制定公司的數據治理戰略,科學規劃數據治理發展路線和實施計劃。其次是明確數據治理的歸口部門,形成數據質量治理方案,建立“質量檢核、現狀分析、問題診斷、治理優化、效果反饋”的數據治理閉環管理體系。
(3)建平臺,管控數據風險。實施數據治理工作,以“深化數據標準、元數據管理、提升數據質量”為核心展開,構建“數據資產管理平臺”。
(4)要效益,挖掘數據價值。開展數據質量問題檢核,分析業務風險點,規范業務管理與現場控制,減少產品質量異議,提升客戶滿意度。
2.2.1 調研業務現狀,理關系
圍繞數據治理目標和范圍,梳理業務流程、數據信息和系統技術,將數據從產生、處理、加工、應用、流轉、存儲、銷毀的全流程進行梳理,采集業務系統元數據,分析數據模型,梳理系統間數據流向,理清數據來龍去脈。用戶可通過系統查看數據資產清單、繪制數據地圖,全視圖了解企業整體數據情況。
數據地圖從宏觀角度展示系統以及系統之間數據流向關系,并支持從系統到數據庫的下鉆及相關信息的展示。通過Web 方式編輯元數據或通過模板方式采集元數據都可進行元數據創建。創建好的初始數據地圖,可通過數據地圖位置調整及保存來調整數據地圖。
2.2.2 建立數據標準,定規范
建立數據標準,是對數據的名稱、含義、結構、取值等信息的統一定義,達成對數據的業務理解、技術實現的一致性,消除數據的不一致性,根源上解決數據質量問題。
通過數據標準樹和數據標準相結合的方式展示數據標準,通過數據標準模塊,用戶可以查看數據標準的基本信息、數據標準對應的數據質量規則、數據標準對應的元數據等信息。也可以在詳情頁中對某一數據標準進行關系分析、查看歷史、導出等操作。
2.2.3 開展數據檢核,提質量
數據質量管理是數據治理項目實施的重中之重(如圖2 所示),通過業務現狀調研和梳理,業務人員根據業務問題以及業務關注點制定相應的業務規則,技術人員根據業務規則定義檢核方法,對數據實施檢核。

圖2 數據治理方法論Fig.2 Data governance methodology
(1)問題收集:系統業務執行過程中的數據質量問題的收集整理、匯總及分類分析。
(2)問題分析:從源頭數據質量差、數據標準缺失、業務管理不規范等方面進行問題的深入分析。
(3)問題處理:對源頭數據質量差的進行源系統改造、數據補錄;數據口徑多樣化導致的數據問題進行數據標準化;對業務管理不規范導致的問題,依托數據標準,關聯系統數據模型,建立質量檢核規則,對發現的數據問題進行診斷,規范業務流程管理。
(4)改進執行:按周期進行數據質量自動檢核,處理問題數據,強化過程監控,建立“質量檢核、現狀分析、問題診斷、治理優化、效果反饋”的數據資產治理閉環管理體系,推動業務流程持續改善。
為持續、有效地推動數據治理工作,開展數據問題全面整改,規避業務風險點,優化業務流程管理,提升數據質量,需建立長效工作機制。
信息化部門應結合各專業治理需求,組織實施數據治理項目;收集業務部門的數據檢核需求,監控數據質量問題;定期評估和檢查數據質量提升的工作結果,編寫整體數據質量總結報告,向數據管理小組進行匯報;結合業務需求,在確保系統功能穩定運行調度前提下,不斷完善數據資產平臺的監管監控能力,提高產銷一體化系統數據質量,有效支撐業務運行,規避業務風險;結合智能制造技術,組織推進數據問題整改;組織解決因技術原因導致的系統數據問題[3]。
業務管理部門負責專業數據質量檢核規則的制定,通過數據資產管理平臺及時發現數據質量問題,組織相關專業人員進行原因分析,并分析業務風險點,制定科學合理的解決方案,不斷提高業務數據質量,為專業管理提供更準、更多的可用數據;負責建立本專業數據質量持續監控體系,圍繞數據質量檢核規則,督促各專業整改相關的數據質量問題,形成“發現問題-解決問題-過程跟蹤-結果反饋”的長效管理機制。
其他部門作為數據產生單位,按照“誰產生數據、誰負責數據”的原則,開展數據的維護、使用和分析工作,保證數據的及時、準確、完整、有效。按照專業管理要求,分析數據質量問題產生的根源,提出并落實數據質量問題的解決方案。
數據資產平臺按檢核周期(天、月)進行數據準確性校核,生成數據質量問題報告。
各部門按周反饋數據問題解決進展,說明數據質量改善情況;根據數據質量報告,針對問題數據的產生,進行流程梳理,查找問題點,分析業務數據問題產生的原因,制定并落實業務整改方案,優化業務系統流程與功能,提升數據質量。
信息化部門、業務管理部門定期組織處理數據質量問題,每月6 號前向數據領導小組提交數據質量報告,通報數據質量整改情況,檢查整改情況與落實效果,提出整改期限,進行整改評價,數據領導小組按照整體工作方案安排,匯總后進行統一發布。各部門數據質量整改與提升工作推進不力的,由業務管理部門提出考核;各專業數據治理工作推進不力的,由數據領導小組提出考核。
評價指標:各業務管理部門按照專業要求,設定分部門的數據質量指標。
評價基準:原則上,采取“上調不下調”原則,即指標進步時上調基準,指標退步時基準不變。
當前,整個鋼鐵行業正在面臨激烈的市場化競爭,企業在經營管理的過程中,數據的價值正逐漸顯現。通過盤點信息化系統數據資產,理清數據分布現狀,統一數據的規范定義,形成一致的數據,發現并治理數據資產中存在的問題,形成機制并提升數據質量,為企業流程優化與創新提供精準的數據支持。持續深入開展數據治理建設,實現從數據基礎治理到數據洞察,讓數據成為企業的“黃金資產”,加快企業實現數字化轉型升級。