摘要 數據資產管理是推動數字化轉型的關鍵性實踐,能夠高效賦能數字交通建設。高速公路全生命周期一體化管理業務數據是數字交通建設中的重要數據資產,而數據標準作為數據資產管理之基,是實現不同業務環節的數據融合分析以及跨業務領域一體化數據應用的關鍵性工作,開展其建設至關重要?;诖?,該文旨在通過研究國內外數據標準建設方法論和實踐經驗,并結合高速公路投資、建設、運營全生命周期一體化管理的業務特點,探索出一套相應的數據標準建設與實踐方法。
關鍵詞 數據標準建設;高速公路全生命周期一體化管理;數據資產管理;數字化轉型
中圖分類號 F542 文獻標識碼 A 文章編號 2096-8949(2024)23-0167-04
0 引言
當前,數字中國建設如火如荼,中國能建集團積極響應數字中國建設相關部署,制定了數字化轉型框架及提出了“五統”指導意見。交投公司為貫徹落實集團數字化轉型相關指示,由科信事業部負責開展了一系列具體工作。但在交投公司高速公路投資-建設-運營全生命周期一體化管理的業務趨勢下,相關工作面臨著數據共享難以實現、數據統計口徑不一、數據源頭不一、溝通成本過高等問題,阻礙了數字化轉型的推進;統一的數據標準作為解決以上問題,實現不同業務環節的數據融合分析以及跨業務領域一體化數據應用的關鍵性工作,有必要對其系統性地開展相關研究及建設實踐。
1 數據標準概述
1.1 數據標準內涵
數據標準(Data Standards)是指保障數據的內外部使用和交換的一致性和準確性的規范性約束[1]。在數字化過程中,數據是業務活動在信息系統中的真實反映。由于業務對象在信息系統中以數據的形式存在,數據標準相關管理活動均需以業務為基礎,并以標準的形式規范業務對象在各信息系統中的統一定義和應用,以提升企業在業務協同、監管合規、數據共享開放、數據分析應用等各方面的能力[1]。
1.2 數據標準的類型
數據可以分為基礎類數據、指標類數據以及數據代碼?;A類數據指業務流程中直接產生的,未經過加工和處理的基礎業務信息;指標類數據是指具備統計意義的基礎類數據,通常由一個或多個的基礎數據根據一定的統計規則計算而得到[1];數據代碼是源系統或生產系統中某個信息項數據內容的枚舉集。相應地,數據標準也可以分為基礎類數據標準、指標類數據標準、數據代碼。在具體的實踐中,可按照業務情況和業務需求進行劃分,確保和業務狀況相一致,如面向高速公路的全生命周期一體化管理業務,可按照投資、建設、運營等業務環節進行數據標準類型的劃分。
1.3 數據標準建設的意義
數據標準是數據資產管理關鍵性地基工作,主要體現在數據質量管理、數據模型管理和數據安全管理等方面[5]。
在數據質量管理方面,數據標準是數據質量稽核規則的主要參考依據,通過將數據質量稽核規則與數據標準關聯,一方面可以實現字段級的數據質量校驗,另一方面也可以直接構建較為通用的數據質量稽核規則體系,確保規則的全面性和可用性[5]。
在數據模型管理方面,數據標準涵蓋了實體、屬性、關系以及這些元素之間的相關規則,這些標準不僅是定義數據結構的基礎,也是確保數據一致性和準確性的關鍵。通過應用這些數據標準,可以有效地構建和管理數據庫、數據倉庫等系統的數據模型。具體來說,數據標準為數據模型的創建提供了一套規范和指導原則,從而使得數據模型的構建過程更加系統化和標準化。
在數據安全管理方面,通過明確業務中敏感數據的對象和屬性,數據標準能夠為數據安全提供堅實的基礎。這些標準不僅包括對數據的識別和分類,還涵蓋了數據訪問、處理、存儲和傳輸過程中的安全規則。
數據標準是企業數字化轉型的基石,它在業務和技術兩個層面發揮著至關重要的作用。在業務層面,數據標準一是能統一業務理解,數據標準明確了業務術語和概念,確保不同業務部門之間對業務含義有共同的理解;二是能促進溝通協調,通過統一的業務語言,加強了業務與技術團隊之間的溝通和協作;三是能標準化統計指標,確保統計指標的一致性,為決策提供準確、可靠的數據支持。在技術層面,數據標準一是能構建規范的數據模型,數據標準指導構建符合企業需求的物理數據模型,提高數據的組織和管理效率;二是能賦能數據的敏捷交互,標準化的數據模型促進了數據在不同系統間的快速流動和交互;三是能減少數據清洗需求,通過減少數據不一致性,降低了數據清洗和整合的工作量;四是便于數據融合分析,標準化的數據更易于進行跨領域的數據融合和深入分析,為企業提供更全面的業務洞察。
2 數據標準建設方法探究
2.1 國外方法論
《DAMA數據管理知識體系指南》[2]是國際數據管理協會編著的一部全方位指導數據管理的方法論,其將數據標準建設劃分為數據治理活動的范疇,將數據標準建設的基本流程提煉為發起數據標準和規程、制定業務術語表兩個模塊。該理論體系作為數據管理整體工作的指導性方法論,對數據標準建設的具體過程未作過多闡述,只從原則性方面開展了論述。
2.2 國內方法論
《數據管理能力成熟度評估模型》(GB/T 36073—2018)(簡稱“DCMM”)[3],是我國首個數據管理領域的國家標準,其把數據標準管理作為數據管理的八大能力域之一,其中明確將數據標準分為業務術語、參考數據與主數據、數據元、指標數據四個二級能力域,每個二級域都對數據標準管理工作提出了具體要求。其二級域的劃分對數據標準的分類提供了有利參考,該標準的條款要求則可為數據標準的管理過程提供了權威指導。在CCSA TC601大數據技術標準推進委員會《數據資產管理實踐白皮書》(6.0版)[1]中指出,數據標準管理是數據資產管理十大活動職能域之一,其將數據標準管理的過程定義為計劃、執行、檢查、改進四個關鍵活動?!度A為數據之道》[4]是華為公司對自身數據治理實踐工作的全面性總結,該方法論將數據標準劃分在信息架構建設域中,認為數據標準建設應該覆蓋業務視角、技術視角和管理視角,該理論可作為數據標準梳理定義的原則性參考。
3 高速公路全生命周期一體化管理的數據標準建設思路
基于高速公路投資、建設、運營一體化管理,文章通過對業務形態進行分析及對數據標準建設相關方法論進行研究對比,將面向高速公路全生命周期一體化管理的數據標準建設的過程總結為數據梳理歸并、數據類目劃分、數據標準制定、數據標準發布、數據標準應用及數據標準維護六個階段。此外,為了數據標準建設工作順利開展,需建立相應的工作保障機制。
3.1 數據梳理歸并
在數據梳理歸并階段,需要調研交投公司投資、建設、運營三大主營業務部門數據需求以及對智能養護、計量支付、電子檔案、OA系統等系統進行調研,全面梳理數據情況,形成相應調研報告和數據資源清單;后續還需持續對其他已建、在建、擬建系統數據進行滾動梳理、整合。
對不同表單內相似字段進行分析,對于含義完全相同但名稱不同的字段進行歸并工作。開展跨部門溝通工作,統一字段名稱,確保相同名稱字段的對應含義的唯一性。
3.2 數據類目劃分
在此階段,依據數據調研梳理結果,大面積開展跨部門溝通,深入了解業務需求。結合調研和溝通結果,開展類目劃分工作,形成類目劃分思維導圖,為數據標準做好規劃;并與業務部門進一步溝通確認,確保類目劃分和系統、數據、業務的實際情況相貼合。
3.3 數據標準制定
標準制定是指在完成數據類目劃分的基礎上,定義數據標準及相關規則,需要對數據元及其屬性進行確定,并遵循權威性、簡明性、穩定性、擴展性的要求。
權威性:參照標準優先級為本行業標準gt;國標gt;地標gt;其他行業行標。業務數據標準依據本行業行標、國標對比結果,標準化代碼;如無對應行標或國標,則參考地標、其他行業行標,標準化代碼;無標準參考情況,則以業務系統原字典定義為準。
簡明性:為快速定位信息資源,為了確保信息資源的快速定位,應注重以下幾點。(1)簡化分類層級,將信息資源的分類層級控制在兩級以內,最多不超過三級,以減少檢索的復雜性;(2)增強名稱可辨識性,確保每個分類類目的名稱直觀、明確,以便用戶僅通過名稱就能大致了解該分類下包含的數據類型;(3)提供清晰的導航標識,使用戶能夠快速地通過分類導航找到所需信息。
穩定性:應盡可能保持數據分類的相對穩定性,保證數據分類能實現最大化采集,容納現有能采集到的各類業務數據信息,同時一級、二級數據分類不會頻繁地發生分類的變化。
擴展性:須考慮業務的不斷發展,根據需要預留適當空位,以便適應內容不斷擴充的需要。
3.4 數據標準發布
數據標準的評審發布工作是確保其在組織中具有高度可用性和易用性的核心環節。在數據標準制定的初步階段完成后,關鍵的下一步是廣泛征詢科信事業部以及所有相關業務部門的意見和建議,這一步驟對于匯集多元化視角至關重要,有助于識別和解決標準可能存在的不足。隨后,將對收集到的意見進行深入分析,并據此對數據標準進行細致的修訂,以確保其能夠滿足跨部門的需求并適應不斷變化的業務環境。修訂完成后,數據標準將進入審議階段,這一過程確保了標準的質量和適用性。最終,經過審議的數據標準將被正式發布,供組織內部和外部的廣泛使用。發布之后,持續監控數據標準的應用效果,并根據用戶反饋進行必要的調整和優化,以實現數據標準的持續改進和完善。
3.5 數據標準應用
數據標準的應用是一個全面而系統的過程,它涉及將已發布的數據標準融入信息建設中,以消除數據不一致性。這個過程要求不僅要將數據標準培訓和宣貫深入地融入對于業務人員的培養過程中,以確保業務人員能夠最大限度上熟悉并理解數據的業務含義并能夠準確應用,還需要對信息系統進行及時且必要的建設和改造以適應這些數據標準。
3.6 數據標準維護
數據標準是一個動態發展的體系,它隨著業務需求的演變和實施效果的反饋而不斷進行優化和調整。整個數據標準的維護過程可以分為初期、中期和后期三個階段。
在初期階段,工作重點既要關注對于需求的收集、評審、變更和發布,同時也要對所有修訂進行嚴格的版本管理,這極大地保證了數據標準的可追溯性,并能夠為數據標準體系的維護和保證框架的一致性夯實基礎。此外,還需制定數據標準運營維護的方案路線圖,明確組織結構和策略流程,確保各部門能夠有效協同,共同助力數據標準的運營和維護工作。
在中期階段,工作的核心任務是針對數據標準執行的日常維護以及定期維護事宜,這包括監控數據標準的應用情況,評估其效果,并根據業務發展和技術進步進行必要的調整。
進入后期階段,要對數據標準有進一步的思考,這就需要重新審視并制定數據標準在各業務部門和系統中的應用方案,并跟隨制定相應的可行性落地計劃。對于因業務拓展或數據標準分類變更而新增的數據標準,必須遵循既定的編制、審核和發布流程,以確保數據標準體系的持續更新和完善。
通過這三個階段的持續努力,數據標準能夠適應不斷變化的業務環境,保持其活力和有效性,支持組織的數據管理和決策制定。
3.7 保障措施
3.7.1 數據標準管理組織架構
數據標準管理組織是為確保數據標準化工作順利進行而設立的關鍵機構,其核心職責是執行和管理數據標準相關的各項工作。該組織的結構和形式不是一成不變的,而是應根據企業自身的數據資產管理規定和行業實踐來確定。
在組織架構上,數據標準管理組織通常被劃分為三個主要層次:
數據標準決策層:決策層處于組織架構中的最高層,負責制定數據標準管理的策略和方向,以及做出關鍵決策。
數據標準管理層:位于決策層之下,負責監督數據標準的實施,確保各項標準得到有效管理和維護。
數據標準執行層:是最基層的執行單位,直接負責數據標準的落地執行,包括標準的推廣、應用和日常監控。
結合交投公司的數據資產管理相關規定,數據標準管理組織應確保每個層級都有明確的職責和工作流程,以促進數據標準化工作的順利進行。通過這種分層管理,組織能夠更有效地協調不同部門和團隊的工作,確保數據標準在整個企業中的一致性和連貫性。
3.7.2 數據標準管理制度體系
數據標準管理制度體系是一個全面而系統的框架,專門設計來指導和規范數據標準管理工作的各個方面。這個體系確保了數據標準的制定、實施和維護都遵循一套明確的原則和流程。
在交投公司,數據標準管理制度體系遵循公司的數據資產管理規定和原則,確保數據管理工作的一致性和合規性。這一制度體系主要包括以下幾個關鍵組成部分:
數據標準管理辦法,是整個體系的基礎,概述了數據標準管理的總體目標、原則和策略。
數據標準規范,詳細規定了數據標準的技術要求和業務規則,確保數據的質量和一致性。
數據標準管理細則,提供了具體的操作指導和步驟,包括數據標準的制定、審批、發布、修訂和廢止等流程。
以上三個組成部分相互銜接,構成了一個有機的整體,確保數據標準管理工作的有序進行。通過這個制度體系,交投公司能夠建立一個穩定、可靠且易于維護的數據環境,支持公司的業務發展和決策制定。
數據標準管理制度體系的建立和執行,不僅有助于提升數據的可用性和易用性,還有助于加強數據安全和隱私保護,滿足法律法規的要求。
4 總結和展望
數據需要和業務充分結合,才能發揮其“乘數”的效應。數據標準的建設是數據和業務融合的過程,是數據資源化向資產化轉變的基礎性和關鍵性工作。具備統一的數據標準,才能形成交投公司內部統一的業務話語體系,從根本上推動數據質量、數據共享、數據融合分析、數據安全等各類問題的解決。
當前階段,交投公司在推進數據標準化過程中仍然面臨更多問題與挑戰,這些問題嚴重地阻礙了數據標準管理工作的順利推進,并在一定程度上阻礙了數據標準化的效果呈現。這些挑戰主要體現在以下幾點:(1)業務部門參與度不高,(2)技術實施不徹底,三是數據標準管理周期長、見效慢。該文所提出的數據標準建設思路,對于交通行業數據標準的建設、數據資產的管理、數字化轉型的推動具有一定參考借鑒意義。在未來,還應持續開展相應研究,結合智能化數據治理工具、大模型等技術,持續提升數據標準的制定效率、數據標準和業務的耦合度、數據標準執行力度,有力助推交投公司數字化轉型,打造“四新能建”,助力數字中國建設。
參考文獻
[1]中國信息通信研究院.數據資產管理實踐白皮書(6.0版)[E].CCSA TC601大數據技術標準推進委員會,2023.
[2][美]DAMA國際.DAMA數據管理知識體系指南[M].北京:機械工業出版社, 2020.
[3]數據管理能力成熟度評估模型:GB/T 36073—2018[S].北京:中國標準出版社, 2018.
[4]華為公司數據管理部.華為數據之道[M].北京:機械工業出版社, 2020.
[5]中國信息通信研究院云計算與大數據研究所.數據標準管理實踐白皮書[E].2019.