



摘要:大型企業雖擁有海量數據資源,但其價值的充分釋放受限于缺乏體系化的建設與運營。有效的管理模式成為關鍵。文章借鑒運營商大數據資源管理經驗,探討了企業數據資源體系的構建路徑,從數據治理組織構建、數據高效匯聚、數據質量保障、數據分類分級以及數據管理規范化等維度,旨在提升數據安全與質量,促進數據資源價值的最大化釋放。
關鍵詞:數據資源; 數據治理; 數據質量; 數據資產管理
中圖分類號:TP3" "文獻標識碼:A
文章編號:1009-3044(2025)18-0068-03
開放科學(資源服務) 標識碼(OSID)
1 企業數據資源管理現狀及挑戰
1.1 數據資源現狀
近年來,數據資源一直是國家信息化發展政策制訂的重要關注內容。國務院于2021年印發的《“十四五”數字經濟發展規劃》提出要推動數據資源標準體系建設,提升數據管理水平和數據質量,探索面向業務應用的共享、交換、協作和開放[1]。國家數據局等部門在《關于促進企業數據資源開發利用的意見》中也強調應充分發揮企業主體作用,分類推進企業數據資源開發利用,提升企業競爭力,賦能產業數字化轉型[2]。這一系列政策要求企業亟須建立標準、安全、分級分類的數據資產管理體系,為后續數據價值挖掘提供底座。
我國企業數據資源在快速增長。根據《全國數據資源入表年度發展報告(2024) 》統計,2024年全國數據生產總量達41.06澤字節(ZB) ,同比增長25%;企業高質量數據集建設增速超27%[3]。因此,隨著數據集規模的快速增長、數據質量的持續提升、數據維度的不斷豐富,如何加快數據資源的開發利用,充分發揮數據資源價值成為迫切的要求。
1.2 面臨的困難挑戰
然而,我國企業數據高質量開放利用方面仍存在許多短板,數據資源的價值遠未得到充分釋放,具體表現為:
1)數據資產底數不清,數據孤島現象普遍,導致跨部門、跨地域、跨層級的數據協同治理組織構建困難。
2)數據來源及格式異構多樣,海量結構化與非結構化數據對大數據平臺的數據接入、存儲及計算能力構成嚴峻挑戰。
3)統一數據標準規范體系的缺位,造成數據一致性差、語義理解困難、機器可讀性低,嚴重制約了數據價值的深度挖掘和在企業創新與數據要素市場流通中的應用。
4)數據分類分級管理制度缺失,導致無法對不同敏感度和價值的數據實施差異化管控策略,尤其在數據對外共享時潛藏安全風險。
5)數據質量管理制度不健全,導致數據質量參差不齊,已開放數據中充斥著數據缺失、信息密度低、數據碎片化等問題。
2 企業數據資源管理體系研究
運營商從傳統BI向大數據階段邁進過程中,積累了豐富的關于數據資源價值實現的實踐經驗。因此,本文以運營商大數據價值釋放實踐為參考,結合國際上成熟的數據治理體系DAMA-DMBOK2[4],探索大型企業數據資源體系的管理框架。企業數據資源管理體系,如圖1所示。
上述數據資源管理體系由數據治理組織、數據實時匯聚、數據質量保障、數據分類分級管理等關鍵維度組成,首先通過多源異構數據實時匯聚接口將數據接入數據湖;并通過數據中臺建立起統一的數據底座;然后進行數據標準、數據質量、數據分級分類處理,完成高質量數據質量;最后通過統一的開放工具和目錄工具,為上層應用提供數據資源,實現價值釋放。同時,企業應依據數據的使用頻率、業務支撐能力、共享次數、產出價值等維度建立數據價值度量指標體系,定量評估數據資產的業務價值與經濟效益。具體實施中,可借鑒電信運營商“數據資產入表”實踐,結合企業自身業務場景和管理制度,設計統一的資產登記表、評估報告模板與價值標簽體系,系統化梳理和動態更新數據資產。
2.1 組建數據治理組織,推進跨域、跨部門數據管理
建立全方位、跨部門、跨層級的數據資產管理組織架構,是開展統一化、標準化、高效化數據治理工作的先決條件。
首先,運營商為解決數據源頭繁多、內部數據分散,跨部門協調難度高等問題,成立了貫穿各層級的治理組織,通過委員會統籌決策,治理團隊監督管理,各部門執行落地的方式,形成了決策、管理與執行三位一體的協同治理模式,保障數據資源的高效管控。
其次,需建立多方主體共同參與、各司其職的綜合數據治理組織。其中數據治理委員會作為數據管理的最高領導組織,負責數據治理統籌指導工作,決策重點方向和核心工作內容,當數據相關方在數據權責、使用等方面出現爭議時負責仲裁。數據治理團隊制定數據統一規范、統一流程,通過制定數據需求的分類分級管理制度,確保數據在共享交換過程符合規范,安全高效。執行團隊在數據接入、數據使用、數據運營等全過程承擔治理平臺、數據標準、數據質量等實施工作,并在系統設計和開發中遵循數據標準,推動數據治理工作的落地。數據治理組織體系,如表1所示。
2.2 推動企業級數據實時匯聚,形成最全“數據湖”
對于要求計算能力同時滿足海量流批數據實時融合計算以及跨域聯合協同計算等業務場景,搭建企業級數據湖并確定數據流轉原則,滿足多樣化復雜業務場景。
1)多源異構數據實時匯聚共享,夯實企業級統一數據底座。針對海量大數據場景下的實時處理、非結構化數據治理等需求,構建湖倉一體的數據底座,兼顧數據湖的靈活性和數據倉庫的數據管理和分析能力,實現多源異構數據實時匯聚共享和多引擎實時處理,進而建設數據資產匯集、數據算法迭代、數據能力輸出的實時計算框架,滿足企業全域數據實時融合與應用的需求。統一數據底座架構,如圖2所示。
2)明確企業數據流轉原則。通過規范化企業數據流轉準則,為數據的規范化生產、匯聚和使用奠定基礎。應遵循如下原則[5]:一點維護,多點使用。應將數據源系統確定為數據流轉內容的權威數據源,相同的數據內容盡可能從相同來源系統獲取;應明確定義數據流轉的相關系統、數據內容、流轉類型(增量或全量) 、數據量、流轉頻率、流轉觸發條件和技術實現方式;對數據內容的描述粒度細化至實體,遵循數據模型設計中定義的實體名稱和實體范圍。
2.3 建立完整數據質量管理機制,推進數據質量提升
應通過完善的數據質量管理機制,有序持續推進企業數據質量工作。建設內容如下:
構建全生命周期數據質量管理制度:通過制定數據質量相關的管理辦法、評價體系等質量管理規范,形成組織級的數據質量需求管理、數據質量檢查、數據質量問題評估分析方法、數據質量問題提升等管理制度,保障面向數據全生存周期的數據質量管理工作規范性。
實施常態化數據質量稽核與閉環優化:定期開展數據質量檢查、分析與提升工作,并通過數據質量規則庫、生產管理平臺等工具實現數據質量的自動化監控,建立數據質量管理案例庫、知識庫,分析并評估數據質量問題的影響與風險,進一步降低數據質量風險。
培育數據質量文化與提升人員能力:基于量化衡量指標持續改善優化數據質量的同時,還需不斷提升數據治理執行人員的數據質量意識,建設數據質量文化。
2.4 明確企業數據分類分級制度,保證數據分類分級使用
大數據平臺存儲的數據涉及企業生產經營情況和用戶的隱私信息,按照數據的涉密等級、重要性、異常傳播造成的危害性等因素對數據進行分類分級,并制訂不同級別的敏感數據在對外開放和內部管理中應遵循的管控實施要求。
數據分類管理方面,運營商針對內部管理和對外開放場景的特點,為便于對數據進行統一管理及推廣應用,將企業內部B域(業務域) 系統、O域(網絡域) 系統、M域(管理域) 系統、S域(創新域) 系統等數據納入以下四類:用戶身份相關數據、用戶服務內容數據、用戶服務衍生數據、企業運營管理數據。數據分級管理參照《電信和互聯網服務用戶個人信息保護分級指南》,根據敏感程度將數據劃分為四級:第1級低敏感級、第2級較敏感級、第3級敏感級、第4級極敏感級。各級數據的基本管控要求如下。
第1級數據基本管控要求:數據可以直接披露公開,通過基礎的安全技術和方法,確保數據安全開放共享;但要注意開放數據規模和類別,避免被關聯分析。
第2級數據基本管控要求:數據在滿足安全管控的要求下,可以對外開放,通過必要的安全技術和方法,確保數據安全。
第3級數據基本管控要求:數據應實施較嚴格的技術和管理措施,保護數據的機密性和完整性。
第4級數據基本管控要求:數據嚴禁離開公司生產環境,嚴禁對外輸出。
為進一步提升數據共享開放和增值利用效率,還應建立企業數據分類分級規則。企業數據分類分級規則參考,如表2所示。
2.5 建立統一的標準規范體系,促進數據融合應用生態建設
規范化數據生產交付全生命周期管理工作,形成統一的數據融合應用管理制度和規范,實現數據融通價值化、服務模式規范化。
數據標準制訂:從數據定義、業務解釋、數據屬性、業務含義編碼等角度對相關數據標準進行編制、審批、發布的管控過程,以形成具有行業特點的數據標準規范性約束,保障企業使用和交換數據的一致性和準確性。數據標準執行:各業務領域的數據標準規范在各系統設計、開發、上線、運維過程中的執行落地過程。數據標準維護:在數據標準建立后,針對業務不斷發展變化以及開發共享過程多方數據標準不一致等情況,持續調整數據標準,不斷完善數據標準內容。數據標準核查:實現對數據標準執行結果的定期檢查,為統一管理以及數據標準維護提供依據。數據標準評估:數據標準管理工作評估主要是對數據標準管理的日常工作過程的監控,并通過工作評估報告,總結數據標準管理工作成果,明確改進方向。
在保障數據安全與合規的基礎上,企業還應積極探索數據資源的能力開放路徑,推動數據產品化、服務化。建設數據開放平臺、數據API接口等方式,向合作伙伴、上下游企業提供標準化、模塊化的數據能力服務,實現數據從資產到生產要素的價值轉換。當前已有頭部企業采取“數據中臺+數據市場”的模式,實現企業內部數據高效流通與外部生態的共享聯動。此外,鼓勵參與行業級數據生態合作,例如共建數據聯盟、參與數據共享試點,提升跨企業、跨行業的數據互聯互通水平。加強數據治理、標準對接與能力輸出,企業不僅可提升數據資源使用效率,也能在產業鏈中占據更具競爭力的核心地位,真正實現數據驅動高質量發展。
3 結束語
通過從頂層戰略規劃入手統籌管理,從組織、管理、制度、技術等方面全面規范與保障數據在企業內部以及對外運營各環節的對接和共享,整合企業內外部、行業相關全域數據,積極開展集中化、標準化、數智化的數據資產管理體系建設,實現融通共享的統一數據管理體系。在數據要素市場化配置改革不斷推進的大背景下,未來企業應圍繞數據目錄構建、數據能力開放、數據資源運營等方面持續發力,強化數據資源作為核心生產要素的流通與價值轉化能力。同時,進一步依托智能化工具與平臺,加快推進數據驅動的數字化轉型與智能化升級,全面提升企業核心競爭力與創新能力。
參考文獻:
[1] 國務院.關于印發“十四五”數字經濟發展規劃的通知[EB/OL].國發〔2021〕29號,2021-12-12.
[2] 國家數據局,工業和信息化部等.關于促進企業數據資源開發利用的意見[EB/OL]. 國數資源〔2024〕125號,2024-12-20.
[3] 國家數據局.全國數據資源入表年度發展報告(2024) [R].北京:國家數據局,2024.
[4] DAMA International.DAMA-DMBOK: Data Management Body of Knowledge,2nd Edition[M].Westfield:Technics Publications,2017.
[5] 劉晨,邵卿.供給與流通視角下企業數據資源體系的建構與實踐[J].數字經濟,2024, (12):66-71.
【通聯編輯:朱寶貴】