鄭金輝
(中國電信系統集成公司,北京 100035)
數字經濟的出現給傳統產業帶來了根本性的變革,隨著數字化轉型的深入和“十四五”規劃的開展,數據作為重要的生產要素已經成為行業客戶的共識,數據中臺和數據能力建設也成為行業信息化關注的焦點。本文謹從數據中臺建設各相關需求、數據中臺建設關鍵要素以及數據孤島消除等幾個層面展開進行分析,嘗試對數據中臺建設進行剖析。
數據中臺的概念正處在認知整合期,業內各方對數據中臺的認知正在趨向統一。與大數據應用平臺更關注數據應用場景不同的是,數據中臺是一套讓企業數據持續運轉的機制,通過數據域公共服務能力的建設實現了數據從資源到資產的升華。通過業務數據化和數據業務化實現企業數據的有序流動,最終實現數據的可見、可用、可運營。
數字經濟的出現給傳統產業帶來了根本性的變革,對IT的訴求也從基礎支撐向激發創新和價值賦能轉型。在這樣一個背景下,數據從資源向資產的躍遷成為趨勢。從這個角度說,數據中臺建設就有了兩個導向,一個是從IT基礎設施出發的能力建設導向;另一個是從業務需求出發的價值創造導向。
首先是能力建設導向,一般是從IT基礎設施層面發起的,由IT部門主導,是IT從基礎支撐向服務業務轉型的一種架構升級措施,希望把IT側的能力從資源供給向能力供給轉變,數據就成了關鍵的抓手,建設的是平臺,期望的是能力。
價值創造導向,一般是由業務部門主持,從業務需求出發,把數據當作生產要素去管理,希望通過對數據的加工和利用實現業務側的價值,建設的是應用,期望的是成效。
這兩種思路從根本上來講,不矛盾,但也不是一個思路,能力建設是IT部門的絕地反擊,價值創造是業務部門的主動覺醒?,F階段和未來一段時間IT建設的主旋律都會圍繞IT部門和業務部門展開。換句話講,誰掌握了數據域規劃和建設的主導權,誰就掌握未來IT的主動權。
數據中臺建設過程中,在客戶側始終存在三類角色,代表著客戶不同層面的訴求。首先是管理層的訴求,然后是業務部門的訴求,其次還有IT部門的訴求。
(1)管理層的訴求,核心思想還是把數據資產盤活,讓數據流動起來,發揮數據對管理的驅動作用。這個層面的需求也是數據最初價值的體現,其重點是決策分析和經營分析等應用場景,同時也會格外關注數據的整體價值。如何取信管理層,是數據中臺項目成敗的關鍵。
(2)業務部門的訴求,核心思想是如何讓數據驅動業務發展,如何快速獲取數據,如何便捷使用數據,如何敏捷進行數據開發,業務部門是數據需求的主體。業務部門不一定是數據域建設的主體,其核心訴求還是在于如何快速敏捷地獲取數據服務。數據中臺的建設,必須關注和引導業務部門需求的走向,把大數據應用建設向數據服務獲取推進。同時有必要讓業務部門接受把數據域的建設中心轉移到基于平臺服務的數據應用場景建設上,實現自助式數據分析是一個非常重要的愿景。
(3)IT部門的訴求,核心思想是延續傳統IT的生命力和地位,從資源型IT向服務型IT轉型是IT部門面臨的重要課題。在這樣一個背景下,數據域就成為關注焦點,從IaaS到PaaS再到DaaS,能力建設始終是關鍵抓手。主要包括兩方面的能力:一是數據資源能力,從散亂無序的數據資源到有序分層的數據資產的能力;二是數據服務能力,從數據采集、數據存儲、數據分析到數據開發這樣一個全生命周期的數據服務能力。IT部門在數據域的核心抓手有兩個:一是數據管理權,代表組織對全域數據行使管理權,雖然這樣做很難,但是必須去做;二是數據服務能力開放,數據能力的建設只是一方面,更重要的是要實現數據服務能力的開放。
數據中臺能力建設,總得來說可以概括成五個重要的環節,分別是“匯、融、管、用、營”。
(1)匯:數據匯聚是第一個重要環節,也是開啟數據中臺新型能力建設的第一步。重點是實現集約化的數據采集能力,包括各種采集手段和采集工具的整合和統一,同時實現原始數據的匯聚(至于是建設數據湖還是數據倉要具體問題具體分析)。
(2)融:數據融合是實現數據場景化應用的重要步驟,如何實現基于業務需求場景的數據分層管理是核心問題。從原始數據入湖、標簽數據入倉,再到主題數據在數據集市或者主題數據庫的加載,總之是要實現數據的分層管理。另外,還需要完成一個關鍵動作,那就是完成數據治理和數據資產化。
(3)管:核心內容是實現數據分析等數據服務能力建設,通過數據服務開放平臺實現數據能力的開放和統籌管理,這是“管”的核心內容。當然“管”還包括數據的整體監控和平臺運維等內容。
(4)用:指的是數據應用的建設,對于中臺來講需要重點關注數據研發能力建設,要以實現數據自助服務為目標,實現數據應用全生命周期的服務和管理。
(5)營:指的是數據運營。數據運營才是推動數據流動的終極手段,通俗來說就是讓數據用起來,活數據才是真正的有效數據,才能發揮價值。
“冰凍三尺非一日之寒”,數據孤島的形成也不是一兩個人或者部門的原因,這里面有IT建設自身的問題,也有組織的問題??偟膩碚f,一般把數據孤島分成兩種情況:一種是物理上的孤島,一種是邏輯上的孤島。物理孤島很容易理解,就是以物理形式單獨存在孤立的數據源,這往往是因為在多業態的格局下,缺乏統一的業務戰略規劃,導致數據在不同部門和業態之間相互獨立存在。邏輯孤島就相對隱蔽一些,很多行業客戶表面上作了數據互聯互通,卻沒有收到應有的效果,這就是因為沒有及時關注和消除邏輯孤島。那什么是邏輯孤島呢?我們一般認為,不同部門站在自身利益和認知的角度對數據進行單獨的定義,一部分本該一致的數據被賦予了不同的含義,增加了數據融合的成本。
對于數據孤島的形成,除了我們傳統認知中的“部門墻”的問題,很大程度上也是因為數據作為企業核心資產沒有得到戰略重視有關系。數據孤島的消除要從戰略、技術和管理等多個方面協同發力才能取得效果,不要妄想建一兩個數倉,建設一個大數據平臺就能實現,要做好持續作戰的心理準備。徹底解決數據孤島,也不是一個一蹴而就的事情,需要統籌規劃、分步實施:
(1)多源數據融合,解決存量數據的合理應用。消除數據孤島還是應該首先從需求角度入手,應該首先解決不同角色和部門對數據的不同訴求。為什么把這一點擺在最前面呢?大家都已經意識到推動數據業務變革的難度了,在任何一個組織內部推動這樣一項工作都是困難重重。所以筆者更贊成讓企業盡快看到數據變革的效益,盡快嘗到甜頭?;诂F有數據盡快開展多源數據融合,實現異構數據的整合,實現數據的統一采集和統一存儲,形成幾個容易見效的主題數據資源(主題數倉),不失為一個好的選擇。
(2)明確責任權屬,澄清數據責權利。有了一個好的開始,就得針對數據孤島的病根入手了,需要徹底清算和盤點數據的權屬問題。我們需要堅持一個底線,那就是數據屬于整個組織,而不是某個單獨的部門和團體。數據的所有權、管轄權和使用權,一定要分開,不能混在一起。在這樣一個大的原則下,開展數據責權利的梳理,最好是在企業戰略和基本章程里面進行明確。在組織機構層面也需要進行配套的變革,可以設立專門的崗位和部門代表整個組織行使數據的管轄權。
(3)實施數據治理,確定數據新秩序。明確了責任邊界,就可以在數據團隊的帶領下,進行徹底的數據治理,也就是建章立制,樹立標準規范。為什么不一開始就實施數據治理呢,其實是為了降低推行數據改革的難度,讓事情得以順利實施。數據治理什么時候做,跟組織的行動力和執行力關系非常大,如果是一個高效執行力的組織,第一時間做數據治理也未嘗不可。
(4)打造數據服務,徹底疏浚數據流。數據治理完成以后,數據資源盤點也就明確了,數據的資產化也就有了基礎,我們就可以更明確從業務需求出發構建數據服務了。通過數據中臺建設打造數據服務開放平臺,通過數據服務接口調用建設各類面向業務場景需求的數據應用,甚至可以打造面向敏捷數據需求的自助數據分析服務。如果這一愿景得以實現,我想沒有哪個業務部門會想著自己去維護一堆雜亂無序的原始數據,數據孤島也就是被洶涌的數據洪流給沖散了,我們的數據湖和數據河也會持續奔流。
綜上所述,數據中臺有兩個關鍵點,一是沉淀,首先是數據資源的沉淀,然后是能力的沉淀,數據全生命周期管理的能力沉淀;二是重用,沉淀不是目的,重用才是目的,更多的是能力的重用。面向整個組織,強調全域數據的能力輸出,降低重復建設,提高數據應用建設效率和效果。
數據中臺的建設不是產品和技術堆砌的過程,而是企業IT架構系統性的變革,向下需要基于已經形成的云資源和云服務打造形成平臺化的數據服務能力,向上需要形成彈性靈活敏捷的數據應用支撐開發環境,更是未來數據資產化的重要載體。