◎李舒揚
數據治理(Data Governance)是組織中涉及數據使用的一整套管理行為,其由企業數據治理部門發起并推行,涉及到如何制定和實施針對整個企業內部數據的商業應用和技術管理的一系列政策和流程。數據治理并不是一個新詞,最初企業中的數據治理是相對簡單的,幾乎所有被治理的數據,都是在企業內部的事務處理系統中生成,與現在相比,數據量較低,數據類型、IT 環境也比較單一。隨著IT 技術的整體發展,特別是大數據時代的到來,如何更好地利用數據已經成為企業數字化轉型的關鍵。
從國家層面看,隨著現代產業的發展,尤其是隨著互聯網技術及其應用的發展,加強數據治理能力更加重要、更加緊迫。數據是國家獲得更多治理資源、治理手段的前提,也是國家之間進行政治、經濟和文化博弈的重要抓手。政府獲取數據、使用數據進行社會管理、社會管制及社會治理,是國家現代治理能力最重要的組成部分,是國家的核心競爭力重要體現。對于企業或其他市場主體而言,擁有更多信息并獲得強大的信息搜集、加工和處理能力,正在成為企業獲得強勁發展勢頭,個體獲得更多機會的一個重要方面或選項。企業數據治理的重要性表現在以下方面:
企業基本數據是企業決策的客觀標準。眾所周知,目前在數據領域最流行的一句話為“更好的數據,意味著更好的決策”。在當今的大數據時代這句話更為真切,它之所以成為肯定的結論而未改變,那就是基本數據是準確、可靠、值得信賴的,能夠為決策者提供重要參考依據。可以說,基本數據是企業生存發展的基礎,能夠有效促成各種業務功能的實現,如果基本數據處理的IT 技術與企業業務融入不夠,就會影響企業的發展,企業就沒有發展后勁。
基本數據是企業生存發展的基礎。現實生活中,對部分企業進行實際的評估結果發現,能夠實現IT 技術與企業業務有機融入的情況卻屈指可數。目前,對相當一部分企業而言,IT 技術與各種業務目標之間仍存在差距,首席信息官及各高級主管仍在努力設法使IT 技術配合各種業務目標,從而促進企業戰略目標的實現。可以說,在數字化時代,有效的數據治理是成功企業的法寶,它會使企業在激烈的市場競爭中處于不敗之地。
早在2009年,《大數據資產:聰明的企業怎樣致勝于數據治理》一書的作者Tony Fisher 就曾提到,如果基本數據不可靠,大多數企業的大數據計劃要么會失敗,要么效果會低于預期。如今,隨著種類、數量日益成倍增加的數據從各種在線渠道洶涌而來的局面,數據處理的迫切性也日益加強,企業面臨著對大量數據的處理繁重任務壓力。
盡管企業數據治理在企業發展中具有至關重要性,但客觀而言,目前對相當一部分企業而言,卻存在以下方面的制約因素,現已嚴重影響企業數據治理在企業發展中作用的有效發揮。
在人工智能、大數據、物聯網等新技術的快速發展的新時代,數據治理現已被所有的主體,尤其是各類企業所重視,現有一些企業已將數據治理納入整體戰略布局中,并研究建立相應的組織、制度、機制予以保障。然而,數據治理畢竟是一項龐大而體系化的工程,在其深入推進過程中,面臨著以下困境和阻力。
數字經濟與數字治理密切相關,以往對多數人而言,尤其是一些決策者,往往認為數據治理只是IT 系統管理員的必備技能或基本功,往往對數據、數字重視程度不夠,有的對數據治理相關問題認識。其實,在信息化、智能化、數字化的新時代,組織內部信息化建設正從以往的以應用為中心,向以數據為中心方面轉變。在此情況下,組織必須認識到數據的巨大價值,因為低質量的數據和復雜的數據應用手段,不僅會讓數據價值發掘的效果大大降低,有的甚至會讓組織決策層喪失數字化轉型的信心。當前,現實生活中,部分企業的決策層,由于數據治理意識不強,對數據治理認識不準確,甚至缺失,現已影響到數據治理的成效。
數字治理與傳統企業管理不同,因為其涉及數據、網絡設施,因此具有事后難以補救的特點。從一些企業信息化、數字化發展軌跡便不難看出,一些企業采用“先建設、后治理”的方式進行數據治理,由此導致其數據治理具有明顯的被動性和滯后性,不可避免地加大后期治理的難度。不僅如此,事后治理還往往會給組織帶來較大不可挽回的損失。因為有效的數據系統設施,一但出現問題,發生毀損,再進行改造,其原有的設施材料就可能會完全報廢,所存儲的數據也有可能丟失。
數據治理具有很強的專業性,需要專門專業人士承擔此任務。實踐中,盡管一些企業也都是由企業IT 工作人員兼職負責此項工作,然而,數據治理不是組織內部一個部門的工作和任務,需要各部門都進行數字化改造。實際工作中,由于一些企業各部門缺少相應的IT 專業管理人員,其他工作人員既不熟悉數據治理專業知識,同時也不熟悉相應專業流程,致使其無法與企業IT 工作人員共同參與數字治理,這就不可避免地造成跨組織部門協調難度加大。而缺少企業各部門工作人員的參與,不僅會加大數據治理工作的繁重程度,還會影響整個企業數字化轉型的進程。
數據治理并非是掌握了計算機技術,簡單上一個計算機系統就能解決的問題,而是一個投入資金多、周期長、見效慢的系統工程,而且它需要組織內部從高層,到數據治理團隊,以至于技術部門、業務部門的長期不懈的堅持。由于組織的投資決策多數情況下是以能夠產生可預期的成效為前提的,因此人力、物力、財力等方方面面需要投入較大,且成效不能立即顯現的數據治理,多數情況下并不被企業所看好。此外,數據治理就如同一個基礎設施,是以支撐組織戰略和長期發展為目標的,而此類項目又無法界定其明確的邊界和目標,致使有些企業持續推動動力不足。
近年來,隨著大數據的發展,各種詞匯用語層出不窮,令人眼花繚亂。如,主數據、元數據、數據倉庫、血緣追蹤、資源目錄、結構化非結構化、聯機分析處理(OLAP)、聯機事務處理(OLTP)、商業智能(BI),等等。這些詞匯用語既有針對傳統數據庫的,也有針對現代大數據數據庫的,加之一些組織對自身數據資產情況缺少足夠清晰的認識,不可避免會導致數據治理的技術選型困難。當下,基于傳統關系型數據庫,仍然符合絕大多數據企業的業務需求。
數據治理具有專業性、可控性和多級性,這是數據治理最明顯之處。數據治理的專業性是指其是指整個過程離不開專業人員的規劃、設計、掌控。數據治理的可控性是指所有共享數據均由一個控制中心或終端所控制,而每一登錄該系統應用程序的設備都有權限的限制。如,企業中層管理者可能會決定所有下屬人員都應使用同一個數據分析應用程序,但包括企業中層管理者在內的,以及所有下屬人員只應允許其查看自己的業績情況和機會,只有IT 系統管理員和企業高層管理者才能進入系統,查看所有信息。數據治理的多級性是指將對用戶權限及數據訪問進行多級管理,使IT 系統管理員可以方便地基于業務管理要求和需求調整管理權限和訪問方式,又不至于因為系統問題而出現數據丟失現象。
數據治理包括盤點和控制正在使用的數據兩個方面。而通過對數據的盤點及定義,并設置對應的校驗控制,有利于設置適當的數據訪問權限。這就是大家熟知的在系統中內置屏蔽或保護個人或敏感信息功能,當在系統中錄入錯誤的數據內容時,系統則會做出控制及提示,這既便于輕松地與其他同構或者異構數據融合應用、與新技術融合應用,同時也能識別出數據運行領域數據的質量及存在問題與否。如果IT系統管理員盤點和控制正在使用的數據時,發現不同用戶使用同一個數據集分析出不同的結果時,就便于識別出數據質量的領域。
明確用戶訪問數據控制是大家熟知的、重要的數據治理。數據治理的最主要功能和目的是用戶必須通過安全連接(例如VPN)進行連接,才能確保數據的訪問和完整性。如果用戶不是通過安全連接進行連接,系統則會立即提示有安全風險。一個企業數字治理,是企業內部IT 系統管理員規劃設計的專門系統,只有如此,才能明確用戶訪問數據控制。
數據治理與傳統企業管理一樣,都存在管理權限和范圍的問題。因此在數據治理中,制定設計數據運行領域是一個較為重要的問題。企業內部IT 系統管理員可以設計數據管理的一定范圍。例如,某個策略不允許數據領域外被其他區域的訪問者使用,或者某個功能模塊僅允許其指定類型的數據存儲在指定區域運行,這也就是指數據的運行領域。
企業內部IT 系統管理員需要數據監管的法律法規,以及相應的行業規定,因IT 系統管理員的一項重要職責是識別監管要求的源頭,確保監管的合規性,關注即將生效的或最新的合規性標準,這些都離不開對標準行規的熟悉和掌握。例如,根據某國消費者隱私法案規定,即使不在該區域的企業也需要考慮客戶,合作伙伴和供應商的位置,對其數據進行相應的保護措施和接受使用限制。客觀而言,標準行規的掌握是IT 系統管理員的必備素質,或者說是從事數據治理必須具備的能力。
盡管企業數據治理在企業發展中具有至關重要性和益處,但客觀而言,目前對相當一部分企業而言,都存在以下方面的制約因素,影響企業數據治理在企業發展中作用的有效發揮。
縱觀各專業組織對數據治理內涵及實踐方法的分析及框架,企業開展數據治理應從以下方面入手:
在人工智能、大數據、物聯網等新技術的快速發展的新時代,數據治理涉及范圍廣,甚至會對企業工作效益帶來影響。而數據治理的前提是要數字化知識和數據治理意識,尤其要增強企業高層領導的數字治理觀念,強化數字治理意識。首先,企業高層領導是企業發展規劃的深度參與并最終決策者,強化其數據治理意識,有利于數據戰略方針的制定和規劃的實施。其次,在數據治理項目實施過程中,強化企業高層領導的數據治理意識,有利于數據治理理念的宣傳貫徹,有利于營造企業數據治理文化氛圍。此外,強化企業高層領導的數據治理意識,有利于企業的頂層設計更加切合數字化時代的發展實際,具有前瞻性、全局性、整體性。總體而言,數據治理的各項工作和實現路徑,不僅僅是技術工具,還包括戰略規劃、組織架構、制度機制、規范標準等,只有自上而下保障各項活動的有效開展并互相促進,強化企業高層領導的數據治理意識,企業數據治理體系才有可能最終形成。
數字治理的流程是企業進行數據治理的科學基礎。作為一項長期性、基礎性專業性較強的工作,企業數據治理能力的推進一般要經歷初始、基礎、成熟、卓越四個階段。而不同企業,盡管數據治理的方法論看似大同小異,但不同企業行業間的數據問題、現狀各有特點。因此應堅持因地制宜、策略推進,遵循分階段、分目標、分重點的原則,深入開展各項具體的建設工作,做到成熟一項,推廣一項,從而達到由量變到質變的飛躍。
數據組織架構體系是企業數據治理的組織保障。企業應結合公司戰略及現狀,根據各行業信息化技術規定的要求,建立了數據治理組織架構體系并明確相應的職責。如在戰略層面,由數據治理Sponsor 和各部門負責人組成的數據治理領導組制定數據治理的戰略方向,以營造數據文化和氛圍為目標,整體負責數據治理工作的開展、政策的推廣和執行,并作為數據治理問題的最終決策組織監控和監督數據治理工作,并確保數據治理工作預算支持。另外,應建立數據治理戰略運作層面具體的實施團隊,數據治理委員會和各領域數據治理工作組。其中,數據治理委員會由數據治理項目負責人、數據治理專家和數據架構專家團組成,針對企業整體進行數據治理工作進行統籌并提供工作指導,在整個企業范圍內定期溝通數據治理工作,形成數據質量精細化管控文化。此外,根據數據治理領導組的愿景和長期目標,建立和管理數據治理流程、階段目標和計劃,設計和維護數據治理方法、總則、工具和平臺,協助各數據領域工作組實施數據治理工作,對整體數據治理工作進行度量和匯報,并對跨領域的數據治理問題進行解決和決策;而各領域數據治理工作組,則在各領域數據范圍內進行數據治理,依據數據治理委員會制定的數據治理方法和總則,制定本領域數據治理目標和工作計劃,負責本領域數據資產的看護,維護更新相應數據標準和及相關元數據,設計本領域數據度量和規則,監控收集數據質量問題并持續改進提升,及時升級相關數據,最終完成領域內數據資產的看護,并支撐數據治理目標的達成。
常言道:“無規矩不成方圓”,對數據治理而言,企業內部的數據治理制度就是指企業自身要通過制度規范建設,制定相應的數據管理制度,即數據治理的制度規范,以此對數據定義、分類、格式、編碼等進行標準化管理。也就說,企業應制定數據標準,并對數據類型、長度、歸屬部門等定義一套統一的規范,以保障不同業務系統之間可以做到對同樣的數據理解統一和使用統一。企業內部多層次制度體系應由以下部分組成:企業在制度建設層面,作為數據治理工作總綱領,用以明確整體工作目標、組織架構和原則;在管理辦法層面,按數據質量管理、數據標準管理、元數據管理、主數據管理等數據治理領域,建立子領域的管理機制;而在實施層面,按需明確具體工作領域的職責、具體工作內容和工作流程,以便相關部門操作執行。
有了全面設計、制度體系、平臺工具等支撐,還要努力夯實數據治理基礎。數據治理是一項長期動態的過程,不能抱有“畢其功于一役”的想法與態度,必須將持續穩扎穩打,建立科學的正向反饋和閉環運營機制,擴寬數據用戶,構建數據生態,不斷適應和滿足數據資產的應用和管理需求。