Craig Brown Charles

數據治理并不復雜,但它的實施需要有專家的建議,而且還要熟悉企業內部,知道其特性,才能開發出帶來實際利益的解決方案。
任何企業最關鍵的一種資產就是數據。如今,企業產生的數據量驚人。所有這一切的核心就是數據治理。盡管這是一個熱門話題,而且還有很多關于數據治理的文章和白皮書發表,但有些企業領導似乎仍然漠不關心。我們需要在這個問題上講得更清楚些。
數據治理是什么?
數據治理的簡單定義是針對企業數據資產管理進行治理的核心流程和策略。數據治理的主要目標是查明哪些數據和信息是重要的,建立管理數據和信息的流程,并衡量實現業務目標的工作是否有效。
通過建立由專注于技術和業務的相關方組成的成熟部門來實施數據治理,該部門記錄策略,生成控制數據對數據進行監督,采集、定義、存儲數據,并分發到整個企業中。
隨著大數據的興起以及數據源的激增,企業要處理的數據越來越多。互聯設備、智能手機、社交網絡和網站能收集大量有關企業表現的數據,例如,客戶的感受或者競爭情況等。
此外,分析技術使用起來也越來越方便了,能夠分析這些數據,從而提高業務績效。這兩種現象催生了所謂的數據驅動型企業。
什么是數據驅動型企業?
簡單說,數據驅動型企業指的是這類企業:經常使用分析技術來分析所掌握的數據,以便做出決策。
在真正以數據為驅動的企業中,所有員工和管理人員在日常工作中都會以整合的方式使用數據。銷售、營銷和財務經理必須能夠利用他們所掌握的所有相關數據,快速做出決定,從而促進業務取得成功。
高明的數據驅動型企業能夠在正確的時間,使用正確的數據,做出正確的決策。數據驅動型企業的優勢還在于他們能夠從業務的各個方面收集相關數據。
與之相關的好處是,這樣他們就能夠更好地了解關鍵要素,例如,客戶行為或者市場趨勢等。把數據分布在整個企業中能夠降低做出錯誤決策的風險,降低與企業數據安全相關的風險,提高效率,并減少IT支出。
為什么要考慮數據治理?
“治理”這個術語顯然包含著質量的概念,因為這是數據治理的主要目的。為什么要考慮數據質量呢?因為糟糕的數據對業務的影響是顯而易見的:貨物運錯了地方,客戶收到的產品與廣告描述的不符……,等等。然而,糟糕的數據質量可能會產生更微妙的影響:例如,由于你無法準確地識別客戶所購買產品的類別而錯過打折銷售,由于不準確的尺寸數據使你在比較網站上名譽掃地,而導致網上銷售損失,等等。
我想你也可以問問自己,“為什么我必須在我的公司中使用數據治理?”原因是,公司的一些員工在日常工作中可能已經開始檢查數據質量了。例如,會計師會核實過賬是否記錄在正確的賬本上,會計部門會核實送出的發票,是否收到了相應的款項。
企業的大多數運營數據已經嵌入到主動管理過程中,但在大多數情況下,人們的興趣不僅在于數量,還在于質量。基準數據是最不受質量控制的數據,由于它會驅動很多業務流程,所以數據治理就是要為這些數據的質量建立正式的管理職責。
數據治理導致了態度的轉變:我們從被動的質量方法轉向更主動的質量方法。通常,只有當一個過程失敗、無法交付或者計算機系統停止工作時,我們才認識到數據質量不好。在某些情況下,這是發現問題的最佳方法。由于數據質量差而發生事故也很常見,而且沒有人愿意為此承擔責任!數據治理確保了責任明確到人,不僅要糾正問題,而且要降低問題發生的風險。
可靠的數據治理策略
越來越多的企業希望能成為數據驅動型的。然而,很多企業未能把所掌握的數據轉化為可操作的信息。這類失敗的主要原因往往是項目界定模糊不清,以及缺乏實現既定目標所需的人員、工具和技術。
要使企業成為數據驅動型的,有幾個步驟是必不可少的。首先,企業必須定義要衡量哪些成功指標,并將這些指標與將用于衡量的數據集相關聯。這種舉措使得企業能夠準備好每個部門執行的具體措施,并使之與企業總體戰略保持一致,根據既定目標和目的去衡量績效。
其次,數據和分析工具必須在整個企業中得以推廣應用。否則,目標會很難實現。領導層可以通過量化并分享財務收益,參考對業務部門工作效率的影響來推動其應用。隨著分析工具的推廣,其應用更加廣泛,協作也更好了。除了這些步驟外,還有幾個關鍵要素對于數據驅動業務戰略的成功至關重要。這包括:
● 一套主數據管理(MDM)工具:一套集成并維護主數據的工具和方法。這些工具與數據治理密切相關,支持企業的數據專家維護他們負責的主數據域。對于企業來說,結合其數據治理策略開發MDM策略是非常重要的。否則,數據治理項目失敗的風險會被放大,最終也更有可能得到的信息不完整和不準確。
● 更好地理解數據的元數據管理解決方案:元數據管理解決方案支持使用定義,以及其他數據公式,幫助企業以更全面的方式理解數據。這些工具包括識別數據庫表、報告、儀表盤以及可能受數據庫更改影響的其他部件。因此,利用元數據管理功能,企業能夠在采取行動之前分析決策的影響。
● 研究數據的商業智能工具:商業智能工具從企業數據中獲得更好的回報。使用這些工具,用戶可以研究信息子集、查詢和開發預測模型。
● 把數據轉換為信息的組織良好的數據體系結構:要把數據轉換為可操作的信息,企業應采用三要素的數據體系結構。必須對每個部件進行設計和建模,以實現特定的目標。第一個部件(或要素)是“著陸區”,其中含有被提取的數據。第二個是所謂的“合規”部件,用于整合這些數據。最后,“分析”部件把數據轉換為格式化的信息,從而可以被自動分析工具和其他商業智能解決方案所使用。
● 收集數據的提取工具:如果只有組織良好的數據體系結構,但卻沒有數據,也會一事無成。因此,對于數據驅動型企業來說,獲取數據采集工具(也稱為提取轉換加載(ETL)工具)非常重要。此外,開發某種策略來理解對源系統所做的更改也是非常重要的。數據變更采集策略有助于隨著時間的推移維護好歷史數據。
數據治理對于幫助決策者獲得清晰、相關和一致的信息是必不可少的。數據治理有助于確保數據質量并定義KPI(關鍵績效指標)。
數據治理是數據驅動型業務的關鍵,因為它不僅節省了資金,而且還幫助企業更賺錢;確保數據的一致性、可靠性和可重復性;解決分析和報告問題;指導所有其他分析活動;讓企業更加自信,對數據清晰明了。
很多企業都犯了把數據治理項目的實施交給IT部門的錯誤,而這些項目在企業領導的直接支持下更有可能獲得成功。有充分的證據表明,能訪問企業主數據的應該是管理人員。當然,管理人員需要數據專家的支持,以便能夠部署可靠和穩健的數據治理策略。
最后,數據治理并不復雜。它的實施需要有專家的建議,而且還要熟悉企業內部,知道其特性,才能開發出適合自己的情況并帶來實際利益的解決方案。
Craig Brown博士是一名作家、創新和技術領域的領導者、執行導師和資深高管,在數據驅動和以數據為中心的能力方面有豐富的專業知識。