程廣明 李堯 劉小茵
摘 要:分析了云計算環境下的數據的特點,提出了云端數據治理定義,并將該定義分解成三個部分進行深入解讀,最后對比了云端數據治理與傳統數據治理和大數據治理在概念上的區別與聯系。
關鍵詞:數據治理 云端數據治理 大數據 云計算
中圖分類號:TP274 文獻標識碼:A 文章編號:1674-098X(2017)06(a)-0185-02
在傳統數據治理領域,國際數據管理協會(DAMA)、數據治理研究所(DGI)、IBM、CMMI研究所、Gartner、普華永道等組織提出了多種數據治理框架或數據治理模型[1]。云計算環境下數據特點發生了很多的變化,尤其是數據在云端的操作給數據治理帶來了很多新的內容,如云端數據來源的多樣性、云端數據的遠程存儲與傳輸、云端數據的合規要求更復雜性、云端數據面臨的安全威脅更多等,都超越了傳統數據治理的范疇。
1 云端數據治理定義
云端數據治理是以云端數據為主要治理對象,制定與云端數據戰略、數據管理、數據優化、數據安全與隱私保護等相關策略,指導組織規劃、構建、評估和優化數據治理體系的活動集合。
我們將上述云端數據治理的定義分解為以下三個部分。
(1)云端數據治理的主要治理對象為云端數據。
隨著云計算的廣泛部署和深入應用,現階段及未來相當長一段時間內,根據數據的存儲位置劃分,數據可以分為本地數據和云端數據。數據本地存儲是互聯網發展起來之前數據存放的主要形式,此時的數據量是相對較小的,組織對其管理也相對比較容易。隨著互聯網、云計算等技術的廣泛應用,越來越多的用戶選擇把數據存儲在云平臺上。
云端數據主要來源于兩大部分:一是組織本地數據向云端的遷移,二是云端自身數據的聚合。從數據成分上來看,云端數據除了是傳統格式化數據外,更多的是半結構化和非結構化數據。
(2)云端數據治理關乎云端數據戰略、數據管理、數據優化、數據安全與隱私保護等相關的策略。
云端數據治理關乎策略策的制定,這些策略成為開展數據治理的指導文件和措施依據,包括數據治理戰略、數據管理策略、數據優化策略、數據安全與隱私保護策略等。
戰略是一項活動的宏觀性綱領,是一種從全局考慮謀劃實現全局目標的規劃。數據治理戰略是對數據治理活動的頂層設計和遠程規劃,其目的是在數據治理活動得到數據治理相關者的理解和認同前提下,對未來一段時間內數據治理活動規劃。
數據管理是對數據進行基礎規范以支撐數據治理整個活動的實施,涉及業務術語、元數據管理和主數據管理等。業務術語是數據治理的基礎,是為了獲得組織對某項事情有個統一的認識。例如,對數據治理成本的進行估算時,究竟是采取以“萬元”為單位還是以“元”為單位,又或是當進行數據整理時,小數點后數值保留幾位,要不要“四舍五入”還是“取整去零”等。
云端數據必須優化,不是所有數據都是可以直接使用的。一方面,云端數據擁有大數據所具有的特點,數據體量大、結構復雜,造成數據價值密度低,所以必須對云端數據進行優化。另一方面,為了最大程度上發揮數據的價值,也必須對數據進行整理優化,通過數據聚合分析發揮單體數據所不能體現出來的價值。數據質量管理、數據操作、數據架構都是為了實現數據優化而進行的數據治理措施。
(3)云端數據治理是一套包含規劃、構建、評估和優化的活動集合。
云端數據治理是依據制定的各項策略對云端數據進行治理的活動集合,為此組織需要建立一個完整的數據治理體系,覆蓋統籌和規劃、構建和運行、監督和評估、改進和優化四大階段[2],促進云端數據治理的落地以實現既定目標。組織云端數據治理體系基本框架如圖1所示,該圖展示了云端數據治理的四大階段,以及每個階段組織需要開展的主要工作。
統籌和規劃階段是云端數據治理活動的前期準備階段,其目標是要統籌和規劃數據治理目標和任務,謀劃必要的治理環境,做好數據治理實施的準備。構建和運行階段是云端數據治理策略的實施階段,其目標是構建數據治理實施的管理機制,確保數據治理實施的有序運行。監督和評估階段是云端數據治理實施效果評估的階段,其目標是監督云端數據治理的實施過程,評估云端數據治理實施的符合性和實施的質量。改進和優化階段是云端數據治理的過程和結果提升階段,其目標是促進組織持續改進云端數據治理實施的過程,提升治理實施的有效性。通過策劃、實施、檢查和調整(PDCA)的活動循環,持續改進云端數據治理體系,因此云端數據治理是一系列活動的集合。
2 云端數據治理與傳統數據治理的區別與聯系
云端數據治理本質上也是數據治理,是數據治理在云計算環境下的一個新發展方向,但是由于治理對象特點的差異,二者又存在著諸多的不同。表1簡要概括了云端數據治理與傳統數據治理和大數據治理在概念上的關系。
3 結語
云端數據治理是數據治理理論在云計算環境下的最新發展,但是治理對象的差異性特點使得云端數據治理被賦予更多新的內涵。首先,云端數據治理的對象主要為聚集在云端的數據;其次,云端數據治理關乎云端數據戰略、數據管理、數據優化、數據安全與隱私保護等相關的策略;再次,云端數據治理是一個包含規劃、構建、評估和優化的治理管理體系。
參考文獻
[1] 程廣明.大數據治理模型與治理成熟度評估研究[J].科技與創新,2016(9):6-7.
[2] 李堯,程廣明.云端數據治理初探[J].科技創新導報,2017 (1):96-97.