繆新萍 王鵬宇 孔慶波


摘 ?要: 數據治理已經成為企業如何充分發揮數據資產價值、全面推動數字化轉型所面臨的重要課題。然而,面對浩如煙海的數據,從何處著手加以有效治理成為一個棘手問題。本文介紹了貴州電網公司在開展數據認責工作中,就如何確定核心認責數據項使用的以問題為導向的核心數據識別方法。通過對數據問題的歸集、分析,從中提取問題分布較集中、業務影響較大的核心數據項,而后借助歸因分析進一步篩選出作為實施認責管理的核心數據項,從而確保突出的痛點數據問題得到有效解決,數據認責管理工作更具針對性和有效性。
關鍵詞: 數據認責;核心數據項;數據治理
中圖分類號: TP391 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.05.029
本文著錄格式:繆新萍,王鵬宇,孔慶波. 數據認責管理中核心數據的識別初探[J]. 軟件,2019,40(5):154158
【Abstract】: Data governance has become an important issue for enterprises to make full use of the value of data assets and promote digital transformation. However, in the face of vast amounts of data, where to proceed with effective governance has become a thorny issue. This paper introduces the problem-oriented core data identification method used by Guizhou Power Grid Company in data identification for data accreditation implementation. Through the collection and analysis of data problems, the critical data elements with more centralized distribution and greater business impact are extracted. Then, with the help of attribution analysis, data items are further screened out as the implementation of data accountability management, so as to solve the relevant data problems and make the data accountability management more targeted.
【Key words】: Data accountability; Critical data element; Data governance
0 ?引言
隨著近年來大數據技術及應用的迅猛發展,數據之中可能蘊藏著價值信息這一觀念早已深入人心,同時也已上升為國家戰略而受到高度重視[1]。數據如同生產設備、人才也是一種寶貴的企業資產的理念使得數據資源管理和數據治理成為各行業企業信息化建設者、乃至企業戰略制定者所十分關注的領域。而作為構建企業數據治理體系的一項十分重要的基礎工作——數據認責管理自然成為企業數據治理“搭框架、夯基礎”的焦點。
數據認責管理是要通過梳理數據項與企業組織機構、崗位人員之間的操作和使用關系,明確數據項的定義、錄入、審核、改進等各類型的責任者,使得數據責任關系明確化,從而為數據問題的分析和解決、數據管理各項措施、制度的有效落實提供保障[2]。但是在企業雄心勃勃開展數據認責管理之前,一個常常未被深思的問題是:“我們究竟要對哪些數據進行認責?”
本文介紹了一種“問題導向”的核心數據項識別和梳理方法,可以為企業開展數據認責提供目標清晰數據范圍,同時幫助有關數據問題得到有效解決,提升數據認責管理的價值。
1 ?數據認責管理之盲
在這個大數據時代,企業的生產、經營已實現深度的信息化,信息系統為每項業務、每個流程和環節提供著支撐,并因此產生或采集了更多的數據,浩如煙海。然而,當企業回過頭開展數據認責管理,亦或數據治理的時候卻發現面對成千上萬的數據項、TB(Terabyte,太字節)或PB(Petabyte,拍字節)級的數據量無從著手。這時候,一種常見的決定是“全部做”,可是巨大的工作量使其成為難以完成的任務;另一種常見的決定是“分批做”,可是孰前孰后也無從判斷;而另一種“更聰明”的決定是“做重點”,即根據業務治理的重點同步開展該領域的數據認責管理,可是目標仍然不夠清晰。這便是數據認責管理之盲,即數據認責管理的對象不清晰而帶來的盲目性[3]。數據認責管理不可一蹴而就,也不能為了認責而認責。數據認責需要具有自身的價值體現,即通過數據認責,明確了相關人員的責任與要求之后,使數據問題和數據質量得到解決和改善,進而實現業務價值[4]。
這種盲目性同樣存在于數據質量治理以及其他數據治理工作中。因此,無論從問題還是價值角度,如何更具導向型地甄別認責管理的數據對象成為一個首要解決的問題。
2 ?企業的核心數據
企業累積并擁有不同來源、不同領域以及不同類型的數據,但并非所有數據都是平等的!面對日以繼夜不斷積聚的大量數據,我們所能接觸或者使用的部分猶如冰山一角。毋庸置疑,我們已經邁入大數據的時代。但是在我們盤點擁有幾個TB、幾個PB的數據存量,又計較著數據增長量的時候,事實上我們真正想要并不是擁有更多、更多的數據,而是那些“正確的”數據。