李瑞華,馮治東,郭紅波
(榆林學院信息工程學院 陜西 榆林 719000)
經濟社會和信息技術的融合引發了數據的急劇增長,數據已經成為衡量一個國家基礎戰略的必備資源。數據產業化已經對全球生產、流通、消費、分配產生重要的影響,在這樣一個全新的社會形態下,國家治理模式逐漸轉移到以數據治理為基礎的治理模式,如何對數據實施規劃、存儲、管理、挖掘、應用,從而使得數據潛在的價值得以釋放,進一步推動社會經濟的增值,是實現數字化轉型的重要內容[1]。
榆林礦產資源豐富,能化工業的起步較晚,眾多企業在原材料準備、生產設備、生產流程、廢物處理、銷售業務、經營管理中基本都已實現了信息化,其信息系統中的海量數據為企業的生產運營提供了大量的數據支撐,但是面對新信息時代的智能化發展要求,如何挖掘元數據之間的存在關系,探索數據礦藏中蘊含的“知識黃金”是企業未來生存和發展的必然途徑[2]。改變原有資產的管理模式和意識形態,注重數據資產的保護和挖掘,是當前能化工業亟待解決的問題。
榆林作為能化工業的發展城市,關于數據治理存在以下幾方面的問題。
傳統的能化工企業只注重有形資產的管理與實際業績的提升,“數據治理”的理解較為狹義,忽略企業在生產過程中各項數據的有效利用與數據分析,如有數據管理往往也只停留在財務報表的范圍之內,沒有真正實現數據資源資產化的管理。
榆林地區煤化工企業較多,很多企業的數據質量意識淡薄,數據管理職能缺失,數據操作不規范,數據質量問題嚴重。各企業對數據的存儲沒有統一的量化標準、存儲標準,造成數據不一致、不完整和不正確[3]。沒有統一的數據標準導致數據難以集成和統一,沒有質量控制導致海量數據因質量過低而難以被利用,沒有能有效管理整個大數據平臺的管理流程。
能化工業的數據管理一般根據行業的生產步驟與環節分散存儲在不同的系統平臺,各平臺數據存儲相互獨立,信息數據無法共享,形成信息孤島,因此無法獲得對產業生產過程的多因素的實時分析檢測與管控,從而造成數據不可知與不可取。
能化工業的智能化建設是基于大數據、物聯網、人工智能等信息化技術,其數據治理必須解決數據標準化、元數據和主數據的管理工作;加強生產現場、服務過程等動態數據的采集、傳輸和匯集體系;加快大數據平臺建設,創新數據融合分析和共享交換機制[4];強化業務場景的數據建模、挖掘數據價值、提升數據洞察力,從而將知識化后的數據轉換為企業的資產,因此提出基于技術架構的能化工業智能化建設中數據治理的基本框架,本框架包括三種形態。
第一種形態為治理的對象。這些對象是原始數據,它只是對生產過程、交易過程的原始記錄,不能體現數據存儲的實際價值,其內容也是晦澀難懂,且能化工業的信息系統中海量元數據存在不一致、冗余、離散等問題,需要建立一個集成平臺,將分散數據集中存儲。
第二種形態為規范化。根據行業規范要求制定權威的數據標準,統一能化工業生產初期、成產過程、廢料排放、產品銷售等不同階段的數據標準,統一業務語境,這需要能化工業統一數據標準以及業務語境,同時協同IT人員收集業務數據并根據標準進行數據遷移、集成,進一步數據挖掘,變離散數據為有效知識[5]。
第三種形態為知識。基于規范化的數據資源目錄發掘數據業務畫像,進一步挖據數據價值,得到可靠、可信、可懂的企業數據資產,挖掘數據中的紅利,使得數據從無形的、不可知到有規律可尋、便于決策的知識,可實現數據治理的有效性、可用性。
基本框架制定了數據治理的過程,具體的數據治理的實施方案內容包括但不局限于:集成數據資源元數據、抽取數據產生數據聚合平臺、數據資源資產化,數據資產的應用。
數據聚合:能化工業由于在生產過程中,各種機器設備的運行狀態、掘進過程、各項數據指標的采集、化學反應過程、廢料指標等根據行業功能不同分別在不同的機器設備以及不同的數據庫中存儲,數據不統一、不集中。需要通過能化工行業業務人員和計算機技術人員,將不同系統的生產元數據通過數據預處理,結合行業標準抽取有意義的數據,聚合在一個平臺,形成一個有標準、可控的、集成的數據平臺[6]。
數據資源資產化:能化工業的信息化系統中存儲的數據是電子化的元數據記錄,元數據本身不具有資產屬性[7]。通過聚合平臺提取有效地原始數據,并通過數據挖掘工具分析元數據之間的關系,使其挖掘結果能夠生成便于企業進行生產管理、業務決策、生產預警等的先驗知識和規則。從而形成企業的有效數據資產。
數據產權與安全:數據一旦成為資產,就一定有產權方和實際控制人。數據實際控制人一般是數據庫的管理人員,但是煤化工企業是數據的產權方,數據資產產權的確定涉及法律層面,應對數據實際控制者的行為嚴加管束,做到合法、合規[8]。數據資產的使用場景與使用手段需明確,即使是數據資產的擁有者,在使用數據資產時必須明確任何數據都有隱私與敏感屬性,同時注重數據的安全性[9]。保證數據使用中的存儲管理、用戶管理、訪問控制權限等,數據資產的所有權和安全性是數據治理的重中之重。
數據資產的應用:數據資產具有資產的效力,通過歷史數據的分析獲得先驗知識可以提升企業智能化生產和管理的能力,便于企業決策、制定未來的發展規劃、財務智能預算等各方面的智能化發展,同時數據資產可以對于企業的安全生產提供預測,便于企業開展發展規劃。
數據作為能化工業智能化的核心資源,其獲取與利用對于工業智能化的發展具有重要的作用,能化工業的數據治理是為了實現能化工業數據資產化而進行的數據決策分配的活動過程,是一項復雜的系統工程,本文主要在數據治理的技術層面對能化工業的數據治理提出理論探索,給出了基本的治理框架,僅供能化工業的智能化建設過程參考。