高洪波,張冬陽,王 鵬,胡而已
(應急管理部信息研究院,北京市朝陽區,100029)
隨著礦山行業的高速發展,礦山企業對于數字化轉型的訴求日益凸顯。為應對此挑戰,眾多礦山企業紛紛導入數據中臺,以期通過數據中臺的構建與應用,提高企業的數據處理效能、業務創新能力及市場競爭力。然而,受制于規范和標準的缺失,數據中臺的建設和應用環節暴露出諸多問題,如數據質量欠佳、數據孤島現象突出、數據安全難以確保等[1-3]。因此,制定礦山數據中臺建設規范迫在眉睫。
在這一背景下,經國家礦山安全監察局批準,在國家礦山安全監察局安全基礎司的指導下,應急管理部信息研究院牽頭,聯合多家礦山、裝備、通信企業以及高校、科研院所共同編制了《智能化礦山數據融合共享規范》,共包括六大部分共40 項規范。其中,《數據中臺建設與應用規范》(以下簡稱《規范》)專注于智能化礦山數據中臺的建設和應用,明確了智能化礦山數據中臺的整體架構,以及數據匯聚、數據管控、數據處理、數據開發、數據服務、數據運營、數據安全、管理保障等方面的建設要求[4]。筆者深入解讀了《規范》的內容,對其實踐應用中的關鍵問題進行了探討。
《規范》主要內容包括范圍、規范性引用文件、建設原則、數據中臺架構、建設內容、管理保障等。數據中臺架構部分對智能化礦山數據中臺的概念、總體架構、功能架構以及數據架構做了規范定義。建設內容部分明確了中臺建設的各主要環節,并對建設內容提出了明確的要求。以下針對這兩部分的要點內容進行解讀。
《規范》主要規定了數據中臺架構的相關內容。數據中臺作為智能化礦山建設的基礎,其主要目標是實現各類數據的統一匯聚、管理和應用。數據中臺的建設需遵循一定的原則和要求,包括實現各類數據的統一匯聚與管理,基于行業數據標準實現數據統一治理,以及提供跨層級、跨區域、跨業務的數據互聯互通。
數據中臺的總體架構可采用多層級架構,涵蓋集團層、礦山層,以及各個業務部門和業務系統。各級數據中臺需遵循統一的數據標準、質量標準和安全標準,實現各級數據平臺間的數據互聯互通。此外,還需建立礦山數據全生命周期管理平臺,支持對海量多源異構數據的匯聚、管控、清洗、開發、服務、運營等[5-7]。智能化礦山數據中臺總體架構如圖1所示。

圖1 智能化礦山數據中臺總體架構
數據中臺的功能架構主要包括數據匯聚、數據管控、數據處理、數據開發、數據服務、數據運營和數據安全等功能[8]。這些功能有助于實現數據的有序流轉、融合分析和價值挖掘。數據中臺功能架構如圖2所示。

圖2 智能化礦山數據中臺功能架構
數據中臺的數據架構通常包括原始庫、資源庫、主題庫和專題庫4個層次[9]。原始庫負責收集原始數據;資源庫對原始數據進行清洗、轉換、關聯等處理后,形成標準化數據;主題庫則是基于業務維度進行深度關聯整合的數據庫;專題庫則是針對特定領域的應用需求而重新組織的專題數據庫。
《規范》主要規定了智能化礦山數據中臺的主要建設環節,包括數據匯聚、數據管控、數據處理、數據開發、數據服務、數據運營及數據安全等,并對各環節的主要內容提出詳細要求。
1.2.1 數據匯聚
數據匯聚是指將來自多個數據源的數據整合至中央存儲庫,以便進一步分析處理的過程。主要包括數據源管理、數據提取、數據轉換和數據裝載等環節。數據源管理涉及采集源端數據庫的連接配置與維護管理,以及管理員進行采集數據源的配置、測試、維護和授權;數據提取是從源格式數據中提取目的格式數據,具備組件化、可擴展和可配置特點;數據轉換環節主要對匯聚的數據進行格式、命名、編碼和標識等方面的統一轉換處理;數據裝載功能支持將抽取和轉換后的數據寫入數據存儲,如文件數據裝載、大數據組件數據裝載和分布式數據倉庫數據裝載等。數據匯聚作為復雜過程,涉及多個步驟和技術,其目的在于提高決策效率和準確性。
1.2.2 數據管控
數據管控主要涵蓋元數據管理、主數據管理、數據血緣、數據地圖和數據質量等方面。元數據管理負責收集、存儲和分析數據的全量元數據,包括數據實體(如系統、庫、表等)的信息,以及數據生產全過程中的數據變更歷史記錄;主數據管理關注被多個系統共享的核心數據,對其進行采集、申請、新增、變更、審核、生效、失效、分發等全生命周期管理,同時識別數據來源,定義和維護數據整合架構;數據血緣用于追蹤數據在數據源庫和目標數據庫之間的流動路徑,提供全鏈路的數據血緣分析和展示;數據地圖是一種可視化界面,協助用戶對礦山各部門的數據連接中的數據表進行統一管理,提供搜索表、按類目管理表、表收藏管理、表標簽管理等功能;數據質量強調定期進行基于規則的質量評估及監控,及時發現、定位、檢測、跟蹤、解決各類數據質量問題,確保數據穩定可靠。
1.2.3 數據處理
數據處理主要包括數據標準化、數據清洗、數據探查和數據評價等功能,旨在提高礦山數據質量[10]。數據標準化模塊應具備創建、修改、刪除、查詢、詳情查看和導入導出等功能,實現數據管理和標準化改造,提升數據質量;數據清洗功能支持過濾不符合要求的數據,包括不完整、錯誤和重復的數據,并進行校驗、糾正錯誤,保障數據一致性,具體功能包括去重、過濾、轉換、校驗等,以及可視化轉換組件和數據治理規則梳理等;數據探查功能支持對不同來源數據進行多維度探查,了解數據的業務含義、存儲更新方式、格式語義、結構和質量等內容;數據評價功能通過對數據的準確性、完整性、一致性、時效性等方面進行評估,生成評價報告,詳細說明數據的質量水平,指出存在的問題和改進建議。
1.2.4 數據開發
數據開發涵蓋離線開發、實時開發、算法模型和機器學習等功能,旨在滿足不同業務場景的數據應用開發需求。離線開發通過傳統數據倉架構批量處理大量數據,具備強大的數據處理能力和較大的吞吐量,但執行和調度周期較長,適用于時效性要求不高的場景;實時開發則通過實時開發引擎提供流式數據處理環境,主要滿足時效性要求較高的場景;算法模型通過提供豐富的算法庫和模型開發工具,以支持用戶構建和優化各類復雜模型,從而實現更準確的數據分析和預測;機器學習通過自動學習和優化算法,進一步增強數據開發的智能化能力,使數據應用能夠不斷適應現場需求并不斷改進,為業務決策提供更有力的支持。
1.2.5 數據服務
數據服務主要包括目錄管理、資源管理、數據服務類型、級聯管理、服務監控和指標管理等功能。目錄管理通過資源目錄編碼、分類和管理,實現對各類礦山數據資源的科學、有序和安全訪問;資源管理通過不同類型的資源配置和管理,滿足數據服務的使用和擴展需求;數據服務類型規定了查詢、協議轉換和比對訂閱等常見服務類型,實現對數據的靈活獲取和使用;級聯管理通過目錄、標準和服務的級聯管理,實現全域節點的數據共享與協調;服務管理通過服務監控和指標管理,實現對數據服務的實時監控和礦山業務管理的評估與優化。
1.2.6 數據運營
數據運營包括運營工具、數據中臺運營、服務運營和資產安全運營。運營工具需要具備智能化、集中化、自動化、標準化的特點,為數據中臺各項服務的統一入口提升用戶體驗和運營效率;數據中臺運營主要包括數據監測、數據盤點、數據成本運營等方面;服務運營則關注接口定義規范、數據安全網關建設、數據模型到數據應用的鏈路關系以及數據邏輯模型的實現;資產安全運營方重點在于數據使用合規審查、數據產品合規評估、數據安全監測與審計以及檢查考核。
1.2.7 數據安全
為了確保數據中臺的全生命周期安全,必須構建一套完整的數據安全防護體系,其中包括對核心數據進行加密等安全技術手段,以及實施權限管控等措施,以提升整體防護能力[11]。在數據分類分級方面,需全面梳理數據資源,并依據業務特性、數據來源和應用場景等因素,制定相應的分類分級規范;在數據運維安全方面,明確各方責任分工,建立全鏈路安全監管機制和協同處置機制,以便及時發現并處置數據安全風險。
在《規范》的實際應用過程中,深入探究了礦山行業的特定需求,并將規范中所提出的理念、方法及應用價值予以實施。以下列舉了一些具體的實踐案例。
在國能烏海能源五虎山煤礦災害監測數據中心的建設過程中,貫徹《規范》中的理念、方法和應用價值,根據《規范》的要求構建了統一的數據中臺,實現了數據的集中管理和處理。項目通過實時采集各類設備、自動化系統、安全監測系統的數據,并將其存儲在數據中臺,達到了數據的全覆蓋和統一管理。在標準化和規范化方面,根據《規范》的要求,對數據的命名規則、數據字典、數據質量標準等進行了統一規定,確保了不同系統、不同設備的數據兼容性和共享性,這一舉措不僅提高了數據處理效率,降低了數據應用的難度,還為上層業務應用和智能化分析提供了有力支持;在數據安全保障服務方面,《規范》要求中臺提供完善的數據備份和恢復機制,并采用先進的數據加密技術和訪問控制機制,確保了數據的機密性和完整性;在數據分析和挖掘方面,中臺基于 Hadoop 架構進行深度定制,提供了煤礦專有數據倉庫和算法服務,實現了數據的離線開發和實時開發,使企業能夠從海量數據中高效提取有價值的信息,為礦井、選煤廠智能化建設提供基礎服務和保障。
國能國神公司敏東一礦數據融合平臺的建設過程中,遵循《規范》的要求,基于數據中臺進行了整體規劃設計。中臺數據全面覆蓋生產、安全及經營業務系統,具備從數據匯聚、轉換到數據標準、數據資產、數據質量以及數據服務的全鏈路環節功能。首先,在頂層設計過程中,根據《規范》要求制定數據標準體系,明確了數據資源的基礎和核心。通過智能化數據加工,將多元和異構的源數據轉化為精細化的數據,為國神公司敏東一礦實現了業務數據化和數據智能化的目標。在數據匯聚方面,中臺實現了煤礦現有多個分散獨立的應用系統數據的聚合和治理,消除了數據孤島現象,形成了有價值的數據資產沉淀。大數據基礎平臺負責保存數據集成引擎采集的各種結構化和非結構化的數據;數據管理通過數據匯聚、存儲和治理,將接入的數據進行標準化處理,為后續服務提供基礎支持;數據資產根據實際情況對數據進行分類、編目、發布和開放;數據服務則以自定義 SQL 的形式或將通過接口調用轉發到其他外部業務系統,為智能礦山的一體化管控、安全分析、監測預警、應急指揮、數字孿生和大數據挖掘等應用提供強有力的基礎數據支持。通過規范化的數據中臺建設,優化了整個煤礦數據資產管理模式,盤活了數據價值,引導了服務創新,進一步強化了“數據+業務”的緊密性。不僅為礦山帶來了更高的生產效率和安全性,還創造了新的商業模式和競爭優勢。
上述2個案例表明了《規范》在實際應用中的重要性,《規范》為礦山企業提供了一套完整的數據中臺建設方法論,可協助企業通過中臺建設克服數據匯聚、管控、處理、開發、服務等方面的挑戰。
《規范》為礦山數據中臺建設提供了關鍵支持,旨在提高數據的使用效率、安全性和可持續性。筆者對《規范》的核心內容進行了詳細解讀并分享了相關應用案例。然而,《規范》亦需不斷改進,包括根據新的技術發展趨勢和最佳實踐進行持續更新,以確保其有效性。此外,規范的培訓和教育至關重要,以確保礦山行業從業者具備必要的技能來有效應用規范。下一步,期待在《規范》的指導下,數據中臺建設在更多礦山企業中得以持續推進,為礦山行業帶來機遇,幫助礦山企業提高生產效率、降低成本,促進礦山行業的可持續發展。