王海軍 丁劍明 白明亮 馬 濤
(1.神華神東煤炭集團有限責任公司,陜西省榆林市,719315;2.中國神華能源股份有限公司神東煤炭分公司信息管理中心,陜西省榆林市,719315)
隨著互聯網、云計算、物聯網等為代表的信息技術的不斷發展和應用,當前已經步入大數據時代。數據將成為或已經成為企業獨立于人、財、物、技術以外的重要資產,數據獲取及分析應用能力將成為或已經成為企業的生產力及核心競爭力。在工業領域,工業大數據技術及應用將成為未來提升企業生產力、競爭力、創新力的關鍵要素。
神東通過《數字礦山關鍵技術及應用研究》(863計劃)項目和《區域中央集中自動控制》項目的實施,初步建成了兩種數字礦山平臺框架,數字礦山已具雛形。但是,還存在數據多標準、多源頭、不準確等問題,要建成真正意義上的數字化礦山,還需要實施數據標準化建設。
數據標準化建設是煤炭企業做工業大數據分析應用的基礎,要實現物聯網、大數據、云計算及人工智能技術在煤礦安全生產等場景中充分發揮出應有的作用,就必須先在“硬件”和“軟件”兩個方面的基礎設施領域開始做好準備工作,而數據標準化就是“軟件”方面的基礎實施建設,因此具有重要意義。
由于神東早期的信息化建設缺乏信息化總體規劃的指導,因此積累了一些問題,比較突出的是信息系統主要依據各部門和各業務模塊需求獨立建設,信息孤島現象嚴重,具體體現在以下幾個方面:
(1)數據分散。神東煤礦生產數據信息分散,同一物理對象在不同部門、不同系統中的描述不同,無法貫通生產管理調度管理等業務,數據分散設計導致數據的準確性和完整性降低,必須花費大量精力對數據進行重新整合才能分析運用。
(2)數據共享程度低。生產數據涉及多個部門和多個系統,但系統間往往缺乏映射,部分數據還存在無系統支撐的情況,一旦出現數據不一致的情況,多依靠手工核對,工作量大且容易出錯。同時,由于數據共享程度低,針對業務要求需對每個業務系統進行數據提取并進行匹配,然而卻很可能出現信息不一致的情況。部門之間往往需要共享信息,數據共享程度低,最終將導致需求部門為了獲得所需信息不得不進行重復的投資建設。
(3)數據標準不統一。早期的信息化建設缺乏宏觀層面的總體規劃,大部分應用系統的數據標準不統一。目前,神東的管理類數據標準已由集團統一制定,但生產類數據標準尚未制定,沒有形成企業級的統一數據信息視圖,難以保證數據的唯一性和準確性。數據收集、系統處理、報表編制缺乏規范和統一的數據標準體系。
基于以上現狀,神東迫切需要將各類數據進行標準化,把數據整合起來,建立共享交換平臺和綜合分析平臺,提升整體業務效率,提高信息共享程度,改善各種數據在跨部門間的運用和分享,為安全高效生產提供堅實的基礎。
在企業數據治理過程中,宏觀層面上要有統一的標準和原則。在神東數據標準化實施過程中,整體按照統一規劃、整體部署、分步實施的大原則進行,除了遵循國內外相關標準外,為了確保生產數據標準體系與神東業務發展方向的一致性,主要遵循以下幾點原則:
(1)全面性。從數據標準體系內容來看,規劃制定對礦井生產業務數據管理的各個領域進行了全面的梳理和描述,力爭促使神東生產管理的基礎數據管理和應用服務能力上一個新臺階。
(2)前瞻性。結合神東的戰略發展需要,并充分借鑒國內外同行業的先進實踐經驗,向國內外領先水平看齊,使生產數據標準體系建設具備一定的前瞻性。同時,生產數據標準化要瞄準建設企業數據倉庫以及神東大數據平臺的目標,確保數據標準化相關內容將能夠服務于未來神東生產管理業務的發展。
(3)可執行性。生產數據標準體系建設基于對神東生產業務及數據管理現狀的深入調研和分析,優先考慮神東在生產管理領域以及相關系統建設上面臨的難題,確保數據標準體系切實可行。
數據架構描述了技術和應用視角下的核心組件,以及這些組件之間的分層關系和應用邏輯。企業數據參考架構以業務需求為導向,基于業務架構和企業流程來規劃數據架構,架構設計以業務應用需求為先導,將數據作為企業核心數據資產之一,與業務流程相互融合,多視圖對業務、數據、技術和平臺進行建模,實現企業人流、物流、資金流和信息流等各業務線的貫通。
中國電子技術標準化研究院和全國信息技術標準化技術委員會大數據工作組聯合發布的《工業大數據白皮書(2017版)》中,給出的大數據架構參考模型和工業大數據架構參考模型如圖1和圖2所示。參考上述模型,遵循神華集團的數據架構模型框架,結合神東業務和IT架構,設計規劃的神東大數據架構參考模型如圖3所示。
在神東大數據架構參考模型中,從下至上共分為七層,分別是數據標準化層、數據源層、數據采集層、數據治理層、數據管控層、數據存儲層、數據展示及應用層,其中本期工程主要完成最下層的數據標準化層。
從業務系統、數據共享和業務主題3個數據管理層次建立數據標準、數據標準管理和數據質量管理,明確數據的定義,規范數據的質量。從神東整個企業的角度出發,建立統一的數據標準,結合數據治理工作成立技術標準工作組,制定工作計劃,組織完成各類標準制定,主要包括技術標準、業務標準、管理標準、數據質量標準等內容。

圖1 大數據架構參考模型

圖2 工業大數據架構參考模型

圖3 神東大數據架構參考模型
目前的生產數據運作流程為產生→轉碼→傳輸→儲存→分析處理→展現,對煤炭生產過程進行全流程、多維度的調研,了解煤炭生產過程中涉及到的業務實體,從數據生命周期的視角來了解和分析生產數據在生產業務過程中如何產生和如何終結。熟悉煤炭生產業務流程,再進一步分析信息化現狀,總結出各個業務實體在哪些信息系統中存在,各個信息系統在使用這些業務實體參照數據過程中使用了哪些屬性值,哪些屬性值是在哪些信息系統中進行維護和更新。 從長遠發展的角度來看,還要了解下一步生產相關業務的信息規劃,了解哪些基礎數據目前可能沒有共享的需求,但在未來有可能需要共享,需要系統分析和管理。數據的分類、數據的標準化是一項立足長遠的工作,必須保證標準體系的易擴展性和易維護性。
需求調研結束后,列出重要的數據管理清單。有些生產數據被一個系統多次引用,或者被多個系統同時引用,則這個數據項必須作為主數據優先標準化。把這些主數據在各個系統中使用到的所有屬性匯在一起就初步形成一個生產主數據完整的指標體系。生產主數據梳理完畢形成完整的指標體系后,還必須將生產主數據劃分層級,這些主數據并不是每一個業務系統都要使用,按照決策層、管理層、執行層分配權限,主數據運用范圍越廣,越貼近具體業務的數據項越具有專業性。
定義好每一個生產數據需要哪些屬性值以及每個屬性值的域,只有這樣才能避免各個信息系統中數據口徑不一致或者數據定義不一致的情況。 定義好每一個生產數據的所有屬性值的約束性規則、完整性規則以及數據質量審核流程,生產數據的使用必須進行規范化,特別是對煤種、產量、產率和效率等敏感數據,定義好哪些部門可以看生產數據的哪些屬性值,以及各個系統之間的數據使用接口。 所有的數據統一用一套編碼規則,方便后續儲存、轉換和分析。
通過數據標準化項目建立神東煤礦生產數據的分類體系,制定神東煤礦生產相關的主數據及共享數據標準,實現數據定義和使用的唯一性與一致性,改善數據質量,減少數據冗余,保障信息化建設成效。
(1)建立數據共享交換平臺?;跀祿仨氉鳛橐环N資產進行管理的理念,為了充分管理和應用數據,進一步發揮數據的價值,僅有標準化的數據還遠遠不夠,還需要建立數據共享交換平臺,以扭轉目前神東信息化建設過程中各個信息系統間網狀關聯關系不斷增長的局面,逐步構建信息系統間星形關聯關系,實現共享數據資源的集中共享和有序分發,從而實現企業內部數據橫向貫通。
(2)建立大數據平臺。建立企業大數據平臺也是解決企業數據全面充分開發利用的有效途徑。神東現有約100 TB的生產數據,隨著神東礦井數字化建設、井下3G和4G移動網絡的投入以及物聯網技術的應用,采集到的生產數據正以幾何級數增長。但是這些數據本身混雜,難以輔助生產活動分析和決策,只有將這些數據進行挖掘和分析,并將結果以友好的形式展現,才會被用戶接受并加以利用。所以可以通過建立神東大數據平臺來實現對這些數據的開發利用,最大程度地挖掘數據資產的價值。
煤炭生產數據標準化建設是煤炭生產領域實現信息化的先驅工程,是建設數字礦山、智慧礦山、數據驅動型企業的基石。神東在數據標準化建設過程中以信息工程方法論為指導,以神華集團信息化總體規劃和神東信息化總體方案設計為基礎,以企業戰略為導向,業務、應用、數據、集成和基礎設施架構相互支持,成為一個有機整體。遵循業界主流標準和神華集團信息化標準,各系統相互集成,確保流程銜接和數據共享。
數據共享交換平臺和大數據平臺作為數據標準化項目的兩個后續建設項目,可以檢驗數據標準化的成效,是數據標準化項目的落腳點,可以實現其成果的有效落地。數據標準化是企業數據治理的開始,隨著業務和數據的梳理,可能會發現一些問題,同時提出改進,涉及業務變革以及組織架構調整等復雜因素,需要企業高層統籌協調推進,是一把手工程,需要結合企業自身實際深入研究。
[1] 劉海濱,劉浩,劉曦萌.煤礦安全數據分析與輔助決策云平臺研究[J].中國煤炭,2017(4)
[2] 張紹華,潘蓉,宗宇偉.大數據治理與服務[M].上海:上??茖W技術出版社,2016
[3] 張明英,潘蓉.《數據治理白皮書》國際標準研究報告要點解讀[J].信息技術與標準化,2015(6)
[4] 中國電子技術標準化研究院,全國信息技術標準化技術委員會大數據工作組. 工業大數據白皮書(2017版)[EB/OL],2017
[5] 張一鳴.數據治理過程淺析[J].中國信息界,2012(9)
[6] 王海軍,武先利. “互聯網+”時代煤礦大數據應用分析[J]. 煤炭科學技術,2016(2)
[7] 馬小平,胡延軍,繆燕子. 物聯網、大數據及云計算技術在煤礦安全生產中的應用研究[J]. 工礦自動化,2014(4)
[8] 申琢,譚章祿.基于數據挖掘的煤礦大數據可視化管理平臺研究[J].中國煤炭,2016(12)
[9] 常朝娣,陳敏. 大數據時代醫療健康數據治理方法研究[J]. 中國數字醫學,2016(9)
[10] 李鳴,郝守勤,何震. 數據治理國際標準研究[J]. 信息技術與標準化,2017(Z1)
[11] 孫金鳳. 中國石油企業源頭數據資源建設架構及對策[J]. 大慶石油學院學報,2010(8)
[12] 劉嬋,譚章祿. 大數據條件下企業數據共享實現方式及選擇[J]. 情報雜志,2016(8)
[13] 巨克真,魏珍珍. 電力企業級數據治理體系的研究[J].電力信息與通信技術,2014(1)
[14] 張科利,王建文,曹豪. 互聯網+煤礦開采大數據技術研究與實踐[J]. 煤炭科學技術,2016 (7)