鄭耀東 李旭峰 陳和平



摘 ?要:工業數據中臺還處于起步摸索階段,工業企業對數據中臺的價值不夠明確,對建設的方法缺乏理論指導。針對這種情況,依托在建設工業數據中臺項目的經驗總結,文章討論了工業數據中臺在促進企業數據和組織的統一協同、激發數據化管理思維,“降本增效”、提高決策效率以及激活企業創新五個方面中體現的價值,并給出基于阿里云平臺和產品構建數據中臺的六步法,為企業建立適合自身的數據中臺提供參考。
關鍵詞:數據中臺;工業;智能制造
中圖分類號:TP302.1 ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)21-0130-04
Research on the Constructing Method of Industrial Enterprise Data Center
ZHENG Yaodong,LI Xufeng,CHEN Heping
(Department of Computer,South China Institute of Software Engineering.GU,Guangzhou ?510990,China)
Abstract:The industrial data center is still in the initial stage of exploration. Industrial enterprises are not clear enough about the value of the data center and lack theoretical guidance on the construction method. In view of this,relying on the summary of the experience in the construction of the industrial data center project,the article discussed the value embodied in five aspects of industrial data center in promoting the unified collaboration of enterprise data and organization,inspiring data management thinking,“reducing costs and increasing efficiency”,improving decision-making efficiency,and activating enterprise innovation. Six-step method for constructing a data center based on Alibaba cloud platform and products is proposed,which provides a reference for enterprise to build their own data center.
Keywords:data center;industrial;intelligent manufacturing
0 ?引 ?言
隨著信息化技術的不斷發展,以智能制造為主導的第四次工業革命正在各國掀起變革浪潮。工業時代經歷了1.0的機械化、2.0的自動化和3.0的信息化,現正在邁向4.0的智能化[1-3],而邁向智能化的必經之路就是數據化。近年來,工業企業的感知設備越來越多,信息化程度越來越高,數據也隨之不斷增加,如何對這些數據進行合理分析和充分挖掘,使企業能從中受益,已成為各個企業潛在的新的增長點。數據中臺的建設將助力工業企業從“制造”向“智造”的轉變,成為企業數字化轉型的引擎[4-6],受到業界的廣泛關注。目前,工業企業數據中臺的建設還處在起步摸索階段,工業企業對數據中臺的應用價值認識不足,對建設的方法缺乏理論的指導。本文依托作者在建設工業企業數據中臺項目的經驗總結,討論建立工業數據中臺的價值,并以阿里云平臺及相關產品為例,探索建設工業數據中臺的基本方法和步驟。
1 ?工業數據中臺的價值
自阿里巴巴提出“大中臺,小前臺”戰略后,數據中臺取得了快速發展。數據中臺是指通過數據技術,對海量數據進行采集、計算、存儲、加工,同時統一標準和口徑。數據中臺將上述數據統一之后,形成標準數據,再進行存儲,進而形成大數據資產層,為客戶提供高效服務。工業企業建設數據中臺,能產生以下價值:
(1)促進數據和組織的統一協同。數據中臺首先解決的是協同問題,包括數據與數據的協同、數據與系統的協同、數據與業務的協同、數據與資源的協同以及以數據協同來促進組織的協同。通過組織的協同達到全集團在技術、架構、標準、模型和指標上的統一。
(2)激發數據化管理思維。數據中臺可實現業務數據化及數據可視化,通過全域的數據模型管理,盤點企業數據資產概況,反映業務全貌。數據中臺可激發企業數據化管理思維,以數據作為管理的主要依據,為數據化運營、精細化運營構建數據基礎。
(3)助力企業“降本增效”。工業企業可通過數據中臺實時產出生產經營報表,流程溯源與一貫制產品質量保障方案,以提高生產運營效率。也可將算法直接應用在實時數據上,提升產能、降低能耗,達到“降本增效”的目的。另外,通過數據中臺支撐算法應用,可快速靈活支撐各類智能應用,避免重復建設與“煙囪式”建設,縮短應用交付周期,提高應用交付質量,幫助企業實現“降本增效”的目標。
(4)提高決策效率。數據中臺可實現跨域數據的智能融合,支持洞察分析,用數據說話,用數據決策,使企業能夠及時地發現問題和機遇,快速做出正確的決策。
(5)企業創新的源泉。有了數據中臺,企業可以發揮員工的能動性,通過數據業務化的過程積極參與企業產品創新、業務創新和組織創新等,使數據中臺帶來的創新思想和新的商業模式成為企業不斷發展的引擎。
2 ?工業數據中臺構建六步法
在為工業企業快速構建數據中臺過程中,作者設計了構建數據中臺的六步法。首先,做準入分析,評估企業的數據現狀;然后,做數據上云實現數據化;再經過數據治理對數據做清洗和建模,使數據成為有用的資產;接下來,對數據資產構建特征做信息挖掘,構造專家系統知識庫或者知識圖譜,使數據資產變成知識;然后通過智能算法應用將數據變為智能數據;最后,做效果評估,重新評估企業數據成熟度。數據中臺的建設需要一輪又一輪不斷的迭代完善,構建流程如圖1所示。
2.1 ?準入分析
在項目調研中,我們發現工業企業信息化現狀參差不齊。有的企業雖然規模很大,但信息化水平非常低,還處于用Excel表格軟件來管理數據或者甚至處于紙質辦公的階段。有的企業對信息化雖然比較重視,但由于企業剛成立不久,各種信息化系統還在建設的初期,也沒有太多的數據積累,這些企業的高層有做數據中臺的想法,但經準入分析評估后,企業目前階段還不適合啟動數據中臺項目。準入分析評估按照專家打分的方式,從客戶的數據完整性、可用性和時效性等方面對客戶數據現狀做一個初步的評估,并參考數據管理能力成熟度評估模型(DCMM)劃分為初始級、受管理級、穩健級、量化管理級和優化級等分層[7]。
2.2 ?數據化
評估企業滿足建設數據中臺的條件后,建設數據中臺的第一步是企業全域數據上云接入。隨著信息技術在企業的深度應用,企業在生產運營活動中產生海量數據。高效存儲、彈性計算和易于擴展的云平臺成為企業構建數據中臺的必然選擇。企業通過上云能夠降低基礎設施的運營成本,提高IT資源利用率。阿里云數據工廠對于結構化的數據庫、非結構化的文件以及工業特色的集散控制系統(DCS)測點數據,均可通過配置的方式做接入。數據上云接入通常分為三步:第一步做業務數據梳理,包含工業生產制造過程相關的人、機、料、法、環、能、廢等過程產生的數據以及企業在供應鏈、研發設計、營銷銷售、客服等環節產生的大量數據;第二步做上云配置,工業企業信息化系統種類繁多,包含DCS、生產過程執行系統(MES)、檢化驗系統、高級生產排程系統(APS)、倉庫管理系統(WMS)、客戶關系管理(CRM)、企業資源計劃系統(ERP)、產品生命周期管理(PLM)和供應鏈管理(SCM)等,其數據源較為復雜。在阿里云數據工廠中可配置多源異構數據源到云端的數據同步傳輸任務;第三步做數據驗證,驗證上云后的數據的正確性、完備性、時效性和一致性等指標。
2.3 ?資產化
資產化是通過對上云后的數據做清洗、加工和數據治理等過程,使原始雜亂、無序、分裂、有缺陷的數據成為有用的數據資產。包含數據模型設計、數據研發和數據資產管理。OneData體系是阿里巴巴數據中臺的核心方法論,其中OneModel表示統一數據構建和管理,即建立企業統一的公共層,從設計、研發、部署和使用上保障數據口徑規范和統一,實現數據資產全鏈路管理,提供標準數據輸出。OneModel是以維度建模為理論基礎,劃分和定義業務板塊、數據域、業務過程、維度、度量/原子指標、業務限定、時間周期、派生指標、修飾類型,設計出維度表、明細事實表、匯總事實表的過程[8]。OneModel規范包含業務板塊、規范定義、模型設計三個部分,如圖2所示。
OneModel規范在工業領域同樣適用,以鋼鐵行業為例,定義了鐵水預處理子域,鐵水成分檢測就是一個典型的業務過程,鐵水設計為維度,鐵水的碳含量設計為原子指標,加上日期的修飾詞就構成了“鐵水檢測碳日平均含量”的派生指標。同時,可設計出鐵水維度表、鐵水檢測成分明細表、鐵水檢測成分日匯總表。鋼鐵行業OneModel模型樣例如圖3所示。
數據中臺將數據分為操作數據(ODS)層、明細數據(DWD)層、匯總數據(DWS)層和應用數據(ADS)層。每個企業的ODS層數據源相差較大,而當上層應用確定后,從DWD層到DWS層的加工邏輯相對固定,DWD層和DWS層有較強的復用性。依賴阿里云數據工廠AIMaster的模型發布和調度能力,可實現數據模型和ETL鏈路的沉淀和復用。數據工程師將數據建模和數據加工邏輯發布在AIMaster的場景畫布,可以在現場環境快速部署。另外,數據中臺提供任務監控的功能,監控所有數據任務運行狀態,對異常任務可做干預和處理,保障線上任務正常穩定運行。
數據進入數據中臺后,數據資產管理工具提供元數據管理、資產目錄、資產地圖等模塊,實現數據血緣分析、影響分析和全鏈路分析,統一管理和運營企業數據。
2.4 ?知識化
信息是指外部的客觀事實,知識是對外部客觀規律的歸納和總結。從數據到知識,在工業數據中臺有兩種表現形式:一是專家系統知識庫,二是知識圖譜。知識庫用來存放由相應領域專家提出的專業知識和經驗知識。知識庫組織是對人類專家豐富的經驗及知識進行歸納、總結,并根據領域及專業特性分類,云上知識庫通常存儲在關系型數據服務(RDS)中。
知識圖譜本質上是一種揭示實體之間關系的語義網絡,運用圖譜的結構來挖掘、分析、建立、描述和展示不同來源的知識資源之間的關聯,用簡單直觀的方法來展示復雜的關系,以便使計算機和人更好的理解[9]。工業知識圖譜需要有知識構建能力、知識抽取能力及知識輔助能力。首先,需要定義一個場景,定義知識本體以及業務本體;然后通過機器學習、深度學習等技術手段進行知識抽取。構造的知識圖譜具有智能搜索、輔助推薦等能力。底層數據匯聚到數據中臺經過加工,變成數據資產,再經過各類算法引擎,最終將專業知識、業務知識、運營知識等知識的知識本體抽取出來,以知識本體為框架,并通過規則引擎進行大數據的推理挖掘,構建起知識圖譜。目前,知識圖譜在設備故障診斷、行業標準智能問答、設備信息查詢助手等方面有廣泛的應用。
2.5 ?智能化
建設工業數據中臺的最終目標是實現企業的智能化。工業企業大數據的典型場景如圖4所示。
由數據驅動的智能供應鏈、智能化設計、智能化生產、智能化營銷、智能化服務等智能場景涵蓋了工業企業供、研、產、銷、服的全流程,共同組成了智能制造。對企業而言,面臨的主要問題之一是如何提高制造資源、物流資源和研發資源的配置效率,如何準確地為新品研發、客戶定位、營銷策略、研發組織、排產計劃和庫存管理等做好決策。企業能夠成功的關鍵因素,就在于外部環境發生變化時能快速做出響應,做正確的決策,其背后所需具備的能力則來自“數據+算法”。
工業領域利用機器學習、深度學習、強化學習的基礎算法庫加上不同行業的制造工藝、仿真等機理知識可構建行業智能引擎,用于支撐庫存優化、排產排程、銷售訂單預測、設備故障診斷等智能化應用,工業數據智能架構如圖5所示。
2.6 ?效果評估
工業數據中臺建成后,將從數據匯聚、數據質量、數據安全及數據價值評估四個準則再對企業做一次數據管理成熟度的評估,并迭代優化持續追蹤企業數據化管理水平。企業數據管理成熟度的評估可采用AHP層次分析法。層析分析法是將決策問題按總目標、評價準則和具體評價指標分解為不同層次結構,采用計算判斷矩陣特征向量的方法,得到各層元素相對上層某元素的權重,根據權重判斷各因素對目標評價的重要性[10]。表1為根據AHP層次分析法設計的企業數據管理成熟度評估指標體系參考。
3 ?結 ?論
工業數據中臺是實現企業數據智能的基礎。數據中臺的建設可幫助企業打通數據孤島,構建企業數據資產,為企業提供穩定的、持續的和可復用的數據生產能力,助力企業降本增效和業務決策。數據中臺的建設還處在發展階段,目前尚未形成穩定、成熟的建設方案和建設路徑。本文討論了數據中臺對工業企業的價值,明確了數據中臺對企業的作用和意義。提出建設工業數據中臺的六步法,為企業在實施過程中提供參考。企業可根據自身實際情況做出方案選型和建設路徑規劃。
參考文獻:
[1] 彭俊松.工業4.0驅動下的制造業數字化轉型 [M].北京:機械工業出版社,2016.
[2] 張曙.工業4.0和智能制造 [J].機械設計與制造工程,2014,43(8):1-5.
[3] LI G,TAN J L,CHAUDHRY S S. Industry 4.0 and big data innovations [J].Enterprise Information Systems,2019,13(2):145-147.
[4] 劉長杰.數據中臺建設將把數字中國推向縱深——與國務院發展研究中心研究員李廣乾對話 [J].中國發展觀察,2020(Z1):86-90.
[5] 艾瑞咨詢.2019年中國數字中臺行業研究報告 [J].互聯網經濟,2019(12):76-83.
[6] 車品覺.建設數據中臺,賦能創新改革 [J].新經濟導刊,2018(10):22-24.
[7] 李冰,賓軍志.數據管理能力成熟度模型 [J].大數據,2017,3(4):29-36.
[8] 阿里巴巴數據技術及產品部.大數據之路:阿里巴巴大數據實踐 [M].北京:電子工業出版社,2017.
[9] 黃恒琪,于娟,廖曉,等.知識圖譜研究綜述 [J].計算機系統應用,2019,28(6):1-12.
[10] 鄧雪,李家銘,曾浩健,等.層次分析法權重計算方法分析及其應用研究 [J].數學的實踐與認識,2012,42(7):93-100.
作者簡介:鄭耀東(1978—),男,漢族,河南許昌人,教師,碩士研究生,研究方向:大數據、數據中臺、數據分析與挖掘。