文|梁建交
工業(yè)企業(yè)受工業(yè)4.0、智能制造愿景的激勵,對大數(shù)據(jù)應(yīng)用充滿期待。但相對大數(shù)據(jù)技術(shù)生態(tài)的日趨完善,平臺廠商對工業(yè)則普遍缺乏深刻理解,企業(yè)用戶對應(yīng)用場景則缺乏洞察和規(guī)劃。
大數(shù)據(jù)應(yīng)用是兩化深度融合最有代表性的體現(xiàn),但由于廠商、企業(yè)的能力不能相互浸透、形成互補,當前在工業(yè)領(lǐng)域的應(yīng)用場景還十分有限,也尚未形成可快速復(fù)制的方法。根據(jù)2020年的統(tǒng)計數(shù)據(jù),工業(yè)大數(shù)據(jù)的產(chǎn)業(yè)規(guī)模僅占到整個大數(shù)據(jù)產(chǎn)業(yè)的5.7%,遠低于制造業(yè)占GDP的比重26.29%。互聯(lián)網(wǎng)經(jīng)濟規(guī)模雖然僅占GDP的3.3%(2019年數(shù)據(jù)),但互聯(lián)網(wǎng)大數(shù)據(jù)產(chǎn)業(yè)規(guī)模卻占到整個產(chǎn)業(yè)規(guī)模的45.2%,說明大數(shù)據(jù)技術(shù)在工業(yè)領(lǐng)域的應(yīng)用潛力還遠未發(fā)揮出來。
大數(shù)據(jù)技術(shù)在工業(yè)領(lǐng)域特別是制造業(yè)領(lǐng)域的成功應(yīng)用,需要廠商和企業(yè)培育符合自身定位的關(guān)鍵業(yè)務(wù)能力,并在能力上形成互補,加強互動協(xié)同,共同打通數(shù)據(jù)價值鏈,激發(fā)數(shù)據(jù)潛能。面向工業(yè)大數(shù)據(jù)的能力包括三個部分,需求側(cè)(企業(yè))的能力、供給側(cè)(廠商)的能力和數(shù)據(jù)價值流的實現(xiàn)。需求側(cè)的關(guān)鍵業(yè)務(wù)能力包括:場景挖掘、機理研究、數(shù)據(jù)治理,供給側(cè)的關(guān)鍵業(yè)務(wù)能力包括:理論與方法、平臺與工具、數(shù)據(jù)處理與分析關(guān)鍵技術(shù)。雙方的業(yè)務(wù)能力都需要以數(shù)據(jù)人才作為基礎(chǔ),工業(yè)大數(shù)據(jù)的開發(fā)和應(yīng)用全過程集中體現(xiàn)為各類數(shù)據(jù)人才的分工與協(xié)作。
1. 場景挖掘
工業(yè)大數(shù)據(jù)的場景挖掘能力是指企業(yè)對大數(shù)據(jù)應(yīng)用場景的規(guī)劃和創(chuàng)新應(yīng)用能力。通過系統(tǒng)規(guī)劃,形成數(shù)據(jù)驅(qū)動的新型業(yè)務(wù)能力譜系圖,以場景拉動數(shù)據(jù)應(yīng)用,倒逼數(shù)據(jù)治理和應(yīng)用系統(tǒng)建設(shè)。大數(shù)據(jù)應(yīng)用場景(數(shù)據(jù)驅(qū)動的新一代應(yīng)用)可通過對經(jīng)營目標、運營問題、業(yè)務(wù)職責的分析來進行識別,或者采用數(shù)據(jù)挖掘的方法來發(fā)現(xiàn)應(yīng)用機會。工業(yè)大數(shù)據(jù)場景應(yīng)用是一個不斷深化的過程,也是一個數(shù)據(jù)價值不斷提升的過程,通常可以劃分為數(shù)據(jù)治理、數(shù)據(jù)報表和可視化、產(chǎn)品與運營分析、精細化/智能化運營、數(shù)據(jù)產(chǎn)品、戰(zhàn)略分析與決策等六個應(yīng)用層次。
2. 機理研究
工業(yè)機理是建立算法模型的重要基礎(chǔ),指的是工業(yè)生產(chǎn)設(shè)備故障診斷、性能優(yōu)化和遠程運維等背后的原理、知識、經(jīng)驗、方法和來自業(yè)務(wù)流程的邏輯,以及來自研發(fā)工具以及生產(chǎn)工藝中的工藝配方、工藝流程、工藝參數(shù)。對工業(yè)問題進行建模,有兩種典型方法,一是機理分析:根據(jù)對現(xiàn)實對象特性的認識,分析其因果關(guān)系,找出反映內(nèi)部機理的規(guī)律,據(jù)此所建立的模型常有明確的物理或現(xiàn)實意義。二是系統(tǒng)辨識:將研究對象視為一個“黑箱”系統(tǒng),通過測量系統(tǒng)的輸入輸出數(shù)據(jù),并以此為基礎(chǔ)運用統(tǒng)計分析方法,按照事先確定的準則在某一類模型中選出一個數(shù)據(jù)擬合得最好的模型。兩種建模方法各有利弊,前者的模型精度高、問題定位準確度高,但分析成本也高。后者模型精度和問題定位準確度低,但分析成本也低,工業(yè)數(shù)據(jù)建模的真正出路是將兩種方法融合。
3. 數(shù)據(jù)治理
數(shù)據(jù)治理能力指的是以擁有高質(zhì)量、高可用數(shù)據(jù)為目標,對工業(yè)大數(shù)據(jù)的基本認知和分類管理能力。高質(zhì)量的數(shù)據(jù)是開展數(shù)據(jù)開發(fā)利用的基礎(chǔ),企業(yè)找不到合適的應(yīng)用場景,很重要部分原因在于數(shù)據(jù)質(zhì)量不足以支撐數(shù)據(jù)分析。以航空裝備產(chǎn)品為例,產(chǎn)品結(jié)構(gòu)復(fù)雜、生命周期長、管理層級多、協(xié)同要求高,相應(yīng)的,航空工業(yè)大數(shù)據(jù)具有多源異構(gòu)、連續(xù)性、高通量、多尺度、強關(guān)聯(lián)等顯著特點,數(shù)據(jù)的潛在價值巨大,但數(shù)據(jù)治理難度也很大。完善的數(shù)據(jù)管理體系是工業(yè)數(shù)據(jù)治理能力的基本體現(xiàn),企業(yè)應(yīng)通過推進數(shù)據(jù)管理成熟度管理,不斷提升數(shù)據(jù)管理水平。
1. 理論和方法
理論和方法能力代表廠商對于大數(shù)據(jù)相關(guān)理論、框架、架構(gòu)、模型和方法論、標準規(guī)范、工具等的掌握程度。掌握豐富的理論和方法,使得廠商能夠以更加系統(tǒng)性的思維,用更加科學(xué)的方法引導(dǎo)工業(yè)企業(yè)推進大數(shù)據(jù)的開發(fā)和利用。這些典型的理論和方法包括但不限于:TOGAF(國際開放組織架構(gòu)框架)、DAMA-DMBOK(數(shù)據(jù)管理知識體系)、CMMI-DMM(數(shù)據(jù)管理成熟度模型)、NBDIF(NIST大數(shù)據(jù)互操作框架)、CRISPDM(跨行業(yè)數(shù)據(jù)挖掘流程)、TDSP(微軟團隊數(shù)據(jù)科學(xué)流程)、大數(shù)據(jù)標準體系、企業(yè)建模工具(如金航EMS)等。
2. 平臺與工具
開展數(shù)據(jù)分析與場景應(yīng)用需要新一代IT架構(gòu)的支撐,其中最核心的部分就是大數(shù)據(jù)平臺和相應(yīng)的數(shù)據(jù)處理、數(shù)據(jù)開發(fā)工具。大數(shù)據(jù)廠商的核心能力在于為企業(yè)用戶提供大數(shù)據(jù)平臺與相關(guān)工具。大數(shù)據(jù)平臺應(yīng)具有先進性和前瞻性、可用性和穩(wěn)定性、大并發(fā)能力和高性能性、安全性和保密性、可擴展性和開放性、易用性和易管理性。平臺軟件應(yīng)涵蓋可擴展基礎(chǔ)設(shè)施、可擴展數(shù)據(jù)存儲、可擴展處理、分析型數(shù)據(jù)庫、操作型數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)網(wǎng)格、數(shù)據(jù)源和接收器、可擴展的流處理、批處理分析和接口、交互式分析和接口、實時分析和接口、應(yīng)用程序和虛擬化、設(shè)計研發(fā)和部署工具、安全、流程管理、數(shù)據(jù)資源管理、系統(tǒng)管理等組件。
3. 數(shù)據(jù)處理與分析關(guān)鍵技術(shù)
鑒于工業(yè)場景的復(fù)雜性和工業(yè)體系的復(fù)雜性,工業(yè)大數(shù)據(jù)具有多源異構(gòu)、強關(guān)聯(lián)、高通量等特點,工業(yè)大數(shù)據(jù)分析模型的建立除了受機理復(fù)雜性影響,同時也受數(shù)據(jù)復(fù)雜性影響。因此,大數(shù)據(jù)廠商必須精通數(shù)據(jù)處理與分析技術(shù),幫助企業(yè)做好數(shù)據(jù)采集、處理、整合和分析建模,保障數(shù)據(jù)價值能夠順利得到發(fā)掘。這些技術(shù)包括:多樣性數(shù)據(jù)采集技術(shù)、多模態(tài)數(shù)據(jù)管理技術(shù)、高通量數(shù)據(jù)寫入技術(shù)、強關(guān)聯(lián)數(shù)據(jù)集成技術(shù)、機理和數(shù)據(jù)建模技術(shù)、機理建模與數(shù)學(xué)建模技術(shù)等。
廠商和企業(yè)用戶的共性能力基礎(chǔ)是數(shù)據(jù)人才,區(qū)別在于結(jié)構(gòu)和數(shù)量上的配置。工業(yè)大數(shù)據(jù)應(yīng)用的開發(fā)過程顯著區(qū)別于傳統(tǒng)的流程驅(qū)動型的應(yīng)用,因此人才配置也顯著不同。在開發(fā)和推進大數(shù)據(jù)應(yīng)用過程中,典型的角色包括:數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、數(shù)據(jù)架構(gòu)師、數(shù)據(jù)工程師、統(tǒng)計學(xué)家、數(shù)據(jù)庫管理員、業(yè)務(wù)數(shù)據(jù)分析師、數(shù)據(jù)產(chǎn)品經(jīng)理、量化分析師、機器學(xué)習(xí)科學(xué)家、數(shù)據(jù)庫開發(fā)者等。
企業(yè)在人才配置上,除機械和電子工程等技術(shù)能力以外,還需要一批新興的跨學(xué)科人才,比如下一代工程學(xué)人才,將機械工程和信息技術(shù)融會貫通,成為“數(shù)據(jù)機械工程師”。盡管目前很多高校已經(jīng)設(shè)立了大數(shù)據(jù)相關(guān)的專業(yè),但總體上大數(shù)據(jù)分析人才仍然難以滿足需求,廠商和企業(yè)都需要制定復(fù)合型人才培養(yǎng)計劃,另一方面需要創(chuàng)造環(huán)境積極引進大數(shù)據(jù)分析人才,同時探索“不求所有、但為所用”的新型人才隊伍建設(shè)模式。
大數(shù)據(jù)應(yīng)用是數(shù)字化轉(zhuǎn)型的核心內(nèi)容,也是信息技術(shù)、工業(yè)技術(shù)和管理技術(shù)深度融合的集中體現(xiàn)。但與互聯(lián)網(wǎng)、金融、政府等行業(yè)相比,大數(shù)據(jù)技術(shù)在制造業(yè)領(lǐng)域的應(yīng)用還有很大提升空間。激發(fā)工業(yè)大數(shù)據(jù)的價值,加速智能制造目標的實現(xiàn),需要企業(yè)和廠商的攜手和共同努力,雙方應(yīng)在提升對大數(shù)據(jù)的體系性認知的基礎(chǔ)上,結(jié)合自身定位,培育并不斷提升面向工業(yè)大數(shù)據(jù)的業(yè)務(wù)能力,對人才結(jié)構(gòu)、業(yè)務(wù)模式進行創(chuàng)新,需要奉行長期主義,厚積而薄發(fā)。

?