范旭輝,劉 輝,王葉闖
(徐工集團工程機械股份有限公司,江蘇 徐州 221004)
近年來,隨著新一輪大數據技術、工業互聯網、人工智能等智能化技術的發展,一個基于大數據時代下的、全新的、智慧化的時代正悄然而至[1]。大數據作為新一代技術發展的“燃料”,正在推動著一次時代的重大變革,逐漸影響著我們的生活、思維方式的轉變,同時也為企業帶來新的商業變革[2]。作為裝備制造行業也不例外,企業正面臨著如何應用大數據技術實現企業從數字化到智能化的改造升級難題。
裝備制造業作為國家制造業的脊梁,被稱作為“國之重器”,以工程機械為代表的中國高端裝備制造業支撐著國民經濟的發展,承載著億萬人民振興中華的“中國夢”[3]。工程機械作為國家新基建戰略落地的主戰場之一,亟需利用工業大數據實現產品研發、生產制造及銷售的全壽期數字化管理與提升。同時,基于積累的企業大數據,完成企業產品知識體系的構建,并不斷迭代更新,這對大型裝備的智能制造以及后期的智能服務起到了舉足輕重的推動作用。
隨著工業大數據技術的發展,工業大數據已然成為驅動企業數字化、網絡化、智能化轉型的核心資源要素,大數據技術與先進制造技術的充分融合,進一步催生新模式、新業態,逐步發展成為企業高質量發展的新動能[4]。當今時代,數據逐漸成為企業自身運營發展,與競爭對手拉開距離的重要保障。目前工業數據的來源主要包括四部分[5]:一是來自于產品研發設計、加工制造、運行以及維修保養等全生命周期所產生的產品數據信息;二是企業各部門在運營管理過程中所產生的所有保障企業正常安全運轉的所有運營數據;三是價值鏈數據,主要包含各類客戶、供應商、同盟軍合作伙伴等商業活動產生的數據;四是外部產業鏈數據,包括國內外政策、經濟形勢的各類政策數據,同行業競爭對手信息以及設備所處的施工環境、地理環境等各種外部數據。數據的采集在于利用數據,因此對于我們來說如何在海量的數據中,利用大數據技術挖掘出對企業有用的價值成為大多數企業共同面對的挑戰,同時也是一個寶貴的機遇。“物競天擇,適者生存”,企業只有抓住這一機遇,敢于突破,在企業現有的信息化系統基礎上構建符合企業自身的智能化大數據分析平臺,才能打破現有的困境,提高產品質量,降低成本,實現“三高一可”(高質量、高效率、高效益、可持續)的戰略目標。此外,在推動實現綠色、智能、精益生產的同時,提升產品質量及穩定性,提高企業的經營效率,同時基于工業大數據的實踐和解決方案可以向行業乃至跨行業輸出,形成新的價值增長點。
本文結合自身在工程機械行業的工業實踐,系統分析工業大數據面臨的挑戰和機遇,介紹了行業內工業大數據平臺技術架構,給出了工業大數據平臺建設的方案,并結合自身實踐經驗提出了關鍵制造過程工業大數據的應用難點及創新解決方案。
大數據技術,就是從各種設備系統上采集的數據中選出具有價值信息的技術[6]。近幾年,大數據包含數據采集、存儲、處理和可視化在內的新技術獲得突飛猛進的發展,也為大數據的推廣應用提供了保障。根據自身對大數據應用的經驗而言,其處理步驟通常包括以下五個方面。
1.2.1 數據采集
數據采集方式通常是通過與各類業務系統、中控系統等進行集成以及通過設備自身(軟采)或者外加網關(硬采)等方式來采集獲得結構化、半結構化及非結構化的各類數據,這些數據構成了工業大數據平臺的底層建設。一般情況下,大數據采集部分由以下兩部分構成,第一部分是感知層:它主要是實現對各類采集到的數據進行初步智能化處理;第二部分是基礎支撐層:它主要是為大數據服務平臺提供所需的服務器等基礎條件。
1.2.2 大數據預處理技術
預處理技術就是采用數據清理、變換、歸類等方法對采集的數據進行分析,為接下來的數據存儲、數據分析應用做準備。所用到的技術主要包括以下兩類技術:
數據抽取技術:對采集到的非結構化、半結構化以及結構化的數據進行數據的轉化,使其變為單一的、便于處理的、統一的數據結構。
數據清洗技術:大量采集上來的數據存在很多沒有價值的數據,或者很多數據就是干擾等所導致的數據,因此通過對數據“清洗過濾”提取所需的數據。
1.2.3 大數據存儲管理技術
目前行業內為滿足各類數據要求,在構建企業大數據平臺時采用了實時數據庫、關系數據庫和時序數據庫多種類型數據庫協同的方式。此外,采用基于數據湖的集群式存儲方式,能夠對結構化數據、半結構化數據及非結構化數據進行存儲,滿足高性價比的數據增長需求和調用要求。
1.2.4 大數據分析及挖掘技術
數據挖掘就是從大量的實際采集上來的“臟數據”中,通過某種方法提取隱藏的、未知的、但又是潛在有用的信息和知識的過程。企業可以通過自身情況對已有數據挖掘和機器學習技術進行改進,根據數據的類型和數據的特點選擇相應的算法,對數據進行挖掘,并對其結果進行評價,最后將結果轉化為用戶易于理解的知識。
1.2.5 大數據應用及可視化技術
各公司應結合自身生產實踐經驗和數據積累,通過制造過程工業大數據采集,建立涵蓋工藝、質量、設備等多維度、多層級的算法模型。借助人工智能(機器學習)、工業大數據等新一代信息技術,實現企業數字化轉型,沉淀工業機理模型和專家知識庫,突破行業難題。
目前企業級工業大數據平臺面臨的主要挑戰有:業務鏈條復雜,且信息化建設多年,體量龐大、系統不一、業務復雜、數據不統一等。具體可以總結為以下十大挑戰,如表1 所示。

表1 企業大數據平臺建設面臨的挑戰
圖1 為企業級工業大數據平臺總體架構(參考)。

圖1 企業級工業大數據平臺架構(參考)
(1)要建立完善的全量系統數據采集平臺,完善的
數據采集方式。
研究分析數據采集對象,包含數據分類、數據格式、數據來源和數據量級等。研究分析數據采集的技術路徑,包含采集的工具、方式以及設備的協議解析和數據傳輸等等。
(2)要以元數據管理為核心建立數據管控體系,強化數據治理。
橫向:向下導入數據采集結果,向上開放數據治理結果的服務化訪問。
縱向:大數據管理平臺提供管控和應用能力,通過對元數據的盤點實現對重要數據信息的集中管控。
通過突破企業內部元數據治理的體系架構,形成了統一的、標準的、規范的,并建立元數據治理的流程機制,常態化管理。
(3)要構建混合架構、分級存儲新型數據倉庫,形成有效數據資產。
企業架構建議采用混搭架構,比如批處理引擎:Spark,MR,Hive,按批次處理海量數據;流式處理引擎:Flink,spark streaming,實時高效處理少量數據;Mpp 處理引擎:impala,presto,多節點多任務并發執行計算等,分級構建新型的存儲數據倉庫,其流程如圖2 所示。

圖2 分級存儲構建新型數據倉庫流程
平臺部署可以參考圖3 所示的拓撲結構,采用云計算技術建立服務器集群,以保障平臺的高效運行和安全管理。

圖3 大數據平臺部署架構圖(參考)
3.1.1 主要技術難點
目前,工業機器人焊接中偏焊、氣孔、熔深不足、焊接夾渣等焊接缺陷是機器人最常見的焊接缺陷,約占機器人總焊接缺陷的90%以上,尤其是無法使用追蹤(電弧追蹤或激光追蹤)功能及追蹤功能異常的工況[7]。工業上常用的焊接在線檢測主要分為以下兩種方式。
第一種是針對短路熔滴過渡形式,通過批量焊接參數采集及工藝試驗,驗證焊接缺陷及焊接工藝參數的關系,缺點是:(1)只能針對短路熔滴過渡形式,而工程機械常用焊接熔滴過渡形式均為射流過渡,通用性較差;(2)軟件采購成本較高,大范圍推廣應用比較困難。
第二種是將激光或高速相機安裝在焊接方向的正前方,通過實時檢測熔池形貌判斷是否有焊接缺陷,其優點是:采集精度較高,實時性強;缺點是:(1)激光或高速相機必須安裝在焊接正前方,限制了機器人的焊接姿態和焊接方向,且在狹小工況激光或高速相機會與工件干涉,降低自動化焊達率;(2)軟硬件成本較高,采購維護成本較高,批量推廣回收見效較慢。
3.1.2 MAG 焊純軟件原理
機器人MAG 焊純軟件在線檢測系統利用互聯網大數據、正交試驗、線性回歸及非參數化神經網絡學習建立偏焊、氣孔等焊接缺陷模型。其工作流程如圖4 所示。模型可進行設備個性差異的定制化配置并建立濾波機制以提高檢測精度,可實時檢測焊接過程中出現的異常,并可對焊接缺陷進行歷史程序指針追溯,整個過程具有較強的遺傳性、采集成本較低、系統安全可靠、易于批量推廣。

圖4 焊接缺陷在線檢測系統流程圖
3.1.3 主要解決方案
將關鍵焊縫在機器人焊接程序內進行標識,通過邊緣計算網關實時采集焊接機器人程序名稱、焊縫編號及TCP 坐標焊縫軌跡。首先將采集到的關鍵焊縫TCP 坐標數據進行主成分分析(PCA),其次將主成分進行Kmeans 數據聚類,然后將相關的數據進行BP 神經網絡學習建立數學模型,進而利用3σ 置信區間對實時采集的坐標數據進行濾波,最后建立關鍵焊縫的偏焊模型。
通過正交試驗及大數據分析回歸建立焊接氣孔及干伸長過短數學模型,其焊接氣孔模型為A≤M+(Y-K)*L,焊接干伸長過短模型為A≥N+(Y-K)*L,其中M,N,K,Y 為實驗值,A 為焊接電流、Y 為設定送線速度。
焊接缺陷模型的所有參數均可差異性配置,缺陷檢測結果經過濾波并匹配邊緣計算網關內的告警知識庫進行告警推送,告警可實現設備自動停機和程序指針追溯。
3.2.1 主要技術難點
加工專機的控制系統為PLC,沒有簡潔的用戶編程交互界面,很難實現在加工程序內進行關鍵節點標識與采集。作者前期利用主軸負載波形曲線識別專機加工產量,由于板材質量和焊接變形等制約,產品在加工過程中經常出現返修現象,負載波形曲線也不規律,進而導致產量統計不準確。此外,加工專機的裝夾找正時間較長,僅從PLC 系統采集的數據很難準確分析加工專機的裝夾找正時長。
3.2.2 主要創新原理
通過安裝紅外距離傳感器1 和紅外距離傳感器2,通過兩個傳感器結果判斷工件有無。由于工程機械行業產品結構較大,通過在工裝兩端間隔大于1.5m 的位置各安裝一個紅外距離傳感器,算法模型中設定物料上件的判定條件(兩個傳感器信息同時置1,且持續時間大于10s),可有效篩除人員、工具等對工件上件信號檢測的干擾。
3.2.3 主要解決方案
如圖5 所示,紅外距離傳感器與波形智能識別組合應用實現主要功能如下:

圖5 紅外到位檢測技術示意圖
(1)通過工件上下件檢測及負載波形聯合分析準確統計專機加工產量及實際生產節拍。在工件檢測=1至工件檢測=0 的時間內(實際生產節拍),主要負載持續時間大于理論加工時間的90%,無論負載曲線如何波動,加工專機的產量統計都是1 件。
(2)可以準確地統計出每一個工件的裝夾找正時間,可以進一步細化加工過程中的時間切片。工件檢測=1 至專機開始運行時間段,為工件的裝夾找正時間。專機運行結束至工件檢測=0 時間段,為卸載時間。
(3)聯合MES 系統快速診斷質量瓶頸。正常機加工工件在工件檢測=1 至工件檢測=0 的時間內,負載波形曲線較規律。當算法模型檢測到工件檢測=1 至工件檢測=0 的時間周期內,負載波形嚴重異常,則將此臺工件的物料ID 反饋至MES 系統,MES 通過對所有的異常物料信息進行追溯,可準確定位造成質量波動的上游設備。例如:所有加工異常物料信息中,80%的產品來自1 號焊接機器人生產,說明1 號焊接機器人造成質量波動的概率最大。通過追溯焊接參數、焊接順序及設備故障,可準確分析1 號焊接機器人造成產品質量波動的主要原因,配合現場精益生產,可快速實現質量的改善。
工程機械作為國家新基建戰略的重要基礎工具,是我國裝備制造業實現智能化的主要發力點。如果我們把數據看作是企業運行的“燃料”,那么大數據平臺就是企業運作的“發動機”。因此,怎樣更好地應用采集的數據使得企業大數據平臺發揮更大的作用是我們一直研究和探討的方向。本文從工程機械領域智能制造子模塊的大數據平臺建設出發,首先介紹了企業大數據平臺建設所用到的關鍵性技術;其次總結了在建設大數據平臺時所遇到的挑戰;最后介紹了大數據平臺建設的方案以及基于大數據平臺所做的部分應用。接下來要做的就是充分利用大數據等新一代信息技術,發揮工業大數據平臺的優勢,提升企業智能化水平,為企業數字化轉型提供強有力的保障。