摘 要:隨著信息化技術的不斷發展,大數據技術正以驚人的速度融入到人們的日常工作和生活中,推動著工業4.0時代的到來。本文利用大數據技術在數據管理優化方面的優勢,根據直升機制造生產活動的特點構建了一個面向工業4.0的直升機制造大數據平臺,平臺主要由生產過程監測與管理、直升機制造大數據平臺和直升機制造生產環境三層結構組成。此平臺不僅能夠應用于直升機零部件加工生產的環節中,而且在產品創新、產品供應鏈的分析與優化等環節也會發揮更大作用。
關鍵詞:直升機制造;大數據;工業4.0
中圖分類號:TP311.13 文獻標識碼:A
1 引言(Introduction)
早在2013年,德國就提出了“工業4.0”生產模式的概念,思科、通用電氣和英特爾等企業紛紛響應組建了“工業互聯網聯盟”,為制造業賦予了智能化、信息化和個性化生產的新特性,促進了數據資源的利用。“工業4.0”生產模式以大數據技術為基礎,實現降低對勞動力的依賴、滿足用戶的個性化需求和減少流通成本的目的,其包括智慧工廠、智能生產和智能物流三大部分,其中智慧生產是關鍵核心。
直升機制造大體分為零件制造、部件裝配、機身鉚裝和全機總裝四大部分,但包括多個生產環節,每個環節都有各自的生產規律,屬于典型的離散型生產活動,其特點包括:(1)產品規格多、結構復雜、技術難度大;(2)品種多、采用中小批量、混線生產模式;(3)產品物料需求量大而雜,物流管理復雜;(4)過程中大量數據及信息分散在各部門技術人員、管理人員、甚至工人手中,部門之間的信息交流不暢,從而導致生產及質量問題不能及時得到反饋、解決,造成大量的生產計劃延期,生產效率低下。
自我國工業4.0戰略推行以來,物聯網技術和互聯網等信息技術與直升機制造業的不斷融合,直升機制造企業在生產過程中積累了大量的數據,不僅包括指令、生產編號、圖號等文本格式的數據,還包括圖片、聲音、視頻等復雜格式的信息,這些數據的產生有規模性、多樣性等特點。如何高效的獲取、存儲、分析處理海量數據,并最大化地從這些數據資源中提煉價值成為直升機制造行業普遍關注的熱點。
大數據技術是目前公認的處理海量數據的有效方法,被譽為是助推實體經濟邁向“工業4.0”的“核動力”。利用大數據管理技術和分布式計算計算分別實現對直升機加工數據的存儲和計算,然后利用大數據分析技術對這些數據進行挖掘,從中獲取對生產決策有價值的信息,幫助企業合理安排生產計劃,從而有效提高企業的綜合競爭力[1]。
2 國內外發展現狀(The development situation at
home and abroad)
近年來,直升機在國防建設中扮演角色的重要性日益凸顯,直升機產業的發展已經被各國提升到戰略高度。發達國家西科斯基直升機公司在產品制造與設計領域目前處于世界領先地位,其利用數字化制造技術不僅完成了從傳統的大批量生產向精益生產模式的轉變,而且創新了管理模式,實現了對成本的透明性和作業流程的標準化管理。此外,西科斯基公司S92項目中,利用CATIA軟件將來自六個不同國家和地區供應商的部件實現了高效化無紙整合,建立了一個設計組件整合的“虛擬直升機”模擬系統,縮短了生產進度。
歐直公司在數字化技術方面的應用水平實際上并不亞于西科斯基公司,該公司在企業資源策劃、數字化電子樣機模擬等方面均達到了很高的水平。歐直公司采用了商務與決策公司同SAP公司聯合為其推出的商務智能平臺,主要用于績效管理與知識管理。
隨著“中國制造2025”戰略的提出,中國制造業迎來了一次新的改革浪潮,我國直升機制造企業紛紛建立了一系列的企業信息化系統來為公司的經營決策、資源配置提供支撐,其中包括資源的優化配置和目視化管理等,基本實現了生產過程的數字化管理。但與發達國家相比,中國直升機制造現在還是以低端制造為主,主要表現在以下兩個方面:
(1)沒有充分利用數據資源,將數據資源的價值資源挖掘出來,例如:若能從海量的數據中提取設備故障相關征兆數據,采用預測與相關管理算法生成該設備將要或已經發生故障的相關信息,使得設備元件具備“自我感知”能力,分析預測自身狀態,就能采取措施進行預防。
(2)缺乏面向產品制造的“知識庫”管理,若能根據大數據技術分析不同生產環節的當前需求,通過推理將不同產品狀態、設備信息相關聯并呈現給管理層,就能對企業科學、有效的決策提供有力的技術支持。
總之,直升機制造生產活動是建立在精密、有序的生產工序的基礎上,通過各工序之間的密切配合,在確保直升機制造質量的同時提升直升機生產效率。大數據在數據管理優化方面具有極強的優勢,除了能夠應用在直升機零部件的加工生產中外,還能夠在產品創新、產品供應鏈的分析與優化,以及工業物聯網的應用中發揮出更大作用。將大數據技術與數字化和檢測等技術相結合,能夠提前對直升機生產環節中的各關鍵要素進行分析與預測,從而更好地提高產品的質量與生產效率[2]。
3 直升機制造大數據平臺的總體框架(The overall
framework of helicopter manufacturing big date
platform)
直升機制造過程中產生的數據具有規模性、多樣性等特點,為了從這些數據資源中挖掘有用價值,首先要確保這些數據的存儲的完整性和處理的高效性,本文構建了一個面向工業4.0的直升機制造大數據平臺,平臺的框架圖如圖1所示。
從圖1可以看出,直升機制造大數據平臺主要由生產過程監測與管理、直升機制造大數據平臺和直升機制造生產環境三層結構組成[3],本文主要研究前兩層。
直升機制造大數據平臺的主要功能是大數據存儲和分布式計算,大數據存儲平臺通過傳統關系型數據庫與大數據庫技術相結合的方式實現對直升機制造生產環境中所產生數據的存儲與管理。在直升機制造過程中,有關系型數據庫對實時性要求較高的數據進行處理,同時定期利用數據遷移技術將關系型數據中的數據同步到大數據庫中,實現直升機制造海量數據的存儲。
隨著時間的推移,直升機制造企業會積累大量的生產相關數據,傳統的集中式處理方法已經無法滿足數據快速處理的要求,本平臺通過搭建分布式計算環境將處理任務分解到不同的服務器上,用“分治”的思想將大規模任務分解為若干個規模較小的任務,分解任務完成后匯總到同一個服務器上,分布式計算的實現不僅提高了數據處理的效率,數據備份的機制也避免了單個服務器崩潰導致整個系統癱瘓的危險[4]。
生產過程的監測與管理主要是建立在對直升機制造海量歷史數據分析的基礎上,此層不僅能夠幫助生產執行單位根據生產設備的運行狀況、原材料的數量和產品的交付期等信息選擇合適的生產方案,對生產設備的任務和產品的生產順序分別進行合理分配和排序,充分利用生產環境中的資源進行優化排產,而且還能對產品的質量進行預測分析,為企業領導層的決策提供數據支持。
4 關鍵技術(The key technology)
4.1 大數據存儲技術
大數據下,直升機制造業對于海量數據的存儲將面臨如下挑戰:(1)存儲數據量大,直升機制造工序復雜,積累的數據將達到PB級別甚至更高;(2)直升機制造數據來源廣泛,數據形式和數據結構均比較復雜;(3)要滿足數據的完整性、可擴展性。直升機制造大數據存儲采用分布式文件系統HDFS和按列存儲數據庫HBase。
傳統的數據存儲方式已經不能滿足業務的需求,分布式文件系統是被國內外一致認可的存儲大數據最好的工具,比較有代表性的分布式文件系統當屬Hadoopz的 HDFS(Hadoop Distributed File System)。HDFS采用master/slave主從架構,即一個控制節點和若干個數據節點組成[5]。一個文件信息通常被切分為若干部分分別存放在不同的數據節點,控制節點相當于整個集群的目錄,用來存儲數據節點的文件元數據。
HBase是基于HDFS是一種分布式的非關系型數據庫,其本質是一張面向列的分布式多維映射表。傳統的MySQL等關系型數據庫通常被部署在一臺服務器上,而HBase數據庫是在多臺服務器上分布存儲的,如表1所示數據在Hbase的存儲方式[6]。
如表1所示,HBase主要由Row Key(行鍵)、Time Stamp(時間戳)和Column Family(列族)組成,Row Key由任意部大于64kB的字符串組成[7];Time Stamp是主要是用于記錄數據的版本,當有新的數據插入,系統會自動添加時間戳;Column Family必須在使用表之前預先定義,但列族成員可以根據需要隨時添加。
4.2 大數據分析技術
Map/Reduce則是Hadoop的唯一分布式程序設計模型,主要用于海量數據集的并行處理。Map、Reduce來源于函數式編程模型中的“Map”“Reduce”兩個核心操作。
當進行大數據分析時,此模型先對輸入的文件進行切割,然后分發給Map函數,Map函數將其映射成另外一組中間文件,Reduce函數主要作用是整合Map函數映射成的中間文件,Map函數的映射規則和Reduce函數的整合處理是開發人員通過編寫代碼實現的。
4.3 大數據可視化技術
大數據可視化包括兩層含義,不僅指利用數據挖掘技術從數據中挖掘有用的信息,而且還要將得到的信息向用戶直觀地展示。大數據可視化的主要步驟包括獲取數據、分析數據、過濾數據、挖掘數據、展示數據和數據總結等。
將數據挖掘應用于直升機制造企業[8],一方面可以更加精準地把握產品的加工、質量和安全管理等方面的情況,另一方面可以預測未來可能遇到的生產和管理上的問題。數據挖掘常用的算法是關聯分析法,通過分析數據和系統之間的關聯,然后進行數據的分類和聚類,最后有目標型的挖掘數據潛在的價值。
可視化展示是建立在數據挖掘的基礎上,將數據中的信息形象化展示出來,常用的方法是多維智能分析法,該方法可以對分析對象進行時間、空間和邏輯關系等多個維度進行分析。
5 大數據平臺的實踐應用(The practical application
of big date platform)
5.1 系統功能簡介
直升機制造大數據平臺的有些功能是需要在后臺做處理的,而這些功能對于實時性的要求并不高,比如企業每月都要進行的加工數據宏觀分析、預測企業加工效率增長趨勢、直升機制造關鍵設備的健康管理等功能都屬于后臺數據處理,本文以直升機制造關鍵設備的健康管理為例進行說明[9]。
A公司已經構建了一套具有狀態感知、實時分析、自主決策特征的旋翼系統部件生產及裝配的智能制造生產線執行系統,通過實時監控發現生產過程中的問題,及時采取應對措施。若能從海量的歷史數據中提取故障征兆數據,采用預測與相關管理算法進行計算,從而生成該設備將要或已經發生故障的相關信息,分析預測自身狀態,就能更有效提高產品加工效率。
系統由設備數據采集、設備專項體檢、設備健康評估和建議、設備健康風險預警四大模塊組成,如圖2所示。
設備數據采集模塊主要是針對設備的基本信息和歷史狀態數據進行管理,設備的基本信息包括設備編號、購買時間、加工零件類型、使用年限等;設備專項體檢模塊中的“專項”包括生產數量、產品種類、工藝難度、原料供應、廢品率、產品要求精度、員工效率、設備生產率、設備故障率等,通過此模塊可以根據設備和產品的特點,有針對性分析影響設備利用率低下的原因;設備健康評估和建議模塊能夠對專項中的所有指標進行評估,并根據評估結果給予一定的建議,針對生產管控系統某個關鍵設備利用率低的問題,可以通過此模塊進行分析,并采取措施;風險預警模塊主要是對設備的近期若干次的健康體檢報告的數據進行管理,若發現嚴重影響設備運行率的指標超低,會進行紅色預警。
5.2 開發工具及環境
硬件工具及環境:本項目的Hadoop集群由五臺普通的PC機組成,其中兩臺用作控制節點和第二控制節點,其余三臺用作數據節點。
軟件工具及環境:本項目基于Java EE開發模式和B/S架構,后臺采用Struts、Spring和Hibernate混合框架,前臺采用ExtJS框架;所有節點采用Linux操作系統、Java Web服務器采用Tomcat。
5.3 大數據存儲
Hadoop集群搭建好后,通過MyEclipse平臺開發大數據平臺存儲功能,主要包括的類如表2所示。
5.4 大數據挖掘和設備健康狀態預測
本文在數據挖掘階段采用神經網絡、非結構數據關聯分析、模糊識別等算法,形成了算法工具庫。以非結構數據關聯分析為例,直升機制造關鍵設備健康管理系統可以通過兩種方式定義關聯算法的規則,一種是對非結構數據庫中的數據進行分析發現潛在的關聯,另一種是根據直升機制造過程中積累的經驗自定義關聯規則[10,11]。
本文采用回歸分析法進行設備健康狀態的預測,目的是根據重要數據的變化趨勢,對未來一定時期內關鍵設備的健康狀況進行推測,提前采取應對措施。
5.5 大數據的可視化分析
直升機制造關鍵設備健康的大數據可視化分析主要分為三個步驟[12],如圖3所示。
如圖3所示,直升機制造關鍵設備健康的大數據可視化分析的處理流程如下:
步驟1:收集數據。將直升機制造關鍵設備的原始數據序列化到hadoop中的HDFS中,并持久化到HBase非結構化數據庫。
步驟2:根據業務需求在算法工具箱中選用相應的算法對數據進行挖掘。
步驟3:將數據挖掘算法輸出的結果集映射到可視化模塊中成為圖形信息,可視化引擎將結果集與場景集成,將可視化效果圖反饋給用戶。
6 結論(Conclusion)
大數據是實現工業4.0的技術基礎,在直升機制造中的應用中,通過建立大數據存儲、數據分析等模型,能夠對直升機零部件生產加工全工序質量信息進行自動化采集、集成管理與質量預警。充分發揮了大數據技術在數據處理能力中的優勢,有效完善了直升機制造和裝配中的建模,以及數據的處理,從而確保了直升機制造的加工效率和產品質量。
參考文獻(References)
[1] Baesens,B.,Bapna,R.,Marsden,et al.Transformational issues of big data and analytics in networked business[J].MIS Quarterly,2016,40(4):807-818.
[2] Robert Thorstad,Phillip Wolff.A big data analysis of the relationship between future thinking and decision-making[J].PNAS February 20,2018,115(8):E1740-E1748.
[3] Chaowei Yang,Qunying Huang,Zhenlong Li,et al.Big Data and cloud computing: innovation opportunities and challenges[J].International Journal of Digital Earth,2016,10(1):13-53.
[4] Alexandros Labrinidis,H.V.Jagadish.Challenges and opportunities with big data[J].Proceedings of the VLDB Endowment,2012,152(10):2032-2033.
[5] Chang F,Dean J,Ghemawat S,et al.Big Table:A distributed storage system for structured data[J].ACM Transactions on Computer Systems,2008,26(2):1-26.
[6] Ghemawat S,Gob IOFF H,Leung P T.The Google file system[C].Proceedings of the 19th ACM Symposium on Operating Systems Principles.New York:ACM Press,2003,29(8):29-43.
[7] Dean J,Ghemawat S.Map/Reduce:Simplied data processing on large clusters[C].OSD Ip04:Proceedings of the 6th Symposium on Operating System Design and Implementation.New York:ACM Press,2004,19(6):137-150.
[8] 黃陽華.德國“工業4.0”計劃及其對我國產業創新的啟示[J].經濟社會體制比較,2015(2):1-10.
[9] 劉智慧,張泉靈.大數據技術研究綜述[J].浙江大學學報:工學版,2014(06):957-972.
[10] Zhang Guanglan,Sun Jing,Chitkushev L,et al.Big data analytics in immunology:a knowledge-based approach[J].Biomed Research International,2014(1):9-18.
[11] 李德仁,李德毅.論空間數據挖掘和知識發現的理論與方法[J].武漢大學學報:信息科學版,2002(03):221-233.
[12] Wu Yingbin,Guo Fuliang.Visualization technology based on the treatment of complicated data[J].Computer & Digital Engineering,2015,43(11):1985-1989.
作者簡介:
張貝貝(1991-),女,碩士,工程師.研究領域:大數據,人工智能及云計算.