吳應樺 趙雯桐 閻翔

摘要:隨著物聯網以及5G網絡的逐漸普及,大數據技術的重要性顯得越來越高,并且深入了社會的方方面面,機械制造行業作為工業的基礎,也受到了深遠的影響,由此而來產生的數據也出現了幾何級別的增長,于是大數據技術也成為了各種領域研究的熱點。大數據技術為了和機械制造領域的應用緊密的結合起來,則需要一系列系統完整科學的理論和方法來應對當前局面下所遇到的挑戰。
Abstract: With the gradual popularization of the Internet of things and 5G network, the importance of big data technology is becoming higher and higher, and it has penetrated into all aspects of the society. As the foundation of industry, the machinery manufacturing industry has also been deeply affected. The data generated from this has also increased at a geometric level, so big data technology has become a hot spot in various fields. In order to combine big data technology with the application of mechanical manufacturing field, it needs a series of systematic, complete and scientific theories and methods to meet the challenges in the current situation.
關鍵詞:大數據;云計算;數據挖掘;機械制造
Key words: big data;cloud computing;data mining;mechanical manufacturing
中圖分類號:F426.4? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)31-0164-02
0? 引言
隨著全人類進入了數字化信息時代以來,出現了萬物皆可數據化的趨勢。在先前的發展歷程中,由于數據的應用受到采集手段、傳輸手段以及處理速度等瓶頸制約的限制,并沒有完全發揮出來數據應有成效。而隨著最近幾年我國的移動設備端基礎建設日趨完善,硬件軟件平臺的不斷加強,特別是4G網絡全世界第一的覆蓋率和全世界最龐大數量的智能機的使用群體這兩項,使得我國的大數據技術飛速發展,并且由于較高的技術投入回報,使得騰訊阿里京東等獨角獸級的信息產業新興公司紛紛入局,也大大促進了大數據的技術的提升,對國家企業和社會的發展也有著很大的促進作用。而近一年國家和社會在5G技術應用中的布局,則反過來對大數據的技術提出了更高更先進的要求,在這個大背景之下,如何把新技術和機械制造更好的結合起來使兩者發揮出來一加一大于二的效果,以更好的滿足我國的工業升級更新換代的需求,成為了擺在我們面前的重要課題。
1? 大數據的特征
概括性的看,大數據有著5V的特性,分別是Volume、Velocity、Veracity、Veriety、Value五大特性。
Volume含義為數據量極大,甚至是ZB或者PB級別的海量數據;Velocity含義為對數據的響應處理時間要求低;Veracity的含義是數據的模糊性,由于大數據的特殊性,采集來的數據往往充滿了噪聲以及數據的不連貫和一些模棱兩可無法歸類的數據;Veriety的含義為數據類型和數據源多元化,文本、音頻、圖片甚至視頻等等都有著一定的比例;Value的含義是數據所蘊含的價值,價值一方面很高,否則也無法如此大規模的應用,另一方面數據所蘊含的價值很稀疏,單位數據量價值含量極低,含有大量的冗余和無效的數據。
相對應這幾大特性,機械制造業的大數據還包含有以下的很多特性:
數據質量低下:由于機械制造行業的生產環境的限制,生產流程中的環境很復雜,傳感器攝像頭等收集到的數據都比一般的數據有著更高的噪聲比。
數據的實時性高:由于生產線的檢測數據都是采用的連續的采樣數據,有著嚴格的次序比例,并且間隔時間極短,一旦數據處理不及時,會導致出現的結果有著一定的滯后性,這樣再得到的分析處理方案就顯得意義不大了。
數據的信息復雜:由于機械制造行業門類眾多,上下游的企業的數據化程度和普及度也有著參差不齊的現實情況,有一些信息化程度高的企業機器產生的數據比例較高,而一些信息化程度低的小型企業則甚至大量依賴人工輸入的原始方法,所以對于機械制造業來說數據情況會更加復雜同時數據的來源也多種多樣,錯誤的比例會更高。
綜上所述,在機械制造業中的大數據分析要力求提高數據的質量和精度的同時,還需要根據應用場景來自我完善分析數據的建模流程,這個建模的流程則是需要設計出一套對實時性要求很高的分析算法,最終使用這個分析結果來知道企業對生產的流程做出管理和優化。
2? 技術體系分析
大數據的技術體系,主要的側重點是針對如何在很短的時間內面對海量的包含大量冗余無效的數據中挖掘分析提煉出有效的數據然后以用戶要求的可視化的模式呈現出來,以及總體的來說流程如圖1所示。
2.1 數據采集? 由于面對的數據類型多種多樣,這里會先按照數據結構的不同對數據進行初步的分類,先分為結構化數據、半結構化數據和非結構化數據。其中結構化數據采用傳統的二維表的結構來構建,非結構化的數據則采用文件系統存儲的方式來進行。在實際應用中,以數字文本等為主體的結構化數據占據少數,大量的以圖片視頻等為主體的非結構化數據占據了主要地位并隨著時間的推移呈幾何倍數增長。而在我們機械制造行業中,比較容易作為結構化數據出現的則是訂單、尺寸、產量以及供需關系等比較單一的參數;而非結構化的例如故障診斷、營銷策略、售后數據以及物聯網和感應器的數據等,都是以視頻或者圖片的形式為主。
2.2 數據存儲? 數據的存儲方面則根據數據的類型劃分,比如針對關系型數據庫的SQL,非關系數據庫的NoSQL 以及新型數據庫 NewSQL,這些數據庫都可以針對大數據的查詢進行簡單的處理需求。當數據規模達到一定的數量級的時候,則需要使用分布式數據庫存儲集群,而隨著網絡帶寬設備的逐步完善,云環境下的數據存儲則占據了越來越重要的地位。嚴格意義上來說,云存儲并不是一種存儲,而是一種多個服務的集合體,它將數據存于各種分布式的設備中并提供給用戶在任何時間地點和網絡設備中對數據皆可進行訪問的服務。
2.3 數據處理與計算? 在不同類型的領域中,數據處理的需求的分類也不同。在互聯網行業中,按照處理的要求時間分類,則分為毫秒級的在線模式、小時分鐘級的近線模式以及天級別的離線模式三大類。早期的計算機網絡處理模式依靠單獨的計算機,但是隨著技術的發展和數據量的不斷龐大,逐漸轉變為分布式的計算模式,最終在最近幾年孕育出了云計算這一新產物,云計算在將來會成為極為重要的計算模式。
2.4 數據挖掘? 數據挖掘的復雜度高,計算量大的特點對于信息提煉的技術提出了更高的要求,在實際應用中則主要通過以下幾種方法進行處理:數據預處理技術,是通過一些特殊的算法技術,通過一定的規則對原始的流式數據篩選出具有一個特征的子集,使用該子集來代替原始數據以達到減少存儲量對數據進行初步預處理的功能;另一種方法則是通過滑動窗口、輸出粒度等算法,基于任務進行優化,在空間上減少整個數據流的計算規模,這是一種對數據進行壓縮的思路。
非向量數據挖掘,相對應傳統的向量數據為主的數據庫,大數據總體數據類型更加多樣化多元化,半結構化和非結構化的數據占據了很大的比例,所以提高非向量數據挖掘的能力可以使得大數據的數據處理技術上升一個臺階,但是由于半結構化和非結構化的數據具有很大的不確定性,所以數據的價值性也呈現出一種不穩定的狀態,對數據挖掘能力提出了更高的要求和巨大的挑戰。
可拓展的大數據挖掘算法,為了面對大數據在使用過程中數據依舊不停的增長的特性,大數據挖掘算法應具備可拓展性。在實際應用中通常通過使用不同的并行策略以及云服務來增強算法的可拓展性,并且實現數據的聚類,例如將樹構建的子任務并行分配與若干進程,從而減少大數據的挖掘響應時間。
3? 大數據的影響
大數據技術可以通過數據挖掘分析出來機械制造生產的各種上下游產業的產品特點和需求特征,然后針對結果制定出與之相對應的生產策略和方針,生產出更好的產品的同時也能反過來推動上下游的一系列產業鏈的發展和進步,從而實現國家層面上總體機械制造業的大轉型。同時大數據技術也能大大的提高機械制造和其他各個行業的結合,企業在大數據的利用背景中,可以提高自身的競爭力,促進企業的發展,為機械制造行業帶來創新和變革。首先大數據技術會影響總體人類社會的思維模式,將思維模式從計算為中心逐步轉變為數據為中心的思維模式;其次大數據技術同樣會改變人們生活的方式,4G、傳感技術以及物聯網等技術的飛速發展,影響到了我們生活的方方面面,直接改變了我們獲取信息資源的模式,而云計算的發展則改變了我們應用信息資源做出決策的方式,從或許信息到應用信息做出決策的過程,更加強調人、機和物的融合,而伴隨著技術的進步和發展,人們也對這些提出了更高的需求;第三則會直接改變生產方式,例如德國提出了工業4.0的智能加工制造的概念,即第四次工業革命,它的目的是通過網絡系統采集產品和零部件以及產量耗材耗時等信息,然后通過算法實現決策過程非人為干預的職能方式來實現自動化處理。
4? 結論
大數據技術在機械制造業中還面臨著更多的挑戰,很多技術層面的成果還正處在實驗和推廣階段,另外,數據建模和算法部署的場景還需要考慮很多不同的因素在內。而管理者還需要考慮在企業的日常管理中如何將大數據的分析結果并產生的方案融合到生產和實際中去。大數據技術作為未來的重要構成,引起個各個國家各個領域以及機構部門的廣泛重視,并且成為未來市場以及國家之間技術領域競爭的重要手段和砝碼。在未來的競爭中,必然會掀起一股更加猛烈的技術革新和科技創新的潮流,推動生產力和人類社會的進一步發展。
參考文獻:
[1]彭宇,龐景月,劉大同,彭喜元.大數據:內涵、技術體系與展望[J].電子測量與儀器學報,2015,4.
[2]梁志宇,王宏志,李建中,高宏.制造業中大數據分析技術應用研究綜述[J].機械,2018,6.
[3]劉康寧.淺析大數據時代的機械設計發展趨勢[J].山洞工業技術,2019,6.