侯棟恒
編者按:隨著科學技術不斷進步,大數據技術在工業領域的應用也越來越廣泛。通過大數據技術分析和處理信息數據,能夠深入挖掘信息數據中的潛在價值,有利于提高信息數據利用率,從而為工業生產奠定良好基礎。基于此,作者結合大數據技術特點進行分析,并總結幾種常見的大數據技術分析方法,深入探索其在工業領域具體應用,希望為專業人士提供參考、借鑒。
引言
在“中國制造2025”發展理念不斷深入的背景下,將大數據技術引入工業制造已經成為工業革命的大勢所趨。在這一背景下,工業大數據概念應運而生。從廣義上分析,工業大數據既包括企業在內部制造產生的信息數據,也包括企業外部存在的信息數據。由于數據信息種類多樣、數量龐大,所以分析難度較高,加上新時期工業生產對分析精度提出較高要求,因此需要企業善于利用大數據技術,對海量信息進行收集、分析和應用,從而為推動工業產業持續發展奠定基礎。
大數據特點分析
大數據的普遍性特點
(1)海量性特點
新時期,我國工業信息化建設水平不斷提高,促進數據量呈井噴式狀態持續增長,海量性已經成為工業大數據典型特征之一。并且時至今日,大數據規模依然處于不斷變化中,單一數據集規模范圍不盡相同,從幾十TB到數PB不等,各種來源均可能產生數據信息。
(2)多樣性特點
受傳統數據記錄和儲存方式制約,導致工業企業記錄的數據大多為生產過程中產生的直接數據。隨著社會經濟飛速發展,檢測技術、傳感技術等新興技術應運而生,采用這些技術能夠準確記錄圖像、聲音等非結構數據,在一定程度上豐富了數據種類[1]。
(3)高速性特點
近年來,我國工業生產規模不斷擴大,生產標準逐漸提高,工藝流程日漸復雜。促進測量、控制技術更新換代速度隨之加快。一些裝置在運行過程中每秒記錄的數據高達幾千甚至上萬MB,充分體現了大數據的高速性特點。
(4)易變性特點
工業生產過程具有復雜性、系統性特征,其工況一般分為穩態和動態兩種,如果生產過程中設備產生故障,那么參數數據也會發生變化,這也突出了大數據的易變性特點。
工業大數據的特點
(1)高維度特點
工業生產結構層次較為復雜,涉及到物理化等多種變化形態,并且產生的數據彼此之間耦合度較高,容易形成一個復雜的系統結構,由于描繪這一過程需要建立在高維度基礎上,所以也充分體現了工業大數據的高維度特點。
(2)強非線性特點
過程工業中產生的信息數據之間存在必然聯系,但這種聯系并非線性關系。例如:熱力學中涉及到的溫度、壓力與反應溫度和反應速度之間存在的關系屬于非線性關系。也正因如此,使得工業生產中產生的大數據在分析和處理方面存在較大難度[2]。
(3)樣本數據分布不均特點
在工業生產中,需要盡可能保證設備參數在規定范圍內。但是受溫濕度等各種因素影響,不可避免會發生參數波動問題,使得工況產生相應變化。另外,工業生產原料性質是始終不變的,所以操作條件會一致處于波動狀態,以上均體現了樣本數據分布不均這一特點。
(4)低信噪比特點
隨著科學技術不斷進步,測量技術、傳感技術均得到了一定優化和完善。但受各種客觀因素影響,容易導致數據存在較大噪聲。例如:工業生產中使用的測量儀表出現故障,導致數據傳輸失真,容易使數據產生噪聲[3],這也為工業大數據分析造成較大難度和挑戰。
工業大數據技術分析方法
降維分析方法
以上提到,工業大數據具有高維度特點。而降維分析方法,就是將高維度數據降低到低維度,從根源上減少“維數災難”的發生。當前,很多專家和學者在研究討論中表明,降維分析實際上就是聚類與分類分析中的一個分支。然而,由于現階段我國工業生產中需要處理的數據大多為高維度數據,所以通常習慣將降維分析方法作為數據處理之前的一種分析技術。降維分析方式具體可以分為兩類,其一是線性降維,包括局部學習投影、主成分分析等方式。其二是非線性降維,包括局部線性嵌入法、等距映射法等方法。
聚類與分類分析方法
對聚類與分類分析方法進行分析,首先要明確二者定義、相關聯系以及主要區別。其中聚類分析方法,是指將工業生產中產生的數據進行分類,使其形成多個自然群體。不同群體的特征不盡相同,有利于獲得各群體特征描述。現階段,聚類分析已經成為工業挖掘數據價值的重要方法,屬于一種在沒有監督環境下形成的學習方案,能夠對數據進行深入探索和挖掘[4]。另外,對數據進行聚類分析,能夠為數據預測、數據檢索奠定良好基礎,有利于提高數據準確率和利用率。常見的聚類分析方法有五種,分別為基于層次、基于劃分、基于密度、基于模型、基于網格等聚類。
分類分析方法則是結合工業數據特征來構建分類器,而后通過分類器明確需要分類的樣本類別。這種分析方法與上文提到的聚類分析方法相比,最本質的區別在于分類數據在數據歸類前,已經明確了數據的分類規則。但聚類分析方法在數據歸類之前,則沒有相應的分類規則,而是需要在完成數據歸類后,才能夠了解不同類比的主要特點。現階段,常見的分類分析方式有多重,結合其分析特點來看,可以分為基于數據庫技術的分類方法、Bayes分類方法等。與此同時,不同分類方法的算法也存在明顯差異。例如:Bayes分類方法中最常見的兩種算法分別為TAN算法和NB算法。可以充分滿足不斷擴大的工業數據量分析需求。
相關性分析方法
所謂相關性分析,就是對工業生產中產生的數據關系程度進行分析。這種分析方法當前在國內外研究領域受到廣泛關注,已經被廣泛應用到氣象學、心理學、金融學等多個領域。從字面上對相關性進行分析,是指對兩個變量存在的關系進行分析,也就是度量二者密切程度。當前,在相關性分析實際應用過程中,最常見的方法有Pearson方法,但是結合分析結果來看,這種方法只能夠度量數據與數據之間的線性關系程度,在分析非線性關系時容易產生誤差,這也意味著該分析方式不適用于兩個變量強非線性關系分析。隨著工業大數據種類和數量的不斷增多,對多變量相關性分析提出較高要求。在這一背景下,典型相關性分析技術、因果關系分析技術等多種多變量相關性分析技術應運而生。但是這些技術在實際應用中也存在一定不足之處[5]。例如:因果關系分析技術在實際應用中,無法進行定量描述;典型相關性分析技術在實際應用中,無法解決時間序列存在的問題。目前來說,這些缺陷具有短期性特點,在未來隨著科學技術不斷進步,各種相關性分析技術勢必也會得到一定優化和完善,不僅能夠提高計算速度,而且使用范圍也會逐漸擴大。
預測分析方法
對工業大數據進行預測,實際上是一種基于功能定義的分析技術概念,在工業生產中涉及范圍較廣。包括工業生產過程對產品質量進行預測,對裝置故障診斷進行預測等。現階段,最常見的數據預測技術,就是將不同優化算法與神經網絡算法深度融合,其中較為成熟的算法有BP神經網絡、RBF網絡等。其優勢可以歸納為以下幾點:第一,從理論角度進行分析,能夠盡可能逼近非線性映射;第二,對數據輸入、數據輸出等問題進行科學處理;第三,滿足數據分布式處理需求;第四,具有較強的自適應性和自學習性;第五,能夠對大量定性定量數據進行統一處理。由于我國在預測分析方法研究和應用方面起步較晚,所以目前為止相關技術依然處于發展階段,很多技術尚不成熟。很多技術都是源于統計學理論發展而來的,其功能包括對工業大數據進行降維分析、分類分析、聚類分析、相關性分析等,并在此基礎上準確預測未來發展規律[6]。現階段,工業領域獲取的應用實例,大多是在大數據技術不同功能和不同算法深入融合背景下產生的。
工業大數據技術實際應用
工業生產過程優化方面的應用
新時期背景下,工業領域面臨的市場競爭壓力不斷增加,提高生產能力和生產質量,已經成為工業企業強化競爭實力的必要需求,這就需要企業引入各種先進裝置。與此同時,在可持續發展戰略背景下,工業領域還要充分考慮節能環保問題,要盡可能將生產過程產生的危害降到最低。面對這一改革創新需求,工業企業可以通過過程優化方式來實現。具體來說,過程優化能夠對企業生產進行實時監督,幫助企業尋求最佳生產途徑,同時可以從根源上減少工業生產過程的干擾因素,為企業提高生產能力、獲取經濟效益奠定良好基礎。對工業過程優化進行深入分析,可以將其分為兩個方面,分別為動態優化方面和靜態優化方面。并且可以采取的優化措施有多種,其中利用數據分析技術優化工業過程,就是企業改革創新的一個新思路[7]。
自改革開放后,我國工業發展規模逐漸擴大,社會生產能力逐漸提升,很多生產工藝已經基本達到國際先進水平。然而,由于工業生產過程較為復雜,所以受多種因素影響容易導致數據產生各種差異,在一定程度上增加了數據分析、處理難度。針對這一問題,有專家提出了自組織映射神經網絡分析技術及模糊C均值聚類分析技術,通過以上技術對工業數據進行分析和處理,能夠對工業生產過程中的數據進行有效監測。在兩種技術分別分析基礎上,對二者分析結果進行對比,可以發現自組織映射神經網絡分析技術精確度更高,但是處理效率相對較差。工業企業可以在分析結果基礎上對生產工藝進行優化和改進,從而進一步提高生產質量和效率,為企業持續發展奠定良好基礎。
另外,眾所周知,石化行業是帶動我國經濟持續發展的支柱產業,在新時期背景下面臨全新發展需求。其在工業生產過程中涉及到催化裂化、催化加氫、焦化等多種工藝技術。常減壓蒸餾作為石化企業較為常見的裝置,也是石油生產的重要環節。通常在進入該環節前,需要對原有進行電脫鹽處理。但結合石油企業生產現狀來看,普遍存在電脫鹽效果不理想情況。對此,有專家提出采用決策樹方法來解決,通過構建決策樹模型,對模型中產生的數據進行聚類分析,從而明確影響原油電脫鹽效果的根本原因,在此基礎上,企業可以通過改進電脫鹽裝置等方式優化生產工藝,提高生產水平。
故障監測和診斷方面的應用
故障監測及診斷最早出現于美國20世紀中期,當時主要應用到軍工、航天方面。近年來,隨著工業生產規模不斷擴大,加上各種先進技術的廣泛應用,各種類型的生產設備應運而生,雖然在一定程度上提高了工業生產質量和效率,但由于設備結構復雜、運行環境多樣,加上運行周期較長,所以不可避免存在故障問題[8]。對設備故障進行全過程監測和診斷,已經成為工業提高社會生產力的必要需求。所謂故障監督和診斷,實際上就是對設備信號、特征、狀態進行采集、提取和識別,而后對設備故障進行診斷,通過以上步驟不斷循環,能夠及時發現各種潛在問題和隱患,有利于提高故障監測及診斷精度,從而保證工業安全生產。當前,隨著工業生產規模不斷擴大,設備故障的原因逐漸增多,并且故障機理也越來越復雜,傳統監測手段和診斷技術已經無法充分滿足設備維修需求。而應用工業大數據技術能夠有效解決以上問題。上文提到,無論是降維處理技術,還是分類聚類技術,均能夠對海量數據進行科學處理。將這些技術與故障檢測診斷技術相融合,能夠突破傳統技術存在的不足之處。
例如:鋼鐵企業在生產過程中離不開高爐煉鐵工藝的支撐,只有控制好高爐煉鐵工藝,才能夠達到理想生產效果。但新時期隨著鋼鐵產品需求量不斷增加,以及生產質量要求的不斷提高,使得生產工藝也逐漸向復雜化趨勢發展,在一定程度上增加了控制難度。在長期發展進程中,專家系統在高爐煉鐵工藝控制中廣泛應用,并取得了顯著成果。所謂專家系統,就是在汲取領域專家經驗及知識基礎上,通過合理算法開發的一種系統。然而,由于鋼鐵生產中使用的高爐特點不盡相同,所以僅通過某一專家系統并不能對其進行合理控制。對此,可以將數據挖掘概念引入專家系統中,以此來解決專家系統中結合人為經驗獲取知識這一弊端。如:將BP神經網絡系統與專家系統相結合,能夠有效提高高爐故障識別率,而后通過K-Means算法對高爐運行過程中產生的數據進行聚類分析,能夠確定立項運行參數值,從而確保高爐煉鐵工藝得到有效控制。
產品預測方面的應用
工業產品的生產質量和生產效率,取決于生產裝置運行情況。雖然當前工業企業認識到了工業產品產率和質量預測的重要性,但采取的預測方法存在嚴重滯后性,無法及時反饋結果,不利于優化操作過程。由此可見,想要在提高產品預測準確性的同時提高及時性,就要充分利用工業大數據技術。注塑成型作為工業企業塑料加工的常見方法,能夠在較短時間內生產出精度較高、結構復雜的產品,這些產品當前被廣泛應用到醫療、電子等領域。但在實際生產過程中,工業企業通常每完成一次生產活動,就要通過抽樣檢查的方法對產品質量進行檢測,由于這種方法效率較低,所以不利于為改進工藝、提高產品質量提供保障[9]。對此,可以在注塑成型過程中引入拉普拉斯特征映射方法,對生產過程產生的高維度數據進行降維分析。而后利用聚類分析方法對實際工況進行分析,從而明確產品分類的具體規則,最后采用基于粒子的群算方法,構建注塑成型過程質量測量模型。結合模型對產品質量進行預測和分析,不僅能夠保證預測準確性,還能夠提高預測效率,有利于為企業優化生產工藝奠定良好基礎。現階段,大數據技術在工業生產中被廣泛應用,為解決工業生產問題提供新思路,隨著大數據技術不斷發展,勢必會進一步擴大大數據技術應用范圍,為工業發展奠定良好基礎。
結語
綜上所述,當前,大數據技術在工業領域應用方面已經取得了顯著成就,但由于我國在工業大數據研究和應用方面起步較晚,并且這些技術主要源于原有數據發掘原理基礎上產生,所以并未充分發揮其潛在價值。需要研究人員進一步加大研究力度,對工業大數據進行深入研究和開發,使其更好地運用到工業發展的方方面面,為推動工業領域持續發展提供保障。
參考文獻:
[1]劉祎,王瑋.工業大數據時代技術示能性研究綜述與未來展望[J].科技進步與對策,2019,36(20):154-160.
[2]李陽.探討大數據背景下數字技術在工業電氣自動化中的應用[J].信息系統工程,2020(01):63-64.
[3]吳章燕.解析大數據技術在工業經濟統計中的應用[J].現代經濟信息,2021(18):171-172.
[4]王韻滋,王爽.基于大數據的數據挖掘技術在工業信息化中的應用分析[J].科學與信息化,2020(25):68-69.
[5]張東光,郭輝.淺析數據采集技術在工業大數據平臺中的應用[J].科學與信息化,2020(8):22-23.
[6]許寧.基于大數據的數據挖掘技術在工業信息化中的應用探究[J].現代工業經濟和信息化,2017,7(22):50-51,54.
[7]趙文博.工業大數據在智能制造中的應用價值[J].造紙裝備及材料,2021,50(01):122-124.
[8]吳鳴浩.工業大數據的應用與實踐研究[J].數碼設計(上),2021,10(5):338.
[9]卓相磊.工業大數據在智能制造中的應用價值[J].科技風,2021(18):85-86.