江元 楊波 鄭黎明 武悅 王鋼



摘 要:隨著傳感器網絡等技術在工業領域的不斷拓展,工業物聯網技術得到了長足發展。工業物聯網及基于工業物聯網的數據分析與預測是工業智能系統的基礎。文中關注在工業互聯網環境下,工業智能系統在訓練階段利用有監督的機器學習方法,將工藝參數以及環境參數作為輸入,將生產過程關注的關鍵性能指標作為輸出,從而對生產線復雜系統進行建模;在生產階段利用訓練階段的系統模型及當前輸入對關鍵性能指標進行預測。分別利用多元線性回歸和非線性BP神經網絡方法建模,并利用當前輸入對輸出結果進行預測,從而對關鍵性能指標進行預警及預處理操作。同時還利用真實的工業物聯網數據進行了仿真和驗證,證明了基于BP神經網絡的預測方法性能優于線性預測技術。
關鍵詞:工業物聯網;機器學習;神經網絡;預測;工業智能;線性回歸
中圖分類號:TP391.7文獻標識碼:A文章編號:2095-1302(2020)02-00-04
0 引 言
2015年5月中國政府發布了《中國制造2025》發展規劃,將其作為我國推行制造業強國制造業立國戰略的重要行動綱領。本輪工業技術革命通過制造業與信息技術行業的融合來推動,從而實現我國制造業產業能力的不斷升級[1]。利用物聯網技術,制造業可以將具備感知功能的生產設備通過私有網絡或共有4G/5G公共網絡接入互聯網,實現生產制造實時數據信息的感知、傳送及智能處理,與生產環節的實時監控與預警、生產資源優化配置及智能化管理[2]。
各類應用帶來的數據量呈指數級增長,傳統人工設置假設前提并利用統計等方法來探索數據規律的方式已無法滿足當下發展需求,同時數據量的爆發式增長也為機器學習方法的發展和大規模應用提供了有利的前提條件。在金融和互聯網領域如用戶信用狀況評價、計算廣告、智能推薦、機器翻譯、自然語言識別乃至無人駕駛領域都取得了突破性進展。麥肯錫全球研究院報告中也認為基于海量傳感器數據的機器學習將主導未來工業領域的革命性創新[3-4]。
工業互聯網技術伴隨我國工業化信息化的融合取得了長足的發展。雖然針對不同客體物聯網應用各不相同,但從數據及信息采集、通信傳輸、處理與有效使用等方面來看,可以大致將物聯網分為四層,即感知層、傳輸層、數據層及應用層[2]。其中數據層實現數據的匯聚、管理及分析處理等相關工作,考慮到工業互聯網數據實時性要求高、數據量大、數據結構復雜且異構等特點,研究對數據進行有效加工的相關算法是工業智能系統的關鍵技術,也是工業國未來競爭力的重要體現。本文主要探索了學習方法在工業互聯網系統預測技術中的應用。
1 預測模型建模方法
1.1 多元線性回歸模型
回歸分析(Regression Analysis)[5]是由高爾頓(Galton)于19世紀末提出,其中最簡便的分析方法—線性回歸方法是通過最小二乘法對線性回歸方程進行求解,從而得到一個或數個自變量同因變量之間的簡單線性關系并進行建模的一種回歸分析。單自變量的回歸分析也被稱為簡單線性回歸。但在具體應用中,某個因變量通常會受多個因素的影響,簡單的單獨變量的回歸方法不足以解決問題,所以引入處理多個變量的多元線性回歸方法,大于一個自變量的稱為多元線性回歸(Multivariate Linear Regression Modeling,MLRM)。多元線性回歸模型的一般表達式如下:
1.2 非線性BP神經網絡模型
隨著生物學研究者對人類及動物神經系統的深入研究,通過神經網絡來模擬人腦處理信息的機能越來越受到研究者的重視。對神經網絡參數進行快速有效的訓練成為神經網絡技術的關鍵。誤差反向傳播(Back Propagation,BP)算法[6]于20世紀80年代被相關學者提出,推動了神經網絡技術的成熟并帶動了該技術在各個領域的廣泛應用,使得人工神經網絡成為機器學習領域的重要方法之一。通過反向傳播算法,人工神經網絡在利用歷史數據進行訓練和學習的過程中會自適應調整網絡參數,使得經過訓練的網絡能夠在盡可能最小化代價函數的意義上擬合訓練數據,從歷史數據中洞悉蘊含的統計規律,使得網絡具備預測未知事件的可能性。同傳統機器學習方法相比,神經網絡方法在處理大規模數據及非線性問題上顯示出了極大的優越性。雖然其當時也被稱作多層感知器,但同現代的深度學習方法相比,它一般是具備一層隱藏層節點的淺層模型。
反向傳播神經網絡通常具備輸入層、隱層和輸出層三層結構,其簡單的拓撲結構如圖1所示。
圖1所示為反向傳播神經網絡的學習過程,包括正向傳播的代價函數計算過程和基于代價或誤差結果的反向傳播過程。前者數據通過輸入層經隱層到達輸出層,這一過程逐級對數據進行處理,并通過比較實際輸出結果和期望結果進行誤差計算。在反向過程中,對正向過程中計算得到的誤差進行反向傳播,從而自適應調整各神經元的加權值及閾值,以降低誤差值并使其最小化。
輸入層同隱層間的加權值為vki,隱層同輸出層之間的加權值為wjk,隱層傳遞函數為f1,輸出層傳遞函數為f2。隱層節點與輸出層節點的輸出分別為:
2 性能仿真
本文采用一組7輸入2輸出的食品工業物聯網數據進行仿真,輸入為工業物聯網傳感器采集的性能指標,共7項,分別為溫度、濕度、烘干時間、原件配比、各原料加工時間、環境及工業參數,輸出值中的y1為產品的含水量,y2為營養含量。數據集規模為5 000條,分別用多元線性回歸模型及BP神經網絡模型對數據進行擬合與趨勢分析,通過擬合的模型對數據進行預測檢驗,并用均方誤差(MSE)對兩種不同模型的性能進行評估(用3 725條數據進行模型學習,用1 225條數據進行驗證)。
3 結 語
本文探討了機器學習方法在工業互聯網中的應用,并對多元線性回歸模型和非線性BP神經網絡模型進行了介紹,給出了以上兩種模型在工業互聯網關鍵性能指標輸出預測技術中的應用。最后通過真實的生產環境數據對模型進行驗證與線性方法和非線性方法均方誤差性能的定量比較。經過分析與數據仿真驗證得知非線性BP神經網絡模型相對于線性多元回歸性能能夠得到明顯改善。
注:本文通訊作者為鄭黎明。
參 考 文 獻
[1]王喜文.中國制造2015:從工業大國到工業強國[J].物聯網技術,2015,5(5):3-4.
[2]劉云浩.物聯網導論[M]. 2版. 北京:科學出版社,2013.
[3] CONWAY D,WHITE J. Machine learning for hackers[M].OReilly Media,Inc.,2012.
[4] DOMINGOS P. A few useful things to know about machine learning[J].Communications of the ACM,2012,55(10):78-87.
[5]包研科.數據分析教程[M].北京:清華大學出版社,2011.
[6] HECHT NIELSEN R. Theory of the back propagation neural network[C]// Neural Networks,1989. IJCNN.,International Joint Conference on. IEEE,1989:593-605.
[7]晁虹.基于人工智能的計算機自動控制系統優化研究[J].物聯網技術,2018,8(8):31-32.
[8]張濤,宋建濤.基于馬爾科夫模型和卷積神經網絡的異常數據檢測方法[J].物聯網技術,2018,8(8):80-82.
[9]王展鵬,吳紅光,馬蓓嬌,等.基于機器學習的工業物聯網入侵檢測技術研究[J].智能物聯技術,2018,1(2):13-17.
[10]張溶芳,許丹丹,王元光,等.機器學習在物聯網虛假用戶識別中的應用[J].電信科學,2019(7):136-144.