郭鵬昕,蘇睿馳,何澤,吳磊,馬懿靖
(1.合肥工業大學管理學院,合肥 230009;2.合肥工業大學機械工程學院,合肥 230601)
在智能制造快速發展的時代,離散化生產是未來中小企業發展的主流,準確預估訂單完工時間,有助于制定合理的生產計劃,有利于按時完工交付,從而提高企業信譽度。參考現有文獻,當前訂單完工期預測問題,朱海平等[1]提出了一種經驗回歸預測方法,構建車間生產過程的高級Petri網仿真模型;V. Vinod等[2]對交貨期分配方法與調度規則之間的關系進行了研究,利用仿真結果開發了元模型;申建紅等[3]綜合考慮了工期的不確定性及相關性,結合Shapley值函數與仿真技術建立工期預測模型;王燕青等[4]在實時作業車間基礎上考慮了用RBF神經網絡搭建預測模型;劉道元等[5]建立了一種基于DBN-DNN的離散制造車間訂單完工期預測模型,并在回歸預測模型中加入dropout和L2正則化以提高泛化能力;Chen等[6]在對晶圓加工周期進行預測時,采用了BP神經網絡,實現一定程度的深度學習。
在目前的預測方法研究中,深度學習已成為主流方法。本文建立了基礎的可擴展性強的深度學習模型,可以根據具體生產車間具體調整,同時使用了實際生產數據來進行訓練和測試,適應不同生產線且使用少量數據即可獲得較為準確的結果,深度學習模型的可靠性高。
訂單完工期T是指在離散化生產系統中一個訂單的第一個產品開始進入系統到最后一個產品完工所花費的總時間T=[t1,t2,…,tn][5]。其影響因素主要為生產車間的屬性W和訂單的構成O兩類影響因素。其中車間屬性包含設備與人員的工作情況、當前生產狀態、物流狀態、負載能力等多種不確定因素;訂單的構成O則可用產品類型及對應類型產品的數量來表示。

以上為影響訂單完工期的量化因素,即{O,W1,W2,…,Wn,W11,W12,…,W1m,…,Wnm},記訂單完工時間T=f(O,W1,W2,…,Wn,W11,W12,…,W1m,…,Wnm),由于函數F的形式未知,無法用簡單的條件約束或線性關系擬合,因此采用機器學習的方法來建立影響因素與訂單完工時間的關系。傳統機器學習在車間產品數量M與訂單產品數量N比較大時,影響因素也逐漸增大,一般模型在解決明確問題時十分高效,但當面對實際生產的復雜問題時,會出現泛化性差,應用效果達不到目的。因此,采用深度學習的方法,尋找影響因素之間的隱式聯系并最終形成預測模型,可達到逼近實際生產過程中復雜非線性關系與以極高精度逼近任何非線性函數的目的。
樣本收集可以通過歷史數據統計和模擬試驗進行。由于模擬實驗很難捕捉到真實生產作業中細節的影響因素,因此本文選擇實際生產數據進行采集,本文從當地某發動機生產裝配企業的制造執行系統(MES系統)獲取數據,基于兩條發動機生產線采集生產過程中的時間數據與影響因素數據,根據生產調查,可以運用統計方法得到不同產品的工藝參數以及在固定設備的加工時間,結合對生產環境人員與設備的調查,對樣本進行特征分析,如表1所示[7],人工篩選出明顯的特征值,篩除“臟”數據,并加入設備故障、人員缺勤等不確定因素,最終整合收集了31 293組數據構建數據集,構建實際生產過程樣本,作為本方法的模型構建的樣本。

表1 特征分析
深度學習神經網絡具有很強的魯棒性,其強大的自學習能力能夠逼近任意的非線性函數,建立深度學習神經網絡模型能夠有效處理時間預測問題中多變量不確定性問題的非線性關系。具體算法步驟如下:1)對MES獲取的數據進行歸一化、標準化及主成分分析法處理,降低信息冗余;2)通過分析確定模型重要參數;3)搭建模型訓練數據,根據訓練結果調整參數及模型激活函數、優化算法選擇;4)運行算法得到結果,分析結果,對比其他機器學習模型,相應算法流程如圖1[4]所示。

圖1 算法流程圖
本文對生產過程中各個環節進行分析,生產過程中確定或不確定的因素都可影響訂單完工時間,從當地企業的制造執行系統(MES系統)獲取數據文件后,除去影響因素中的不可抗力及部分人為因素,并對強相關性的數據進行整合之后,以生產線為導向,利用MySQL數據庫管理系統選取數據,并獲取對應的完成時間,導出數據為csv格式,以便Python讀取數據。將統計數據以影響因素的形式寫入對應類別的影響因素(0,0.5,1)作為樣本值,通過人工篩選出明顯的特征值,剔除無用數據,最終整合了31 293組數據構建數據集,并使用60%數據建立訓練集,其余數據用于測試。整合的數據按時間長短分類,特征包括工序數、工件數、生產線、人員缺勤、機器生產能力、人工生產能力、物流時間、物流不暢(通暢:0;短時:0.5;超過1 d:1)[7]、機器故障(無故障:0;當天可解決:0.5;當天無法解決:1)[7]、物料短缺(不短缺:0;當天可解決:0.5;當天無法解決:1)[7]10個相關特征。因此每一組輸入樣本有10個輸入變量,每個變量代表一種影響完工期的信息,同時以每一輸入向量下的預測完工期作為輸出層。

使用主成分分析法(PCA,Principal Component Analysis)對數據進行特征提取,降低數據的冗余,能夠進一步減少數據中“臟”數據的隱患,使模型能夠更好地把握數據中的主要特征,以便后續模型運算過程中提高預測的效率與準確度。
3.3.1 網絡結構的搭建
模型底層選擇激活函數為sigmoid交叉熵損失函數,公式如下:

用softmax函數作為處理參數運算過程中的分類問題的激活函數,公式如下:

由于時間預測問題不同于傳統二分類問題,使用logistic回歸算法建立k個獨立的二元分類器無法實現對時間的準確預測,只能得到時間的區間。因此使用Softmax回歸分類器更加有利于對時間預測問題的結果表達。
傳統機器學習的神經網絡通過1個隱層實現非線性映射,但為了提高模型的穩定性和泛用性,本文選擇建立DNN(深度神經網絡)選擇包含3個隱層的神經網絡,輸入層包含節點數為10,即代表訂單所包含的10個不同特征,輸出層的節點數為1,即預測結果得到的時間。網絡結構如圖2所示。

圖2 神經網絡結構圖
3.3.2 結構參數的確定
該深度學習神經網絡結構內部共包含65個隱含層神經元,且均可被訓練,依照訓練樣本可以進行學習迭代。由于基于多不確定變量構建的時間預測模型,輸入變量的有限性導致在測試中發現學習率不宜過大,將導致嚴重的過擬合現象,故在學習過程中選擇模型訓練過程中初始化學習精度ε為0.1,擴展常數Spread定為3,模型輸入節點為樣本特征數10,輸出節點為1,訓練步長為500。取樣本中60%的數據作為深度學習神經網絡模型的訓練集,余下40%作為模型的測試集用以驗證樣本的可靠性以及結果分析。
3.3.3 代碼實現
本文采用keras深度學習架構,基于tensorflow的深度學習庫,利用Python實現深度學習神經網絡模型,核心代碼(部分)包括3個部分:
1)對樣本數據的預處理。劃分訓練集與測試集,分割時間與其他特征,對特征數據進行歸一化、標準化及PCA處理(參照3.2節):

2)模型構建。依照模型架構(參照3.3.1節)最終實現深度學習的神經網絡模型,并且利用訓練集數據進行訓練,利用測試集進行測試。

3)結果分析。根據模型的測試結果進行loss曲線和val_loss曲線的繪制,利用對時間的預測結果,并通過對真值與預測值的反演計算RMSE(均方根差),衡量測試集預測值與真實值的樣本標準差,來評判預測結果的優劣(參照4.1節)。

本文以某發動機生產及裝配車間為例,從發動機兩條生產線上各選取部分數據,經過歸一化及主成分分析法處理后,輸入深度學習模型。
多次實例運行測試后最終得到的結果如表2所示。

表2 實例測試結果
RMSE(Root Mean Squared Error,均方根差)代表預測的值和觀察到的值之差的樣本標準差,用以表示預測結果分布的穩定性。計算式如下:

loss采用均方誤差Mean Squared Error(MSE)評定指標,MSE可以評價數據的變化程度,在模型運算過程中隨模型迭代次數增加而減少。
分析得出: 在相同條件下,多次試驗所得出的訓練結果不盡相同,但是訓練速度及仿真精度變化不大,能夠在誤差很小的范圍內完成對數據結果的預測。
為了進一步驗證深度學習神經網絡在解決本問題上的優越性能,根據對相似問題的研究,構建另外兩種機器學習訂單時間預測方法的模型,徑向基函數神經網絡-RBF神經網絡模型[4]和BP神經網絡模型[7],在相同樣本數據下,相同學習率的條件下,獨立進行20 次實驗,將預測結果進行比較。
作為完成訂單時間預測問題的模型,RBF 網絡有更簡潔的參數限定,預測結果變化幅度較小,而BP 網絡預測結果與實際結果有著相同的波動趨勢,且與實際結果的誤差較小,即對數據有更好的適應性,更利于在不確定條件下做出預測。作為近年來典型的預測模型,與傳統邏輯回歸算法相比,均有較好的準確性與適用性。
通過對20次實驗結果進行整體分析,選取RMSE(均方根差),作為評價分析指標,對比結果如表3所示。

表3 三種模型的誤差對比
由結果分析得知,DL神經網絡、RBF 神經網絡、BP神經網絡3種模型都可以精準地進行訂單完成時間的預測,但是DL神經網絡的均方根差為2.610,低于RBF模型的6.982與BP網絡模型的9.424,綜上分析可知,DL神經網絡模型的運行精度更好,優越性更強。
但深度學習方法由于在結構上擴大網絡尺寸,故本文方法比其他方法的網絡參數數量增加,使網絡更容易過擬合。尤其是在樣本不足的學習率過高的情況下,DL模型會出現嚴重的過擬合現象,模型的偏差小而方差大。且DL模型對樣本數據的要求比其他兩種機器學習模型高,導致的模型訓練后的泛用性問題使之局限于對目的任務的準確預測,進一步優化網絡結構與數據初處理過程是下一步改進方向。
本文重點針對離散型制造企業訂單完工時間預測展開研究,搭建了一種基于深度學習的訂單完工時間預測模型。采用了歸一化處理數據,運用深度學習獲取訂單相關參數及參數與預測時間的相關函數,有效提高了模型擬合度,比BP神經網絡與RBF神經網絡的效果更好。將基于深度學習的訂單完工時間預測模型運用到離散化車間生產中,通過模型處理數據,可以達到準確預測生產時間的目的,能為企業的生產、調配、協調工作提供保證。