桂勇,冷晟 ,吳紀元 ,陽祥貴
(1. 南京航空航天大學 機電學院,江蘇 南京 210016;2. 中國航空工業昌河飛機工業(集團)有限責任公司,江西 景德鎮 333002)
隨著復合材料的大規模生產,合理地在生產中進行動態調度,能夠有效提高車間生產效率和降低生產成本。由于熱壓罐是復材生產中的瓶頸資源,故復材車間的動態調度中常以熱壓罐的利用率作為調度目標,并按約束理論進行每個工段的動態調度,即以熱壓成型工段為基準,對其前面的生產環節實行拉動式生產,后面的生產環節實行推動式生產。如高波等以熱壓罐的利用率為動態調度目標,將復材制造過程分為若干個工段,提出了按約束理論進行工段動態調度[1]。陳國慧等以復材熱壓成型工序為研究重點,提出了基于啟發式規則的熱壓成型工段計劃排程[2]。因此,對熱壓成型工段的動態調度進行研究,具有重大意義。
對于動態調度,啟發式調度規則相比搜索優化算法、整數規劃等有著排程迅速和靈活易實施的優勢,在實際車間動態調度中廣泛應用。然而,大量文獻研究普遍認為:沒有一個規則在所有的性能指標和調度環境下始終比其他規則要好[3-4]。因此,有大量學者提出了基于數據的生產動態調度方法,期望從車間歷史遺留的調度相關數據中挖掘出有用的調度知識,根據所處的實時調度環境狀態,定出較優的調度策略。SHIUE Y R[5]利用支持向量機學得動態調度規則選擇分類器,用于車間控制系統進行實時調度決策。吳啟迪等[6]針對半導體生產線動態調度問題,基于調度優化數據樣本,利用特征選擇和分類算法獲得動態調度模型,以實時定出近似最優的調度策略。吳秀麗等[7]研究了基于數據驅動的流水車間實時調度,從歷史近優的調度方案中提取訓練樣本,通過BP神經網絡學習獲取生產系統狀態與調度規則的映射關系網絡,并將其應用于在線實時調度。但上述文獻所學得調度知識的輸出仍為單一調度規則,由于單一調度規則僅是根據工件的某一屬性進行兩個工件的比對,其在調度環境的適應性上仍存在一定的局限性。因此本文針對復材熱壓成型工段動態調度,提出一種基于極限學習機(extreme learning machine,ELM)的動態調度方法,學習獲取有用的調度知識模型,并根據實時的調度環境信息以及工件的多種屬性對比信息,定出較好的工件排入罐中。
熱壓成型工段動態調度問題可看作單工序并行多機調度問題和優化排樣問題[8]的融合:有n個相互獨立的工件,需要在m臺功能和加工時間均相同但容量不同的熱壓罐中加工,每個工件都有確定的加工時間ti(i=1,2,…,n)和確定的長和寬(li,bi),每臺熱壓罐內的排樣面都有確定的長度和寬度(Lj,Bj)(j=1,2,…,m),每個工件只需選擇其中一臺熱壓罐進行加工,并且可成批組合進罐。調度目標是最大化設備平均利用率Umax。約束條件有:1)工件的長度和寬度必須小于所排入罐的排樣面的長和寬;2)排入每個罐內的所有工件面積總和不能超過該罐排樣面的面積;3)任意兩個工件所占的區域不得有交叉部分;4)一旦工件在機器上加工就不能中斷直至其被加工完成;5)只有加工時間、壓力、溫度等相關參數相同的工件才能組成同批入罐。
根據以上描述,熱壓成型工段調度的數學模型如下:
(1)
li≤Lk,bi≤Bk
(2)
(3)
Di∩Di′=?
(4)
ti=ti′,Fi=Fi′,Ti=Ti′
(5)
Ei≤Hi,Hi+Pi≤Qi
(6)
式中:p為所排的罐數;k為熱壓罐的索引號;nk為第k罐的工件數量;Lk、Bk分別為第k罐的排樣面的長度和寬度;Di為第i個工件的所占區域;ti、Fi、Ti分別為第i工件的加工時間、固化壓力和溫度;Ei、Hi、Pi、Qi分別為第i個工件的計劃開工時間、實際開工時間、加工周期和計劃完工時間。
根據以上的動態調度問題描述,可將調度過程分為兩部分:調度序列優化+熱壓罐排樣優化。如圖1所示,調度序列優化是將可合罐的工件排列成優化的順序;熱壓罐排樣優化是基于已排好的調度序列,根據設定的排樣算法將工件依次排入熱壓罐中。關于排樣優化的方法主要有啟發式算法和智能優化算法,由于智能優化算法搜索時間較長,效率低,因此實際應用中常采用啟發式算法進行排樣。近些年來,賈志欣等提出的最低水平線法[9]受到了理論界的廣泛關注,眾多學者對其加以改進應用,都取得了較好的排樣效果。然而,選擇不同的調度序列優化算法與最低水平線法結合,會獲得不同的排樣效果。傳統的啟發式調度規則多是按某種指標(如面積、邊長)[10-11]對矩形零件排序,但單一的調度規則并不能在所有的排樣環境中都取得較好的效果。因此,本文提出基于ELM的熱壓成型工段動態調度方法與最低水平線法結合,在每個排樣的決策點時刻,根據實時的調度環境信息和工件對比信息,實時地決策出最佳的工件排入罐中。

圖1 熱壓成型工段動態調度過程
圖2為所提出的基于ELM的熱壓成型工段動態調度方法總體框架。整個框架分為兩個部分:離線學習階段和在線調度階段。
離線學習階段:該階段有獲取訓練數據和調度知識模型學習兩個任務。復材車間在常年的運行生產中積累了大量的歷史數據,涵蓋了企業訂單、工藝、設備、較優調度方案等多方面的調度相關數據。這些數據中隱含了反映實際調度環境特點以及相關調度知識的大量有效信息。因此,需要先從中提取出有價值的訓練樣本數據,然后通過極限學習機算法進行學習,從而獲得調度知識模型。
在線調度階段:該階段相當于一個在線實時動態調度器。在每一個調度決策點時刻,根據實時的訂單、生產系統狀態等數據,提取模型輸入數據,輸入離線學習階段學得的調度知識模型中,從而定出較優的調度策略,指導熱壓成型工段動態調度的進行。
由2.1節可知,該調度方法的核心就在于調度知識模型的挖掘,因此本節主要介紹調度知識模型的輸入與輸出特征以及模式的定義。對于熱壓成型工段動態調度問題,單一調度規則在對兩個工件進行比較時,一般是根據工件之間的一些屬性差值,如長、寬,面積等。但在不同的調度環境狀態下,僅僅靠單一的工件屬性進行比較無法總是獲得較好的結果。因此,本文定義調度模式為:根據實時所處的調度環境狀態和工件之間的各種屬性差,比較出任意兩個工件的優先關系。令調度知識模型的輸入特征為調度環境狀態特征和工件的各種屬性差值特征,表1所示為根據文獻[9-11]研究歸納出的一些特征屬性,其中序號1-5為工件之間相關屬性的差值特征,序號6-18的特征描述了實時調度環境的特征;輸出特征為值是0或1的類屬性,其中0代表作比較的兩個工件的后者優先,1則代表前者優先。

表1 輸入特征屬性
圖3所示為本文所需學習的極限學習機神經網絡結構,由輸入層、隱含層和輸出層總共三層神經元構成,其中輸入層有18個神經元對應18個輸入特征屬性,輸出神經元有1個,對應一個類屬性。

圖3 極限學習機神經網絡結構
選取N個任意各不相同的樣本(xi,yi)(i=1,2,…,N),其中xi=[xi1,xi2,…,xin]T∈Rn,yi=[yi1,yi2,…,yim]T∈Rm,并設隱含層神經元的激活函數為g(x),則含有l個隱含層節點的ELM數學模型可表示為
(7)
式中:ωj表示輸入層神經元與隱含層的第j個神經元之間的連接權值;βj為隱含層的第j個神經元與輸出層神經元之間的連接權值;bj為隱含層第j個神經元的閾值;ti表示ELM模型的期望輸出。
若該ELM模型能以零誤差逼近N個樣本,則存在βj、ωj、bj,使得
(8)
式(8)可表示為
Hβ=Y
(9)
式中:H為神經網絡的隱含層輸出矩陣;Y為ELM網絡輸出矩陣;β為隱含層到輸出層的權值矩陣。因此,一旦輸入層與隱含層之間的神經元連接權值ω和隱含層神經元的閾值b給定,矩陣H就被唯一確定。單隱層神經網絡的訓練就可以轉化為一個線性系統,只需求出輸出權重β就能完成訓練,β可由式(9)取得:
β=H+Y
(10)
式中H+表示隱含層輸出矩陣H的Moore-Penrose廣義逆。
為驗證所提出的基于ELM的熱壓成型工段動態調度方法的有效性,本文以某企業復材車間的熱壓成型工段為例進行研究,基于Tecnomatix plant simulation進行仿真實驗,并對實驗結果進行分析與比較。
本文通過Tecnomatix plant simulation仿真軟件對某企業復材車間熱壓成型工段的動態調度問題進行仿真實驗。由于實驗數據資源有限,本文通過仿真實驗,根據該車間的工藝、設備、歷史訂單數據,確定了一些調度問題實例的參數取值范圍(如工件的數量和尺寸、機器的加工時間等),隨機構造了30個實例問題,然后針對每個問題實例利用GA進行仿真,取出每個問題對應的最優調度方案,并在此基礎上提取出訓練數據對?;赑ython語言實現ELM學習算法,用于調度知識模型的學習。相關算法的實驗參數如表2所示,所有實驗均在Intel Core i7-4510U、2.6GHz CPU、8GB RAM、Win8 64為系統的平臺下運行,所涉及的軟件有Tecnomatix plant simulation、python 3、PyChram。

表2 算法實驗參數
為了驗證所挖掘出ELM模型的調度性能,在調度問題參數的取值范圍內隨機構造了10個調度問題實例,分別利用ELM模型和各種常見的單一調度規則(面積、寬度、高度、高寬比等進行排序)對問題實例進行求解,并對調度結果進行分析與比較。
表3為各種算法的調度性能(設備平均利用率)的數值比較。從表3中可以看出,在8/18的調度問題求解情況下,ELM模型的調度性能明顯優于其他單一調度規則。此外,關于ELM對訓練樣本進行學習的過程較為耗時,但學習得出的ELM模型用來對測試樣本進行決策時,幾乎是瞬間完成。據實驗統計,ELM模型預測一條樣本的結果大約耗時0.02s。因此,完全滿足動態調度的實時性要求。

表3 各種算法的調度性能(設備平均利用率)比較
另一方面從算法穩定性角度考察ELM模型,圖4所示為ELM模型與各單一調度規則在不同的調度問題實例下的調度性能表現??梢钥闯龈鞣N單一調度規則在不同調度問題下的表現差異較大,無法取得穩定的調度結果,而ELM模型在不同調度問題下表現良好且穩定。

圖4 各算法在不同調度問題下的表現
本文針對復材熱壓成型工段動態調度問題,研究了一種基于ELM的動態調度方法,從車間歷史存留的調度相關數據中提取訓練樣本,利用ELM從中學得調度知識模型,在每一個調度決策點時刻,根據實時的調度環境狀態信息和工件間屬性差信息,定出較優的工件排入罐中。該方法不僅適用于實時的車間動態調度過程,而且在調度性能上明顯優于其他單一的調度規則。