胡敏
中船第九設計研究院工程有限公司 上海 200090
加快船舶制造智能化升級,為智能制造在我國船舶工業的深化發展提供有力支撐,實現船舶精益生產,是國內船舶企業的共同目標[1]。當前,在我國船舶管件加工制造行業中已經引入了數字化制造協同管理技術,其能夠將項目管理、計劃管理、物料管理、生產準備、作業管理、質量管理、系統管理等集成為一體化管理平臺,為船舶管件的加工制造過程提供系統化管理服務。然而,船舶行業受市場周期性波動和勞務成本增加的影響,工種的穩定性有所下降,部分工種甚至出現短缺[2];與此同時,行業的發展與擴張又使得生產部門面臨著巨大的生產壓力。因此如何高效地利用現有的資源與生產條件來最大化地提高生產效率是船舶管件加工生產行業的共同難點問題[3]。
智能化派工系統在一些行業已經得到了運用,比如電力行業,但是船舶行業還在探索中[4]。本文設計一種適用于船舶加工行業的智能化派工系統?;诖肮芗庸ぶ圃煨袠I現有的數字化制造協同管理平臺,本文研究開發了基于機器學習和強化學習算法的智能化派工系統。該系統是基于生產部門的最大產能、車間效率,以及管件特征,將需要加工生產的管件任務自動推薦派送給相應的部門。該系統的建立過程可分為以下三步:第一步,利用過去船舶管件加工生產的各部門各車間產能數據,以及相應的設備信息結合機器學習,使模型學習到各部門各車間的產能邊界。其次建立強化學習模型,結合產能邊界條件值、管件特征、各部門車間當前正在進行的作業狀態等信息建立強化學習模型。第三步,實現智能派工。根據當前環境的變化,做出相應變化的動態學習模型,智能推薦最佳的派工任務。
本文根據船廠管件加工制造流程以及任務派工特點,通過在原有的數字化制造協同管理平臺的基礎之上添加智能化派工系統模塊。該模塊能夠通過機器學習算法對過去車間生產數據進行學習得到各個車間的產能邊界,結合當前生產狀態,以及過去生產加工的管件信息等數據進行強化學習模型的訓練,最終在輸入待生產加工的管件信息后,該智能化派工系統能夠結合數字化制造協同管理平臺中各車間的當前生產狀態自動將新的待生產加工任務派發到特定的生產車間,以此能夠保證各車間生產加工任務的最優效率。該系統框架圖1所示:
圖1 船舶管件智能派工系統總體設計
現有的生產管控系統數據直接獲取當前各部門的生產狀態數據,以及待加工生產的任務信息數據,提取派工模型所涉及的變量,主要包括兩類:第一類是各部門的作業狀態信息、第二類是系統已派發任務信息。部分變量如下:
表1 變量信息表
為了獲取現有的船舶各車間生產狀態的規律,本文運用機器學習模型,學習生產的規律,并確定產能邊界。在機器學習中,有很多涉及監督學習的算法,本文選擇了4種算法,其中自適應增強學習算法[5]是集成算法boosting的典型代表,而隨機森林[6]算法則是集成算法bagging的典型代表,其次還有以傳統統計學為基礎的邏輯斯蒂回歸。這4種算法都適合于做分類算法,但在不用的類型的樣本數據和不同行業中,由于樣本的分布有很大差異,因此這4種算法的表現效果上總有差異。
以管件生產為例。本文選擇隨機森林進行生產特征重要度計算。其主要思想為利用每個特征在隨機森林中的每棵樹上所做貢獻的平均值進行對比,計算方法為利用平均不純度的減少,測量方式為計算分支前某一節點與分支后兩個節點gini指數的變化量。例如選擇為“管型”、“管線”、“品名”、“規格”、“校管”、“焊接”、“表面處理”、“上架”等八個特征進行重要度計算,同時可以使用其他選擇或是車間構造新的特征組合進行計算。結果如圖2。
圖2 船舶管件生產環節重要度排序圖
船舶生產系統的生產數據量巨大,憑經驗很難高效地派工。本文強化學習的任務可以用馬爾科夫決策過程(Markov Decision Process,MDP)來描述,機器處于環境E中,狀態空間為X,其中每個狀態 是機器感知到的環境的描述,如在車間生產任務上這就是當前生產狀態的描述;模型能采取的動作構成了動作空間A,如生產過程中有多種管件加工工藝類型、不同時間段的多個加工任務等多種可供選擇的動作;若某個動作 作用在當前狀態x上,則潛在的轉移函數P將使得環境從當前狀態按某種概率轉移到另一個狀態。如有兩個加工任務,一個是要求在3天后交貨,一個是要求在10天后交貨,若選擇動作是3天后交貨的加工任務,則生10天后交貨的生產任務有2種可能,一種是逾期交貨,一種的如期交貨;在轉移到另一個狀態的同時,環境會根據潛在的“獎賞”(reward)函數R反饋給模型一個獎賞,如保證一個任務都如期交貨則+1,兩個生產任務都逾期則-10,最終兩個任務都如期交貨+100。綜合起來,強化學習任務對應了四元組 ,其中 指定了狀態轉移概率。 指定了獎賞[7]。
令 表示從狀態x出發使用策略 作所帶來累積獎賞;函數 表示從狀態x出發,執行動作 后再使用策略 所帶來的累積獎賞。由累積獎賞的定義,有狀態值函數:
表示起始狀態, 表示起始狀態上采取的第一個動作;對于T步累積獎賞,用下標t表示后續執行的步數。我們有狀態動作值函數:
由于MDP具有馬爾可夫性質,即系統下一時刻的狀態僅由當前時刻的狀態決定,不依賴于以往任何狀態,于是值函數有很簡單的遞歸形式。對于T步累積獎賞有:
類似的,對于折扣累積獎賞有:
綜上,我們根據最終的策略函數作為最優化求解,就可以建立一個基于馬爾科夫決策的強化學習模型,對與不同狀態下船舶生產部門通過對過去數據的學習就可以得到一個產能邊界信息數據。具體部門的工作情況及產能邊界信息展示如熱力圖,圖3所示(因保密要求隱去具體派工數據):
圖3 2020年管加二部作業對派工計劃表
船舶管件智能派工系統設計時采用msSQL 2016作為數據庫服務器,并使用ABP開發框架進行服務端開發,以此提高服務端的穩定性和功能完整性。系統模塊功能如表2所示。
表2 船舶管件智能派工系統模塊說明
為保證系統在最復雜的情況下,能夠做出最合理的派工。我們利用歷史生產數據作為訓練數據對模型進行訓練后,選擇2020年6月的116條生產任務數據輸入至模型中。模型精確地給出了的派工結果能夠保證98%的任務在上架日期內完成,即逾期率只有2%。而2020年實際當月的生產任務有26%的逾期。另外,由數字化制造協同管理平臺生產管控系統中2020年6月兩部門的工作情況,我們發現兩部門工作符合存在明顯的差異,顯然是生產任務沒有進行合理的派發所導致,而根據智能派工系統所推薦的派工結果來看各部門的工作負荷也有所改觀,116條任務中管加二部工派發了61條生產加工任務,管二大連派發了55生產條加工任務。這證明我們的智能化派工系統能夠輸出合理的派工信息,提升部門的生產效率。
表3 智能派工系統派工結果
本文為了提高船舶制造過程中管件的管理效率,設計實現了船舶管件生產加工任務的智能化派工系統。首先采用機器學習技術對各生產加工部門歷史生產數據進行學習,獲得其動態產能邊界,在此基礎上結合待派發的生產加工任務信息以及各部門的當前生產狀態信息建立強化學習預測模型,將新的加工任務輸入模型即可輸出應該承擔該生產任務的部門;較好地實現了船舶管件加工生產任務的智能派工,極大地減少了工作人員的工作負擔,很好地提升了各部門的效率。