梁青艷 孫彥廣
(中國鋼研科技集團冶金自動化研究設計院 北京 100071)
鋼鐵生產流程是一個多工序組成的復雜的高溫物理化學過程,在制品的溫度控制是產品質量的保證和高效生產的前提。因此,通過生產計劃和調度等手段有效控制和管理生產過程,合理安排生產任務和各工序生產節奏,在滿足溫度、成分等工藝約束前提下使生產連續高效、動態有序低成本運行至關重要[1]。
鋼鐵企業生產流程屬于多工序協調作業,前后工序之間具有強耦合特性,而且同工序多設備,生產組合多,約束多,同時生產調度需要考慮多目標特性,在滿足交期的基礎上,又要考慮庫存、成本、效率等,作業計劃制定困難。由于受到內外部環境的影響,存在較多干擾如插單、撤單、設備故障、質量偏差、運輸異常等,導致生產過程生產周期的變化以及前后工序生產的同步提前或延遲,從而使生產節奏偏離計劃,計劃與執行匹配困難,難以有效實施動態調度。目前鋼鐵企業大多還處于手工編制計劃階段,手工編制計劃大多依賴經驗,時間周期較長、力度粗(不能到具體設備)、難以基于多目標進行優化。因此基于計算機建模技術實現計劃的自動編制,提高作業調度的精細化和智能化,具有重要現實意義。
目前國內外學者對鋼鐵企業作業計劃及調度問題進行了廣泛的研究,不同的專家學者基于不同的側重點對這個問題的研究方法進行了分類[2-6],有些側重于建模,有些側重模型求解。比較傳統的方法有人機交互、數學規劃、智能優化、仿真建模。其中人機交互方法簡單、明了,圖形化的界面非常易于使用,適應性較強。目前我國鋼鐵企業作業調度主要依賴于人機交互方法,但此方法主要依賴計劃調度人員個人的經驗,即使將人的經驗轉化為規則、專家系統或案例推理,也難以實現強耦合、多目標優化,而且很難持續改進。數學規劃法是將問題抽象成若干約束下的一個或者多個目標函數的優化問題,如文獻[7]以板坯熱裝比最大、交貨提前/拖期率和組爐余材率最小為優化目標,綜合考慮煉鋼與熱軋的產能及鋼種、板坯和成品規格等約束條件,建立生產合同計劃多目標優化數學模型,采用多目標優化算法進行求解,最終獲得多個可行的計劃方案;文獻[8]以煉鋼廠的連鑄機為研究對象,分別建立了連鑄機開澆決策的混合整數規劃模型以及構建了連鑄機的開澆次與實踐決策的多目標優化模型。數據規劃法本質上是一種靜態優化方法,建模過程中往往會對問題進行前提建設,主要存在理論研究層次,很難應用于多變的復雜生產流程。智能優化主要針對非線性目標函數和約束條件、多目標優化計劃調度問題提升了優化求解能力,例如文獻[9]構造了一個具有“可分離”結構的新型整數規劃公式,開發了一種將拉格朗日松弛,動態規劃和啟發式相結合的解決方法;文獻[10]針對某大型鋼鐵企業煉鋼連鑄生產調度問題,提出了一系列啟發式算法,分別用于解決作業排序、設備分配及時間安排問題以獲得高質量的粗調度;文獻[11]采用基于啟發式規則的混合遺傳算法來研究生產計劃優化問題,但是當問題比較復雜,調度規模較大時,計算量和存儲量急劇增大,很難在較短事件內找到最優解,很難對多變的現場實際狀況及時作出適應調整,受各種因素限制,現實生產中作業計劃問題很難被抽象成一個優化求解模型,限制了其應用范圍。仿真建模法可以避免對復雜制造流程物流和調度問題理論細節的分析,實現對實際生產環境分析并抽象建模,如文獻[12]建立了煉鋼生產細胞自動機仿真模型,對煉鋼生產流程進行了仿真分析;文獻[13]基于面向對象的建模技術,構建了連鑄生產過程仿真模型。通過仿真建模方法建立對象的模型,通過交互仿真分析各種計劃調度方案的優劣,但是仿真模型的精度不夠時,會使得仿真優化效果大打折扣。
多智能體建模方法由于智能體本身所具有的自主性、自治性和智能性,較好地解決了復雜系統中個體智能體行為簡單準確,大規模系統下網絡耦合、行為涌現的特征,相對于傳統的建模方法,在異構、分散、復雜系統建模上更具適應性。隨著人工智能和計算機技術的發展,多智能體技術在制造業中具有廣闊的應用前景,如文獻[14]以上海寶鋼連鑄熱軋生產過程實際情況為背景,針對連鑄熱軋一體化生產調度問題建立了按流程設備劃分的多智能體模型;文獻[15]針對煉鋼連鑄生產流程調度問題建立了多智能體調度模型;文獻[16]提出了一種基于Multi-agent的多品種多工藝車間作業調度建模與分析方法。文獻[17]提出了一個用于熱連軋機(HSM)和連鑄機集成動態調度的多代理體系結構。本文以某特鋼企業為背景,基于多智能體建模理論,構建了煉鋼澆鑄生產流程動態調度仿真模型,仿真分析表明所建模型能有效減少設備無效等待時間,極大地提高了設備利用率,縮短了生產周期。另外模型架構設計上力求通用,可用于其他生產車間,為一體化生產調度提供了基礎。
某鋼鐵企業熔煉-澆鑄生產流程如圖1所示,生產設備包括1個20tIF,1個LF爐,1個VD爐,3個澆鑄坑,其中1#澆鑄坑可生產電極棒和鑄錠,3#澆鑄坑只生產電極棒,而2#澆鑄坑只生產鑄錠。不同鋼種和規格的產品工藝路線不同,不同鋼種的爐次生產中會涉及到LF、VD 一次或者多次生產。實際生產為避免鋼包等待,需要根據澆鑄坑準備好的時間來確定鋼包入爐時刻,由于工藝要求或者工況變化,爐次生產流程中LF、VD會有二次經過的情況,這樣就涉及到同類設備競爭問題。單純靠手工來排產,難以獲得緊湊的爐次生產時刻表,而且為了避免鋼包等待,實際生產中,經常會出現澆鑄等鋼包的情況,設備利用率不充分。如何使熔煉-澆鑄生產流程平滑連續生產,減少鋼包等待,提高設備利用率,是調度要解決的主要問題。

圖1 生產流程簡圖
仿真的目的是以無效作業時間最小作為優化目標,根據設備生產的具體工藝要求和約束,確定各爐次生產計劃在具體設備上的作業時刻表。




生產調度系統是一個包含了工位、物料等多元素組成的多目標、多約束和多動態的復雜系統。多智能體系統能將復雜大系統分解成結構簡單,且彼此相互通信及相互協調的、易于管理的多個簡單Agent。多智能體技術特別適用于解決大量交互作業的復雜問題。通過對鋼鐵企業復雜生產流程分析,基于分組和統籌管理的思想,分別建立了物料Material 智能體、單設備Equipmet智能體、工序Process智能體、總調Scheduler智能體。Material智能體主要從物流層面描述了物料按照工藝路徑在不同設備的加工處理流程。Equipment智能體則是從工序設備的角度描述各設備對物料的加工處理流程。Process智能體則從工序的角度描述同工序內同類設備的任務分配和協調流程,Scheduler智能體從全局角度安排物流生產及上下游工序有序協調。
模型體系結構如圖2所示,各智能體之間通過消息進行通信,智能體之間信息交互、任務分配及協調流程描述如下:Material智能體根據自身工藝路徑向Scheduler智能體請求設備,Scheduler智能體則根據工藝路徑進行工序選擇,創建物流加工任務,并發送給和工藝路徑匹配的Process智能體。Process智能體收到任務,若有空閑設備,則從空閑設備列表中選擇可以生產且優先級高的設備進行任務委派,否則安排Material智能體進入等待設備隊列排隊等待。一旦Material智能體獲取了設備資源,則進入運輸狀態,到達相應的工位Equipment智能體,則設備啟動,進入工作狀態,同時Material智能體進入被加工狀態。工作完畢,檢查輸出條件是否具備,如果不具備則等待輸出,一旦具備輸出條件則Material智能體輸出,并進入后處理狀態。后處理狀態結束后,按照工藝路徑請求下一工序設備,而工位Equipment智能體進入工裝準備狀態。準備狀態結束后,則發消息通知本工序Process智能體,主動請求任務,若有待生產物料,則Process智能體從當前等待轉移的物料隊列列表中選擇優先級高且適合本設備生產的物料,給空閑設備安排生產任務。同時由Scheduler智能體統籌任務執行時間,協調上下游節奏,進入下一輪生產流程,否則進入等待物料隊列排隊等候。

圖2 模型體系結構
如圖3所示,智能體基本結構包括知識庫、推理決策、數據通信三部分,其中知識庫包括靜態知識庫、動態知識庫、規則知識庫。靜態知識庫存儲了不隨生產流程變化而改變的固有屬性,如所屬工序、車間、噸位、物料加工規格等;動態知識庫存儲生產過程中的動態屬性,如狀態、預計完成時間等;規則知識庫存儲了各工藝約束、狀態觸發條件,用來約束和指導智能體行為變遷;推理決策是智能體基于知識庫和目標,進行邏輯計算,把全局目標轉化為智能體的行為約束,給出行為變遷的指令;數據通信部分負責其他Agent和外部環境的信息交互。

圖3 智能體基本結構
Material智能體邏輯結構如圖4所示,靜態知識庫轉化為智能體靜態屬性,包括名稱、爐次、鋼種、規格、工藝路徑等信息。動態知識庫轉化為智能體動態屬性,包括狀態記錄、上一個加工設備/工位、下一個加工設備/工位、當前加工工序、入爐溫度、出爐溫度。智能體基于靜、動態知識庫和規則知識庫進行推理決策,主要邏輯計算模塊如下:
(1) 設備資源請求:從知識庫獲取自身狀態及位置,請求下游工序設備。
(2) 狀態變遷:智能體獲得設備后基于規則知識庫進行狀態變遷,其中運輸規則描述了上下游工序之間的距離和運輸速度; 轉移規則描述了物料轉移去向(庫存或者下一個工位);后處理規則,描述了物料的后處理工藝及后處理時間。
物料智能體狀態由等待轉移、運輸、被加工、后處理幾個狀態組成。物料從等待轉移狀態開始,一旦被分配了設備資源,且具備運輸條件,則基于運輸規則開始運輸,到達所分配的設備Equipment智能體,開始進入被加工狀態。加工完畢如需后處理,則基于后處理規則進入后處理狀態,如脫模及冷卻等,否則后處理狀態作為一個時間為零的過度狀態呈現。在后處理狀態結束后,根據工藝路徑,向下一個工位Process智能體請求設備,再次處于待轉移狀態。
(3) 信息輸出:智能體在一個加工周期結束后,更新動態知識庫,同時統計在此工序設備加工周期過程中的物料等待時間、運輸時間、加工時間、后處理時間。

圖4 Material智能體邏輯結構
Equipment智能體是所有單體設備智能體的基類,從Equipment智能體可以拓展出各工位設備智能體,如20tIF智能體、LF智能體、VD智能體、澆鑄智能體等。Equipment智能體主要職責一方面是接受Process智能體的能力評估,另一方面當被Process智能體選中后接受Process協調智能體下達的任務,基于規則知識庫及靜、動態知識庫信息,形成狀態變遷指令,完成任務,并進行狀態變更。如圖5所示,其主要邏輯計算模塊如下:
(1) 能力評估: 根據物料加工任務,讀取靜、動態z知識庫,評估是否符合設備加工條件(滿足溫度、鋼種、規格約束),預估開始加工時間、總加工時間。
(2) 狀態變遷:根據能力評估結果接收任務,基于規則知識庫中設備啟動條件及動態知識庫中設備實時狀態進行邏輯判斷,發出狀態變遷指令,驅動智能體進行狀態變遷,同時更新動態知識庫中相應記錄。
智能體狀態變遷流程圖如圖2所示,大體分為正常狀態和檢修狀態,其中正常狀態可細分為等待來料、工作狀態、等待輸出、工裝準備,基本描述了一個設備的正常工作流程;等待來料又細分為閑置等待和等待運輸,可以更加精準地分析優化等待時間。設備正常且空閑時則處于閑置等待狀態,一旦被委派任務,則狀態變更為等待運輸狀態。物料Material智能體到達設備,且具備啟動條件,則設備轉為工作狀態。工作完成后,處于等待輸出狀態,如果具備物料輸出條件,則物料直接輸出,設備進入工裝準備狀態;如果不需要工裝準備,則工裝準備時間為零,工裝準備結束,設備再次處于閑置等待狀態,開始下一批物料的加工周期。
設備啟動和物料輸出條件如下:
① 設備啟動條件:
? 設備壽命未到;
? 物料到達,且滿足溫度、鋼種、規格約束;
? 設備空閑且正常;
?輔助設備正常。
② 物料輸出條件:
? 運輸設備正常;
? 后序工位就緒。
(3) 信息輸出:對本次物料加工任務執行進行記錄,包括任務開始結束時間,物料輸入輸出信息,物料轉移工位或者庫存位置的記錄,統計執行過程中等待時間、運輸時間、工作時間、工裝準備時間、總時間。

圖5 Equipment智能體邏輯結構
Process智能體屬于工序設備管理智能體,一方面用于管理同工位的多個設備,進行任務委派和多設備任務協調,解決多設備的競爭和沖突。另一方面通過和Scheduler智能體通信,協調上下游工序生產節奏,確保生產連續、緊密且無沖突。Process智能體在本工序運用排隊論進行管理,當有物料請求本工序設備的時候,如果暫無空閑設備,則基于任務排序規則,安排物料進入等待設備隊列。當多個空閑設備處于等待物料狀態的時候,基于設備評價規則選取最佳設備進行任務委派。如圖6所示,其主要邏輯計算模塊如下:
(1) 任務排序:基于任務選擇原則,對任務進行優先級排序,在滿足溫度約束的前提下交貨期靠前的優先級高
(2) 設備評價:通過和工位智能體通信,獲取各工位智能體能力評估結果,并按照設備能力評價規則進行評價,選擇最佳設備進行任務委派。設備能力評價規則如下:
? 符合工藝約束;
? 閑置等待時間短;
? 設備效率高;
? 運行成本低。
(3) 任務下達:更新動態知識庫,并下達任務,同時從Scheduler智能體獲取下一作業任務入爐時間的預判結果,調整生產節奏。

圖6 Process智能體邏輯結構
Scheduler智能體主要用于控制整個物流沿工藝路徑的生產流程,協調上下游工序生產節奏。它還起著感知環境狀態變化信息(即信息輸入)及輸出調度信息(即信息輸出)的作用。
上下游協調是指,當本工序生產完畢,下游工序未準備好的情況下,則本工序物料處于等待狀態,出現前序等后序;或者當下游工序已準備好處于設備空閑狀態,上游工序未完成生產任務,出現后序等前序。無論哪種情況,都會造成設備的無效等待。為了解決此問題,Scheduler智能體基于全局目標,運用模型沿流程演化和時間倒退相結合的方法,確定各智能體局部目標,進行上下游工序間的工作協調。本文以熔煉-澆鑄生產流程中所面臨的協調性問題,進行具體闡述。
如圖7所示,為了通用性,本文所提供的解決方案考慮到了各工序均是多設備的情況,首先需要對下爐次設備使用情況按照工藝路徑進行預分配。物料分配具體設備后,需要根據設備當前的狀態,預計下爐次設備空閑可用的時間。根據各設備空閑可用時間,再結合物料的具體的工藝路徑倒推物料入20 t中頻時間,選擇其中最晚開始時間。

圖7 煉鋼-澆鑄工序間協調機制
仿真模型基于Java語言和平臺進行實現,通過構建對象類來描述各智能體結構,運用多線程技術實現智能體行為邏輯的并發執行及相互之間的通信,通過數據庫進行智能體知識庫的存儲及更新。
選取2017-6-24至2017-6-28 總共20爐數據為仿真基礎數據,仿真計劃輸入按照實際計劃輸入,仿真過程中各工序工作時間、工裝時間以及運輸時間以實際數據為基礎,仿真開始時間以實際第一爐中頻入爐時間為準。對仿真輸出結果總用時和無效作業時間分析如下:
(1) 總用時:
第一爐開始到最后一個爐次結束,仿真總用時97.7 h,實際用時104.7 h,比實際提前6.9 h完成爐次冶煉計劃。如表1所示。

表1 總冶煉時間對比
(2) 無效作業時間分析:
本次仿真流程中不涉及工裝設備切換時間,輔助工序額外等待時間及自身設備故障檢修時間。只考慮等待來料空閑時間和等待后續工位準備好時間。則無效作業時間可簡化為:
等待來料: 20爐,除去第一爐次外,從第二爐次開始,統計各工位從第二爐到最后一個爐次的爐次間閑置等待來料時間(如表2所示),實際和仿真相比總等待來料時間相差約39.8 h。

表2 等待來料時間對比
等待后續:主要涉及到LF等澆鑄準備好所產生的包內等待,仿真程序通過協調中頻入爐時間,消除了包內等待情況,總共減少了約130 min的包內等待時間(如表3所示)。

表3 等待后續時間對比
無效作業時間為等待來料和等待后續時間總和,實際無效作業時間為184.39 h,仿真無效作業時間為142.38 h,相差約42小時(如表4所示)。可見,通過仿真優化,使生產節奏更加緊湊,極大地減少了無效作業時間。

表4 無效作業時間對比
(3) 甘特圖分析:
由圖8和圖9對比可知,通過仿真優化,可有效避免產生包內等待,減少澆鑄坑無效等待時間,使工序之間流程更加緊湊,極大地提高了生產效率,使冶煉計劃更加緊湊連貫。

圖8 實際生產甘特圖

圖9 仿真生產甘特圖
本文基于多智能體理論建立了煉鋼澆鑄流程優化調度仿真模型,構建了物料、設備、工序、總調度幾大智能體模型,建立了任務分配機制以及前后工序間協調機制。一方面通過任務分配機制解決了多設備之間任務分配問題,另一方面通過前后工序協調優化機制,消除了由于澆鑄坑未準備好或者澆鑄坑被占用導致產生無效的鋼包等待(前序等后續),減少了由于中頻入爐時間晚導致澆鑄坑為等待鋼包產生的長時待料(后序等前序)。仿真結果表明,所建模型能有效減少設備無效等待時間,提高設備作業效率,使冶煉作業計劃更加緊湊連貫。本文所提出的4類智能體模型及智能體模型的任務協調機制具有通用性,可用于其他生產車間,為一體化生產調度提供了基礎。