李曉理 王康 于秀明 蘇偉
礦渣微粉(Ground granulated blast-furnace slag,GGBS)全稱為“粒化高爐礦渣粉”,是將煉鐵高爐排出的水淬礦渣經過超細粉磨干燥而得到的一種粉末狀產品.作為一種新型環保型建材,礦渣微粉按一定比例摻合,可以大大改善水泥和混凝土的強度、抗滲性、耐久性、抗蝕性、抗硫酸鹽等性能[1].礦渣微粉廣泛應用于建筑、鐵路鋪設、海底隧道等建材中.比表面積(單位質量物料平鋪所具有的總面積)是衡量礦渣微粉質量的重要指標.立式磨機是礦渣微粉生產的主要設備,粒化高爐礦渣在磨機中經過干燥粉磨,得到粒度滿足細度要求的礦渣微粉顆粒.提高礦渣微粉比表面積可增加水化反應接觸面積,提高礦渣水化活性.比表面積越大,礦渣微粉產品質量越高,單位時間內產量也就越低.微粉產品比表面積和單位時間產量是礦渣微粉生產關注的兩大關鍵指標.
礦渣微粉在封閉的大型立磨設備中進行復雜的物理化學變化,微粉生產是一個非線性、強耦合、高不確定性的復雜過程,難以對其建立精確的數學模型[2].同時,礦渣微粉生產是一個多工況系統,礦渣原料的不同批次、材質、含水量,選粉機等設備的異常狀態都會使生產系統工況發生劇烈變化.傳統自適應控制方法針對的被控對象是基于參數不變或緩慢變化的模型,系統工況的劇烈變化往往導致傳統控制方法超調量變大、收斂速度降低甚至控制失效.多模型自適應控制是解決系統工況切換問題的有效方法,該方法基于多個模型與被控對象之間的辨識誤差,實現最優模型和控制器的切換[3?4].利用神經網絡逼近動態規劃問題中HJB(Hamilton-Jacobi-Bellman)方程的解和最優控制策略,自適應動態規劃(Adaptive dynamic programming,ADP)為求解非線性系統的優化問題提供了新思路[2,5].利用多模型思想,設計多模型ADP優化控制器,將能有效解決礦渣微粉生產系統參數跳變和工況切換問題.
如圖1所示[6],通過對先進感知、計算、通訊與控制技術的深度融合與有機協作,信息物理系統(Cyber-physical system,CPS)構建人、機、物、環境等要素在物理空間和信息空間的相互映射、適時交互和高效協同,實現系統內信息與知識的累積和迭代優化.從2006年美國科學院發布《美國競爭力計劃》,到德國“工業4.0”、“中國制造2025”,信息物理系統在國內外引起了政府和學術科技界的廣泛關注和深入研究.目前,CPS已廣泛應用于道路交通、能源、航空航天、醫療、機器人、工業自動化、智能電網等領域[7?14].

圖1 信息物理系統Fig.1 Cyber-physical system
由于網絡技術的快速發展以及大量基礎自動化設備的應用,礦渣微粉生產過程中的大量數據能夠被實時獲取,這些數據包含了大量反映礦渣微粉生產運行和產量質量等關鍵參數的潛在信息.將礦渣微粉生產物理系統與信息系統進行深度融合,利用信息物理系統特有的數據驅動、虛實映射、精確控制和系統自治等功能,構成“狀態感知–實時分析–科學決策–精準執行”的閉環賦能體系,實現基于CPS框架的礦渣微粉生產系統優化控制,解決礦渣微粉生產過程中的工況切換和優化控制問題.
利用礦渣微粉生產過程中的大量運行數據,本文分析并提取出反映生產運行的三種典型工況—正常工況、喂料量異常和選粉機轉速異常.求解“質量–產量”多目標優化問題,獲得不同工況下的最優設定值.利用不同工況數據,分別采用遞歸神經網絡(Recurrent neural network,RNN)建立三種工況的動態模型,根據最優設定值設計基于ADP的最優跟蹤控制器集合,通過模型誤差,計算不同控制策略權值,構建礦渣微粉生產系統的加權多模型控制方案.解決礦渣微粉生產系統工況切換情況下的優化控制問題,減小系統超調量,改善控制品質,提升礦渣微粉生產整體效能.
本文結構如下:第1節分析了礦渣微粉生產過程并給出了系統最優控制問題描述;第2節給出了“運行過程優化–跟蹤控制優化”的優化控制結構,設計多工況切換情況下的多模型ADP控制器,并給出礦渣微粉生產系統的CPS框架;第3節將多模型自適應控制器應用到礦渣微粉生產過程中,進行實驗仿真分析;第4節對全文進行了總結.
如圖2所示,煉鋼煉鐵過程產生的礦渣經配料設備進行配料、混合、除鐵、稱重等操作,由入料皮帶傳送至立磨.分布在立磨磨盤中央的礦渣在立式磨輥和旋轉磨盤之間的擠壓下進行粉磨并逐漸移至磨盤邊緣,自下而上的熱風將掉入磨盤邊緣與磨機邊壁縫隙的礦渣顆粒吹起并烘干.隨氣流進入磨機頂部符合粒度要求的微粉顆粒被選粉機分離出來,而粗料通過回料錐落回磨盤中央進行重新粉磨.
礦渣微粉單位時間產量和產品質量是礦渣微粉生產過程關注的重要指標.比表面積指示微粉產品質量,比表面積越大,產品粒徑越小,其水活性、耐腐蝕性等性能越好.國家標準分別將比表面積超過400m2/kg和500m2/kg的礦渣微粉定位S95和S105級.此外,為了保證立磨運行穩定,磨內壓差需要在給定范圍內變化,以確保進出磨物料達到動態平衡.影響微粉產量和質量的主要因素有:

圖2 礦渣微粉生產系統流程圖Fig.2 Flow chart of GGBS production process
1)喂料量
在入磨物料穩定的前提下,單位時間喂料量越大,微粉產品產量越高,立磨內累積的物料也就越多,需要減慢選粉機轉速,增大出磨量以維持磨內壓差穩定,造成微粉顆粒粒徑變大,產品質量變差.
2)入磨熱風
入磨熱風將磨內物料吹起烘干,并攜帶至立磨頂部進行篩選.入磨熱風采用熱風爐提供熱風,通過調節入磨冷風閥開度調節熱風溫度,氣體溫度太低,烘干能力不足,成品水分大,導致礦渣磨不細,系統的粉磨效率降低;風溫過高,物料由于靜電作用在立磨頂部堆積,造成產品顆粒變細,同時產量降低.入磨風量過大,大粒徑顆粒被帶入成品庫,產品質量變差產量提高;風量過小,產量變小,同時只有小粒徑顆粒才能被選為成品,質量提高.
3)選粉機轉速
實際生產中,入磨風量通常保持不變,選粉機轉速是調節微粉產品質量的直接手段.選粉機葉片旋轉帶動物料高速旋轉,在離心力的作用下,粒徑達不到標準的顆粒被甩至邊壁掉入磨盤進行重新粉磨.選粉機轉速越快,離心力越大,產品粒徑越小產量也就越低;轉速越慢,被選出的產品粒徑越大,產量越高.選粉機轉子采用了變頻調速,可以實現微粉質量的平滑調整.
由于礦渣微粉生產過程復雜,且封閉的立磨內部氣流和顆粒運動難以預測,目前還無法建立礦渣微粉生產過程的準確機理模型.通過以上分析,微粉產量、質量同時受到喂料量、入磨熱風溫度、冷風閥開度、選粉機轉速等參數的影響,同時,各參數對產量、質量的作用是相反的.給出如下礦渣微粉生產過程的動態描述:

其中,x∈R2,u∈R4,x1、x2分別為微粉比表面積和產量,u1、u2、u3、u4分別表示喂料量、選粉機轉速、入磨熱風溫度和冷風閥開度,θ為影響礦渣微粉生產的物料材質、含水量、入磨風量等固定參數.
礦渣微粉生產過程的主要控制目標是在保證系統穩定性的前提下,使產品產量和質量跟蹤上期望值.與此同時,由于實際生產過程中,各執行器受到自身物理條件和工藝機理的限制,只能在給定范圍內變化,如表1所示.

表1 各控制變量允許變化范圍Table 1 Permitted range for each variable
式(2)給出了礦渣微粉生產過程優化控制問題


為了實現礦渣微粉生產過程優化控制,最優控制量滿足如下性能指標函數

其中,r(xe(i),ue(i))為關于狀態誤差xe(i)和控制誤差ue(i)的函數.


圖3 優化控制結構圖Fig.3 Structure of optimal contol
通過計算、網絡及優化控制方法的互相協作和融合,提出一種礦渣微粉生產過程的信息物理系統框架,實現系統信息的及時監測、可靠傳輸和優化控制和綜合治理.如圖4所示,通過分布式數據采集系統,生產過程中各傳感器數據通過現場總線傳輸至集成優化控制器,通過“過程運行優化–跟蹤控制優化”的優化控制方法,獲得多工況切換情況下生產過程的優化控制信號,通過現場總線傳輸至各執行器進行調控,從而實現礦渣微粉生產過程的優化控制.由工業以太網進行數據雙向傳輸,工業觸摸屏顯示系統運行狀況并對生產運行進行現場監測和控制.同時,應用無線傳輸模塊和工業云,利用遠程計算機和移動設備對生產過程進行監控.
礦渣微粉生產依據實際生產與設定值的偏差進行控制,現場往往根據生產運行狀況,憑借生產經驗給定產量、質量等設定值,不能充分發揮生產設備性能,造成產能和資源的浪費,影響企業效益.從生產數據出發進行運行過程優化,在滿足控制變量約束條件的前提下求解“質量–產量”多目標優化問題,獲得后續跟蹤控制的優化設定值,充分挖掘設備性能,提高生產效率、產品質量和經濟效益.

圖4 礦渣微粉生產最優控制系統CPS硬件結構Fig.4 The CPS hardware structure of GGBS production optimal control system
對濟南魯新新型建材有限公司生產三線2013年1月12日至5月8日2380組數據進行分析,提取出影響礦渣微粉生產產量質量的比表面積、產量、磨內壓差、喂料量、熱風溫度、冷風閥開度、選粉機轉速等數據.經過經驗篩選,得到如表2的正常工況(記作工況1)運行數據.

表2 微粉廠3號礦渣微粉生產線生產工況1運行數據Table 2 Process data for GGBS production line 3 in condition 1
根據工程師經驗結合現場數據,提取出礦渣微粉生產過程的兩種典型異常工況,工況2表示喂料量異常,與正常工況進料情況差距較大;工況3表示選粉機轉速異常.表3和表4分別為以上兩種異常工況下的生產數據.

表3 微粉廠3號礦渣微粉生產線生產工況2運行數據Table 3 Process data for GGBS production line 3 in condition 2

表4 微粉廠3號礦渣微粉生產線生產工況3運行數據Table 4 Process data for GGBS production line 3 in condition 3
礦渣微粉生產過程優化控制的目標是同時使產量最高、質量最優,然而,礦渣微粉產量和質量是兩個互相矛盾的目標.如圖5所示,提高微粉產量需要增大喂料量,造成進出磨壓差變大,嚴重時導致磨機振動,需要減慢選粉機轉速來增大出磨量,造成產品顆粒比表面積變小,質量變差;減小產量需要減少喂料量,造成磨內壓差變小,需要加快選粉機轉速減少出磨量,致使成品顆粒變細,質量提高.

圖5 微粉參數作用機理Fig.5 Interaction among parameters of GGBS production process
因此,礦渣微粉生產過程可以總結為如下多目標優化問題:


對于不同生產工況,其多目標優化問題的最優解集可能是不同的,同時,工況切換后的系統不一定能達到之前的最優設定值.如圖6所示,對于三種生產工況,分別采用文獻[15]提出的礦渣微粉生產多目標優化方法對微粉產品產量、質量及磨內壓差建立基于粒子群優化的最小二乘支持向量機模型Fj,j=1,2,3.根據實際生產狀況、各執行器物理條件約束及生產過程穩定性要求,給出各控制變量及磨內壓差的約束條件,得到礦渣微粉生產過程的多目標優化問題(Multi-objective programming,MOP).一般來說,多目標優化問題并不存在一個最優解,所有可能的解都稱為非劣解,也稱為Pareto解.利用快速非支配排序遺傳算法(NSGA-II)求解不同工況下多目標優化問題,得到關于質量–產量兩個矛盾目標的Pareto最優解集,根據客戶需求及實際生產設備人員狀況,從最優解集中選取合適點作為不同工況下的最優設定值ri,i=1,2,3.

圖6 多目標優化設定值流程Fig.6 Flow chart of set-point optimization using multi-objective optimization algorithm
2.3.1 遞歸神經網建模
對于如下非線性系統,

其中,x(k)∈Rn,u(k)∈Rm.
根據Stone-Weierstrass定理,上述非線性系統可寫成如下形式:

其中


定義模型辨識誤差

定理1[16].采用辨識策略式(9)辨識如式(5)的動態系統,如果RNN權值按照如下更新



根據定理1,分別利用三種工況運行數據,建立不同工況下的RNN模型,得到如下礦渣微粉生產過程的多工況描述:

其中,Mi,i=1,2,3表示不同工況系統模型.
2.3.2 ADP跟蹤控制器設計
假設期望軌跡為xd(k),則其滿足

進一步可得到期望控制輸入

其中,(·)+為 (·) 的偽逆.
定義控制誤差ue(k)=ud(k)?u(k)和狀態誤差xe(k)=xd(k)?x(k),根據式(11)和(13)可得

令ue滿足


至此,x(k)→xd(k),u(k)→ud(k)的最優跟蹤控制問題轉化為xe(k)→0,ue(k)→0的最優調節問題,可采用在線ADP實現系統的最優跟蹤控制.
為了使控制輸入滿足約束條件,定義如下性能指標函數


設計評價網和執行網,利用梯度下降法,得到如下網絡權值調整律:
評價網權值

其中, ??c(xe(k))=?c(xe(k+1))??c(xe(k)),?c(·)=tanh(·).
執行網權值

其中

可得控制誤差

最終得到控制量

對于系統(11),評價網權值和執行網權值分別按照式(17)和式(18)在線調整,則可得到如式(21)的最優控制信號.評價網和執行網設計及穩定性證明可參考文獻[15].對于不同工況模型(12)和最優設定值ri,設計如下基于ADP的多控制器Ci

其中,χi(·)表示三種工況情況下基于式 (21)的ADP控制器,ui和xi分別為三個控制器的輸入輸出向量,期望軌跡為不同工況最優設定值,即xdi=ri,i=1,2,3.
2.3.3 概率加權模型切換機制
第i個模型的與系統的模型誤差定義為

令

其中,0<γ<1.

第i個控制器權值pi(k),

其中,q(k)指示工況切換.得到加權形式的控制輸入

工況切換礦渣微粉生產系統的加權多模型ADP控制方案如圖7所示,利用RNN建立三種工況的數據模型(12)以覆蓋系統不確定性,對應多個模型及最優設定值設計控制輸入受限的ADP控制器集合(22),基于模型誤差,計算不同控制器權值,最終得到如式(29)的加權形式控制輸入.
整合礦渣微粉生產物理資源、優化控制算法、工業網絡、通信系統,本文提出了一種基于CPS的礦渣微粉生產過程優化控制方案.如圖8所示,冷風閥開度、喂料皮帶秤電機轉速、傳送帶稱重、選粉電機轉速、熱風溫度及微粉產品產量、質量等傳感器信息實時上傳到以太網,并在以太網中進行數據存儲和實時計算,得到基于PSO優化的LSSVM靜態模型和基于RNN的動態模型.決策單元基于靜態模型進行多目標優化問題求解,在人為指導或自動設定下獲得產量和質量的最優設定值,加權多模型ADP控制器根據模型誤差,計算各控制器權值,自動調整控制量,實現多工況切換情況下的礦渣微粉生產過程優化控制決策.優化控制信號經以太網傳遞給各執行器,構成“感知–分析–決策–執行”的數據閉環,實現信息物理系統構架下礦渣微粉生產過程的智能優化控制.與此同時,工業以太網上的生產控制數據以報告和圖表形式傳遞給決策檢測單元,完成生產過程和控制決策的可視化,實現生產過程的遠程監測和控制.
針對三種工況數據,令設定矩陣A=[0.6,0;0,0.6],激活函數?1(·),?2(·) 為雙曲正切函數.根據定理1,得到式(12)中三種模型參數分別為


圖7 概率加權多模型ADP結構Fig.7 Structure of weighted multiple model ADP

圖8 礦渣微粉生產過程CPS框架Fig.8 The CPS structure of GGBS production process


圖9 Pareto最優解集Fig.9 Obtained Pareto solutions
對于正常工況采用多目標優化算法求得的礦渣微粉生產過程Pareto最優解集如圖9所示,在最優解集內,不存在任意一點在產量和質量上同時比其他點對應的解更優.其中拐點A兩側任意方向的微小提高都會造成另一方向的大幅減小[17],取A點的解作為正常工況下最優設定值,即期望比表面積為428.71m2/kg,期望產量為104.08×103kg/h.同理,獲得兩種異常情況下的最優解集及最優設定值,最終得到:

考慮被控對象按照如下工況變化:

對于如式(30)的礦渣微粉生產多工況切換系統,采用傳統單個ADP控制器C1,得到如圖10所示的微粉產量曲線.可以看出,在第150和第300時刻發生工況切換時,由于模型與工況不匹配,系統狀態發生突變,并且產品質量不能跟蹤上期望最優設定值.

圖10 采用控制器3時的質量曲線Fig.10The quality curve using controller 3
采用本文提出的礦渣微粉生產系統多模型自適應控制方法,得到如圖11所示的微粉質量曲線和如圖12所示的控制輸入曲線.在第150和300時刻發生工況切換時,微粉質量發生突變,但仍能快速跟蹤上新工況對應的最優設定值且具有較小的超調量.同時,對比圖12和表1,各控制輸入均在給定的約束范圍內變化.
多模型自適應控制算法對礦渣微粉生產系統工況切換識別結果如圖13所示,對比式(30)可知,該算法能夠有效識別工況切換,及時對控制策略做出調整.

圖11 多模型ADP微粉質量曲線Fig.11The quality curve using multiple model ADP

圖12 多模型ADP控制輸入曲線Fig.12The curve of control using multiple model ADP
圖14給出了礦渣微粉生產系統控制曲線界面.
本文提出了一種基于CPS框架的礦渣微粉生產過程多模型ADP優化控制方案.利用生產數據得到三種典型運行工況,建立并求解生產過程多目標優化問題,以獲取最優設定值.基于循環神經網絡構建多個模型以覆蓋不同工況,設計輸入受限ADP控制器,基于模型誤差計算不同控制器權值,得到加權形式的控制信號.實驗表明,提出的多模型ADP控制方案能夠有效發揮系統性能,提高多工況切換情況下礦渣微粉生產過程控制品質.同時,提出的CPS框架將礦渣微粉生產過程信息和物理系統的有效融合,實現了生產過程的遠程監測和優化控制.

圖13 多模型ADP工況切換識別Fig.13 Working condition identification using the multiple model ADP algorithm

圖14 礦渣微粉粉磨系統運行數據Fig.14 Operation data of GGBS production system