劉 強 孔德志 郎自強
電熔鎂爐是生產電熔鎂砂(主要成分是氧化鎂)晶體的核心裝備.電熔鎂砂具有結構緊密、熔點高、抗氧化性好、耐腐蝕性強等優良特性,是廣泛應用于航空、軍事、冶金等領域的重要戰略物資[1?2].電熔鎂生產工藝是將主要成分為碳酸鎂的菱鎂礦石加熱到2850 ℃ 以上,使其熔煉為氧化鎂產品和二氧化碳氣體.由于菱鎂礦石成分波動大、礦物組成復雜,熔煉時易發生半熔化、排氣異常、過加熱等異常工況,引起熔煉溫度及分布異常,直接影響產品質量和生產安全[3?6],有必要及時診斷.
由于與運行工況直接相關的熔煉溫度高達2850 ℃以上,無法由常規溫度傳感器測量,目前主要是通過工人定期巡檢時觀察爐壁狀態來診斷.但是人工巡檢實時性差且容易誤檢、漏檢.此外,由于現場生產環境惡劣(高溫、強光等),不利于工人長期工作.為此,有學者提出基于熔煉電流的電熔鎂爐異常工況診斷方法,主要是通過歷史故障數據提取異常工況特征,再基于上述特征來診斷異常工況.比如,文獻[5]提出一種基于規則的電熔鎂爐異常工況診斷方法,利用鎂爐運行時的熔煉電流數據建立專家診斷規則庫,但規則提取和維護困難.而且,電熔鎂爐電極移動及熔煉過程中電弧放電過程中的強不確定性會導致電流無規律的波動,影響診斷精度.
相比較過程數據而言,熔煉圖像更直觀地反映了熔煉過程中熔池內的工況.近兩年學者提出了基于圖像的電熔鎂爐異常工況診斷方法.比如,文獻[7]提出基于爐體圖像相關系數的半熔化工況診斷方法,但該方法未有效利用圖像的時序特征,對于熔煉時的水霧引入的擾動較為敏感;文獻[8?9]提出基于深度學習的異常工況診斷方法,但模型訓練需要大量帶有標簽的異常工況數據,診斷結果強依賴于標簽的準確性,而實際生產中往往難以獲取標簽數據,限制了該類方法的應用.
相比于異常工況數據而言,電熔鎂生產的正常工況數據更容易獲取.近年來,數據驅動的異常工況診斷通常利用正常工況數據,采用如主元分析(Principal component analysis,PCA)[10?13]等方法獲取過程變量間的潛結構關系和正常變化的范圍,再通過其非期望變化來診斷異常,已在化工、鋼鐵、半導體加工等過程中得到成功應用.
對于電熔鎂熔煉過程而言,局部空間特性和溫度慣性會引入時空動態性,傳統的PCA 方法只能提取靜態變化,使得基于PCA 的異常工況診斷方法易發生誤報與漏報[14?15].針對此問題,學者提出了提取動態關系的動態潛結構建模方法以及在此基礎上的異常工況診斷方法.比如,文獻[16?19]提出采用時滯偏移技術來提取多維變量間的動態關系的動態主元分析方法;文獻[20?21]利用自回歸算法提取潛變量,然后建立一個向量自回歸內部模型來提取變量間的動態關系;文獻[22]提出動態內在主元分析 (Dynamic inner principal component analysis,DiPCA)方法直接從多維時間序列中根據動態性強弱依次提取動態潛變量,在此基礎上建立相應的監控指標來實現異常工況診斷.上述方法為利用電熔鎂爐動態圖像提取熔煉過程的動態特征進行異常工況診斷提供了新思路.
本文面向半熔化這類與熔煉溫度直接相關的異常工況的診斷問題,研究利用熔煉過程爐壁時序圖像提取各區域的時空特征的方法.主要貢獻是結合文獻[23]所提出的分塊建模和逐級診斷思路,提出電熔鎂爐時序圖像逐級建模與異常工況診斷方法.該方法結合鎂爐熔煉圖像的空間特征以及溫度慣性和水霧擾動的時序特征將爐壁時序圖像分為整體、子塊、列三級.在此基礎上,將熔煉過程分級特征與DiPCA 算法相結合提出一種多級動態主元分析(Multi-level dynamic principal component analysis,MLDPCA) 算法來提取爐壁動態圖像局部子塊區域的圖像空間特征,再通過對建立的MLDPCA模型定義區域的監控指標及整個爐況的綜合指標,實現異常工況的逐級診斷.當檢測到異常工況后,將MLDPCA 模型與貢獻圖[24]相結合,提出基于MLDPCA 貢獻圖的電熔鎂爐熔煉異常定位方法.
電熔鎂生產是通過三相交流電熔鎂爐(簡稱電熔鎂爐) 將主要成分為碳酸鎂的菱鎂礦石加工的輕燒鎂粉加熱到2850 ℃ 以上使之分解為氧化鎂熔液和二氧化碳氣體,再將氧化鎂熔液冷卻結晶去除雜質后得到高純度的氧化鎂晶體[2,5].圖1 為電熔鎂生產的工藝圖[2],利用三相電極供電與鎂粉原料之間形成電弧使原料加熱熔化,分為起爐、加熱熔煉、冷卻、粉碎、分揀等工序,其中加熱熔煉為主要工序.其主要熔煉過程是周期性地加料、加熱熔化和排氣.

圖1 電熔鎂生產過程Fig.1 Fused magnesia manufacturing processes
2)電熔鎂爐異常工況描述
由于原料大小和成分波動,造成熔煉時三相電極之間電阻的突變,易引起熔煉溫度及分布的異常,發生半熔化、排氣異常、過燒等異常工況.該類異常的發生和發展伴隨著熔池溫度及分布的非期望動態變化.熔池溫度及分布動態變化引起爐壁圖像時空特征變化,為利用其進行電熔鎂爐異常工況診斷提供了新的思路.
電熔鎂爐爐體為圓柱體,爐口為排氣區,爐中部主要為熔煉區,爐底和邊部主要為保護層區,不同區域的溫度分布不同,采集到的各區域圖像具有相對獨立的空間特征.同時,各區域熔煉溫度變化受物質和能量約束,為各區域的圖像引入時間相關性.然而,熔煉時對爐壁噴灑水冷卻降溫,會帶來大量白色的水霧,對上述時空相關性帶來強干擾.比如,爐壁上方漂浮的水霧,在爐口火焰的照射下,水霧亮度較高,但由于水霧存在時間短且不斷產生,造成局部區域時序圖像的亮度波動,如圖2 (a)所示.

圖2 (a)正常工況圖像;(b)半熔化工況圖像Fig.2 (a) Image of normal situation;(b) Image of semimolten situation
與熔煉溫度相關的異常工況發生時,時序圖像會偏離上述時空相關性.比如,半熔化異常工況發生時,熔池溫度異常升高且區域不斷擴大.爐壁圖像在自然閃爍的同時逐漸變紅發亮,且發亮區域不斷擴大,如圖2 (b)所示.相對于位置不規則變化的水霧,半熔化區域在空間上較固定.為此,可利用正常工況下的時序圖像的時空特征的非期望變化來診斷異常工況.結合鎂爐不同熔煉區域空間特征相對獨立,可對電熔鎂爐熔煉圖像分塊處理,提取熔煉區域時序圖像的時空特征動態潛結構,在此基礎上,實現異常工況的逐級診斷與定位.
電熔鎂爐異常工況相關的熔煉溫度主要與圖像亮度有關.為此,利用式(1)將原始RGB 圖像轉化為灰度圖像[25].

其中,n=1,2,···,N,N為圖像的幀數,分別表示第n幀原始時序圖像的R,G,B 三個通道的亮度.
熔煉過程中,爐口的火焰會不規則跳動導致亮度不斷變化,拍攝出的時序圖像忽明忽暗,不利于時序圖像的特征提取.因此,對上述灰度圖像按式(2)進行歸一化[26]:

正常工況下,鎂爐熔煉溫度隨時間變化引入爐壁圖像的時序特征.描述上述特征的時序圖像序列包含空間上兩個維度以及時間維度共計三個維度.不同熔煉區域(如爐口與爐底)的圖像具有各異的時空特征,若直接將二維單幀圖像拉直變換轉化為一維數據,進而將三維時序圖像序列轉化為二維數據進行動態建模,會忽略各區域內圖像各像素點間的空間約束,難以有效提取各熔煉區域內各異的動態變化;另一方面,準確反應熔煉運行工況的高分辨率圖像對應超大規模的變量個數(>90000),若將超大規模變量直接拉直為一維進行建模,建模算法內的矩陣乘積等運算會因變量維數過大超過計算機內存限制,導致建模算法難以計算實現.因此,本文通過分塊將每個位置的每幀圖像的每一時刻組合來描述工況特征,提出了一種多級動態主元分析建模方法.為提取上述特征,首先將時序圖像序列分為3 級數據,如圖3 所示.

圖3 時序圖像序列分級結構Fig.3 Hierarchical structure of time series image
第1 級數據為每幀完整的時序圖像Xn:

針對電熔鎂熔煉過程分為B個區域,將每幀圖像Xn根據熔煉過程知識分成的B個塊,作為第2 級數據:

然后為提取動態性,將每個塊對應相同的列提取出來組合為Xb,m,作為第3 級數據:

其中,m為對應子塊的第m列,m=1,2,···,M,M為單幀圖像的列數,Xb,m,n為時序圖像序列的第n幀圖像的第b塊中的第m列.根據Xb,m可以得到如下矩陣:

其中,i=1,2,···,s+1 .
可以得到第3 級數據動態建模目標[22]:

采用附錄A 的動態內在主元分析(Dynamic inner PCA,DiPCA)算法,建立第3 級數據的動態潛結構模型:

傳統的過程監控通常利用平方預測誤差(Squared prediction error,SPE)和Hotelling'sT2兩個指標檢測空間相關性的異常變化.為了有效檢測各熔煉區域溫度分布非期望的動態變化,本文建立MLDPCA 的動態潛變量監控指標和靜態潛變量的監控指標.

為了監控局部熔煉區域溫度分布異常及其隨時間的非期望變化,將以上指標通過下式建立綜合指標:

對于第2 級數據,其監控指標為:

其中,?b,m為φb,m,k的控制限,可由式(10)求得.
對于整個鎂爐時序圖像的監控指標為:

其中,?b為φb,k的控制限,可由式(10)求得,同時根據式(10)可求出第3 級監控指標φk的控制限?.
正常工況下存在水霧等干擾,采用綜合指標診斷可減小水霧等干擾對分級指標診斷帶來的誤報,提高診斷算法的魯棒性.
基于MLDPCA 進行異常工況診斷的流程如圖4 所示,步驟總結如下:首先利用歷史正常工況數據建立MLDPCA 模型,再采用建立的模型計算實時圖像的各級監控指標,在此基礎上進行集散監控.然后對綜合指標進行監控,當檢測到異常工況發生時,首先由第2 級監控指標定位到異常工況發生的塊b,b=1,2,···,B,然后通過式(13)計算該塊每個像素點的貢獻[24]:

圖4 基于MLDPCA 的異常工況診斷流程圖Fig.4 Flow chart of MLDPCA based abnormal situation diagnosis


通過式(14)計算貢獻最大的前A個像素點的累計貢獻率CP,其中,異常點個數A的取值由累計貢獻率達到閾值ct來確定,本文中根據經驗將ct取值為35 %,M為該塊像素點的總數.將貢獻較大的前A個像素點取值為1,其余的像素點取值為0,將取值為1 的點可視化為白色,將取值為0 的點可視化為黑色,得到各個像素點的貢獻圖,根據貢獻圖,定位到異常工況發生的位置.
本節結合實際的電熔鎂爐熔煉過程,從電熔鎂爐半熔化異常工況診斷的準確性與實時性兩個方面對第2 節所提出的異常工況診斷方法進行驗證.從電熔鎂爐熔煉現場采集到圖像序列,采樣率為30幀/秒,其分辨率為 385×315×800,其中前兩個維度分別為空間維度的水平方向與垂直方向,第三個維度為時間維度(即動態圖像的幀數).將前300 幀作為訓練集,第301~ 800 幀作為測試集.圖5 為本文方法與多級PCA 方法的診斷結果對比,其下半部分為上半部分方框中放大后的結果,由圖5 (a)可以看出540 幀開始,綜合監控指標開始超過控制限,可以診斷此時發生了異常工況.檢測到半熔化異常工況發生后,利用每個子塊的監控指標定位異常工況區域,圖6 分別為每個子塊的監控指標變化圖,可以看出第9 個子塊在540 幀左右監控指標上升,診斷發生了半熔化工況;同時,第5 個子塊在700 幀左右監控指標上升,可以判斷在第700 幀時發生了第2 個半熔化工況.第6 子塊在后期也發生了監控指標上升情況,是由第9 個子塊處的半熔化區域后期范圍擴大引起.

圖5 (a) MLDPCA 診斷結果;(b)多級PCA 診斷結果Fig.5 (a) Diagnosis result of MLDPCA;(b) Diagnosis result of MLPCA

圖6 每個子塊的監控指標Fig.6 Monitoring index for each sub-block
分別計算第540 幀時第9 塊和第700 幀時第5塊每個像素的貢獻,由于發生半熔化工況的像素有多個,因此計算每個像素點的貢獻率,將累計貢獻率超過35 %的像素點標記為白色,其余像素點標記為黑色,可視化如圖7 所示,圖中白色區域為診斷出半熔化工況發生位置.通過圖7 (a)可以診斷出在540 幀時第9 子塊上方發生了半熔化異常工況,圖7 (b)在700 幀時第5 子塊左上方發生異常.圖8為電熔鎂爐第540 幀和第700 幀圖像(編號從左到右,從上到下依次為 1~9),通過與圖7 對比,本文方法能夠及時診斷半熔化工況發生的位置.圖8 (b)第5 子塊左上角處半熔化工況發生位置剛好處于爐壁正常工況的白斑附近,肉眼辨別困難,若由人工巡檢易漏報.

圖7 (a) 第540 幀時第9 塊貢獻圖;(b) 第700 幀時第5 塊貢獻圖Fig.7 (a) Contribution plot in 9th block at 540th;(b) Contribution plot in 5th block at 700th

圖8 (a) 第540 幀時爐壁圖像;(b) 第700 幀時爐壁圖像Fig.8 (a) Image at 540th frame;(b) Image at 700th frame
圖5 (b)為多級PCA 診斷結果.可以看出由多級PCA 方法求出的監控指標在控制限附近存在較大的波動,相比于本文方法更容易誤報.經過分析可知由于存在高頻噪聲特性的水霧干擾,而靜態的PCA 在計算時無法提取時序圖像的時間特性,因此會將水霧干擾情況計算到監控指標中.為減少誤報率,改進監控性能,本文利用時間延遲窗進行診斷[27],即當連續d個樣本的綜合指標超限(即[φk~φk+d]>?)時診斷出異常,其中,?為監控指標控制限,可由式(10)求得,d為延遲窗大小,本文取值為6.表1 給出了采用時間延遲窗和未采用時間延遲窗條件下,本文方法與多級PCA 方法的誤報率.由該表可以看出,未采用時間延遲窗時,本文方法相比多級PCA 方法而言誤報率降低了約5 倍,為7.63 %;而采用時間延遲窗后,使本文方法的誤報率降至0.1 %,滿足了實際應用的要求.

表1 電熔鎂爐半熔化工況診斷誤報率Table 1 False positive rates of semimolten for FMF
本文方法在硬件配置為i7-3770,3.40 GHz 的4 核CPU,內存為8 GB 的計算機上進行實驗與驗證.由于本文采用動態階次為3 的DPCA 建模,滯后3 幀(0.10 秒),采用大小為6 幀的時間延遲方法滯后6 幀(約0.20 秒),二者帶來計算滯后時間9幀(約0.30 秒),該滯后時間與MLDPCA 診斷算法的計算時間之和為在線診斷的時間.表2 分別列出了本文方法與多級PCA 方法的離線建模時間與在線診斷時間.可以看出,本文方法建模時間長于多級PCA 方法,診斷時間相近,均約為0.9 秒,滿足了診斷的實時性要求,雖然本文方法建模時間較長,但可提前離線訓練完成.

表2 建模時間與診斷時間Table 2 Cost time of modeling and online diagnosis
針對電熔鎂熔煉過程圖像的時空特性,本文提出一種基于多級動態主元分析的異常工況診斷方法.相比人工巡檢,可在異常發展前提前預報.相比較靜態PCA 算法,所提方法能夠更好地克服現場水霧干擾的影響,降低誤報率,提高了診斷精度.下一步擬研究鎂爐爐壁圖像與爐口火焰圖像和熔煉的電流相融合的異常工況診斷方法.
附錄A:動態內在主元分析(Dynamic inner Principal Component Analysis,DiPCA)算法[22]

