褚菲 傅逸靈 趙旭 王佩 尚超 王福利
隨著市場競爭的日趨激烈,生產技術的不斷革新,原材料資源的日益緊缺,現代企業逐漸從追求維持生產過程的安全穩定轉變為追求企業綜合經濟效益最大化,并將其作為現代企業生存及可持續發展的戰略目標.而過程良好的運行狀態則是保證產品質量,提高企業綜合經濟效益的關鍵[1?2].
然而,工業過程的運行狀態不可避免地會受到各類干擾或不確定性因素影響,從而偏離期望的最優工況點.因此,引入實時的過程監控技術對保證產品質量及綜合經濟效益至關重要[3?4].傳統的以區分“正常/故障”狀態的過程監測技術[5?6]已不能滿足現代工業過程智能精細化管理的需求,因此,在生產過程安全運行的前提下,對實際工業過程運行狀態的優劣作進一步的識別及評價,并對非最優運行狀態進行非優因素追溯,為操作人員及時調整控制策略或工業過程的自愈控制提供指導建議,具有十分重要的實際意義.
近年來,針對工業過程的運行狀態評價逐漸受到研究者的關注.例如,針對實際工業過程數據中存在與綜合經濟指標數據無關的過程信息,Liu 等分別利用ORVI (Optimality-related variations information) 方法[7]和T-PLS (Total projection to latent structures)方法[8]分離過程數據中與綜合經濟指標相關/無關的過程信息,并建立運行狀態評價模型.針對過程數據呈多峰分布的特點,Liu 等[9]提出了一種基于高斯混合模型回歸(Gaussian mixture model regression,GMR)的運行狀態評價方法,實現了多模態過程的運行狀態最優性評價.另外,為了對剛建立的具有少量歷史數據的新過程進行狀態評價,Zou 等[10]提出了一種基于跨域特征遷移學習(Cross-domain feature transfer learning,CDFTL)的運行狀態評價方法.CDFTL 無需假設源域及目標域數據獨立同分布,同時利用通用信息和獨立信息保證了評價模型的精度和泛化能力.
隨著現代化工業過程日趨復雜,過程變量間普遍呈現非線性,現有的基于線性方法的運行狀態評價模型,如主元分析(Principal components analysis,PCA)方法[11]、T-PLS 方法[8]、ORVI 方法[7]等,無法獲得滿意的效果.近年來,隨著AI 技術的深入研究,神經網絡算法因其較強的非線性處理能力,受到了研究者的青睞[12].如針對化工過程中的非線性及動態性,Eren 等[13]利用一維卷積神經網絡進行特征提取和選擇,進而建立高精度的軸承故障檢測模型.針對工業過程中因噪聲干擾引起的滾動軸承故障重疊的問題,文獻[14]介紹了一種基于深度信念網絡 (Deep belief network,DBN)的設備分層診斷框架,并將其應用于故障類型及嚴重性等級的識別.其中,神經網絡算法中的自編碼器由于其強大的數據特征提取能力,在工業過程控制中得到了廣泛應用[15].如Jiang 等[16]利用多層的自編碼器模型結合動態擴展矩陣提升故障分類的準確性.Yu等[17]融合降噪自編碼器和彈性網絡用于工業過程監測和故障隔離.
但自編碼器在特征提取階段僅僅是無監督地對原始輸入數據進行重構,因此無法保證所提取的過程特征與所識別的過程相關指標的關聯性.針對該問題,基于有監督學習的自編碼器漸漸受到了廣大研究者的重視.例如,文獻[18]提出了一種標簽約束的半監督棧式自編碼器(Label regularization semi-supervised stacked autoencoder,LSSAE).LSSAE 結合了無監督學習與監督學習的優勢,在有效抽取樣本內在特征的同時保證特征訓練目標化.Chai 等[19]提出了一種稀疏和標簽約束的自編碼器(Label and sparse regularization autoencoder,LSRAE),利用無監督學習與監督學習有機結合的方式,實現準確抽取樣本的本質特征.同時,有相關學者將有監督機制的自編碼器應用于工業過程的軟測量建模,如Yuan 等[20]提出了一種變量加權堆疊自編碼器(Variable-wise weighted stacked autoencoder,VW-SAE).通過對輸入變量和質量變量的相關性分析,為自編碼器輸入層各單元賦予權重,然后利用逐層加權的方式進行訓練,提高對質量數據的預測精度.由于該方法需要計算輸入數據和質量數據的皮爾遜相關性,而該相關性為數據間的線性相關程度,因此難以挖掘變量之間的非線性關系.針對此問題,Yuan 等[21]在VW-SAE 的基礎上提出了一種質量驅動的堆疊自編碼器(Stacked qualitydriven autoencoder,SQAE)模型.該模型利用質量數據來指導特征提取,使其可以捕獲與質量相關的過程潛在特征,而無需對輸入數據和質量數據進行相關性分析.
由于工業過程的復雜程度日漸增加,過程變量中與綜合經濟指標相關的特征難以提取;實際生產過程中存在各種形式的噪聲干擾和不確定性因素,導致工業現場的過程數據存在缺失和大量噪聲;此外,工業過程數據中也存在信息冗余問題.如果繼續采用現有的運行狀態評價方法,則難以針對上述問題建立穩健可靠的工業過程運行狀態評價模型.因此,本文提出了一種基于綜合經濟指標驅動的稀疏降噪自編碼器(Comprehensive economic index driven sparse denoising autoencoder,ISDAE)的復雜工業過程運行狀態評價方法.針對工業過程變量間的強非線性以及難以提取過程變量與綜合經濟指標間相關特征的問題,本文引入綜合經濟指標預測誤差項迫使ISDAE模型挖掘出與綜合經濟指標相關的原始數據特征.針對工業過程信息冗余問題,本文利用稀疏性約束使得模型學習過程數據的稀疏特性,使其更有效地找出隱含在輸入數據內部的結構與模式.同時,針對工業過程數據中存在噪聲的問題,本文通過對原始輸入數據進行數據破壞,迫使編碼器去學習輸入數據的更加魯棒的特征表達,增強模型的魯棒性.
本文的主要貢獻如下:1)將綜合經濟指標概念引入自編碼器有監督學習機制中,使ISDAE模型獲得表征與綜合經濟指標相關的原始數據特征的能力;2)提出了基于綜合經濟指標驅動的自編碼器模型的運行狀態評價方法,實現具有強非線性、信息冗余以及強噪聲的工業過程運行狀態在線精準評價;3)針對過程的非優運行狀態,結合自編碼器模型特點,提出了一種基于自編碼器貢獻圖算法的非優因素追溯方法.
最后,將所提出方法應用于重介質選煤過程,利用機理模型數據和實際現場數據驗證了所提方法的有效性.
復雜工業過程的運行狀態評價模型一般由特征提取模型和運行狀態識別模型組成.特征提取模型旨在從過程數據中挖掘出能夠表征過程潛在運行模式的數據特征,能夠在降低過程數據的復雜度的同時提高運行狀態識別模型的泛化能力.運行狀態識別模型則是利用這些數據特征,結合有效的分類方法和評價準則,識別過程的運行狀態等級.特別地,運行狀態評價模型的特征提取過程旨在盡可能地提取與綜合經濟指標相關的特征,這也是運行狀態評價方法有別于一般過程監控方法的關鍵特性之一.
標準的AE(Autoencoder)模型是一種由編碼器和解碼器兩部分組成的自學習前饋神經網絡結構[22].如圖1所示,從輸入層到隱藏層的轉換過程稱為編碼過程(Encoder),從隱藏層到輸出層的轉換過程稱為解碼過程(Decoder).編碼過程和解碼過程定義如下:

其中,N為訓練樣本數,||·||2為二范數.

模型結構The structure of AE model
由于復雜工業過程中諸如壓力、流量、溫度等過程變量經標準化處理后通常是在?∞到 +∞之間分布,而傳統AE模型的解碼過程由于常用sigmoid函數作為激活函數,其輸出值的范圍為0~ 1,因此,本文通過將AE模型的解碼過程線性化[23],即以獲得對流程工業過程的建模能力.
為了解決實際過程數據中存在的信息冗余問題,通過設置AE模型的隱藏層神經元個數nH大于輸入層神經元個數nI并引入稀疏性約束的方式迫使隱藏層學習過程數據的稀疏特征,即構建稀疏自編碼器(Sparse autoencoder,SAE)模型[24?25].相較于傳統的壓縮結構模型(nH SAE的損失函數定義如下: 此外,工業過程不可避免地還會受到噪聲、離群點及其他不確定性因素的影響,為增強模型的魯棒性,本文考慮引入降噪自編碼器(Denoising auto encoder,DAE)模型[27].通過從“損壞”的輸入數據中重構出原始“完好”的輸入數據,DAE模型可以學習輸入數據的更加魯棒的特征表達,使得模型具有較強的抗干擾能力.DAE的加噪過程是通過對原始輸入數據加噪的方式進行數據破壞,即按照一定概率PR使部分原始輸入數據隨機置0[28],具體的操作如下: 其中,rand(·)是與輸入數據x同維度的{0,1}分布的隨機矩陣. 本文綜合考慮復雜工業過程中存在的強非線性、信息冗余以及過程受不確定性因素嚴重影響等問題,通過融合SAE和DAE模型的優勢,構建稀疏降噪自編碼器模型(Sparse denoising auto encoder,SDAE)解決上述問題.但SDAE模型僅是一種無監督的特征提取方法,很難或無法表征與過程綜合經濟指標相關的數據,因此,僅使用這些特征數據無法建立一個有效可靠的狀態識別模型.鑒于此,本文利用基于綜合經濟指標驅動的ISDAE模型進行過程特征的提取,迫使SDAE模型在提取原始數據表征的同時選擇與綜合經濟指標相關的特征數據[18?19],并利用這些數據建立最終的運行狀態評價模型,提高模型的可靠性.這里的綜合經濟指標可以是定量的產品質量、設備損耗量等,也可以是結合專家知識的定性指標,如過程運行的優、良、中、差狀態,其中定量信息是通過數值大小描述的數值變量信息,定性信息是由狀態來描述的狀態變量信息[29]. 通過在SDAE模型無監督學習機制的基礎上引入綜合經濟指標,利用集成無監督學習誤差JSDAE和有監督學習誤差JIndex的方式指導SDAE模型的特征提取過程,從而綜合了有監督和無監督學習機制的優勢,能夠同時提取過程變量中蘊含的過程運行模式特征與綜合經濟指標相關的過程特征.根據文獻[18?19,21,30]中對有監督機制下的自編碼器的損失函數的定義,對自編碼器在綜合經濟指標意義下有監督學習的損失函數定義如下: 其中,WI、bI是連接權重和偏置,z(·)是激活函數,Y為綜合經濟指標數據,為綜合經濟指標數據的預測值.最終的特征提取模型的損失函數如下: 其中,α、γ為損失函數中各項的重要性權值參數,JSDAE為SDAE模型的損失函數,有JSDAE=JSAE.結合神經網絡結構的特點,可根據不同類型的綜合經濟指標數據建立不同的監督學習模型.具體地,如果綜合經濟指標為定性的標簽數據,可選擇分類模型;如果是定量數據,則可選擇回歸模型.特征提取模型的訓練可采用反向傳播算法(Back propagation,BP)進行模型參數的優化[31]. 運行狀態識別的本質是對過程的運行狀態進行分類.在利用ISDAE特征提取模型完成過程數據的特征提取后,通過在ISDAE特征提取模型的隱藏層后加上分類器可實現運行狀態的識別[18?19,30].狀態識別的方法有很多,如softmax分類器模型、支持向量機模型、決策樹等.本文結合自編碼器的結構特點,選擇softmax分類器作為運行狀態評價的狀態識別模型.softmax分類器模型的輸出如下式所示: 同樣地,本文選擇BP算法優化狀態識別模型參數.當狀態識別模型訓練完成后,將ISDAE模型的編碼器與狀態識別模型級聯,利用輸入數據和標簽數據進行級聯后模型的微調,采用BP算法微調級聯后模型的輸入層到隱藏層連接權重和偏置以及分類器參數矩陣,得到最終的運行狀態評價模型,具體算法步驟見第2.2節. 運行狀態評價的核心在于提取與綜合經濟指標高度相關的數據特征信息,并以此建立穩定可靠的運行狀態評價模型.此外,當過程的運行狀態處于“非優”時,通過非優因素追溯的方法找出過程“非優”原因,為操作人員及時調整控制策略,提高綜合經濟效益提供參考依據. 考慮到實際過程數據中存在強非線性、信息冗余以及受不確定性因素影響嚴重等情況,本文提出了一種基于ISDAE模型的運行狀態評價方法.通過無監督和有監督學習相結合的方式訓練特征提取模型,提取過程數據中與綜合經濟指標相關的數據特征,并將這些數據特征作為輸入訓練狀態識別模型,然后將特征提取模型與狀態識別模型級聯,利用神經網絡微調的方式得到最終的運行狀態評價模型.在線應用時,本文結合流程工業運行特點,引入在線滑動窗口并根據時間距離大小設置信任權值以提高在線評價時的可靠性.此外,當運行狀態非優時,本文提出了一種基于自編碼器貢獻圖算法的非優因素追溯方法,通過貢獻率大小找出可能的“非優”原因,為操作人員和控制系統的及時調控提供參考依據.基于ISDAE模型的運行狀態評價系統的系統框圖如圖2所示. 圖2 基于ISDAE模型的運行狀態評價系統框圖Fig.2 The system block diagram of ISDAE model based operating performance assessment 過多的狀態等級會導致運行狀態評價問題復雜化,同時過于細膩的狀態等級也不利于狀態特征的提取.當然,過少的狀態等級也不利于實現工業過程的精細化管理[11].因此,對復雜工業過程運行狀態等級的劃分,需以實際過程的運行情況及綜合經濟效益為參考,并結合實際的運行管理需求. 根據第1.2節給出的綜合經濟指標的定義,狀態等級的劃分可采用融合多類定量經濟指標數據并結合專家知識的方式確定.具體地,以本文研究的重介質選煤過程為例,可選用多類產品質量指標,如溢流灰分、溢流硫分、溢流碳分等為參考,并結合專家知識對這些產品質量指標賦予不同的權值,最后根據加權后獲得的綜合指標將過程劃分為不同的狀態及對應的狀態等級.當然,考慮到有些綜合經濟指標數據不易獲取或采集到的數據受不確定性因素影響嚴重等情況,也可選擇最具有代表性的產品質量指標作為劃分狀態等級的參考依據.本文結合重介質選煤過程的過程特性及精細化管理需求,最終以選煤過程的溢流灰分為參考依據,結合專家知識將過程劃分為四個狀態,即“優”、“良”、“中”、“差”,對應“1~ 4”四個狀態等級. 復雜工業過程的運行狀態評價模型的離線建模過程包括:特征提取、運行狀態識別以及特征提取模型與運行狀態識別模型級聯后的參數微調.假設離線采集到的過程數據為:{(x(1),y(1)),(x(2),y(2)),···,(x(N),y(N))}∈R,其中X=[x(1),x(2),···,x(N)]T,Y=[y(1),y(2),···,y(N)]T. 基于ISDAE 特征提取模型的訓練過程: 3)初始化ISDAE模型參數,包括各層的連接權重(WE,WD)、偏置(bE,bD)、隱藏層神經元個數、稀疏參數ρ、稀疏懲罰項系數β以及約束項重要性參數α和γ; 5)計算損失函數JISDAE(W,b); 6)BP算法優化模型參數(WE,WD)和(bE,bD); 7)重復步驟4)到步驟6),直到損失函數收斂. 狀態識別模型: 3)對狀態等級數據yL進行獨熱編碼(One-Hot)操作; 4)初始化模型參數θ; 5)以H為輸入,One-Hot編碼后的yL為輸出,計算softmax 分類器的損失函數J(θ); 6)BP算法優化模型參數θ; 7)重復步驟4)到步驟5),直到損失函數收斂. 反向微調過程: 1)級聯ISDAE特征提取模型的編碼器和狀態識別模型,即 圖3 運行狀態在線評價示意圖Fig.3 The schematic diagram of online operating performance assessment 2)采用BP算法對模型參數WE、bE、θ進行調整. 假設已有的離線數據足以建立穩定的運行狀態評價模型,將t時刻在線數據x t輸入所建立的運行狀態評價模型,以獲得當前時刻的運行狀態屬于不同等級的后驗概率其中i∈{1,2,···,q,q=4},評價結果為當前時刻最大后驗概率對應的狀態等級,即 但考慮到在線評價時單一采樣時刻數據不足以穩健表征此刻復雜工業過程的運行狀態,同時在線評價結果易受過程噪聲及不確定性因素影響,從而導致評價結果可靠性降低.為此,本文引入了滑動窗口作為在線狀態評價的基本分析單元[8].假設滑動窗口的大小為H,則將t?H+1到t時刻之間的數據作為“在線窗口”,即Xon=[x t?H+1,···,x t]T.如圖3 所示,為保證在線評價結果的實時性,本文結合連續過程的運行特點,根據窗口內的數據距離當前時刻的時間遠近賦予不同的信任權值w i,其中i=1,2,···,H,對應窗口內數據x t,x t?1,···,x t?H+1,窗口內距離當前時刻越近的數據的輸出概率賦予越大的權值,即1≥w1≥w2≥···≥w H ≥0,最后輸出不同等級的加權后驗概率作為當前時刻不同等級的后驗概率. 需要注意的是,過大的滑動窗口易導致運行狀態評價模型對過程運行狀態發生改變的判斷延遲,從而降低運行狀態評價模型的靈敏性以及評價結果實時性;過小則易使在線評價結果受到過程擾動和不確定性因素的影響,降低在線評價結果的可靠性.因此,滑動窗口的寬度H需要結合工業過程的具體特性以及實際管理需求來定,在運行狀態評價的準確性和及時性之間取合理的折中方案. 當過程處于非最優運行狀態時,即當運行狀態等級為“良”、“中”、“差”時,此時需要對導致非優狀態的原因進行追溯,從而為及時調控生產過程提供可靠的依據.本文結合自編碼器的特點,提出一種基于自編碼器貢獻圖算法的非優因素追溯方法,無需非優狀態的先驗知識便能識別出各變量對非優狀態的貢獻率,同時具有計算簡單的特點. 傳統的基于PCA模型的變量貢獻圖法是一種考慮變量的空間相關性,描述每個變量對統計量影響大小的簡單且有效的原因追溯方法[32?33].針對在線變量x在殘差空間的SPE統計量定義如下: 特別地,當自編碼器的激活函數f(·)、g(·)為線性恒等函數且滿足時,由于偏置量bD、bE可通過歸一化消除[34],所以在自編碼器模型的編解碼過程線性化的條件下,自編碼器模型的非優因素追溯可由SPE貢獻圖定義.由于自編碼器的輸入輸出數據正好對應著原始數據與重構數據,根據SPE貢獻圖的定義,基于自編碼器貢獻圖的非優因素追溯定義如下: 離線建模時,只需選擇運行狀態為“優”的過程數據建立ISDAE模型.在線應用時,當在線數據被評價為“非優”狀態等級時,將該數據輸入此ISDAE模型得到重構值,將實際輸入與重構值帶入式(14)計算出每個變量的貢獻率,貢獻率大的變量則是導致運行狀態非優的主要原因. 選煤的主要任務是去除原煤中的雜質,降低原煤中的灰分和硫分,以獲得滿足用戶需求的高品質精煤,基于阿基米德原理的重介質選煤技術是當前最先進也是應用最廣泛的選煤技術之一.由于選煤廠環境惡劣且受不確定性因素影響嚴重,選煤過程往往達不到預先設定好的最優運行狀態,因此對選煤過程進行細致且有效的運行狀態評價,并對非最優狀態進行原因追溯是保證企業綠色高效生產,提高原煤質量及企業綜合效益的有效途徑[35]. 以兩產品重介質旋流器選煤過程為例,其主要工藝流程包括:原煤粒度分級、煤介混合、介質調配、介質回收、重介質分選等環節.工藝流程如圖4 所示,原煤經過破碎后,用傳送皮帶送往主分級篩進行粒度篩分,收集下層篩網下粒度較小的原煤顆粒后,輸送至次分級篩進行進一步篩分,這一步的目的是篩除小粒度原煤中混合的煤泥.當獲得粒度合適的原煤顆粒后,將其與合格介質桶輸送出的密度合適的重介質懸浮液在媒介混料桶內混合,并由壓力泵將煤介混合物輸送到重介質旋流器中進行分選.重介質旋流器的底流和溢流經過脫介篩進行重介質回收,溢流和底流通過脫水脫介可獲得灰分含量低的精煤以及灰分含量高的矸石等廢料.由于脫水脫介環節無法完全將磁性介質回收,因此需要往合格介質桶內補充磁性介質.在合格介質桶內,通過磁選機回收的稀介質與補充的磁性介質和水進行密度調配,用于重介質旋流器的分選[36?37]. 本文通過重介質選煤過程機理模型[36?37]產生的數據與山東某選煤廠實際生產過程中采集的數據來共同驗證本文所提方法的有效性和實用性. 機理模型產生的數據包括過程變量和產品煤的綜合經濟指標數據.過程變量的選擇如表1所示.綜合經濟指標數據主要包括溢流密度、溢流灰分、溢流硫分、溢流碳分以及設備耗能指標等,此類指標數據均可作為評判運行狀態優劣的參考依據.結合實際選煤過程對參數獲取的難易程度,以及仿真實驗的復雜度,本文選擇最具有代表性的定性產品質量指標–溢流灰分作為評判選煤過程運行狀態等級的參考指標.結合專家知識,針對機理模型數據,具體的溢流灰分值與狀態等級的劃分見表2. 圖4 重介質選煤工藝流程圖Fig.4 The process flow diagram of dense medium coal preparation process 表1 過程變量選擇Table 1 The selection of process variable 在模擬非優狀態時,通過設置實際生產過程中最容易出現問題的幾個主要操作變量,即選煤廠原煤入料(變量1)、旋流器入料壓力(變量7)以及進入混料箱的重介質密度(變量6),偏離正常值范圍大小的不同,來模擬“良、中、差”三種狀態.為了更加直觀地顯示仿真效果,在設計非優狀態時,通過等時間間距對選煤過程操作變量引入“非優”的方式產生非優狀態等級數據,而“非優”變量偏離正常值的大小不等導致機理模型輸出的灰分值不同,進而可以區分出“良、中、差”三個狀態. 表2 機理模型數據運行狀態等級劃分及等級標簽設置Table 2 Operating performance level division and level label setting of mechanism model data 本文通過重介質選煤過程機理模型生成共2400組數據,其中各狀態等級中各非優變量分別作用的時間間距為200個采樣點.采用分層采樣的方式對每個狀態等級中的各非優變量分別隨機抽取100組數據作為離線建模數據集,則離線建模數據集共1200組數據,其中,各狀態等級數據各占300組.離線建模數據集中的數據的具體分布如表3 所示. 針對實際重介質選煤過程,本文選取合介桶液位(m)、主系統介質密度(g/L)、主旋流器入口壓力(MPa)、煤泥的含量(%)以及磁性物濃度(g/L)這5個過程變量作為運行狀態評價的在線測量變量,選取精煤的灰分離線化驗值(%)作為經濟指標劃分依據,驗證所提方法在實際生產過程中的有效性.針對由選煤廠采集的實際選煤過程數據,共選取894組選煤過程數據,隨機抽取500組數據作為訓練數據,剩余的394組數據作為測試數據.考慮工廠的實際生產需求,結合專家知識,按照灰分值的范圍將運行狀態劃分為4 個狀態等級,具體劃分如表4 所示. 表3 離線建模數據集中的非優因素設置Table 3 Non-optimal factors setting in offline modeling dataset 表4 實際過程數據運行狀態等級劃分及等級標簽設置Table 4 Operating performance level division and level label setting of field data 利用上述重介質選煤過程離線數據,按照第2.2節和第2.4 節所述的方法離線建立運行狀態評價模型和非優因素追溯模型.其中,特征提取模型的約束項重要性參數α和γ通過網格搜索的方式確定,神經網絡的學習率lr為0.001,其他模型參數可根據經驗確定,具體參數設置如表5所示. 表5 模型參數設置Table 5 Model parameter setting 此外,以實際選煤廠數據為例,隱藏層神經元個數與模型精度的關系如圖5所示.因此,針對實際過程數據的運行狀態評價模型及非優因素追溯模型的隱藏層神經元個數為50,類似的方法確定針對機理模型數據的運行狀態評價模型及非優因素追溯模型的隱藏層神經元個數為20. 3.3.1 重介質選煤過程機理模型數據運行狀態在線評價 圖5 模型精度與隱藏層神經元個數的關系圖Fig.5 The relationship between the model accuracy and the number of neurons in hidden layer 在機理模型數據抽取訓練數據集后剩余的部分中,針對每個狀態等級中各非優變量抽取50組數據作為測試數據集,則測試數據集共有600組數據,其中,各狀態等級數據均為150組.測試數據的具體分布如表6所示. 為驗證本文所提方法的有效性,本文分別利用SDAE模型和文獻[38]中所提的基于KT-PLS(Kernel total projection to latent structure)的運行狀態評價方法(記為KT-PLS方法)對上述數據進行建模和運行狀態在線評價.在線評價時,結合重介質選煤過程運行特性,設置滑動窗口的寬度為H=3,信任權值為[0.6,0.2,0.2]T. 圖6為未引入滑動窗口時三種方法的評價效果對比,可以看出,KT-PLS方法對各狀態等級的識別結果與SDAE和ISDAE相比波動較大,且存在少許誤識別的情況.而ISDAE模型與SDAE模型相比,存在一些時刻,如200~ 250個樣本點間,ISDAE模型的評價準確性優于SDAE模型.受過程中不確定性因素的影響,ISDAE模型、SDAE模型以及KT-PLS方法在線評價時輸出的后驗概率均存在一些波動,當不確定性因素影響嚴重時可能會導致運行狀態的誤識別.引入在線窗口并對窗口內的數據賦予信任權值后,如圖7 所示,能有效解決擾動帶來的運行狀態誤識別問題,特別是在針對來自實際重介質選煤過程數據的仿真實驗中,這種優勢更加明顯. 表6 測試數據集中的非優因素設置Table 6 Non-optimal cause setting in test dataset 圖6 未引入滑動窗口的機理模型數據運行狀態在線評價結果Fig.6 Online operating performance assessment results of mechanism model data without sliding window 3.3.2 實際重介質選煤過程數據運行狀態在線評價 為驗證本文所提方法的實用性,在實際重介質選煤過程數據上進行實驗.其中測試數據集為394 組,“優良中差”4個狀態等級的數據分別為77、124、104、89組. 圖8為對實際重介質選煤過程數據進行降維所得的二維、三維數據圖.從圖8中可以看出,實際的過程數據存在著很強的非線性,此外還存在著噪聲的影響,即使在三維數據中,也很難找出合適的超平面劃分4 個狀態等級. 對實際重介質選煤過程數據進行在線評價時,同樣設置在線滑動窗口寬度H為3,信任權值為[0.4,0.4,0.2]T.在線評價結果如圖9所示. 圖7 引入滑動窗口的機理模型數據運行狀態在線評價結果Fig.7 Online operating performance assessment results of mechanism model data with sliding window 圖8 實際選煤廠數據分布Fig.8 Data distribution of actual coal preparation plant 圖9 未引入滑動窗口的實際過程數據運行狀態在線評價結果Fig.9 Online operating performance assessment results of field date without sliding window 圖9為ISDAE模型、SDAE模型和KT-PLS方法的運行狀態評價效果對比.從圖9中可以看出,由于實際生產過程受過程干擾、噪聲及不確定性因素影響嚴重,導致運行狀態評價模型的輸出后驗概率存在較大波動,造成少量狀態等級誤識別情況.KTPLS方法對各狀態等級的識別效果與ISDAE模型和SDAE模型相比波動較大,誤識別率較高.同時,ISDAE模型相較于SDAE模型,輸出的各狀態等級后驗概率波動更小,識別準確性更高.圖10為引入滑動窗口后各方法的實際重介質選煤過程數據的運行狀態在線評價結果.對比圖9與圖10可以看出,當引入在線滑動窗口及信任權值后,各方法的識別準確率均得到了較大的改善. 為了更加直觀地驗證本文所提方法的有效性,本文引入了分類評價指標對在線評價結果進行分析.其中宏平均值(Macro average)為各類狀態等級不同評價指標的平均值,加權平均值(Weighted average)為各類狀態等級不同評價指標的加權平均值.精確率(Precision)、召回率(Recall)、F1值定義如下: 圖10 引入滑動窗口的實際過程數據運行狀態在線評價結果Fig.10 Online operating performance assessment results of field data with sliding window 其中,TP、FP、FN、TN的含義參見表7. 表7 TP/FP/FN/TN 參數含義Table 7 Meaning of parameter TP/FP/FN/TN 表8和表9分別為未引入滑動窗口和引入滑動窗口后的各方法的運行狀態評價結果的分類評價指標.從表8和表9中可以看出,無論是否引入滑動窗口,本文所提方法的精確率、召回率和F1值的宏平均值以及加權平均值均優于SDAE模型和KTPLS方法的評價結果.因此,利用基于ISDAE模型的運行狀態評價方法可以有效地對過程的運行狀態作出評價. 表8 未引入滑動窗口的運行狀態評價結果報告Table 8 Report of operating performance assessment results without sliding window 表9 引入滑動窗口的運行狀態評價結果報告Table 9 Report of operating performance assessment results with sliding window 當運行狀態非優時,需要進行非優因素追溯,以找出可能導致過程非優的原因,為系統的控制或操作人員實時調整提供依據.當評價模型輸出狀態等級為2、3、4時,即過程運行狀態處于“良、中、差”時,將當前時刻的樣本數據輸入非優因素追溯模型,計算各變量的貢獻率. 3.4.1 選煤過程機理模型數據的非優因素追溯 針對重介質選煤過程機理模型數據,本文隨機選擇非優狀態中的第170,211,271,316,388,409,460,517,575個樣本點進行非優因素追溯,非優因素追溯結果如圖11所示.通過對比圖11中樣本的各變量的貢獻率與表6中的非優因素設置可以看出,圖11中的9個樣本點中,選煤廠原煤入料(變量1)、旋流器入料壓力(變量7)以及進入混料箱的重介質密度(變量6)對各樣本所屬的狀態等級的貢獻率高于其他變量,非優因素追溯結果和樣本點所設置的非優因素保持一致.因此本文的非優因素追溯方法可以有效追溯出導致過程非優的原因變量. 3.4.2 實際選煤過程數據的非優因素追溯 對于實際選煤過程數據,本文隨機選擇“非優”狀態中的第23,50,72,112,151,171,224,265,298個樣本點進行非優因素追溯,非優因素追溯結果如圖12所示.其中,變量1~變量5分別對應操作變量:主系統介質密度、介質桶液位、主旋流器入口壓力、磁性物濃度和煤泥含量. 圖11 機理模型數據的非優因素追溯結果:第170、211、271個樣本為狀態“良”的各變量貢獻率;第316、388、409個樣本為狀態“中”的各變量貢獻率;第460、517、575個樣本為狀態“差”的各變量貢獻率Fig.11 Non-optimal cause identification results of mechanism model data:The contribution rate of each variable of the 170th,211st,and 271st samples,when the state is“fine”;the contribution rate of each variable of the 316th,388th,and 409th samples,when the state is“medium”;the contribution rate of each variable of the 460th,517th,and 575th samples,when the state is“poor” 圖12 實際選煤過程數據的非優因素追溯結果Fig.12 The non-optimal cause identification results of coal preparation field data 以第112個樣本點為例,從圖12中可以看出變量3的貢獻率明顯高于其他變量,因此認為變量3是導致選煤過程在第112個樣本點狀態非優的主要原因.結合機理知識可知,由于主旋流器入口壓力過高,導致主旋流器分選效率降低,錯配率增加,即溢流灰分含量增多,同時底流灰分減少,此時為非優工況.同時,由于重介質懸浮液中的磁性物濃度減少,重介質懸浮液粘度增加,導致原煤在煤介混合物中分層阻力增大,影響分選效果.這就是除了變量3的貢獻率比較大外,變量4 和變量5的貢獻率也高于其他變量的原因.類似地,亦可分析其他樣本點的非優因素追溯結果與實際運行情況中導致“非優”狀態的原因一致. 綜上實驗結果分析可知,面對重介質選煤過程運行狀態穩健且準確的評價問題,本文所提出的基于ISDAE模型的運行狀態評價方法能有效處理重介質選煤過程變量間存在復雜非線性和信息冗余以及選煤過程數據中存在噪聲等問題,能夠滿足對重介質選煤過程進行運行狀態準確評價的需求.本文所提的運行狀態評價方法無論在機理模型數據還是實際生產過程數據上,均能獲得穩健且準確的評價結果.此外,通過對導致重介質選煤過程運行狀態非優的原因進行追溯,可以有效地發現選煤過程在線運行過程中的非優因素,保證了選煤過程的高效運行,提高了選煤廠的綜合經濟效益. 復雜工業過程細致而穩健的運行狀態評價是提高企業綜合經濟效益的有效手段之一.本文考慮到工業過程中存在強非線性、信息冗余以及不確定性因素影響等問題,提出了一種基于ISDAE模型的工業過程運行狀態評價方法.通過引入綜合經濟指標預測誤差項,實現了同時提取過程變量中蘊含的過程運行模式特征與綜合經濟指標相關的過程特征.同時針對非優狀態,結合自編碼器的結構特點提出了基于自編碼器貢獻圖算法的非優因素追溯方法,有效識別出導致過程非優的原因變量,為操作人員及時調整控制策略提供依據.最后,通過選煤過程機理模型數據和實際選煤過程數據的仿真實驗,共同驗證了所提方法的有效性及實用性.

1.2 基于ISDAE的運行狀態離線評價模型



2 基于ISDAE模型的運行狀態評價

2.1 運行狀態等級的劃分
2.2 離線建立運行狀態評價模型




2.3 運行狀態在線評價

2.4 非優因素追溯方法


3 重介質選煤過程的運行狀態評價與非優因素追溯
3.1 重介質選煤過程
3.2 建立運行狀態評價模型及非優因素追溯模型






3.3 在線評價












3.4 非優因素追溯


4 結論