阮宏鎂,田學民,王平
(中國石油大學(華東)信息與控制工程學院,山東 青島266580)
實際工業過程中存在一些與產品質量密切相關,需要加以嚴格監控的重要過程參數。由于技術或經濟的原因這些參數尚難以用傳感器直接測量,目前主要通過化驗室離線采樣化驗分析得到,導致測量滯后大,從而無法實時監控產品的質量,對此,軟測量技術[1]是解決該問題的有效途徑。
基于數據驅動[2]的軟測量建模方法,是一種基于過程歷史數據的經驗方法,不需要了解過程內部復雜的機理,因而得到了廣泛的應用。其中主成分分析 PCA (Principle Component Analysis)[3]、偏最小二乘 PLS (Partial Least Squares)[4]等建模方法,算法結構簡單,解決了共線性問題,同時降低了輸入空間的維數,然而這些方法只能有效地處理數據間的線性關系,不能反映出變量間的非線性關系。因此,人們提出了核偏最小二乘KPLS(Kernel PLS)[5-6]、人工神經網絡 ANN (Artificial Neural Networks)[7]、支持向量基 SVM (Support Vector Machines)[8-9]等非線性建模方法。這些方法在一定程度上克服了線性建模方法的不足,但另一方面又失去了線性建模方法的良好特性,存在模型結構和模型參數難以確定,計算求解繁瑣等問題。由于模型對非線性的逼近精度很大程度上取決于模型的復雜程度,模型對過程非線性的逼近能力和模型復雜程度間存在著矛盾。
實際工業過程軟測量模型的建立不僅受到過程非線性的影響,過程時延也給軟測量模型的建立帶來很大困難。時間滯后在系統中普遍存在,如儲蓄單元引起的容積時延、信號傳輸帶來的純時延等,使軟測量模型的精度受到很大影響,因而要建立高精度的軟測量模型,準確估計過程時延是十分必要的。過程時延通常是在對工藝機理進行深入分析的情況下,依據先驗知識來確定的,然而對于較復雜的生產過程來說,該方法存在著較大的隨機性。另外,相關分析法[10]根據輸入輸出變量間的相關程度可較好地估計時延,然而該方法獨立地分析各輸入變量與輸出變量的關系,易陷入局部最優,且相關分析法只能分析變量間的線性相關程度,因而不適用于非線性系統的時延估計。
針對以上兩個典型問題,筆者提出一種帶時延估計的時間差分PLS軟測量建模方法。時間差分PLS模型用當前時刻輸入輸出變量與之前某一時刻輸入輸出變量的差值作為新的建模樣本,然后基于PLS建立軟測量模型,不僅充分保留了線性PLS模型的良好特性,并且提高了模型對過程非線性逼近的精度。另外,將時延估計問題轉化為多維非線性優化問題,由具有全局搜索能力的差分進化算法求解,從而得到全局最優解。最后,采用工業常壓塔的實際生產數據建立軟測量模型對本文方法進行驗證。
PLS[11]可用外部關系和內部關系來描述,外部關系分別對輸入變量矩陣X與輸出變量矩陣Y進行分解,內部關系則是描述輸入變量矩陣X與輸出變量矩陣Y之間的關系。對于輸入變量X,輸出變量Y,采用PLS方法進行分解,如下式所示:

式中:T——X中提取的主元矩陣;U——Y中提取的主元矩陣;P——X的負荷矩陣;Q——Y 的負荷矩陣;B——系數矩陣;E——X 的殘差矩陣;F——Y的殘差矩陣;R——U的殘差矩陣。
PLS模型結構簡單、物理意義明確,可有效地克服共線性問題,且使模型包含最少的獨立變量數。但是PLS本質上是一種線性回歸方法,處理非線性過程的建模問題時模型精度不夠,因而筆者引入時間差分模型。
傳統的軟測量模型直接尋找輔助變量X(t)與主導變量y(t)之間的函數關系。時間差分模型[12-13]則首先計算差分量 ΔX(t),Δy(t),即計算輔助變量X(t),主導變量y(t)當前時刻的值X(t),y(t)與i時刻之前的值X(t-i),y(t-i)的差值。

然后再建立ΔX(t),Δy(t)之間的模型,預測時先計算新數據X(t′)的差分量,再代入已建立的模型中得到模型的預測值y(t′)的差分量 Δy(t′),X(t′)的差分量計算如下:

模型的預測值y(t′)計算如下,其中y(t′-i)是已知的。

假設非線性過程模型如下:

在任意點x0= [x10,x20,…,xm0]處進行泰勒展開,略去高次項得:

進一步可表達為

由式(10)可知時間差分模型建立Δx,Δy間的線性回歸模型,即非線性模型(8)的梯度模型,這在一定程度上提高了模型對非線性過程的逼近能力,從而提高了建模精度。
非線性時延過程可表示為如下形式:

式中:y(tk)——tk時刻過程的輸出值;xi——過程的輸入值,i=1,…,m;τi——第i個輸入變量與輸出變量之間的時延值,i=1,…,m。
對該過程建立軟測量模型,假設建立基于PLS的軟測量模型,模型如下:

式中:yPLS(tk)——PLS模型輸出值;xi——PLS模型輸入值,i=1,…,m;τ′i——第i個輸入變量與輸出變量之間的時延估計值,i=1,…,m。
從而非線性過程的時延估計問題可表示為如下的非線性優化問題:

其中約束條件根據過程先驗知識確定,各輸入變量的時延值τi取值范圍 在 [τinf,τsup],τinf,τsup為時延值的上下限,且τi是輸入變量采樣時間TX的整數倍,過程輸出變量的采樣時刻tk是輸出變量采樣時間TY的整數倍。
顯然,上述優化問題是一個復雜的多維非線性約束優化問題,因而考慮用差分進化算法DE(Differential Evolution)求解該優化問題。在上述約束條件限制的范圍內,搜索最優決策變量τi,使目標函數J,即實際輸出值與軟測量模型預測輸出值間的誤差平方和SSE最小。
DE算法是一種基于群體智能理論的優化算法,采用實數編碼,通過種群內個體間的合作和競爭產生的群智能指導優化搜索,具有容易理解、易于實現、搜索能力強等優點[14]。



對于式(13)所示的約束優化問題,DE尋優的實現步驟如下:
2)假設當前種群為第k代,對于該種群每一個體Xik(1≤i≤N ),由變異、交叉、選擇,產生下一代個體 Xik+1(1≤i≤N )。在進行變異操作后,產生的新一代種群中一些個體的某些維的值會不滿足約束條件,將這些不滿足條件的值由隨機初始化產生的新值取代。
3)若算法滿足終止條件J≤e或k≥NG則算法結束,終止進化,否則返回步驟2)。e為模型允許的最大誤差,NG為最大進化代數。
帶時延估計的時間差分PLS算法步驟如圖1所示。

圖1 算法實現步驟
1)初始化DE參數,最大進化代數NG,模型允許的最大誤差e。
2)由DE算法進行全局搜索,尋找最優的時延參數值τ,根據得到的時延值選取對應的輸入輸出數據X(t-τ),y(t)。
3)根據式(4),(5)計算時間差分量 Δy(t),ΔX(t-τ)。
4)建立ΔX(t-τ),Δy(t)之間的PLS模型,求得模型估計值ypis(tk)。
常壓塔是石油化工生產過程中的重要裝置,其側線產品的質量指標是備受關注的重要過程參數,往往通過化驗分析得到,一般是每隔8h或4h采樣一次,無法保證產品質量和生產操作的連續穩定。因此,通過建立側線產品質量指標的軟測量模型實現產品質量的實時監測與控制。
本文建立常二線干點的軟測量模型,根據常壓塔裝置的機理、工藝流程和專家經驗,結合相關分析法選擇塔頂壓力、塔頂溫度、側線抽出量和抽出溫度等14個密切相關的過程變量作為常二線干點軟測量模型的輔助變量。生產數據從某石化公司獲得,經過數據處理之后得到158組數據,輔助變量由DCS獲取,每30s采樣一次,主導變量由實驗室分析得到,每天8點、12點各采樣一次。
取其中前120組作為訓練樣本集,建立軟測量模型,剩余38組作為測試樣本集,評價模型泛化能力。需要優化的變量為各輔助變量相對主導變量的時延τ,搜索范圍都設為[0,120min]且取采樣時間TX=30s的整數倍,顯然問題維數n,即輔助變量個數為14個,設置最大進化代數NG=200,種群規模N=140,變異概率F=0.1,交叉概率CR=0.3。
為了驗證文中所提方法的有效性,分別由相關分析估計時延建立時間差分PLS模型,由DE估計時延建立PLS模型,與本文由DE估計時延建立時間差分模型做比較,選取的標準是使測試數據的均方誤差MSE達到最小。表1給出了3種軟測量模型的結果,比較表1第1行和第2行可以看出,均建立時間差分模型,DE估計時延建立模型的預測誤差明顯小于由相關分析法估計時延建立模型的預測誤差。比較表1第1行和第3行可以看出,均采用DE估計時延,時間差分模型的預測誤差明顯小于PLS模型的預測誤差,由以上分析可見帶時延估計的時間差分PLS模型可顯著提高模型精度和泛化能力。

表1 3種軟測量模型結果比較
為了更直觀地比較3種軟測量模型的預測效果,圖2~圖4給出3種軟測量模型的測試結果。由DE算法估計時延建立PLS模型得到結果如圖2所示;由相關分析估計時延建立時間差分PLS模型得到結果如圖3所示;本文提到的由DE算法估計時延建立時間差分PLS模型得到結果如圖4所示,分別比較圖2和圖4,圖3和圖4,可以看出筆者所提方法建立軟測量模型所得預測曲線可以更好地逼近工業實際曲線。

圖2 DE估計時延的PLS建模結果

圖3 相關分析估計時延的時間差分建模結果

圖4 DE估計時延的時間差分建模結果
筆者結合時間差分PLS建模方法與基于DE的時延估計方法分別解決實際工業過程中的非線性和時延估計等問題。時間差分PLS模型建立非線性過程的梯度模型,増強了PLS逼近非線性過程的能力,同時保持了PLS建模方法的優點。采用DE算法估計時延,進一步提高了軟測量模型精度。對常壓塔二線干點數據進行仿真應用取得了很好的效果,模型的精度和泛化能力得到提高,表明本文方法的有效性。
[1]俞金壽,劉愛倫,張克進.軟測量技術及其在石油化工中的應用[M].北京:化學工業出版社,2000.
[2]KADLEC P,GABRYS B,STRANDT S.Data-driven Soft Sensors in the Process Industry [J].Computers and Chemical Engineering,2009,33(04):795-814.
[3]LIN B,RECKE B,KNUDSEN J K H,et al.A Systematic Approach for Soft Sensor Development[J].Computers and Chemical Engineering,2007,31(05):419-425.
[4]KANO M,MIYAZAKI K,HASEBE S,et al.Inferential Control System of Distillation Compositions Using Dynamic Partial Least Squares Regression [J].Journal of Process Control,2000,10(02):157-166.
[5]ROSIPAL R.Kernel Partial Least Squares for Nonlinear Regression and Discrimination[J].Neural Network World,2003,13(03):291-300.
[6]ROSIPAL R,TREJO L J.Kernel Partial Least Squares Regression in Reproducing Kernel Hilbert Space [J].Journal of Machine Learning Research,2002(02):97-123.
[7]ROGINA A,?I?KO I,MOHLER I,et al.Soft Sensor for Continuous Product Quality Estimation(in Crude Distillation Unit)[J].Chemical Engineering Research and Design,2011,89(10):2070-2077.
[8]YAN Weiwu,SHAO Huihe,WANG Xiaofan.Soft Sensing Modeling Based on Support Vector Machine and Bayesian Model Selection[J].Computers and Chemical Engineering,2004,28(08):1489-1498.
[9]林碧華,顧幸生.基于差分進化算法-最小二乘支持向量機的軟測量建模[J].化工學報,2008,59(07):1681-1685.
[10]傅永峰.軟測量建模方法研究及其工業應用[D].杭州:浙江大學,2007.
[11]李浩,楊敏,石向榮,等.基于主曲線的軟測量方法及其在精餾塔上的應用[J].化工學報,2012,63(08):2492-2499.
[12]KANEKO H,FUNATSU K.Maintenance-free Soft Sensor Models with Time Difference of Process Variables [J].Chemometrics and Intelligent Laboratory Systems,2011,107(02):312-317.
[13]KANEKO H,FUNATSU K.A Soft Sensor Method Based on Values Predicted from Multiple Intervals of Time Difference for Improvement and Estimation of Prediction Accuracy [J].Chemometrics and Intelligent Laboratory Systems,2011,109(02):197-206.
[14]王鈞炎,黃德先.基于混合差分進化算法的軟測量時延參數估計[J].化工學報,2008,59(08):2058-2064.