李新春,何春明
(和利時科技集團有限公司,北京 100176)
工業生產中要實現良好的產品質量控制,必須對與產品質量密切相關的重要過程變量進行準確的實時測量與控制。然而在生產過程中有一些變量卻難以直接或實時測量,比如催化劑的活性、精餾塔的產品組分濃度、汽油干點、輕柴油凝固點、裂解爐裂解深度、丙烯腈收率等。
為解決以上問題,軟測量便應運而生。軟測量也稱為軟儀表,即建立可測、易測的過程變量(輔助變量)與難以直接檢測、或難以實時監測的待測變量(主導變量)的數學模型,用軟件實現對待測變量的估計。軟測量為后續的質量檢測、質量控制及質量優化奠定了基礎,是化工過程控制中十分重要的問題[1]。
軟測量模型的建立主要有以下3種方法:
1)機理法。通過分析過程的反應機理,運用物理、化學等基本定律來描述過程,建立模型。機理模型在工藝機理比較清楚的情況下,能夠取得較好的效果,其適用工況范圍大,推廣性好,且主導變量的化驗數據不存在時采用機理模型。但到目前為止仍有機理不明的復雜過程難于建模,建模的代價也較高,不同對象的機理模型可能千差萬別,因此機理模型的專用性強而移植性較差,難于形成通用的軟測量產品。在文獻[2-4]中,建立聚乙烯反應的機理模型估計聚合物成分,建立精餾塔的嚴格機理模型估計反應溫度及產品成分,建立熱量與風量的機理模型估計氧氣量。該類模型多基于熱動力學、流體力學、化學等定理定律,經適當的假設和簡化處理應用于實際問題。
2)統計法。根據系統的輸入輸出數據,建立與系統外部特征等價的數學建模的方法也稱為統計建模。基于數據建模方法簡單,模型精度可以接受,無需對工藝等有深入了解,易于形成通用的軟測量工具,便于工程師使用。但其受工況變化影響大,模型意義難以明晰。非線性及動態情況難于處理。在文獻[5-7]中,聚類分析、特征選擇、多模型融合等統計方法應用于軟測量的統計建模中,從數據中找規律,降低了模型對工藝機理的依賴,仿真結果也證明了統計法的有效性。
3)機理統計混合法。將機理法與統計法相結合,取長補短,方式有多種。
首先由機理模型確定模型架構,再通過實際數據及統計方法辨識模型的參數,進而得出完整的軟測量模型[8-9]。另外常用的結合方法還有機理模型明確的部分用機理模型估計,機理不清部分由統計模型估計,兩者結合形成整體估計[10-11]。
以上三種方法各有利弊,其中以統計法的應用較為廣泛,成功案例也較多。
以苯乙烯精餾過程[12]為實驗案例,精餾過程是化工工業中的典型過程之一,利用混合物中各組分揮發度不同而將各組分加以分離的一種分離過程。苯乙烯精餾過程的進料以乙苯(C8H10)為主,其中還包含苯、甲苯、苯乙烯等的混合物,主反應為乙苯吸熱分解為苯乙烯和氫氣。反應式如式(1)所示:

(1)
塔頂餾出產品為苯乙烯,其中含有少量雜質甲基苯乙烯(AMS),產品質量指標為塔頂餾出苯乙烯中的雜質AMS的質量分數w(AMS)。
某工廠現場AMS每天取樣一次,由中心實驗室進行化學分析得出取樣值的質量分數。為主導變量,測量范圍為0.001 5%~0.04%。
收集的輔助變量為精餾過程中20個主要的過程量,如溫度、壓力、流量等,采用的是取樣用于實驗分析時的小時平均值。w(AMS)及采樣時刻的20個輔助變量每天采樣分析一次,共采集21個變量值。由于w(AMS)為重要的產品質量變量,需做質量控制,因此其軟測量模型必不可少。
軟測量模型在實際應用中也存在以下問題:
1)化工過程往往比較復雜,相關輔助變量眾多,易造成模型過擬合。
2)對于非線性較強的過程,模型精度難以滿足要求。
除此以外,對于離線建模在線估計的架構,由于建模的數據的不完善、模型結構的不合理、工況變化等情況,在線模型難于提供長期穩定的質量估計,模型的在線更新非常必要。對于重要的主導變量,現場往往會提供產品質量的實驗室分析值或者提供在線分析儀測量值,這些值存在較大的測量滯后,無法直接用于質量控制,但可以用于軟測量的模型更新。
針對以上問題,雖已提出多種改進算法[5-7,13-14],但仍缺乏產品級的整體解決方案。經過大量的理論研究及實踐驗證,提出了一種通用的PCA-RBF-Kalman軟測量架構,如圖1所示。統一解決變量選擇、非線性及模型更新問題。通過主元分析(PCA)對輔助變量進行降維,RBF網絡解決過程非線性,在線估計時通過Kalman濾波對模型進行有效更新。并在該基礎上提出了一種模型參數的整定算法,提升了模型的性能,降低了現場實施的工程難度。

圖1 通用的軟測量架構示意
PCA是一種將多個相關變量轉化為少數幾個相互獨立的變量的有效分析方法。通過PCA在眾多的輔助變量中提取主要信息,進行降維處理。對輔助變量矩陣X進行主元分解如式(2)~式(3)所示:
(2)
(3)
式中:ti——得分向量,也稱為主元,ti∈RN;pi——負荷向量,pi∈RK;N——樣本數;K——輔助變量數。
當X中的變量間存在線性相關時,X的變化主要體現在最前面的幾個負荷向量上,X在最后幾個負荷向量上的投影很小,主要有測量噪聲引起的。忽略噪聲影響,不會引起X中有用信息的明顯缺失。
(4)
一般情況Q?K,即輔助變量數從K降維至Q,Q為建模時選取的主元變量個數。將有效地降低模型的復雜度,提高模型的穩定性。Q個主元是后續RBF網絡輸入,考慮到RBF神經網絡有很強的非線性擬合能力,可映射任意復雜的非線性關系,且輸出層為線性學習規則簡單等因素,本文采用RBF網絡來解決過程中的非線性如圖2所示。

圖2 RBF網絡模型示意
中間層徑向基函數選擇高斯函數,如式(5)所示:
(5)
式中:TC——高斯函數的中心,TC∈RQ。RBF網絡中間層雖然是非線性的但輸出層為線性,最終的質量估計模型公式,如式(6)所示:
(6)
式中:z=[1z1z2…zL]T;β=[biasβ1β2…βL]T。
中間層節點個數L及各中心節點的TC是RBF模型的關鍵參數,其整定方法將在下節論述。
在線估計時根據采樣所得輔助變量X,先變換為主元ti再經RBF網絡中間層非線性變換為Q,進行回歸建模。為使估計模型能夠長期穩定運行,設計了Kalman濾波器對估計模型進行有效更新。相對于常用的偏置量更新及遞推最小二乘更新,Kalman更新充分考慮了過程的狀態噪聲及測量噪聲,更新效果更為理想。
構建軟測量模型的狀態方程公式,如式(7)~式(8)所示:
βk=βk-1+hk-1
(7)
(8)
這里定義模型系數β為狀態量,且為無偏估計。h∈RL+1為狀態偏差,設為零均值白噪聲序列。e∈R1為測量偏差。Kalman更新即可變換,如式(9)~式(13)所示:
βk|k-1=βk-1|k-1
(9)
Pk|k-1=Pk-1|k-1+H
(10)
(11)
(12)
(13)
式中:P——狀態β的協方差矩陣;H——狀態噪聲hk-1的協方差矩陣;R——測量噪聲的協方差矩陣;G——Kalman增益;y——在線運行時實驗室分析值與測量值的比值。當該比值與估計值的偏差超過設定的閾值時啟動Kalman更新,按式(9)~式(13)對模型系數β進行更新。H和R的選擇對模型更新影響較大,其選擇方法也將在下節討論。
在本節中提出一種自動確定RBF網絡中間層節點數及其中心TC的方法。當網絡輸入節點數為M時,中間層節點數通常小于2M~3M,在該定義中間節點遍歷范圍為[1, 3M]。RBF網絡模型參數整定流程如圖3所示。

圖3 RBF模型參數整定流程示意
中間層各節點中心采用K-means法計算,算法邏輯如下:
1)初始化聚類中心TCi(i=1, 2, …,L)。初始值從M組輸入樣本ti(i=1, 2, …,Q)中隨機選擇L個樣本作為聚類中心。
2)將輸入樣本按最鄰近規則分組,更新中間層TCi的聚類集合Γi(i=1, 2, …,L)。
3)計算Γi中樣本的平均值,更新TCi,計算式如式(14)所示:
(14)
式中:Mi——Γi中的輸入樣本數。
按以上步驟迭代計算,直到TCi的分布不再變化,則可得收斂的中心值。一般確定模型結構時,會根據AIC準則[14]定義模型評價指標。
在模型評價時,需綜合考慮模型的復雜度及精度,對軟測量RBF模型而言,其輸入節點數為前若干主元個數,輸出節點數為待估計的質量變量數,模型復雜度主要體現在中間層節點數。AIC準則[14]定義模型評價指標計算式如式(15)所示:
(15)

選擇AIC值最小的模型可有效防止模型的過擬合,平衡模型的復雜度及精度。
H,R,P0|0是Kalman濾波的重要參數,手動設定相對困難。為降低現場實施的難度,其參數的自動設定更新非常必要,提出了Kalman參數整定流程如圖4所示。該方法的結果精度比較高,可滿足用戶的要求。

圖4 Kalman參數整定流程示意
圖4中,ym為實測的輸出,即為質量變量的實驗室分析值或測量值,yp為采用初始模型參數β的模型預測輸出值。βu為Kalman更新后的模型參數。yKalman為采用更新后的模型參數βu的模型預測輸出值。
H初值可設為單位矩陣I,因其表征的是狀態的估計值與實際值的偏差,這里用狀態的二階中心距,即方差近似。由于假設狀態噪聲為白噪聲,即狀態β為無偏估計,則狀態協方差可簡化為P0|0=β·βT。S為測量偏差的協方差矩陣,可直接根據定義計算。
在進行Kalman參數整定流程步驟1)的初始化后,每次有實測的實驗室分析值或測量值時,如需模型更新則可根據圖4中步驟2)~4)進行模型參數及Kalman濾波參數的自動更新。相對于一般的參數固定的Kalman濾波,上述的更新方法充分考慮了動態變化的狀態噪聲及測量噪聲,在線預測時具有更好的預測精度及魯棒性。
該研究采用苯乙烯精餾裝置2019年1—8月的數據用于軟測量的建模研究。
建模數據分為模型訓練和模型校驗兩部分,其中模型訓練用數據選擇前181組,占總數據的70%。校驗用數據選擇后79組,占所有數據的30%。
模型評價指標選均方根誤差σRMSE,標準誤差σSTD以及膨脹系數δ,表征了模型的精度及過擬合的程度。具體定義如式(16)所示:
(16)

選擇20個輔助變量進行MLR回歸,比較了MLR, PCR, Input selection, PCR-RBF多種模型,及其Kalman模型更新方法。
由上述可以看出,雖然訓練部分擬合效果不錯,但校驗部分偏差明顯增大,δ指標已顯示明顯過擬合。
所以,引入所有的輔助變量是不合理的,需從工藝分析及數據分析出發選擇合適的輔助變量(Input Selection)參與建模。根據工藝及數據的分析結果選擇流量,溫度的測量值作為輔助變量重新建模,經過合理的變量選擇后,與輔助變量全部引入的模型相比訓練的指標值雖略有下降,但校驗的指標值卻得到了很大的改善,包括模型的精度及穩定性。
通過PCR模型提取主元進行回歸,其前6個主元t1~t6已覆蓋整體信息的85%以上,因此選擇t1~t6進行回歸。經過主元分析后削弱了輔助變量間的相關性,主元之間相互獨立,校驗部分的過擬合得到改善。
通過4.1節的方法整定RBF模型參數,設定α=0.4、γ=0.6,即整定更偏重于減少校驗偏差,提高校驗精度。輸入主元數為6,計算所得RBF模型最優中間節點數為5,聚類所得RBF中間層節點中心值。
PCA-RBF模型擬合效果如圖5所示,可以看出相較于MLR模型、Input Selection模型以及PCR模型,PCA-RBF訓練及校驗的精度及δ都有明顯改善。

圖5 PC-RBF模型示意
上述4種模型結果對比見表2所列,其中T為建模訓練數據,V為建模校驗數據。

表1 4種模型結果對比
由表2可知,PCA-RBF模型的有效性顯而易見,但從圖5的模型擬合結果看仍然存在預測誤差較大的區域。將通過Kalman濾波更新模型系數,進而改善模型精度。
w(AMS)測量范圍為0.001 5%~0.04%,設定當模型預測值與實測值偏差超過最大值0.04%的5%時,即e>2×10-5時觸發模型更新。其擬合曲線如圖6所示,評價指標見表3所列。

圖6 PC-RBF-Kalman模型示意

表2 PC-RBF-Kalman模型指標
由圖6可知,經過Kalman濾波更新后模型校驗部分的各指標都有大幅提升,模型的估計結果能夠跟隨實測值變化,反映了在線運行時,根據采樣時刻的實驗室分析值或測量值與模型估計值的偏差,及時進行模型更新將會大幅提高預測精度、提高模型穩定性,有利于模型的長期在線運行。
本文提出了一個通用的軟測量模型的架構及其模型參數的整定方法。并實際應用于苯乙烯精餾過程。建立了質量變量AMS多種軟測量模型,對其結果進行了分析比對。研究了預測偏差及過擬合問題,采用Kalman濾波對模型進行更新,模型預測效果明顯改善,實際結果證明了所提出模型及其更新方法的有效性,具有實用參考價值,為后續的質量控制奠定了基礎。