鄒涵
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
非線性動態(tài)WPLS航煤干點軟測量
鄒涵
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
針對煉油工業(yè)過程存在的多變量、非線性和數(shù)據(jù)動態(tài)性問題,提出一種自回歸移動平均模型與徑向基函數(shù)-加權(quán)偏最小二乘相結(jié)合的非線性動態(tài)建模方法。首先建立基于徑向基函數(shù)-加權(quán)偏最小二乘方法的軟測量模型,然后利用自回歸移動平均模型對數(shù)據(jù)進行時序分析校正,將動態(tài)誤差信息加入到模型中去,實現(xiàn)模型的動態(tài)裝換。將該方法應(yīng)用到加氫裂化航煤干點的軟測量建模中,從而獲得比徑向基函數(shù)-加權(quán)偏最小二乘算法更高的預(yù)測精度。
徑向基函數(shù);自回歸移動平均模型;偏最小二乘;干點;軟測量
在煉油工業(yè)的生產(chǎn)過程中,干點是衡量分餾產(chǎn)品質(zhì)量的一個關(guān)鍵指標(biāo),直接影響到其質(zhì)量和收率的高低。但是,該指標(biāo)是規(guī)格參數(shù),無合適的在線分析儀進行測量,只能離線分析且時間長。因此,建立性能優(yōu)良的干點軟測量模型,可以實現(xiàn)干點質(zhì)量指標(biāo)的預(yù)測,并為生產(chǎn)操作提供指導(dǎo)。目前,軟測量已提出很多方法,有多種全局多元線性回歸方法[1-3],具有簡潔明確的表達形式,但難以描述非線性系統(tǒng)。為了處理非線性問題,又提出了多種非線性軟測量方法[3-4],然而由于過程生產(chǎn)中自身控制要求的改變、本身特性的變化以及現(xiàn)場環(huán)境對其影響,使得過程生產(chǎn)通常處于動態(tài),利用靜態(tài)建模方法難以體現(xiàn)動態(tài)特性,造成模型預(yù)測精度低且不能持續(xù)使用。所以僅僅考慮非線性特性是不夠的,需要將對象的動態(tài)信息融合到模型中去。
本文提出一種自回歸移動平均(autoregressionmnving average,ARMA)模型與徑向基函數(shù)-加權(quán)偏最小二乘(Radial basis function-Weighted partial least regression,RBF-WPLS)相結(jié)合的軟測量方法。該方法首先建立基于RBF-WPLS的軟測量模型,即將具有非線性樣本數(shù)據(jù)映射到高維特征空間中,在高維特征空間中建立WPLS線性回歸模型;然后,利用ARMA模型對數(shù)據(jù)進行動態(tài)估計,通過增加動態(tài)校正環(huán)節(jié),實現(xiàn)了對靜態(tài)模型的動態(tài)校正。
1.1 加權(quán)偏最小二乘回歸
加權(quán)偏最小二乘回歸方法是對偏最小二乘回歸方法的改進算法。下面對PLS原理[5]做簡單描述:
設(shè)樣本容量為n,自變量數(shù)據(jù)矩陣X為n×p(n>p)維,因變量數(shù)據(jù)矩陣Y為n×q(n>q)維,提取PLS主元采用NIPALS算法[6]。設(shè)T是前t個PLS成分組成的n×t維隱變量矩陣,且有T=XU,則PLSR模型

式中:U——p×t維轉(zhuǎn)換矩陣;
C——t×q維回歸系數(shù)矩陣;
E——n×q維的殘差矩陣。
在NIPALS算法中可同時計算出C與U,則q個因變量的預(yù)測值可以如下回歸方程計算:

現(xiàn)實情況中,由于每個樣本貢獻率不同,導(dǎo)致其權(quán)重也不同。為了體現(xiàn)這種情況,可以采用加權(quán)回歸方法[7],即對各個樣本賦予不同的權(quán)值,權(quán)值回歸模型為

式中:W——權(quán)值系數(shù)。
權(quán)值大小需根據(jù)樣本和預(yù)測對象之間的歐氏距離來分配大小。歐式距離與預(yù)測能力呈負相關(guān)關(guān)系[7]。即樣本與預(yù)測對象的歐式距離越大,所分配的權(quán)值將越小。確認權(quán)值系數(shù)有很多種方法,本文采用一種較簡單的方法。設(shè)權(quán)值分配參數(shù)為m(m為正整數(shù)),則與預(yù)測對象歐式距離最近的前m個樣本權(quán)值為1,其余樣本權(quán)值為0。
1.2 徑向基函數(shù)-加權(quán)偏最小二乘回歸
徑向基函數(shù)-加權(quán)偏最小二乘回歸算法是在加權(quán)偏最小二乘算法之前進行徑向基函數(shù)的非線性變換。通過輸入空間映射到一個新的空間,輸出層在新的空間中進行線性組合,從而將線性不可分問題轉(zhuǎn)化為線性可分[8]。本文采用最常用的高斯徑向基函數(shù)做為隱含層節(jié)點的徑向基函數(shù)。其隱含層節(jié)點的加權(quán)輸出為

式中:λi——隱含層輸出的權(quán)值系數(shù);
m——徑基個數(shù);
ci,σi——第i個是高斯函數(shù)的中心和寬度參數(shù);
‖·‖——歐式范數(shù)。
RBF網(wǎng)絡(luò)中需要學(xué)習(xí)3個參數(shù),即高斯函數(shù)的中心ci、寬度σi以及隱含層輸出的權(quán)值系數(shù)λi。高斯函數(shù)的中心ci和寬度σi可以采用K-均值聚類方法[9]確定,權(quán)值系數(shù)λi可以采用偏最小二乘方法算出。
ARMA模型[10]是研究時間序列、用于平穩(wěn)時間的重要方法。即序列的當(dāng)前值除了與自身的過去值存在關(guān)系,并且還與其以前進入系統(tǒng)的外部干擾存在一定的依賴關(guān)系,則該模型在表現(xiàn)刻動態(tài)特性時,模型中既包括自身的滯后項,也包括過去的外部干擾誤差項。通常ARMA模型可表示為

對其引入后向算子B有:Bxt=xt-1,B2Xt=Xt-2,(c為常數(shù))。對于上述ARMA模型表達式,分別令:

則式(5)轉(zhuǎn)變?yōu)槿缦卤磉_式:

式中:xt——正態(tài)、平穩(wěn)的時間序列;
at——隨機干擾誤差項;
B——延遲算子;
φ(B),θ(B)——算子多項式。
模型稱為p階自回歸、q階滑動平均模型,記作ARMA(p,q)。
ARMA(n,n-1)模型具有將隨機平穩(wěn)系統(tǒng)逼近到任意精度的功能,通過遞增法逐步逼近,需找適合的n值,確定模型階數(shù)n。同時,n以2為遞增量,不需要對ARMA(n,n-1)((q≠p-1))模型的討論,從而降低復(fù)雜度[11]。
對于ARMA(n,n-1)模型階次的確定,利用F校驗方法來判定。從n取1開始逐漸增大取值,直到獲得滿意的模型階次。設(shè)H0:φ2n+2=0,θ2n+1=0,Q0為ARMA(2n+2,2n+1)模型殘差平方和,Q1為ARMA(2n,2n-1)模型殘差平方和,則:

式中:s——被校驗參數(shù)的個數(shù);
r——模型參數(shù)的總個數(shù);
n——樣本長度。
若F>Fa,則H0不成立,模型將繼續(xù)增加階次;否則,ARMA(2n,2n-1)是合適的模型。而Fa的值可由F分布表和預(yù)先給定的置信度a來確定。
首先利用RBF-WPLS算法建立軟測量預(yù)測模型,將該模型訓(xùn)練輸出值y?m與真實測量ym值相減,
得到一個關(guān)于輸出值誤差Δym的時間序列值,利用ARMA(n,n-1)模型對該時間序列進行建模,得到關(guān)于預(yù)測誤差的ARMA模型。將以上兩個模型相結(jié)合進行模型預(yù)測時,RBF-WPLS模型輸出值減去ARMA模型的誤差值,即得到輸出變量的預(yù)測結(jié)果。該模型結(jié)構(gòu)框圖見圖1。

圖1 基于RBF-WPLS和ARMA的軟測量模型結(jié)構(gòu)
其實現(xiàn)過程步驟如下:
(1)將每個訓(xùn)練樣本作為RBF的基向量(ci=xi,i=1,2,…,n),使得隱含層節(jié)點個數(shù)等于樣本數(shù)。對輸入矢量x執(zhí)行非線性變換,得到隱含層輸出矢量Ri(x)(i=1,2,…,n),即

式中:e——大于0的常數(shù)。
將得到的輸出矢量Ri(x)組成n×n維的隱含層輸出矩陣Ri(x)。
(2)采用WPLS回歸方法,假定提取的主元個數(shù)為t(t=1,2,…,p);權(quán)值分配參數(shù)為m(m=t+1,t+2,…,n-1)。
(3)利用舍一交叉驗證的思想,在所有樣本n中選出一個樣本來,設(shè)為xi(i=1,2,…,n)。將其作為測試樣本,剩余n-1個樣本均作為訓(xùn)練樣本。并且在訓(xùn)練集中,將與測試樣本距離最近的m個樣本權(quán)值設(shè)為1,其余樣本權(quán)值設(shè)為0。構(gòu)建權(quán)值矩陣W。
(4)分別對自變量矩陣X和因變量矩陣進行加權(quán)處理,得到m×p維的自變量矩陣Xm=WX和m×q維的因變量矩陣Ym=WY。
(5)通過NIPALS算法,從自變量矩陣Xm中提取t個主元,構(gòu)建m×t維隱變量數(shù)據(jù)矩陣Tm,t同時計算對應(yīng)的p×t維轉(zhuǎn)換矩陣Um,t和t×q維回歸系數(shù)矩陣Cm,t。
(6)采用相對誤差平方和Em,t來確定m和t的值對于1到n記錄每個Em,t的值。其中y?j為測試樣本xj的預(yù)測矢量為其第l個分量;yjl為第j個實際測量值。
(7)構(gòu)建相對誤差矩陣R,將每個Em,t值對應(yīng)輸入其中,并在矩陣其他沒有對應(yīng)的位置添入+∞。當(dāng)誤差矩陣中Em,t取最小值時,即為Em,t的最優(yōu)目標(biāo)值,對應(yīng)行列分別記為m0和t0。
(8)對于預(yù)測對象,將權(quán)值分配參數(shù)取為m0,提取的主元個數(shù)取為t0,按(2)~(6)步驟建立回歸模型。
(9)將訓(xùn)練樣本集經(jīng)過WPLS模型處理后,得到一組模型輸出值y?m,將其與真實測量值ym相減,得到關(guān)于訓(xùn)練輸出值誤差時間序列值Δym,對該時間序列進行ARMA建模,確定ARMA(n,n-1)模型階數(shù)。模型階數(shù)n的確定采用遞增系列法逐步逼近,找到最合適的n值。
(10)利用上述兩個模型對測試樣本進行仿真,軟測量模型最終的輸出值即為

以某石化公司加氫裂化裝置為研究背景,經(jīng)現(xiàn)場了解工藝情況及相關(guān)性分析后發(fā)現(xiàn):航煤干點主要受10個變量的影響:航煤抽出量x1,回流溫度x2,回流量x3,輕石腦油抽出量x4,重石腦油抽出點溫度x5,重石腦油抽出量x6,進料量x7,進料溫度x8,塔釜溫度x9,塔頂壓力x10。現(xiàn)將10個變量作為模型的輸入變量,以分餾塔的航煤干點作為輸出變量,對現(xiàn)場數(shù)據(jù)進行采集,并剔除病態(tài)數(shù)據(jù),共采集了174組數(shù)據(jù)。將其中的124組作為訓(xùn)練數(shù)據(jù),其余的50組作為測試數(shù)據(jù),采用ARMA-RBF-WPLS方法建立航煤干點軟測量模型。根據(jù)上述ARMA-RBF-WPLS建模步驟,需要尋找Em,t的最小值來確定權(quán)值分配參數(shù)和主要個數(shù)。由趨勢性分析得到Em,t取最小值時,分別對應(yīng)的權(quán)值分配參數(shù)m為93,主元個數(shù)t為8,并選出與預(yù)測對象之間歐氏距離最小的93個樣本,其權(quán)值分配為1,剩余樣本權(quán)值分配為0,得到加權(quán)樣本。
ARMA模型參數(shù)階數(shù)的確定,從ARMA(2,1)模型開始,以2為步長,建模ARMA模型,每當(dāng)n增加時,通過F準(zhǔn)則去檢驗判定。當(dāng)模型增加到ARMA(5,4)時,與ARMA(4,3)對比發(fā)現(xiàn)在預(yù)定的顯著誤
差水平上F值下降不顯著,所以模型階數(shù)應(yīng)停止增加,選擇ARMA(4,3)為航煤干點的軟測量模型。

圖2 ARMA-RBF-WPLS模型預(yù)測結(jié)果與實際值對比
圖2給出了ARMA-RBF-WPLS模型預(yù)測值與工廠實際值對比曲線。
為做對比,采用相同數(shù)據(jù)用RBF-WPLS方法建立干點預(yù)測模型。圖3給出了RBF-WPLS模型預(yù)測值與工廠實際值對比曲線。從表1和圖2~圖3可以看出,ARMA-RBF-WPLS模型與RBF-WPLS模型相比,結(jié)構(gòu)更加精確,誤差更小,更好地反映了航煤干點的變化趨勢。在50組檢驗樣本中,采用ARMA-RBF-WPLS模型的均方差為1.2268℃,82%的樣本誤差小于±1℃,98%的樣本誤差小于±2℃;采用RBF-WPLS模型的均方差為1.6514℃,70%的樣本誤差小于±1℃,90%的樣本誤差小于±2℃。ARMARBF-WPLS模型與RBF-WPLS模型對比,顯示出更高的擬合精度。

圖3 RBF-WPLS模型預(yù)測結(jié)果與實際值對比

表1 ARMA-RBF-WPL模型和RBF-WPLS模型的結(jié)果比較
通過利用RBF-WPLS和AMRA相結(jié)合的方法實現(xiàn)了系統(tǒng)動態(tài)過程的非線性軟測量建模,利用AMRA模型克服了RBF-WPLS算法難以描述動態(tài)特性的缺點,利用歷史輸出值對當(dāng)前時刻的影響實現(xiàn)了預(yù)測誤差的動態(tài)估計,體現(xiàn)了系統(tǒng)的動態(tài)特性。將該方法應(yīng)用于加氫裂化第一分餾塔航煤干點的預(yù)測,仿真結(jié)果驗證了該方法與RBF-WPLS軟測量模型相比具有更高的預(yù)測精度。
[1]Bastion P,Esposito V V,Michel T.PLS generalized linear regression[J].Computational Statistics and Data Analysis,2005,48(1):17-46.
[2]石琳,湯佳佳,于濤,等.基于樣條變換的非線性PLS的反應(yīng)高爐爐溫的參數(shù)預(yù)測[J].鋼鐵研究學(xué)報,2013,25(2):22-25.
[3]蔡華斌.基于神經(jīng)網(wǎng)絡(luò)的電機轉(zhuǎn)矩軟測量研究[J].中國測試技術(shù),2007,33(2):50-52.
[4]Nicolai B M,Theron K I,Lammertyn J.Kernel PLS regerssion on waveler transformed NIR spectra for prediction of sugar content of apple[J].Chemoertrics and Intelligent Laboratory Systems,2007,85(2):243-252.
[5]顏學(xué)峰.基于徑基函數(shù)-加權(quán)偏最小二乘回歸的干點軟測量[J].自動化學(xué)報,2007,33(2):193-196.
[6]計智偉,吳耿鋒.基于層次聚類算法和偏最小二乘的特征選擇[J].計算機工程與設(shè)計,2009,30(21):4931-4935.
[7]劉海濤,魏汝禪,蔣國萍.基于加權(quán)偏最小二乘回歸的軟件成本估算方法[J].計算機工程,2012,38(21):36-39.
[8]賈明興,趙春暉,王福利,等.基于RBF神經(jīng)網(wǎng)絡(luò)的非線性主元分析方法[J].儀器儀表學(xué)報,2008,29(3):453-457.
[9]韓敏,劉曉欣.基于互信息的分布式輸入變量選擇多元序列預(yù)測研究[J].自動化學(xué)報,2012,38(6):999-1006.
[10]閻平凡,張長水.人工神經(jīng)網(wǎng)絡(luò)與模擬進化計算[M].北京:清華大學(xué)出版社,2000:46-48.
[11]Ives A,Abbott K C,Ziebarth N L.Analysis of ecological time series with ARMA(p,q)model[J].Ecology,2010,91(3):858-871.
Soft sensing for dry point of jet fuel based on nonlinear dynamic WPLS
ZOU Han
(College of Electronics and Information Engineering,Nanjing Technology University,Nanjing 211816,China)
A nonlinear dynamic modeling method combining auto-regressive and moving average and radial basis function-weighted partial least squares regression is presented to solve the problem according to the requirements for refining industrialprocesses with multivariable,nonlinear and dynamic data.Firstly,this approach built RBF-WPLS model.Then,ARMA models use the data correction timing analysis,and dynamic error message will be added to the model to achieve a dynamic model.Finally,the proposed ARMA-RBF-WPLS was used to predict the dry point of jet fuel in hydrocracking unit,and it obtained highly precise prediction results compared with RBF-WPLS methods.
radial basis function;ARMA model;partial least square;dry point;soft sensor
TP273;TE62;O224;O241.5
:A
:1674-5124(2014)03-0121-04
10.11857/j.issn.1674-5124.2014.03.032
2013-11-16;
:2014-01-22
鄒 涵(1990-),男,江西豐城市人,碩士研究生,專業(yè)方向為復(fù)雜過程的先進控制。