劉興紅,鄒志云,劉景全,郭宇晴,于魯平
(防化研究院,北京102205)
鑒于間歇過程在現代工業中的地位和作用愈加重要,且隨著數據采集、數據庫、化學計量學(chemometrics)等技術的發展,間歇過程基于數據驅動的建模方式發展迅速[1]。非線性時間序列預測技術可實現重要參數未來變化趨勢的早期預報,從而為分析判斷工況是否正常、確定轉入下一工序的時機提供依據,進而達到節能降耗、提高產量的目的。筆者根據間歇過程數據特點,提出了一種間歇過程變量非線性時間序列在線預測方法。
建立間歇過程變量預測模型需要挖掘該變量在以往過程批次中的數據信息。由于間歇過程數據具有動態特點,在批次內表現為非線性的時間序列,即具有非線性和自相關性;在不同操作批次之間過程變量軌跡的變動服從正態分布,且不同批次數據不等長[2]。因此,難于找出一條統一不變的軌跡來擬合,以建立變量的在線預測模型。筆者采用對多個批次數據按照隨機的順序首尾相接組成長數據集的數據重構策略,采用時間序列分析及預報技術,實現間歇過程變量的實時預報。
常用的非線性時間序列建模方法有基于自回歸求和滑動平均ARIMA(Autoregressive Integrated Moving Average)的方法[3-4]、人工神經元網絡ANN(Artificial Neural Net)方法[5]和支持向量機SVM(Support Vector Machine)方法[6-7]等。ARIMA方法是理論上最為成熟的自回歸滑動平均(ARMA)方法在非線性時間序列分析應用中的一種演進和拓展。由于ARIMA方法算法簡單,計算速度快,且精度也較高,因而筆者采用ARIMA方法建模。通過與相空間重構-最小二乘支持向量機方法比較,表明該方法可用于間歇過程變量在線預測。
1.1.1 數據重構
Nomikos和MacGregor[8-13]將間歇過程數據看成三維數據:批次(I)、時間(K)和變量(J),并采用兩種方法將三維數據展開為二維數據。方法一是沿批次方向展開,即(I,K×J),其中一維為批次,另一維為每一批次的不同變量的數據隨時間首尾相連;方法二是沿變量展開,即(J,K×I),其中一維為變量,另一維為每一變量不同批次的數據隨時間首尾相接。前者存在不同批次數據不等長的問題,采用后者對間歇過程變量進行數據重構,所不同的是筆者對單變量(J=1)建立時間序列預測模型,數據重構示意如圖1所示。數據重構后的時間序列為{x1,1,x2,1,…,xK1,1,x1,2,x2,2,…,xK2,2,…,x1,i,x2,i,…,xKi,i,x1,I,x2,I,…xKI,I},其中Ki為第i批次的數據采集時間,I為批次數。

圖1 數據重構示意(I=4,J=1)
1.1.2 預測算法設計思路
根據間歇過程數據特點,設計間歇過程變量時間序列預測算法的具體思路如圖2所示。圖中實線箭頭為模型訓練過程,虛線箭頭為模型檢驗和預測過程。首先對數據進行初始化處理,采用Savitzky-Golay濾波方法對每個批次的數據分別做數據平滑處理;然后將所有數據分成訓練集和檢驗集;采用上一步驟的方法將兩個數據集分別做數據重構,即以批次為單位隨機地將不同批次數據首尾相接,并采用后面所有數據減去上一批次最后一個數據的方法去除批次連接點處數據跳躍的情況;運用訓練集建立ARIMA方法;運用檢驗集對建立的模型進行驗證,預測精度性能指標采用預測均方差MSE(Mean Square Error),驗證合格的模型,用于間歇過程變量在線預測。

圖2 間歇過程變量預測模型建立流程示意
由于間歇過程變量時間序列具有趨勢性和非平穩性,因而不能直接采用針對平穩序列的建模方法。ARIMA方法就是采用Box-Jenkins方法,即差分方法,來消除趨勢性和非平穩性,使得變換后的序列成為平穩序列,再對該序列采用ARMA方法建模。
首先介紹ARMA方法。假設{Xt,t=1,2,…,N}(N為時間序列的長度)是平穩時間序列,對該序列建立的ARMA模型可表示為[14]

式中:{εt}~WN(0,σ2)為一白噪聲過程;p,q——整數,(p,q)≥0稱為模型的階,記為{Xt}~ARMA(p,q)。B表示向后推移算子,其定義為BkXt=Xt-k。則ARMA(p,q)可表示為

且b(·)和a(·)具有如下定義式:


如果時間序列{Yt}的d階差分Xt=(1-B)dYt是一個平穩ARMA(p,q),其中d≥1是整數,即b(B)(1-B)dYt=a(B)εt,則稱{Yt}為具有階p,d和q的ARIMA過程,記為{Yt}~ARIMA(p,d,q)。
筆者采用的建模步驟如下:
a)求差分階數d。先求時間序列的1階差分,判斷差分處理后序列是否為平穩性序列。若是,則d=1;若不是,則對序列求2階差分,依次類推,直至d階差分處理后序列為平穩序列為止,得差分階數d。序列的平穩性采用Daniel檢驗法進行檢驗。
Daniel檢驗方法:對于顯著水平α,由時間序列{Xt}計算(t,Rt)的Spearman秩相關系數qs,t=1,2,…,n為數據樣本容量,Rt=R(Xt)為{Xt}的秩統計量。qs計算公式如下:

構造統計量:

若|T|>tα/2(n-2),則拒絕原假設H0,認為序列非平穩,且當qs>0時,認為序列有上升趨勢;qs<0時,認為序列有下降趨勢。又當|T|<tα/2(n-2)時,接受H0,認為{Xt}是平穩序列。
b)確定p和q。采用AIC準則確定ARMA模型的階數p和q。AIC準則起源于Kullaback-Leibler信息量。AIC定階準則為選取p,q,使得:

筆者應用MATLAB統計函數Aicbic計算統計量AIC,AIC最小值所對應的p和q即為所求。
c)ARMA模型參數估計。ARMA模型參數估計方法有多種,筆者采用最大似然估計方法,并運用Matlab中Garch工具箱的相關函數實現參數估計,建立ARMA模型。
間歇蒸餾過程是精細化工生產過程中非常重要的加工和分離環節,其原理是不同組分由于在同一溫度(或壓力)下的蒸汽分壓(或共沸點)不同而實現液體混合物的分離。由于間歇蒸餾過程內在機理復雜,預分離的混合物種類或組成經常變動,對控制作用響應緩慢,且蒸餾塔工藝結構特點千差萬別,因而對實現間歇蒸餾過程的自動控制提出了諸多挑戰。相對而言,對溫度實時監測較易實現,且根據混沌理論,溫度能較高程度地反映體系內反應及分離情況。因此,在熟知工藝的前提下,基于溫度預報的軟測量技術對間歇蒸餾過程的控制可發揮重要作用。筆者采用上述方法對間歇等壓蒸餾溫度實施在線預測,得到可預測多步的溫度值,進而為間歇蒸餾過程的質量控制提供重要的參考。
筆者選取數據為某間歇等壓蒸餾過程的上升氣溫度數據,總批次為15批,數據點數共8 630,采樣間隔為15s。10批作為訓練集,5批作為檢驗集。
圖3為訓練集數據經預處理和重構后的時間序列,可以看出數據連續且平滑。

圖3 數據預處理及重構后時間序列曲線
采用1.2節ARIMA方法對該數據集建立的模型為ARIMA(2,2,8)。


表1 ARIMA方法與LSSVM方法多步預測的MSE
圖4為對某批次采用ARIMA方法和LSSVM方法進行4步在線預測結果的比較,從圖中可以看出,在升溫階段,預報值與實際值吻合得非常好,因而該模型可用于間歇蒸餾過程轉餾分點(升溫變緩的點)的在線預測。因此,可以看出ARIMA方法可作為一種優良的非線性預測方法用于間歇過程變量的在線預測。

圖4 某一批次4步(1min)預測結果比較
a)間歇蒸餾過程溫度在線預測結果表明:以批次為單位隨機將不同批次數據首尾相接的數據重構策略適于間歇過程變量數據特點,可用于該類數據的預測建模。
b)采用ARIMA時間序列分析及預測方法建立的預測模型,預測精度滿足生產現場的要求。
c)考慮到ARIMA在多步預測中隨著預測步數的增加,預測精度明顯降低的情況,可考慮在非線性段將ARIMA方法與其他非線性建模方法如SVM方法結合的算法設計策略。
[1] 宋建成.間歇過程計算機集成控制系統[M].北京:化學工業出版社,1999.
[2] 陸寧云,王福利,高福榮,等.間歇過程的統計建模與在線監測[J].自動化學報,2006,32(03):400-410.
[3] 單偉,王玉田.非線性時間序列在衛星通信網絡數據預測中的應用[J].空間電子技術,2009(02):115-119.
[4] 董曉萌,羅鳳娟,郭滿才,等,時間序列的自回歸模型在楊凌地區降水量預報中的應用[J].中國農業通報,2007,23(11):403-407.
[5] 韓敏,王亞楠.基于Kalman濾波的貯備池多元時間序列在線預報器[J].自動化學報,2010,36(01):169-173.
[6] BERNHARD B,MARCO H,DETLEF B,et al.A Sales Forecast Model for the German Automobile Market Based on Time Series Analysis and Data Mining Methods[C].ICDM 2009,LNAI 5633,2009:146-160.
[7] XU Ruirui,BIAN Guoxing,GAO Chenfeng,et al.Discussion about Nonlinear Time Series Prediction Using Least Squares Support Vector Machine[J].Commun Theor Phys,2005(43):1056-1060.
[8] NOMIKOS P,MACGREGOR J F.Monitoring Batch Processes Using Multiway Principal Component Analysis[J].AIChE Journal,1994,40(08):1361-1375.
[9] NOMIKOS P,MACGREGOR J F.Multivariate SPC Charts for Monitoring Batch Processes[J].Technometrics,1995,37(01):41-59.
[10] MACGREGOR J F,KOURTL T.Statistical Process Control Ofmultivariate Processes[J].Control Fag Practice,1995,3(03):403-414.
[11] NOMIKOS P,MACGREGOR J F.Multi-way Partial Least Squares in Monitoring Batch Processes[J].Chemometrics and Intelligent Laboratory Systems,1995(30):97-108.
[12] KOURTI T,NOMIKOS P,MACGREGOR J F.Analysis,Monitoring and Fault Diagnosis of Batchprocesses Using Multiblock and Multiway PLS[J].Proc Cont,1995,5(04):277-284.
[13] KOURTI T.Multivariate Dynamic Data Modeling for Analysis and Statistical Process Control of Batch Processes,Start-ups and Grade Tansitions[J].Chemometrics,2003(17):93-109.
[14] 范劍青,姚琦偉.非線性時間序列建模、預報及應用[M].北京:高等教育出版社,2005.
[15] 劉興紅,鄒志云,馬麗欣,等.相空間重構-最小二乘支持向量機用于間歇過程變量在線預測[J].計算機與應用化學,2011(12):1577-1580.