林圣才 楊煜普 屈衛東
(上海交通大學電子信息與電氣工程學院自動化系系統控制與信息處理教育部重點實驗室,上海 200240)
近二十年來,隨著現代化工及冶金等工業過程的日益大規模化和復雜化,工業過程的安全問題越來越受到人們的關注。復雜的工業過程往往難以用精確的物理模型去描述[1],因此基于多元統計分析的故障診斷方法應運而生,并在工業過程中獲得了成功的應用[2~5]。Wise B M等將主元分析方法(PCA)引入了過程監控[6],Lee J M等在PCA的基礎上提出了核PCA方法并將其用于故障診斷[7]。PCA方法是從觀測數據中提取與統計無關的主元,通過構造統計量對過程狀況進行監控統計,判斷過程是否出現故障,它要求數據服從高斯分布。但是實際工業過程往往并不滿足這個條件,同時PCA方法無法反映過程的動態時序特性,這在一定程度上影響了它的故障檢測準確率。可預測元分析(Forecastable Component Analysis,ForeCA)作為一種新的統計信號處理方法[8],克服了這個不足。它是一種全新的用于多變量時序相關信號的降維與特征提取方法,它能從已有的數據中捕捉到系統的動態特性,并以此來預測系統運行變化的趨勢,因此所提取的特征更能從本質的上描述工業過程。
筆者將可預測元分析方法引入到故障檢測中,通過所挖掘的可預測元提取出觀測信號中的可預測分量,構造兩種統計量對其進行統計監控。該方法克服了主元分析方法需要數據服從高斯分布且無法反映過程時序特性的不足,能夠預測系統運行變化的趨勢,反映出系統的動態特性,提升故障檢測的效果。在TE過程上的仿真結果表明了該方法的可行性和有效性。
設矩陣X∈Rn×m,可預測元分析的基本思想是尋找到一個線性變換WT∈Rk×n,使得:

(1)
W為負荷矩陣,它的列向量表示負荷向量,彼此相互正交。

γy(k)=E(yt-μy)(yt-k-μy)T,k∈R
(2)
其中k表示時延。
定義單變量平穩過程的譜密度為對其自協方差函數的傅里葉變換:
(3)


(4)
熵越大則平穩過程的后續變化越難被預測,且白噪聲無法被預測,因此可得:

(5)
根據式(5)定義平穩過程的可預測度為:

(6)
對于多變量二階平穩過程Xt,考慮線性變換yt=wTXt,其中w(w∈Rn)是W的列向量,即可預測元,此時yt就可以看成是一個單變量的二階平穩過程。Goerg G給出了ForeCA的最優化問題[8]:


(7)
s.t.wTΣXw=1

在求解式(7)問題時,首先使用加權交疊平均(WOSA)譜估計法對隨機過程進行譜密度估計[9],然后使用EM-Like算法求取可預測元[10]。通過文獻[8]給出的算法可以計算出一組按照可預測度由高到低順序排列的可預測元(可預測元個數可以指定,一般不大于平穩過程的變量個數),進而得到線性變換矩陣WT。
首先選取一段正常工況生產下的觀測數據Yn×m,其中n為變量個數,m為采樣點數(時間序列),由于變量使用的量綱不同,因此需要對觀測數據進行標準化處理,處理后的數據記為Xn×m。對Xn×m運用ForeCA算法,選取可預測元的個數等于觀測數據中變量的個數n,使用算法后得負荷向量wi∈Rn,i=1,2,…,n,每個負荷向量wi對應的可預測度為Ωi,進而得到線性變換矩陣:
WT=[w1,w2,…,wn]T∈Rn×n
WTW=In∈Rn×n
(8)
定義累積可預測度貢獻率為:
(9)
根據式(9)的定義,一般取Ψ(Ω)≥85%,由此可求得k值。定義前k個可預測元對應的負荷向量wi(wi∈Rn,i=1,2,…,k)為可預測主元負荷向量,并令:
(10)
定義WdT為可預測主元負荷矩陣。通過從可預測元矩陣中選取可預測主元一方面可降低矩陣的維數和計算量,另一方面可構造新的用于故障檢測的統計量。式(9)給出了一種選取可預測主元的方法,除此之外,還可以使用交叉驗證的方式。
當用于在線數據時,設某次采樣得到的數據為x,x∈Rn,可得:

(11)
(12)
(13)
式(12)表示數據x在可預測主元子空間的投影,式(13)表示數據x在殘差子空間的投影。
根據式(11)、(13)定義兩種統計指標:L2統計量與SPE統計量。L2統計量與SPE統計量定義分別為:
通常,我們都會不自覺地將一張攝影作品歸入某個特定的時代框架里。然而荒誕的是,這張照片似乎想要從一切短暫的年代歸屬之中退出去。一方面,觀眾感覺這張照片反映的是一個詭異而險惡的“舊世界”。它以某種方式將這種痕跡留在照片上:斑點、劃痕,諸如此類來自玻璃負片時代的特征。威特金常常采用一種高度直覺化的方式來完成照片制作的物理過程,比如刮擦負片、漂白或是調節畫面顏色。
L2=xTWdΛ-1WdTx
(14)

(15)
其中Λ表示由前k個可預測主元對應的可預測度組成的對角陣。L2統計量是通過可預測模型內部的可預測元模的波動來反映系統的變化情況,SPE統計量則表示一個觀測數據到可預測模型空間的距離,反映了測量值對模型的偏離程度。
由于所構造的統計量并不一定嚴格服從正態分布,因此可以采用核密度估計法[11,12]對統計量進行密度估計,選取合適的置信水平進而確定統計量的控制限。
當使用ForeCA算法提取出可預測系統運行變化趨勢的特征,并構造出上述兩種統計量后,將此可預測模型運用于在線數據,對其進行檢驗:如果檢驗結果在相應統計量的控制限以下,則說明目前系統工作在可預測模型所預測的變化范圍之內,即系統工作正常;反之,則說明目前系統的工作狀態已經偏離可預測模型所預測的變化范圍,因此有理由判斷系統已經出現了故障。
當使用L2統計量與SPE統計量檢測到過程系統出現故障后,需要定位出系統發生異常的位置,這里采用貢獻圖法[13]來處理這個問題。對于L2統計量與SPE統計量,對每個變量定義如下的貢獻值:

(16)

(17)
利用貢獻圖法可以知道過程變量對當前狀態的貢獻,貢獻值最大的變量很可能是這次故障發生的位置所在,因此可以及時給予報警。
TE實驗平臺是Downs J J和Vogel E F于1993年提出的[14]。TE實驗平臺在Eastman化學公司的世界工藝流程上做了少許改動,可以很好地模擬現實中的復雜工況,其流程如圖1所示。

圖1 TE過程流程
選取正常的樣本數據500個,每個樣本點包含33個變量,分別為22個連續變量XMEAS(1)~XMEAS(22)和前11個控制變量XMV(1)~XMV(11),變量的具體含義參見文獻[14]。首先對數據進行標準化處理,使用ForeCA算法對數據進行處理,之后對測試數據進行檢測,測試數據集包含960個樣本點,每個樣本點包含33個變量。前160個樣本點為正常數據,后800個樣本點為故障數據。
將ForeCA法和傳統PCA法進行對比,在PCA法中,選取T2統計量與SPE統計量,表1列出了8個故障的檢測準確率。

表1 ForeCA和PCA方法故障檢測準確率比較 %
從表1中可以看出,L2統計量的檢測準確率要高于T2統計量,ForeCA算法的SPE統計量和PCA算法的SPE統計量相比各有優勢。圖2給出了IDV(10)和IDV(20)的故障檢測準確率對比圖。仿真實驗表明了ForeCA方法在故障檢測中的可行性與有效性。

a. IDV(10) b. IDV(20)
選取IDV(10)作為典型故障進行詳細分析。IDV(10)的發生是由于TE過程中供料C的溫度產生了隨機變化。當系統某時刻出現此變化后,控制回路會補償這個變化,進而導致過程的總體特征產生變化。圖3顯示的是一個可預測元提取的IDV(10)特征,虛線表示前160個正常數據的均值,點劃線為后800個故障數據的均值,兩者的均值幾乎相同,但是故障數據的方差產生了非常大的變化,這說明提取的特征很好地抓住了過程變化的總體方差特征,同時顯示出一定的周期性,因此可對過程下一次的狀態做出合理預測,這兩點都為ForeCA用于故障檢測提供了保證。圖3提取的IDV(10)特征也正好符合L2與SPE統計量所顯示的IDV(10)檢測圖的兩個波峰的特點。

圖3 可預測元提取的IDV(10)特征
仍然以IDV(10)為例。假設在檢測出系統發生故障后,使用貢獻圖法確定故障變量(圖4),圖中變量18的貢獻值最大,由此可以推斷故障很可能是變量18異常導致的,即解吸塔溫度異常。綜合考慮TE過程的所有故障,只有IDV(10)能直接導致解吸塔溫度發生變化,因此在很大程度上可以認為系統發生了IDV(10)。


圖4 IDV(10)發生時貢獻圖法的診斷結果
針對傳統PCA算法具有的需要數據服從高斯分布且丟失過程動態特性的缺點,將ForeCA應用于過程監控領域,選取可預測主元,構造新的統計量,建立了完整的基于ForeCA的故障診斷方法。ForeCA方法可以從觀測數據中提取過程的動態特性,預測過程以后的運行變化趨勢,這在一定程度上提高了建模精度,因而具有較好的故障檢測能力。最后在TE過程上的仿真結果表明了ForeCA方法的可行性和有效性。在后續工作中,可以通過改進監控統計量和ForeCA算法來進一步提高故障檢測能力。
[1] 李晗,蕭德云.基于數據驅動的故障診斷方法綜述[J].控制與決策,2011,26(1):1~9.
[2] Kimura D,Nii M,Yamaguchi T,et al.Fuzzy Nonlinear Regression Analysis Using Fuzzified Neural Networks for Fault Diagnosis of Chemical Plants[J]. JACIII, 2011, 15(3): 336~344.
[3] Kano M, Nakagawa Y. Data-based Process Monitoring, Process Control, and Quality Improvement: Recent Developments and Applications in Steel Industry[J]. Computers & Chemical Engineering, 2008, 32(1): 12~24.
[4] 陳玉東,施頌椒.動態系統的故障診斷方法綜述[J].化工自動化及儀表, 2001, 28(3): 1~14.
[5] Zhang Y,Zhang Y.Fault Detection of Non-Gaussian Processes Based on Modified Independent Component Analysis[J]. Chemical Engineering Science, 2010, 65(16): 4630~4639.
[6] Wise B M, Ricker N L, Veltkamp D F, et al. A Theoretical Basis for the Use of Principal Component Models for Monitoring Multivariate Processes[J]. Process Control and Quality,1990,1(1): 41~51.
[7] Lee J M, Yoo C K, Choi S W, et al. Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004, 59(1): 223~234.
[8] Goerg G.Forecastable Component Analysis[C].Proceedings of the 30th International Conference on Machine Learning. Atlanta,GA,USA:ICML,2013: 64~72.
[9] Nuttall A H,Carter G C.Spectral Estimation Using Combined Time and Lag Weighting[J].Proceedings of the IEEE,1982, 70(9): 1115~1125.
[10] Dempster A P, Laird N M, Rubin D B. Maximum Likelihood from Incomplete Data via the EM Algorithm[J].Journal of the Royal Statistical Society, 1977, 39(1): 1~38.
[11] Botev Z I, Grotowski J F, Kroese D P. Kernel Density Estimation via Diffusion[J]. The Annals of Statistics, 2010, 38(5): 2916~2957.
[12] Wand M P, Jones M C. Kernel Smoothing[M]. Boca Raton: Crc Press,1994.
[13] Yoon S, MacGregor J F. Fault Diagnosis with Multivariate Statistical Models Part I: Using Steady State Fault Signatures[J]. Journal of Process Control, 2001, 11(4): 387~400.
[14] Downs J J, Vogel E F. A Plant-wide Industrial Process Control Problem[J]. Computers & Chemical Engineering, 1993, 17(3): 245~255.