基于改進核慢特征分析的間歇過程故障檢測

2020-03-04 08:56:54張漢元張漢營梁澤宇

山東建筑大學學報 2020年1期

張漢元張漢營梁澤宇

(1.山東建筑大學信息與電氣工程學院，山東濟南250101；2.山東建筑大學熱能工程學院，山東濟南250101)

0 引言

近年來，工業生產更加倚重能夠生產小批量、高附加值產品的間歇過程。高效可靠的故障檢測對保證間歇過程的生產安全起著至關重要的作用。基于在間歇過程中采集和存儲的大量過程數據，以多路主元分析 MPCA (Multiway Principal Component Analysis)為典型代表的基于數據驅動的監控方法得到了廣泛的研究和應用[1]。由于間歇過程具有非線性特征，劉世成等[2]在提出的多向核主元分析中利用非線性核函數提取過程數據的非線性信息。為了在監控時利用間歇過程的高階統計量信息，謝曉慶等[3]提出基于核獨立元分析的方法應對過程數據的非高斯特征。由于設備溫度漂移和營養物質減少等操作條件的變化，間歇過程在一個生產批次中動態地從一個操作狀態變化到另一個操作狀態。針對間歇過程的動態特性，翟坤等[4]利用先前的觀測數據對當前的觀測數據進行維度擴展，提出了一種改進的動態核主元分析算法監測間歇過程的故障。考慮主元得分向量的動態特性，齊詠生[5]在提出的改進的MPCA 方法中釆用隨時間變化的主元協方差計算HotellingT2統計量。為了提高動態間歇過程中微弱故障的檢測率，Wang 等[6]討論了多模型單一動態核主元分析 KPCA ( Kernel Principal Component Analysis)方法處理間歇過程的時變動態特性和多階段特性。然而，這些基于動態PCA 和動態偏最小二乘PLS(Partial Least Squares)的監控方法不能從測量數據中提取導致間歇過程動態時變的潛在驅動力，從而不能充分提取間歇過程的時變動態特性[7]。

慢特征分析SFA(Slow Feature Analysis)作為一種不變量特征學習新方法，能夠從變化較快的時間序列中提取出變化緩慢的特征信息作為時變信號的不變特征[8]。為了實現自適應監控復雜動態工業過程，Shang 等[7]研究了一種基于遞歸SFA 的故障檢測策略，通過不斷更新SFA 模型改善對過程的監控效果。針對過程數據的動態特性和噪聲干擾問題，蔣昕祎等[9]提出了一種基于SFA 與數據重構的軟測量建模方法。考慮到間歇過程的時變動態特性，Zhang 等[10]討論了一種新的基于SFA 的方法，可以同時監控正常操作條件變化導致的偏移和真實故障引起的動態特性異常。 SFA 具有從動態時變的輸入數據中提取出變化緩慢的慢特征信息的能力，能夠表征導致過程動態時變的潛在驅動力。因此，基于SFA 的監控方法相比傳統的動態監控方法，在提取間歇過程的時變動態特性上具有更大的優勢。

針對間歇過程的非線性和時變動態特性，文章將核慢特征分析 KSFA ( Kernel Slow Feature Analysis)應用于監控間歇過程，并將全局保持結構分析的思想融入到KSFA 中，提出了一種基于改進核慢特征分析IKSFA(Improved Kernel Slow Feature Analysis)的故障檢測算法，能夠更加充分地提取間歇過程的動態時變特征，改善間歇過程的故障檢測性能。以青霉素發酵過程為仿真對象驗證了所提出的間歇過程故障檢測方法的有效性。

1 基于核慢特征分析的間歇過程故障檢測算法介紹

不同于連續過程統計建模方法，間歇過程用于建模的訓練數據通常是一個三維的數據矩陣X(I × J ×K) ，其中I為訓練集中的批次數；J為一個批次中的過程變量數；K為一個批次中總的采樣點數。因此，KSFA 方法不能直接應用于間歇過程的統計建模，需要采用兩步多路數據展開技術，將三維訓練數據展開成一個兩維的數據矩陣。第一步是按批次方向展開，將三維矩陣X(I×J×K)展開成二維矩陣X(I×KJ)，在每個采樣時刻上沿著每個變量對二維矩陣X(I ×KJ) 進行零均值和單位方差歸一化處理。第二步是按變量方向的重新排列，將數據矩陣X(I × KJ) 重新排列成一個新的按變量方向展開的二維矩陣X(IK ×J) 。兩步多路數據展開過程如圖1 所示。

圖1 兩步多路數據展開過程示意圖

在圖1 中，數據矩陣X(IK × J) 由一系列的時間切片矩陣Xk(I ×J)，k ＝1，2，…，K組成，破壞了矩陣X(IK × J) 中的時間序列結構信息。在KSFA 建模時，需要構造偽時間序列以提供時間序列結構信息。在離散數據中，通常根據數據點的近鄰信息產生偽時間序列[11-12]。用xk(i) 表示時間切片矩陣Xk(I × J) 中的第i個樣本點，用xj k(i)，k ＝1，2，…，

K；j ＝1，2，…；l表示在對應的時間切片矩陣Xk(I ×J) 中xk(i) 的l個近鄰點。其中，相對于樣本點xk(i) 的偽時間序列由式(1)表示為

更進一步，時間切片矩陣Xk(I ×J) 的偽時間序列矩陣構造由式(2)表示為

以此類推，矩陣X(IK × J) 就被擴展成一個偽時間序列矩陣T(2IKl × J) ，由式(3)表示為

對于1 ≤i≤IKl，將偽時間序列矩陣T中的第2i-1和2i個樣本點分別表示為τ(2i-1) 和τ(2i) 。因此，在樣本點τ(2i -1) 和τ(2i) 之間，可以認為存在時間變化。假定非線性映射函數φ(·) 將矩陣T和X變換成高維特征空間中的矩陣φ(X) 和φ(T) ，分別表示為Xφ和Tφ，KSFA 的最優化問題由式(4)表示為

式中:IKl ＝I × K × l；τφ(2i)＝φ(τ(2i)) ；τφ(2i -

1)＝φ(τ(2i -1)) ；xφ(i)＝φ(x(i)) 。

由于向量wj是φ(x(i)) 的線性組合，存在常數向量αj，使向量wj進一步由式(5)表示為

式中:αij為向量αj的第i個元素。

將式(5)帶入式(4)中，JKSFA可由式(6)表示為

式中:核向量k2i ＝Xφ τφ(2i) 、k2i-1＝Xφ τφ(2i -1) ，并且核矩陣K ＝Xφ XTφ。

求解式(6)的最優化問題可以轉化為式(7)中的廣義特征值分解問題。

基于式(7)的求解，就能夠建立基于KSFA 的間歇過程統計監控模型。

2 基于改進核慢特征分析的間歇過程故障檢測算法介紹

將KSFA 應用于間歇過程的建模數據時，KSFA的最優化目標是最小化輸出信號的時間變化。由于間歇過程輸入數據的原始時間結構信息被破壞，可以根據最近鄰準則構造偽時間序列矩陣T(2IKl ×J) ，為矩陣X(IK×J) 提供偽時間結構信息。因此，KSFA 等價于一種局部近鄰數據關系保持算法，而忽略了過程的全局數據結構信息。針對KSFA 的不足，通過將全局結構分析融入到KSFA 方法中，提出一種改進的KSFA 方法——IKSFA，檢測間歇過程的故障。

給出正常操作數據集Xφ ＝ φ(X)＝[xφ(1)，xφ(2)，…，xφ(IK)]T，全局結構分析的目標是尋找一個投影向量wj，即最大化投影空間中的所有樣本點yj(i)＝wTj xφ(i) 與其均值之間歐式距離的平方的均值[13]。全局結構分析的目標函數由式(8)表示為

考慮到投影向量wj能夠改寫成訓練樣本的線性組合全局結構分析的目標函數可以進一步改寫，由式(10)表示為

為了對過程數據降維的同時保持數據的全局和局部結構信息，將KSFA 的最優化目標JKSFA和全局保存的最優化目標JGlobal融合到一起，構造IKSFA的目標函數，由式(11)表示為

式中:β為松弛因子，0＜β ＜1 是平衡全局最優化和KSFA 局部最優化之間關系的參數。

為了保證獲得合理的解，附加上下面的約束條件，由式(12)表示為

由于目標函數JKSFA和JGlobal具有不同的尺度，在式(11)中應該對JKSFA和JGlobal進行歸一化處理，以保證KSFA 局部最優化和全局保持最優化在相同的尺度下予以考慮。歸一化后的J＾IKSFA最優化目標由式(13)表示為

求解式(13)中的最優化問題等價于執行式(14)中的廣義特征值分解問題

選擇能夠提供超過95%累積緩慢貢獻率的慢特征的數目作為p的值。

在監控測試向量xte時，基于從IKSFA 模型提取出的慢特征信息建立T2和SPE監控統計量。具體來說，T2監控統計量測量過程數據主要的緩慢變化趨勢，由式(16)表示為

式中:kte＝φ(X)φ(xte) 是測試向量xte的核向量。

相反，建立SPE統計量來測量過程數據中的短時波動，由式(17)表示為

獲得T2和SPE監控統計量后，需要計算其各自的控制限以監控過程的運行狀態。采用核密度估計方法確定T2和SPE統計量的控制限。

3 基于改進核慢特征分析的仿真研究分析

為了驗證所提出算法的故障檢測性能，在青霉素發酵過程中進行仿真實驗。將所提出IKSFA 方法的故障檢測性能與多路核主元分析MKPCA(Multiway Kernel Principal Component Analysis)[1-2]、多路核獨立元分析 MKICA ( Multiway Kernel Independent Component Analysis)[3]和KSFA[7，10]方法的故障檢測性能進行比較。青霉素發酵過程是一個廣泛用來評價間歇過程故障檢測方法的基準仿真過程[6，14]，包括兩個操作階段:預培養階段和分批補料階段。在初始的預培養階段，大量細胞所必須的營養物質開始產生，青霉素細胞在細胞指數增長期出現。在分批補料階段，為了維持較高的青霉素產量，需要連續不斷地給發酵過程供給葡萄糖。為了給青霉素的生產提供最好的條件，對發酵罐的溫度和pH 值采用閉環控制。

在仿真實驗中，采用仿真器Pensim V 2.0 產生青霉素發酵過程的仿真數據[14-15]。選擇了10 個過程變量作為監控變量，并在變量采樣過程中添加高斯噪聲。采集正常工況下的40個批次數據組成訓練數據集，每個批次的長度均為400 h。青霉素發酵過程的正常操作條件在一定的允許范圍內波動，具體的波動范圍參見文獻[6]和[14]。此外，還仿真產生了6 個批次的故障數據，每個批次的長度也是400 h，有關仿真中所添加故障模式的詳細信息見表1。

表1 青霉素發酵過程的6 種故障模式表

在IKSFA 建模時，選用高斯核作為核函數。采用網格搜索算法確定IKSFA 中核參數c和松弛因子β，分別取值為500 和0.8。具體而言，c的搜索范圍為[1，100，200，…，900，1 000] ，β的搜索范圍為[0.1，0.2，0.3，…，0.8，0.9] ，根據正常工況數據最優的故障檢測結果分別選取c和β的最優取值。近鄰樣本點數目l根據經驗選擇為6，根據95%的累積緩慢貢獻率確定需要保留的慢特征數目p。為了公平比較，在MKPCA、MKICA 和KSFA 方法中使用高斯核作為核函數，并且核參數c同樣設置為500。在KSFA 中，近鄰點數目l同樣設定為6。在MKPCA、MKICA 和KSFA 方法中，根據95%的累計信息貢獻率選擇所要保留的主元或獨立元的數目。對于4 種監控方法，將正常工況數據99%的置信限設置為每個監控統計量的故障檢測閾值。故障檢測率定義為超出檢測閾值的故障樣本數與總的實際樣本數的百分比。為了降低故障誤報率，僅當連續的5 個樣本超出99%的置信限時，才認為檢測到故障發生。故障檢測時刻定義為5 個連續超限樣本中的第1 個樣本的采樣時刻。

MKPCA、MKICA、KSFA 和IKSFA 方法對故障F3 的監控結果如圖2 所示。在圖2(a)、(b)中，MKPCA 的T2和SPE統計量分別在第122、130 個采樣時刻檢測到故障發生。在圖2(d)中，MKICA 的SPE統計量相比于MKPCA 的SPE統計量獲得了更好的故障檢測效果， MKICA 的SPE統計量在第116個采樣時刻指示有故障出現。由圖2(e)、(f)可以看出，KSFA 的T2統計量在第118 個時刻檢測出故障，SPE統計量在第138 個時刻對故障進行報警。與圖2(a)～(f)中的故障檢測結果相比，圖2(g)、(h)中的IKSFA 方法獲得了最好的故障檢測效果。IKSFA 的T2和SPE統計量均在第102 個時刻超出各自的控制限，故障檢測時間在4 種方法中是最早的。

4 種方法對故障F6 的監控結果如圖3 所示。由圖3(g)、(h)可以看出，IKSFA 獲得了最好的故障檢測效果，IKSFA 的T2統計量在第112 個時刻檢測到故障，SPE統計量在第108 個采樣時刻檢測到故障。在圖3(a)、(b)中，MKPCA 的故障檢測效果最差，T2和SPE統計量分別在第164、146 個時刻對故障進行報警。圖3(c)、(d)顯示MKICA 的I2統計量的故障檢測時間是第126 個采樣時刻，SPE統計量的故障檢測時間是第124 個采樣時刻。由圖3(e)、(f)可以看出，KSFA 的T2和SPE統計量分別在第122、124 個采樣時刻指示出有故障發生。對故障F6 的監控結果顯示基于IKSFA 的故障檢測方法能夠比其他3 種方法更為快速地檢測出故障F6 的發生。

4 種故障檢測方法對6 類故障模式的故障檢測時間和故障檢測率分別見表2、3。由表2 可以看出，4 種方法對階躍故障F1 和F2 的檢測效果不存在延遲。盡管4 種方法均不能在階躍故障F3 剛添加時就立即給出故障報警，但是IKSFA 的故障檢測延遲時間最短，僅為2 h。相比具有階躍變化的故障，斜坡故障F4、F5 和F6 由于緩慢變化的過程，參數檢測起來更加困難。對于斜坡故障的檢測問題，IKSFA 取得了最快的故障檢測效果。由表3 可以看出，4 種方法對于階躍變化的故障F1 和F2 都能獲得100%的故障檢測率。對于檢測起來比較困難的故障F3、F4、F5 和F6，IKSFA 在這4 種方法中獲得了最高的故障檢測率。總而言之，結果證實了基于IKSFA 的方法與基于MKPCA、MKICA 和KSFA 的方法相比，具有更加優越的故障檢測性能。

圖2 4 種故障檢測方法對青霉素發酵過程故障F3 的監控圖

圖3 4 種故障檢測方法對青霉素發酵過程故障F6 的監控圖

表2 4 種故障檢測方法的故障檢測時間(采樣時刻)比較表/h

表3 4 種故障檢測方法的故障檢測率比較表/%

4 結論

通過上述研究，可以得到以下結論:

(1) 與MKPCA、MKICA 和KSFA 監控方法相比，IKSFA 監控方法對間歇過程的6 種故障具有最快的故障檢測時刻。 IKSFA 方法對故障F1 和F2 在第100 個采樣時刻就檢測到故障，對故障F3、F4、F5和F6 的最快檢測時刻分別為第102、108、112 和108 個采樣時刻。

(2) 與MKPCA、MKICA 和KSFA 監控方法相比，IKSFA 監控方法對間歇過程的6 種故障具有最高的故障檢測率。 IKSFA 方法對故障F1 和F2 的故障檢測率均為100%，對故障F3、F4、F5 和F6 的最高故障檢測率分別為99%、96.67%、96.62%和97.97%。

(3) 仿真結果表明，在IKSFA 方法中構造的確定保留慢特征數目的準則是行之有效的。