王 毓 楊煜普 屈衛東
(上海交通大學電子信息與電氣工程學院自動化系,上海 200240)
隨著工業過程控制系統不斷朝著大規模、智能化和復雜化的方向發展,安全問題日益成為大家關心的主要問題之一。在過去的幾十年中,故障診斷方法的研究得到了國內外學者的廣泛關注。這些方法從整體上可以分為定性方法和定量分析兩大類[1]。其中,在定量分析方法中,基于多元統計的方法是近年來關注較多的方法。傳統的基于貢獻圖的統計方法是最受歡迎的方法之一,那些具有較大貢獻值的變量被認為是引起故障的變量。Kourti T和MacGregor J F將貢獻圖法應用到高壓低密度的聚乙烯反應過程中[2],他們認為貢獻圖可能不能確定導致故障的原因變量。Westerhuis J A等引入了貢獻圖的置信限來增強鑒別偏離正常運行條件的原因變量的能力[3]。他們認為在應用貢獻圖法時必須謹慎小心,因為PCA的殘差能將某個變量的貢獻值轉移到其他變量的貢獻值上。最近,Alcala C F和Qin S J提出了基于重構的貢獻圖方法(RBC)[4],該方法保證了故障變量有最大的貢獻值,從而比傳統的貢獻圖法要有更精確的鑒別能力。但是,RBC仍沒有解決貢獻值從一個變量轉移到其他變量的問題?;谪暙I圖的多元統計方法的主要缺點是沒有考慮到故障在系統中的傳播,導致故障變量定位錯誤而不能檢測出引起故障的根本原因。筆者將SDG和數據重構相結合,在故障發生時在SDG所有有效節點和相容路徑方向上對測試樣本進行重構,其中重構指標最大的方向被認為是實際故障的傳播方向,而傳播方向上的起始節點被認為是引起故障的根本原因變量。
筆者討論的故障診斷與隔離方法利用正常的過程模型,通過PCA將樣本向量分解為兩個部分:

(1)

(2)


(3)
且dim(Sr)=m-k。

為了在所有可能的故障中檢測出故障Ψi,必須在所有可能的故障方向ζj上來進行重構,重構方法是:對于每個假設的故障Ψj,測量的樣本向量x在方向ζj上移動,直到它離主元空間Sp的距離最短。圖1顯示了通過重構進行故障辨識的幾何解釋。在圖中,假設故障Ψj發生了,通過將x沿著ζj方向移動得到xj。即:xj=x-fjζj。其中fj是對f的估計,表示沿著方向ζj朝主元超平面移動的位移大小。xj表示沿方向ζj重構后的樣本向量。如果假設的故障Ψj就是實際發生的故障Ψi,那么重構后的樣本向量xj應該最接近x*。

圖1 重構方法的幾何解釋

于是,故障隔離的問題就轉化為以下求極值的問題:
(4)

(5)

(6)
式(6)是使得重構后樣本向量的SPE最大程度減小的充要條件。因此:
(7)
(8)
它描述的是數據樣本沿ζj方向重構后樣本SPE的下降的程度,其取值范圍為[0,1],取值越大,表示Ψj越有可能是真實的故障Ψi。
以上分析是基于故障Ψi是由于某個變量引起的這個前提下進行的,而實際情況并沒有如此簡單。通常情況下,故障會隨著系統部件進行傳播,往往其統計值變化最明顯的變量只是故障導致的結果,而非引起故障的原因。按照文獻[5]的觀點,必須在所有可能的方向上對xj其進行重構,但如果單純地搜索所有可能的方向,搜索空間將隨著變量的增加呈指數增長,當變量過多時,搜索空間由于過大導致故障診斷很難進行下去。因此,必須充分利用系統的結構特性,有目的地對故障數據進行重構。筆者將利用符號有向圖來對故障可能的傳播方向進行確定,從而避免搜索空間爆炸的問題。
筆者采用的數據重構標準是使重構后的樣本點離主元距離最小,即使重構后的樣本SPE最小,因此,檢測故障時采用SPE統計量和相應的控制線[4]。
CUSUM是檢測微小變化的有效工具,尤其對于監控變化量為0.5~2.0個標準差的樣本效果較好。為了避免設定每個變量上、下限這些繁冗的工作,筆者采用CUSUM監控量和V-mask方法來確定有效節點。V-mask的主要參數為:
(9)
(10)
h=d·k
(11)
式中d——最近的采樣點離V定點的距離;
h——最近的采樣點離V的上下臂的距離;
k——V的斜率;
α——誤報率;
β——漏報率;
δ——能檢測到的偏移量(樣本標準差的倍數);
σx——樣本的標準差。
整個故障診斷的步驟為:首先通過采集正常數據進行離線訓練,即通過PCA對預處理后的數據進行分解,進而求出SPE的控制線。根據系統流圖,建立SDG模型,在設定漏報率、誤報率、檢測偏移量后確定各變量V-mask的參數。然后實時采集系統未知狀態的工作數據,對各變量的CUSUM和樣本SPE進行監控,如果SPE超過了控制線,表示系統發生了故障,之后通過CUSUM統計量確定有效節點,通過搜索所有可能的相容路徑,在所有有效節點和相容路徑方向上對測試數據進行重構,其指標η2最大的方向,便是真實的故障傳播方向,該方向上的起始節點被認為是故障的原因變量,而導致該節點異常的事件被認為是產生故障的根本原因。
TE實驗平臺是Downs J J和Vogel E F根據Eastman化學公司的世界工藝流程作了少許修改后于1993年提出的[6],以下以故障IDV(1)為例加以分析。
首先通過PCA對預處理后的正常樣本數據進行分解,正常數據包括480個樣本點,每個樣本點是52維的向量。這里主元個數按照特征值累計貢獻率來選取,一般要求90%以上,但也不能太大,選擇太大將使檢測過程容易受噪聲影響,筆者按96%選取。為了確定各變量V-mask參數,設定誤報率為0.3%,漏報率為1%,檢測偏移量為各變量標準差的0.5倍。然后對測試數據進行檢測。這里,測試數據為960個樣本點,每個樣本點是52維的向量,其中,故障IDV(1)從第161個樣本點開始引入。通過對各變量的CUSUM和樣本SPE進行監控,確定故障發生與否,同時通過對有效節點的確定,找出使η2最大的相容路徑。
需要注意的是,由于通過V-mask確定CUSUM是否超過控制線具有延時性,筆者設定為10個采樣周期。
圖2顯示了SPE隨樣本序列的變化,其中虛線為控制線,超過控制線表示故障發生。從圖中可以看出,故障在第160個樣本附近被檢測到。仿真實驗在163個樣本點檢測到故障發生,故障發生時,有向圖中的有效節點及其含義見表1,系統有向圖和節點含義見參考文獻[7]。

圖2 SPE隨樣本序列的變化

序號節點節點含義1MV1D進料閥門(流2)2MV2E進料閥門(流3)3MV3A進料閥門(流1)4MV5壓縮機閥門5MV6排空物料閥門(流9)6MV10反應器冷卻水控制閥門7P7反應器壓力8P13氣液分離器壓力9P16解吸塔壓力10T21反應器冷卻水出口溫度11XA反應器給料組分A(流6)12XC反應器給料組分C(流6)
為了在所有可能的方向上對樣本進行重構,對所有有效節點從1~12進行編號(表1)。考慮到故障的傳播,需在有向圖的相容路徑方向上進行重構,搜索得到的3條相容路徑為:XA↓?MV3↑、MV10↓?T21↑、XC↑?P7↑?P13↑?P16↑,分別編號為13、14、15。
圖3所示為測試樣本在所有15個方向上重構后的故障指標,從圖中可以看出,編號為15的相容路徑指標最大,可以判斷出該相容路徑為故障傳播路徑,即反應器給料組分C的增加,導致反應器壓力、氣液分離器壓力和解析塔的壓力增加。所有故障中只有故障1含有組分C的變化,由此可以推斷該故障為故障1。作為對比,圖4顯示了傳統貢獻圖法各變量的貢獻值,其中反應器溫度貢獻值最大,此時不能推斷是故障1還是其他故障導致反應器溫度增加。由此可以看出,通過SDG和數據重構的方法對檢測故障發生的根本原因更加有效。

圖3 所有重構方向的隔離指標

圖4 故障1發生時所有變量的貢獻
介紹了一種基于SDG和數據重構的故障診斷方法。該方法先用PCA模型的SPE指標檢測出異常的發生,然后通過各變量的CUSUM對SDG的有效節點進行確定,當SPE超過控制線時,通過在所有有效節點和相容路徑方向上對測量樣本進行重構,重構后SPE下降最多或故障隔離指標最大時,表示該方向為故障的傳播方向。通過在TEP模型上的仿真表明,該方法比傳統貢獻圖法對檢測故障的根本原因更加有效。