潘怡君,楊春節,孫優賢,周哲,安汝嶠
?
基于主成分追蹤方法的過程監測
潘怡君,楊春節,孫優賢,周哲,安汝嶠
(浙江大學控制科學與工程學院,浙江杭州,310027)
為了將主成分追蹤(PCP)的方法應用在工業系統過程監測中,提出一種基于均值方差的過程監測統計量。首先將標準化后的訓練以及測試數據矩陣進行PCP分解,然后分別計算分解得到的稀疏矩陣中每個變量的均值和方差,并進行比較,最后將它應用在數值仿真和TE過程中。研究結果表明:這種統計量能夠消除大部分噪聲的影響。使用這種統計量能夠同時完成模型建立、故障檢測、故障識別以及過程重構這4個過程監測的步驟,具有較好的適用性。
過程監測;主成分追蹤;TE過程;均值方差
工業過程生產是國家經濟發展的支柱產業,因此保證生產過程的高效性和穩定性十分重要。工業過程監測方法分為3類:基于定量數學模型的方法、基于知識的方法以及基于數據驅動的方法[1?3]。相比于基于機理模型和基于知識的方法,目前應用較多的是基于數據驅動的過程監測方法。這類方法不需要構建精確的過程機理模型,也不需要豐富的專家經驗知識。它是以實際生產中采集到的大量數據為基礎,利用數據潛在的特性,進行過程監測[4]。目前應用較多的數據驅動方法有主元分析(PCA)、偏最小二乘(PLS)、支持向量機(SVM)、人工神經網絡(ANN)以及在它們基礎上面研究出來的改進方法[5]。近年來,一種基于主成分追蹤(PCP)的算法被提出。2011年,CANDES等[6?11]介紹了PCP算法的原理及求解方法。他們通過解決凸優化問題將數據矩陣分解成低秩矩陣和稀疏矩陣2個部分。其中低秩矩陣為沒有傳感器噪聲和過程故障的數據,稀疏矩陣中的數據包含傳感器噪聲以及過程故障。目前,主成分追蹤的方法大多應用在視頻監控領域,BOUWMANS等[12]對PCP在視頻監控領域的應用情況進行了綜述。ISOM等[13]將PCP的算法應用在過程監測中,提出PCP方法能夠同時完成模型建立、故障檢測、故障分離和過程重構,然后從上面4個方面計算了PCA和PCP的關系,并利用這種關系應用PCP進行過程監測。CHENG等[14]驗證了PCP方法相比于PCA,對過程中出現的異常值不敏感的特性,以及在進行PCP運算前對數據進行歸一化處理的必要性,最終通過觀察故障數據的稀疏矩陣中的元素幅值變化來進行過程監測。PCA將數據分為主元空間數據和殘差空間數據,而PCP將數據分為低秩矩陣數據和稀疏矩陣數據。雖然二者相似,但是不能直接完全地把PCA的統計量應用在PCP中。這是因為PCA方法的本質在于降維[15],而PCP是進行矩陣分解,保持矩陣維數不變。同時,由于噪聲出現的隨機性,若觀察單個采樣時間的變量數值,可能會導致比較高的誤報率。因此,本文作者提出了一種基于均值方差統計指標的過程監測統計量。利用均值和方差是因為均值和方差均為表現過程統計信息的變量。方差利用數據的偏離程度能在均值的基礎上進一步表現數據統計特性。它是通過計算訓練集和測試集的稀疏矩陣中變量的均值方差得到的過程監測統計量,利用一段時間的統計指標來進行過程監測,可以在一定程度上避免單個時刻噪聲的干擾。本文首先說明了低秩矩陣中不應該包含傳感器噪聲以及過程故障。其次說明利用新的統計量能夠同時實現過程監測的4個步驟。并且可以實現多個故障分離識別。而且由于訓練集稀疏矩陣中包含的是傳感器噪聲,而測試集稀疏矩陣中包含傳感器噪聲和過程故障,二者相差的為過程故障,構建這樣的統計量還避免了應用其他數據驅動方法構建統計量時,有噪聲干擾的問題,可以提高過程監測的精確度。最后分別在數值仿真和TE模型上面進行了仿真,驗證了統計量的可用性。

式中:為低秩矩陣,為去除傳感器噪聲和過程故障的數據矩陣;為稀疏矩陣,僅僅包含傳感器噪聲以及過程故障的數據矩陣,因此指的是變量在第個樣本點時,不存在傳感器噪聲以及過程故障。PCP的本質是解決如式(2)所示的凸優化函數,在本文中利用奇異值閾值的方法來解決這個矩陣分解的凸優化函數[16]。
(2)

過程監測一般分為4個步驟,分別是模型建立、故障檢測、故障分離以及過程重構。目前在過程監測研究中,大部分使用數據驅動的方法,但是PCA,PLS,ANN和SVM以及在它們基礎上改進的方法都不能同時完成過程監測的4個步驟[17]。而PCP與它們相比,最重要的優點就是可以同時實現模型建立、故障檢測、故障分離以及過程重構[13]。雖然在應用中,PCP暫時不能像PCA和PLS那樣進行在線實時監測,但是它可以同時實現過程監測的4個步驟。因此,它的這種優點能夠降低計算的復雜度,降低成本,更簡潔地同時實現發現故障,識別故障引起的原因,恢復正常工況這些過程監測步驟。根據PCP的原理,可以得知數據矩陣被分解為2部分,分別是不包含傳感器噪聲和過程故障的低秩矩陣以及包含傳感器噪聲和過程故障的稀疏矩陣。
在實際的工業生產中,各個變量是具有相關性的。因此只有在傳感器測量過程中沒有噪聲干擾時,才能得到變量具有相關性的數據,也就是低秩矩陣。例如給定1個矩陣,的秩為1,此時對第1個采樣點的第1個變量加入傳感器噪聲,得到的新數據矩陣,此時的秩為2。由于噪聲和故障具有隨機性,出現的時間和變量均是不可控的,同時考慮前面提及的二維數據在某個時刻對某個變量引入噪聲會改變變量之間的相關性,因此,推廣到多變量過程中,噪聲和故障的出現也一定會改變矩陣中列之間的相關性。這也說明PCP算法分解得到的低秩矩陣中不應該包含傳感器噪聲,因為包含傳感器噪聲和過程故障的數據不可能是低秩的。相對而言,稀疏矩陣中包含的就是傳感器噪聲以及過程故障,所以,利用稀疏矩陣來進行過程監測是可行的。在使用數據驅動方法進行過程監測時,需要使用2類數據集,分別是訓練數據集以及測試數據集。考慮到PCP的原理,對訓練數據集進行矩陣分解時,得到的稀疏矩陣1中應該只包含傳感器噪聲,而在對測試數據進行矩陣分解時得到的稀疏矩陣2不僅包含傳感器噪聲,還包含過程故障。因此,當稀疏矩陣2的數據分布情況和稀疏矩陣1情況不同時,即2的相關統計量超出了1的統計線,就完成了監測故障或異常狀況的工作。雖然均值和方差反映的是一段時間之內數值的平均水平,但是故障的發生不會在某一個很短的時間段就消失,若這個時間段的均值出現了異常,不符合正常工況下的標準,則可以利用均值方差這些基本數據統計量對過程進行故障檢測判斷。使用這種統計量不僅能實現同時完成過程監測的4個步驟,而且計算簡單,同時,在理論上能夠基本消除過程中傳感器噪聲的 影響。
2.1 模型建立
在實際工業生產過程中,不同變量的數據幅值可能存在很大的不同,甚至有的會相差好幾個數量級。因此,若在建立模型前沒有進行歸一化處理,則會對最后的結果產生很大的影響。雖然從表面上來看,對于PCP來說,不論是矩陣的秩還是矩陣的稀疏性,和歸一化都沒有關系,不會因為矩陣的歸一化而改變它們的值。但是CHENG等[14]證明了在應用PCP方法之前對數據進行歸一化的必要性。
因此,在模型建立之前,首先對訓練集數據和測試集數據進行歸一化處理。在本文中,采用最常用的均值、方差歸一化方法。將歸一化處理之后的訓練數據矩陣和測試數據矩陣分別利用PCP方法進行矩陣分解,得到

式中1為訓練集的低秩矩陣;1為訓練集的稀疏矩陣;2為測試集的低秩矩陣;2為測試集的稀疏矩陣。
至此,模型建立完成[16]。
2.2 故障檢測
根據2.1節中建立的模型,首先計算矩陣1的統計量特性,均值和方差。在矩陣1中,計算每個變量一段時間內樣本點的均值和方差。理論上,在得到訓練集樣本的統計特性之后,將2中每個變量每個時刻的值與訓練集相應變量的均值相比較,若發現大于,則說明有故障發生。但是,由于噪聲的干擾,為了防止出現錯報,應考慮比較測試集樣本在一段采樣時間內的變量均值和方差。與訓練集相比較,觀察是否出現故障,進行故障檢測。時間段的選取根據研究對象來確定。
2.3 故障識別
在本文中,計算測試集樣本每個變量在一段時間內的均值和方差,與訓練集樣本得到的正常情況下的均值和方差比較,若變量的統計特性超出了正常閾值,則說明該變量導致了故障的發生,完成了故障識別。并且如果多個變量均超出正常閾值,還能夠實現多重故障識別。
2.4 過程重構
無論是模型建立、故障檢測還是故障識別,目的都是為了及早發現故障,并快速改正以消除故障,因此,過程監測的前3個步驟均是為過程重構做準備。過程重構就是根據已受故障影響的過程變量測量值估計出名義上的正常測量值*。在本文中,過程重構出的矩陣就是測試集樣本D通過PCP算法分解得到的低秩矩陣2。
從前面可以得知:利用新提出的統計量能夠同時完成模型建立、故障檢測、故障識別以及過程重構這4個過程監測的步驟。下面利用數值仿真例子和實際的工業生產模擬實例TE過程來驗證一下這種統計量的有效性。
在仿真驗證中,數值仿真的測試集有500個樣本,TE過程的測試集故障數據有800個樣本。采樣個數較少,因此,在故障檢測階段,每個變量均是對所有樣本時間計算均值方差。因為PCP算法的局限性,在本文中采取計算每個變量所有樣本點的均值方差,并且由于導致故障出現的變量具有不確定性。因此,本文中利用這個統計量進行故障檢測只能判斷是否出現故障,不能計算誤檢率和漏報率。
3.1 數值仿真
為了驗證經過PCP算法分解得到的稀疏矩陣包含過程故障以及本文提出的統計量的可用性,首先在數值仿真例子上進行研究證明。在數值仿真例子中,由于數值矩陣里面的元素存在負數,所以稀疏矩陣中也可能存在負數。因此,在求解均值時,可能會出現相互抵消的情況,與實際情況不同,可能會降低故障幅值,會導致漏報。因此,在數值仿真例子中,均先對稀疏矩陣進行絕對值運算,再進行統計量均值和方差的求解。
ALCALA等[18]構建了一個數值仿真模型來驗證統計量的有效性。因此,在本文中也利用這個數值仿真模型。過程模型如下式所示。

式中:1,2和3分別為零均值,標準差為1.0,0.8和0.6的隨機變量;為零均值,標準差為0.2的正態分布噪聲。得到故障樣本的公式如下:
(6)
從得到的測試集稀疏矩陣2可以看出:在每個采樣時刻變量1的幅值明顯比其他變量的大,這說明對測試集利用PCP的方法進行矩陣分解得到的稀疏矩陣的確包含過程故障。同時,為了驗證這個結論,還進行了其他變量發生故障的實驗,均可以發現出現故障的變量在稀疏矩陣里面的幅值要比其他變量的大。圖1和圖2所示分別為對訓練集和測試集的稀疏矩陣的所有樣本點求取均值和方差相比較的仿真圖。從圖1和圖2可以得出:測試集發生故障的變量1的均值1=0.633 8,1=0.028 8,訓練集變量1的均值2= 0.096 7,2=0.019 6,1>2,1>2,因此,根據前面已經得到的稀疏矩陣特性,得出此時有故障發生。同時由于只有變量1的均值和方差,測試集比訓練集大,因此,可以知道是變量1導致了故障的發生。同時測試集分解得到的低秩矩陣為沒有過程故障的正常數據,完成了過程重構。通過分析圖1和圖2可知:利用PCP能很好地進行過程監測,并且利用均值和方差這2個統計量能夠進行故障檢測和故障識別,說明了這種新的統計量適合PCP算法的,并且能進行過程監測。

1—訓練集統計量;2—測試集統計量。

1—訓練集統計量;2—測試集統計量。
為了更好地說明稀疏矩陣包含過程故障,以及這種統計量的監測效果。將變量1,3和4均引入故障,監測效果如圖3和圖4所示。

1—訓練集統計量;2—測試集統計量。

1—訓練集統計量;2—測試集統計量。
3.2 TE過程仿真
TE過程是由伊斯曼化學品公司創建的,其目的是為評價過程控制和監控方法提供一個現實的工業過程。測試過程是基于一個真實工業過程的仿真,包含41個測量變量和12個控制變量。過程仿真包括21個預設定的故障,其中16個是已知的,5個是未知的,詳細介紹見文獻[19?20]。在本文中,最后一個控制變量在過程中基本不會發生變化。因此建立模型時采用41個測量變量以及11個控制變量,共52個變量[21]。TE過程收集訓練數據采樣周期為24 h,采樣間隔為3 min。測試數據的采樣周期為48 h,前8 h為正常數據,后面引入故障。因此,用來建模的數據訓練集維數為480×52,測試集維數為960×52,第161個數據點引入的故障。參數根據公式以及經驗選取。在本次實驗中,選擇,得到的實驗結果如圖5~8所示。圖5~8中所示的是在TE過程中比較有代表性的2個故障:故障1和故障5。

圖5 TE過程故障1發生時52個變量均值分布

圖6 TE過程故障1發生時52個變量的方差分布圖

圖7 TE過程故障5發生時52個變量的均值分布

圖8 TE過程故障5發生時52個變量的方差分布
從圖5~8可以看出:測試集后800個樣本均值或方差比訓練集統計量的大,而測試集前160個樣本均值或方差與訓練集統計量的相近或略小,因此,使用這種統計量能夠進行過程監測。當觀察到超出正常閾值的‘○’點時,可以識別出發生故障的變量,此時低秩矩陣為過程重構矩陣。但因為TE過程有52個變量,而且每個故障出現和不同的變量相關,在故障發生的時候也不一定是全部的變量都超出正常的閾值。因此,在本故障檢測中,若某個過程后800個樣本點變量的均值方差超過訓練集變量的均值方差的個數多于前160個正常樣本點變量的均值方差超過訓練集變量的均值方差的個數,均值和方差這2個統計量中任何一個超過閾值時則判斷發生故障。在TE過程中,利用均值方差統計量能夠實現過程監測的4個步驟,這種統計量是可行的。但是在實際的工業生產中,不會存在像TE過程前160個正常樣本點這樣的數據,所以為了判斷某個過程是否出現故障,可以利用前一段時間正常運行非訓練集中的數據來代替TE過程中的前160個正常樣本點。同樣還是比較正常數據超過閾值的變量數和測試數據超過閾值的變量數。
1) 利用PCP進行矩陣分解得到的低秩矩陣不包含噪聲和故障,它們被放在稀疏矩陣中。因此,PCP方法對過程監測是適用的。
2) 針對使用PCP方法的特點,提出了一種利用均值方差統計指標來構建的統計量。并且在數值仿真和TE過程上面進行仿真,效果良好。
3) 由于PCP算法是一個矩陣分解方法,所以,本文提出的均值和方差統計量方法不能實現在線實時監測,還需要改進統計量。
[1] 葛志強. 復雜工況過程統計監測方法研究[D]. 杭州: 浙江大學控制科學與工程學院, 2009: 5?12. GE Zhiqiang. Statistical process monitoring methods for complex processes[D]. Hangzhou: Zhejiang University. Department of Control Science and Engineering, 2009: 5?12.
[2] 周東華, 胡艷艷. 動態系統的故障診斷技術[J]. 自動化學報, 2009 (6): 748?758. ZHOU Donghua, HU Yanyan. Fault diagnosis techniques for dynamic systems[J]. Acta Automatica Sinica, 2009 (6): 748?758.
[3] QIN S J. Survey on data-driven industrial process monitoring and diagnosis[J]. Annual Reviews in Control, 2012, 36(2): 220?234.
[4] GE Zhiqiang, SONG Zhihuan, GAO Furong. Review of recent research on data-based process monitoring[J]. Industrial & Engineering Chemistry Research, 2013, 52(10): 3543?3562.
[5] WANG Youqing, FAN Jicong, YAO Yuan. Online monitoring of multivariate processes using higher-order cumulants analysis[J]. Industrial & Engineering Chemistry Research, 2014, 53(11): 4328?4338.
[6] CANDèS E J, LI X, MA Y. Robust principal component analysis[J]. Journal of the ACM (JACM), 2011, 58(3): 11.
[7] CHANDRASEKARAN V, SANGHAVI S, PARRILO P A, et al. Rank-sparsity incoherence for matrix decomposition[J]. SIAM Journal on Optimization, 2011, 21(2): 572?596.
[8] ZHOU Z, LI X, WRIGHT J, et al. Stable principal component pursuit[C]// 2010 IEEE International Symposium on Information Theory Proceedings (ISIT). Austin: IEEE, 2010: 1518?1522.
[9] XU H, CARAMANIS C, SANGHAVI S. Robust PCA via outlier pursuit[C]// Advances in Neural Information Processing Systems. Vancouver, 2010: 2496?2504.
[10] CANDèS E J, RECHT B. Exact matrix completion via convex optimization[J]. Foundations of Computational Mathematics, 2009, 9(6): 717?772.
[11] CHANDRASEKARAN V, SANGHAVI S, PARRILO P, et al. Sparse and low-rank matrix decompositions[C]// 47th Annual Allerton Conference on Communication, Control, and Computing. Monticello: IEEE, 2009: 962?967.
[12] BOUWMANS T, ZAHZAH E H. Robust PCA via principal component pursuit: a review for a comparative evaluation in video surveillance[J]. Computer Vision and Image Understanding, 2014, 122: 22?34.
[13] ISOM J D, LABARRE R E. Process fault detection, isolation, and reconstruction by principal component pursuit[C]// American Control Conference. San Francisco, USA: IEEE, 2011: 238?243.
[14] CHENG Yue, CHEN Tongwen. Application of principal component pursuit to process fault detection and diagnosis[C]// American Control Conference. Washington, USA: IEEE, 2013: 3535?3540.
[15] CHEN Dan, LI Zetao, HE Zhiqin. Research on fault detection of tennessee eastman process based on PCA[C]// 25th Control and Decision Conference (CCDC). Guiyang, 2013: 1078?1081.
[16] CAI J F, CANDèS E J, SHEN Z. A singular value thresholding algorithm for matrix completion[J]. SIAM Journal on Optimization, 2010, 20(4): 1956?1982.
[17] XIE Lei, LIN Xiaozhong, ZENG Jiusun. Shrinking principal component analysis for enhanced process monitoring and fault isolation[J]. Industrial & Engineering Chemistry Research, 2013, 52(49): 17475?17486.
[18] ALCALA C F, QIN S J. Reconstruction-based contribution for process monitoring[J]. Automatica, 2009, 45(7): 1593?1600.
[19] CHIANG L H, RUSSELL E L, BRAATZ R D. Fault diagnosis in chemical processes using Fisher discriminant analysis, discriminant partial least squares, and principal component analysis[J]. Chemometrics and Intelligent Laboratory systems, 2000, 50(2): 243?252.
[20] CHIANG L H, BRAATZ R D, RUSSELL E L. 工業系統的故障檢測與診斷[M]. 段建民, 譯. 北京: 機械工業出版社, 2003: 125?160. CHIANG L H, BRAATZ R D, RUSSELL E L. Fault detection and diagnosis in industrial systems[M]. DUAN Jianmin, trans. Beijing: China Machina Press, 2003: 125?160.
[21] YIN S, DING S X, HAGHANI A, et al. A comparison study of basic data-driven fault diagnosis and process monitoring methods on the benchmark Tennessee Eastman process[J]. Journal of Process Control, 2012, 22(9): 1567?1581.
(編輯 楊幼平)
Process monitoring based on principal component pursuit
PAN Yijun, YANG Chunjie, SUN Youxian, ZHOU Zhe, AN Ruqiao
(School of department of Control Science and Engineering, Zhejiang University,Hangzhou 310027, China)
To apply principal component pursuit (PCP) method for process monitoring, a mean variance statistic was proposed for process monitoring. First, the standardized training and testing data matrices were decomposed by PCP. Then the mean and variance of each variable were calculated in corresponding sparse matrix. The numerical simulation and TE process were provided. The results show that this statistic can eliminate the influence of almost noise interference in process. It can accomplish the objectives of model building, fault detection, fault isolation, and process reconstruction simultaneously, and illustrate the effectiveness of proposed statistic.
process monitoring; principal component pursuit; TE process; mean variance
10.11817/j.issn.1672-7207.2017.01.018
TP277
A
1672?7207(2017)01?0127?07
2016?01?10;
2016?03?15
國家高技術研究發展計劃(863計劃)項目(2012AA041709);國家自然科學基金資助項目(61290321) (Project(2012AA041709) supported by the National High Technology Research and Development Program (863 Program) of China; Project(61290321) supported by the National Natural Science Foundation of China)
楊春節,博士,教授,從事工業過程建模、過程監測、高爐故障診斷研究;E-mail: cjyang@iipc.zju.edu.cn