景亞杰, 董鴻霖, 韋志康, 楊 旭
(1. 江蘇方天電力技術有限公司, 南京 211102; 2. 東南大學 能源與環境學院, 南京 210096)
由于熱工過程數據具有高維度、高噪聲、高時滯性、多擾動的特點,目前熱工過程數學模型的故障檢測方法常用于穩態熱工過程的故障檢測及診斷,對于動態過程沒有特別好的檢測效果。對熱工過程的故障檢測及診斷一般采用基于數據驅動的算法。主成分分析(PCA)法是一種簡單高效的多元統計方法,并被廣泛應用于工業過程的過程監控和故障診斷中。KU W F等[1]考慮到傳統PCA法往往難以滿足熱工過程的動態特性影響,提出了動態主成分分析(DPCA)法,通過用帶有時滯性的變量構造出動態數據矩陣后,利用PCA技術提取相關主成分及殘差的方法以提高故障診斷及檢測的精確度。
在PCA法中,大量的非零元素出現在主成分向量及殘差向量中,不利于特征值的解釋和提取,并且熱工數據中噪聲的影響也較難剔除。雖然DPCA法能夠捕捉熱工過程的動態特性,但是其通過構造出高維矩陣,進一步增加了主成分向量中噪聲的影響,降低了故障診斷及檢測的精確度。稀疏主成分分析(SPCA)法是在PCA法的基礎上,通過稀疏化PCA的主成分向量降低噪聲的影響,并增加主成分的可解釋性,從而提高故障的檢測正確率。
筆者結合DPCA法的動態優點和SPCA法的降噪特性,提出一種基于動態稀疏主成分分析(DSPCA)的熱工過程故障檢測方法。DSPCA法先通過計算動態熱工數據的滯后因子,構造其增廣矩陣,再通過彈性網懲罰函數獲取稀疏主成分。筆者通過建立檢驗統計量進行故障診斷及檢測,對仿真數據和現場數據進行驗證。
PEARSON K[2]于1901年提出PCA的概念,其基本思想是以有限長度的多維變量時間序列構成的數據矩陣為基礎,進行矩陣運算后確定若干正交向量,歷史數據在正交向量上的投影反映數據變化最大的若干方向,舍去變化較小的幾個方向,便可將高維數據降維表示。采集正常工況下的過程數據組成的矩陣X為:
(1)
式中:xij為第j個樣本的第i次測量,i=1,2,…,n(n為測量次數),j=1,2,…,m(m為樣本數)。
對X進行標準化處理,得到標準化矩陣Xs為:
(2)
xav=(xav,1,xav,2,…,xav,m)
式中:xav,j為第j個樣本的測量平均值;sj為xav,j對應的標準差。
計算系數矩陣R為:
(3)
求出X的m個特征值,并將特征值按照從大到小的順序排列為λ1,λ2,…,λm,得到排列后的特征值矩陣Λm為:
Λm=diag(λ1,λ2,…,λm)
(4)
根據特征值可以求出特征值對應的特征向量。在實際應用中,根據方差的累積貢獻率來選取主成分數。
對Xs進行分解得到:
Xs=T×PT+Es
(5)
T=X×P
式中:P為主成分子空間負荷矩陣;T為得分矩陣;Es為殘差矩陣。
動態系統的狀態變量是時間函數,系統狀態由其狀態變量隨時間變化的信息來描述,狀態變量具有持續性。但是,熱工過程的大部分數據是動態或準穩態的,DPCA法可彌補PCA法在捕捉動態數據關系上的不足。DPCA法將采樣數據的變量作為新的增廣矩陣的變量,然后用PCA法降維,以減弱變量間的相關性。
將X的m維降為t維后,可得到降維后的矩陣Xt為:
(6)
將Xt擴展為滯后因子為h的增廣矩陣Xt-h,得到:
(7)
通過假設求出的靜態關系數為:
(8)
式中:r(·)為靜態關系數;rnew(·)為更新后的靜態關系數;a為迭代計算次數。直到rnew(h)≤0,對應的h即為所選擇的滯后因子。
ZOU H等[3]將主成分的求解問題轉化為Lasso回歸問題,并引入彈性網作為其懲罰結構,并提出了SPCA法。SPCA法在傳統的PCA法的基礎上進一步稀疏化載荷矩陣,在準確提取數據信息的前提下使主成分向量每一列中非零元素最少。目前,共有3種主流的SPCA法模型[4],即基于嶺回歸的SPCA法模型,基于彈性網回歸的SPCA法模型和基于Lasso回歸的SPCA法模型。
基于彈性網回歸的SPCA法模型比基于Lasso回歸和嶺回歸的SPCA法模型具有更好的性能,其稀疏主成分具有唯一解,不會陷入到局部最小,提高了模型的精度,同時收斂速度快,易于實現在線監測,所以筆者使用基于彈性網回歸的SPCA法模型,具體算法可參考文獻[4]。
關于SPCA法中每個主成分向量的非零元素的確定,目前多數研究者認為當SPCA法與PCA法計算出的每個主成分的解釋方差相近時,非零元素可以在此基礎上適當增加以最大化稀疏主成分,筆者選擇了GAJJAR S等[5]提出的前向選擇算法來確定每個主成分向量的非零元素的數目。
在進行工業過程監測時,T2統計量、Q統計量及綜合指標f常被用于故障檢測,T2統計量衡量樣本向量在主空間投影的變化,Q統計量衡量樣本向量在殘差子空間投影的變化,綜合指標是T2統計量和Q統計量的綜合體現,具體計算公式為:
(9)
Λ=diag(λ1,λ2,…,λk)

(10)
ei=xsi-PPTxsi
式中:QSPE,i為數據集第i次的Q統計量構成的矩陣;ei為觀測向量的殘差向量。
(11)

綜合指標的控制限fucl為:
(12)
式中:Kα為卡方分布在置信度為α下的閾值;I為m行m列的單位矩陣。
結合DPCA法的動態優點和SPCA法的降噪特性,提出一種基于DSPCA的熱工過程故障診斷及檢測方法,該方法先通過計算動態熱工數據的滯后因子,構造其增廣矩陣,再通過基于彈性網回歸的SPCA法獲取稀疏主成分,通過Q統計量、T2統計量及綜合指標對測試數據進行故障診斷及檢測。DSPCA法步驟為:
(1) 對X進行標準化處理得到Xs,按列對其進行零均值和標準方差處理。
(2) 求滯后因子,得到Xs的增廣矩陣。
(3) 計算增廣矩陣的協方差矩陣。
(4) 計算協方差矩陣的特征向量和特征值。
(5) 根據方差的累積貢獻率計算其主成分數,一般選擇方差的累積貢獻率為85%(有時也取80%和90%,視實際情況而定)。
(6) 根據基于彈性網回歸的SPCA法以及前向選擇算法算出P。
(7) 求出Q統計量、T2統計量及綜合指標,即可得到DSPCA法的故障檢測模型。
仿真數據采用文獻[1]中的模型,系統輸入變量為:(1)均值為0、方差為1的白噪聲;(2)均值為0、方差為0.1的白噪聲。輸入矩陣和輸出矩陣均為可測二維變量矩陣。采集模型在正常情況下的100個樣本用于建模。在測試數據的第11個數據引入故障,故障1為在輸入矩陣的第1行添加1個單位階躍,故障2為在輸入矩陣的第2行添加1個幅度為3的階躍。數據的測試結果見圖1,曲線U1和U2代表輸入矩陣的第1行和第2行數據,曲線Y1和Y2代表輸出矩陣的第1行和第2行數據。第1~100個測試數據為正常情況下的數據,第101~200個測試數據對應故障1的作用范圍,第201~300個測試數據對應故障2的作用范圍。

圖1 數據的測試結果
取方差的累積方差貢獻率為85%,得到主成分數為3,分別使用PCA法、DPCA法和SPCA法對測試數據進行故障檢測,具體結果見圖2(虛線為檢測的控制限,下同)和表1。

圖2 PCA法、DPCA法和SPCA法的檢測結果

表1 PCA法、DPCA法和SPCA法的檢測正確率對比
由表1可得:SPCA法的Q統計量和綜合指標的檢測正確率相較于PCA法和DPCA法大大提高。為進一步捕捉數據動態特性,最后使用DSPCA法進行檢測,結果見圖3和表2。

圖3 DSPCA法的故障檢測結果

表2 DSPCA法的檢測正確率
從表1和表2可以看出:與PCA法、DPCA法和SPCA法相比,DSPCA法更進一步提高了故障檢測正確率,對于動態數據的故障檢測具有最優的效果。
高壓加熱器位于給水泵和省煤器之間,是回熱式汽輪機最重要的組成之一。利用汽輪機的部分抽汽對給水進行加熱,可提高汽輪機組運行效率。高壓加熱器發生故障會導致回熱系統傳熱效率下降,嚴重時會對機組安全運行造成影響。為了保障機組運行的經濟性和安全性,需要時刻對高壓加熱器運行狀態進行監視,當高壓加熱器發生故障時能及時發現并進行有效的檢測,防止損失擴大。目前,高壓加熱器最常見的故障為高壓加熱器管系泄漏及高壓加熱器管結垢堵塞。筆者針對發生率更高、危害更大的高壓加熱器管系泄漏故障進行研究。
采用某電廠600 MW機組高壓加熱器運行過程中的相關數據[6]進行仿真建模,并用發生泄漏前后的數據對模型準確性進行驗證。以某級高壓加熱器為例,相關測點參數包括:鍋爐給水流量,該級高壓加熱器的進口給水的溫度、壓力及出口給水的溫度、壓力,該級高壓加熱器對應的抽汽壓力和抽汽溫度,該級高壓加熱器液位高度,上一級高壓加熱器的疏水溫度和疏水流量,汽輪機功率。
高壓加熱器泄漏分為凝結段泄漏、疏水冷卻段泄漏和蒸汽冷卻段泄漏,高壓加熱器發生泄漏后,都會導致疏水流量顯著增大。該機組的3號高壓加熱器曾發生泄漏,檢修后發現有6根管道泄漏,隨后對其進行了封堵。從廠級監控信息系統(SIS)數據庫中提取在3號高壓加熱器泄漏前,相關測點在5日內的數據,采樣時間間隔是5 min。采樣時間間隔太短,會增加運營成本,采樣時間間隔太長,無法準確提取到每個時刻傳感器所測變量的狀態,所以采樣時間間隔應該綜合考慮經濟性和測量有效性后進行選取。對于600 MW機組,合適的采樣時間間隔一般為5 min。經過動態判定后獲得部分連續數據,共有300組,對其進行建模,以發生故障當天的數據作為故障樣本,基于DSPCA對模型進行驗證,該案例模型的滯后因子為1、主成分數為3,得到的故障檢測結果見圖4。

圖4 現場試驗基于DSPCA的故障檢測結果
由圖4可得:在電廠檢測到高壓加熱器泄漏并對其進行切除檢修之前,該模型就已經檢測到了較為明顯的故障,即在電廠檢測到該故障發生6 h前就檢測到了該故障,表明筆者所建立的故障檢測模型具有較強的故障敏感性和準確性,能夠在早期檢測出高壓加熱器管系泄漏。
筆者提出了基于DSPCA的熱工過程故障檢測方法,最大程度降低噪聲的影響,提取出歷史數據中最有用的信息。仿真算例結果表明:該方法對熱工過程數據具有較強的針對性,針對高壓給水加熱器常見的管系泄漏故障有較高的檢測正確率。