李勁松,董 澤,馬 寧,3
(1.河北國華定州發電有限責任公司,河北 定州 073000;2.華北電力大學河北省發電過程仿真與優化控制技術創新中心,河北 保定 071003;3.華北電力科學研究院有限責任公司,北京 100045)
近年來,隨著大數據和人工智能等信息化技術在工業領域得以實現。在火力發電領域,基于數據驅動的系統建模[1],過程監測[2]和性能評估[3]被廣泛研究與應用,這些方法的基礎是獲取電站穩態工況下的數據。然而,由于自動發電控制(AGC)調度指令和電站燃煤質量變化的影響,電站很多系統經常處于波動狀態,這使得電站存儲的歷史數據中含有大量的非穩態數據,因此,研究如何從海量數據中快速、有效地篩選出穩態數據具有重要的理論與應用價值。
基于電站歷史數據的穩態篩選方法可不需考慮過程變量的機理特性,也避免了由傳統正交試驗獲得穩態數據導致時間和財力的消耗。目前,國內外諸多學者對穩態檢測方法進行了研究。Cao[4]等人提出了利用數據濾波前后的估計方差的比值判斷當前數據是否處于穩態的R檢驗法,并分析了不同濾波系數和判定閾值之間的關系。針對R檢驗法,近年來一些學者提出了不同的改進策略[5-6],然而,R檢驗法容易受到濾波參數和判定閾值的影響,且只適用于幅度變化緩慢的數據,難以對電站中參數變量幅值變化較快的數據進行穩態檢測。Korbel等[7]利用小波變換對數據進行異常值檢測及去噪處理,并通過小波變換后的數據確定穩定數據段的起止點,為數據穩態檢測提供了一個新思路。陳世和等人[8]通過計算單一變量數據變化的速度以及加速度來獲得穩態指數,再對多個變量加權得到綜合穩態指標判斷電站鍋爐是否處于穩態。此外,還有基于趨勢判斷[9],多項式擬合[10],聚類[11]等穩態檢測方法。以上檢測方法在豐富穩態檢測方法理論的同時,也取得了良好的實際應用效果,但是也存在著參數難以確定等局限性。
基于以上的研究,考慮到電站數據因儀表安裝環境和位置因素影響導致含有大量噪聲,干擾穩態檢測精度,本文將基于信號分解與能量結合的去噪算法引入到電站數據穩態檢測中,并提出一種自適應確定滑動窗口長度和檢測閾值策略,并用于火電廠歷史數據穩態檢測。
經驗模態分解(EMD)[12]理論思想是認為信號都是由若干獨立的固有模態函數(IMF)序列組成,經驗模態分解步驟如下:
1)根據極大值點和極小值點獲得其上下包絡線p(t)和q(t),并計算均值
(1)
2)計算差值f1(t)
f1(t)=x(t)-m(t)
(2)
3)計算為第一階固態分量IMF1
c1(t)=f1(t)
(3)
計算一階殘余項r1(t)
r1(t)=x(t)-c1(t)
(4)
4)通過對r1(t)進行重復分解,得到若干固態分量,最終的分解結果為
(5)
雖然EMD在很多領域得到應用,但其也存在著容易產生模態混疊問題,對此,Wu等[13]人提出了集合經驗模態分解(EEMD)方法,該方法通過引入高斯白噪聲擾動并對經過多次EMD分解的模態函數求取平均值,避免了模態混疊問題。
Frandrin提出了一種能量去噪法與EMD相結合的濾波算法[14],其核心思想為,對于信號中的白噪聲,若將分解后的首個模態分量作為噪聲信號,則第i個噪聲模態分量的功率頻譜呈自相似性,即第i個噪聲分量能量的半對數log2W[i]隨著i的增大而減少,能量W[i]的估計值為
W[k]=Cρ-i(i≥2)
(6)
式中
C=W[1]/β
(7)
ρ=2.01+0.2(H-0.5)+0.12(H-0.5)2
(8)
其中,H為判斷時間序列是否為隨機游走的指標。當估計的相對應的模態分量在置信區間95%至99%,時,即95%Wi (9) 通常在95%置信區間內β為0.719,ρ為2.449;在99%置信區間內β為0.719,ρ為1.919。 為了將噪聲信號D(n)從原始信號X(n)中去除,選擇分解后第一個固有模態分量作為估計的第一個噪聲IMF分量,其能量E1[n]等于W[1],并基于此估計其它噪聲分量的能量值W[k],若W[k]與各模態分量能量Ei[n]滿足一定關系,則可認為該模態分量僅含有噪聲成分。基于以上理論,EEMD與能量結合的去噪算法步驟如下: 1)對原始信號X(n)進行EEMD分解,得到k個模態分量IMF1-IMFk,并根據式(9)計算各模態分量能量Ei[n],(i=1,2,…,k); 2)令W[1]=E1[n],參數按95%置信區間和99%置信區間相關參數計算得到噪聲分量95%Wk和99%Wk。 4)對噪聲信號求和 (10) 5)獲得去噪后的信號x(n)=X(n)-D(n). 提出一種基于滑動窗口快速篩選大規模數據穩態工況的數據篩選方法,該方法以包括一段數據的滑動窗口作為對穩態數據判斷的最小單元,此窗口每向前滑動一次,都會有一個新的數據進入到滑動窗口內,同時有一個舊數據滑出,計算窗口內數據的標準差并與給定閾值比較,若小于閾值,則將窗口內數據記為穩態數據,假設窗口的長度為p,則窗口數據平均值、方差和標準差的表達式為 (11) (12) (13) (14) k時刻的滑動窗口內的數據方差值為 (15) 展開得 (16) k+1時刻,方差為 (17) 方差遞推公式為 (18) 標準差遞推公式為 (19) 窗口長度和閾值是影響該算法性能的兩個主要因素,當窗口長度太小,則在滑動過程中窗口的平均值,標準差受新數據影響較大,不利于判斷數據整體趨勢;當窗口長度太大,則會導致算法對數據點的變化不敏感;標準差閾值Sd是判斷數據是否處于穩態的關鍵參數,為此,利用一段具有穩態與非穩態標簽的歷史數據作為辨識樣本對窗口長度和標準差閾值進行辨識,辨識原理如圖1所示,圖中的目標函數為滑動窗口法篩選出的穩態數據、非穩態數據與標記數據的誤差值,每當篩選結果與標記結果不同,最終選取目標值最小時的窗口長度和閾值。 圖1 滑動窗口參數辨識原理示意圖 為了檢驗所提穩態數據篩選方法的有效性,本文利用某火電廠1000MW超超臨界機組的總風量歷史數據進行穩態篩選驗證。選取5000個歷史數據點,由于總風量數據不可避免地存在著一定程度的噪聲,這些噪聲會對以統計理論為基礎的穩態檢測方法造成干擾,所以需要采用EEMD與能量去噪結合的方法對歷史總風量數據進行去噪處理,去噪后的數據如圖2所示。 圖2 去噪后的1000MW機組總風量歷史數據 選取去噪后的前1000個數據作為參數辨識樣本,并人為標注該段數據的狀態,即穩態或是非穩態數據。圖3(a)為1000個辨識樣本,圖6(b)表示的是樣本狀態,當狀態標志量為1時,則所對應的數據為穩態數據,當標志量為0時,所對應的數據為非穩態數據。 圖3 辨識樣本及樣本狀態標識 利用滑動窗口法對1000個辨識樣本進行穩態篩選。設每個樣本的狀態標記量為Si(i=1,2,…,1000),即Si=1時,表示為穩態,Si=0時,為非穩態。滑動窗口法檢測的結果為Si’,則參數辨識的目標函數為, (20) 由上式可以看出,目標值J越小,檢測結果越接近于標記值,當J達到最小時其對應的滑動窗口參數即為最優滑動窗口參數。通過網格搜索方法尋優,當滑動窗口長度p為35閾值Sd為9時,目標值J最小,所以此組參數為穩態數據篩選的最優參數。 圖4為1000MW機組總風量數據穩態篩選結果,其中(a)圖為總風量經過EEMD與能量結合去噪后的數據和篩選出的穩態數據;(b)圖為每個采樣點經穩態檢測算法確定的狀態標志量。從圖中可以看到,本文提出的穩態檢測算法可以有效地檢測出總風量歷史數據中的穩態部分。算法對于穩態數據與非穩態數據邊界點識別的準確程度也可從圖中多處數據突變的檢測結果得以證實。以上實驗結果驗證了本文提出的穩態檢測方法的有效性和高效性。 1)針對電站數據存在較大噪聲干擾的問題,利用集合經驗模態分解與能量結合的去噪算法進行數據去噪處理,并采用滑動窗口法進行穩態檢測,其中,通過標記數據狀態的辨識樣本確定滑動窗口的長度以及閾值大小。 2)以某電站1000MW機組總風量歷史數據為測試對象,利用所提算法進行穩態數據篩選,實驗結果表明,該穩態檢測算法可以從數據波動幅度較大數據中準確篩選出穩態數據,且具有耗時小的特點,可用于在電站海量歷史數據中快速篩選出用于數據建模及控制的穩態數據。 3)所提出的穩態檢測方法主要針對與電站單一變量的穩態數據篩選,而對于電站某個特定系統多變量穩態篩選往往會涉及到各變量之間的相關性以及系統的整體特性,因此系統的穩態檢測會更加復雜,這也是進一步的研究方向。2.3 EEMD能量去噪算法步驟

3 滑動窗口穩態檢測算法
3.1 滑動窗口原理

3.2 參數選擇

4 電站歷史數據穩態檢測


5 結論