周傳杰 王嘉琪 馬運保 杜偉



摘?要:針對燃煤發電機組的重要執行機構閥門,通過深度神經網絡算法對機組大量運行數據進行學習,構建重要執行機構閥門在全負荷工況下的精準數學模型,以深度神經網絡模型預測值和皮爾遜相關系數判別為依據,實現重要執行機構閥門的故障診斷和早期預警。結果表明,基于大數據,學習和深度神經網絡算法的數學模型有效地實現了對執行機構閥門的故障診斷和提前預警,指導運行人員進行提前干預和檢修,減少機組的故障率。執行機構閥門故障預警的深度神經網絡模型以執行機構閥門前的相關DCS參數、系統主要運行參數作為模型的輸入變量;以執行機構閥門之后的參數作為輸出量。選擇機組在不同負荷工況下,執行機構閥門系統從打開到關閉的完整時間段內的大量數據,作為深度神經網絡模型的訓練數據。該方法具有較強的通用性,可以方便地平行移植至火電機組的其他重要輔機設備中。皮爾遜相關系數能反映數據變化的趨勢信息,能判斷兩個向量或者兩個數組相似度。以皮爾遜相關系數作為深度神經網絡模型預測輸出值與系統實際輸出偏差距離的判據,可以很好地解決系統發生偏離后的預警問題,有效地提高模型預測的精度。
關鍵詞:深度神經網絡算法;皮爾遜相關系數;執行機構閥門故障預警;多維度距離偏差監測;大數據分析
在能源轉型的背景下,智能發電成為發電行業轉型升級的新興技術[13]。智能發電從智能生產控制和智能管理兩個核心展開,借助智能控制、智能安全、智能管理三大功能,綜合自學習、自恢復、自適應、自診斷等技術,形成了一種智能發電運行控制和管理模式[25]。這種模式具備自驅優化全程控制、自學習分析診斷、自恢復故障處理、自適應多目標優化和自組織細致管理等特征。
在故障診斷方法研究中,文獻[38]中將故障診斷方法分為基于模型的故障診斷、基于信號的故障診斷和基于歷史運行數據的故障診斷這三大類。
基于模型的故障診斷方法首先需建立系統的精準數學模型,通過模型參數的變化實現對系統的監測,因此所建立的模型是否準確將直接決定預警及診斷結果的可靠性。基于信號的故障診斷方法通過對關鍵檢測信號進行小波分析,以及通過對信號的頻域和幅值相關性分析對機組是否具有潛在故障進行診斷,但其需安裝大量的傳感設備,實施和維護成本較高。基于歷史運行數據的故障診斷方法,通過分析機組正常運行數據與故障運行數據的差異,判斷系統是否處于異常狀態。基于歷史運行數據的故障診斷方法需獲取系統的大量典型故障歷史數據樣本,而在電廠的海量歷史數據中尋找故障數據如同海底撈針,且故障數據非常有限,因此在實際中難以實施。
在燃煤火電廠系統中,執行機構閥門是常見的一種設備,它主要起到對流體進行控制的作用。現代化的燃煤火電廠中含有大量的閥門,閥門在其中起著控制介質輸送的作用,是保證火力發電廠正常運轉的重要環節。在火力發電廠的熱工系統中,執行器是非常普遍的一種設備。現代燃煤火力發電廠中,在正常運行的情況下,閥門的開關頻率較高,極易引起閥門的性能劣化,引起安全事故。在火力發電廠發生的各種事故中,由于閥門的原因引起的事故占到了70%左右,因此,閥門的工作可靠與否直接關系到火力發電廠的安全運行。所以,本文將以執行機構閥門為研究對象,采用深度神經網絡算法對執行機構閥門系統海量歷史數據進行學習,構建執行機構閥門系統在各種工況下的精準數學模型,從而建立出了執行機構閥門系統在不同工況下的精確數學模型。
以深度神經網絡模型預測值和皮爾遜相關系數判別為依據,開發出一套故障診斷與預警系統,實現執行機構閥門的故障診斷和早期預警。通過實例驗證,本文所提出的方法可以對電動閥門的工作狀況進行正確的判別,可以對閥門的內漏度做出較為精確的判別;并在系統的測試中,證明了該系統的模塊功能是有效的。本文探討的重點是探討自學習、自分析和自診斷等新技術,并將新技術應用于燃煤機組重要執行機構閥門的故障診斷和預警,提高了火電機組運行的安全可靠性,推動電廠向智能生產控制與管理升級[912]。
1?數據預處理
1.1?歷史數據抽取和預處理
在實際應用中,主要從質量分析、數據轉換、再取樣等幾個方面來進行預處理:
(1)數據質量分析是指檢測數據缺失值和異常值情況,并加以處理,以提升數據質量,使數據適合某一種特定的挖掘技術與工具。缺失值處理方法有:自動刪除不符合要求的記錄、均值/中位數/眾數插補、固定值插補、回歸方法插補、不處理等;異常值處理方法有:異常值刪除、視為缺失值、不處理等;數據噪聲處理可采用參數平滑相關算法。
(2)數據變換主要是為了對數據進行規范化處理,以供挖掘。轉換方法有:簡單函數變換、正態分布變換、非平穩到平穩序列的變換和量程壓縮;數據規范化(歸一化)包括最小—最大規范化、零—均值規范化和小數定標規范化等。
(3)數據重取樣是指為了去除一些噪聲,適應建模算法的要求,減少數據量,加快建模速度,對數據進行再取樣,并在前一個取樣周期的整數倍上對數據進行再取樣處理,從而去除一些噪聲,適應建模算法的要求[8]。在此基礎上,本文采用了一種基于前一周期的整數倍采樣方法,以消除部分噪聲,并使其與模型的需求相匹配,以降低模型的樣本數量,提高模型的速度。
1.2?歷史數據篩選和挖掘
火電機組鍋爐系統運行優化所需測點均是時序信號,操作人員的運行優化控制對系統的影響可轉化為數據相關性模型。
基于鍋爐運行優化的特點,本發明提出了針對對象相關性的數據挖掘技術:
(1)初態穩定性抽取:選取處于穩態轉化為動態的數據片段,以用于多變量線性離散狀態空間相關性分析;
(2)根據具體情況進行篩選:如工況篩選、動態數據篩選等。
如圖1所示是用于數據預處理和挖掘的人機交互平臺界面。
2?深度神經網絡算法和皮爾遜相關系數
2.1?深度神經網絡算法
深度前向全連接神經網絡(Deep?Neural?Networks,DNN)本質上是一個包含多個隱層,結構深度多層化的多層感知機[37]。圖2是一個包含五個隱層的,每層含有若干個節點的深度神經結構示意圖。深度神經網絡(DNN)采用層級的結構,每層之間相互連接,包括輸入層、隱藏層和輸出層。相鄰層的節點往往采用全連接的方式,因為全連接的深度神經網絡往往會出現過擬合的情況。一般會構造稀疏深度神經網絡,以降低過擬合度,斷開某些層之間點與點的連接。隱藏層的節點激活值是由前一層神經網絡的激活值和當前層神經網絡權重的線性加權求和,并加上偏置后,最終通過非線性的激活函數激活得到。
DNN的輸入層輸入預處理之后的數據,設輸入為h0=X,對于有L層隱含層的深度神經網絡,其每層的激活值的計算公式為:
α(l)=W(l)h(l-1)+b(l),(1SymbolcB@
lSymbolcB@
L+1)
h(l)=f(α(l)),(1SymbolcB@
lSymbolcB@
L)(1)
式中,Wl為l-1到l層的權重向量,hl-1為l-1層隱含層的激活值,bl為偏置向量,hl為l層的激活輸出。f(·)為激活函數,傳統的DNN普遍采用Sigmoid激活函數,其函數表達式為:
h(l)=f(α(l))with?hlj=11+e-alj(2)
目前,新興的激活函數為整流線性單元(Rectified?Linear?Unit,ReLU),常用于隱藏層節點的非線性激活函數。其表達式為h(l)=max(0,al)。ReLU因其求導簡單,使用ReLU訓練時的收斂速度比較快,也不會出現梯度消失的問題。相對于Sigmoid函數,ReLU具有單側抑制、相對寬闊的興奮邊界和稀疏激活性等優點。
對于回歸擬合的任務,DNN的輸出層通常采用Sigmoid激活輸出。當使用DNN接受輸入層的數據,并相應計算出輸出層的數據的過程,稱為前向傳播過程(Forward?Propagation)。當得到DNN輸出的理論計算值與實際數據值進行比對時,需建立相應的損失函數。根據不同的任務,DNN常用有兩種優化準則。對于分類任務,通常使用交叉熵準則,對于回歸任務(CrossEntropy,CE),通常使用最小均方差(Mean?Square?Error,MSE)。最小均方差的損失函數公式為:
J(Θ)=12N∑N1‖yl-hl‖2(3)
式中,Θ={Wl,bl|l=1,2,…,L+1}表示DNN中的所有參數,yl為輸出的實際值。DNN的反向傳播,學習訓練任務是使損失函數的值達到最小,達到最終的回歸優化擬合效果,即:
Θ*=minΘ∈瘙 綆
NJ(Θ)(4)
對于有多個隱藏層、多個節點的深度神經網絡,上述的優化過程通常是高維、非凸的。反向傳播過程可采用基于隨機梯度下降(SGD)的BP算法來進行優化。反向傳播算法(BP算法)的訓練過程,其核心思想是通過鏈式求導方法,計算出目標函數關于每層的輸出誤差,進一步得到網絡參數的梯度,進而來調整每個網絡節點的參數值。通過鏈式求導法則得到對應的誤差信號表達式為:
elγ=ylγalγ(5)
得到第l層輸出的誤差信號后,權重的梯度通過誤差信號可計算得到:
JWl=elγ(hl-1γ)′(6)
權重更新公式為:
ΔWlt+1=ρ·ΔWlt-(1-ρ)·ηJWlt
Wlt+1=Wlt-ΔWlt+1(7)
式中,ρ為動量因子,η為學習速率。
為了有效地防止參數更新過程中,出現太大的權值,在目標函數中添加權重,相應的權重更新公式為:
ΔWlt+1=ρ·ΔWlt-(1-ρ)·η(JWlt+βWlt)(8)
式中,β為權重衰減因子,通常取為0.001。
2.2?皮爾遜相關系數
采樣點間距是衡量兩條曲線相似性的重要指標,然而對具有規律性的燃煤發電系統,僅靠間距難以體現出各參數之間的時間相關性,即曲線變化的趨勢信息未被充分表達。皮爾遜積矩相關系數(Pearson?ProductMoment?Correlation?Coefficient,又稱作PCCs或PPMCC,簡稱為皮爾遜相關系數)是一種常用的數值分析方法,用于衡量X、Y兩個變量間的線性相似度,其值在(-1,1)的區間內,取1代表完全的正相關性,而取-1則代表完全的負相關性。
X和Y之間皮爾遜相關系數的計算公式為:
ρx,y=cov(X,Y)σXσY
=E((X-μX)(Y-μY))σXσY
=E(XY)-E(X)(Y)E(X2)-E2(X)E(Y2)-E2(Y)(9)
式中,E代表數學期望值。
皮爾遜相關系數ρx,y應滿足如下性質:
(1)若ρx,y=±1,當且僅當Y=aX+b,a≠0,a,b為常數;
(2)ρx,y∈(-1,1);
(3)cos0°=1。
式(9)出示皮爾遜相關系數ρx,y的計算方法,即將X和Y的協方差cov(X,Y)與它們的標準差乘積σXσY相除。通過幾何學的方法,可以更好地了解相關性的意義。皮爾遜的相關系數,可以看成是兩個矢量之間的角度,用來計算余弦。當向量夾角為0°,即兩者向同一方向變化時,cos0°=1,即ρX,Y=1?ρx,y=1,表明二者此時共變,較大程度上反映了數據變化的趨勢。
與歐幾里得距離相比,皮爾遜相關系數能夠更有效地表示復雜的數據信息,并判斷兩個向量或數組的相似度。在數據不規范的情況下,它往往能夠給出更好的結果。對于本研究對象,與只選擇單一參數點作為故障樣本相比,該模型的預測精度將大大提高。雖然模型預測的結果與實際數據并不能完全吻合,但是當數據存在一定差異但總體趨勢相近時,可以給出較高概率的輸出結果,并以此作為故障產生的依據。
皮爾遜相關系數g=cov(X,Y)/(aX*aY),表示兩個向量的夾角余弦值。如果向量夾角為0度,則c=1,b=1,說明它們共變,并反映出數據變化的趨勢。皮爾遜相關系數可以比歐幾里得距離更好地表示數據信息相似度,尤其適用于不規范的數據。對于本研究模型,通過建模獲得的數據變化趨勢,預測結果的準確性將顯著提高。即使數據存在一定差異,但整體趨勢類似,模型能夠提供相對高的概率輸出結果,作為故障判斷的支持依據。
3?執行機構閥門故障預警仿真驗證
以引風機動葉故障為例,利用深度神經網絡算法,對引風機動葉執行機構進行建模。以引風機電流、爐膛負壓、鍋爐負荷、風機出口壓力、風機動葉液壓油壓力作為模型的輸入變量,以引風機動葉的反饋作為輸出量,選擇機組在不同負荷工況下,輸入輸出量的海量數據,作為訓練數據。針對風機動葉故障預警的深度神經網絡算法的系統結構如圖3所示。
選擇半個月的海量歷史運行數據,選取深度神經網絡隱含層為3層,每層節點數分別為30、50、30,權重更新速率為1,模型訓練代數為100代。引風機動葉故障預警的深度神經網絡模型的驗證效果如圖4所示。圖3顯示出引風機動葉反饋預測值與實際值的曲線基本吻合,平均相對誤差小于5%,滿足模型精度的要求。說明基于大數據學習和深度神經網絡,構建的引風機動葉系統數學模型,能有效實現引風機動葉系統的參數預測。
截取某時間段內,引風機動葉運行數據作為測試樣本,對執行機構故障診斷和預警系統進行驗證。如圖5所示。當時間達到1286s時,模型預測輸出值與實際值之間的皮爾遜相關系數小于0.6,并以此進行故障預警。28s后,實際動葉發生卡澀,實現了對執行機構系統故障的提前預警。
4?結論
針對燃煤火力發電站的執行機構閥門,采用深度神經網絡算法對執行機構閥門系統海量歷史數據進行學習,構建執行機構閥門系統在全負荷工況下的精準數學模型,以深度神經網絡模型預測值和皮爾遜相關系數判別為依據,實現執行機構閥門系統的故障診斷和早期預警。結果表明:
(1)執行機構閥門故障預警的深度神經網絡模型以鍋爐負荷、爐膛負壓、動葉指令、風機軸溫、風機出口壓力、控制油壓作為模型的輸入變量;以風機動葉反饋、引風機電流作為輸出量。選擇機組在不同負荷工況下,引風機系統從啟動到停止的完整時間段內的海量數據,作為深度神經網絡模型的訓練數據。
(2)基于深度神經網絡構建的執行機構閥門系統數學模型,能有效實現執行機構閥門的故障診斷和早期預警。該方法具有較強的通用性,可以方便地平行移植至火電機組的其他重要輔機系統中。
(3)皮爾遜相關系數能反映數據變化的趨勢信息,能判斷兩個向量或者兩個數組相似度。以皮爾遜相關系數作為深度神經網絡模型預測輸出值與系統實際輸出偏差距離的判據,可以很好地解決系統發生偏離后的預警問題,有效地提高模型預測的精度。
參考文獻:
[1]李孟周,伏勁宇,杜杰,等.燃煤火電集控運行精益化管理提升策略研究[J].電力設備,2017(34):230,232.
[2]國家能源局.關于推進“互聯網+”智慧能源發展的指導意見[EB/OL].[20160229].
[3]劉吉臻,胡勇,曾德良,等.智能發電廠的架構及特征[J].中國電機工程學報,2017,37(22):64636470.
[4]高波,李寧,孫奇輝,等.燃煤電站執行機構閥門出力不足的系統分析與優化[J].科研,2016,5(9):4243.
[5]Agrawal?V,Panigrahi?B?K,Subbarao?P?M?V.Review?of?control?and?fault?diagnosis?methods?applied?to?coal?mills[J].Journal?of?Process?Control,2015,32:138153.
[6]王金浩,陳偉巍,陳錚,等.1000MW機組輸煤控制系統通訊網絡升級優化改造[J].防護工程,2018(2):293294.
[7]劉瑞國.一個基于模型的故障診斷算法[J].微計算機信息,2007,23(13):219221.
[8]楊利,鄒成,胡建忠,等.中速輥式執行機構閥門單耗的分析與運行優化[J].工業,2016,10(9):5152.
[9]文成林,呂菲亞,包哲靜,等.基于數據驅動的微小故障診斷方法綜述[J].自動化學報,2016,42(9):12851299.
[10]吳英.基于證據理論的民機電源系統故障診斷方法[J].國外電子測量技術,2017,36(8):510.
[11]Heaton?J.Ian?Goodfellow,Yoshua?Bengio,Aaron?Courville.Deep?learning[J].Genetic?Programming?&?Evolvable?Machines,2017,19(12):13.
[12]劉暢.電站設備輔機狀態監測與故障診斷[D].華北電力大學(北京),2017.
作者簡介:周傳杰(1973—?),男,本科,工程師,主要從事熱工保護及自動化;王嘉琪(1994—?),女,研究生,工程師,主要從事熱工保護及自動化;馬運保(1969—?),男,專科,工程師,主要從事熱工保護及自動化。