林樂(lè)麒

摘 要:針對(duì)水口電站水輪機(jī)振擺度振動(dòng)數(shù)據(jù),運(yùn)用決策樹模型,完成對(duì)機(jī)組振擺度的分析。
關(guān)鍵詞:水電站;水輪機(jī);狀態(tài)檢修;回歸決策樹
1、概述
目前,水口電站的監(jiān)控系統(tǒng)、狀態(tài)監(jiān)測(cè)系統(tǒng)已經(jīng)運(yùn)行了十幾年,它們已經(jīng)積累了海量設(shè)備運(yùn)行的數(shù)據(jù)。倘若采用傳統(tǒng)分析方法對(duì)這海量的設(shè)備數(shù)據(jù)分析和處理,不僅費(fèi)時(shí)費(fèi)力并且難以從海量的數(shù)據(jù)中發(fā)現(xiàn)真正具有價(jià)值的信息。近年來(lái),隨著大數(shù)據(jù)、云計(jì)算技術(shù)的快速發(fā)展以及一些主流大數(shù)據(jù)算法框架的開放,大數(shù)據(jù)技術(shù)在日常生產(chǎn)中的運(yùn)用已經(jīng)逐漸成熟,利用大數(shù)據(jù)技術(shù)對(duì)水輪發(fā)電機(jī)組進(jìn)行故障分析診斷已經(jīng)十分必要。傳統(tǒng)的方法只是通過(guò)機(jī)組定值的方式對(duì)機(jī)組工況進(jìn)行簡(jiǎn)單的判定判定,但通過(guò)大數(shù)據(jù)分析可以分析機(jī)組各組特征數(shù)據(jù)的潛在規(guī)律,提前發(fā)現(xiàn)水輪發(fā)電機(jī)組運(yùn)行工況的微妙變化,及早發(fā)現(xiàn)設(shè)備存在的缺陷及變化趨勢(shì)。
2、基礎(chǔ)數(shù)據(jù)
本文所用數(shù)據(jù)是由水口電站狀態(tài)監(jiān)測(cè)系統(tǒng)采集水口1號(hào)機(jī)組從2018年6月1日至2020年7月4日71031條穩(wěn)態(tài)數(shù)據(jù)。監(jiān)測(cè)變量包括上導(dǎo)X向擺度,上導(dǎo)Y向擺度,推力X向擺度,推力Y向擺度,水導(dǎo)X向擺度,水導(dǎo)Y向擺度,上機(jī)架X向水平振動(dòng),上機(jī)架Y向水平振動(dòng),上機(jī)架Z向垂直振動(dòng),頂蓋X向水平振動(dòng),頂蓋Y向水平振動(dòng),頂蓋Z向垂直振動(dòng),定子X向水平振動(dòng),定子Y向水平振動(dòng),蝸殼差壓,蝸殼進(jìn)口壓力,導(dǎo)葉出口壓力,頂蓋下水壓力,尾水管出口壓力,有功功率,導(dǎo)葉開度,槳葉開度,轉(zhuǎn)速,工作水頭,水導(dǎo)X向擺度6X,水導(dǎo)Y向擺度6X,頂蓋X向水平振動(dòng)6X,頂蓋Y向水平振動(dòng)6X,頂蓋Z向垂直振動(dòng)6X。由于數(shù)據(jù)參數(shù)過(guò)多,本文僅以上導(dǎo)X向擺度、推力X向擺度、水導(dǎo)X向擺度和蝸殼差壓,有功功率,無(wú)功功率,等參數(shù)建立數(shù)據(jù)模型進(jìn)行分析。
3、數(shù)據(jù)預(yù)處理
首先,進(jìn)行數(shù)據(jù)清理,主要對(duì)數(shù)據(jù)中的缺失值以及異常值進(jìn)行處理。由于機(jī)器學(xué)習(xí)算法對(duì)于數(shù)據(jù)的正確率要求比較高,噪聲會(huì)對(duì)模型造成較大的影響。由于通信或者采集模塊故障等原因造成有些采集值為空,對(duì)于這一類數(shù)據(jù),因?yàn)檎伎倶颖颈壤容^小,所以以丟棄的方式處理。其次,由于數(shù)據(jù)中包含機(jī)組異常運(yùn)行時(shí)數(shù)據(jù),所以通過(guò)機(jī)組定值,刪除包含異常值的數(shù)據(jù)。
4、數(shù)據(jù)建模
由于觀察各個(gè)參數(shù)與振擺度不符合線性回歸模型,所以采用決策樹模型搭建預(yù)測(cè)分析模型。
4.1決策樹模型原理
決策樹是一種通過(guò)大數(shù)據(jù)訓(xùn)練,然后生產(chǎn)數(shù)據(jù)模型,對(duì)數(shù)據(jù)進(jìn)行分類預(yù)測(cè)和回歸預(yù)測(cè)的方法。通過(guò)的特征值的“是否”區(qū)分左右兩個(gè)分支,不斷迭代二分每個(gè)特征后而生成的模型。
假設(shè)X與y分別是輸入矩陣和結(jié)果,并且y是連續(xù)變量,給定訓(xùn)練數(shù)據(jù)集
一個(gè)回歸樹對(duì)應(yīng)著輸入空間(即特征空間)的一個(gè)劃分以及在劃分的但單元上的輸出值。假設(shè)已將輸入空間劃分為M個(gè)單元 ,并且在每個(gè)單元上有一個(gè)固定的輸出值,于是回歸樹模型可表示為
決策樹算法就是要不斷找到信息熵最小的那個(gè)維度上(特征)值,這個(gè)值可以把目標(biāo)值劃分的類別信息熵最小。
Entropy代表信息熵,i 表示數(shù)據(jù)總類別數(shù),P(i) 表示類別 i 樣本數(shù)量占所有樣本的比例
最后通過(guò)R^2進(jìn)行模型正確率的評(píng)估
4.2決策樹建模
本文選取的特征值比較少,只建立簡(jiǎn)單的決策樹回歸模型,并不進(jìn)行參數(shù)調(diào)優(yōu)的過(guò)程。
首先,將所有數(shù)據(jù)分為80%的訓(xùn)練集,以及20%的測(cè)試集。將80%的訓(xùn)練集訓(xùn)練生成決策樹模型如下圖:
4.3模型分析
由表1所示,上導(dǎo)X向擺度模型正確率明顯低于推力X向、水導(dǎo)X向擺度模型。分析原因可能是由于引入特征量相對(duì)較少、上導(dǎo)X向傳感器精確度相對(duì)較低造成數(shù)據(jù)誤差較大。
從三個(gè)數(shù)據(jù)模型結(jié)果來(lái)看,機(jī)組不同地點(diǎn)震動(dòng)的影響因素也不大相同。
a、上導(dǎo)X向擺度主要受到蝸殼壓差蝸殼差壓 <= 13.961這個(gè)主要條件進(jìn)行影響,其次受到導(dǎo)葉開度與槳葉開度的影響。
b、推力X向擺度主要受到有功功率有功功率 <= 108.333這個(gè)主要條件影響,然后再根據(jù)有功功率 <= 25.699,有功功率 <=195.975兩個(gè)條件進(jìn)行劃分。
c、水導(dǎo)X向擺度主要由受到蝸殼壓差蝸殼差壓 <= ?0.615這個(gè)主要條件進(jìn)行影響,其次主要受到槳葉開度的影響。
5、結(jié)語(yǔ)
生產(chǎn)大數(shù)據(jù)在水口電站機(jī)組振擺度分析中具有巨大的作用,通過(guò)大數(shù)據(jù)技術(shù)可以發(fā)掘海量數(shù)據(jù)中的潛在價(jià)值,打破傳統(tǒng)分析手段的限制,多維度的對(duì)機(jī)組機(jī)組工況、振擺度進(jìn)行精確的分析。通過(guò)大數(shù)據(jù)技術(shù)對(duì)海量的數(shù)據(jù)進(jìn)行分析,可以得到水輪機(jī)組運(yùn)行中的客觀規(guī)律,為故障判斷、預(yù)測(cè)分析以及輔助決策提供更有價(jià)值的信息。通過(guò)大數(shù)據(jù)技術(shù)可以有效的降低事故的發(fā)生,做到防范于未然。從而有效降低水電站的運(yùn)營(yíng)成本,為企業(yè)創(chuàng)造更高效益。
(福建水口發(fā)電集團(tuán)有限公司 ?350000)