999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于AC-GAN 數(shù)據(jù)重構(gòu)的風電機組主軸承溫度監(jiān)測方法

2021-11-27 00:48:44尹詩侯國蓮胡曉東周繼威
智能系統(tǒng)學報 2021年6期
關(guān)鍵詞:故障模型

尹詩,侯國蓮,胡曉東,周繼威

(1.中能電力科技開發(fā)有限公司,北京 100034;2.華北電力大學 控制與計算機工程學院,北京 102206)

由于風電機組所處運行環(huán)境惡劣,受氣象、設備老化等多種不確定因素的影響,容易出現(xiàn)性能與運行狀態(tài)劣化,從而造成關(guān)鍵部件失效。風電機組主軸承連接著輪轂與齒輪箱,作為重要的機械傳動部件之一,其可靠性要求較高,但主軸承內(nèi)部結(jié)構(gòu)和受力較復雜,且常常運行在重負荷、強沖擊的工作狀態(tài)下,容易發(fā)生磨損、不對中、不平衡等問題[1]。風電機組主軸承一旦損壞,受限于維修過程的復雜,其維修費用高、周期長,嚴重影響風電場的經(jīng)濟效益。

風電機組故障診斷研究目前主要集中在振動信號分析法方法、SCADA 數(shù)據(jù)分析方法、視頻圖像檢測方法、潤滑油檢測方法、聲發(fā)射信號檢測方法、應變傳感信號檢測方法等[2]。數(shù)據(jù)挖掘方法能夠在大量數(shù)據(jù)中發(fā)現(xiàn)隱含的知識或潛在規(guī)律,因此近年來在各行業(yè)中具有廣泛的研究和應用。隨著數(shù)據(jù)挖掘算法的不斷發(fā)展,一些算法逐漸被應用到故障預警和故障辨識中[3]。目前基于數(shù)據(jù)挖掘的風電機組的狀態(tài)監(jiān)測研究主要基于采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition,SCADA) 時序數(shù)據(jù),利用相關(guān)智能學習算法建立設備部件的正常運行模型,通過分析正常模型預測值與實際觀測值之間的殘差進行狀態(tài)監(jiān)測。文獻[4]利用深度置信網(wǎng)絡建立發(fā)電機同步定子故障預警模型,對殘差設定故障閾值進行狀態(tài)監(jiān)測。文獻[5]利用BOX-COX 變換和相對熵對殘差進行分析,對齒輪箱進行狀態(tài)監(jiān)測。文獻[6]利用數(shù)據(jù)分類重建和提取衰退指標的方法對齒輪箱進行狀態(tài)監(jiān)測。文獻[7]將DS 證據(jù)理論應用于SCADA 警報分析對風電機組進行故障診斷。文獻[8]通過提取風電機組SCADA 系統(tǒng)中的實際運行數(shù)據(jù),采用雙向遞歸神經(jīng)網(wǎng)絡建立風電機組運行預測模型,根據(jù)滑動窗口的實際值與實測值之間的殘差,利用萊特準則實現(xiàn)故障預警。

以上方法對殘差進行分析時需要人為設定故障預警閾值,所述方法適用于某一特定風電場,其泛化性有待提升。文獻[9]利用SCADA 數(shù)據(jù)提出了基于工況辨識的Bi-RNN 神經(jīng)網(wǎng)絡,建立預警模型對風電機組主軸承運行狀態(tài)進行監(jiān)測,該方法在故障決策方面引入隨機森林算法避免人為設定故障閾值,但由于故障發(fā)生前SCADA 數(shù)據(jù)不全是表征故障的數(shù)據(jù),所建立的狀態(tài)決策模型精度有待提升。

上述研究在不同程度上對風電機組關(guān)鍵核心部件的狀態(tài)監(jiān)測和故障預警起到了推動作用,但是普遍存在泛化性弱,故障決策受主觀因素影響、缺乏理論支撐等問題,限制了狀態(tài)監(jiān)測模型的工程實用性。

因此,本文以風電機組主軸承溫度為研究對象,提出了一種基于輔助分類生成對抗網(wǎng)絡(auxiliary classifiergenerative adversarial networks,ACGAN)數(shù)據(jù)重構(gòu)的風電機組主軸承狀態(tài)監(jiān)測方法對其運行狀態(tài)進行監(jiān)測。

1 建模方法設計

溫度是風電機組運行數(shù)據(jù)中較為重要的觀測指標,具有很強的抗干擾性,不會輕易因環(huán)境或工況變化產(chǎn)生劇烈跳躍變化。正常情況下,軸承溫度隨著軸承開始運行緩慢上升,后續(xù)達到穩(wěn)定運行狀態(tài)。風電機組主軸承溫度隨著熱容量、散熱速度、轉(zhuǎn)速和負載而發(fā)生變化。但機械傳動設備在運行過程中產(chǎn)生的磨損、潤滑不良、屏蔽不良等問題往往會導致溫度數(shù)據(jù)異常,如果主軸承長期在高溫下運行,其運行壽命將會大大縮短,甚至會引起更為嚴重的故障事故[10]。因此,本文重點分析風電機組主軸承溫度參數(shù)的變化,監(jiān)測并實時掌握主軸承運行狀態(tài),發(fā)現(xiàn)其潛在隱患。風電機組主軸承溫度預測模型的準確度、泛化能力以及狀態(tài)決策模型的準確度決定著主軸承狀態(tài)監(jiān)測的精準度。建模流程如圖1 所示。

圖1 建模方法流程Fig.1 Flow chart of the modeling method

首先,利用SCADA 時序數(shù)據(jù)建立基于輕型梯度增強學習器(light gradient boosting machine,LightGBM)的主軸承溫度預測模型,定義模型預測輸出溫度與實際觀測溫度之差為殘差。相較于其他算法,LightGBM 算法無需通過計算所有樣本信息增益,其內(nèi)置的特征降維技術(shù)具有較高的預測精度和較快的訓練速度,比較適合于工程實現(xiàn)。

其次,通過滑動窗口和統(tǒng)計過程控制(statistical process control,SPC)方法將異常主軸承殘差中的正常殘差和異常殘差進行有效區(qū)分。利用AC-GAN 輔助分類生成對抗網(wǎng)絡生成與主軸承異常殘差分布相似的殘差數(shù)據(jù)集,用來替換異常主軸承殘差分布中的正常殘差數(shù)據(jù)集。由于風電機組異常主軸承的殘差特征不全表征為異常狀態(tài),無法統(tǒng)一進行標記。因此,利用AC-GAN 將溫度殘差特征進行數(shù)據(jù)重構(gòu),得到異常主軸承下的殘差特征,從根本上解決了異常樣本數(shù)據(jù)的標記問題,進而提高了后續(xù)主軸承狀態(tài)決策模型的預測精度。

最后,建立基于自然梯度提升(natural gradient boosting,NGBoost)的狀態(tài)決策模型對風電機組主軸承狀態(tài)進行判斷。NGBoost 算法利用自然梯度進行概率預測,解決了傳統(tǒng)狀態(tài)決策方法中采用單一固定閾值或人為主觀設定閾值進行風電機組運行狀態(tài)監(jiān)測的問題,提高了狀態(tài)決策模型的預測精度和泛化性。

2 數(shù)據(jù)預處理

2.1 SCADA 數(shù)據(jù)說明

本文所采用的SCADA 數(shù)據(jù)是河北某風電場1.5 MW 雙饋式風力發(fā)電機組的運行數(shù)據(jù)。該風電場的風電機組切入風速為3 m/s,切出數(shù)據(jù)為25 m/s。SCADA 數(shù)據(jù)每10 min 記錄一條,為了消除偶發(fā)性的故障對主軸溫度預測模型的影響,本文共選取該風電場1.5 MW 機組共36 臺機組,包括23 臺主軸承正常機組,13 臺主軸承異常機組。這36 臺風電機組生產(chǎn)廠家和型號相同,并且都是同一個風電場的風電機組,因此所利用的風資源和地理環(huán)境相似,能夠表征該風電場的所有運行工況。SCADA 時序數(shù)據(jù)包括時間、風速、風向、有功功率、發(fā)電機轉(zhuǎn)速、葉輪轉(zhuǎn)速、偏航角度、環(huán)境溫度、齒輪箱油溫等百余個有效觀測數(shù)據(jù)。表1為部分SCADA 有效數(shù)據(jù)。

表1 SCADA 數(shù)據(jù)示例Table 1 Examples of SCADA data

2.2 數(shù)據(jù)清洗

由于風電機組本身和SCADA 系統(tǒng)在運行過程中掉電、傳感器損壞、系統(tǒng)宕機、通信設備故障等因素造成SCADA 數(shù)據(jù)中夾雜著很多異常噪聲數(shù)據(jù)。在建模前首先對數(shù)據(jù)進行清洗,其過程如下:

1)采用分區(qū)間方法按風速0.5 m/s 劃分子工況區(qū)間;

2)將小于切入風速、大于切出風速、有功功率小于或等于0 的數(shù)據(jù)剔除;

3)采用統(tǒng)計學中的四分位原理[11]對每個子工況區(qū)間的SCADA 數(shù)據(jù)進行清洗。

為說明去除異常噪聲數(shù)據(jù)的效果,本文對2.1節(jié)提到的風電機組歷史SCADA 數(shù)據(jù)進行了異常噪聲數(shù)據(jù)去除,如圖2 所示。圖2(a)為該風電機組歷史SCADA 數(shù)據(jù)過濾前的風速功率曲線圖,圖2(b)為過濾后的風速功率曲線圖。

圖2 SCADA 數(shù)據(jù)過濾前后風功率對比圖Fig.2 Contrast chart of the wind-power before and after SCADA data filtering

2.3 特征數(shù)據(jù)提取

風電機組SCADA 數(shù)據(jù)中并非所有的時序數(shù)據(jù)均與風電機組主軸承溫度相關(guān),為提高風電機組主軸承溫度預測模型精度,同時降低模型訓練時長,選取與風電機組主軸承運行狀態(tài)相關(guān)的特征子集。傳統(tǒng)的特征篩選方式為利用皮爾森相關(guān)系數(shù)或根據(jù)工程師相關(guān)經(jīng)驗進行確定,皮爾森相關(guān)系數(shù)對數(shù)據(jù)的要求必須服從正態(tài)分布,但風電機組由于棄風、限電等運行工況的變化導致SCADA數(shù)據(jù)并不符合正態(tài)分布,且皮爾森相關(guān)系數(shù)受到數(shù)據(jù)異常值的影響較大,僅適用于某些特定場合下的風電場或風電機組。鑒于此,本文選取相關(guān)系數(shù)收斂快、可解釋性好且對數(shù)據(jù)分布沒有特殊要求的斯皮爾曼相關(guān)性分析方法提取直接或者間接反映風電機組主軸承溫度特征的參數(shù)集[12],斯皮爾曼相關(guān)系數(shù)的計算步驟為:

1)SCADA 數(shù)據(jù)特征中主軸承溫度定義為Y,其他特征定義為Xi,將Xi和Y列所對應的數(shù)據(jù)轉(zhuǎn)換為各自列向量的排名,記為R(Xi) 和R(Y)。

2)兩個列向量中對應數(shù)據(jù)R(Xi) 和R(Y) 之間的差異d為

兩個列向量之間的相關(guān)性Rs為

式中:i為每一列SCADA 特征數(shù)據(jù);N為SCADA數(shù)據(jù)特征的長度。斯皮爾曼系數(shù)高于0.5 時特征之間的相關(guān)性為強相關(guān),因此,通過斯皮爾曼相關(guān)性系數(shù)分析,得到SCADA 數(shù)據(jù)中與主軸承溫度相關(guān)性較高的特征,見表2 所示。因此,選取發(fā)電機轉(zhuǎn)速、葉輪轉(zhuǎn)速、機艙溫度等10 個特征。

表2 斯皮爾曼相關(guān)性系數(shù)Table 2 Spearman correlation coefficient

提取的特征數(shù)據(jù)中往往具有不同的量綱和量綱單位,為了消除特征數(shù)據(jù)之間的量綱影響,將數(shù)據(jù)歸一化處理,計算公式為

式中:x為每一個SCADA 特征數(shù)據(jù);xmean為特征數(shù)據(jù)的均值;xmax為特征數(shù)據(jù)的最大值;xmin為特征數(shù)據(jù)的最小值;xn為歸一化以后的特征數(shù)據(jù)。

3 基于LightGBM 的風電機組主軸承溫度預測

3.1 LightGBM 算法

極限梯度提升(eXtreme gradient boosting,XGBoost)算法是在自適應增強(adaptive boosting,adaBoost) 算法和梯度提升迭代決策樹(gradient boosting decision tree,GBDT)算法基礎上優(yōu)化形成的算法[13],具有良好的預測精度和分類準確率,在眾多領(lǐng)域得到了廣泛的應用。但XGBoost 算法普遍存在訓練耗時長、內(nèi)存占比大等缺點。針對這些缺點,Ke 等[14]做了相應的改進,并在2017 年提出了LightGBM 算法。LightGBM 算法無需計算所有樣本信息增益,具有訓練效率高、低內(nèi)存、高準確率、并行化學習等優(yōu)勢,較適合于工程實踐。

LightGBM 使用直方圖算法替換了GBDT 的預排序,能夠在不損害準確率的前提下加快GBDT 模型的訓練速度[15]。為保證結(jié)果準確性,算法使用梯度單邊采樣技術(shù)過濾大部分小梯度數(shù)據(jù),在計算信息增益的時候只利用具有高梯度的數(shù)據(jù)信息;為大幅度減少占用內(nèi)存,采用獨立特征合并技術(shù)實現(xiàn)互斥特征的捆綁,減少樣本特征數(shù)據(jù)[16]。

假設訓練一個具有T棵樹的LightGBM 模型,給定數(shù)據(jù)集為D={(xi,yi)|i=1,2,···,n,xi∈Rm,yi∈R},其中給定的數(shù)據(jù)集共有n個樣本,每個樣本xi對應m個特征和一個標簽值yi。LightGBM算法在迭代過程中,假設在前一輪迭代中得到的強學習器是ft?1(x),損失函數(shù)為L(y,ft?1(x)),為了讓本輪迭代的損失函數(shù)最小,本輪迭代的目的是找到分類回歸樹模型的弱學習器ht(x),如式(1)所示:

利用損失函數(shù)負梯度擬合本輪損失函數(shù)近似值,從而擬合一個樹模型。第t輪的第i個樣本的損失函數(shù)L(yi,f(xi))的負梯度rti為

利用(xi,xti) 擬合一個CART 回歸樹,進而得到t棵回歸樹所對應的葉子節(jié)點的范圍為 Rti,i=1,2,···,J。其中J為葉子節(jié)點的樣本,當損失函數(shù)最小時擬合葉子節(jié)點輸出值ct j為

式中:c是損失函數(shù)最小化時的常數(shù)值;xi∈Rt j表示樣本xi屬于第t棵樹下的第j個葉子節(jié)點。本輪的決策樹擬合函數(shù)為

式中:I(xi∈Rt j)是指示函數(shù),當xi∈Rt j時,指示函數(shù)的值為1,反之為0[17]。進而本輪最終得到的強學習器的表達式為

3.2 溫度預測模型建立

選用10 臺主軸承正常機組的歷史SCADA 數(shù)據(jù)共38955 組,按上述方法進行預處理后得到共25946 組數(shù)據(jù)。將數(shù)據(jù)集80%作為訓練集,數(shù)據(jù)集20%作為測試集。本文所有試驗運行環(huán)境均為:操作系統(tǒng)為Windows10、python 版本為3.7.1、集成開發(fā)運行環(huán)境為anaconda3,LightGBM 算法、XGBoost 算法和隨機森林算法調(diào)用sklearn 的API。后續(xù)使用的AC-GAN 生成對抗神經(jīng)網(wǎng)絡調(diào)用kears 深度學習框架API,NGBoost 算法調(diào)用斯坦福的NGBoost 框架。

對比分析LightGBM 算法、XGBoost 算法、CatBoost(categorical boosting)算法在風電機組訓練主軸承溫度預測模型的精度,如表3 所示。

表3 LightGBM、XGBoost 和CatBoost 建模性能比較Table 3 LightGBM,XGBoost,and Cat Boost modeling performance comparison

采用模型訓練時間、均方根誤差RMSE 和決定系數(shù)r2指標對建模精度進行評價,計算公式為

式中:yi為第i個主軸承溫度的真實測量值;為第i個主軸承溫度的預測值;為主軸承溫度的真實測量值的均值。LightGBM 算法在均方根誤差RMSE、決定系數(shù)r2指標和訓練時間上均優(yōu)于XGBoost 算法和CatBoost 算法。表4 為Light-GBM、XGBoost 和CatBoost 這3 種算法在測試集樣本中殘差特征對比。LightGBM 算法在測試集上的殘差最大值為0.129,殘差均值為0.022,基于LightGBM 的風電機組主軸承溫度預測在測試集上 具有較高的預測精度。

表4 3 種算法測試集殘差特征對比Table 4 Comparison of residual characteristics of three algorithms in test data

基于LightGBM 算法的主軸承溫度預測模型在測試集上的殘差見圖3 所示。

圖3 主軸承溫度模型測試集殘差Fig.3 Residual error of the main bearing temperature model in the test data

4 基于AC-GAN 的主軸承溫度殘差重構(gòu)

基于AC-GAN 的主軸承溫度殘差重構(gòu)方法具體步驟為:首先,采用SPC 方法將主軸承異常機組殘差在控制范圍內(nèi)的正常殘差數(shù)據(jù)剔除;其次,將控制范圍之外的異常殘差數(shù)據(jù)作為訓練數(shù)據(jù),采用AC-GAN 生成對抗網(wǎng)絡生成與真實數(shù)據(jù)分布相似的數(shù)據(jù)替換被剔除的數(shù)據(jù)。

4.1 基于SPC 的殘差特征提取

SPC 方法最初主要用來監(jiān)測生產(chǎn)產(chǎn)品中的質(zhì)量問題,如果生產(chǎn)過程中出現(xiàn)隨機質(zhì)量問題說明此過程處于統(tǒng)計過程當中,如果出現(xiàn)故障問題說明此過程處于失控狀態(tài)[18]。

假設某產(chǎn)品在生產(chǎn)過程中的質(zhì)量特征沒有顯著的非正態(tài)因素,而是由很多隨機原因?qū)е拢瑒t認為該質(zhì)量特性服從正態(tài)分布[19]。其質(zhì)量特征X服從均值為 μ,標準差為 σ 的正態(tài)分布,則概率密度分布函數(shù)為

質(zhì)量特征在 [μ?3σ,μ+3σ] 的概率為0.9973,則認為在該范圍內(nèi)的數(shù)據(jù)是可控的,范圍之外為不可控。因此,本文主軸承異常機組溫度殘差中設定 [μ?3σ,μ+3σ] 的范圍,范圍內(nèi)的殘差為正常殘差,范圍之外為異常殘差,其中μ和σ為主軸承正常機組測試集溫度殘差的均值和標準差。利用SPC 方法可以提取主軸承異常機組殘差中的特征,將殘差中正常殘差進行剔除。

由文獻[20]研究得知,軸承類故障在發(fā)生故障前一個月會有明顯的劣化趨勢,因此選取風電機組主軸承故障發(fā)生前一個月的SCADA 數(shù)據(jù)進行試驗。圖4 為某機組主軸承故障發(fā)生前一個月的溫度殘差,紅線為μ?3σ 下控制線,藍線為μ+3σ 上控制線,由圖可知故障發(fā)生前并不是所有的殘差都超出控制線范圍。采用AC-GAN 生成對抗網(wǎng)絡重構(gòu)主軸承異常機組溫度殘差序列,得到異常主軸承下的殘差特征,解決異常樣本數(shù)據(jù)的標記問題,進而提高了后續(xù)主軸承狀態(tài)決策模型的預測精度。

圖4 某機組故障發(fā)生前一個月溫度殘差Fig.4 Residual diagram of one month before a unit failure

4.2 AC-GAN 算法介紹

生成對抗網(wǎng)絡(generative adversarial networks,GAN)是一種無監(jiān)督學習方法,包含生成器G(generator)和判別器D(discriminator)兩部分。

將噪聲信號z映射到樣本空間,通過生成器G得到生成樣本數(shù)據(jù)Xfake=G(z),將生成樣本Xfake或真實樣本數(shù)據(jù)Xreal輸入判別器D進而判定概率P(S|X)=D(X),表示判別樣本X屬于S的概率。由于Xreal是真實數(shù)據(jù),所以判別器判定概率接近于1,Xfake是經(jīng)生成器生成的數(shù)據(jù)并經(jīng)過判別器判定是否真實。GAN 的目標函數(shù)為

目標函數(shù)包含生成器目標函數(shù)和判別器目標函數(shù),其中生成器目標函數(shù)為

判別器的目標函數(shù)為

GAN 訓練過程中,G和D二者交替訓練,相互博弈,最終使G生成的樣本符合真實樣本概率分布,達到納什均衡。GAN 在訓練過程中無需先驗概率即能學習真實樣本的分布,但同時GAN對初始參數(shù)極其敏感,輸入G的隨機噪聲信號無約束,導致生成數(shù)據(jù)概率分布與真實數(shù)據(jù)差異大,訓練過程難以收斂,使整個訓練過程出現(xiàn)震蕩,發(fā)生模式崩潰[21-22]。為了解決上述問題,文獻[23]提出了帶標簽輔助分類器的生成對抗網(wǎng)絡ACGAN,在傳統(tǒng)GAN 基礎上增加了噪聲數(shù)據(jù)對應的標簽c,使用兩者來生成Xfake=G(c,z),判別器計算生成數(shù)據(jù)的概率分布P(S|X) 和類標簽上的概率分布P(c|X)分別為

式中:c={0,1,2,···,n},n表示樣本類數(shù)。真實樣本數(shù)據(jù)標記為正常溫度殘差(c=0) 和異常溫度殘差(c=1),AC-GAN 通過內(nèi)部博弈,最終實現(xiàn)主軸承異常機組溫度殘差的重構(gòu)。

4.3 基于AC-GAN 的溫度殘差重構(gòu)

AC-GAN 生成器和判別器均采用RNN 神經(jīng)網(wǎng)絡,輸入層為32 個神經(jīng)單元,隱含層有3 層神經(jīng)單元,輸出層為1 個神經(jīng)單元,激活函數(shù)為sigmoid,損傷函數(shù)為均方誤差。AC-GAN 生成對抗網(wǎng)絡的基本框架見圖5。

圖5 AC-GAN 對抗神經(jīng)網(wǎng)絡生成殘差的基本框架Fig.5 Basic framework for the AC-GAN to generate residuals

溫度殘差重構(gòu)具體步驟為:

1)將主軸承發(fā)生故障前一個月的SCADA 特征數(shù)據(jù)輸入至基于LightGBM 的主軸承溫度預測模型,計算得到一個月內(nèi)的主軸承異常機組溫度殘差。

2) 采用SPC 控制圖將主軸承異常機組殘差在控制范圍內(nèi)的正常溫度殘差數(shù)據(jù)剔除。

3)定義控制線之外的殘差數(shù)據(jù)為訓練樣本數(shù)據(jù),采用AC-GAN 算法生成與真實樣本數(shù)據(jù)分布相似的殘差數(shù)據(jù),用來重構(gòu)剔除的正常溫度殘差2)中剔除的正常溫度殘差。

5 基于NGBoost 的主軸承運行狀態(tài)決策

NGBoost 算法由斯坦福吳恩達團隊在2019年10 月提出的,最初是用于預測不確定性估計的天氣預測和醫(yī)療保健等領(lǐng)域[24]。該算法使用自然梯度的Boosting 方法,這種方法可直接在輸出空間中得到全概率分布,用于預測量化不確定性。NGBoost 算法區(qū)別于其他Boosting 算法是因為該算法可以返回每個預測的概率分布,NGBoost 通過預測參數(shù)θ,產(chǎn)生概率密度為Pθ(y|x) 的概率預測。NGBoost 使用自然梯度來學習參數(shù),使得優(yōu)化問題不受參數(shù)化的影響,隨后在GBM 的框架下讓每個基學習器去擬合自然梯度,最后經(jīng)過放縮和加權(quán)組合,得到一個集成模型的參數(shù),由此可以學習最終條件分布參數(shù),從而達到概率預測的目的。NGBoost 作為一種梯度提升算法,使用自然梯度(natural gradient)解決現(xiàn)有梯度提升方法難以處理的通用概率預測的技術(shù)難題,NGBoost在不確定性估計和傳統(tǒng)指標上的預測能力具有相當大的優(yōu)勢[25]。

對于自然梯度,首先定義得分規(guī)則為S,這個得分規(guī)則與概率分布P和輸出值y相關(guān),記為S(P,y)。對于正確的概率分布,并期望取得最佳值,概率預測越準確,損失越小,故有

式中:Q為正確的概率分布;P為預測的概率分布。定義得分規(guī)則的散度:

得分規(guī)則定義需要使得散度非負,并且能夠測量分布間的距離。如果得分規(guī)則定義為MIF,則

如果得分規(guī)則定義為CRPS(連續(xù)概率排位分數(shù)),則

式中F為累計概率分布函數(shù)。本來定義CRPS 為

CRPS 對于真實概率,其值最小,散度非負,度量分布距離符合規(guī)則的定義要求。對于選擇的得分規(guī)則S(θ),滿足 E[?S(θ)]=0,對L關(guān)于 θ 求導有

最終的梯度為

對于MIF,有

對于CRPS,有

風電機組的主軸承溫度殘差同樣是一種不確定估計,對主軸承狀態(tài)監(jiān)測實質(zhì)也是一種故障發(fā)生不確定性的概率預測,因此可利用該算法建立主軸承運行狀態(tài)決策模型。

為使降低故障決策中單點誤報,獲得較高的預測準確度,本文按天提取主軸承溫度殘差的最大值、最小值、均值、偏度、峰度、中位數(shù)、方差、標準差8 個特征,將主軸承正常機組的溫度殘差標簽設置為0,主軸承異常機組重構(gòu)的溫度殘差標簽設置為1。

6 實例應用驗證

本實驗所采用的SCADA 數(shù)據(jù)為河北某風電場的歷史數(shù)據(jù)。選取機組編號為07#、09#、23#、31#、32#、41#、14#、11#、71#、81#,10 臺主軸承正常機組,選取編號為69#、37#、84#、88#、99#、15#、96#、86#、13#、70#的10 臺主軸承異常機組,共計20 臺機組。通過基于LightGBM 的主軸承溫度預測模型計算各機組主軸承溫度殘差,對于異常機組通過AC-GAN 算法重構(gòu)殘差值。提取主軸承正常機組和主軸承異常機組8 個溫度殘差特征作為狀態(tài)決策模型輸入,預測的主軸承正常或異常的概率值作為狀態(tài)決策模型輸出。由于主軸承正常機組標簽設置為0,異常機組標簽設置為1,因此,輸出概率在0.5 以上可判斷為異常狀態(tài),0.5以下判斷為正常狀態(tài)。溫度殘差特征80%用于訓練狀態(tài)決策模型,剩余20%用于測試模型的準確度。按上述流程提取殘差特征后共得到938 組數(shù)據(jù)。對比分析NGBoost、XGBoost 和隨機森林3 種算法在殘差重構(gòu)前后測試樣本中的準確性。

NGBoost 算法在測試集上的準確為0.875,混淆矩陣見圖6(a)。采用同樣的特征提取方法提取沒有經(jīng)過殘差重構(gòu)的特征,在測試集上的準確度為0.660,混淆矩陣見圖6(b)。XGBoost 算法在測試集上的準確為0.843,混淆矩陣見圖7(a)。采用同樣的特征提取方法提取沒有經(jīng)過殘差重構(gòu)的特征,在測試集上的準確度為0.651,混淆矩陣見圖7(b)。

圖6 殘差重構(gòu)前后故障決策模型混淆矩陣(NGBoost 算法)Fig.6 Confusion matrix of the fault decision model before and after residual reconstruction(NGBoost algorithm)

圖7 殘差重構(gòu)前后故障決策模型混淆矩陣(XGBoost 算法)Fig.7 Confusion matrix of the fault decision model before and after residual reconstruction(XGBoost algorithm)

隨機森林算法在測試集上的準確為0.750,混淆矩陣見圖8(a)。采用同樣的特征提取方法提取沒有經(jīng)過殘差重構(gòu)的特征,在測試集上的準確度為0.642,混淆矩陣見圖8(b)。

圖8 殘差重構(gòu)前后故障決策模型混淆矩陣(隨機森林算法)Fig.8 Confusion matrix of the fault decision model before and after residual reconstruction (random forest algorithm)

實驗結(jié)果表明:在同等條件下,NGBoost 算法在風電機組主軸承狀態(tài)決策模型中優(yōu)于XGBoost 算法和隨機森林算法。而且NGBoost、XGBoost 和隨機森林3 種算法經(jīng)過殘差重構(gòu)的狀態(tài)決策模型的準確度分別提高了21.5%、19.2%、10.8%,說明基于AG-GAN 的數(shù)據(jù)重構(gòu)對風電機組主軸承運行狀態(tài)具有良好的預測準確度。

下一步,選取未參與模型訓練和測試的6 臺機組用來驗證基于殘差重構(gòu)和NGBoost 算法下的準確性和泛化性。選取主軸承正常機組編號為08#、65#、66#,主軸承異常機組編號為10#、85#、91#。

10#機組在2019 年3 月28 號巡檢時發(fā)現(xiàn)該機組主軸承振動過大,需要更換主軸承,選取2019年3 月1 號到2019 年3 月30 號的數(shù)據(jù)。85#機組在2019 年4 月1 號巡檢時有異常響聲,經(jīng)廠家檢查發(fā)現(xiàn)該機組主軸承電腐蝕嚴重,因振動導致平衡環(huán)境存在輕微開裂跡象,選取2019 年3 月8 號到4 月4 號的數(shù)據(jù)。91#機組在2019 年10 月13 號發(fā)生主軸承開裂故障,選取2019 年9 月16 號到10月16 號的數(shù)據(jù)。正常機組隨機選取一個月的數(shù)據(jù)。

對比分析表5、6,正常機組編號為08#的機組在經(jīng)過殘差重構(gòu)后預測的準確率提升了28%,65#機組的準確率提升了3%,66#機組的準確率提升了1%。對比分析表7、8,異常機組編號為10#的機組在經(jīng)過殘差重構(gòu)后預測的準確率提升了17%,85#機組的準確率提升了15%,91#機組的準確率提升了7%。

表5 正常機組未經(jīng)過殘差重構(gòu)時的概率預測值Table 5 Probability prediction value of the normal wind turbine without residual reconstruction

表6 正常機組經(jīng)過殘差重構(gòu)時的概率預測值Table 6 Probability prediction value of the normal wind turbine after residual reconstruction

表7 異常機組未經(jīng)過殘差重構(gòu)時的概率預測值Table 7 Probability prediction value of the abnormal wind turbine without residual reconstruction

表8 異常機組經(jīng)過殘差重構(gòu)時的概率預測值Table 8 Probability prediction value of the abnormal wind turbine after residual reconstruction

7 結(jié)束語

本文以風電機組主軸承為研究對象,針對狀態(tài)監(jiān)測和故障預警中人為設定閾值的相關(guān)問題,提出了基于AC-GAN 數(shù)據(jù)重構(gòu)的風電機組主軸承狀態(tài)監(jiān)測方法,得到如下結(jié)論:

1)采用LightGBM 算法建立主軸承溫度殘差預測模型,并將XGBoost 算法、CatBoost 算法與之對比分析,在同等條件下,LightGBM 算法在主軸承溫度建模中綜合性能優(yōu)于XGBoost 算法和Cat-Boost 算法。

2)采用滑動窗口提取主軸承異常機組殘差,利用SPC 方法對主軸承異常溫度殘差在控制線范圍內(nèi)進行篩選,并利用AC-GAN 算法對殘差序列進行重構(gòu),解決了人為設定閾值的相關(guān)問題,提升了主軸承異常和正常數(shù)據(jù)標簽標注的準確率。

3)在同等條件下,NGBoost 算法在風電機組主軸承狀態(tài)決策模型中優(yōu)于XGBoost 算法和隨機森林算法。而且,NGBoost、XGBoost 和隨機森林3 種算法經(jīng)過殘差重構(gòu)的狀態(tài)決策模型的準確度分別提高了21.5%、19.2%、10.8%,選擇6 臺機組進行測試分析(3 臺主軸承正常機組,3 臺主軸承異常機組),均能夠判斷正確。基于NGBoost 的狀態(tài)決策模型的平均準確率從60.5%(無殘差序列重構(gòu))提升至72.3%(利用殘差數(shù)據(jù)重構(gòu))。

猜你喜歡
故障模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
故障一點通
3D打印中的模型分割與打包
奔馳R320車ABS、ESP故障燈異常點亮
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
故障一點通
故障一點通
故障一點通
主站蜘蛛池模板: 无码人妻热线精品视频| 欧洲亚洲欧美国产日本高清| 麻豆国产在线不卡一区二区| 黄色网页在线播放| 中文天堂在线视频| 欧美福利在线| 露脸一二三区国语对白| 亚洲欧美另类久久久精品播放的| 亚洲中字无码AV电影在线观看| 久久久久国产一级毛片高清板| 亚洲男人的天堂在线观看| 四虎永久在线精品国产免费| 香蕉99国内自产自拍视频| 高潮爽到爆的喷水女主播视频| 97色伦色在线综合视频| 91色老久久精品偷偷蜜臀| 一级毛片a女人刺激视频免费| 嫩草国产在线| 五月婷婷导航| 成人一级黄色毛片| 国产精品女主播| 日韩毛片免费观看| 伊人激情综合网| 亚洲欧美在线看片AI| 国产精品中文免费福利| 青草精品视频| 国产午夜在线观看视频| 试看120秒男女啪啪免费| 国产成人高清精品免费软件 | 人妻精品久久无码区| 九色91在线视频| 六月婷婷综合| 蜜臀AV在线播放| 亚洲人成网址| 日韩毛片基地| 伊人色在线视频| 99这里只有精品在线| 91无码网站| 在线看片免费人成视久网下载| 精品国产aⅴ一区二区三区| 久久精品国产免费观看频道| 亚洲色婷婷一区二区| 依依成人精品无v国产| 高清精品美女在线播放| 91无码视频在线观看| 国产成人一区二区| 国产丝袜啪啪| 国内精品91| 亚洲区欧美区| 国产精品hd在线播放| 第一页亚洲| 国产亚洲高清在线精品99| 91在线无码精品秘九色APP| 黄色片中文字幕| 毛片网站在线看| 国产网友愉拍精品视频| 久久伊人操| 美美女高清毛片视频免费观看| 亚洲妓女综合网995久久| 亚洲水蜜桃久久综合网站| 狠狠色噜噜狠狠狠狠色综合久| 亚洲嫩模喷白浆| 欧美区国产区| 女同久久精品国产99国| 日韩成人高清无码| 国产专区综合另类日韩一区 | av午夜福利一片免费看| 亚洲精品老司机| 亚洲精品777| 国产爽妇精品| 91年精品国产福利线观看久久| 国产精品永久在线| 精品久久久久成人码免费动漫| 国产成人a在线观看视频| 69国产精品视频免费| 久久婷婷六月| 中文天堂在线视频| 欧美另类一区| 综合人妻久久一区二区精品| 人妻21p大胆| 性色一区| 久久夜色撩人精品国产|