趙翰馳 姜鳳敏 任妍
摘 要:針對傳統的模型在風力發電機異常識別過程中存在識別準確率差的問題,本文提出基于CNN的異常識別方法。將輸入的屬性值數據轉換為方陣生成許多大小相同的風機屬性圖片,通過訓練海量圖片,不斷調整模型參數,得出CNN模型各層結構,通過圖片的二分類問題實現風機狀態的判斷。
關鍵詞:風力發電機;SCADA數據;識別;卷積神經網絡(CNN)
中圖分類號:TP0391.41 文獻標識碼:A 文章編號:1671-2064(2018)21-0128-03
1 引言
風機SCADA數據經過數據清洗和先聚類后類內降維的預處理后,可以作為本文異常識別模型的有效輸入,但數據量仍然較為龐大,所以我們既需要解決因屬性較多導致數據量龐大的問題,還要找尋有效的二分類方法實現正異常的準確分類[1-2]。卷積神經網絡(CNN) 具有強大的非線性映射能力,在解決數據量大、屬性多的問題有較好的應用性,同時也避免了需要特征提取的復雜性[3-4],亦可通過圖片分類的形式實現二分類問題[5]。
卷積神經網絡(CNN)是一種前饋人工神經網絡,是一種廣泛應用的深度學習算法[6-8]。CNN主要用來識別位移、縮放及其他形式扭曲不變性的二維圖形。由于CNN的特征檢測層通過訓練數據進行學習,所以在使用CNN時,避免了顯式的特征抽取,而隱式地從訓練數據中進行學習[9-10]。CNN的這些特點符合我們的需求,可用于實現風機的異常識別。
2 卷積神經網絡設計步驟
在使用CNN進行風機異常識別時,輸入數據需要被組織為具有相同尺寸的歸一化的圖像以被饋送到CNN中。所提出的識別模型由歸一化層,兩個卷積層,兩個池化層,完全連接的分類層組成。
2.1 歸一化層
由于CNN的輸入需要被標準化為相同的尺寸,特此引入歸一化層。首先,找到輸入到歸一化層的圖像最大值和最小值及其對應位置;然后使用下采樣方法將其歸一化為所需大小;最后更換最大值和最小值。在提出的模型中加入歸一化層不僅可以帶來很多方便,而且可以節省計算時間。
2.2 卷積層
卷積層是CNN的核心部分,主要起到特征提取的作用。卷積層包括卷積和非線性兩個操作繼而生成幾個特征圖。每個特征圖是某些區域中輸入風機屬性圖像的特定特征表示,卷積運算可以通過(2.1)表示。
(2.1)
其中,*代表卷積操作;是輸出的第個特征圖;是可訓練的卷積核(也稱過濾器);是第個輸入。卷積運算用權值共享和稀疏連接這兩個重要概念來提高網絡的性能。
2.3 池化層
除了卷積操作之外,CNN的另一個重要操作是池化操作。該操作可以顯著減少特征圖的大小。最大池化操作和平均池化操作是兩種常見的池化操作。首先將輸入分成幾個具有相同大小的非重疊矩形區域,最大池化操作得到矩形區域內的最大值。平均池化操作得到矩形區域內的平均值。
2.4 全連接層
經過兩次卷積和池化操作,特征圖顯著變小,將特征圖進行全連接轉換為1-D矢量并饋送到全連接層。通常,全連接層由三個完全連接的層組成,本文采用的全連接層是一個包含三層的傳統神經網絡。
2.5 分類層
在本文中,分類層采用的激活函數為S型功能函數,這對于風機有無異常這個二分類問題是足夠的,其中輸出0代表風機異常,1代表風機正常,采用準則(2.2)判定風機狀態,分類的準確率根據式(2.3)、(2.4)、(2.5)統計。
(2.2)
其中Y代表輸出的狀態量。
(2.3)
(2.4)
(2.5)
其中,表示風機處于異常狀態下分類的準確率,(true abnormal)是其正確分類的統計,(false abnormal)是其錯誤分類的統計;統計風機處于健康狀態下的準確率,(true health)是其正確分類的統計,(false health)是其錯誤分類的統計;是綜合的準確率。
本文的CNN模型結構圖如圖1所示。
2.6 總體模型結構
CNN的行輸入是每個類別降維后的屬性之和即X,列輸入為采樣點。輸入數據均在標準化層歸一化為許多大小為(X×X)的相同尺寸的圖片作為模型的輸入,每個輸入圖片代表風機(X×n)min內的屬性特征,其中n代表采樣間隔。首先,第一個卷積層卷積個大小為b×b的內核,且×b,表示輸出特征圖的數量,輸出特征圖的大小為(x-b+1)×(x-b+1)使用帶有2×2的濾波器和步幅為2的最大池化層進行跟蹤,使得該層輸出個大小為的特征圖;然后,第二個卷積層用c個大小為d×d的內核卷積上一層的結果,該層將輸出c個尺寸為 的特征圖,且保持激活次數(特征圖的數目乘以像素位數)從一層到下一層不減少的原則來選擇內核的數量。第二個池化層與第一個具有相同的結構,它將生成c個分辨率為的特征圖;最后將這些圖轉換成矢量饋送到由三層組成1-D的全連接層,通過分類層實現狀態判斷。
3 仿真及結果
3.1 卷積神經網絡參數配置
總體模型中設置如表1所示。
3.2 第一類屬性發生單項異常
訓練樣本為2萬個大小為的風機屬性圖片,其中包含多種異常,測試樣本為100個大小為的風機屬性圖片,其中只包含齒輪箱后軸承溫度過熱這一種異常。且用于訓練和測試的樣本均含有大量地因包括因工況造成數據變化異常的樣本。
圖2(a)(b)中前三行是第一類屬性的色彩顯示,顯而易見健康狀態下的風機第一類屬性值顏色較淺,只有小范圍的波動或者個別時間點的跳動,而圖2(c)(d)處于異常狀態下的風機,如紅虛線所標識的地方顏色明顯變深,并且時間連續,與圖2(a)(b)顯著不同,異常明顯。
3.3 第六類屬性發生多項異常
訓練樣本與3.1中用到的樣本相同完全一致,測試樣本為100個大小為的風機屬性圖片,其中只包含同一時刻發電機轉速和齒輪箱轉速都顯著降低這兩種異常。
圖3中第16~18行是第六類屬性的色彩顯示,如圖中紅虛線所示。等同于圖2(a)(b),第六類屬性健康狀態下的風機屬性值顏色較淺,只有小范圍的波動或者個別時間點的跳動,而圖3(c)(d)處于異常狀態下的風機屬性值前兩行顏色明顯變深,圖3(c)(d)對比圖3(c)(d)異常顏色值變化更加劇烈,范圍更加廣,異常程度可以明顯在圖中呈現。
4 結語
基于CNN的風力發電機的異常識別,首先確定輸入CNN模型的圖片大小,其次設置模型各個卷積層、池化層的大小與數目,以確定我們的模型結構,然后通過實驗驗證CNN模型可識別異常;于傳統的基于某一屬性建模,只能發現單類屬性異常的局限性,CNN模型的輸入樣本由完整的風機圖像片段提供,其中包含全面的異常信息,可有效實現多類屬性的異常識別。
參考文獻
[1]梁穎,方瑞明.基于SCADA和支持向量回歸的風電機組狀態在線評估方法[J].電力系統自動化,2013,37(14):7-12.
[2]Chehouri A,Younes R. Review of performance optimization techniques applied to wind turbines[J].Appl Energy,2015,142:361-88.
[3]趙洪山,胡慶春,李志為.基于統計過程控制的風機齒輪箱故障預測[J].電力系統保護與控制,2012,40(13):67-73.
[4]Meik S, Ilmar F.Wind turbine condition monitoring based on SCADA data using normal behavior models[J].Applied Soft Computing,2014,447-460.
[5]謝平,楊玉昕.基于局部均值分解的滾動軸承故障診斷新方法[J].計量學報,2014,35(1):73-773.
[6]Maaten L, Hinton G. Journal of Machine Learning Research[J].2008,9: 2579-2605.
[7]LeCun Y, Ranzato M. Deep learning tutorial[C].Tutorials in International Conference on Machine Learning,2013,14:11-19.
[8]Convolutional Neural Network[Online].Available at https://en.wikipedia.org wiki/Convolutional_neural_network.2016,10:24-29.
[9]Wang X,Zhang W,Qiang J I. A Kernel PCA Shape Prior and Edge Based MRF Image Segmentation[J]. Chinese Journal of Electronics,2016,25(5):892-900.
[10]Chen Y,Jiang H,Li C,Jia X.Deep feature extraction and classification of hyperspectral images based on convolutional neural networks.IEEE Trans Geosci. Remote Sens,2016,10:6232-6251.