999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進Adaboost-SVM的風機葉片覆冰檢測

2023-06-07 09:42:56冉浦東張子凡龐成鑫黃墀志
計算機應用與軟件 2023年5期
關(guān)鍵詞:分類模型

冉浦東 范 磊 張 軍 張子凡 龐成鑫* 黃墀志

1(上海電力大學電子與信息工程學院 上海 201306) 2(國電南瑞南京控制系統(tǒng)有限公司 江蘇 南京 210000)

0 引 言

風電作為可再生的清潔能源越來越受到國家和社會的重視,我國的北方和沿海地區(qū)是風電場分布最密集的地區(qū),在秋冬寒冷季節(jié)極易發(fā)生葉片覆冰現(xiàn)象[2]。風電機組在運行時出現(xiàn)葉片覆冰現(xiàn)象會使風機的發(fā)電量降低甚至停機而且葉片覆冰會縮短風機的使用壽命甚至導致葉片折斷或者風機倒塌[2]。風力發(fā)電機的故障檢測研究可以提高其運行可靠性,降低運維成本,這對于目前風電設備由于故障頻發(fā)所帶來的高昂的運維成本來說極具經(jīng)濟價值[3]。本文提出的算法是一種以SVM模型作為基分類器的自適應提升算法(Adaptive Boosting,Adaboost),能夠有效地提升風力發(fā)電機葉片覆冰故障檢測準確率和模型的泛化能力。

1 算法原理

1.1 支持向量機

支持向量機(SVM)是一種以統(tǒng)計學和結(jié)構(gòu)風險最小化為理論基礎的機器學習經(jīng)典方法[4],其核技巧是把低維樣本空間中線性不可分的問題使用核函數(shù)映射到高維空間,使其在高維空間中線性可分并尋求距離兩類樣本的最優(yōu)分類超平面[5]。SVM對于非線性的分類問題有著非常好的分類效果,非常適合應用于風機葉片覆冰的檢測。在實際應用中效果也很好,對風機葉片覆冰檢測的準確率也很高,但是在對結(jié)冰數(shù)據(jù)的查全率方面還有提升的空間。

1.2 Adaboost原理

Adaboost算法是一種迭代算法,首先初始化樣本權(quán)重,使每一個樣本權(quán)重相同,使用樣本集訓練第一個基分類器模型,根據(jù)分類結(jié)果調(diào)整樣本的權(quán)重,被分類錯誤的樣本權(quán)值會增加,分類正確的樣本權(quán)值會降低,通過這樣的方式來聚焦于那些難分的樣本,使這些樣本在下一輪分類中更容易被分類正確[6-7]。經(jīng)過多次迭代訓練生成多個差異化的基分類器,最終的學習結(jié)果取決于多個基分類器分類結(jié)果的策略組合,其目的是通過提升的方式使算法變得更精確[8]。正是由于這種機制使得Adaboost算法對于樣本中少數(shù)的離群點很敏感[9]。

1.3 Adaboost-SVM模型設計

風機葉片覆冰問題是典型的數(shù)據(jù)不平衡問題,常規(guī)的Adaboost-SVM算法在處理不平衡數(shù)據(jù)問題時可能會出現(xiàn)集成效率低、分類準確率下降等問題。出現(xiàn)上述問題的原因是:(1) 以基分類器的分類準確率作為該分類器的權(quán)值,會使得該模型的分類結(jié)果偏向于多數(shù)類,對少數(shù)類不利[10]。正確分類少數(shù)類樣本的分類規(guī)則及其特殊,其覆蓋率低,在訓練過程中可能會被忽略。(2) Adaboost算法對離群點敏感,而不平衡數(shù)據(jù)中少數(shù)類樣本的離群點對Adaboost算法影響更加嚴重,為了能正確分類離群點數(shù)據(jù),會通過迭代生成多個準確率極低的分類器,影響Adaboost-SVM模型的集成效率,甚至降低算法的分類準確率。

Adaboost與SVM算法的結(jié)合與具體的模型訓練過程和公式參考文獻[11-14]。針對上述問題和風機葉片覆冰樣本數(shù)據(jù)的特點對常規(guī)Adaboost-SVM算法做出以下兩點改進:

(1) 首先使用線性核的SVM模型將部分未結(jié)冰數(shù)據(jù)和極少數(shù)結(jié)冰數(shù)據(jù)的離群點分類出來,再使用Adaboost-SVM算法對剩下部分數(shù)據(jù)進行進一步分類和提升。這樣不僅可以減少該算法的計算量,降低剩余數(shù)據(jù)的不平衡程度,也消除了部分離群數(shù)據(jù)對算法的影響。

(2) 常規(guī)Adaboost-SVM算法最后的結(jié)果是對各個SVM分類器的分類結(jié)果進行加權(quán)求和,權(quán)值就是各個分類器的分類準確率,現(xiàn)改為各個SVM分類器的分類結(jié)果,結(jié)冰數(shù)據(jù)乘以結(jié)冰數(shù)據(jù)的權(quán)值,未接冰數(shù)據(jù)乘以未接冰數(shù)據(jù)的權(quán)值。而這兩類權(quán)值的取值就是SVM分類器輸出的兩類數(shù)據(jù)的準確率。

算法流程如圖1所示。樣本數(shù)據(jù)經(jīng)過數(shù)據(jù)預處理和特征選擇后先經(jīng)過線性SVM模型進行初步篩選,線性SVM分類為未接冰類型的數(shù)據(jù)準確率高,可以直接作為最后的分類結(jié)果,而準確率低的結(jié)冰類型數(shù)據(jù)會再經(jīng)過Adaboost-SVM模型進行更精確的分類。

圖1 算法流程

首先初始化結(jié)冰類型樣本的權(quán)重,將每個樣本初始權(quán)重設置為W1,所以樣本的權(quán)重之和為1。再將帶有權(quán)值W1的樣本進行訓練第1個SVM模型,通過網(wǎng)格搜索的方法對SVM模型的懲罰系數(shù)C和核變量σ進行優(yōu)化,得到第一個SVM模型,計算樣本在第1個SVM模型的整體錯誤率e1,和整體準確率a1和結(jié)冰類型的準確率B1,未接冰數(shù)據(jù)準確率C1。根據(jù)分類器準確率a1更新樣本權(quán)重為W2。不斷循環(huán)上述步驟直道達到設置的迭代次數(shù)m。將各個SVM分類器的分類結(jié)果進行加權(quán)求和得出最后的分類結(jié)果。

(1)

式中:F(Xi)為第j個樣本的最終分類結(jié)果;Gi(Xi)為第j個樣本在第i個SVM模型中的分類結(jié)果,當Gi(Xi)為結(jié)冰時Ki=Bi,當Gi(Xi)為未結(jié)冰時Ki=Ci。

2 實驗設計

2.1 數(shù)據(jù)預處理

本文數(shù)據(jù)來源于2017年工業(yè)大數(shù)據(jù)創(chuàng)新競賽中的15號風機2個月時長和21號風機1個月時長的SCADA數(shù)據(jù)以及結(jié)冰時間段和未結(jié)冰時間段。對數(shù)據(jù)進行預處理:

(1) 去除其中無效數(shù)據(jù)、異常數(shù)據(jù)和重復數(shù)據(jù)。

(2) 根據(jù)結(jié)冰時間段和未結(jié)冰時間段將15號風機和21號風機所有數(shù)據(jù)分類并貼標簽,把結(jié)冰數(shù)據(jù)標為1,未結(jié)冰數(shù)據(jù)標為-1。

(3) 對結(jié)冰和未結(jié)冰數(shù)據(jù)按時間序列分別進行移動滑窗處理。

(4) 對所有特征都進行歸一化處理,降低不同量綱對分類結(jié)果的影響。

經(jīng)過數(shù)據(jù)預處理過后,15號風機未結(jié)冰數(shù)據(jù)44 371組,結(jié)冰數(shù)據(jù)3 215組,21號風機未結(jié)冰數(shù)據(jù)22 711組,結(jié)冰數(shù)據(jù)1 432組。在15號風機數(shù)據(jù)的結(jié)冰數(shù)據(jù)中隨機抽取2 000個樣本在未結(jié)冰數(shù)據(jù)中隨機抽取2 000個樣本作為訓練集。15號風機其余數(shù)據(jù)作為測試集。21號風機數(shù)據(jù)作為測試集。

2.2 特征選擇

由于本文中每組數(shù)據(jù)都有27個特征量,部分特征與結(jié)冰結(jié)果關(guān)系不明顯,不少特征含有很多重復信息或者無效信息。為了減少這些信息對模型最終分類結(jié)果的影響,降低模型的計算開銷,本文使用遞歸消除(Recursive Feature Elimination)加交叉驗證的方法對訓練集數(shù)據(jù)的特征進行選擇,采用5折交叉驗證,將數(shù)據(jù)平均分成5份,其中4份作為訓練集,1份作為驗證集,輪換5次最終的特征數(shù)量與結(jié)冰與否的相關(guān)性得分取5次結(jié)果的平均值。

如圖2所示,特征數(shù)量為11個時,特征集與結(jié)冰與否的相關(guān)性達到最高,圖中的陰影部分表示在交叉驗證中出現(xiàn)的波動范圍。所以本文選擇在SVM模型中表現(xiàn)最好的11個特征來對模型進行訓練。特征重要性排名如圖3所示。

圖2 RFE最佳特征數(shù)

圖3 特征重要性排序

2.3 模型訓練

線性SVM模型用于初步篩選出樣本數(shù)據(jù)中的部分未結(jié)冰數(shù)據(jù)和極少數(shù)結(jié)冰數(shù)據(jù)的離群點,要保證被線性SVM模型分為未結(jié)冰類型的數(shù)據(jù)分類準確率高,且數(shù)據(jù)量盡可能大。使用訓練集數(shù)據(jù)對線性SVM模型進行訓練,模型的權(quán)值系數(shù)clss-weight={-1:1=1:X},表示模型中未接冰數(shù)據(jù)的權(quán)值是1,而結(jié)冰數(shù)據(jù)的權(quán)值是X,通過調(diào)節(jié)X的大小來調(diào)節(jié)模型的分類效果。使用驗證集數(shù)據(jù)對X取不同值的線性SVM模型的分類效果進行驗證,并選取最優(yōu)的X取值。X的取值與被結(jié)冰類型數(shù)據(jù)的準確率和數(shù)據(jù)量的關(guān)系如圖4所示。

圖4 未結(jié)冰類型數(shù)據(jù)準確率和數(shù)據(jù)量

數(shù)據(jù)量隨著X的增大而減小,當X>6.5過后所有數(shù)據(jù)全被分模型分為結(jié)冰數(shù)據(jù)。分類準確率在X=4時達到最大。最終選擇X為4的模型作為初步篩選的線性SVM模型,X=4時未接冰數(shù)據(jù)準確率為99.672%,數(shù)據(jù)量為38.028%。

將訓練集中被線性SVM模型分類為結(jié)冰數(shù)據(jù)類型的樣本作為新的訓練集,訓練改進的Adaboost-SVM模型。利用驗證集數(shù)據(jù)對本文算法與常規(guī)Adaboost-SVM算法在不同迭代次數(shù)下模型整體分類準確率進行比較。如圖5所示,本文算法在集成效率和準確率方面優(yōu)于常規(guī)的Adaboost-SVM算法。確定本文算法迭代次數(shù)m=55,常規(guī)Adaboost-SVM算法m=80。

圖5 迭代次數(shù)與準確率關(guān)系圖

3 結(jié)果分析

在實際運行中風力發(fā)電機葉片結(jié)冰時長遠小于不結(jié)冰時長。這就要求我們在判斷模型預測和檢測有效標準時不能僅僅以整體的精確度作為唯一標準,要從精確度、查全率、查準率與F1等多方面進行評價。

使用測試集數(shù)據(jù)對本文算法,常規(guī)Adaboost-SVM算法和SVM算法進行測試比較,其結(jié)果如表1所示。表1中的算法在測試集都表現(xiàn)出了相當不錯的精確度,但是在查準率方面都普遍較低,這也符合不平衡數(shù)據(jù)的特征。

表1 4種分類算法的檢測結(jié)果對比

從檢測速度方面來看,本文算法由于要對數(shù)據(jù)進行前期篩選和部分數(shù)據(jù)的多次迭代,所以檢測時間大于SVM算法和Adaboost算法。但是相比于將所有數(shù)據(jù)都進行多次迭代的Adaboost-SVM算法來說,本文算法的運算速度有較大的優(yōu)勢。而本文算法在精確度、查全率、查準率和F1度量方面相比于其他三種算法都有明顯的提升。尤其是結(jié)冰數(shù)據(jù)的查全率方面,在實際的風機葉片覆冰的故障檢測中,故障的查全率非常重要,因為一旦發(fā)生故障就會面臨嚴重的經(jīng)濟損失和安全問題。

為了比較不同算法模型在風機葉片覆冰檢測中的效果,引入2017工業(yè)大數(shù)據(jù)競賽評分標準:

(2)

式中:S為模型檢測得分;α為結(jié)冰數(shù)據(jù)在總數(shù)據(jù)中所占的比例;β為未結(jié)冰數(shù)據(jù)在總數(shù)據(jù)中所占的比例;TP為真正例;TN為真反例;FP為假正例;FN為假反例。模型檢測得分S權(quán)衡了數(shù)據(jù)的不平衡性,能夠科學地評價各個算法模型對測試集的綜合檢測能力。本文模型和文獻[15-16]中的各種神經(jīng)網(wǎng)絡算法模型得分對比如表2所示。

表2 算法模型評分對比

可以看出本文算法的模型檢測得分相比于文獻[15-16]中的各種神經(jīng)網(wǎng)絡算法模型有明顯優(yōu)勢的。

4 結(jié) 語

(1) 本文算法能夠有效地對風力發(fā)電機葉片覆冰故障進行檢測,相比SVM、Adaboost和Adaboost-SVM算法整體精確度,結(jié)冰故障的查全率和查準率更高。相比于CNN、LSTM等神經(jīng)網(wǎng)絡算法有更高的綜合檢測能力,更加適應不平衡數(shù)據(jù)的分類問題。

(2) 本文提出的集成權(quán)值的變化有利于提升Adaboost算法在處理不平衡數(shù)據(jù)時的集成效率和準確率。

(3) 本文算法也存在一些不足,算法的檢測時間較SVM和Adaboost算法略長,算法在結(jié)冰數(shù)據(jù)的查準率方面仍有很大的提升空間,這將是我在接下來的研究中要解決的問題。

綜合來看本文方法對于風機葉片覆冰檢測問題具有較高的實用價值。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 亚洲精品无码高潮喷水A| 毛片视频网| 国产福利在线观看精品| 婷婷午夜天| 欧美精品成人一区二区视频一| 午夜福利在线观看成人| 98精品全国免费观看视频| 久久伊人操| 欧美一区精品| 亚洲三级色| 国产成人精品日本亚洲| 欧美精品另类| 久久影院一区二区h| 97超爽成人免费视频在线播放| 人妻丰满熟妇αv无码| 国产欧美日韩一区二区视频在线| 麻豆国产原创视频在线播放 | 国产丰满大乳无码免费播放| 青青青伊人色综合久久| av尤物免费在线观看| 18禁高潮出水呻吟娇喘蜜芽| av午夜福利一片免费看| 亚洲精品欧美重口| 久久综合AV免费观看| 亚洲精选无码久久久| 国产高清无码第一十页在线观看| 日韩午夜伦| 亚洲国产成人自拍| 日韩免费毛片| 亚洲男人在线天堂| 国产v欧美v日韩v综合精品| 特级做a爰片毛片免费69| 国产在线视频二区| 日韩高清一区 | 一本色道久久88| 精品视频91| jizz在线观看| 国产一级妓女av网站| YW尤物AV无码国产在线观看| 综1合AV在线播放| 国产在线自在拍91精品黑人| 亚洲成人一区二区| 亚洲动漫h| 9啪在线视频| 久久亚洲国产最新网站| 亚洲国产欧美目韩成人综合| 国产极品美女在线观看| 久久久久无码精品| 亚洲无码A视频在线| 亚洲精品成人7777在线观看| 久久动漫精品| 亚洲人成网址| 狠狠色丁香婷婷| 欧洲欧美人成免费全部视频| 亚洲AV无码乱码在线观看裸奔 | 亚洲成人免费看| 色偷偷男人的天堂亚洲av| 亚洲成人在线免费观看| 一区二区自拍| 国产欧美视频综合二区| 欧美天堂久久| 久久精品国产精品国产一区| 国产精品无码AV片在线观看播放| av无码一区二区三区在线| 欧美另类精品一区二区三区| 99re视频在线| 亚洲第一页在线观看| 91丝袜乱伦| 一级成人欧美一区在线观看 | a级毛片一区二区免费视频| 91在线播放免费不卡无毒| 国产产在线精品亚洲aavv| 高h视频在线| 免费不卡视频| 久操线在视频在线观看| 亚洲成人动漫在线观看| 曰AV在线无码| 欧美日本在线一区二区三区| 久久伊人操| 一边摸一边做爽的视频17国产| 国内精品久久久久鸭| 福利视频一区|