湯占軍,孫棟欽,李英娜,陸 鵬
(1.昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明 650500;2.云南龍?jiān)达L(fēng)力發(fā)電有限公司,云南 曲靖655000)
能源和環(huán)境引發(fā)的問題日益增多,世界各國紛紛出臺了相應(yīng)的能源結(jié)構(gòu)轉(zhuǎn)型戰(zhàn)略。風(fēng)力發(fā)電得到了廣泛的應(yīng)用,國內(nèi)風(fēng)電市場也保持著強(qiáng)勁的增勢。葉片是風(fēng)機(jī)的重要組成部分,也是易受損的部件。風(fēng)沙、雨水、雷擊、冰凍,以及在安裝過程中的不當(dāng)操作都會造成風(fēng)機(jī)葉片不同程度的損傷。裂紋類損傷形成后會隨著雨水、風(fēng)沙侵蝕逐漸擴(kuò)大。此類損傷的早期發(fā)現(xiàn)可以給工作人員更多的調(diào)整維修時(shí)間。裂紋超過一定程度,風(fēng)力發(fā)電機(jī)將被迫停機(jī),影響風(fēng)電場整體的發(fā)電計(jì)劃。更為嚴(yán)重的是,因裂紋過大而導(dǎo)致葉片折斷,甚至撞擊塔筒。因此,定期檢測風(fēng)機(jī)葉片發(fā)現(xiàn)早期裂紋是十分必要的。
傳統(tǒng)的裂紋人工檢測方法主要有3種:地面敲擊辨音檢測法、地面望遠(yuǎn)鏡觀測法、吊車輔助近距離觀測法[1]。人工檢測方法效率低下,經(jīng)濟(jì)、時(shí)間成本高。由于受到主觀影響,漏檢率也比較高。近年來也有人提出對風(fēng)機(jī)葉片裂紋的聲發(fā)射信號進(jìn)行模式識別,或是通過分析風(fēng)機(jī)出口氣動信號的檢測裂紋方法[2],[3]。但一些老款的風(fēng)力機(jī)沒有在葉片上安裝相應(yīng)的傳感器,不能采集相關(guān)的數(shù)據(jù)。得益于無人機(jī)的快速發(fā)展,可以利用無人機(jī)巡航拍攝風(fēng)機(jī)葉片圖像,再將圖像傳回后臺進(jìn)行人工分析,排查故障,在一定程度上減 輕了巡檢人員工作量。無人機(jī)巡檢機(jī)動靈活,且數(shù)據(jù)存儲與傳輸方便,有利于構(gòu)建風(fēng)力行業(yè)大數(shù)據(jù)。但面對無人機(jī)巡檢拍攝的海量圖像,后臺工作人員受主觀經(jīng)驗(yàn)影響,難免會出現(xiàn)漏檢或誤檢。借助合適的模型,利用算法對無人機(jī)拍攝圖像進(jìn)行裂紋識別有助于克服上述弊端。現(xiàn)有文獻(xiàn)對無人機(jī)巡檢風(fēng)機(jī)葉片圖像缺陷檢測的相關(guān)研究不多。文獻(xiàn)[4]通過在魯棒性主成分分析(RPCA)模型中增加F范數(shù)和Laplacian正則項(xiàng),使模型對缺陷的檢測更具魯棒性。雖然此算法能在一定程度上抑制風(fēng)機(jī)葉片光照不均的問題,但是該算法以超像素為檢測單元,對于微小裂紋的檢測效果欠佳。
為提高風(fēng)機(jī)葉片微小裂紋的檢測效率和準(zhǔn)確率,本文提出了利用無人機(jī)拍攝的葉片圖像結(jié)合機(jī)器學(xué)習(xí)的方法進(jìn)行裂紋識別。利用局部二值模式(LBP)和灰度共生矩陣(GLCM)對圖像進(jìn)行特征提取。用改進(jìn)的螢火蟲算法優(yōu)化支持向量機(jī)(SVM)對特征向量進(jìn)行訓(xùn)練。為提高算法的搜索能力,引入混沌理論取得更好的種群初始位置,采用自適應(yīng)步長的螢火蟲算法優(yōu)化SVM參數(shù)。
為了后續(xù)提取圖像特征,需要對圖片進(jìn)行預(yù)處理。首先將原始圖像灰度化,將圖像的紅、綠、藍(lán)3種顏色按一定的權(quán)重轉(zhuǎn)化至0~255的灰度范圍內(nèi),再進(jìn)行雙邊濾波。考慮到像素的鄰近關(guān)系,也考慮到了亮度上的相似性[5]。裂紋反映在圖片上更像是邊緣信息。為了更好地保持裂紋信息,雙邊濾波在灰度值變化大的風(fēng)機(jī)葉片裂紋區(qū)域像素范圍域權(quán)重變大。使用Sobel邊緣檢測算法是為了使微小的裂紋更加地清晰。圖1為圖像處理前后的對比圖。

圖1 圖像預(yù)處理的對比Fig.1 Comparison of image preprocessing
LBP算子窗口的大小為3×3,以中心位置為灰 度 閾 值[6]。經(jīng) 式(1),(2)運(yùn) 算 得 到 中 心 位 置 的LBP值。將窗口以步長為1移動,待軌跡覆蓋整幅圖片就得到一幅由LBP值組成的新圖。將這幅LBP值圖劃分為n×n個區(qū)域,每個區(qū)域都得到一個統(tǒng)計(jì)直方圖,連接后就成特征向量。

式 中:(xc,yc)為 中 心 位 置 的 坐 標(biāo);P為 與 中 心 位置相鄰的像素個數(shù);ip為p位置的像素值;ic為中心位置的像素值。
式(1)中 的S(x)為

GLCM用于分析局部圖像,能反映方向、間隔、變化等信息。GLCM是兩個像素聯(lián)合分布的統(tǒng)計(jì)概率矩陣,除以矩陣元素的總和,每個元素被歸一化為特定距離和角度中對應(yīng)像素對的概率[7]。

式中:P為像素點(diǎn);下標(biāo)d為兩像素點(diǎn)的距離;下標(biāo)θ為方向角;i,j為轉(zhuǎn)換后圖像的灰度級。
取以下4個量來組成特征向量。


熵ENT反映風(fēng)機(jī)葉片表面裂紋分布的不均勻性或復(fù)雜程度,熵值越大,葉片上的裂紋越多越復(fù)雜。對比度CON反映紋理清晰程度。裂紋越深像素灰度值差別越大;裂紋越淺灰度值差別越小,對比度越小。IDM為逆方差,風(fēng)機(jī)葉片紋理越清晰、越有規(guī)律性、越容易描述,IDM的值越大。相關(guān)性COR越大表示在特定方向上灰度值的相關(guān)程度越高。圖2為提取圖片特征向量的基本流程。

圖2 提取特征基本流程Fig.2 The basic process of extracting features
在機(jī)器學(xué)習(xí)中,SVM是與學(xué)習(xí)算法相關(guān)的監(jiān)督模型,用于分類和回歸分析[8]。在樣本數(shù)量較少且特征向量存在非線性、多維數(shù)的情況下,也能有良 好 的 泛 化 能 力。例 如,合 集D=(xi,yi),i=1,2,3…n,xi為 樣 本 的 特 征 向 量,yi為 類 別 是+或-,SVM能找到一個將不同類別劃分開來的超平面(圖3)。

圖3 SVM分類基本原理圖Fig.3 Basic schematic diagram of SVM classification
由于訓(xùn)練樣本的局限性,測試樣本可能更加接近劃分面。為了讓模型有更好的魯棒性,劃分面與兩類別的間隔應(yīng)最大化。在實(shí)際應(yīng)用中常常出現(xiàn)難以確定一個超平面將樣本全部分開的情況,當(dāng)然這樣的樣本應(yīng)盡可能少。為此引入懲罰因子c,允許一些樣本不滿足約束。c越小,受到的約束就越小。現(xiàn)實(shí)問題中常常會出現(xiàn)不存在一個超平面能將不同樣本分開的情況。為解決此問題,可借助核函數(shù)將原始樣本空間映射到高緯度特征空間,在高緯度特征空間尋找超平面將樣本分類,核函數(shù)參數(shù)g定義了數(shù)據(jù)在高維空間的作用范圍。
SVM的分類效果會受到c和g的影響,可以利用優(yōu)化算法搜索最優(yōu)解。本文采用改進(jìn)的螢火蟲算法優(yōu)化SVM的c和g。
采用螢火蟲算法尋優(yōu)c和g,可以看作螢火蟲分布在二維平面中,其橫坐標(biāo)x對應(yīng)c,縱坐標(biāo)y對應(yīng)g。在搜索過程中,螢火蟲靠光吸引感知范圍內(nèi)的其他個體,同時(shí)也受到感知范圍內(nèi)其他螢火蟲的吸引,種群向最亮的個體聚集。熒光素值越大,螢火蟲發(fā)出的光就越亮。初始情況下螢火蟲個體的熒光素li和感知半徑都相同。搜索過程中熒光素的大小跟螢火蟲個體當(dāng)前所在的位置有關(guān),找到的c,g越適合檢測模型,熒光素的值就越大。熒光素的更新公式為

式 中:t為 當(dāng) 前 的 代 數(shù);ρ(0<ρ<1)為 熒 光 素 的 揮發(fā)速率參 數(shù);γ為更 新速 率;Ji(t+1)為t+1代 螢火蟲個體對檢測模型的適應(yīng)值。
感知范圍隨周圍個體數(shù)量改變。周圍個體密度大,感知范圍就小,周圍個體密度小,感知范圍就變大。感知范圍更新公式為

在基本螢火蟲算法中,一般采用固定步長尋優(yōu),或者采用隨著迭代次數(shù)增加步長減小的動態(tài)步 長d。

式中:t為當(dāng)前螢火蟲代數(shù);alpha為步長,其初始值 為1。
將螢火蟲搜索得到的最優(yōu)解用作SVM的參數(shù),螢火蟲優(yōu)化SVM的流程如圖4所示。

圖4 螢火蟲優(yōu)化SVM的流程Fig.4 Flow chart of firefly optimization SVM
使用混沌映射隨機(jī)生成種群初始位置有利于提高初始解的質(zhì)量。本文引入了logistic映射策略。

式中:μ為混沌系數(shù)。
圖5為logistic映射圖。
由圖5可知,在 μ為4時(shí)陷入完全混沌。混沌是確定性非線性系統(tǒng)中存在的一種貌似無規(guī)則、隨機(jī)的運(yùn)動,具有遍歷性、隨機(jī)性和內(nèi)在規(guī)律性[9]。利用混沌的這幾個特性,可以在一定程度上防止算法陷入局部最優(yōu),提高算法的全局搜索能力,達(dá) 到 優(yōu) 化 的 目 的。根 據(jù) 式(13)~(15)生 成 螢 火蟲個體的初始位置。

圖5 logistic映射圖Fig.5 Logistic map

式中:ub,lb分別為xij的上限和下限。
在基本螢火蟲算法中,一般采用固定步長尋優(yōu)。如果步長選擇太小會導(dǎo)致算法運(yùn)行前期個體不能迅速向鄰域內(nèi)亮度高的螢火蟲靠近。反之,步長選擇太大會導(dǎo)致螢火蟲個體無法向最亮的個體進(jìn)一步靠近。使算法的收斂性不穩(wěn)定,影響求解精度。針對這種情況,本文采用了文獻(xiàn)[10]的自適應(yīng)步長,引入了熒光因子的概念。

式中:xi為第i只螢火蟲的位置;xm為螢火蟲中最優(yōu)位置;dmax為xm到其他螢火蟲的最遠(yuǎn)距離。
按照Hi進(jìn)行步長的更新。

式中:si為步長;smin,smax分別為設(shè)定的步長最小值和最大值。
根 據(jù) 式(16),(17),隨 著 算 法 運(yùn) 行,螢 火 蟲 群中個體的亮度差異減小,移動步長也會相應(yīng)減小,不至于因步長太大而跳過最優(yōu)解。
IFA優(yōu)化分為以下步驟。
①利 用 混 沌 映 射 式(13),(14),(15)生 成 種 群初始位置,設(shè)定算法的一系列初始參數(shù),搜索二維空間。
②采用驗(yàn)證集均方根誤差作為適應(yīng)度值。根據(jù)式(8)決定熒光素大小,使螢火蟲個體在式(9)計(jì)算的感知范圍內(nèi)向亮度最大的個體移動,根據(jù)式(16),(17)計(jì) 算 移 動 步 長。
③每更新一代就重新計(jì)算適應(yīng)度,同時(shí)更新熒光素、感知范圍和步長,直到最大迭代次數(shù)或者達(dá)到適應(yīng)度要求。
④將得到的最優(yōu)解代入SVM分類器中。
本文所使用的圖片集來自于云南某風(fēng)電場的無人機(jī)拍攝的風(fēng)機(jī)葉片。86張圖片中的葉片帶有微小裂紋,282張圖片葉片上無裂紋。由于原數(shù)據(jù)集樣本數(shù)量不多,容易造成過擬合現(xiàn)象。帶有微小裂紋的圖像較少,特征向量中可能存在某些部分與無裂紋圖像重疊,使得分類器對裂紋的識別度下降。
在無法獲得更多新數(shù)據(jù)的情況下,為減少過擬合的可能,同時(shí)解決樣本分布不均勻所帶來的問題。通過裁剪的方式將大小為400×300像素的原始圖像裁剪為300×300像素大小。為保證樣本多樣性,每一張?jiān)瓐D像都經(jīng)過裁剪,將無裂紋樣本擴(kuò)充到400張,帶有微小裂紋的圖像經(jīng)過裁剪后,增 加 旋 轉(zhuǎn)(90°,180°)的 方 式 擴(kuò) 充,同 樣 達(dá) 到400張。
將無裂紋、有裂紋兩類葉片圖片分別記為1和0。隨機(jī)選取其中480張圖片用于模型的訓(xùn)練,160張組成驗(yàn)證集,160張圖片用于測試模型的準(zhǔn)確度。測試樣本的圖片不出現(xiàn)在訓(xùn)練集圖片庫中。
對訓(xùn)練集、驗(yàn)證集和測試集圖片預(yù)處理,提取圖片LBP和GLCM特征并將二者串聯(lián),構(gòu)成每一張圖片的特征向量。用改進(jìn)的螢火蟲算法尋優(yōu)c,g參數(shù)后建立SVM風(fēng)力發(fā)電機(jī)葉片裂紋檢測模型。
改進(jìn)的螢火蟲算法參數(shù)設(shè)置為n=20,max gen=100,ρ=0.5,l0=5,γ=0.6,r0=10,s0=0.25,smin=0.001,smax=1,β=0.08,nt=5。PSO和GA同 樣 設(shè)置為n=20,max gen=100。圖6為模型的適應(yīng)度曲線。
由圖6可知,IFA收斂曲線下降比GA,PSO,F(xiàn)A都快得多,GA和PSO容易陷入局部最優(yōu)。由于優(yōu)化了螢火蟲的初始位置,在第一代IFA的求解精度就比FA高。采用了自適應(yīng)的步長,能夠讓IFA獲得比FA更好的搜索能力,并得到更高的求解精度。

圖6 適應(yīng)度曲線Fig.6 Fitness curve
為檢驗(yàn)?zāi)P托阅埽謩e用遺傳算法優(yōu)化支持向量機(jī) (GA-SVM)、粒子群優(yōu)化支持向量機(jī)(PSO-SVM)、螢火蟲算法優(yōu)化支持向量機(jī)(FASVM)和IFA-SVM檢測。用所有圖片集做實(shí)驗(yàn)后,再用600張背景復(fù)雜的圖像(風(fēng)機(jī)建造在山頂,葉片背景中常常出現(xiàn)樹木和云層)分訓(xùn)練集、驗(yàn)證集和測試集進(jìn)行30次獨(dú)立實(shí)驗(yàn)。記錄結(jié)果進(jìn)行比較,主 要 衡 量 指 標(biāo) 是 準(zhǔn) 確 率(Accuracy,A),查 準(zhǔn) 率(Precision,P)和 查 全 率(Recall,R):

表1,2分別為各種檢測模型的性能比較和復(fù)雜背景下各種檢測模型的性能比較結(jié)果。

表1 各種檢測模型的性能比較Table1Performance comparison of various algorithms %

表2 各種檢測模型的性能比較(復(fù)雜背景)Table2Performance comparison of various algorithms(complex background)%
由表1,2可知,背景越復(fù)雜識別效果就越差。本文算法在兩種情況下比GA-SVM,PSO-SVM,F(xiàn)A-SVM都表現(xiàn)出更好的性能。由于將有裂紋的葉片誤查成無裂紋的葉片可能引起嚴(yán)重的后果,查準(zhǔn)率顯得尤為重要。在查準(zhǔn)率上本文算法對比其他算法均有不同程度的提高,說明了本文方法的有效性。
為提高風(fēng)機(jī)葉片微小裂紋的檢測效率和準(zhǔn)確率,本文提出一種利用無人機(jī)拍攝的葉片圖像結(jié)合機(jī)器學(xué)習(xí)進(jìn)行裂紋檢測的模型。提取圖像紋理特征,用改進(jìn)的螢火蟲算法優(yōu)化的SVM模型進(jìn)行識別,得到以下結(jié)論。
①通過對圖像進(jìn)行預(yù)處理能有效地減少模糊,提高提取的紋理特征質(zhì)量。
②改進(jìn)的螢火蟲算法優(yōu)化的SVM模型與GA-SVM,PSO-SVM和FA-SVM進(jìn)行對比,SVM模型獲得了更高的準(zhǔn)確率、查準(zhǔn)率和查全率。