楊彥利,矯紅巖
(天津工業(yè)大學(xué) 電子與信息工程學(xué)院,天津300387)
絕緣子是輸電線路的重要組成部分[1]。絕緣子長期暴露在自然環(huán)境中,難免出現(xiàn)自爆、掉串和破損等問題。對絕緣子的巡檢成為保障輸電線路正常工作的必要手段。
目前,絕緣子狀態(tài)監(jiān)測已發(fā)展到無人機(jī)自動巡檢階段,自動采集絕緣子圖像并進(jìn)行故障識別[2]。借助于深度學(xué)習(xí)來識別絕緣子圖像越來越受到關(guān)注,如卷積神經(jīng)網(wǎng)絡(luò)CNN 用于從紅外圖像[3]和視覺圖像[4]中檢測絕緣子,深度卷積神經(jīng)網(wǎng)絡(luò)DCNN 用于識別絕緣子的自爆[5],基于跨連接卷積神經(jīng)網(wǎng)絡(luò)的絕緣子檢測方法[6]等。還有識別與定位故障絕緣的方法[7-9],如基于Mask R-CNN 的方法[10]。這些方法雖在一定程度上提高了絕緣子故障檢測的智能程度,但基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法[11]依賴于大量的訓(xùn)練樣本,其樣本庫的容量直接決定了神經(jīng)網(wǎng)絡(luò)檢測方法的性能。
利用深度學(xué)習(xí)來識別絕緣子故障需要大數(shù)據(jù)的支撐,絕緣子圖像往往為企業(yè)獨(dú)有,難以建立共享的大樣本庫,嚴(yán)重影響該方法對絕緣子故障的識別。在此,研究了故障絕緣子圖像的計算機(jī)生成方法, 利用生成對抗網(wǎng)絡(luò)GAN 來生成故障絕緣子圖像,以模擬真實(shí)的絕緣子圖像,達(dá)到增加故障絕緣子圖像樣本和多樣性的目的。
GAN 生成圖像的基本框架如圖1 所示[12]。

圖1 GAN 生成圖像的示意框圖Fig.1 Diagrammatic sketch of GAN generated image
由圖可見,GAN 包含2 個網(wǎng)絡(luò): 生成網(wǎng)絡(luò)G 和判別網(wǎng)絡(luò)D。生成網(wǎng)絡(luò)G 不斷學(xué)習(xí)訓(xùn)練集中真實(shí)圖像數(shù)據(jù)的概率分布,其目標(biāo)是將輸入的隨機(jī)噪聲轉(zhuǎn)化為能以假亂真的圖像;判別網(wǎng)絡(luò)D 判斷一個圖像是否為真實(shí)的圖像, 目標(biāo)是將生成網(wǎng)絡(luò)G 產(chǎn)生的“假”圖像與訓(xùn)練集中的“真”圖像樣本分辨開。
深度卷積對抗生成網(wǎng)絡(luò)DCGAN[13](deep convo lution generative adversarial networks),在GAN 網(wǎng)絡(luò)的基礎(chǔ)上引入了卷積操作,利用卷積層強(qiáng)大的特征提取能力來提高GAN 的效果[14],以期解決GAN訓(xùn)練不穩(wěn)定的問題。它雖是訓(xùn)練生成對抗網(wǎng)絡(luò)的一種更穩(wěn)定的體系結(jié)構(gòu), 但有時會進(jìn)入單一振蕩模式。對此,人們又開發(fā)出一些模型[15-17],這些模型從不同角度改進(jìn)了DCGAN,每個網(wǎng)絡(luò)有各自的特點(diǎn),具體見表1。
由表可知, 網(wǎng)絡(luò)模型的差別主要是損失函數(shù)、判別器最后一層以及優(yōu)化算法的選擇,并且不同的網(wǎng)絡(luò)模型在不同領(lǐng)域具有不同的應(yīng)用效果。
相比于GAN 模型,DCGAN 模型利用了卷積網(wǎng)絡(luò)強(qiáng)大的特征提取能力,可更好地生成圖像。DCGAN可用于螺栓圖像生成[18]、天文圖像生成[19]、SAR 圖像生成[20]等。在此,以DCGAN 模型為基礎(chǔ)生成絕緣子圖像,結(jié)合絕緣子圖像的特點(diǎn),對DCGAN 模型進(jìn)行適當(dāng)?shù)男薷模宰詣由赡軌蛞约賮y真的故障絕緣子圖像樣本。

表1 網(wǎng)絡(luò)模型的特點(diǎn)對比Tab.1 Comparison of characteristics of network models
基于DCGAN 生成絕緣子圖像的流程如圖2 所示。在此采用了均勻分布的隨機(jī)噪聲而非正態(tài)分布的隨機(jī)噪聲。

圖2 絕緣子圖像生成過程示意圖Fig.2 Diagrammatic sketch of insulator image generation process
由圖可見,利用DCGAN 生成絕緣子圖像的過程如下:將隨機(jī)噪聲輸入生成網(wǎng)絡(luò),生成“假”樣本數(shù)據(jù),再將生成的“假”樣本數(shù)據(jù)與從圖像樣本中的實(shí)際圖像一起輸入到判別網(wǎng)絡(luò)。該過程與基于GAN的圖像生成方法基本框架類似,差別在于生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)。這也表明,生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)是圖像生成的2 個核心部分。在此,主要從這2 個部分來改進(jìn)DCGAN,以生成高質(zhì)量的絕緣子圖像。
1)修改生成網(wǎng)絡(luò)
首先修改生成網(wǎng)絡(luò),以提高生成絕緣子圖像的分辨率。在原DCGAN 基礎(chǔ)上增加一層卷積網(wǎng)絡(luò),生成網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3 所示,修改后的生成網(wǎng)絡(luò)可以生成大小為128×128 的絕緣子圖像。生成網(wǎng)絡(luò)中除最后一層外,每層均加入BatchNorm[21](批量歸一化)層,其目的是增加學(xué)習(xí)的穩(wěn)定性。

圖3 生成網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of generate network
激活函數(shù)也是神經(jīng)網(wǎng)絡(luò)的一個重要參量。它的作用是將輸入進(jìn)行非線性映射,使神經(jīng)網(wǎng)絡(luò)可任意逼近任何非線性函數(shù)。常用的有Sigmoid 函數(shù)[22]、Tanh函數(shù)、線性整流函數(shù)ReLU 等,眾所周知,其表達(dá)式分別為

Sigmoid 是將輸入的連續(xù)實(shí)值變換為0~1 之間的輸出;Tanh 函數(shù)取值范圍為[-1,1]。生成網(wǎng)絡(luò)的輸出層采用Tanh 函數(shù),其余層激活函數(shù)是ReLU 函數(shù)。
生成網(wǎng)絡(luò)的輸入為均勻分布的隨機(jī)噪聲,經(jīng)過reshape 后得到大小為4×4 的512 層圖像,再與卷積核為5,步長為2,Padding=1 進(jìn)行反卷積,得到256層8×8 的圖像, 依此類推。最終得到3 層128×128的圖像作為判別器的輸入。而Tanh 函數(shù)的取值范圍是[-1,1],目的是使數(shù)據(jù)壓縮到[-1,1]。
2)修改判別網(wǎng)絡(luò)
與原DCGAN 中的判別網(wǎng)絡(luò)相比, 在此增加了一層卷積網(wǎng)絡(luò),其模型如圖4 所示。判別網(wǎng)絡(luò)的輸入有兩部分:真實(shí)的絕緣子樣本圖像數(shù)據(jù)和生成網(wǎng)絡(luò)生成的“假”絕緣子圖像數(shù)據(jù)。判別網(wǎng)絡(luò)是要判斷生成的絕緣子圖像的真實(shí)性,且判斷越準(zhǔn)越好。

圖4 判別網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of discriminant network
判別網(wǎng)絡(luò)使用轉(zhuǎn)置卷積層(transposed convolutional layer),且用≮2 的步長進(jìn)行上采樣,中間層均加入BatchNorm 層。判別網(wǎng)絡(luò)的最后一層使用Sigmoid 激活函數(shù), 其他層的激活函數(shù)均采用Leak Relu 函數(shù)。
為了使生成網(wǎng)絡(luò)更快的學(xué)習(xí)到樣本的特征,并減緩生成網(wǎng)絡(luò)損失的下降,每訓(xùn)練1 次判別網(wǎng)絡(luò)便訓(xùn)練5 次生成網(wǎng)絡(luò),即每更新1 次判別網(wǎng)絡(luò)的權(quán)重需要更新5 次生成網(wǎng)絡(luò)的權(quán)重。通過不斷地更新生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的權(quán)重,使生成網(wǎng)絡(luò)持續(xù)學(xué)習(xí)到真實(shí)數(shù)據(jù)的分布,進(jìn)而根據(jù)數(shù)據(jù)的分布生成絕緣子圖像。生成網(wǎng)絡(luò)生成以假亂真的圖像來欺騙判別網(wǎng)絡(luò),直至判別網(wǎng)絡(luò)不能分清輸入圖像的真?zhèn)巍T谟?xùn)練過程中,生成網(wǎng)絡(luò)與判別網(wǎng)絡(luò)互相學(xué)習(xí),并且保持基本相同的學(xué)習(xí)速率, 通過不斷地互相學(xué)習(xí),最終達(dá)到一個均衡的效果。
利用改進(jìn)的DCGAN 模型來生成絕緣子圖像,并與LSGAN,WGAN,WGAN-GP 等模型生成的絕緣子圖像進(jìn)行對比。通過多種途徑獲得絕緣子圖像,經(jīng)過人工篩選得到清晰的絕緣子圖像樣本有988張,圖像分辨率為178×218。使用Python 語言并基于Pycharm 軟件進(jìn)行編程。
在此,通過IS[23](inception score)指標(biāo)來評估生成模型性能。IS 主要評估生成圖像的清晰度和多樣性,IS 值越高,模型生成圖像的質(zhì)量越好。通過將生成的圖像放入預(yù)訓(xùn)練的Inception 模型[24]中,計算目標(biāo)圖像的熵值實(shí)現(xiàn)對圖像質(zhì)量的評估。即[23]:

式中:x~pg為生成的圖像;y 為樣本輸入到Inception模型產(chǎn)生的向量;p(y|x)為該圖像在各個類別的概率分布;p(y)為該圖像的概率分布;DK-L為對p(y|x)和p(y)求K-L 散度。K-L 散度用以衡量2 個概率分布的距離,它是非負(fù)的,值越大說明這2 個概率分布越不像。眾所周知,K-L 散度公式為

式中:P(i)為真實(shí)圖像的數(shù)據(jù)分布概率;Q(i)為生成圖像的數(shù)據(jù)分布概率。
為了進(jìn)一步驗(yàn)證改進(jìn)模型的準(zhǔn)確度,采用基于Mask R-CNN 的故障絕緣子識別中的方法[10]。其中平均準(zhǔn)確率AP 和總平均準(zhǔn)確率MAP 的值代表了模型識別絕緣子圖像的精準(zhǔn)度,AP 由準(zhǔn)確率和召回率求平均得到。準(zhǔn)確率P 為[10]

式中:TP 為準(zhǔn)確識別出故障絕緣子的數(shù)量;FP 為將故障絕緣子識別為正常絕緣子的數(shù)量。召回率R 為[10]

式中:FN 為將正常絕緣子識別為故障絕緣子的數(shù)量。MAP 為所有的AP 之和求平均值。
經(jīng)過試驗(yàn)調(diào)試, 發(fā)現(xiàn)學(xué)習(xí)率設(shè)為0.0004 時,生成的絕緣子圖像效果較佳。輸入均勻分布的隨機(jī)噪聲,輸出是分辨率為128×128 的絕緣子圖像。經(jīng)過10000 次訓(xùn)練,所生成的無背景、有背景絕緣子圖像如圖5 所示。

圖5 DCGAN 生成的絕緣子圖像Fig.5 Insulator image generated by DCGAN network
由圖可見,生成的絕緣子圖像很逼真,而且圖像具有不同的形態(tài)。
作為對比,在相同輸入條件下,使用不同網(wǎng)絡(luò)模型生成的絕緣子圖像如圖6 所示,每種網(wǎng)絡(luò)均調(diào)到最優(yōu)。
由圖可見,WGAN 模型生成的絕緣子圖像幾乎無法辨認(rèn);WGAN-GP 模型生成的絕緣子圖像相差不大;LSGAN 模型生成的絕緣子圖像效果較好,但其多樣性不是很好。
為便于比較,將4 種模型參數(shù)均調(diào)到最優(yōu),并計算其IS 值, 結(jié)果見表2。由表可知, 改進(jìn)后的DCGAN 網(wǎng)絡(luò)的IS 值為4.10,高于其他模型IS 值。
為測試生成圖像的實(shí)用效果,選取并分析改進(jìn)后模型生成的100 張有背景和無背景的圖像。先用文獻(xiàn)[10]中的模型進(jìn)絕緣子識別,測試結(jié)果見表3。由表可知生成的部分絕緣子圖像被正確識別。作為對比, 將100 張圖像取50 張進(jìn)行訓(xùn)練, 對另外50張進(jìn)行測試,結(jié)果見表3。測試結(jié)果表明,MAP 值有不同程度的提高, 尤以無背景圖像的MAP 值大幅提高,這表明所生成的絕緣子圖像可以像真實(shí)絕緣子圖像那樣被有效識別。

圖6 不同模型生成的絕緣子圖像對比Fig.6 Comparison of insulator images generated by different models

表2 IS 值的比較Tab.2 Comparison of IS values

表3 MAP 值對比Tab.3 Comparison of the MAP values
利用DCGAN 模型設(shè)計了絕緣子圖像生成算法。針對絕緣子圖像的特點(diǎn),修改了DCGAN 模型的生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò),并設(shè)置了合適的激活函數(shù)和學(xué)習(xí)率等參數(shù),實(shí)現(xiàn)了故障絕緣子圖像的自動生成。與基于LSGAN,WGAN,WGAN-GP 等模型生成絕緣子的圖像進(jìn)行對比,結(jié)果表明本文算法生成的絕緣子圖像效果更好,一些圖像可以達(dá)到真?zhèn)坞y辨的程度。鑒于絕緣子工況的復(fù)雜多變性,生成具有復(fù)雜背景的故障絕緣子圖像尚需在后續(xù)的工作中進(jìn)一步研究。