基于DCGAN的絕緣子圖像生成方法

2021-01-29 08:28:22楊彥利矯紅巖

自動化與儀表 2021年1期

關(guān)鍵詞：故障模型

楊彥利，矯紅巖

（天津工業(yè)大學(xué) 電子與信息工程學(xué)院，天津300387）

絕緣子是輸電線路的重要組成部分[1]。絕緣子長期暴露在自然環(huán)境中，難免出現(xiàn)自爆、掉串和破損等問題。對絕緣子的巡檢成為保障輸電線路正常工作的必要手段。

目前，絕緣子狀態(tài)監(jiān)測已發(fā)展到無人機(jī)自動巡檢階段，自動采集絕緣子圖像并進(jìn)行故障識別[2]。借助于深度學(xué)習(xí)來識別絕緣子圖像越來越受到關(guān)注，如卷積神經(jīng)網(wǎng)絡(luò)CNN 用于從紅外圖像[3]和視覺圖像[4]中檢測絕緣子，深度卷積神經(jīng)網(wǎng)絡(luò)DCNN 用于識別絕緣子的自爆[5]，基于跨連接卷積神經(jīng)網(wǎng)絡(luò)的絕緣子檢測方法[6]等。還有識別與定位故障絕緣的方法[7-9]，如基于Mask R-CNN 的方法[10]。這些方法雖在一定程度上提高了絕緣子故障檢測的智能程度，但基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法[11]依賴于大量的訓(xùn)練樣本，其樣本庫的容量直接決定了神經(jīng)網(wǎng)絡(luò)檢測方法的性能。

利用深度學(xué)習(xí)來識別絕緣子故障需要大數(shù)據(jù)的支撐，絕緣子圖像往往為企業(yè)獨(dú)有，難以建立共享的大樣本庫，嚴(yán)重影響該方法對絕緣子故障的識別。在此，研究了故障絕緣子圖像的計算機(jī)生成方法，利用生成對抗網(wǎng)絡(luò)GAN 來生成故障絕緣子圖像，以模擬真實(shí)的絕緣子圖像，達(dá)到增加故障絕緣子圖像樣本和多樣性的目的。

1 DCGAN 基本原理

GAN 生成圖像的基本框架如圖1 所示[12]。

圖1 GAN 生成圖像的示意框圖Fig.1 Diagrammatic sketch of GAN generated image

由圖可見，GAN 包含2 個網(wǎng)絡(luò)：生成網(wǎng)絡(luò)G 和判別網(wǎng)絡(luò)D。生成網(wǎng)絡(luò)G 不斷學(xué)習(xí)訓(xùn)練集中真實(shí)圖像數(shù)據(jù)的概率分布，其目標(biāo)是將輸入的隨機(jī)噪聲轉(zhuǎn)化為能以假亂真的圖像；判別網(wǎng)絡(luò)D 判斷一個圖像是否為真實(shí)的圖像，目標(biāo)是將生成網(wǎng)絡(luò)G 產(chǎn)生的“假”圖像與訓(xùn)練集中的“真”圖像樣本分辨開。

深度卷積對抗生成網(wǎng)絡(luò)DCGAN[13]（deep convo lution generative adversarial networks），在GAN 網(wǎng)絡(luò)的基礎(chǔ)上引入了卷積操作，利用卷積層強(qiáng)大的特征提取能力來提高GAN 的效果[14]，以期解決GAN訓(xùn)練不穩(wěn)定的問題。它雖是訓(xùn)練生成對抗網(wǎng)絡(luò)的一種更穩(wěn)定的體系結(jié)構(gòu)，但有時會進(jìn)入單一振蕩模式。對此，人們又開發(fā)出一些模型[15-17]，這些模型從不同角度改進(jìn)了DCGAN，每個網(wǎng)絡(luò)有各自的特點(diǎn)，具體見表1。

由表可知，網(wǎng)絡(luò)模型的差別主要是損失函數(shù)、判別器最后一層以及優(yōu)化算法的選擇，并且不同的網(wǎng)絡(luò)模型在不同領(lǐng)域具有不同的應(yīng)用效果。

相比于GAN 模型，DCGAN 模型利用了卷積網(wǎng)絡(luò)強(qiáng)大的特征提取能力，可更好地生成圖像。DCGAN可用于螺栓圖像生成[18]、天文圖像生成[19]、SAR 圖像生成[20]等。在此，以DCGAN 模型為基礎(chǔ)生成絕緣子圖像，結(jié)合絕緣子圖像的特點(diǎn)，對DCGAN 模型進(jìn)行適當(dāng)?shù)男薷模宰詣由赡軌蛞约賮y真的故障絕緣子圖像樣本。

表1 網(wǎng)絡(luò)模型的特點(diǎn)對比Tab.1 Comparison of characteristics of network models

2 基于DCGAN 的絕緣子圖像生成算法

基于DCGAN 生成絕緣子圖像的流程如圖2 所示。在此采用了均勻分布的隨機(jī)噪聲而非正態(tài)分布的隨機(jī)噪聲。

圖2 絕緣子圖像生成過程示意圖Fig.2 Diagrammatic sketch of insulator image generation process

由圖可見，利用DCGAN 生成絕緣子圖像的過程如下：將隨機(jī)噪聲輸入生成網(wǎng)絡(luò)，生成“假”樣本數(shù)據(jù)，再將生成的“假”樣本數(shù)據(jù)與從圖像樣本中的實(shí)際圖像一起輸入到判別網(wǎng)絡(luò)。該過程與基于GAN的圖像生成方法基本框架類似，差別在于生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)。這也表明，生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)是圖像生成的2 個核心部分。在此，主要從這2 個部分來改進(jìn)DCGAN，以生成高質(zhì)量的絕緣子圖像。

1）修改生成網(wǎng)絡(luò)

首先修改生成網(wǎng)絡(luò)，以提高生成絕緣子圖像的分辨率。在原DCGAN 基礎(chǔ)上增加一層卷積網(wǎng)絡(luò)，生成網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3 所示，修改后的生成網(wǎng)絡(luò)可以生成大小為128×128 的絕緣子圖像。生成網(wǎng)絡(luò)中除最后一層外，每層均加入BatchNorm[21]（批量歸一化）層，其目的是增加學(xué)習(xí)的穩(wěn)定性。

圖3 生成網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of generate network

激活函數(shù)也是神經(jīng)網(wǎng)絡(luò)的一個重要參量。它的作用是將輸入進(jìn)行非線性映射，使神經(jīng)網(wǎng)絡(luò)可任意逼近任何非線性函數(shù)。常用的有Sigmoid 函數(shù)[22]、Tanh函數(shù)、線性整流函數(shù)ReLU 等，眾所周知，其表達(dá)式分別為

Sigmoid 是將輸入的連續(xù)實(shí)值變換為0～1 之間的輸出；Tanh 函數(shù)取值范圍為［-1，1］。生成網(wǎng)絡(luò)的輸出層采用Tanh 函數(shù)，其余層激活函數(shù)是ReLU 函數(shù)。

生成網(wǎng)絡(luò)的輸入為均勻分布的隨機(jī)噪聲，經(jīng)過reshape 后得到大小為4×4 的512 層圖像，再與卷積核為5，步長為2，Padding=1 進(jìn)行反卷積，得到256層8×8 的圖像，依此類推。最終得到3 層128×128的圖像作為判別器的輸入。而Tanh 函數(shù)的取值范圍是［-1，1］，目的是使數(shù)據(jù)壓縮到［-1，1］。

2）修改判別網(wǎng)絡(luò)

與原DCGAN 中的判別網(wǎng)絡(luò)相比，在此增加了一層卷積網(wǎng)絡(luò)，其模型如圖4 所示。判別網(wǎng)絡(luò)的輸入有兩部分：真實(shí)的絕緣子樣本圖像數(shù)據(jù)和生成網(wǎng)絡(luò)生成的“假”絕緣子圖像數(shù)據(jù)。判別網(wǎng)絡(luò)是要判斷生成的絕緣子圖像的真實(shí)性，且判斷越準(zhǔn)越好。

圖4 判別網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of discriminant network

判別網(wǎng)絡(luò)使用轉(zhuǎn)置卷積層（transposed convolutional layer），且用≮2 的步長進(jìn)行上采樣，中間層均加入BatchNorm 層。判別網(wǎng)絡(luò)的最后一層使用Sigmoid 激活函數(shù)，其他層的激活函數(shù)均采用Leak Relu 函數(shù)。

為了使生成網(wǎng)絡(luò)更快的學(xué)習(xí)到樣本的特征，并減緩生成網(wǎng)絡(luò)損失的下降，每訓(xùn)練1 次判別網(wǎng)絡(luò)便訓(xùn)練5 次生成網(wǎng)絡(luò)，即每更新1 次判別網(wǎng)絡(luò)的權(quán)重需要更新5 次生成網(wǎng)絡(luò)的權(quán)重。通過不斷地更新生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的權(quán)重，使生成網(wǎng)絡(luò)持續(xù)學(xué)習(xí)到真實(shí)數(shù)據(jù)的分布，進(jìn)而根據(jù)數(shù)據(jù)的分布生成絕緣子圖像。生成網(wǎng)絡(luò)生成以假亂真的圖像來欺騙判別網(wǎng)絡(luò)，直至判別網(wǎng)絡(luò)不能分清輸入圖像的真?zhèn)巍Ｔ谟?xùn)練過程中，生成網(wǎng)絡(luò)與判別網(wǎng)絡(luò)互相學(xué)習(xí)，并且保持基本相同的學(xué)習(xí)速率，通過不斷地互相學(xué)習(xí)，最終達(dá)到一個均衡的效果。

3 試驗(yàn)結(jié)果與分析

利用改進(jìn)的DCGAN 模型來生成絕緣子圖像，并與LSGAN，WGAN，WGAN-GP 等模型生成的絕緣子圖像進(jìn)行對比。通過多種途徑獲得絕緣子圖像，經(jīng)過人工篩選得到清晰的絕緣子圖像樣本有988張，圖像分辨率為178×218。使用Python 語言并基于Pycharm 軟件進(jìn)行編程。

3.1 評價指標(biāo)

在此，通過IS[23]（inception score）指標(biāo)來評估生成模型性能。IS 主要評估生成圖像的清晰度和多樣性，IS 值越高，模型生成圖像的質(zhì)量越好。通過將生成的圖像放入預(yù)訓(xùn)練的Inception 模型[24]中，計算目標(biāo)圖像的熵值實(shí)現(xiàn)對圖像質(zhì)量的評估。即[23]：

式中：x～pg為生成的圖像；y 為樣本輸入到Inception模型產(chǎn)生的向量；p（y|x）為該圖像在各個類別的概率分布；p（y）為該圖像的概率分布；DK-L為對p（y|x）和p（y）求K-L 散度。K-L 散度用以衡量2 個概率分布的距離，它是非負(fù)的，值越大說明這2 個概率分布越不像。眾所周知，K-L 散度公式為

式中：P（i）為真實(shí)圖像的數(shù)據(jù)分布概率；Q（i）為生成圖像的數(shù)據(jù)分布概率。

為了進(jìn)一步驗(yàn)證改進(jìn)模型的準(zhǔn)確度，采用基于Mask R-CNN 的故障絕緣子識別中的方法[10]。其中平均準(zhǔn)確率AP 和總平均準(zhǔn)確率MAP 的值代表了模型識別絕緣子圖像的精準(zhǔn)度，AP 由準(zhǔn)確率和召回率求平均得到。準(zhǔn)確率P 為[10]

式中：TP 為準(zhǔn)確識別出故障絕緣子的數(shù)量；FP 為將故障絕緣子識別為正常絕緣子的數(shù)量。召回率R 為[10]

式中：FN 為將正常絕緣子識別為故障絕緣子的數(shù)量。MAP 為所有的AP 之和求平均值。

3.2 結(jié)果分析

經(jīng)過試驗(yàn)調(diào)試，發(fā)現(xiàn)學(xué)習(xí)率設(shè)為0.0004 時，生成的絕緣子圖像效果較佳。輸入均勻分布的隨機(jī)噪聲，輸出是分辨率為128×128 的絕緣子圖像。經(jīng)過10000 次訓(xùn)練，所生成的無背景、有背景絕緣子圖像如圖5 所示。

圖5 DCGAN 生成的絕緣子圖像Fig.5 Insulator image generated by DCGAN network

由圖可見，生成的絕緣子圖像很逼真，而且圖像具有不同的形態(tài)。

作為對比，在相同輸入條件下，使用不同網(wǎng)絡(luò)模型生成的絕緣子圖像如圖6 所示，每種網(wǎng)絡(luò)均調(diào)到最優(yōu)。

由圖可見，WGAN 模型生成的絕緣子圖像幾乎無法辨認(rèn)；WGAN-GP 模型生成的絕緣子圖像相差不大；LSGAN 模型生成的絕緣子圖像效果較好，但其多樣性不是很好。

為便于比較，將4 種模型參數(shù)均調(diào)到最優(yōu)，并計算其IS 值，結(jié)果見表2。由表可知，改進(jìn)后的DCGAN 網(wǎng)絡(luò)的IS 值為4.10，高于其他模型IS 值。

為測試生成圖像的實(shí)用效果，選取并分析改進(jìn)后模型生成的100 張有背景和無背景的圖像。先用文獻(xiàn)[10]中的模型進(jìn)絕緣子識別，測試結(jié)果見表3。由表可知生成的部分絕緣子圖像被正確識別。作為對比，將100 張圖像取50 張進(jìn)行訓(xùn)練，對另外50張進(jìn)行測試，結(jié)果見表3。測試結(jié)果表明，MAP 值有不同程度的提高，尤以無背景圖像的MAP 值大幅提高，這表明所生成的絕緣子圖像可以像真實(shí)絕緣子圖像那樣被有效識別。

圖6 不同模型生成的絕緣子圖像對比Fig.6 Comparison of insulator images generated by different models

表2 IS 值的比較Tab.2 Comparison of IS values

表3 MAP 值對比Tab.3 Comparison of the MAP values

4 結(jié)語

利用DCGAN 模型設(shè)計了絕緣子圖像生成算法。針對絕緣子圖像的特點(diǎn)，修改了DCGAN 模型的生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)，并設(shè)置了合適的激活函數(shù)和學(xué)習(xí)率等參數(shù)，實(shí)現(xiàn)了故障絕緣子圖像的自動生成。與基于LSGAN，WGAN，WGAN-GP 等模型生成絕緣子的圖像進(jìn)行對比，結(jié)果表明本文算法生成的絕緣子圖像效果更好，一些圖像可以達(dá)到真?zhèn)坞y辨的程度。鑒于絕緣子工況的復(fù)雜多變性，生成具有復(fù)雜背景的故障絕緣子圖像尚需在后續(xù)的工作中進(jìn)一步研究。