999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于VAE-MSGAN網絡的復雜細節圖像生成方法

2021-07-25 15:46:22張德浩王佳松陳禹平
機電工程技術 2021年6期
關鍵詞:評價質量模型

張德浩,王佳松,陳禹平,王 帥

(1.中國科學院長春光學精密機械與物理研究所,長春 130033;2.中國科學院大學,北京 100049)

0 引言

現階段深度神經網絡在特定行業應用時圖像訓練樣本較少,采用生成式對抗技術實現圖像訓練樣本的生成可以增加圖像集中圖像的多樣性,并對圖像數據集中圖像數量進行增廣,減輕在搜集和標記圖像中使用的工作量。生成式對抗網絡模型(Generative Adversarial Net?works.GANs)相較于自回歸模型和自動編碼器模型需要大量先驗知識和大量參數,可以實現無監督學習,同時能夠反映數據內在的概率分布規律并生成全新數據,因而在圖像生成、圖像修補[1]、圖像超分辨[2-3]、草稿圖復原[4]、圖像上色[5-6]、圖像風格變換[7-9]、視頻生成[10]和文字生成圖像領域有著廣泛應用。

近年來,GAN的發展日新月異,國內外對于GAN進行了深入研究。Mirza M等[11]提出了CGAN,在GAN中添加額外的條件信息c,在GAN中添加有監督的學習方式,引導GAN生成固定方向的圖像,穩定GAN的訓練。Chen X等[12]提出了InfoGAN,通過引入互信息量,將條件變量c拆解為有隱含意義的條件c和無意義的噪聲,使得GAN的行為在某種程度上可以解釋。Odena等[13]提出ACGAN(Auxiliary Classifier GAN),以條件重構的形式使GAN能夠生成指定圖像。Alec Radford等[14]提出了DC?GAN,將卷積神經網絡與GAN相結合,從網絡模型和訓練GAN技巧方面改進網絡,提升訓練的穩定性,一定程度上解決了模型易崩潰的問題。Arjovsky等[15]提出了Wasserstein GAN(W-GAN),改變了原始GAN的優化代價函數,直接用其他分布度量來提供優化目標,將代價函數由交叉熵變為推土機距離,解決GAN易崩潰的原理性問題。Denton E等[16]提出了一種LAP-GAN模型,通過疊加不同的生成器網絡,由一張低分辨率圖像最終生成高分辨率圖像。Zhao J B等[17]提出EBGAN,將GAN中的判別器使用自動編碼機作為代替,通過將自動編碼器的重構誤差視為圖像樣本的能量,有效地改善了生成樣本的多樣性。上述文獻雖然提出了一定穩定GAN訓練的方法,但對于圖像生成時紋理細節部分模糊的情況未作具體的分析和改進,同時加入先驗信息一定程度上使GAN這一無監督學習深度學習模型變為有監督學習,在提升了訓練穩定性的條件下,失去了無監督學習的意義。文章通過對生成式對抗網絡進行模型研究,在GAN的基礎上將生成式對抗網絡與變分自編碼器相結合,應用深度卷積模型作為判別器,增強模型兼容性,提升訓練的穩定性,同時采用多尺度判別器,解決生成圖像局部模糊的問題,最終設計了一種多尺度判別變分編碼-生成式對抗網絡(Variational Auto-Encoderand Multiscale Gener?ative Adversarial Networks.VAE-MSGAN)模型結構,通過該網絡模型穩定了GAN訓練,同時在多個尺度下判別圖像局部信息的真實性,使其具有復雜背景圖像的生成更加清晰的特點。最后,針對特定領域圖像數據集,將文章中所提算法生成圖像與真實圖像的分類結果相似性對比,實驗結果表明了所提算法的有效性。

1 GAN網絡模型

在生成式對抗網絡中,包括生成模型和判別模型。生成器的作用是通過使生成樣本數據分布逼近真實樣本數據分布,進而生成一個真實圖像,判別器的作用是作為一個分類器,用以判斷所生成的圖像和真實圖像是否一致。為實現圖像生成,將隨機噪聲輸入到生成器中,輸出生成圖像;然后將真實圖像樣本和生成圖像輸入到判別器中,進行判別圖像真偽。模型的優化過程是訓練生成器和判別器,在對生成式對抗網絡進行訓練時,固定判別器或者生成器其中一方,更新另一方的參數,然后交替執行此步驟,每一次更新目的都是使另一方的錯誤最大化。最終,網絡訓練處于納什均衡狀態,此時生成器生成的圖像基本與真實圖像一致,達到生成圖像目的。

GAN的生成圖像原理和模型如圖1所示。

圖1 GAN的模型結構

1.1 GAN模型優化目標函數

在通過GAN對圖像進行生成時,GAN模型算法的總體目標優化函數如下所示:

式中:Pdata(x)和PZ(z)分別是真實數據和生成數據的分布,即真實圖像的像素值矩陣和生成的圖像像素矩陣。

整個生成式對抗網絡的訓練過程,就是對上式進行最大化最小化交替訓練的過程。

在GAN網絡訓練過程中,當生成器固定時,優化判別器得到目標函數的極小值,而當判別器固定時,求取生成器目標函數的極小值,但是生成器和判別器的極小值并不一定是處在同一個位置上,所以就會有一個全局的次優或者說折中的均衡點,這個點就是納什均衡點。

當固定生成器的網絡參數,訓練判別器的網絡時,式(1)可化作:此時如果要通過優化D使目標函數V最大,就可以轉化為求積分項最大,即優化D使下式最大:

因為真實樣本分布一致,生成器固定,所以此時Pdata與PG已經固定為常值,將上式求導,即可以得到判別器網絡的當前全局最優值如下所示:

將上式代入總體優化目標函數式(2)中,可得下式:

其中,JS為JS散度(Jensen-Shannon divergence),其定義為下式:

優化目標函數要使V最小,需要使上式中JS散度最小,而JS散度最小時為0,此時,需滿足條件如下式所示:

此時生成分布與真實分布相等,優化函數最終目標達成,可視為GAN生成了真實樣本分布,即GAN的訓練成功的充分必要條件是真實樣本分布與生成樣本分布一致。

1.2 GAN模型訓練優化過程

通過生成式對抗網絡對圖像進行生成時,在訓練判別器時,需盡可能判斷出真實圖像為真,即真實數據通過判別器的判別值應為1,同時需盡可能判斷出生成圖像為假,即生成數據通過判別器的判別值應為0。在訓練生成器時,盡可能使生成器的輸出圖像為真,也就是使生成圖像通過判別器時為真,判別值應為1。

生成器與判別器通過不斷地進行博弈學習,最后判別器無法判別輸入數據是否為生成器生成,此時不論輸入的是生成圖像還是真實圖像,分類器判斷輸入的圖像樣本是真實的概率都近似為0.5,此時可視為生成器生成了真實圖像樣本。

圖2所示為GAN的簡化訓練過程,可以看出在優化過程中,采用交替訓練判別器和生成器的方式,每進行k次對判別器的優化,相應的再進行1次生成器的優化。這樣只要生成器的變化足夠慢,判別器的值就基本穩定在其最優解的附近。

圖2 GAN優化過程

2 VAE-MSGAN網絡模型

VAE-MSGAN將變分自編碼器與生成式對抗網絡結合,在本課題中,真實圖像首先通過變分自編碼器的編碼器進行編碼,得到隱性變量,將隱性變量通過解碼器得到VAE所生成的圖像,隨機噪聲通過生成器得到生成圖像,隨機噪聲的維數保持與隱性變量一致。真實圖像、GAN的生成圖像、VAE的生成圖像同時通過判別器進行判別,通過對抗訓練使隨機噪聲生成真實圖像。通過變分自編碼器與GAN的結合,可以得到其訓練過程,可以看出解碼器與生成器的作用以及輸入輸出大小相同,所以可以在網絡模型中將二者合為一個上采樣層,這樣通過將兩種模型的融合可以推理出其訓練過程。

VAE-MSGAN的基本結構如圖3所示。

圖3 VAE-MSGAN的基本結構

由變分自編碼器可以得出編碼器與解碼器的優化函數,編碼器的作用是由真實數據得到隱性表達Z,過程可以描述為:

變分自編碼器的損失函數是期望的對數似然和先驗正則化項做減法運算,得到損失函數如下:

其中:

同時,在生成對抗網絡中,也是由兩個不同網絡組成,一個是生成器G,作用是將噪聲或者是隱性表達Z映射到與真實樣本分布一致的空間,其輸出為G(z),一個是判別器網絡D,D的作用是將輸入的x降采樣分類,輸出表達為D(x),y=D(x)∈[0.1],y是用來表明x是真實數據樣本的概率,1-D(x)則是表示生成數據樣本通過判別器判別為假樣本的概率,其中z的分布可以設為p(z)。這樣其目標函數如下式所示:

將兩種模型結合后的整體優化函數總結為:

在訓練的過程中,首先用損失函數公式(12)來同時對VAE和GAN進行訓練。在對生成式對抗網絡和編碼器進行訓練時,首先是自動編碼器更新編碼器,同時更新解碼器使得輸入的重建誤差最小化。然后生成式對抗網絡先更新判別器來判斷輸入樣本數據是真實樣本還是生成樣本,真實樣本來自于真實的樣本數據,生成樣本通過解碼器和生成器對隱藏編碼進行計算得到。

3 實驗結果分析

3.1 網絡模型選用及生成結果分析

在不同網絡層分別使用3*3,5*5,7*7的卷積核進行訓練,通過不同卷積核生成圖像的評價結果來確定卷積核的大小組合,每一層網絡層最優的卷積核大小。同時通過對判別器中池化操作的不同方式和進行池化操作的具體網絡層數位置進行不同測試考量,確定卷積核大小與池化操作的最優組合。

首先,將生成器中反卷積核的大小與判別器中卷積核的大小組合成不同模式,表1所示為所設定幾種不同情況。

表1 不同模式表

在上表所有模型中,通過所設計網絡實現圖像生成時,模式1、2、3所生成圖像基本為噪聲,其他幾種模式下通過主觀觀察,模式4、6的生成圖像質量良好,其他幾種模式能正常生成圖像,但生成圖像質量較前幾種模式差。通過實驗結果分析,在較高分辨率的圖像中,使用3*3的卷積核提取圖像的特征時表現較差,使GAN生成圖像質量較差。

在客觀評價指標中,將未能正確生成對應類別圖像的模式排除在外,其余幾種模式下生成圖像的客觀評價指標如圖4所示。由圖可知,在模式4生成圖像的La?place梯度值與真實圖像最為接近,說明生成圖像的細節特點最優,其他指標與其他模式較為接近,以生成圖像客觀質量評價指標看,5*5的卷積核與5*5的反卷積核是本課題網絡模型中最優的卷積核大小。

圖4 客觀質量評價1

綜合主觀質量評價和客觀質量評價,本課題所設計的深度卷積生成式對抗網絡模型的生成器中,反卷積層的反卷積核大小為5*5;在判別器中,卷積層的卷積核大小為5*5。

在本課題對網絡模型進行設計時,在卷積核固定為5*5時,將判別器中對于池化操作的選擇設為3種模式,即不采用池化、平均池化、最大池化。通過對網絡的訓練,可得到生成圖像,在這3種模式下,平均池化時生成圖像質量較差,基本不能識別圖像所屬類別,而最大池化與全卷機(即無池化)所生成圖像以主觀判斷生成所屬類別正確。而在客觀質量評價上,具有有效生成圖像的兩種模式評價如圖5所示。

圖5 客觀質量評價2

在生成圖像的客觀質量評價中,在均值上,不同池化操作所生成的圖像平均均值近似相等,與真實圖像的平均均值也近似;在方差上,不同池化操作所生成的圖像同樣與真實圖像方差近似;在圖像的熵上,不同池化操作所生成的圖像同樣與真實圖像的熵同樣近似相等,可見不用池化操作和最大池化兩種模式下評價指標大小幾乎一致,而最大池化模式略接近真實圖像實際評價值,故本文選用最大池化作為判別器中卷積操作的下采樣層。

3.2 VAE-WGAN多尺度判別網絡圖像生成結果分析

為驗證VAE-WGAN多尺度判別網絡在圖像生成問題上的有效性和穩定性,同樣采用主觀質量生成評價,客觀質量生成評價和分類器準確率3種方式對生成圖片進行質量評價,并與真實圖像進行對比,確定生成圖像有效性,3種類別軍事生成圖像如圖6所示。

圖6 生成圖像

(1)主觀質量生成評價

通過主觀判斷,新設計的網絡模型的圖像生成質量優于基于WGAN的條件DCGAN網絡模型,生成的3種類別的圖像都能判斷生成的圖像所屬類別,局部圖像也未失真嚴重。

(2)客觀質量生成評價

將每個類別100張生成圖像輸入到所編寫程序中,計算圖像的平均均值、標準差、熵和Laplacian梯度值,對比真實圖像的平均圖像質量和生成圖像的平均圖像生成質量,結果如表2所示。

表2 不同類別圖像客觀評價指標

整體客觀評價如圖7所示。從圖中可以看出本文提出的方法所生成圖像的客觀評價指標參數都接近真實圖像,考慮到在計算客觀質量評價時圖像平均的問題,可視為生成圖像質量良好。

圖7 整體客觀質量評價

(3)分類器準確率評價

將1 000張真實圖像與其他類別的圖像一同輸入到VGG分類網絡中,訓練好模型后,將100張真實測試圖像和100張生成測試圖像輸入到分類網絡中,得到真實圖像測試集的分類準確率為96%,生成圖像的分類準確率為90%;將1 000張生成圖像與其他類別的圖像一同輸入到VGG分類網絡中,訓練好模型后,將100張真實測試圖像和100張生成測試圖像輸入到分類網絡中,得到真實圖像測試集的分類準確率為91%,生成圖像的分類準確率為93%;將500張生成圖像與500張坦克真實圖像作為同一類別訓練上述VGG分類器,再通過100張真實圖像測試集和100張生成圖像分別計算分類準確率,得到的真實圖像分類準確率為93%,生成圖像分類準確率為92%,而其他類別圖像的測試集測試分類準確率基本保持不變;可以看出,通過本章中的網絡模型進行生成圖像,與真實圖像有著較高的相似性,分類為真實圖像的概率較大,同樣可以用于圖像樣本增廣,制作圖像樣本數據集。

從3種圖像生成質量評價中,通過綜合分析可知,本章所設計的基于VAE-WGAN的多尺度判別網絡模型具有良好的圖像生成質量,對于特定行業領域,例如軍事領域的圖像樣本生成有著良好的作用。

4 結束語

圖像生成技術一直是計算機視覺領域中的重點內容之一,并且隨著近年來人工智能的發展,得到了廣泛發展,而通過GAN來進行圖像生成則在圖像生成領域有著卓越地位,在通過GAN對圖像進行生成時仍存在很多具有挑戰性的問題亟待解決。本文針對特定行業領域圖像訓練樣本缺乏這一問題,設計了復雜背景下的特定圖像訓練樣本生成算法流程。通過分析生成式對抗網絡的模型結構,設計實現了基于深度卷積生成式對抗網絡的圖像生成算法,并通過對比實驗,確定了網絡的模型結構和參數;為了解決生成圖像局部失真模糊的問題,通過分析變分自編碼器這一生成式模型,將之與生成式對抗網絡結合,基于多尺度分類的思想,設計了一個生成式模型,將這一生成式模型的生成結果進行生成質量評價,與真實圖像進行比較。因此,本文提出的方法在圖像生成領域具有一定的參考意義和工程應用價值。

猜你喜歡
評價質量模型
一半模型
“質量”知識鞏固
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
質量守恒定律考什么
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
做夢導致睡眠質量差嗎
3D打印中的模型分割與打包
質量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
基于Moodle的學習評價
主站蜘蛛池模板: 亚洲视频a| 亚洲天堂网视频| 亚洲无码视频一区二区三区| 无码国内精品人妻少妇蜜桃视频| 国产成年无码AⅤ片在线| 日本人真淫视频一区二区三区| 欧美在线一二区| 国产无码高清视频不卡| 亚洲人成网站在线播放2019| 中文字幕第4页| 国产v欧美v日韩v综合精品| 精品国产免费人成在线观看| 精品91视频| 69av在线| 色视频国产| 国产综合精品日本亚洲777| 精品欧美日韩国产日漫一区不卡| 91精品久久久无码中文字幕vr| 久久永久精品免费视频| 一级毛片无毒不卡直接观看| 欧美在线导航| 91精品伊人久久大香线蕉| 欧美在线导航| 99久久精品免费观看国产| 97视频精品全国免费观看| 日韩精品欧美国产在线| 国产91丝袜在线播放动漫 | 亚洲成年人片| 成人午夜视频网站| 日韩麻豆小视频| 欧美亚洲欧美| 欧美精品一区在线看| 国产一级裸网站| 亚洲欧洲免费视频| 乱系列中文字幕在线视频| 国产精品自拍合集| 国产精品99一区不卡| 免费播放毛片| 六月婷婷精品视频在线观看| 亚洲浓毛av| 成人在线视频一区| 99久久精品久久久久久婷婷| 国产欧美日本在线观看| 国产精品三级专区| 欧美激情视频一区| 国产成人精品2021欧美日韩| 波多野结衣在线一区二区| 欧美亚洲网| 久久人妻xunleige无码| 国产精品无码久久久久久| 国产主播在线观看| 午夜啪啪网| 国产黑丝视频在线观看| 欧美日韩一区二区三区四区在线观看| 欧美日韩久久综合| 干中文字幕| 青青青伊人色综合久久| 91精品aⅴ无码中文字字幕蜜桃| 精品国产99久久| 日韩毛片免费视频| 欧美成人精品一级在线观看| 欧美国产精品不卡在线观看| 97se亚洲综合| 国产成人精品一区二区三区| 91区国产福利在线观看午夜| 少妇精品在线| 国产视频a| 五月激情婷婷综合| 精品偷拍一区二区| 精品亚洲国产成人AV| 久久黄色毛片| 免费在线色| 666精品国产精品亚洲| 久久久久夜色精品波多野结衣| 亚洲中文无码av永久伊人| 专干老肥熟女视频网站| 国产一区二区福利| 成人福利在线免费观看| 毛片免费视频| 国产97色在线| 91精品小视频| 全部毛片免费看|