999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生成對抗網絡的研究進展綜述*

2020-03-19 13:48:04吳少乾李西明
計算機與生活 2020年3期
關鍵詞:模型

吳少乾,李西明

華南農業大學 數學與信息學院,廣州510642

1 背景

近年來,伴隨著Alpha Go 成為第一個擊敗人類職業圍棋世界冠軍的人工智能機器人開始,機器智能得到了迅速發展。而機器智能需要人們應用大量的數據去訓練機器,使其更加智能。其中,生成算法通常被視為機器對訓練數據“理解”程度的衡量標準,生成算法通過學習一組信息之后生成信息分布,通過深度學習領域中的基于反向傳播和Dropout 算法的判別式模型,將高維豐富的感知器輸入映射到類別標簽上[1-2],以此來判別生成算法生成的分布的正確性,若生成的分布正確,那么機器也一定正確地理解了這些信息。因此,生成算法被看作是對系統理解的一種度量,常應用于生成文本[3-4]、圖像[5-6]、語音[7-8]及生成系統行為和系統狀態[9]等領域。

然而,由于在最大似然估計和相關策略方面通常存在許多難以解決的概率計算問題,且在生成上下文時無法充分利用分段線性單元的優勢,導致深度生成模型沒有得到廣泛的應用。但是,在統計信號處理和機器學習中,以產生或再現與真實樣本難以區分的樣本為目標的研究依舊是一大熱點。特別是,獲取高維數據分布的生成模型是一項具有挑戰性但又非常重要的工作,因為它們對于各種應用程序(如文本到演講合成、語音轉換、圖像到圖像的翻譯和照片編輯等)都具有重要的意義。

2014年,Goodfellow 等人[10]提出了一種通過對抗訓練來評估生成模型的新框架——生成對抗網絡(generative adversarial networks,GANs)。它的出現為解決工程和數學領域中高維度概率密度分布中采樣和訓練的問題提供了很大的幫助,迅速成為人工智能學界一個熱門的研究方向。GANs 的基本思想源自雙人博弈論,由一個生成器和一個判別器構成,通過對抗學習的方式進行訓練,目的是估測數據樣本的潛在分布并生成新的數據樣本,這使得GANs 在各個領域得到迅速的發展,被廣泛應用于各個算法、模型和神經網絡中,從樸素貝葉斯到深度信念網絡,再到高斯混合模型、隱馬爾可夫模型、潛在狄利克雷分配和受限玻爾茲曼機等。

近年來,對于GANs 的基礎研究和實際應用研究,都取得了相當不錯的成果。本文將對GANs 近幾年來的研究成果進行總結,介紹GANs 的基礎理論及其實際應用成果。

2 GANs的基本原理

2.1 GANs原理

GANs 是一種深度生成模型,它包含兩個相互競爭的神經網絡模型:生成模型G和判別模型D。其中G的目的是學習真實樣本的分布,生成相似度逼近真實樣本的生成樣本,而D的目的則是判斷訓練樣本來自真實樣本還是生成樣本。簡單來說,兩個模型通過不斷的對抗訓練,G最大化生成以假亂真的生成樣本,D最小化自己判別錯誤的概率。

模型G和D通過不斷的對抗訓練,使D正確判別訓練樣本來源的概率最大化,同時使G生成的生成數據與真實數據的相似度最大化。在訓練優化D時,當D的輸入為真實樣本x時,希望D(x)趨于1;當輸入為生成樣本G(z)時,則希望D(G(z))趨于0,即希望1-D(G(z))趨于1,故極大化模型D。在訓練優化G時,輸入只有噪聲z,此時希望生成樣本G(z)通過D后的概率值為1,即希望D(G(z))趨于1,也就是說希望1-D(G(z))趨于0,故極小化模型G。因此,D和G的訓練可以表示為關于值函數V(G,D)的極小化極大的雙方博弈問題:

訓練過程中,兩個模型交替迭代,先固定G,訓練D,更新D的參數,然后固定D,更新迭代G的參數,最終達到模型穩定。Goodfellow 等人在文獻[10]中證明了當且僅當pz=pdata時,極大化極小的雙方博弈問題存在全局最優解,即達到納什均衡,此時生成模型G學會了真實樣本pdata的分布,使得判別模型D的準確率穩定停留于1/2 上,即使得D只能對訓練樣本在0 或1 之間進行隨機猜測。

2.2 GANs優缺點

相比較于以前的建模框架,GANs 框架具有以下的一些優勢。相比較于蒙特卡洛估計、玻爾茲曼機和生成隨機網絡等生成網絡,GANs 的計算過程不需要使用馬爾可夫鏈,學習過程也不需要近似推理,這使得它能夠更好地利用分段線性單元的優勢,僅通過反向傳播來計算梯度,從而回避了近似計算困難的概率難題。與完全明顯的信念網絡相比,GANs 因為不需要在采樣序列生成不同的數據,使其能夠更快地產生樣本。相比于變分自編碼器,GANs 沒有變分下界,不需要引入任何決定性偏置,是漸進一致的,而變分方法引入的決定性偏置是有偏差的,由于變分自編碼器優化的是對數似然的下界,而不是似然度本身,從而導致變分自編碼器的生成效果比GANs 差。相比較于非線性獨立分量分析,GANs 不需要對潛在變量(生成器的輸入值)的大小進行限制,即不要求生成器輸入的潛在變量有任何特定的維度或要求生成器是可逆的。

GANs 雖然解決了生成式模型中的一些問題,對其他生成算法的發展具有一定的啟發意義,但GANs也并非完美,在解決了已有問題的同時也產生了一些新的問題。由于GANs 采用對抗學習的方法,導致模型收斂性的不穩定,雖然GANs 在納什均衡時達到最優,但是只有當梯度下降在凸函數的情況下才能保證實現納什均衡。而訓練過程需要保證兩個對抗網絡的平衡和同步,否則難以得到很好的訓練效果,但在實際過程中,兩個對抗網絡的同步不易把控,因此訓練過程可能不穩定,這就導致了模型訓練很難收斂的問題。此外,GANs 框架使用極大化極小的概念,這使得在訓練過程中難以對模型訓練情況進行評價。GANs 在訓練過程中,生成模型可能出現退化現象,總是生成同樣的樣本點,無法繼續學習,導致生成模型崩潰,而當生成模型崩潰時,判別模型也會對相似的樣本點指向相似的方向,使得訓練無法繼續,從而導致了GANs 的模型崩潰問題。相比其他生成式模型,GANs 無需預先建模,直接對真實樣本進行采樣訓練,從而真正達到理論上可以完全逼近真實樣本,這是GANs 的最大優勢,但同時這也會使得模型過于自由。而對于尺寸大、像素高的圖片,簡單的GANs 又會導致模型不太可控,這就導致了GANs模型過于自由不可控的問題。

3 GANs的衍生模型

自2014年Goodfellow 等人提出生成對抗網絡以來,GANs 已經成為最流行的深度生成模型之一,其研究也取得了快速的進展,衍生出了上百種相關的模型,在短短的幾年里已在圖像處理、自然語言、計算機視覺等領域中得到了廣泛的應用,最終形成了所謂的GANs-zoo。本章將從GANs 模型中的損失函數、網絡體系結構及其模型應用改進等方面的研究進展進行整理分析,并介紹其中具有代表性的模型,并將一些比較常見的GANs 衍生模型進行分類,如表1 所示。

3.1 基于損失函數改進的GANs

Nowozin 等人[14]對Nguyen 等人[15]提出的變散度估計框架進行擴展,提出f-GANs 模型,將散度估計擴展到模型估計,并稱這種新方法為變分發散最小化(variable dispersion minimization,VDM),并證明了生成對抗訓練是VDM 框架的一個特例。他們使用生成模型Q和變分函數T作為生成對抗網絡的兩個模型。通過實驗表明,GANs 架構中的JS 散度可以被任意的f-散度(不同散度的總稱)代替,證明了GANs 的廣泛應用性。雖然使用交叉熵的定義可以保證模型收斂的速度,但是在決策邊界為真的一邊的樣本均會被分類為真,即使是假樣本,這樣就會導致即使使用與真實樣本相差甚遠的假樣本更新生成器時,判別器仍會判斷為真,這就讓假樣本成功欺騙了判別器。從而導致了更新生成器的時候出現梯度彌散的問題,進而使得傳統GANs 生成的圖片質量不高以及訓練過程不穩定的系列問題。針對以上問題,Mao 等人在文獻[16]中提出了一種最小二乘生成對抗網絡(least squares generative adversarial networks,LSGANs),該網絡將傳統GANs 的目標函數中的交叉熵損失函數替換成最小二乘損失函數,并將最小二乘損失函數作為判別器,根據樣本到決策邊界的距離進行懲罰,從而將假樣本移向決策邊界,這樣就會生成更多的梯度來更新生成器,同時保證了模型的收斂性和穩定性,以此解決了GANs 中梯度消失的問題,但LSGANs無法解決這個核心問題——如何更好地測量生成數據和真實數據之間的散度距離。

Table1 Classification of GANs derived models表1 GANs的衍生模型分類

針對散度距離測量的問題,Arjovsky 等人[17]提出的WGAN(Wasserstein GAN)拋棄了傳統GANs 的JS 散度(Jensen-Shannon 散度)定義,采用Earth Mover距離(EM 距離)來計算兩個分布的距離,利用EM 距離來監控模型的好壞,解決GAN 訓練不穩定、模型崩塌和生成模型的評價問題。WGAN 在處理Lipschitz限制條件時采用了權重裁剪方法,將參數的梯度值限制在一定的范圍內,以便通過倒數限制D(x)的增長速度,但是該方法中的權重裁剪值卻不好確定,這使得有時仍然只能生成較差的樣本或無法收斂。針對WGAN 存在的缺點,Gulrajani等人在文獻[18]中提出了WGAN 的改進版WGAN-GP,WGAN-GP 提出了一種新的Lipschitz 連續性限制手法,即通過給判別函數添加梯度懲罰項,將參數與限制聯系起來,達到Lipschitz 限制條件,以此解決WGAN 的權重裁剪導致參數集中化、梯度爆炸和梯度消失的問題,但是對于梯度的模大于1 的區域的值,WGAN-GP 雖然也做出了懲罰,但是卻無法保證每一個值的梯度的模都小于等于1,并且該方法計算成本很高。

以上所述均存在一個較強的假設,即鑒別器在每一步中(在函數空間中)都處于最優狀態,相比較WGAN 和WANG-GP,Petzka 等人[19]提出一種較弱的正則化項來執行Lipschitz 限制。而Kodali 等人[20]提出的DRAGAN(deep regret analytic GAN)則將交替梯度更新過程看作regretminimization 進行訓練,以達到納什均衡,并且證明了在無參數限制和無需要求判別器在每一步中都處于最優狀態的條件下,模型訓練能夠漸近收斂,在此基礎上提出了一種新的梯度懲罰算法,支持更快的訓練,實現更好的穩定性和建模性能,但本質上只是采用了不同的梯度懲罰函數。同樣,Berthelot 等人在文獻[21]中提出了一種新的平衡強化方法——BEGAN(boundary equilibrium GAN),該方法結合EM 距離的損失來訓練基于自動編碼器的GANs。BEGAN 拋棄了通過估計真實分布和生成分布之間的差距,反而通過估計分布的分布誤差之間的相似度,以達到判別目的,但是BEGAN主要應用于圖像領域中,對于高分辨率的圖像的效果一般。為此,在BEGAN 的基礎上,Li 等人[22]在判別器中新增去噪損失函數,以獲取更多與真實分布相關的信息,以此提高訓練效果和收斂穩定性,但其效果并未超過WGAN-GP。

在文獻[23]中,Mroueh 等人利用奇異值分解概念,將分布嵌入到有限維特征空間中,并根據其均值和協方差特征統計進行匹配,同時匹配均值特征和二階矩陣特征,使得真實數據分布和生成數據分布之間的嵌入協方差差異最大化,以此提升訓練效果。在文獻[24]中,Mroueh 等人建立了一種積分概率矩陣框架——FisherGAN來訓練GANs。它在WGANGP的基礎上繼續改進,當WGAN-GP 對判別器函數的梯度做出懲罰時,Fisher GAN 會對判別器的二階矩陣進行約束,使得模型可以穩定訓練,但是FisherGAN對于積分概率度量(integral probability metrics,IPM)的約束較強,缺乏一定的靈活性。在神經網絡中,將梯度的模限制在一個范圍內,抽象地說就是讓產生的函數更平滑一些,最常見的做法便是正則化,而頻譜歸一化則可以使正則化產生更明確的限制,因此Miyato 等人在文獻[25]中提出了頻譜歸一化GANs,利用頻譜范數[26]標準化神經網絡的參數矩陣W,從而讓神經網絡的梯度被限制在一個范圍內,以便讓正則化產生更明確的限制,但這同時也犧牲了模型的收斂速度。

3.2 基于模型應用改進的GANs

上一節主要介紹了從損失函數方面進行改進的各種GANs 模型,通過各種改進,不但穩定了模型的收斂性,同時也解決了模型崩潰的問題。而在這一節中,將介紹從模型的內部網絡體系結構和結合模型應用等方面進行改進的各種GANs衍生模型。

在無監督學習中,從大量無標記數據集中學習到可重復使用的特征是十分有意義的,特別是在計算機視覺領域中,如果能從大批量無標記圖像和視頻中學習到良好的中間特征,就可以將它用于諸如圖像分類這樣的監督學習任務。要建立圖像的良好特征,可以通過訓練無監督學習的GANs 模型,并把判別模型和生成模型作為特征提取器,然后再應用到有監督學習上。因此,在基于GANs 的思想上,2015年Radford 等人[27]提出了一種將有監督學習中的深度卷積神經網絡CNNs 和無監督學習的GANs 結合在一起的架構——深度卷積對抗生成網絡(deep convolutional GANs,DCGANs)。通過在不同訓練集上訓練表明,不論是判別模型還是生成模型,也不論是單個對象還是圖像全局場景,DCGANs 都能學習到一系列特征,同時GANs 訓練的穩定性以及生成結果質量都有了極大的提升,DCGANs 也因此建立起了CNNs在有監督學習和無監督學習之間的橋梁。

訓練傳統GANs 需要找到具有連續高維參數的非凸博弈的納什均衡,而傳統GANs 通常使用梯度下降法進行訓練,這種算法雖然可以找到損失函數的最小值,但是無法找到博弈的納什均衡。并且當該算法用于尋找納什均衡時,該算法可能無法收斂,即使做了結構細化的DCGANs,其訓練過程仍難以收斂。因此,Salimans 和Goodfellow 在文獻[28]中提出Improved-DCGANs,針對DCGANs 的訓練過程,利用特征匹配、小批量判別、歷史平均、單側標簽平滑和虛擬批次正態化五種不同的增強方法,使訓練朝著收斂方向進行。

針對GANs 無需預先建模,導致模型過于自由不可控的問題,Mirza和Osindero[29]提出了一種給GANs加上約束條件的模型,稱為CGANs(conditional GANs)。CGANs 就是一種帶條件約束的GANs,在G和D的模型中均引入條件變量y,通過將y作為G和D輸入層的一部分來進行調節,以此提高對模型的控制。這個改進雖然簡單,但是被證明非常有效,并廣泛用于后續的相關工作中[30-32]。已有的文本圖像生成方法可以生成比較粗糙的模型,但是卻無法生成必要的細節和生動的物體,雖然CGANs 的出現提高了生成圖像的質量,但是CGANs 仍無法產生高質量的圖片。因此,Zhang 等人[6]在CGANs 的基礎上提出了StackGAN 來生成高質量的圖片。StackGAN 通過堆疊的方法來實現目的,即將合成過程分解為兩個較易處理的階段。第一階段的GANs 利用文本描述粗略勾畫物體主要的形狀和顏色,生成低分辨率的圖片;第二階段的GANs 修正了第一階段的結果,生成細節豐富的高分辨率圖片,但是StackGAN 無法處理復雜文本。為了進一步提高生成樣本的質量,穩定GANs的訓練,Zhang 等人[33]提出了對StackGAN 進一步改進后的StackGAN++,相比于StackGAN,StackGAN++由多個生成器和多個鑒別器組成,它們以樹狀結構排列,讓同一場景對應的多個尺度的圖像由樹的不同分支生成,以此提升模型對復雜文本的處理能力。但是StackGAN++仍無法很好地處理很復雜的文本,因此Johnson 等人[34]提出了一種從場景圖生成圖像的端到端的方法,以處理更長更復雜的文本,與從文本描述生成圖像的方法相比,該方法能夠從結構化場景圖中明顯地推理出對象和關系,并生成具有多個可識別對象的復雜圖像。

Donahue 等人[11]在GANs 的基礎上,結合編碼器的定義提出一種雙向生成對抗網絡,不但能將潛在樣本映射到生成的數據,而且能夠將數據逆映射到潛在表示上。在CGANs的基礎上,Perarnau 等人[12]則將編碼器和CGANs 相結合,提出了用于圖像編輯的可逆的CGANs,將真實圖像映射到高特征空間和條件表示中,這就允許根據任意的屬性重構和修改真實圖像,即能夠重新生成具有確定性的復雜修改的真實圖像。在文獻[2]中,Karacan 等人利用反卷積神經網絡和卷積神經網絡構造了新的條件GANs——屬性-布局條件生成對抗性網絡(attribute-layout conditioned GAN,AL-CGAN)。AL-CGAN 模型被拆解成兩部分研究,即單屬性條件的A-CGAN 模型和單空間布局條件的L-CGAN 模型。同時還會對缺失的空間布局進行補充,對每個場景進行粗語義標注,對缺失的屬性進行屬性預測。

上述表明了深度卷積網絡能夠提升GANs 生成高分辨率圖片的細節,但是由于卷積網絡的局部感受的限制,如果要生成大范圍相關的區域,卷積網絡就會出現問題。Qian 等人[35]提出將AttentiveNet 引入傳統的GANs 中,以此生成注意力圖(attentive map),并將注意力圖應用于生成網絡和判別網絡中,使網絡能夠快速準確地定位到圖像中的重點關注區域。但由于GANs 很難捕捉幾何結構特征,使得GANs 在某些圖像類別上很難建模,因此依靠卷積來建立不同圖像區域之間的依賴關系的模型,其依賴關系的傳遞只能通過大范圍的多個卷積層來實現。隨著卷積大小的增加,網絡的真實容量也在增加,卻損失了計算效率。而self-attention 卻能夠做到依賴性和計算效率的平衡。因此,Zhang等人[36]提出將self-attention機制加入GANs 中,讓生成器和判別器可以自動學習圖像中的重要目標,形成了模型SAGAN(self-attention GAN)。SAGAN 克服了傳統GANs 模型均在低分辨率特征圖的空間局部點上來生成高分辨率的細節的缺陷——SAGAN 可以從所有的特征處生成細節,并且SAGAN 的判別器可以判別兩幅具有明顯差異的圖像是否具有一致的高度精細特征,但仍有很大的提升空間。此外,Brock 等人[37]提出的BigGAN 以SAGAN 架構為基礎,將正交正則化應用于生成器,使其適用于簡單的“截斷技巧”,并使用鉸鏈損失作為GANs 目標函數,同時使用類條件BatchNorm 和含投影的D向G提供類信息,該方法極大地提高了生成圖像的逼真性和精細度。

上訴介紹的各種改進只是眾多改進中的一小部分,除此之外,研究者們利用各種相關的方法繼續改進傳統GANs,以改善傳統GANs 的各種不足,例如:Ghosh 等人[38]利用多主體的GANs 來改進傳統GANs模型崩塌的問題;Zhao等人[39]引入能量定義,提出了基于能量的生成對抗網絡(energy-based GAN,EBGAN),該模型將判別器看作一個能量函數,將低能量賦給數據流行附近地區域,將高能量賦給其他區域,結果表明EBGAN 比傳統的GANs 更加穩定,生成的圖像分辨率更高;Qi[40]提出的損失敏感型生成對抗網絡,進一步利用真實數據密度的Lipschitz 正則條件對其損失函數進行正則化處理,得到一個正則化模型,該模型提升了GANs 生成新數據的泛化能力;Li 等人[13]將最大均值差異作為損失函數,并結合自動編碼器,結果表明它能夠比傳統GANs 更有效地生成更好的生成模型;Tolstikhin 等人[41]使用自提高的訓練機制,通過融合各生成模型,達到更好的擬合數據分布的目的,從而克服了GANs訓練難以及模型崩潰問題。

4 GANs的應用

GANs 作為一種生成模型,它并不局限于特定的數據類型,可以應用于各種數據,如圖像、音頻、文本等。它也不局限于特定的任務,可以應用于各種任務,如圖像的處理、視頻生成、惡意檢查、通信保護和密碼破譯等。

4.1 GANs在圖像領域中的應用

針對GANs 模型過于自由問題,除了給其加上約束條件外,也可以通過讓GANs 分次完成任務,一次生成一部分,分多次生成完整的目標,來避免這個問題。因此,Denton等人[42]采用這個思想,在基于CGANs的基礎上,提出了改進模型LAPGANs(Laplacian pyramid of GANs)。LAPGANs是一種生成式參數模型,通過帶有Laplacian 金字塔框架的級聯卷積網絡,以逐步求精的迭代方式生成高質量的自然圖像樣本,LAPGANs 訓練出來圖像比GANs 訓練出來的圖像更加自然,邊緣也更加明確,但由于LAPGANs 的網絡深度較深,使得逐步求精的方法增加了網絡簡單記憶輸入樣本的難度。Li 等人[43]將對抗性生成式網絡應用于Markovian 環境中,學習相同內容的不同描述之間的映射,通過生成網絡G將輸入的圖像直接解碼為合成圖像的像素,然后利用判別器D去學習區分實際的特征塊和不合適的合成特征塊,通過對抗性訓練反卷積神經網絡來合成紋理,但是該方法在處理非紋理的數據上的表現不足。

GANs 模型不僅適用于二維空間,而且適用于三維空間。但不同于GANs 在二維空間的應用,在三維空間中,GANs 的生成器需要建立從二維空間到三維空間的映射關系,并依據該映射關系將2D 圖像生成3D 形狀的對象,這個映射關系既是重點也是難點,直接影響3D 對象的生成質量。Wu 等人[44]在DCGANs的基礎上進行改進,提出了3D 生成對抗網絡(3DGAN),它利用生成對抗網絡和體卷積網絡[45],建立從概率空間到3D 對象空間的映射,再利用判別器為三維對象的描述提供有用的特征信息,但是合成的3D 圖像的銳度和邊緣信息還有待提高。Gadelha 等人[46]提出的投影生成對抗網絡(PrGANs),利用其訓練一個可以準確表示3D 形狀的深度生成模型,將2D圖像生成3D 對象,并在傳遞給判別器之前將其轉換為2D 圖像,通過迭代訓練周期,生成器通過改進生成的3D 體素形狀來完善2D 圖像到3D 對象的投影結果。將GANs 應用于三維空間上的探索還有很多,例如:Cao 等人[47]利用一種3D 輔助二重生成對抗網絡(aided duet GAN,AD-GAN)來精確地將人臉圖像旋轉到任意指定的角度;Wang 等人[48]結合3D 解碼器GANs 和長期循環卷積網絡,以低分辨率填充缺失的三維數據,使三維模型具有語義合理性和上下文細節。

隨著神經網絡在無監督學習和半監督學習領域上的發展,可以通過對輸入樣本的重構來對數據分布進行顯式建模,但是基于重構的學習方法往往會學習并保存全部輸入樣本的特征。在GANs 的基礎上,Yi等人[49]提出了無監督和半監督學習下的分類生成式對抗網絡框架,即將神經網絡分類器與對抗生成模型相結合,對抗生成模型對訓練有素的分類器進行正則化,以此使得與分類器一起學習的生成器能夠生成高視覺保真度的圖像。但由于傳統GANs的輸入是一組沒有任何限制且完全隨機的噪聲信號z,這使得無法將z的具體維度和數據的語義特征對應起來,導致輸入向量對輸出產生不明確性的影響。因此,Chen 等人在文獻[50]中提出了無監督學習的InfoGANs,他們將原本的輸入向量z拆成子向量c(可解釋的隱變量,表示對輸出產生影響的因素)和子向量z′(不可壓縮的噪聲)。InfoGANs 通過約束隱變量c與生成數據之間的關系,使c能夠直接代表數據某個方面的語義信息,進而使得c與生成數據具有較高的互信息,以此解決隱變量可解釋性的問題。

為了提高圖像的分辨率,Ledig 等人[51]提出了一種超分辨率生成對抗網絡(super-resolution GAN,SRGAN),實現了低分辨圖像合成4 倍放大的高分辨率圖像,但生成的圖像的紋理信息并不夠真實,且常常伴有噪聲。因此,Wang 等人[52]提出了一種增強分辨率的生成對抗網絡(enhanced super-resolution GAN,ESRGAN),對網絡的結構、對抗性損失和感知性損失進行改進。并在此基礎上,引入殘差-剩余密集塊作為基本的網絡構建單元,得益于這些改進,為亮度一致性和紋理恢復提供更強的監控,產生的紋理比SRGAN 更真實和自然,進一步提高了視覺的質量。GANs 應用于圖像超分辨率的例子還有很多,例如:Huang等人[53]提出的雙通道生成對抗網絡通過感知全局結構和局部細節,實現了從一張單側照片合成高分辨率的正面人臉圖像;Kupyn 等人[54]提出了一種基于CGANs和內容損失的端到端學習法DeblurGAN,能夠去除由于運動而產生的模糊;Kupyn等人對DeblurGAN進行改進得到DeblurGAN-v2[55],大大提高了去模糊效率、質量和靈活性。

圖像到圖像的轉換是圖像領域中一大熱門研究方向,GANs 在該方向的研究也取得了一定的進展。Isola 等人[31]在CGANs 的基礎上進行圖像到圖像的轉換的研究,利用成對的數據集進行實驗,表明了CGANs 是一種很有前途的圖像到圖像的轉換方法,特別是那些涉及高度結構化圖形輸出的圖像。圖像到圖像的轉換通常使用一組成對的圖像對來學習輸入圖像和輸出圖像之間的映射,但是對于許多任務,成對的訓練數據很難獲取,因此Zhu 等人[56]提出了一種在沒有成對數據的情況下,設計雙生成器與雙鑒別器,形成雙向風格遷移的CycleGAN 模型,學習將圖像從域X轉換為目標域Y的方法,解決了pix2pix 必須使用成對數據的問題。Chen 等人[57]提出一種利用非成對數據來實現圖像增強的方法,其基于一個結構類似于CycleGAN 的雙向GANs,并進行改進,以此來實現圖像到增強圖像的轉換。

除了上述應用外,GANs 在各個領域的應用也十分廣泛,Wang 等人[58]對圖像生成過程進行了分解,提出了一種基于風格和結構的生成反求網絡;Creswell等人[59]將GANs 應用于檢索;Zhu 等人[60]提出利用生成式對偶神經網絡直接從數據中學習自然圖像流形;包仁達等人[61]提出了一種掩模控制的自動上妝GANs,能夠重點編輯上妝區域,約束人臉妝容編輯中無需編輯的區域不變,保持主體信息;Reed 等人[9]綜合了圖像和描述在哪個位置繪制什么內容的指令;Vondrick 等人[62]利用大量未標記的視頻來學習視頻識別任務(例如動作分類)和視頻生成任務(例如未來預測)的場景動力學模型;Taigman 等人[63]研究了將一個域上的樣本轉移到另一個域上的模擬樣本的問題,可以應用于包括數字和人臉圖像在內的視覺領域;Denton 等人[64]介紹了一種簡單的基于對抗性損失的畫中學習的半監督學習方法;Mogren[65]提出了一種基于連續序列數據的生成式對抗模型,并將其應用于古典音樂的集合;武隨爍等人[66]針對GANs 無法有效提取圖像局部與全局特征間依賴關系,以及各類別間的依賴關系,提出一種用于GANs 的孿生注意力模型;桑亮等人[67]基于GANs 的深度卷積網絡,采用端對端的方式,復原了由于抖動或運動所導致的模糊圖像的細節信息;時澄等人[68]利用GANs 對殘缺圖像進行補全。除此之外,GANs 的應用數不勝數,但仍需要繼續研究。

4.2 GANs在信息安全領域中的應用

在數據隱私保護中,如何保證數據集的可利用性和隱私性的平衡是極為重要的。隨著GANs 應用領域的不斷擴大,其在隱私保護中也有所應用。GANs 利用自身的優勢,將噪聲添加到潛在空間而不是直接添加到數據中,減少了整體的信息損失,同時保證了隱私。Triastcyn 等人[69]提出了一種生成人工數據集的方法,在生成對抗網絡的判別器中加入高斯噪聲層,使輸出和梯度相對于訓練數據具有不同的私密性,然后利用生成器組件合成具有保密性的人工數據集,不但保留了真實數據的統計特性,同時為這些數據提供了差分隱私保護。Beaulieu-Jones 等人[70]結合GANs 和差分隱私提出了差分隱私輔助分類生成對抗網絡,用于生成醫療臨床數據。針對當GANs 應用于私人或敏感數據(如病人的醫學病歷),并且分布的集中可能泄露關鍵的病人信息的問題,Xie等人[71]提出了一種差分私有GANs 模型——DPGAN(differentially private GAN)模型,通過在學習過程中向梯度中添加精心設計的噪聲來實現GANs 的差分隱私。同樣,Huang 等人[72]結合GANs 提出一種上下文感知隱私模型,通過巧妙添加噪聲來實現私有數據的發布。Frigerio 等人[73]通過差異隱私定義提出了一個保護隱私的數據發布框架,從時間序列到連續數據和離散數據的生成,均可以很容易地適應不同的用例,以保證在發布新的開放數據的同時保護用戶的個性。Papernot 等人[74]提出了一種教師-學生模式的深度網絡隱私保護方法,利用教師深度模型和學生GANs 模型,通過訓練從而達到保護訓練數據集的目的,但是這種將模型訓練過程視為黑盒,僅從模型外部添加隱私保護機制,其保護效果的可控性是不夠的。

GANs 除了應用于隱私保護外,還被應用于惡意檢測中。為了有效地檢測包括零日攻擊在內的惡意軟件,Kim 等人[75]提出了一種轉移深度卷積生成對抗網絡(transferred deep-convolutional GAN,tDCGAN),基于深度自編碼技術,利用實際數據和tDCGAN 生成的修改數據學習各種惡意軟件的特征,提取有意義的特征進行惡意軟件檢測。GANs 同樣適用于信用卡欺騙檢測,Fiore 等人[76]訓練一個GANs 模型來輸出模擬的少數類的欺騙例子,然后將這些例子與訓練數據合并成一個增強訓練集,從而提高分類器對少數類欺騙例子的分類效率。為了有效識別受害者向詐騙者發送大額轉賬,Zheng 等人[77]提出了一種基于GANs 的模型來計算銀行每筆大額轉賬的欺詐概率,讓銀行采取適當的措施,以此防止潛在的騙子在概率超過閾值時取錢。除了這些惡意檢測,GANs 還可以用于檢測僵尸網絡,Yin 等人[78]提出了一種基于GANs 的僵尸網絡檢測模型框架——Bot-GAN,生成模型不斷生成偽樣本,以輔助原檢測模型提高性能。

GANs 的廣泛適用性,使其在信息安全領域中最為古老的密碼學中同樣也適用。2016年,Abadi等人[79]利用GANs 的對抗學習機制,將傳統的對稱加密體系中的通信雙方及敵手用神經網絡進行代替,以此實現加解密的過程,達到保護通信過程的目的。在文獻[80]中李西明等人改進Abadi 等人的模型,進行了抗泄漏加密通信測試,發現了利用生成對抗網絡實現抗泄漏加密通信的可能性。Coutinho 等人[81]利用選擇明文攻擊的概念改進了Abadi 等人的模型,證明了神經網絡在適當的環境下可以學習一次性密碼本。除了保護通信之外,GANs 同樣也適用于密碼破譯。Gomez 等人[82]基于GANs 提出CipherGAN,用于破譯古典密碼學中移位密碼和維吉尼亞密碼,Hitaj等人[83]提出了一種利用GANs 來增強密碼破譯的新方法——PassGAN,通過在泄露密碼列表中訓練GANs 來實現密碼破譯,為GANs 在密碼學上的應用前景提供了更廣闊的道路。

5 討論

自2014年GANs 的誕生以來,它作為一種新型的生成模型得到了廣泛的應用。作為一個生成模型,GAN 模型避免了一些傳統生成模型在實際應用中的一些困難,巧妙地通過對抗學習來近似一些不可解的損失函數,這是其最大的創新之處,也是其產生問題的根源。針對其產生的各種問題,研究者們近幾年不斷地進行研究分析,將GANs 與各種相關的方法進行改進融合,得到了許多有效的成果。但目前的GANs 仍存在不足及缺陷,有賴于研究者們進一步解決。在應用上,GANs 被廣泛應用于圖像、文本生成、自然語言和信息安全等領域中,其中應用最為熱門的領域當屬圖像領域。

雖然GANs 已經在許多方面得到應用,但其仍存在廣大的應用前景,特別是在信息安全領域。在未來的工作中,可以從以下幾點深入研究GANs 在信息安全領域中的應用。

(1)利用GANs 的特性,結合圖像水印技術,將信息附著在圖像上進行傳輸,達到消息的安全傳遞的效果。

(2)利用GANs 的對抗學習機制,分析病毒樣本,預測新型病毒,形成自動防御體系。

(3)將GANs 與經典密碼學相結合,分析破譯率,并利用GANs 的對抗學習機制,保證公鑰密碼體制下的安全通信,實現消息的可認證性和保密性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产毛片高清一级国语| 亚洲国产精品人久久电影| 色香蕉影院| 中文字幕有乳无码| 不卡午夜视频| 国产91高跟丝袜| 精品成人一区二区三区电影 | 黄色网页在线观看| 国产99视频精品免费观看9e| 91在线国内在线播放老师 | 欧美黄色a| 九九热免费在线视频| …亚洲 欧洲 另类 春色| 欧美午夜在线观看| 中文字幕av一区二区三区欲色| 午夜毛片福利| 91欧美亚洲国产五月天| a在线观看免费| 91青青草视频| 日韩小视频网站hq| 久久女人网| 伊伊人成亚洲综合人网7777| 国产呦精品一区二区三区网站| 国产在线一区视频| 国产偷倩视频| 国产一区亚洲一区| 亚洲欧美日韩综合二区三区| 先锋资源久久| 国产91无码福利在线| 九色视频一区| 成人看片欧美一区二区| 亚洲天堂精品在线观看| 欧美中日韩在线| 欧美成人精品在线| 3344在线观看无码| 国产在线视频导航| 美女潮喷出白浆在线观看视频| 色精品视频| 久草性视频| 欧美视频在线不卡| 国产一级在线播放| 亚洲av无码人妻| 亚洲国产中文欧美在线人成大黄瓜| 国产在线视频二区| 亚洲va精品中文字幕| 国产精品亚洲va在线观看| 国产精品密蕾丝视频| 青青国产成人免费精品视频| 色悠久久久久久久综合网伊人| 精品人妻无码区在线视频| 亚洲欧美日韩另类在线一| 日本免费精品| 福利国产在线| 久久中文无码精品| 国产91视频观看| 国产精品真实对白精彩久久 | 久久免费视频6| 亚洲天堂日韩av电影| 99人妻碰碰碰久久久久禁片| 先锋资源久久| 三上悠亚一区二区| 无码一区二区三区视频在线播放| 中文一级毛片| 露脸国产精品自产在线播| 99久久精彩视频| 婷婷激情五月网| 国产在线欧美| 亚洲一区二区三区国产精华液| 亚洲男人的天堂久久香蕉| 久久这里只有精品8| 国产成人综合日韩精品无码不卡| 欧美人人干| 亚洲欧洲一区二区三区| 久久天天躁狠狠躁夜夜2020一| 亚洲一级色| 三上悠亚精品二区在线观看| 亚洲五月激情网| 国产亚洲欧美日韩在线一区二区三区| 深爱婷婷激情网| 成人无码区免费视频网站蜜臀| 亚洲综合亚洲国产尤物| 精品乱码久久久久久久|