999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

變分自動(dòng)編碼器的潛變量空間解耦方法

2022-08-30 07:51:00曾青耀鄭茜穎俞金玲
關(guān)鍵詞:模型

曾青耀,鄭茜穎,俞金玲

(福州大學(xué)物理與信息工程學(xué)院,福建 福州 350108)

0 引言

隨著神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展,深度生成已經(jīng)成為一項(xiàng)創(chuàng)建和操縱數(shù)據(jù)的強(qiáng)大工具.潛變量空間解耦這一研究方向大多是基于圖像或音樂數(shù)據(jù)集的數(shù)據(jù)可控性研究.基于潛在表示的模型,例如文獻(xiàn)[1]中變分自動(dòng)編碼器(variational auto-encoder,VAE)在潛變量空間解耦方面顯示出卓越性能.

當(dāng)前大多數(shù)無監(jiān)督解耦方法都是基于VAE框架的變化.無監(jiān)督方法試圖解離數(shù)據(jù)中不同的變化因素,學(xué)習(xí)其表示形式.此類模型對單個(gè)基礎(chǔ)變化因子的更改會(huì)導(dǎo)致學(xué)習(xí)到表示形式的單個(gè)因子發(fā)生更改.例如文獻(xiàn)[2]中對潛在空間信息容量施加約束的β-VAE模型,文獻(xiàn)[3]中最大化潛在編碼子集和觀測值之間互信息的生成式對抗網(wǎng)絡(luò)模型(簡稱Info-GAN模型),以及文獻(xiàn)[4]中最大化潛在編碼之間獨(dú)立性潛在變量的解耦增強(qiáng)VAE模型(簡稱β-TCVAE模型)等.

監(jiān)督方法是通過學(xué)習(xí)轉(zhuǎn)換關(guān)系來控制屬性的一類研究.文獻(xiàn)[5]中屬性正則化VAE模型(簡稱AR-VAE模型)試圖沿著不同維度編碼不同的數(shù)據(jù)屬性.文獻(xiàn)[6]中的樂器數(shù)字接口VAE模型(簡稱MIDI-VAE模型)將潛在空間分解為不同的部分,每個(gè)部分去對應(yīng)特定的屬性.文獻(xiàn)[7]中的非對稱多模式VAE模型(簡稱AM-VAE模型)則是通過學(xué)習(xí)潛變量空間和屬性值之間的轉(zhuǎn)換關(guān)系來控制數(shù)據(jù)屬性.以上的監(jiān)督學(xué)習(xí)方法也存在一些局限性,例如某些方法僅適用于某種類型的數(shù)據(jù)屬性,或者模型需要通過獨(dú)立改變屬性來采樣數(shù)據(jù)點(diǎn)等.同時(shí),上述多數(shù)方法能夠?qū)W習(xí)到在每一維度具體的、不相干意義的潛在表示,但其潛在表示的可解釋性[8]仍不夠強(qiáng),其可控性和可拓展性較弱.然而在實(shí)現(xiàn)潛變量空間解耦的過程中,最重要的是讓學(xué)習(xí)到的表征具備人類可理解的意義,讓生成的數(shù)據(jù)屬性更為可控.

本研究工作的主要包括以下4個(gè)方面:

1) 提出一種基于潛變量空間解耦的圖像生成方法——自注意力屬性VAE模型(簡稱TA-VAE模型),通過改變編碼結(jié)構(gòu)和設(shè)計(jì)新穎的損失函數(shù)實(shí)現(xiàn)更優(yōu)越的解耦性能;

2) 編碼器階段運(yùn)用了自注意力機(jī)制[9],使得本模型對長期依賴關(guān)系有著更強(qiáng)的捕捉能力,比起序列模型而言對層次結(jié)構(gòu)信息能夠進(jìn)行更有效的表達(dá);

3) 殘差網(wǎng)絡(luò)[10]使模型中信息的前后向傳播更加順暢,也讓更深層的網(wǎng)絡(luò)訓(xùn)練成為可能;

4) 標(biāo)準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本模型在訓(xùn)練過程中隨著潛空間的變化,屬性值變化更均勻,損失也更易于優(yōu)化.

1 TA-VAE模型構(gòu)建

提出一種自注意力機(jī)制下的潛變量空間解耦模型.在原始編碼器的基礎(chǔ)上使用了自注意力機(jī)制和殘差網(wǎng)絡(luò)來實(shí)現(xiàn)編碼,在解耦方面也使用了新的損失來實(shí)現(xiàn)結(jié)構(gòu)化潛在空間,從而沿著不同維度編碼不同的數(shù)據(jù)屬性.

1.1 編碼器和解碼器模型

1.1.1 編碼器自注意力模型

本編碼器結(jié)構(gòu)模型如圖1所示.在編碼器上,運(yùn)用了4層卷積層和1層線性層對圖像數(shù)據(jù)進(jìn)行特征映射和參數(shù)調(diào)整,能夠有效地實(shí)現(xiàn)數(shù)據(jù)降維,并且高度保留圖像特征.隨后,將處理后的數(shù)據(jù)傳入自注意力機(jī)制模型,捕捉數(shù)據(jù)特征的內(nèi)部相關(guān)性.

圖1 編碼器模型Fig.1 Encoder model

第一階段,通過線性層將學(xué)到的數(shù)據(jù)分布式特征表示映射到樣本標(biāo)記空間,得到查詢矩陣Q(query)、鍵矩陣K(key)和值矩陣V(value).

第二階段,將Q和K網(wǎng)絡(luò)的輸出矩陣相乘,計(jì)算兩者相關(guān)性,得到Q-K矩陣如下:

Similarity(Q,Ki)=Q·Ki

(1)

第三階段,使用Softmax激活函數(shù)得到w,對第一階段的原始分值進(jìn)行歸一化處理,將Q和K的縮放點(diǎn)積轉(zhuǎn)化為注意力的相對測量.這里的計(jì)算結(jié)果ai即為V對應(yīng)的權(quán)重系數(shù),即:

(2)

第四階段,根據(jù)權(quán)重系數(shù)對V進(jìn)行加權(quán)求和,將Softmax激活后的w與v矩陣相乘,得:

(3)

第五階段,將得到的w-v矩陣和輸入圖像X進(jìn)行元素級相乘,得到自注意力機(jī)制的輸出w-v.總的自注意力機(jī)制計(jì)算公式為:

(4)

1.1.2 編碼器殘差網(wǎng)絡(luò)

在得到QKV網(wǎng)絡(luò)的輸出后,將這一部分輸出與輸入圖像相加,構(gòu)成殘差連接傳到線性層,并從線性層輸出模型所需的潛變量空間編碼z.

在圖1模型中的resnet部分,運(yùn)用殘差網(wǎng)絡(luò)把輸入圖像直接映射到后面的網(wǎng)絡(luò)層中,確保后面的網(wǎng)絡(luò)層一定比前面包含更多的圖像信息.這樣能夠避免網(wǎng)絡(luò)退化現(xiàn)象,也能夠避免可能存在的梯度消失問題.

1.1.3 解碼器

本解碼器結(jié)構(gòu)模型如圖2所示.在解碼器階段,使用三層線性層和四層轉(zhuǎn)置卷積層將潛變量空間編碼z解碼,實(shí)現(xiàn)圖像的重構(gòu).在每一個(gè)線性層和卷積層后都選擇使用RELU函數(shù)進(jìn)行激活.RELU函數(shù)在一定程度上增加了網(wǎng)絡(luò)模型的稀疏性,使得模型提取出來的特征更具代表性.在相對小的運(yùn)算量區(qū)間內(nèi)成功提高網(wǎng)絡(luò)的泛化性能.值得一提的是,在編碼器和解碼器階段因參數(shù)量更少,較AR-VAE而言實(shí)現(xiàn)了更為輕量級的模型架構(gòu).

圖2 解碼器模型Fig.2 Decoder model

1.2 訓(xùn)練損失

提出一種新穎的潛變量空間解耦損失算法.在潛變量空間中采樣z~p(z),得到潛在空間上的先驗(yàn)分布.在高維數(shù)據(jù)空間采樣x~pθ(x|z),得到由θ參數(shù)化的解碼器網(wǎng)絡(luò).本研究后驗(yàn)分布qφ(z|x)由編碼器用參數(shù)φ近似.變分推理通過最大化證據(jù)下界(ELBO)來最小化近似后驗(yàn)和真實(shí)后驗(yàn)之間的KL散度,即:

(5)

上式第一項(xiàng),可被解釋為最大化重構(gòu)精度.第二項(xiàng)則是確保使用先驗(yàn)p(z)對潛在向量進(jìn)行采樣時(shí)生成真實(shí)樣本.

綜上,VAE的損失函數(shù)為:

LVAE(θ,φ)=Lrecons(θ,φ)+LKLD(θ,φ)

(6)

其中,重構(gòu)損失為:

(7)

KL散度損失為:

(8)

接下來向VAE訓(xùn)練目標(biāo)添加一項(xiàng)與屬性值相關(guān)的損失:將一個(gè)潛在空間的潛在向量表示為z:{zk},其中k∈[0,).本研究目標(biāo)是能夠沿著潛在空間維度r編碼屬性a.此時(shí),當(dāng)沿著r遍歷,屬性值a能夠增加.

計(jì)算該損失有如下3個(gè)主要步驟.

1) 第一步,計(jì)算一個(gè)屬性距離矩陣:

Da(i,j)=a(xi)-a(xj)

(9)

其中:i,j∈[0,m);m為訓(xùn)練批量大小.

2) 第二步,為潛在向量正則化維度r計(jì)算類似距離矩陣:

(10)

3)第三步,潛變量空間解耦損失為:

Lr,a=mean(exp(-tanh(δDr)·Da))

(11)

其中:δ是決定后驗(yàn)分布的可調(diào)超參數(shù).

該潛變量空間解耦損失能夠?qū)崿F(xiàn)預(yù)計(jì)目標(biāo),即成功地沿著解耦維度r編碼屬性a,迫使解耦維度潛在編碼與屬性值具有單調(diào)關(guān)系.本研究中潛變量空間解耦損失變化均勻,且損失十分易于優(yōu)化.該損失區(qū)間明顯,在出現(xiàn)符合預(yù)期結(jié)果時(shí)loss變化劇烈,損失在(0,1)區(qū)間范圍,出現(xiàn)不符合預(yù)期結(jié)果時(shí)損失會(huì)變?yōu)椤?

綜上,總的損失函數(shù)為:

(12)

其中:β>1,鼓勵(lì)潛在空間維度的獨(dú)立性;γ為可調(diào)超參數(shù),代表正則化強(qiáng)度;L為屬性個(gè)數(shù),l∈[0,).

該損失由三部分構(gòu)成,分別是VAE重構(gòu)損失、KLD散度損失和潛變量空間解耦損失.對屬性距離矩陣Da和潛在空間維度距離矩陣Dr的定義部分地參考了AR-VAE.

2 實(shí)驗(yàn)與分析

2.1 實(shí)驗(yàn)環(huán)境設(shè)置

采用Python 3.7.4編程語言和Pytorch 1.3.0深度學(xué)習(xí)框架,設(shè)計(jì)了一系列定量實(shí)驗(yàn),評估了包括解耦和重構(gòu)上的若干指標(biāo).選取2-d sprites數(shù)據(jù)集[11]和Morpho-Mnist數(shù)據(jù)集[12]進(jìn)行實(shí)驗(yàn),并使用Adam優(yōu)化器優(yōu)化訓(xùn)練模型.

β-VAE作為一種非監(jiān)督模型表現(xiàn)出與其他監(jiān)督模型相當(dāng)?shù)男阅埽瑢⑵渥鳛闈撟兞靠臻g解耦領(lǐng)域的基線模型并與之對比.同時(shí),也與使用屬性正則化監(jiān)督方法的AR-VAE模型進(jìn)行對比.

本模型在圖像數(shù)據(jù)集上進(jìn)行測試,所以模型中運(yùn)用到了卷積結(jié)構(gòu)而不是循環(huán)結(jié)構(gòu).為了確保一致性,數(shù)據(jù)集采用相同的優(yōu)化器、學(xué)習(xí)速率,并針對相同數(shù)量的Epochs進(jìn)行訓(xùn)練.

1) 對于2-d sprites和Morpho-Mnist數(shù)據(jù)集,β-VAE、AR-VAE和TA-VAE模型都用了10種不同的隨機(jī)初始化進(jìn)行了訓(xùn)練.

2) 對于β-VAE模型,β設(shè)置為4.0進(jìn)行訓(xùn)練.

3) 對于AR-VAE模型,γ設(shè)置為10.0,δ設(shè)置為1.0訓(xùn)練.

4) 對于TA-VAE模型,γ設(shè)置為10.0,δ設(shè)置為1.0訓(xùn)練.

2.2 數(shù)據(jù)集與屬性

使用評估潛變量空間解耦的標(biāo)準(zhǔn)圖像數(shù)據(jù)集2-d sprites和Morpho-Mnist.2-d sprites包含737 280個(gè)簡單變化的二維形狀.每一個(gè)二維形狀具有五個(gè)屬性,分別為:x軸位置、y軸位置、大小、方向、形狀.

1)x軸位置:在[0,1]的區(qū)間范圍均分,取32個(gè)不同的值.

2)y軸位置:在[0,1]的區(qū)間范圍均分,取32個(gè)不同的值.

3) 大小:在[0.5,1]的區(qū)間范圍均分,取6個(gè)不同的值.

4) 方向:在[0,2π]的區(qū)間范圍均分,取40個(gè)不同的值.

5) 形狀:有三種形狀,方形、心形和橢圓形.

選取數(shù)據(jù)集總體的70%作為訓(xùn)練集(516 096張圖片),取20%作為驗(yàn)證集(147 456張圖片),取10%作為測試集(73 728張圖片).

Morpho-Mnist包含70 000個(gè)手寫MNIST數(shù)字,以及使用一種形態(tài)測量學(xué)獲得的每個(gè)數(shù)字的復(fù)雜形態(tài)屬性.這些屬性包括面積、長度、厚度、傾斜度、寬度和高度.文獻(xiàn)[12]中具體形態(tài)測量學(xué)方法如下.

因MNIST圖像原始分辨率通常不足以支撐良好的形態(tài)學(xué)處理,并且直接在二值化圖像上測量屬性(例如長度、厚度等)可能不夠準(zhǔn)確并且量化嚴(yán)重.為了緩解這個(gè)問題并在測量中實(shí)現(xiàn)亞像素精度,Morpho-Mnist采取了以下處理步驟:1) 將圖片放大;2) 二值化處理:將模糊的放大圖像在其強(qiáng)度范圍的一半進(jìn)行閾值處理,以確保不會(huì)刪除細(xì)小的或模糊的數(shù)字;3) 計(jì)算歐氏距離變換(EDT):數(shù)字邊界內(nèi)的每個(gè)像素都包含到其最近邊界點(diǎn)的距離;4) 提取骨架:檢測EDT處理后的紋路,即檢測與兩個(gè)或多個(gè)邊界點(diǎn)等距的點(diǎn)的軌跡;5) 運(yùn)用提取出來的骨架信息為每個(gè)數(shù)字計(jì)算多種形態(tài)測量屬性;6) 可選地對二值化圖像應(yīng)用擾動(dòng);7) 將二值化或擾動(dòng)的圖像縮小到原始分辨率.

2.3 實(shí)驗(yàn)結(jié)果

2.3.1 潛變量空間解耦指標(biāo)

1) 可解釋性(interpretability)[8].可解釋性指標(biāo)測量僅使用潛在空間的一個(gè)維度i來預(yù)測給定屬性j的能力.通過對屬性值j的每個(gè)測試樣本點(diǎn)對應(yīng)的結(jié)果概率對數(shù)求和,得到該屬性的潛在空間可解釋性得分.

2) 模塊化(modularity)[13].它測量潛在空間的每個(gè)維度是否僅依賴于一個(gè)屬性.如果編碼維度能夠理想模塊化,它將與單個(gè)因子具有高互信息,而與其他因子具有零互信息.使用這個(gè)理想化案例的偏差來計(jì)算模塊化分?jǐn)?shù).

3) 互信息間隙(mutual information gap,MIG)[4].它測量給定屬性和與該屬性共享最大互信息的潛在空間的頂部兩個(gè)維度之間的互信息差異.

4) 分離屬性可預(yù)測(spearman correlation coefficient,SCC)[14].SAP計(jì)算對特定屬性的兩個(gè)最佳預(yù)測維度之間的差值,即研究每個(gè)潛在空間維度是否只依賴于一個(gè)屬性值.

5) 斯皮曼相關(guān)系數(shù)得分(spearman correlation coefficient,SCC)[15].其計(jì)算屬性值和潛在空間的每個(gè)維度之間的斯皮曼相關(guān)系數(shù)的最大值.

2.3.2 指標(biāo)對比分析

通過匯總所有屬性的平均值,得到每個(gè)指標(biāo)的得分.圖3顯示本模型TA-VAE與β-VAE、AR-VAE在2-d sprites以及Morpho-Mnist數(shù)據(jù)集上的解耦性能表現(xiàn),所示分別是3個(gè)模型在5種解耦指標(biāo)上的量化對比箱型圖.圖中的圓點(diǎn)表示不同的隨機(jī)初始化情況下模型在該解耦指標(biāo)上的分?jǐn)?shù).

圖 3 3個(gè)模型的指標(biāo)對比Fig.3 Metrics of the three models

數(shù)據(jù)集2-d sprites上的模型解耦指標(biāo)對比如表1所示.由表1數(shù)據(jù)對比分析可發(fā)現(xiàn),本模型TA-VAE在5種指標(biāo)的表現(xiàn)均遠(yuǎn)好于β-VAE.并且這種卓越的性能未來可能擴(kuò)展到其他數(shù)據(jù)集,解耦不同領(lǐng)域和不同屬性復(fù)雜程度的數(shù)據(jù)集.

表1 數(shù)據(jù)集2-d sprites上模型解耦指標(biāo)對比Tab.1 Comparison of metrics on the 2-d sprites

本模型TA-VAE與AR-VAE進(jìn)行指標(biāo)對比.

1) TA-VAE將可解釋性指標(biāo)從0.85提升到了0.91.這說明TA-VAE使用潛在空間的某一個(gè)維度預(yù)測給定數(shù)據(jù)屬性的能力較AR-VAE更優(yōu).可解釋性指標(biāo)是潛變量空間解耦任務(wù)中最關(guān)鍵的指標(biāo).在可解釋性上的大幅提升證明了TA-VAE模型優(yōu)越的潛變量空間解耦能力.

2) 模塊化度量指標(biāo)上TA-VAE與AR-VAE持平.這可以通過觀察所使用的指標(biāo)計(jì)算方法進(jìn)行解釋.其計(jì)算過程中分?jǐn)?shù)除以具有潛在維度的所有屬性的互信息的最大值θi.這樣就導(dǎo)致即使AR-VAE模型互信息的值相對較低,卻也能夠得到較高的模塊化得分.

3) 互信息間隔(MIG)指標(biāo)略低于AR-VAE.這表明潛變量空間中除了解耦屬性的維度之外,還有其他維度與不同屬性共享高度的互信息.

4) 分離屬性可預(yù)測性(SAP)從0.85提升到0.91.這說明TA-VAE模型中每個(gè)潛變量空間維度更依賴于某一個(gè)屬性值,屬性在潛變量空間編碼的分離效果上較AR-VAE更優(yōu).

5) 斯皮曼相關(guān)系數(shù)得分(SCC)從0.88提升到了0.95.這樣的躍升說明TA-VAE模型某一屬性的屬性值與潛變量空間編碼維度之間具有更為良好的單調(diào)關(guān)系.

數(shù)據(jù)集Morpho-Mnist上的模型解耦指標(biāo)對比如表2所示.經(jīng)表2數(shù)據(jù)對比分析可發(fā)現(xiàn),TA-VAE在可解釋性、SAP、SCC三種指標(biāo)上均優(yōu)于其他兩個(gè)模型.但是在模塊化指標(biāo)上,TA-VAE與β-VAE、AR-VAE持平.在MIG指標(biāo)上與AR-VAE持平,且低于β-VAE.

表2 數(shù)據(jù)集Morpho-Mnist上模型解耦指標(biāo)對比Tab.2 Comparison of metrics on the Morpho-Mnist

從這里可以看出,Morpho-Mnist數(shù)據(jù)集上TA-VAE的表現(xiàn)也很好,但是2-d sprites數(shù)據(jù)集上的潛變量空間解耦度量通常會(huì)更高.出現(xiàn)這種結(jié)果的主要原因是2-d sprites是人工生成的數(shù)據(jù)集而Mnist是現(xiàn)實(shí)數(shù)據(jù),2-d sprites數(shù)據(jù)屬性復(fù)雜程度更低.

2.3.3 圖像重構(gòu)

2-d sprites數(shù)據(jù)集中有三種形狀類別(正方形、心形和橢圓形).圖4 (a)~(c)分別是3個(gè)模型在數(shù)據(jù)集上的屬性遍歷重構(gòu)圖像.這里展示心形圖像進(jìn)行對比.每一組圖像內(nèi)的不同列對應(yīng)了沿著潛在空間維度對某種特定屬性進(jìn)行編碼,從左到右的五列分別遍歷了形狀、大小、方向、x軸位置、y軸位置這5種屬性.

圖 4 2-d sprites的屬性遍歷圖像Fig.4 Controlling different attributes of 2-d sprites

觀察重構(gòu)圖像可以發(fā)現(xiàn)β-VAE重構(gòu)效果最差.大小屬性遍歷的最后一個(gè)圖像以及在心形旋轉(zhuǎn)時(shí)都無法準(zhǔn)確還原出心形.這說明β-VAE的潛變量空間解耦程度最低,難以實(shí)現(xiàn)很好的屬性遍歷效果.AR-VAE和TA-VAE在重構(gòu)圖像上明顯更優(yōu).但AR-VAE在x軸遍歷的最后一個(gè)圖像上生成心形較TA-VAE更為模糊.

Morpho-Mnist數(shù)據(jù)集中有0~9共10種數(shù)字.圖5 (a)~(c)分別列出3個(gè)模型在數(shù)據(jù)集上的屬性遍歷重構(gòu).這里展示數(shù)字7圖像進(jìn)行對比.每一組圖像內(nèi)的不同列對應(yīng)了沿著潛在空間維度對某種特定屬性進(jìn)行編碼,從左到右6列分別是面積、長度、厚度、斜度、寬度、高度的遍歷.

圖5 Morpho-Mnist的屬性遍歷圖像Fig.5 Controlling different attributes of Morpho-Mnist

觀察重構(gòu)圖像可以發(fā)現(xiàn)Morpho-Mnist數(shù)據(jù)集上3個(gè)模型的表現(xiàn)都不如2-d sprites數(shù)據(jù)集.β-VAE的重構(gòu)圖像最差,生成圖像十分模糊.AR-VAE和TA-VAE在重構(gòu)圖像的清晰度以及屬性遍歷的完整度上明顯更優(yōu).沿著潛變量空間的特定維度進(jìn)行遍歷,手寫體數(shù)字的各種屬性都在不斷變大.但是在長度屬性遍歷中的最后一個(gè)圖像上TA-VAE的長度較AR-VAE明顯更長,厚度屬性中TA-VAE的重構(gòu)圖像也更為清晰,厚度更大.

重構(gòu)準(zhǔn)確率是評估生成模型的重要指標(biāo).本實(shí)驗(yàn)測量了3種不同模型對2-d sprites圖像,以及Morpho-Mnist手寫體數(shù)據(jù)集的重構(gòu)準(zhǔn)確率,如圖6所示.3個(gè)模型在2-d sprites數(shù)據(jù)集的重構(gòu)準(zhǔn)確率都很高.β-VAE為99.65%,AR-VAE和TA-VAE都高達(dá)99.90%.在Morpho-Mnist數(shù)據(jù)集,β-VAE為94.20%,AR-VAE為97.10%,TA-VAE為97.20%.雖然于目前的解耦任務(wù)而言重構(gòu)準(zhǔn)確率相對較高,并且提高解耦能力可能要以犧牲重構(gòu)為代價(jià).但本模型在解耦性能更好的情況下,重構(gòu)準(zhǔn)確率仍遠(yuǎn)高于β-VAE,并且高于AR-VAE.這也證明了本模型在潛變量空間解耦上的良好性能.

圖6 3個(gè)模型的重構(gòu)準(zhǔn)確率對比Fig.6 Reconstruction metrics of the three models

3 結(jié)語

對編解碼模型和訓(xùn)練損失進(jìn)行新穎設(shè)計(jì).通過構(gòu)造沿著潛變量特定維度對數(shù)據(jù)屬性進(jìn)行編碼的潛在空間,更好地實(shí)現(xiàn)潛變量空間解耦,生成圖像數(shù)據(jù).本模型在通用數(shù)據(jù)集2-d sprites和Morpho-Mnist上取得很好的解耦效果.通過客觀指標(biāo)對比,在保證重構(gòu)精度的前提下,本模型在可解釋性、分離屬性可預(yù)測性(SAP)、斯皮曼相關(guān)系數(shù)得分(SCC)指標(biāo)上取得提升效果,圖像解耦性能優(yōu)于β-VAE基線模型和AR-VAE先進(jìn)方法.

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 免费无码AV片在线观看国产| 精品少妇人妻一区二区| 欧美成人一区午夜福利在线| 91网红精品在线观看| 无码专区在线观看| 四虎永久在线精品国产免费| 国产视频自拍一区| 中文成人在线视频| 成人免费一区二区三区| 67194成是人免费无码| 欧美一区二区自偷自拍视频| 色视频久久| Aⅴ无码专区在线观看| 男人天堂伊人网| 免费可以看的无遮挡av无码 | 亚洲精品老司机| 午夜成人在线视频| 国产在线98福利播放视频免费| 日韩精品一区二区三区中文无码| www.狠狠| 男女男精品视频| 亚洲一区色| 国产中文一区a级毛片视频| 中文字幕乱妇无码AV在线| 日韩视频福利| 成人永久免费A∨一级在线播放| 亚洲永久免费网站| 22sihu国产精品视频影视资讯| 欧美高清国产| 成人精品在线观看| 成人国产小视频| 国产精品一区二区久久精品无码| 日韩欧美国产三级| 97久久免费视频| 99精品高清在线播放| 久久综合干| 91精选国产大片| 午夜影院a级片| 亚洲中文字幕23页在线| 欧美午夜在线播放| 亚洲黄色视频在线观看一区| WWW丫丫国产成人精品| 在线观看av永久| 国产91九色在线播放| 国产精品3p视频| 青草视频久久| 国产精品yjizz视频网一二区| 成人精品免费视频| 亚洲精品第一在线观看视频| 亚洲男人的天堂久久香蕉| 欧美日韩国产在线观看一区二区三区 | 国产综合色在线视频播放线视| 91久久偷偷做嫩草影院免费看| 精品伊人久久久久7777人| 午夜视频在线观看免费网站| 91福利免费| 99久久精品免费看国产免费软件| 77777亚洲午夜久久多人| 欧美特黄一级大黄录像| 22sihu国产精品视频影视资讯| 88av在线看| 小说区 亚洲 自拍 另类| 国产99久久亚洲综合精品西瓜tv| 亚洲综合香蕉| 色九九视频| 亚洲三级色| 最新日本中文字幕| 亚洲国产日韩在线成人蜜芽| 久久一本日韩精品中文字幕屁孩| a国产精品| 亚洲综合极品香蕉久久网| 亚洲AⅤ波多系列中文字幕| 国产综合网站| 欧美日本在线一区二区三区| 国产最新无码专区在线| 99视频在线免费看| 亚洲成在人线av品善网好看| 日本高清有码人妻| 在线观看国产精品日本不卡网| 国产高清自拍视频| 成人免费网站久久久| 国产精品成人一区二区不卡 |