黃張燕,李一媛,岑婷婷,鄧涌康,呂燕君
(桂林電子科技大學,廣西桂林,541004)
隨著智能化應用的不斷發展,不管是現在和未來,我們都需要一款面向廣大用戶的智能化生成服裝樣式和搭配軟件。目前我們國內的網絡定制服務發展還不夠成熟,而人們生活水平和消費水平與日俱增,這一形式迫切需求服裝產業在互聯網上的快速發展。“壹服設”平臺縮短了服飾設計的過程,降低設計成本,節省人力、物力和財力,能快速滿足市場對具有時尚、獨特、個性化的服飾樣式的消費需求,這一功能可以有效地應用到各服裝品牌和服裝生產廠。同時它還能作為個人APP為廣大消費者實現個性化定制,滿足不同的消費需求,為用戶提供試衣模型,便于購買服裝以減少商家庫存囤積,同時為廣大設計愛好者的提供藝術交流的平臺。平臺能夠在很大程度上促進服裝產業的發展。在將來基于智能服飾設計的興盛是趨勢所向,它具有更廣闊的發展空間。
隨著我國綜合國力的不斷增強和在國際舞臺地位的提高,國人甚至外國友人對富有傳統文化的產品關注度也在提升,當代服裝企業為吸引更多的消費者,將增強當代文化服飾體系的鉆研的力度,為品牌注入中華傳統文化內涵。我國服裝業是世界頭號產量及出口大國我國服裝加工業技術高,在能滿足市場需求情況下,還有很大的發展前景。服裝的款式設計和色彩搭配是一項耗時耗力卻又十分重要的工作。目前,國內服裝市場上還沒有出現一款可以智能化快速生成服裝設計圖的軟件,此環境下,基于深層卷積生成對抗網絡的服裝圖像生成的方法,大幅減少服飾設計的本錢,是目前市場需求大、真正解決現有問題的創新產品,迎合了市場的需求,具有非常巨大的市場前景。
目前市面上所使用的服裝生成器大多使用基于數據的整理分類生成方法,僅能做到隨機生成不同的服裝搭配,而且由于生成器使用基于數據的整理分類生成方法,導致生成的服裝種類只能是已有的款式,針對性不強。進而存在生產水準低下、產品同質化嚴峻等一連串的問題,無法滿足消費者對服裝質量、時尚、前衛的需求,此時基于樣本學習服飾圖像生成平臺顯得尤為重要。
本項目旨在開發一個基于樣本學習進行服飾設計搭配的服飾圖像生成的Web平臺,主要功能包括:服飾生成功能、個性化定制功能、模型試衣功能、社交板塊等。為用戶提供快捷的服飾設計、搭配參考,基本功能實現后,我們將根據用戶反饋,不斷完善軟件,增加新的功能。
(1)服飾生成功能
根據用戶給定的服飾圖像自動提取其主要特征(如顏色、紋路、款式),并自動生成新的設計樣式,最后通過使用智能優化算法給出合理的服飾搭配設計圖。
服飾生成功能采用基于深層卷積生成對抗網絡的服裝圖像生成方法。 首先,結合卷積神經網絡強大的特征提取能力、生成對抗網絡能很好的學到復雜數據潛在分布的能力,設計并構建了深層卷積生成對抗網絡模型,學習服裝圖像的潛在分布并且生成新的圖像。其次針對生成對抗網絡難以收斂的問題,引入對噪聲魯棒的激活函數和初始化方法對其改進,使用判別器和生成器的迭代次數比為1: 3的訓練策略幫助網絡收斂到穩定狀態。
(2)個性化定制功能
向用戶推薦流行服飾元素、并能根據市場流行元素、圖案分類、服裝款式分類,給用戶定制個性化服飾設計。
卷積神經網絡是一種端到端的學習模型,它將會以網絡的輸入作為原始數據,然后經過多個卷積層、激活層,以及池化層之后,原始數據將會隱性地特征表示,進而達到改善因人工提取特征的偏差導致網絡魯棒性差的問題。
卷積核權值共享機制能夠實現減少網絡中訓練參數個數以及減小網絡的復雜度的效果。池化操作能夠通過降低特征圖的分辨率,具備提取具有空間不變性的特征的能力,這有利于降低了網絡模型的計算量,提升了網絡的泛化能力。
本文用X 表示輸入CNN的原始圖像,Fi表示CNN第i層的特征圖Fo=X,經過卷積層得到Fi的過程可以表示為:

其中wi表示第i層卷積核的權值向量,運算符號“?”表示卷積核與第i-1層特征圖的卷積運算操作,卷積運算的結果與第i層的偏移向量bi相加得到線性特征表示,然后通過非線性激活函數f(x)對輸出結果去線性化,得到第i層的特征圖Fi。卷積層之后通常連接池化層,池化操作這個過程并不會改變特征圖的數量,該過程能對特征圖的下采樣起到二次提取特征的效果。經過池化層得到第i層特征圖的過程可以表示為:

經過卷積層和池化層的多次交替傳遞,獲得原始圖像的深層特征體現,之后連接1個或者多個全連接層,用來整合卷積層或許池化層中能夠辨別類別的部分信息,得到基于輸入X的條件概率分布Y(i表示第i個類別的標簽):

然后根據具體的任務,選擇合適的損失函數loss(W,b),利用梯度更新優化算法對網絡中的參數進行更新。
生成對抗網絡模型結構由一個生成器G和一個判別器D構成,其中生成器G的任務是將隨機噪聲z盡量擬合到真實數據的分布Pdata中,并輸出生成數據G(z),判斷器的工作為辨別出輸入樣本是真實數據X還是生成數據G(z)。GAN的優化目標是達到納什均衡,這一優化流程如圖1所示。

圖1 GAN流程圖
判別器D是基于Sigmoid的二分類模型,在生成器G給定的情況下,通過最小化交叉熵損失來優化判別器D,其損失函數為:

其中,E(·)表示期望值,X表示真實數據分布Pdata(x)的采樣,Z表示先驗分布Pz(z)的采樣,通常是100維的隨機噪聲向量。D(x)表示判別器判別輸入樣本是真實數據X的概率,D的目標是使其越接近1越好,D(G(z))表示判別器判別輸入樣本是生成數據G(z)的概率,D的目標是使其越接近0越好,同時G的目標是使其越接近1越好。這是一個關于D和G的零和博弈,此時生成器G的損失函數為:

所以GAN的優化問題是一個極小極大問題,GAN的目標函數為:

在GAN的訓練過程中,需要訓練優化D的參數來最大化判別不同輸入數據的準確率,同時訓練優化G的參數來最小化log(1 - D( G( z)))。在訓練達到納什均衡狀態的GAN網絡中,生成器G掌握了真實數據的分布,學習到隨機噪聲到真實數據之間的映射關系,并且可以生成與真實數據幾近相似的數據樣本,此時判別器D對真實數據和生成數據的判別概率都為0.5。
深度學習在圖像和視覺領域發展迅速.卷積神經網絡(Convolutional neural network,CNN)是一種經典的深度學習模型,具有卷積核權值共享,相連層之間局部連接,降維的池化操作等優良特性,其強大的特征學習能力引起眾多科學領域的廣泛關注. Goodfellow等在2014年提出生成對抗網絡(Generative adversarial networks,GAN)模型.GAN 的提出使得圖像生成模型取得了巨大的進展。目前,GAN已經可以生成手寫數字圖像和自然的人臉圖像,給黑白圖像上色,從物體輪廓恢復原圖像,從低分辨率圖像生成高分辨率圖像等。此外深度學習是一種基于數據驅動的方法,GAN可以從大量數據中學習到真實數據的潛在分布,將隨機的高斯噪聲擬合到真實數據的分布中,從而生成與真實數據相似的樣本。
(3)模型試衣功能
建立2D人體模型,將生成的平面設計圖二維展示,用戶可通過模型直觀地觀察服飾設計效果。
其中模型的收斂性使用Tensorboard可視化訓練效果,所有的損失變化圖均使用0.926的平滑系數。隨著訓練次數的增加,生成樣本的損失函數變化情況如圖2所示,判別器的損失如圖3所示。根據圖2和圖3可以看出生成器和判別器在初始相互對抗的過程中呈現出圖中大幅震蕩的狀態,隨著訓練次數的增加,兩個模型的損失都在逐漸下降,網絡模型總體收斂到穩定狀態。

圖2 d_loss的變化趨勢

圖3 gloss的變化趨勢