Abstract:Thefocusofthisstudyisonthetextualresearchanddigitizationoftraditionalclothing,trainingtoformastableLora model.Buildingonthis,itcombinesspecificuseranddesignerneedstocreatedesigns withconsistentstyles.Thestudydigitizes typical elementsof Mongoliantraditional Costumeandanalyzes thecolorsof typicalMongolian garments,processing them digitally toasistindivergentdesign.Itestablises workflowstailoredtovarious design stylesandtests theimagegeneration efectsofthemodelacross diferentpaths.Theresultsindicatethatusingacomprehensivedatasetoftraditionalclothingand itscolors,astableLoramodelcanbeformedthroughdeplearning.Thedifusionmodel,basedonthisgeneratesimagesand designs i multiplestyles,efectivelyachieving cultural heritageand innovativedesign migrationoftraditionalclothing.This providesareferenceforfashiondesignersandresearchers inthefashionindustrytouseAIGCtechnologyfortheinheritaceand innovation of traditional Chinese clothing.
KeyWords:LoraModel;MachineLearning;CostumeColor;MongolianAttire
近年來,隨著AI技術的發展,越來越多的研究者探索并擴展著數字藝術與設計創意需求的邊界,擴散模型、去噪擴散概率模型、潛空間擴散模型等不斷地迭代,不斷地提高擴散模型的圖像生成效率。本文以蒙古族服飾為切入點,探究對傳統服飾的圖像考據復原,并將擴散模型應用于藝術創作。
1Lora模型的工作原理及蒙古族服飾設計因子提取
1.1Lora模型賦能蒙古族服飾數字化
AIGC的全稱為“人工智能生成內容”(ArtificialIntelligenceGeneratedContent),是以深度學習為基礎的大型神經網絡模型。在目前設計領域應用較為廣泛的,主要有Midjourney、DALL-E2、StableDiffusion等主流模型[]。在蒙古族服飾數字化及創新設計方面,AIGC不僅能作為圖像內容的生成工具,還能在顯著提高設計生產效率的同時降低設計生產成本。在未來,人工智能技術將繼續高速發展,AIGC賦能傳統服飾和民族服飾的傳承與創新也將是必然趨勢。
深度學習模型,特別是卷積神經網絡(CNN),能夠自動學習和提取數據中的特征,無需依賴復雜的數學模型和假設[2]。通過大量的訓練數據,深度學習模型可以不斷優化其參數,從而實現高精度的復原效果。對于以蒙古族服飾為代表的傳統服飾和民族服飾,要實現更高效的設計轉化,在設計前期將較為準確的服飾圖像、較為考據的文本信息輸入模型,進行充足的深度學習,生成較為穩定適配的Lora模型,能為后續的新圖像生成及設計迭代、泛化,打下良好的基礎,甚至達到出其不意的創新創意方案。
2015年之后,深度學習技術的快速發展有力推進了生成藝術的技術迭代,卷積神經網絡(CNN)開始以一種嶄新的方式理解視覺圖像,并實現神經風格遷移,從而讓融合不同圖像風格以創建新圖像成為可能。[3深度學習技術在圖像復原和信號處理方面展現出了巨大的潛力。在圖像產出方面,深度學習方法強大的泛化能力,能夠適應各種復雜和動態變化的場景,顯著提高圖像和信號復原的質量和效率。甚至擴展至多模態、全方位的創意內容創作。例如,生成對抗網絡(GANS)和變分自編碼器(VAES)等技術已經能在圖像和音頻領域創作出相關的藝術作品。
1.2蒙古族服飾形制的復原傳承及設計特征因子提取
1.2.1 蒙古族服飾的總體風格及設計因子提取
蒙古族服裝兼具審美與實用,寬松的袍服在游牧習俗中亦可用作鋪蓋,呼應了蒙古族人豪放的草原文化性格,寬大高聳又華貴莊重的服飾也與游牧生活和諧匹配。
根據系統分類學理論,蒙古族服飾整體上可以按照結構分為直身袍和斷腰袍兩種主要廓形,根據其腰部結構和袖型各分為三種類型,按照門襟結構可分為四個類型,按照頭飾特征可分為六式[4]。蒙古各部落裝飾紋樣各有不同,不同的紋樣分別濃縮著各部落的圖像語言和文化隱寓。
蒙古族紋樣大致有幾何紋(如萬字紋、回紋、云紋、錦地紋、牛鼻紋、銅錢紋、盤腸紋、壽字紋等)、植物紋(如卷草紋、牡丹花紋、桃花紋等)和動物紋(如蝴蝶紋、龍鳳紋、馬紋等);蒙古族服飾的工藝主要有包邊、飾絳、隆泡袖、辮線、抽褶、貼片等。
在本次模型訓練過程中,訓練集素材將根據蒙古族典型服飾元素進行抓取,將前文所述典型的蒙古袍廓形、結構、門襟、典型紋樣等進行歸納總結(表1),根據李莉莎的蒙古族服飾結構[5的分類,總結后生成畫面風格一致的蒙古族服飾圖像,并進行后期的模型訓練實驗。
1.2.2蒙古族服飾的色彩及設計因子提取
本系列服飾訓練素材對蒙古族服飾色彩也做了提取,使訓練集中的整體服飾色調符合蒙古族服飾審美。蒙古族性情豪邁熱情,服飾用濃烈的色彩表達其對于草原生活的熱情與生活觀念。
在蒙古族文化中,不同的顏色對應著不同的漢語蒙語音譯讀音,也有著不同的象征與美好寓意:從文化淵源上,可能與蒼狼白鹿的神話傳說有關;從織物材料上,可能與草原上易得的氈料和羊毛織物、蒙古包文化有關;從自然環境上,還可能與圣潔的天空、潔白的云朵、豐饒的羊群有關。自然、地理、生活生產中最常見的色彩,直接或間接影響了蒙古族服飾的用色?;诖?,張瑞霞對蒙古族傳統服飾色彩符號進行了分析整理 (表2)。
在白、藍、紅、黃等主要傳統色彩的主導下,蒙古族服飾以高飽和的濃重色彩為主色調,配以各種精美華麗的鑲邊裝飾以及頭飾串珠的金屬裝飾。例如,邊飾部分往往采用對比互補的色彩調和,紅與綠、紅與黃、紅與藍等高純度且對比明顯的色彩,使主色更為鮮艷、明亮;頭飾部分,裝飾有彩色的寶石和金、銀、黑、白等金屬色和無彩色,使點綴其中的眾多色彩完整而調和。

本文節選自《傳承:蒙古族、達幹爾族、鄂倫春族、鄂溫克族服飾》與《中國蒙古族服飾》中28個蒙古族部落的典型女裝服飾部分款式,針對各部落蒙古袍的典型服飾色彩使用及色彩搭配關系進行分析,為后文的蒙古族服飾圖像Lora模型生成提供設計因子 (表3)。
2民族服飾復原圖像生成實驗
2.1 實驗環境
本次實驗使用的計算機硬件配置:顯卡型號為NVIDIAGeForceRTX4060LaptopGPU,CPU型號為Intel(R)Core(TM)i9-14900HX2.20GHz,內存為16GB。
2.2蒙古族服飾復原風格Lora
2.2.1蒙古族服飾復原風格Lora模型數據集構建
蒙古族服飾復原風格Lora訓練數據集包括訓練圖像與圖像對應的描述文本,其訓練圖像數據均為整理收集的蒙古族服飾圖像,未明確限定圖像實物年代,預訓練單圖均經過繪圖軟件人工處理。通過Photoshop 將已有的蒙古族服飾圖像進行人工圖像及服飾形制的預處理,將畫面中的服飾及圖像元素進行繪畫性的整合統一。

預處理時統一圖片尺寸、分辨率、統一干凈的空間背景、一致穩定的色溫光線。每張訓練圖像都有對應的英文描述文本(圖1),文本邏輯除基本的“greyground,fullbody,1girl,Portraitview”等統一畫面內容外,重點進行服飾描述,按照從整體到局部,從上到下的順序,色彩、款式、面料、紋樣、裝飾細節等,通過文本復現進行文本與圖片中服裝要素對應關系的訓練。

素材重點在于還原正宗的蒙古族服飾,因此在訓練數據集中,服飾圖像及英文描述文本中均反復出現復原性蒙古族服飾名詞 (表4)。
2.2.2 蒙古族服飾復原風格Lora模型的訓練
本模型的主要訓練參數設置:24張訓練圖像數據,每張圖片訓練次數20,訓練輪數(epoch)設定為20,訓練批量(batchsize)為2張,訓練總步數為9600步,學習率2e-4,參數預訓練參數底模為R18偏真人2.8D.safetensors。該模型為stablediffusion全參數微調后的開源大模型,生成畫面偏向于接近真實人像,而不是帶有二次元動漫人物風格的2.8D效果圖像。

2.2.3蒙古族服飾復原風格Lora模型的生成效果
驗證本模型的訓練有效性時,在stablediffusion圖像生成過程中調用訓練好的蒙古族服飾復原風格Lora(其他參數:底模大模型為R18偏真人2.8D.safetensors;提示詞相關性為7;圖像生成分辨率為512?784 ;生成圖像采樣步數設置為27;啟用detail強化head、hand即頭部、手部等)。

結果表明:隨著Lora權重增加,訓練集中的服裝元素特點越發顯著;隨prompt權重增加,prompt導向的設計意圖就越發明顯。如蒙古族長袍、蒙古族連身袍或斷腰袍結構、盤扣、蒙古族樣式的華麗珠寶裝飾、蒙古族袖型、冠帽樣式、面料質地等。當Lora權重增加至0.6左右時,服飾要素與設計衍生都較為顯著且較為平衡;權重過高則容易出現過擬合、服裝結構混亂的現象;權重過低則容易出現特征因子不明顯的情況。在調用Lora模型時合理協調其他各項參數權重,則可以達到平衡協調的生成效果。

3設計反思及設計二階衍生
3.1風格衍生意圖下蒙古族服飾Lora的不同設計工作流
訓練得到蒙古族服飾Lora模型后,不僅可以產出蒙古族服飾較為準確且風格較為穩定的圖片,還可以建立Lora集并應用于民族服飾的數字化譜系構建,如蒙古族各支系服飾數字化圖像譜系構建、歷代傳統服飾數字化譜系構建等。就設計學和服裝設計專業而言,更重要的是基于AIGC訓練得到穩定的蒙古族服飾Lora模型,可以高效地衍生出不同風格的設計圖像,這些圖像將既能表征穩定的蒙古族服飾要素,又能良好地兼容其他具有創造性的設計風格,建立穩定而具有邏輯延展性的Lora模型庫。這對于設計師和服裝行業而言,可能會成為一種極大提升工作效率甚至轉變設計工作方法的新思路。
蒙古族復原風格服飾Lora疊加其他衍生設計風格的工作流。中國傳統服飾或與蒙古族一樣的少數民族服飾,在生成式人工智能語境下都面臨一個共同的研究難點,即中文語境下存在大量的傳統服飾及民族服飾專有名詞在英文語境中無法被通行地辨識和理解。因此,需要在垂類模型中進行專門的訓練和機器學習。未經訓練時,stable diffusion無法通過單一的文生圖prompt觸發生成準確的蒙古族服飾元素。
訓練得到蒙古族服飾復原Lora后,疊加Lora可使生成圖像具備較為穩定的蒙古族服飾元素。然而,當設計目的要求在保持蒙古族服飾風格的基礎上進行更多風格的衍生設計時,利用AIGC技術以及工作流中的幾個關鍵節點對圖像生成進行優化 (圖3)。本文對部分工作流進行了進一步的實驗及說明。
(1)工作流1:以大模型(checkpoint)為節點調控,由于大模型數據量大且最為穩定,因此在開源或非開源數據中選擇特定風格的大模型,搭載蒙古族服飾風格Lora模型,生成的圖像最為穩定。
(2)工作流2:以提示文本(prompt)為節點調控,由于提示文本內容不穩定且不能保證其中的自然語言均已經過機器學習成為有效文本,因此生成圖像較不穩定。

(3)工作流3:通過蒙古族服飾Lora疊加其他設計風格prompt生成圖像,經過人工挑選及預處理,形成蒙古族服飾疊加其他設計風格服飾圖像數據集,訓練成為基于蒙古族復原服飾Lora二階衍生的(蒙古族 +X )Lora,將新的設計風格穩定下來。
(4)工作流4:以Lora訓練集為節點調控,將風格融合的工作在收集和整理訓練集階段完成,但前期工作量較大,需要對每一張圖片數據都進行較為深入的預處理,但穩定性較高。
3.2基于工作流2和工作流3的蒙古族服飾圖像生成設計
基于前文提到的工作流2和3,可以基于穩定的底模疊加蒙古族服飾Lora 模型架構,通過設置prompt進行蒙古族服飾二階衍生不同風格的服飾設計,下文嘗試列舉三種不同風格實驗 (表5),同時其他相關參數保持一致( .采樣方式DPM ++2Sa ,提示詞權重7,重繪幅度0.3,單批數量2,采樣步數27)。

3.3基于工作流4的蒙古族服飾 × 蒸汽朋克風格圖像生成
3.3.1蒙古族服飾蒸汽朋克風格Lora模型數據集構建
本模型的訓練數據集包括訓練圖像與圖像對應的描述文本。蒙古族蒸汽朋克Lora的訓練圖像數據均為設計圖像,預訓練單圖均為繪圖軟件人工處理,通過Photoshop將已有的蒙古族服飾圖像、衍生風格(蒸汽朋克風格服飾元素)圖片、AI預生成長袍圖像等圖像元素進行繪畫性的整合統一。預處理時統一圖片尺寸、分辨率、統一干凈的空間背景、一致穩定的色溫光線,圖像預處理集 (表6)。
Lookl 1位女孩,獨身一人,站立姿勢,全身照,灰色背景,蒙古族服飾,蒸汽朋克風格,蒸汽朋克皮靴,由金和銅制成,頭戴高聳的圓柱形王冠,裝飾著許多齒輪、指南針、鐘表機械和螺絲,蒸汽朋克風格的長袍,皮革材質,中式交叉領,右側翻領,金屬鑲邊,膝上長度的裙子,紅色寬松的披風,錦緞面料,紋理圖案。

每張訓練圖像都有對應的英文描述文本,文本邏輯除了基本的greyground、fullbody、1girl、正面等,還會重點進行服飾描述,從整體到局部,從上到下,包括色彩、款式、面料、紋樣,裝飾細節等。通過文本復現,進行文本與圖片中服裝要素對應關系的訓練。
3.3.2蒙古族服飾蒸汽朋克風格Lora模型的訓練
本模型的主要訓練參數設置:19張訓練圖像數據,每張圖片訓練次數30,訓練輪數(epoch)設定為18,訓練批量(batchsize)為2張,訓練總步數為10260步,學習率2e-4,參數預訓練參數底模為R18偏真人2.8D.safetensors,該模型為stablediffusion全參數微調后的開源大模型,生成畫面偏向于接近真實人像而帶有二次元動漫人物風格的2.8D效果風格圖像。
3.3.3蒙古族服飾蒸汽朋克風格Lora模型的生成效果
驗證本模型的訓練有效性時,在stablediffusion圖像生成過程中調用訓練好的蒙古族蒸汽朋克風格Lora,(其他參數:底模大模型為R18偏真人2.8D.safetensors;提示詞相關性為7;圖像生成分辨率為512?784 ;生成圖像采樣步數設置為27;啟用detail強化head、hand即頭部、手部等。)測試過程使用prompt文本,將Lora模型設置為0、0.3、0.6、0.9、1.0等不同權重分別生成圖像 (圖7)。

4結語
本文基于stablediffusion的Lora模型設計了兩種不同的工作流,以蒙古族服飾為例,探究了在民族服飾數字化復原的基礎上進行設計創新研究的方法和途徑,并進行了4種不同方向的衍生設計。隨著AIGC的迅速發展,就服裝及服裝設計行業而言,未來服裝業生產力及生產結構也將隨著技術的發展而呈指數爆炸的速度發展變化,生產結構的變革使得不同的生產部門及行業內部的產線結構和順序邏輯,都將進行重新匹配與調整。這就要求從事服裝創新設計研究及設計學研究的設計師及研究人員,率先進行設計及設計流程方法的研究。雖然目前AIGC在服裝圖像的生成方面,還存在著很多服裝結構在自然語言與機器學習之間轉譯和深度學習的問題,但在努力解決這些問題的過程中,也要看到可能產生的新問題,如影響就業機會、就業崗位等。技術引發的是生產力及生產結構變革,也一定會催生新的技術人員需求、新的藝術創意流派及媒介的迭代。我們應該以更宏觀的視野和格局,去擁抱新的技術時代。
5參考文獻
[1]岳頒,張晨康.多模態場景下AIGC的應用綜述[J/OL].計算機科學與探索.[2024-10-21].http://kns.cnki.net/kcms/detail/11.5602.TP.20241018.1543.011.html.
[2]扶暄澤.AIGC元年背景下人工智能繪畫的突破、爭議與反思[]新美域,2023(9):25-28.
[3]王澤軒,陳亞軍.AIGC技術發展與應用進展[J].印刷與數字媒體技術研究,2024(04):1-14+96.
[4]郭曉芳,趙偉慧,張金濱.基于眼動實驗蒙古族服飾特征差異及分類研究[J].絲綢,2024,61(5):94-104.
[5]李莉莎.蒙古族古代斷腰袍及其變遷[].內蒙古社會科學(漢文版),2011,32(5):71-74.