服裝設計知識圖譜中的服裝裝飾工藝分類模型

2021-01-05 06:00:04張遠鵬

紡織學報 2020年8期

楊娟，張遠鵬

(1. 蘇州大學紡織與服裝工程學院，江蘇蘇州 215123； 2. 南通大學紡織服裝學院，江蘇南通 226001；3. 南通大學智能信息技術研究中心，江蘇南通 226001； 4. 香港理工大學電子計算學系，香港 999077)

知識經濟時代是伴隨著大數據、物聯網、云計算、人工智能、區塊鏈等技術的成熟和相互融合而開始的。隨著計算機技術的迅速發展和網絡信息數據的爆炸式增長，服裝設計資源信息通過數字化、網絡化的形式，高速在互聯網上傳播形成了巨型的知識網，為設計者提供了豐富的素材積累和實時的潮流資訊。就目前對服裝設計行業的調研來看，網絡資源的利用呈現出2方面的特征：一方面手動檢索效率低下，信息的可信度甄選困難，信息反饋滯后；另一方面，海量數據通過各種渠道井噴式涌現，其中所包含的信息魚龍混雜、良莠不齊，很難快速高效地提取有價值的信息并加以利用。如何解決信息超載與知識饑渴的矛盾，實現服裝設計資源的有效檢索與利用是當前服裝設計領域的關鍵課題。服裝設計資源知識圖譜能夠從語義層面為設計師提供輔助檢索、智能推薦等功能，在服裝設計行業具有極高的應用價值。在服裝設計資源知識圖譜自底向上構建過程中，會面臨各類資源的分類問題，其中，文本資源分類尤為常見。

服裝工藝作為服裝設計的三要素之一，是服裝設計得以實現的重要環節。裝飾工藝作為其主要的組成部分已經成為展現服裝藝術性、時尚性和風格特征的重要手段，促進當今服裝設計與服飾審美的多元化呈現，因此，服裝設計知識圖譜中裝飾工藝已成為不可或缺的重要知識資源。在互聯網上存在大量有關裝飾工藝的文本描述，例如：“在中原地區，印花技術的再度復興是從纈開始的，纈有絞纈、葛纈和夾纈。絞纈、葛纈實際上就是一種仿染印花的織物……”[1]，對于這類文本資源，期望能夠自動判斷其工藝類別屬于刺繡、印染、編結、手繪或鑲嵌等其中的一種，因此，智能分類模型不可或缺[2-3]。由于文本資源較為復雜，在進行向量表示后維數高，從單一視角建立分類模型進行分類已很難滿足應用需求，故具備多視角協同學習的分類模型應運而生。例如：Jiang等[4]提出一種具備雙視角協同學習的分類模型，通過在目標函數中引入各視角決策誤差最小的約束實現協同學習，同時引入信息熵學習各視角的權重；張遠鵬等[5]提出一種多視角模糊聚類算法，利用各視角代表點一致性約束來實現多視角協同學習。

在目前已有的多視角分類模型中，噪聲視角或弱相關視角給多視角分類模型分類結果帶來負影響的研究較少。所謂噪聲視角或弱相關視角，指的是在其所包含的樣本特征空間中，缺乏有效的模式識別信息來訓練模型參數。裝飾工藝文本在向量化后，每一維特征表示每個特征詞，如果將每個特征詞看成是一個視角的話，那么在進行多視角分類模型建模時，就必然要考慮如何降低噪聲視角或弱相關視角帶來的負影響。這是因為一篇裝飾工藝文本中肯定存在一些特征詞，對其類別判定貢獻較小，甚至起到負作用。為此，本文提出一種具備視角約減的多視角分類模型(VR-MV-CM)，該模型以經典1-階 TSK(Takagi-Sugeno-Kang)模糊[6]系統作為基礎，引入變體信息熵，控制各視角的權重學習；然后設計約減規則，在VR-MV-CM的目標函數優化過程中，動態約減噪聲視角或弱相關視角，對服裝裝飾工藝文本進行分類。

1 服裝裝飾工藝文本預處理

本文所使用的服裝裝飾工藝文本資源來源于表1 所示的站點(僅包含部分)。文本資源的抽取方式采用本文作者2018年所開發的領域模型[7]。在進行裝飾工藝文本所屬類別判定之前，需要對其進行預處理。預處理的主要過程如圖1所示。

表1 服裝裝飾工藝文本資源部分站點Tab.1 Some of web sites for text recourses describing garment ornamenting craft

圖1 服裝裝飾工藝文本資源的預處理過程Fig.1 Preprocessing of text recourses describing garment ornamenting craft

從圖1可看出，在構建分類器進行裝飾工藝文本分類之前，需要進行4個步驟的預處理。1)分詞：分詞的主要目的是從文本中劃分出最小實體表示單位，即詞。本文使用中科院提供的分詞工具ICTCLA[8]進行分詞處理。2)特征詞提取：特征詞提取的主要目的是從分詞結果中提取具有一定代表性的特征詞。在本文中，對于分詞獲取的所有實體詞，利用詞頻-逆文檔(TF-IDF)[9]計算權重值并按照權重值從小到大排序，取前60%的實體詞作為特征詞。3)特征詞向量化：特征詞向量化的主要目的是利用1組量化的數值(向量)來表示特征詞，方便分類模型處理。在本文中，利用Mikolov在2013年提出的Word2vec模型[10]來訓練特征詞向量模型，進而將特征詞向量化。4)文本向量化：文本向量化是在特征詞向量化的基礎上，利用詞向量來表示文本。用于文本向量化的方法有很多，本文采用一種樸素的文本表示方法，即用所有特征詞向量的平均值來表示文本。

在將所有的服裝裝飾工藝文本向量化后，接下來構建分類模型，進行工藝類別判定。

2 服裝裝飾工藝分類模型

經預處理獲得的服裝裝飾工藝文本向量維數較高，必然存在一些特征對文本分類精度貢獻較低，甚至還會產生負影響。如果將每一維特征看成一個視角的話，那么在構建多視角分類模型時，就需要考慮如何約減這些貢獻度較低的視角。本文提出一種針對服裝裝飾工藝文本分類且能夠進行視角約減的多視角分類模型。

2.1 多視角協同學習機制

(1)

其中，

(2)

(3)

2.2 視角約減機制

在訓練數據集D中，可能會存在某些視角(特征)對最終的分類結果產生負影響，因此，需要一種機制來實現對此類視角的自動約減，減少或屏蔽此類視角的負影響。故提出基于變體信息熵的視角權重自適應學習機制來學習各視角的權重，并通過預先設定的規則對視角權重小于某一閾值的視角進行約減，消除他們對分類結果的負影響。對于訓練數據集D而言，視角加權的機制可表示為如式(4)所示的形式：

(4)

式中：yic表示第i個文本向量屬于第c類；w=[w1,w2,…,wM]表示視角權重向量，其中wm表示第m個(m=1,2,…,M)視角的權重；δm為控制權重wm學習的參數；參數β用于控制Φ的貢獻程度，該值由用戶指定或者在訓練數據集上通過交叉驗證的方式得到。

在概率統計領域，通常使用方差均值比(VMR)來觀察樣本的分散程度，VMR值越小，表示樣本越聚集，反之則表示樣本越分散。在式(4)中，期望通過第2項，使得包含分散特征的視角能夠獲得較小的權重，因此，在本文中采用VMR的倒數形式，即均值方差比(RMV)作為δm，來實現對各個視角權重學習的控制。

2.3 目標函數及其優化

基于上述協同機制以及視角約減機制，VR-MV-CM 的目標函數可表示為如式(5)所示的形式：

(5)

(6)

(7)

(8)

(9)

式中：w′m表示更新后的視角權重；M′表示約減后的視角總數。

(10)

3 實驗分析

利用本文作者2018年所構建的領域模型[7]，從互聯網抽取裝飾工藝文本文檔共5 400篇，并按照圖1所示的預處理步驟對所有文本進行向量化。對于5 400個文本向量，選擇80%進行人工類別標注，并作為訓練文本向量(訓練文本示例如表2所示)構建訓練數據集，所涉及的服裝裝飾工藝類別包括5類，分別為“刺繡”“印染”“編結”“手繪”和“鑲嵌”，類別標簽分別用1、2、3、4、5表示。其余20%作為測試文本向量構建測試數據集。

選擇支持向量機(SVM)[11]、C4.5決策樹(C4.5)[12]、 1-階TSK模糊系統(1-TSK-FS)[6]以及Jiang等[13]提出的多視角TSK模糊系統(MV-TSK-FS)作為對比分類模型進行分類結果的比較。SVM、C4.5、1-TSK-FS以及本文提出的VR-MV-CM中的參數均通過在訓練數據集上進行5-折交叉驗證的方式獲取。實驗將從3個方面進行：1)對于VR-MV-CM，觀察有視角約減和無視角約減(只需將δm設置為0)時在訓練數據集和測試數據集上的分類精度；2)觀察VR-MV-CM和所引入的對比模型在訓練數據集和測試數據集上的分類精度；3)將VR-MV-CM所約減的視角從訓練數據集和測試數據集中剔除，用剔除后的訓練數據集和測試數據集重新測試對比模型，觀察與剔除之前分類精度的變化。

表2 訓練文本示例Tab.2 Example of training texts

采用分類精度指標評價實驗結果。分類精度定義為正確分類的樣本數和總樣本數的比值。在訓練數據集上的分類精度，稱之為訓練精度，在測試數據集上的分類精度，稱之為測試精度。表3、4分別示出在訓練數據集和測試數據集上的實驗結果。其精度均為對應模型運行50次的平均值和標準差。

表3 對比分類模型的訓練精度Tab.3 Training precison of comparison classification models

從表3、4實驗結果可看出，在訓練和測試數據集上，VR-MV-CM在約減噪聲視角或弱相關視角后，50次的平均分類精度相比約減之前，分別提高了4.32%和2.68%。另外，即使VR-MV-CM未進行視角約減，由于采用了多視角協同學習機制，相比其他單視角決策模型(SVM、C4.5、1-TSK-FS)，訓練和測試精度仍具有優勢。

表4 對比分類模型的測試精度Tab.4 Testing performance of comparison classification models

VR-MV-CM在50次運行后，在訓練數據集和測試數據集上共約減的視角數的平均值為12.1和11.4。通過將這50次約減的視角交集從測試數據集中剔除，然后重新運行對比算法(包括VR-MV-CM在δm=0時)。從表3和表4的第4列可看出，在剔除噪聲視角或弱相關視角后，所有決策模型的訓練和測試精度均有所提高，這再次印證了本文所提出的VR-MV-CM進行噪聲視角或弱相關視角的有效性。

4 結論

在服裝設計資源知識圖譜構建過程中，為判定服裝裝飾工藝文本的類別，本文提出了一種具備噪聲視角或弱相關視角約減功能的多視角分類模型(VR-MV-CM)。該模型綜合考慮了視角之間的協同學習以及視角權重的學習，同時利用約減規則過濾權重較低視角。這不僅充分挖掘了視角之間的潛在關聯，同時也削減了噪聲視角或弱相關視角對于最后分類結果的影響。在服裝裝飾工藝文本分類實驗中，VR-MV-CM能夠自動剔除權重較低的視角，相比所引入的對比決策模型，具備更好的分類精度。在后續的研究中，將從文本資源拓展至圖像資源，進一步驗證模型的功能。

FZXB