999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

服裝設計知識圖譜中的服裝裝飾工藝分類模型

2021-01-05 06:00:04張遠鵬
紡織學報 2020年8期
關鍵詞:分類工藝文本

楊 娟, 張遠鵬

(1. 蘇州大學 紡織與服裝工程學院, 江蘇 蘇州 215123; 2. 南通大學 紡織服裝學院, 江蘇 南通 226001;3. 南通大學 智能信息技術研究中心, 江蘇 南通 226001; 4. 香港理工大學 電子計算學系, 香港 999077)

知識經濟時代是伴隨著大數據、物聯網、云計算、人工智能、區塊鏈等技術的成熟和相互融合而開始的。隨著計算機技術的迅速發展和網絡信息數據的爆炸式增長,服裝設計資源信息通過數字化、網絡化的形式,高速在互聯網上傳播形成了巨型的知識網,為設計者提供了豐富的素材積累和實時的潮流資訊。就目前對服裝設計行業的調研來看,網絡資源的利用呈現出2方面的特征:一方面手動檢索效率低下,信息的可信度甄選困難,信息反饋滯后;另一方面,海量數據通過各種渠道井噴式涌現,其中所包含的信息魚龍混雜、良莠不齊,很難快速高效地提取有價值的信息并加以利用。如何解決信息超載與知識饑渴的矛盾,實現服裝設計資源的有效檢索與利用是當前服裝設計領域的關鍵課題。服裝設計資源知識圖譜能夠從語義層面為設計師提供輔助檢索、智能推薦等功能,在服裝設計行業具有極高的應用價值。在服裝設計資源知識圖譜自底向上構建過程中,會面臨各類資源的分類問題,其中,文本資源分類尤為常見。

服裝工藝作為服裝設計的三要素之一,是服裝設計得以實現的重要環節。裝飾工藝作為其主要的組成部分已經成為展現服裝藝術性、時尚性和風格特征的重要手段,促進當今服裝設計與服飾審美的多元化呈現,因此,服裝設計知識圖譜中裝飾工藝已成為不可或缺的重要知識資源。在互聯網上存在大量有關裝飾工藝的文本描述,例如:“在中原地區,印花技術的再度復興是從纈開始的,纈有絞纈、葛纈和夾纈。絞纈、葛纈實際上就是一種仿染印花的織物……”[1],對于這類文本資源,期望能夠自動判斷其工藝類別屬于刺繡、印染、編結、手繪或鑲嵌等其中的一種,因此,智能分類模型不可或缺[2-3]。由于文本資源較為復雜,在進行向量表示后維數高,從單一視角建立分類模型進行分類已很難滿足應用需求,故具備多視角協同學習的分類模型應運而生。例如:Jiang等[4]提出一種具備雙視角協同學習的分類模型,通過在目標函數中引入各視角決策誤差最小的約束實現協同學習,同時引入信息熵學習各視角的權重;張遠鵬等[5]提出一種多視角模糊聚類算法,利用各視角代表點一致性約束來實現多視角協同學習。

在目前已有的多視角分類模型中,噪聲視角或弱相關視角給多視角分類模型分類結果帶來負影響的研究較少。所謂噪聲視角或弱相關視角,指的是在其所包含的樣本特征空間中,缺乏有效的模式識別信息來訓練模型參數。裝飾工藝文本在向量化后,每一維特征表示每個特征詞,如果將每個特征詞看成是一個視角的話,那么在進行多視角分類模型建模時,就必然要考慮如何降低噪聲視角或弱相關視角帶來的負影響。這是因為一篇裝飾工藝文本中肯定存在一些特征詞,對其類別判定貢獻較小,甚至起到負作用。為此,本文提出一種具備視角約減的多視角分類模型(VR-MV-CM),該模型以經典1-階 TSK(Takagi-Sugeno-Kang)模糊[6]系統作為基礎,引入變體信息熵,控制各視角的權重學習;然后設計約減規則,在VR-MV-CM的目標函數優化過程中,動態約減噪聲視角或弱相關視角,對服裝裝飾工藝文本進行分類。

1 服裝裝飾工藝文本預處理

本文所使用的服裝裝飾工藝文本資源來源于表1 所示的站點(僅包含部分)。文本資源的抽取方式采用本文作者2018年所開發的領域模型[7]。在進行裝飾工藝文本所屬類別判定之前,需要對其進行預處理。預處理的主要過程如圖1所示。

表1 服裝裝飾工藝文本資源部分站點Tab.1 Some of web sites for text recourses describing garment ornamenting craft

圖1 服裝裝飾工藝文本資源的預處理過程Fig.1 Preprocessing of text recourses describing garment ornamenting craft

從圖1可看出,在構建分類器進行裝飾工藝文本分類之前,需要進行4個步驟的預處理。1)分詞:分詞的主要目的是從文本中劃分出最小實體表示單位,即詞。本文使用中科院提供的分詞工具ICTCLA[8]進行分詞處理。2)特征詞提?。禾卣髟~提取的主要目的是從分詞結果中提取具有一定代表性的特征詞。在本文中,對于分詞獲取的所有實體詞,利用詞頻-逆文檔(TF-IDF)[9]計算權重值并按照權重值從小到大排序,取前60%的實體詞作為特征詞。3)特征詞向量化:特征詞向量化的主要目的是利用1組量化的數值(向量)來表示特征詞,方便分類模型處理。在本文中,利用Mikolov在2013年提出的Word2vec模型[10]來訓練特征詞向量模型,進而將特征詞向量化。4)文本向量化:文本向量化是在特征詞向量化的基礎上,利用詞向量來表示文本。用于文本向量化的方法有很多,本文采用一種樸素的文本表示方法,即用所有特征詞向量的平均值來表示文本。

在將所有的服裝裝飾工藝文本向量化后,接下來構建分類模型,進行工藝類別判定。

2 服裝裝飾工藝分類模型

經預處理獲得的服裝裝飾工藝文本向量維數較高,必然存在一些特征對文本分類精度貢獻較低,甚至還會產生負影響。如果將每一維特征看成一個視角的話,那么在構建多視角分類模型時,就需要考慮如何約減這些貢獻度較低的視角。本文提出一種針對服裝裝飾工藝文本分類且能夠進行視角約減的多視角分類模型。

2.1 多視角協同學習機制

(1)

其中,

(2)

(3)

2.2 視角約減機制

在訓練數據集D中,可能會存在某些視角(特征)對最終的分類結果產生負影響,因此,需要一種機制來實現對此類視角的自動約減,減少或屏蔽此類視角的負影響。故提出基于變體信息熵的視角權重自適應學習機制來學習各視角的權重,并通過預先設定的規則對視角權重小于某一閾值的視角進行約減,消除他們對分類結果的負影響。對于訓練數據集D而言,視角加權的機制可表示為如式(4)所示的形式:

(4)

式中:yic表示第i個文本向量屬于第c類;w=[w1,w2,…,wM]表示視角權重向量,其中wm表示第m個(m=1,2,…,M)視角的權重;δm為控制權重wm學習的參數;參數β用于控制Φ的貢獻程度,該值由用戶指定或者在訓練數據集上通過交叉驗證的方式得到。

在概率統計領域,通常使用方差均值比(VMR)來觀察樣本的分散程度,VMR值越小,表示樣本越聚集,反之則表示樣本越分散。在式(4)中,期望通過第2項,使得包含分散特征的視角能夠獲得較小的權重,因此,在本文中采用VMR的倒數形式,即均值方差比(RMV)作為δm,來實現對各個視角權重學習的控制。

2.3 目標函數及其優化

基于上述協同機制以及視角約減機制,VR-MV-CM 的目標函數可表示為如式(5)所示的形式:

(5)

(6)

(7)

(8)

(9)

式中:w′m表示更新后的視角權重;M′表示約減后的視角總數。

(10)

3 實驗分析

利用本文作者2018年所構建的領域模型[7],從互聯網抽取裝飾工藝文本文檔共5 400篇,并按照圖1所示的預處理步驟對所有文本進行向量化。對于5 400個文本向量,選擇80%進行人工類別標注,并作為訓練文本向量(訓練文本示例如表2所示)構建訓練數據集,所涉及的服裝裝飾工藝類別包括5類,分別為“刺繡”“印染”“編結”“手繪”和“鑲嵌”,類別標簽分別用1、2、3、4、5表示。其余20%作為測試文本向量構建測試數據集。

選擇支持向量機(SVM)[11]、C4.5決策樹(C4.5)[12]、 1-階TSK模糊系統(1-TSK-FS)[6]以及Jiang等[13]提出的多視角TSK模糊系統(MV-TSK-FS)作為對比分類模型進行分類結果的比較。SVM、C4.5、1-TSK-FS以及本文提出的VR-MV-CM中的參數均通過在訓練數據集上進行5-折交叉驗證的方式獲取。實驗將從3個方面進行:1)對于VR-MV-CM,觀察有視角約減和無視角約減(只需將δm設置為0)時在訓練數據集和測試數據集上的分類精度;2)觀察VR-MV-CM和所引入的對比模型在訓練數據集和測試數據集上的分類精度;3)將VR-MV-CM所約減的視角從訓練數據集和測試數據集中剔除,用剔除后的訓練數據集和測試數據集重新測試對比模型,觀察與剔除之前分類精度的變化。

表2 訓練文本示例Tab.2 Example of training texts

采用分類精度指標評價實驗結果。分類精度定義為正確分類的樣本數和總樣本數的比值。在訓練數據集上的分類精度,稱之為訓練精度,在測試數據集上的分類精度,稱之為測試精度。表3、4分別示出在訓練數據集和測試數據集上的實驗結果。其精度均為對應模型運行50次的平均值和標準差。

表3 對比分類模型的訓練精度Tab.3 Training precison of comparison classification models

從表3、4實驗結果可看出,在訓練和測試數據集上,VR-MV-CM在約減噪聲視角或弱相關視角后,50次的平均分類精度相比約減之前,分別提高了4.32%和2.68%。另外,即使VR-MV-CM未進行視角約減,由于采用了多視角協同學習機制,相比其他單視角決策模型(SVM、C4.5、1-TSK-FS),訓練和測試精度仍具有優勢。

表4 對比分類模型的測試精度Tab.4 Testing performance of comparison classification models

VR-MV-CM在50次運行后,在訓練數據集和測試數據集上共約減的視角數的平均值為12.1和11.4。通過將這50次約減的視角交集從測試數據集中剔除,然后重新運行對比算法(包括VR-MV-CM在δm=0時)。從表3和表4的第4列可看出,在剔除噪聲視角或弱相關視角后,所有決策模型的訓練和測試精度均有所提高,這再次印證了本文所提出的VR-MV-CM進行噪聲視角或弱相關視角的有效性。

4 結 論

在服裝設計資源知識圖譜構建過程中,為判定服裝裝飾工藝文本的類別,本文提出了一種具備噪聲視角或弱相關視角約減功能的多視角分類模型(VR-MV-CM)。該模型綜合考慮了視角之間的協同學習以及視角權重的學習,同時利用約減規則過濾權重較低視角。這不僅充分挖掘了視角之間的潛在關聯,同時也削減了噪聲視角或弱相關視角對于最后分類結果的影響。在服裝裝飾工藝文本分類實驗中,VR-MV-CM能夠自動剔除權重較低的視角,相比所引入的對比決策模型,具備更好的分類精度。在后續的研究中,將從文本資源拓展至圖像資源,進一步驗證模型的功能。

FZXB

猜你喜歡
分類工藝文本
分類算一算
轉爐高效復合吹煉工藝的開發與應用
山東冶金(2019年6期)2020-01-06 07:45:54
在808DA上文本顯示的改善
5-氯-1-茚酮合成工藝改進
世界農藥(2019年2期)2019-07-13 05:55:12
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數據分析中的分類討論
教你一招:數的分類
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
一段鋅氧壓浸出與焙燒浸出工藝的比較
銅業工程(2015年4期)2015-12-29 02:48:39
主站蜘蛛池模板: 又粗又硬又大又爽免费视频播放| 国产成人乱无码视频| 欧美激情成人网| www.精品国产| 九色视频线上播放| 国产一级视频在线观看网站| 国产成人精品一区二区免费看京| 国产微拍一区二区三区四区| 中国精品久久| 婷婷色婷婷| 中国国产高清免费AV片| 亚洲黄色片免费看| 欧美日韩国产在线观看一区二区三区| 黄色三级网站免费| 国产成人永久免费视频| 日韩无码视频网站| 欧美19综合中文字幕| 午夜福利免费视频| 这里只有精品在线| 国产精品视频猛进猛出| 国产主播福利在线观看| 国产成人福利在线视老湿机| 97视频精品全国在线观看| 一级毛片免费观看不卡视频| 99久久无色码中文字幕| 老司机aⅴ在线精品导航| 亚洲日韩久久综合中文字幕| 亚洲欧美成人综合| 人妻中文久热无码丝袜| 日韩欧美综合在线制服| 91无码人妻精品一区二区蜜桃| 久久精品无码中文字幕| 日韩欧美视频第一区在线观看 | 任我操在线视频| 丁香六月激情婷婷| 亚洲成综合人影院在院播放| 精品久久久久久久久久久| 日韩在线播放中文字幕| 熟女日韩精品2区| 国产精品粉嫩| 天天摸天天操免费播放小视频| 精品无码专区亚洲| 亚洲午夜福利精品无码不卡| 亚洲黄网视频| 一本久道久综合久久鬼色| 国产福利2021最新在线观看| 久久中文字幕av不卡一区二区| 色婷婷成人| 亚洲a免费| 色屁屁一区二区三区视频国产| 亚洲精品777| 91毛片网| 国产va视频| 亚洲成人高清无码| 天天色天天操综合网| 国产欧美日本在线观看| 无码有码中文字幕| 天堂成人av| 久久精品aⅴ无码中文字幕| 5388国产亚洲欧美在线观看| 国产美女91视频| 精品一区二区三区自慰喷水| 久久成人18免费| 曰韩人妻一区二区三区| 好吊妞欧美视频免费| 久久香蕉欧美精品| AV不卡国产在线观看| 日本免费一区视频| 99精品视频在线观看免费播放| 午夜精品影院| 欧美中出一区二区| 99激情网| 欧美yw精品日本国产精品| 国产成人AV大片大片在线播放 | 国产福利免费视频| 国产女人水多毛片18| 亚洲无线国产观看| 国产一级在线观看www色| 国产麻豆精品在线观看| 丁香五月婷婷激情基地| 欧美日韩亚洲国产| 中文字幕色在线|