王賽賽 陳敏之



摘要: 服裝款式豐富多樣,服裝屬性語義復雜。針對關鍵詞難以表述消費者檢索需求的問題,文章以款式復雜的連衣裙為例,提出了一種基于本體的連衣裙款式知識庫構建方法,對其他類別服裝語義檢索具有普遍適用指導意義。通過匯總和歸納連衣裙款式概念及其關系,利用Protégé工具,建立款式關鍵詞的關聯性,構建連衣裙款式本體模型。并結合本體語義擴展方法,提出了基于語義信息的連衣裙款式檢索模型,實現基于語義的連衣裙款式智能搜索,提高款式檢索的查全率和查準率。
關鍵詞: 本體知識庫;連衣裙款式;相似度;語義檢索;語義擴展
中圖分類號: TS941.717.82
文獻標志碼: A
文章編號: 1001-7003(2021)09-0067-06
引用頁碼: 091111
DOI: 10.3969/j.issn.1001-7003.2021.09.011(篇序)
Research on ontologybased retrieval of onepiece dress style
WANG Saisaia, CHEN Minzhia,b
(a.Fashion Design Academy; b.Institute of International Education, Zhejiang SciTch University, Hangzhou 310018, China)
Abstract: Garment styles are abundant and various, and the semantics of clothing attributes are complex. To solve the problem that keywords are difficult to indicate consumers retrieval needs, an ontologybased clothing style knowledge base construction method is proposed by taking onepiece dress with complicated style as the example, hoping to provide universally applicable guidance for semantic retrieval of other categories of clothing. After summarizing the concepts of onepiece dress styles and their relationships, the relevance of style keywords is established using Protégé tool and an ontology model of onepiece dress styles is constructed. The retrieval model of onepiece dressstyles based on semantic information is proposed through ontology semantic extension method, and semanticbased intelligent search of onepiece dressstyles is implemented, thereby enhancing the recall ratio and precision ratio of the retrieval.
Key words: ontology knowledge base; onepiece dress style; similarity; semantic retrieval; semantic extension
收稿日期: 20210107;
修回日期: 20210823
基金項目: 浙江省自然科學基金一般項目(LY17E060007)
作者簡介: 王賽賽(1996),女,碩士研究生,研究方向為服裝智能化推薦。通信作者:陳敏之,副教授,cmz_m@163.com。
隨著服裝領域信息化的發展,消費者通過網絡就能進行服裝的查詢,服裝款式檢索成為服裝行業研究的重點。服裝款式具有服裝品類多、款式豐富、服裝屬性語義復雜等特征,但目前服裝領域的檢索引擎大多是基于關鍵詞檢索的方式,而簡單的關鍵詞檢索無法在語義層面通過幾個關鍵詞完全理解用戶特定的需求[1],信息檢索結果通常廣泛而不精確,因此將信息檢索系統進行細分,針對專業領域構建信息檢索系統是近幾年的研究趨勢。
本體作為一種建模工具,提供了一種恰當的概念表示方式,通過構建語義模型,充分地表達領域內概念的層次結構和概念間的關系,精確地描述領域內的知識。本體在語義信息檢索系統的語義標注、基于本體的索引、基于本體的查詢擴展等多個方面都有很重要的作用。目前本體已廣泛分布于各個行業,從早期在語義Web中的推理研究[2],到如今醫療領域[3]、家具個性化定制[4]等智能檢索方面的應用。在服裝行業中如服裝智能制造[5]、服裝加工服務[6]、紡織服裝領域檢索[7]等也多有研究,但將本體引入款式領域的檢索尚未進行深入研究。
連衣裙因春夏可單穿,秋冬可內搭為四季常青類目,且連衣裙款式復雜,覆蓋多種廓形、領型等款式類型,具有廣泛代表性。因此本文以連衣裙為例,提出了基于語義層面上的連衣裙款式語義檢索模型,對其他類別服裝的語義檢索具有普遍適用指導意義。通過分析連衣裙款式知識及概念層次,利用連衣裙款式領域概念之間的語義關聯,構建連衣裙款式本體模型。并結合本體語義擴展算法,將本體數據庫在連衣裙款式信息檢索中進行語義推理應用,實現連衣裙款式語義檢索。
1連衣裙款式領域本體設定原則及流程
連衣裙款式本體是定義連衣裙款式領域、可以被計算機理解且被該領域所共同接受的一些概念,通俗地說,是建立檢索連衣裙時所用的正式的詞匯表,包含了連衣裙款式領域內的概念、實例、概念之間的關系及概念的屬性等。領域本體結構如圖1所示。
連衣裙款式本體在“七步法”建模方法基礎上,結合服裝產品的特點及款式檢索的需求,形成的具體構建過程如下:1) 確定連衣裙款式本體的領域和范圍,即本體構建的應用目標;2) 收集領域相關信息;3) 列舉領域內最核心的概念,一般取自教科書或者專家知識;4) 核心概念詞匯層次化;5) 核心概念同義詞擴展;6) 確定概念之間的關系和屬性;7) 利用本體工具構建連衣裙款式本體。
2連衣裙款式本體的構建
本文構建的連衣裙款式本體主要面向檢索應用領域,一般在款式檢索時需要對款式進行標注,而標注的過程就是獲得描述款式的語義概念的過程,因此構建連衣裙款式領域本體最主要的任務是收集款式領域的概念詞匯。本文概念詞匯
的獲取方法如圖2所示。服裝款式領域本體概念一方面由文獻查閱和領域專家訪談獲取款式知識的構成及分類,形成連衣裙款式領域本體的核心層次概念;另一方面通過對消費者問卷訪談進行概念同義詞擴展。
2.1連衣裙核心概念層次體系建立
本文通過查閱及整理相關文獻[8-10],整合了連衣裙款式領域內所有基礎概念及其實例,選取影響款式造型較為明顯的廓形、領型、袖型、色調、面料、圖案、裙長、袖長、合體度等服裝款式因素來分析連衣裙款式。
按照常見的服裝款式分類,本文將連衣裙款式分為廓形、領型、袖型、面料、色調、圖案、袖長、裙長、合體度9類一級概念,其下又分為21個二級概念,三級為二級概念的實例,如圖3所示。如概念無領的實例有圓領、方領、V領等6個實例;概念光澤型面料的實例有綢、緞;概念柔軟型面料的實例有絲綢、麻紗等。本文共收集74個實例。
2.2連衣裙款式概念的同義詞獲取
服裝款式領域的一個檢索障礙是詞匯的多樣性,主要是連衣裙款式的廓形、領型、袖型,不同地區不同人的叫法不同,導致用戶的檢索詞匯與本體中的概念語義描述不盡相同。為了解決用戶檢索同義類型詞時信息不足的問題,需要對本體中的詞匯進行同義詞擴展。例如,“H形”的同義關系概念有“直身形、直筒形”,當用戶在領域本體模型中檢索“H形”時,通過本體語義擴展,檢索詞將擴展為檢索集“H形、直筒形、直身形”,以此提高用戶檢索的準確性。
2.2.1問卷訪談數據采集
為了使問卷結果更具科學性和有效性,本文從淘寶、京東等常用購物網站收集了圖3中廓形、領型、袖型的20個概念實例的圖片進行問卷訪談,如圖4所示。
經查詢,25歲~35歲為連衣裙消費主力軍,因此確定調查目標人群為25~35歲。地區選擇石家莊、北京、鄭州等北方城市,杭州、南京等南方城市及成都、重慶等西南城市進行調研,每個地區選擇5個訪談對象,每個款式類別分別讓各地區的訪談對象指認類別名稱。
2.2.2問卷訪談結果統計
本次問卷調查共收集了750張問卷,通過對問卷調查得到的結果進行統計分析整理,共得到225個同義概念,分別將之與層次概念中的概念對應,部分關鍵詞的同義擴展匯總如表1所示。
2.3基于本體的連衣裙款式本體構建
服裝款式概念劃分具有的結構性和層次性特征,使得它可以建立知識本體模型。前文確定了連衣裙款式本體的概念,而概念在領域本體中是通過相互之間的關系連接起來的。本文利用Protégé工具構建連衣裙款式本體,主要涉及的概念之間的基本關系如表2所示,主要有組成關系、繼承關系、實例關系、屬性關系、同義關系5種[11]。Partof表達概念之間部
分與整體的關系,例如“廓形”是“服裝款式”的一部分。Kindof表達概念之間的繼承關系,例如“廓形”繼承了“服裝款式”的所有屬性。Instanceof表達概念的實例和概念之間的關系,例如“H形”是“廓形”的一個實例。Attributeof表達概念之間的屬性關系,例如“裙長”和“合體度”均是“連衣裙款式”的數據屬性;“袖長”是“袖型”的數據屬性。另外,使用“owl:Equivalent to”這一特定屬性表達概念的同義關系,如“H形、直身形、直筒形”之間的關系。
至此,服裝款式領域本體中的概念、實例及其屬性在語義層面上建立了聯系,得到部分語義本體框架如圖5所示。
3基于本體的連衣裙款式檢索
3.1基于本體的連衣裙款式概念語義相似度計算
領域本體中概念之間的語義相似度是語義信息檢索研究的重點[12]。本體概念相似度計算是指在計算概念的相關度時參考了概念間的層次結構信息,如節點關系、語義鄰居關系等。在款式檢索中使用語義相似度來代表這些關系,連衣裙款式領域本體可以看成一本體層次概念語義樹,如圖6所示。其中結點N1、N2、N3等表示本體中的概念詞,結點之間的邊表示本體中概念與概念之間的語義相似度,如S(N1,N2)。
本文采用概念語義相似度的計算方法,用S(x,y)表示兩個概念之間的相似程度。如果連衣裙款式本體中概念Ni和Nj是同義關系,則兩者的語義相似度為1,即S(Ci,Cj)=1;如果是兩個非同義的概念Ni和Nj,則兩者之間的語義相似度按下式計算。
S(Ni,Nj)=(Dist(Ni,Nj)+θ)×θ(d(Ni)-d(Nj))CE(Ni,Nj)×2×Dep×max(|d(Ni)-d(Nj)|)(1)
式中,d(Ni)和d(Nj)分別是概念Ni和Nj對應的節點在概念樹中的層次,d(Ni)-d(Nj)表示概念Ni和概念Nj的層次差,Dist(Ni,Nj)表示從概念Ni結點到概念Nj結點所經過的路徑上相似度的和。θ是一個可調節參數,用于調節概念層次差對語義相似度的影響,一般大于等于0。CE(Ni,Nj)表示從概念Ni結點到概念Nj結點所經過的路徑長度,每條邊記數為1,當Ni和Nj不連通時,路徑長度為∞。Dep為概念所在本體中的層次深度。
以此可以構造表示連衣裙款式本體中的所有概念的語義相似度矩陣[13]。本文經實驗確定θ取值為0.2時,語義相似度結果與領域專家經驗值相吻合,實驗結果如表3所示。
3.2基于本體的連衣裙款式檢索流程
將建立的連衣裙款式知識本體結構連接到款式檢索的系統中。基于本體的連衣裙款式檢索流程如下:用戶發出語義檢索請求,首先關鍵詞進入本體進行關鍵詞擴展,包括在領域本體的基礎上對用戶的檢索語言進行同義和相似擴展(如果是單關鍵詞也直接進行語義相似度擴展),生成新的語義檢索擴展集合,然后在款式庫中檢索匹配的款式,最后將相似性款式檢索結果推薦給用戶。基于本體的連衣裙款式檢索系統流程如圖7所示。
3.3檢索效果分析
本文以檢索請求“q=H形、泡泡袖”為例,來驗證基于本體檢索系統的優越性。如果基于關鍵詞的檢索系統進行檢索,結果只能是含有“H形、泡泡袖”這兩個關鍵詞的款式。而基于本體的檢索,參照連衣裙款式本體,“H形”與“直身形”“直筒形”為同義詞,相似度為1.0,“泡泡袖”與“公主袖”的相似度為10,與“燈籠袖”的相似度為0.811 0,這樣原始的檢索請求q經本體推理后表示為:q=(H形〈1.0〉,直身形〈1.0〉,直筒形〈1.0〉,泡泡袖〈1.0〉,公主袖〈1.0〉,燈籠袖〈0.8〉)。
圖8為6個連衣裙款式,d1=(H形、泡泡袖),d2=(H形、公主袖),d3=(H形、燈籠袖),d4=(直筒形、泡泡袖),d5=(直筒形、公主袖),d6=(直筒形、燈籠袖)。
如果按照關鍵詞檢索,則與檢索請求相匹配的相似度S結果為S(q,d1)>S(q,d2)=S(q,d3)=S(q,d4),而d5和d6不會被檢索出來;如果按照基于連衣裙本體的檢索方式,則相似度結果為S(q,d1)=S(q,d2)=S(q,d4)=S(q,d5)>S(q,d3)=S(q,d6),顯然后者更符合檢索語義上的需求。
目前常用兩個指標來檢驗一個檢索系統的檢索效果,即查全率(Recall)和查準率(Precision)。公式如下:
P/%=nN×100(2)
R/%=nM×100(3)
式中:n指查詢結果中與檢索請求標注相同的款式數量,N指查詢結果中所有款式數量,M指系統中所有相關的款式數量。
為了驗證基于本體的款式檢索模型的有效性,本文從淘寶、京東等常見購物網站選取80件已標注產品關鍵詞的連衣裙款式,分別按傳統簡單關鍵詞檢索方式和基于本體的語義檢索方式進行檢索。通過結果比較分析,兩種檢索方式得到的查準率和查全率兩項性能指標對比如表4所示。
將表4的查準率、查全率對比數據通過Excel轉換成折線圖,如圖9、圖10所示。
由表4、圖9和圖10可以看出,若待檢索關鍵詞無同義詞時,如“圓領”“羊腿袖”,基于本體的檢索和基于關鍵詞的檢索查全率結果不相上下,而前者查準率較高;但在檢索同義詞較多的關鍵詞時,如“O形”“方領”等,基于本體的檢索模型明顯比基于關鍵詞的查準率和查全率高。因此,基于本體的連衣裙款式檢索模型得到了更好的檢索效果,在查全率和查準率上得到了明顯提高。
4結論
本文通過建立連衣裙款式領域本體,提出了基于語義層面的連衣裙款式檢索模型。通過建立連衣裙款式本體,將連衣裙款式方面的概念進行匯總與整理,結合相似度算法,將用戶的檢索詞進行同義擴展與相似擴展,有效提高了檢索的查準率與查全率。與關鍵詞檢索方式相比,基于本體的連衣裙款式檢索模型能更好地理解用戶語義,為用戶提供更為精確的檢索結果,今后可與圖像識別、自動添加標簽等技術結合,實現更智能的服裝款式檢索。
參考文獻:
[1]厲穎. 基于本體的服裝領域知識表示的建模研究[D]. 青島: 山東科技大學, 2010.
LI Ying. Based on Ontology about Field Knowledge Representation of the Clothing Modeling Study[D]. Qingdao: Shandong University of Science and Technology, 2010.
[2]李永超, 羅鈞旻. 語義Web中的本體推理研究[J]. 計算機技術與發展, 2007(1): 101-103.
LI Yongchao, LUO Junmin. Research on reasoning on ontology in semantic Web[J]. Computer Technology and Development, 2007(1): 101-103.
[3]NASKAR D, DAS S. HNS ontology using faceted approach[J]. Knowledge Organization, 2019, 46(3): 187-198.
[4]李文靖, 胡書山, 余日季. 基于語義網的數字化家具模型本體設計與檢索[J]. 軟件導刊, 2019, 18(8): 136-139.
LI Wenjing, HU Shushan, YU Riji. Design and retrieval of digital furniture model ontology based on semantic web[ J ]. Software Guide, 2019, 18(8): 136-139.
[5]王倩. 基于本體的服裝制造過程信息上下文建模研究[J]. 軟件導刊, 2015, 14(12): 118-121.
WANG Qian. Research on ontologybased garment manufacturing process information context modeling[ J ]. Software Guide, 2015, 14(12): 118-121.
[6]伊恩弟. 面向云制造的服裝加工服務本體模型及其描述[J]. 硅谷, 2012, 5(23): 189-176.
YI Endi. Clothing processing service ontology model for cloud manufacturing and its description[J]. Silicon Valley, 2012, 5(23): 189-176.
[7]梁道雷, 姚亮, 陳鞏靜. 基于本體的紡織服裝主題搜索引擎系統研究[J]. 絲綢, 2014, 51(11): 28-31.
LIANG Daolei, YAO Liang, CHEN Gongjing. Research of ontologybased textile and clothing topic search engine system[J]. Journal of Silk, 2014, 51(11): 28-31.
[8]劉曉剛. 服裝設計元素論[J]. 東華大學學報(自然科學版), 2003(2): 23-26.
LIU Xiaogang. Theory of fashion design elements[J]. Journal of East China University(Natural Science Edition), 2003(2): 23-26.
[9]XAVIER A, SOPHIE G, JEREMY H. VetiVoc: a modular ontology for the fashion, textile and clothing domain[J]. Applied Ontology, 2015, 11(1): 128.
[10]張韓. 連衣裙的造型要素與感性意象關聯量化及款式推薦研究[D]. 杭州: 浙江理工大學, 2017.
ZHANG Han. Research on the Correlation Quantification and Style Recommendation of Dress Modeling Elements and Perceptual Images[D]. Hangzhou: Zhejiang SciTech University, 2017.
[11]羅仕鑒, 董燁楠. 面向文化創意設計的器物知識集成與管理[J]. 計算機集成制造系統, 2018, 24(4): 964-977.
LUO Shijian, DONG Yenan. Integration and management method of cultural artifacts knowledge for cultural creative design[J]. Computer Integrated Manufacturing System, 2018, 24(4): 964-977.
[12]張乃靜, 鞠洪波, 紀平. 基于本體的林業領域語義查詢擴展模型[J]. 計算機系統應用, 2016, 25(03): 151-156.
ZHANG Naijing, JU Hongbo, JI Ping. Modeling semantic query expansion of the foresty domain based on ontology[J]. Computer System Application, 2016, 25(3): 151-156.
[13]張志武. 基于本體的Web圖像語義標注與檢索模型[J]. 情報科學, 2015, 33(4): 121-124.
ZHANG Zhiwu. Web image semantic annotation and retrieval model based on ontology[J]. Informatics, 2015, 33(4): 121-124.