尹光燦 羅戎蕾
摘 要:針對服裝領型特征識別困難、分類效果不理想等問題,提出了一種基于Alex Net卷積神經網絡的服裝領型識別與分類方法,實現了服裝衣領造型的自動識別與分類。首先,從電商平臺收集服裝樣本圖并對其進行剪裁和預處理,建立一個包含圓形領、方形領、一字領、V形領等15類服裝領型的樣本庫;其次,利用Alex Net卷積神經網絡中的卷積、池化操作,提取服裝領型樣本中的領型特征;最后,運用Softmax回歸分類器來實現服裝領型的分類。結果表明,該方法可以有效地對服裝領型進行識別與分類,分類準確率達到98.67%,可以有效解決服裝領型識別分類困難等問題,為服裝商品的可視化分類提供有效方法。
關鍵詞:卷積神經網絡;Alex Net;服裝領型;識別分類
Abstract:A new method of recognition and classification of garment collar typebased on Alex Net convolution neural networkis introduced to improve automatic recognition and classification of garment collar style, so as to overcome the difficulties in recognition and classification of characteristics of garment collar type. Firstly, different garment sample designs were collected from e-commerce platforms and edited and preprocessed,and a sample database consisting of 15 garment collar types (including round collar, square collar, off collar, V collar and so on) were built. Secondly, operations of convolution and pooling of Alex Net convolution neural network were conducted to extract the collar characteristics from the samples. Finally, Softmax regression classifier was used to realize the classification of the clothing collars. The experiment result shows that this method works well in identifying and classifying clothing collar types with an accuracy rate up to 98.67%. This method is an effective way to overcome the difficulties in identifying and classifying clothing collar types,and provide an effective method for visual classification of apparel goods.
Key words:CNN; Alex Net; garment collar type; identification and classification
衣領,從其字面意思理解,就是服裝的領子部分,貼合于人體頸部,裝縫在衣身領圈上的部件,具有保護、裝扮頸部的作用[1]。領部在服裝設計中,是組成服裝款式的重要部件之一,也是服裝設計師重點關注的部位。不同的衣領造型通常會給人不同的視覺效果和心理感受。在服裝風格識別中,衣領的造型是影響服裝風格的重要因素之一。但目前電商平臺對于領型的識別和分類主要還是依靠人為添加標簽來完成。由于不同的人對領型的認知不同,就導致在添加標簽的過程中可能出現錯誤的分類。而消費者則是通過文本和關鍵詞進行搜索,搜索出來的結果會出現詞不對圖的情況。使用傳統方法對領型分類不僅浪費了大量的時間,且分類效果也不理想,這就需要尋找實現服裝領型分類更簡便的方法。
目前國內外學者對服裝分類的研究主要集中在款式、風格、色彩、圖案等方面。馮利等[2]通過量化服裝的主要控制部件,例如領部、外形、袖部等的變化范圍實現對服裝風格的分類。張海泉等[3]對服裝面料視覺風格的特點進行研究進而對面料風格進行了分類。陳雁等[4]通過專家調查和物理測試的方式對顏色風格進行研究,實現對顏色風格的分類。李一磊等[5]通過將服裝的部件屬性和決策者心理相結合,建立MDFT的服裝風格決策模型,對服裝風格進行了分類。早期的這些研究都是人為設定提取特征,提取出來的特征具有主觀性和限制性。隨著深度學習的發展使得機器學習與特征學習有了很大的突破。汪姍娜等[6]通過改進卷積神經網絡實現了領帶花型的情感分類。吳歡等[7]改進Caffe Net卷積神經網絡的模型結構對5種女褲廓形進行分類。Bossard等[8]使用色彩、圖案和服裝輪廓等指標對 服裝屬性進行分類。上述方法都是使用深度學習對服裝整體進行分類,沒有對服裝零部件進行分類。因此本文以服裝領型為研究對象,通過微調Alex Net卷積神經網絡模型的超參數,實現對服裝領型的自動識別與分類,進而為實現服裝類商品的可視化分類提供有效方法。可以將其運用于電商,便于在線商店標注與服裝相關的描述,也便于消費者跨越語義鴻溝,找到想要的服裝商品。
1 領型分類
衣領是由領線和領子兩個部分組成,按照領線和領子的組合方式,可以分為無領和有領兩大類[9]。無領是指僅有領線而無領子的領型;有領是指在領線上裝有各種不同形式的領子。根據不同的分類標準,領子的分類不同。按領的高度可分為高領、中領、低領;按領的穿著狀態可分為開門領和關門領;按領的造型結構可為無領、立領、翻領和駁領等基本類型。
本實驗將按照領子的造型結構分類進行研究,總體分為無領、立領、翻領和駁領4大基本領型。
1.1 無 領
無領的特點是只有領線而無領面。它在基本領線的基礎上改變領線的大小或形狀從而形成不同的款式造型,例如圓形領、方形領、V形領和一字領等,如圖1所示。
1.2 立 領
立領又稱豎領,是立于頸周而無翻折的領造型,也就是說立領只有領座。改變其領座的造型,從而衍生出不同的立領造型,例如中式立領和系結領等,如圖2所示。
1.3 翻 領
翻領是指領面攤貼在領圈上(無領腳)或翻攤在領腳外面(領腳將領面撐起)的領式。根據有無領腰,翻領又分為兩種,有領腰的叫襯衫領(圖3);無領腰的叫做平領。平領又根據其翻折領面大小幅度不同或形狀不同,又形成不同的平領造型。例如海軍領、波浪領、披肩領、娃娃領等,如圖4所示。
1.4 駁 領
駁領是由衣領和駁頭組成,將衣領和駁頭縫接在一起,駁頭兩側向外翻折呈駁口線型的領式。駁領根據其領形變化又可分為平駁領、槍駁領、大駁領和青果領等,如圖5所示。
根據電商平臺對領型的分類,再結合文獻調研[1,10-11]及專家訪談等形式,最終確定15種特征較明顯的領型作為本次的研究對象,分別是圓形領、方形領、V形領、一字領、中式立領、系結領、襯衫領、海軍領、波浪領、披肩領、娃娃領、平駁領、槍駁領、大駁領、青果領。
2 卷積神經網絡的構建
早在20世紀60年代,Duffy等[12]在對貓的大腦視覺皮層實驗中,發現生物的視覺系統是通過多層級的視覺感受野逐層激發實現的。研究人員在動物的視覺系統實驗啟發下,設計出了類似的算法,通過多層級的視覺感受野對圖像進行深層次的識別。隨著機器視覺概念的提出,卷積神經網絡憑借像素之間的距離與其相似性關系的優勢,依靠網絡自身,學習、提取訓練樣本特征的能力,成為當前識別圖像分類領域的研究熱點之一[13]。
本研究將Alex Net卷積神經網絡模型應用于服裝領型的識別分類,利用卷積神經網絡反向傳播算法的特點,通過調整Alex Net模型參數得到適用于服裝領型識別分類的網絡模型結構。
Alex Net網絡模型共有8層,1~5層為卷積層,6~8層為全連接層,激勵函數RELU(Rectified Linear Unit)和局部歸一化(Local Response Normalization,LRN)處理存在于前五層的卷積層中,Alex Net網絡結構的優勢在于兩個LRN層及最后一個卷積層后加入了最大池化層,最大池化層的作用在于提取訓練樣本中最顯著的特征。表1為網絡的隱含層參數。
3 算法流程
領型識別任務分為4個階段,領型分類及樣本空間確定、樣本圖片預處理、領型樣本訓練、特征提取和識別分類。算法流程如圖6所示。
3.1 領型分類及樣本空間確定
基于文獻和專家訪談等形式確定領型的分類;按照對應的領型種類變量,確定樣本空間量,包括領型訓練樣本空間量和領型測試樣本空間量。
3.2 樣本圖片預處理
將收集的服裝領型圖片進行預處理,首先要防止樣本圖片中的服裝非領型部分對機器學習造成干擾,其次防止樣本圖片中服裝的色彩和面料對實驗結果造成誤差,最后對樣本圖片尺寸大小進行歸一化處理。
3.3 領型樣本訓練
使用Alex Net卷積神經網絡模型對預處理過的領型樣本圖片進行訓練。Alex Net網絡模型中的卷積核對圖像進行自上而下、自左到右的加權求和操作,從而得到新的像素值,接著在池化層進行特征融合、降維操作。輸入的領型樣本圖像經過交替的卷積和池化操作,模型已經學習到領型樣本高度抽象的特征。
3.4 特征提取和識別分類
將卷積和池化操作之后得到的特征圖輸入到Softmax回歸分類器中,結合領型的分類標簽對Softmax分類器進行訓練。完成一定迭代次數的訓練后,輸出15類目標的概率值。
4 樣本數據采集及圖像預處理
4.1 樣本數據采集
在淘寶、天貓、京東、唯品會等購物APP及各大服裝品牌官網尋找對應的領型樣本,一共1 575個領型樣本,為了提高Alex Net網絡訓練的精準度,防止其他無關內容的干擾,本實驗選取去除背景且無其他內容干擾的白底圖片。又因為圖片中非領型部分會對卷積神經網絡的訓練造成干擾,因此需要對圖片進行剪裁,只留下領子部分。裁剪方法使用labelimg軟件對領子部位進行標記,產生對應的XML文件,用python-opencv讀取XML文件并進行裁剪。圖7為剪裁后的部分領型樣本。
4.2 樣本數據增強
為了增強Alex Net卷積神經網絡的魯棒性,減少數據過擬合,在保持數據集標簽不變的情況下,增大數據集[14]。本研究主要采用兩種方法,一是樣本圖片翻轉,擴充數據集;二是使用正態分布的高斯噪音,人工添加一些干擾,提高卷積神經網絡的魯棒性。
4.2.1 樣本圖片翻轉
由于卷積神經網絡具有很強的泛化能力,即使樣本圖片在空間中發生位移、拉伸或旋轉等變化,卷積神經網絡也能很好地完成識別任務。因此在實驗中將每一張樣本圖片分別向左、向右翻轉90°,這樣將數據集擴充至4 725張圖片。圖8為部分樣本圖片翻轉。