周 捷,王 萍,毛 倩,王奧斯
(1.西安工程大學 服裝與藝術設計學院,陜西 西安710048;2.利茲大學 設計學院,英國 利茲 LS2 9JT)
女性乳房形態(tài)具有差異性與復雜性,導致市場上文胸號型分類往往不能滿足消費者的個體需求[1],因此準確識別乳房形態(tài)將對改善文胸合體性[2]、優(yōu)化文胸結構設計[3-6]和鋼圈設計[7-9]、完善文胸號型的分類[10]以及滿足消費者對文胸的情感需求[11-12]具有重要作用。一些研究者主要從人體測量、乳房分類[13-17]等方面對乳房形態(tài)開展相關研究。基于三維人體掃描,文獻[15]以上乳房角和內外乳點角/乳房深為參數(shù),將267位18~35歲女性的乳房立體形態(tài)分為9類。文獻[16]以乳間距和胸高將西部女大學生乳房形態(tài)也分為9種類型。文獻[17]基于馬丁人體測量,采用K-means聚類分析法,將華東地區(qū)20~40歲女性罩杯分為AA、A、B、C等4類,再通過幾何推導關鍵值,最終將胸部側面形態(tài)分為圓盤型、圓球型、紡錘型和下垂型4種類型,以上分類方法均能夠有效表征乳房形態(tài)立體特征。雖然乳房形態(tài)分類在文胸款式和結構設計中起著不可或缺的作用,但還不能直接應用到號型推薦及文胸個性化定制中。而運用神經(jīng)網(wǎng)絡結構模型能夠相對快速且高效地識別不同的乳房形態(tài)[18-20],基于其形態(tài)識別的參數(shù)可以設計生產(chǎn)文胸。因此,乳房形態(tài)識別模型在實際應用過程中就顯得尤為重要。
目前已有研究學者以胸圍、下胸圍、胸寬作為輸入變量預測乳房根圍,計算并比較了BP神經(jīng)網(wǎng)絡模型和線性回歸模型的預測精度,結果表明BP神經(jīng)網(wǎng)絡模型識別精度更高,達95.9%,但沒有給出具體的運行時間[18]。文獻[19]采用基于多視角卷積神經(jīng)網(wǎng)絡的乳房X射線分類方法對乳腺圖像進行分類,其精度和魯棒性有所提高。有研究學者通過廣義回歸神經(jīng)網(wǎng)絡和概率神經(jīng)網(wǎng)絡2種算法研究了乳房特征對乳房形態(tài)識別的影響[20],盡管這2種算法的識別準確率均相對較高,如廣義回歸神經(jīng)網(wǎng)絡模型為88.89%,但其準確率還有待提高。
而ELM是一種單隱層前向神經(jīng)網(wǎng)絡的機器學習算法,已被廣泛應用于識別、預測以及醫(yī)學診斷領域[21-22]。與傳統(tǒng)的訓練算法相比,ELM算法最突出的優(yōu)勢在于:輸入層和隱含層之間的連接權值隨機產(chǎn)生,且確定后無需再調整;隱含層和輸出層之間通過解方程一次計算完成,無需依靠迭代計算來完成訓練學習,整體精確度較高且訓練速度較快[22]。因此,為進一步提高乳房形態(tài)識別的精度與模型運行速度,本文通過CFSFDP算法對108位青年女性的乳房形態(tài)進行分類,再用ELM算法對乳房形態(tài)進行識別,分析ELM乳房形態(tài)識別模型的識別準確率與模型運行時間,并對比不同激活函數(shù)下隱含層神經(jīng)元個數(shù)對ELM乳房形態(tài)識別模型識別準確率的影響,確定最佳參數(shù)。
采用馬丁人體測量儀,對108位年齡(23.13±3.75)歲、身高(160.07±5.89)cm、身體質量指數(shù)(21.01±3.97)kg/m2,且乳房基本發(fā)育成熟的西部地區(qū)女性進行乳房特征數(shù)據(jù)采集。
室內環(huán)境溫度為(25±2)℃,相對濕度為(65±2)%。被測試者上身呈裸體狀態(tài)、足跟并攏、自然站立于水平地面上、雙眼平視前方、肩部放松、雙臂自然下垂。測試者依照GB/T 5703—2010《用于技術設計的人體測量基礎項目》的測量要求采集被測試者的乳房特征數(shù)據(jù)。
基于相關文獻研究[12-14],選取6個測量項目部位:乳平圍、乳間距、胸厚、胸寬、頸窩點至乳頭點長以及胸圍至下胸圍高。
根據(jù)測量的6個項目計算得到4個乳房特征值,其中乳平圍、胸厚與胸寬的比值,共同描繪了乳房的豐挺程度;乳間距與胸寬的比值描繪了乳房聚攏的情況;頸窩點至乳頭點長與胸圍至下胸圍高的比值代表乳房高度情況。因此確定乳平圍、乳間距/胸寬、胸厚/胸寬、頸窩點至乳頭點長/胸圍至下胸圍高4個乳房特征為乳房形態(tài)類別的判斷依據(jù)[20]。
本文首先采用CFSFDP算法[23]對4個乳房特征進行乳房形態(tài)的聚類分析,建立ELM乳房形態(tài)識別模型并對乳房形態(tài)進行識別,然后通過式(1)計算模型的乳房形態(tài)識別準確率R,同時得到模型運行時間,對比采用不同激活函數(shù)時ELM乳房識別模型的識別率。ELM乳房形態(tài)識別流程如圖1所示。
(1)
式中:N表示測試集中乳房形態(tài)識別正確的樣本數(shù);M表示測試集樣本總數(shù)。

圖 1 ELM乳房形態(tài)識別流程圖Fig.1 Flow chart of ELM breast shape recognition
常用的K-means、FCM聚類算法對非球形集群數(shù)據(jù)監(jiān)測效果并不顯著,而CFSFDP算法適用于各種形狀的數(shù)據(jù)集,且對非球形集群數(shù)據(jù)聚類效果較顯著[24],并能夠在得到直觀聚類中心數(shù)的同時提高聚類準確性[20]。因此本文采用CFSFDP聚類算法對乳房形態(tài)進行分類。基于局部密度和相對距離[25],根據(jù)決策圖識別出密度最大且與其周圍的點距離最短的4個樣本數(shù)據(jù)點作為聚類中心,利用該算法計算出4類類簇中心的乳房特征值及特征均值,見表1。

表 1 類簇中心的特征值及特征均值
由表1可知,從乳平圍和胸厚/胸寬這2個特征來看,乳平圍在類簇2的數(shù)值最大,類簇3的數(shù)值最小,且相差較大;而胸厚/胸寬在類簇2的值最大,類簇1、3、4的值較小且相差不大。這表明類簇2的乳房形態(tài)特征表現(xiàn)為豐滿且挺拔,類簇1、3、4的乳房形態(tài)特征均為扁平狀,同時類簇1相對豐滿,類簇4次之,類簇3的乳房形態(tài)相對瘦小。乳間距/胸寬在類簇2、3的值較大,說明這2種乳房形態(tài)表現(xiàn)為內斂;類簇1、4的值最小,乳房為偏外擴形態(tài)。根據(jù)頸窩點至乳頭點長/胸圍至下胸圍高的特征數(shù)值,類簇2的值最大,類簇1、3的值次之,類簇4的值最小,表明類簇4的乳房高度最高,類簇1、3適中,類簇2最低,乳房呈下垂狀態(tài)。計算4類乳房形態(tài)的各項乳房特征平均值,求得4類類簇中心特征值與4類類簇特征均值的差值絕對值范圍中心,分別為[0.01,0.67]、[0.03,0.59]、[0.04,1.3]、[0.01,0.64] cm。差值范圍越大,則類簇樣本分布越離散。類簇2的差值范圍0.56 cm最小,表明該類簇樣本分布較集中且類簇中心代表性較強,類簇1和類簇4的差值范圍0.66 cm和0.63 cm相對較小,表明該類簇樣本分布較為集中,類簇中心可以代表該類簇乳房形態(tài)。類簇3的差值最大,為1.3 cm,表明該類簇樣本分布較分散,這類類簇的聚類效果偏差。因此,將相對豐滿、較扁平且偏外擴的類簇1定義為標準型乳房(A型),豐滿、挺拔、內斂且下垂的類簇2定義為豐滿型(B型),相對瘦小、扁平且內斂的類簇3定義為扁瘦型(C型),特征為扁平、比較瘦小、乳房高度較高且外擴的類簇4定義為高挺型(D型)。
將樣本數(shù)據(jù)點歸屬到相對距離較小的聚類中心,得到4類乳房形態(tài)的分類,如圖2所示。

圖 2 乳房形態(tài)分類圖Fig.2 Classification of breast morphology
圖2中,屬于標準型(A型)的類簇1數(shù)量最多,占比為41.28%,其次為高挺型(D型)的類簇4,占比33.03%,扁瘦型(C型)的類簇3較少,豐滿型(B型)的類簇2最少僅占總樣本量的6.42%。說明標準型和高挺型是西部地區(qū)女性乳房的主要特征。
ELM算法結構包含輸入層、隱含層和輸出層(圖3),其中輸入層和隱含層之間的連接權值以及隱含層神經(jīng)元的閾值隨機產(chǎn)生[26-27]。

圖 3 ELM算法結構Fig.3 ELM algorithm structure
圖3中,x代表訓練集樣本的輸入層,即4類乳房特征數(shù)據(jù);y表示訓練集樣本的輸出層,即4種乳房形態(tài)類別;ωij表示第i個輸入層神經(jīng)元和第j個隱含層神經(jīng)元之間的連接權值;g(·)表示激活函數(shù);O1,O2,…,OL表示隱含層節(jié)點;βjk表示第j個隱含層神經(jīng)元和第k個輸出層神經(jīng)元之間的連接權值。
ELM學習與識別步驟如下:
1) 導入訓練集樣本的矩陣X與輸出矩陣T,其中矩陣X的行是樣本的4個乳房形態(tài)特征,矩陣T的行是4類乳房形態(tài),兩矩陣的列均代表訓練集樣本數(shù)為88個,見式(2)與式(3)。
(2)
(3)
2) 隨機產(chǎn)生輸入層和隱含之間的連接權值ωij以及隱含層神經(jīng)元的閾值bi(i=1,2,…,L),其中L代表隱含層神經(jīng)元個數(shù)。
3) 計算隱含層的輸出矩陣H。
(4)
式中:G函數(shù)代表隱含層神經(jīng)元的輸出;g函數(shù)為激活函數(shù)。
4) 通過求解方程組計算隱含層和輸出層之間的連接權值β,‖Hβ-T‖=0,即
β=H-1T
(5)
5) 輸入測試集樣本的矩陣X′,其中行是4個乳房特征,列是20個測試集樣本數(shù)量,見式(6)。
(6)
6) 得到ELM乳房識別模型預測結果的輸出矩陣T′:

(7)
采用Matlab R2019a(MathWorks公司)自定義elmtrain函數(shù),以4個乳房特征作為ELM的輸入層,以乳房聚類結果作為ELM的輸出層。隨機產(chǎn)生訓練集和測試集,其中訓練集包含88個乳房數(shù)據(jù)點,測試集包含20個數(shù)據(jù)點。激活函數(shù)設為sin且隱含層神經(jīng)元設為30,建立ELM網(wǎng)絡模型并訓練。得到乳房形態(tài)測試集預測準確率,見圖4。

圖 4 測試集仿真預測Fig.4 Simulation prediction of test set
從圖4可以看出,測試集預測準確率為90%,其中A型和D型乳房形態(tài)識別率為100%,B型識別率為50%,C型乳房形態(tài)識別率83.3%,在這種情況下ELM乳房形態(tài)識別模型識別率整體較高。有2個樣本識別錯誤,其中一個為B型乳房被識別為C型乳房,可能是因為這2類乳房特征的乳間距/胸寬的值很相近,且B型乳房形態(tài)樣本量偏少,訓練樣本不足導致該類型乳房形態(tài)不易被識別。另一個是C型乳房形態(tài)樣本被識別為D型乳房,可能是因為這2類乳房形態(tài)特征數(shù)據(jù)中胸厚/胸寬的值很相近導致識別出現(xiàn)偏差。
將ELM乳房形態(tài)識別模型運行10次并計時,結果見圖5。該模型第1次運行時間最長為11.57 s,可能是由于模型首次訓練時需要額外的讀取數(shù)據(jù)時間,之后的運行時間大多在1.28 s左右,整體來看運行時間較短。

圖 5 ELM模型運行時間Fig.5 Running time of ELM models
通過以上分析可知,ELM模型乳房形態(tài)識別率整體較高,運行時間較短。可以為內衣企業(yè)個性化文胸定制以及完善文胸號型起到重要作用,給不同乳房形態(tài)的消費者提供更滿意的選擇,同時指導文胸罩杯及結構設計,降低文胸對不同乳房形態(tài)女性的不合體度,從而做到對女性胸部的支撐與塑型功能。另外,本研究存在乳房形態(tài)樣本量不充足的缺點,后續(xù)研究應擴大受試者群體,減少識別結果的誤差,進一步提高乳房形態(tài)識別的準確率。
為了提高乳房形態(tài)識別精度,采用不同的激活函數(shù)與神經(jīng)元個數(shù)來定義ELM模型[28]。針對hardlim、sig、sin等3種不同的激活函數(shù),分析隱含層神經(jīng)元個數(shù)值在500以內、按照首項為5、公差為5的等差數(shù)列形式對樣本乳房形態(tài)識別精度產(chǎn)生的影響。
將乳房形態(tài)識別模型中的激活函數(shù)設為hardlim,見圖6。

圖 6 hardlim激活函數(shù)對預測準確率的影響Fig.6 Influence of hardlim activation function on prediction accuracy
圖6中,當隱含層神經(jīng)元個數(shù)在5~150之間時,測試集預測準確率波動較小,但不低于50%;隱含層神經(jīng)元個數(shù)在150~500時預測準確率波動較大,且當隱含層神經(jīng)元個數(shù)為470時,預測準確率達到最高,為71.7%。表明激活函數(shù)為hardlim時,ELM乳房形態(tài)識別模型的識別率整體較低。
將乳房形態(tài)識別模型中的激活函數(shù)改為sig,見圖7。不難發(fā)現(xiàn)當隱含層神經(jīng)元個數(shù)為30時,該模型識別乳房形態(tài)的準確率最高達到81.7%;當隱含層神經(jīng)元個數(shù)在10~55之間時,模型預測準確率高于70%;而在30~45之間時,準確率均大于80%;說明神經(jīng)元個數(shù)設在此段時模型識別精確率較好;隱含層神經(jīng)元個數(shù)在50~100之間,預測精度下降明顯;隱含層神經(jīng)元個數(shù)在60~500時,模型預測精度整體低于70%。因此當激活函數(shù)為sig時,建議將隱含層神經(jīng)元個數(shù)設置為30~45之間。

圖 7 Sig激活函數(shù)對預測準確率的影響Fig.7 Influence of sig activation function on prediction accuracy
最后,將乳房形態(tài)識別模型中的激活函數(shù)改為sin,見圖8。可以看出ELM乳房形態(tài)識別模型的預測準確率較好,隱含層神經(jīng)元個數(shù)設為25時,預測準確率平均達到98.3%,乳房形態(tài)識別率最好;隱含層神經(jīng)元個數(shù)在5~60之間時,模型識別準確率為80%以上,這表明此時模型識別準確率較高,識別效果較好;隱含層神經(jīng)元個數(shù)在60~500之間時,模型識別率均不超過80%,當隱含層神經(jīng)元個數(shù)在85~90時識別精確率僅為45%,表明采用此段隱含層神經(jīng)元個數(shù)的模型預測精度不高。

圖 8 Sin激活函數(shù)對預測準確率的影響Fig.8 Influence of sin activation function on prediction accuracy
綜上,在自定義乳房形態(tài)識別模型時,激活函數(shù)設為hardlim時,預測準確率整體較低,不建議采用該激活函數(shù);sig激活函數(shù)下,建議將隱含層神經(jīng)元個數(shù)設置在30~45之間識別效果較好,準確率均大于80%,且當隱含層神經(jīng)元個數(shù)為30時,該模型識別乳房形態(tài)的準確率最高,為81.7%;激活函數(shù)為sin且當隱含層神經(jīng)元個數(shù)在20~50時,預測準確率較高,平均為95%,隱含層神經(jīng)元個數(shù)設為25時,預測準確率平均為98.3%,最高可達100%。
ELM乳房形態(tài)識別模型識別效果較好,在sin激活函數(shù)下,當隱含層神經(jīng)元個數(shù)設為25,模型的預測準確率平均為98.3%,最高可達100%。模型運行時間整體較短,除首次運行11.57 s以外,平均為1.28 s。ELM乳房形態(tài)識別模型的探究有利于提高乳房形態(tài)識別準確率,優(yōu)化消費者穿著文胸的合體度,為文胸號型的細分和個性化定制提供理論參考。