計(jì)蘊(yùn)容周韋潤(rùn)
(1.江蘇科技大學(xué)計(jì)算機(jī)學(xué)院 鎮(zhèn)江212003)(2.江蘇句容抽水蓄能有限公司 鎮(zhèn)江212400)
面料是與我們生活聯(lián)系非常緊密的一種日用品原材料。使用面料制作成的商品有很多,比如衣服、圍巾、包等。商品制造廠商需要先采購(gòu)滿足客戶需求的面料,再加工成商品。而紡織面料的種類多種多樣,采用人工對(duì)比方式采購(gòu)不僅勞動(dòng)強(qiáng)度大而且可靠性低,容易造成采購(gòu)的面料與制造廠商實(shí)際需要的面料不匹配。因此,建立一個(gè)有效檢索面料的系統(tǒng)就很有必要。
近年來(lái),基于內(nèi)容的圖像檢索方法[1]已經(jīng)應(yīng)用于織物檢索領(lǐng)域。圖像檢索方法三個(gè)重要指標(biāo)是準(zhǔn)確率、可靠性和檢索速度。準(zhǔn)確率關(guān)系檢測(cè)的結(jié)果是否準(zhǔn)確,可靠性關(guān)系檢測(cè)的方法是否實(shí)用,檢索速度關(guān)系檢測(cè)過(guò)程效率的高低。然而,大部分情況下,這幾個(gè)指標(biāo)之間相互制約,很難同時(shí)兼顧。為了彌補(bǔ)傳統(tǒng)圖像檢索方法的單一特征造成的不便,本文提出了一種多特征融合的檢索方法,分析并融合面料圖像的顏色特征、形狀特征和紋理特征,進(jìn)行檢索。此外,對(duì)于各特征所占比重,可以根據(jù)不同的特征設(shè)置不同的值,整體權(quán)重為1。
顏色是圖像中重要的屬性之一,也是描述圖像內(nèi)容最直接的一種視覺(jué)特性。常用的顏色特征表
示方法包括顏色直方圖[2]、顏色集[3]、顏色矩[4]等。顏色直方圖可以簡(jiǎn)單地描述圖像中顏色的全局分布,即整個(gè)圖像中不同顏色的比例,其通用性較強(qiáng),被廣泛使用。但是,這種方法也有缺點(diǎn)。由于顏色直方圖是全局顏色統(tǒng)計(jì)的結(jié)果,丟失了像素點(diǎn)間的位置特征,從而各種顏色的局部分布及空間位置就無(wú)法明確。針對(duì)這一缺點(diǎn),本文采用HSV空間中的顏色矩表示顏色特征。
顏色矩是Stricker和Orengo在2002年提出的描述顏色分布的方法,這種方法建立在線性代數(shù)中矩的概念上,用矩來(lái)表示圖像的顏色分布。分別為顏色一階矩(mean)、顏色二階矩(variance)和顏色三階矩(skewness)。三個(gè)顏色矩的數(shù)學(xué)定義分別如下:

式中:pij為第j個(gè)像素的第i個(gè)分量;N為像素總數(shù)。一階矩計(jì)算平均值,反映圖像的亮度;二階矩計(jì)算方差,反映圖像的顏色分布范圍;三階矩計(jì)算斜度,反映圖像的顏色分布對(duì)稱性。
HSV顏色空間有三個(gè)屬性,色彩(Hue)、飽和度(Saturation)和亮度(Value)。人眼的色彩感知主要包括色調(diào)、飽和度和亮度,這與HSV色彩空間的三個(gè)屬性相匹配,因此,本文選用HSV色彩空間進(jìn)行顏色特征提取,其模型如圖1。

圖1 HSV顏色空間模型
在該空間中,分別獲取了圖像H通道、S通道和V通道三個(gè)圖像的顏色矩特征參數(shù)。如果用M,N表示兩幅圖像,那么它們矩的距離公式表示為

式中,ωij≥0(1≤i,j≤3)是指定的加權(quán)系數(shù),但ωi1、ωi2、ωi3的累積和必須為1。提取到待匹配圖與數(shù)據(jù)庫(kù)中圖像的顏色矩后,通過(guò)曼哈頓距離[5]進(jìn)行相似性度量。
形狀特征是描述高層視覺(jué)特征的重要手段。對(duì)形狀特征的提取主要是尋找一些幾何不變量,即對(duì)圖像中感興趣目標(biāo)的分割。形狀特征提取流程圖如圖2。

圖2 形狀特征提取流程圖
在本文中,形狀不變矩用來(lái)描述圖像的形狀特征。由于Hu不變矩[6~7]在表征圖像形狀時(shí)具有空間幾何不變性,如旋轉(zhuǎn)、平移、縮放時(shí),不隨圖像的位置、大小和方向而變化,因此該方法在提取圖像中的形態(tài)方面非常有效。
在連續(xù)的情況下,圖像函數(shù)為f(x,y),那么圖像的(p+q)階的矩定義為(p+q)階中心矩定義為


(p+q)階歸一化的中心矩定義為

其中:

7個(gè)不變矩組為

根據(jù)上述式(9)可以計(jì)算圖像的7個(gè)不變矩陣,提取圖片的Hu不變矩特征后,再通過(guò)歐式距離[8]進(jìn)行相似性度量。
歐氏距離(Euclid Distance)是一個(gè)常用的距離定義,也把它稱為歐幾里得度量或歐幾里得距離。它是m維空間中兩點(diǎn)之間的真實(shí)距離。二維空間中的歐幾里得距離就是兩個(gè)點(diǎn)之間的線性距離。
二維空間歐氏距離公式表示為

三維空間的歐氏距離公式表示為

n維歐氏空間是一個(gè)點(diǎn)集,它的每個(gè)點(diǎn)x可以表示為(x(1),x(2),…,x(n)),其中x(i)(i=1,2,…,n)是實(shí)數(shù),稱為x的第i個(gè)坐標(biāo),兩個(gè)點(diǎn)A=(a(1),a(2),…,a(n))和B=(b(1),b(2),…,b(n))之間的距離d(A,B)定義為下面的公式:

通過(guò)計(jì)算要匹配的圖的不變矩與數(shù)據(jù)庫(kù)中圖像不變矩的歐氏距離,可以將讀取的圖像與數(shù)據(jù)庫(kù)中的圖像進(jìn)行比較,選出相似度高的,在系統(tǒng)界面上返回結(jié)果圖像。
紋理也是圖像中一種重要的視覺(jué)特征,它描述了圖像中重復(fù)出現(xiàn)的局部模式以及它們的排列規(guī)則,其本質(zhì)是刻畫(huà)像素的鄰域灰度空間分布規(guī)律。圖像紋理分析是圖像分析處理研究中的一個(gè)關(guān)鍵部分。紋理分析在計(jì)算機(jī)圖形學(xué)中具有廣泛的應(yīng)用。目前,紋理特征的研究方法多種多樣,大致可分為統(tǒng)計(jì)法、結(jié)構(gòu)法、模型法和變換法。
在本文中,采用Gabor小波[9~11]變換的方法提取面料圖像的紋理特征。Gabor小波變換可以被看作母小波是Gabor函數(shù)的小波變換,即在進(jìn)行小波變換時(shí),將Gabor函數(shù)作為基函數(shù)。假設(shè)用I(x,y)表示一幅圖像,那么該圖像用Gabor濾波器可以表示為

其中,參量s和t是濾波器模板大小的變量,參數(shù)x和y反映像素在圖像中的位置,參量p和q分別表示小波變換的尺度和方向,g*pq表示gpq的復(fù)共軛。
假設(shè)局部紋理區(qū)域具有空間一致性,則變換系數(shù)的均值μpq和方差σpq可以代表該區(qū)域的紋理特征。

假設(shè)用V表示圖像I(x,y)的紋理特征向量,則V可以表示為

假設(shè)用Vm表示待查詢圖像m對(duì)應(yīng)的紋理特征向量,用Vn表示數(shù)據(jù)庫(kù)中圖像n對(duì)應(yīng)的紋理特征向量,則采用歐氏距離計(jì)算圖像間的相似度,歐幾里德距離可以表示為

其中,c表示紋理特征向量的維數(shù)。若Vm和Vn具有不同的維數(shù),則c表示為

由于面料圖像的顏色多種多樣且樣式繁多,為了確保圖像的準(zhǔn)確檢索,本文對(duì)圖像的顏色特征、形狀特征及紋理特征進(jìn)行融合。特征融合[12~13]采用對(duì)不同特征給予不同權(quán)重的方法,用戶可以手動(dòng)輸入各個(gè)特征占融合特征的比重,整體權(quán)重值為1。
圖像檢索時(shí),數(shù)據(jù)庫(kù)中的圖像用I表示,待查詢圖像用Q表示,設(shè)數(shù)據(jù)庫(kù)中圖像I在三個(gè)不同特征提取分析下與待查詢圖像Q的相似性距離分別為D1、D2、D3,手動(dòng)設(shè)置的歸一化權(quán)重大小分別為W1、W2、W3,則數(shù)據(jù)庫(kù)中圖像I與待查詢圖像Q基于多特征融合后的相似性距離為

根據(jù)上述方法,計(jì)算數(shù)據(jù)庫(kù)中所有圖像與待查詢圖像Q的相似度,按照相似度大小排名,返回規(guī)定數(shù)量?jī)?nèi)最相似的圖像給用戶。特征融合算法中權(quán)重的設(shè)置主要根據(jù)用戶的需要和待檢索圖像的特點(diǎn)來(lái)設(shè)置不同特征所占的比重,使算法更自主化,以達(dá)到較好的檢索結(jié)果。
為驗(yàn)證本文所提出的多特征融合算法的準(zhǔn)確性,將該方法應(yīng)用于實(shí)際拍攝的面料圖像庫(kù)中進(jìn)行實(shí)驗(yàn)。所選用的面料圖像是從某布料加工廠隨機(jī)拍攝的800幅面料圖像。實(shí)驗(yàn)中,70%被選為訓(xùn)練集,30%被用作測(cè)試集。面料庫(kù)的部分圖像如圖3。

圖3 面料庫(kù)圖像樣本
本實(shí)驗(yàn)選擇了查準(zhǔn)率(precision)[14]和查全率(recall)[15~16]作為衡量算法平均性能的指標(biāo)。查準(zhǔn)率指的是在一次查詢過(guò)程中,返回的結(jié)果中相似圖像占檢索到的圖像的比例,查全率指的是在一次查詢過(guò)程中,返回的結(jié)果中相似圖像占數(shù)據(jù)庫(kù)中相似圖像的比例。本實(shí)驗(yàn)中,假設(shè)執(zhí)行一次查詢過(guò)程,返回的結(jié)果中相似圖像數(shù)目為r,返回的圖像總數(shù)為N,數(shù)據(jù)庫(kù)中相似的圖像總數(shù)為R,則查準(zhǔn)率和查全率的表達(dá)式可以表示如下:

為了驗(yàn)證本文檢索方法的有效性,分別將顏色特征、形狀特征、紋理特征與三項(xiàng)特征融合進(jìn)行實(shí)驗(yàn)對(duì)比。隨機(jī)抽取100張圖像,以每一張圖像作為待檢索對(duì)象,面料庫(kù)作為檢索庫(kù),共運(yùn)行100次,計(jì)算了100次的查全率和查準(zhǔn)率,并對(duì)查全率和查準(zhǔn)率求平均值,得到平均查全率和平均查準(zhǔn)率。在實(shí)驗(yàn)中,對(duì)比單一特征和多特征融合的查全率與查準(zhǔn)率,實(shí)驗(yàn)結(jié)果見(jiàn)表1。

表1 單一特征算法和多特征融合算法實(shí)驗(yàn)結(jié)果%
從表中的數(shù)據(jù)可以看出,本文的多特征融合算法,在查全率和查準(zhǔn)率方面均高于單一特征。四種算法在不同返回圖像數(shù)目時(shí),查準(zhǔn)率和查全率的曲線圖如圖4和圖5。

圖4 四種算法查準(zhǔn)率曲線

圖5 四種算法查全率曲線
從圖4和圖5中,可以看出多特征融合算法在查準(zhǔn)率和查全率上都優(yōu)于單一特征檢索算法,主要是由于多特征融合算法考慮到多種特征因素的影響,可以在一定程度上減小單一特征帶來(lái)的影響。
本文提出了一種結(jié)合了顏色、形狀、紋理三種特征的面料圖像檢索方法。通過(guò)在HSV空間提取顏色特征,采用Hu不變矩算法提取形狀特征,利用Gabor小波提取紋理特征,最后將三種特征結(jié)合,使用相似性度量分別對(duì)顏色特征、形狀特征、紋理特征以及融合后的特征進(jìn)行了圖像檢索實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,基于多特征的檢索效果優(yōu)于單一特征,具有一定的實(shí)際意義。本文研究的是面料圖像的檢索,數(shù)據(jù)庫(kù)中都是布料圖像,布料圖像的種類繁多,針對(duì)不同的類型,多特征融合時(shí)各權(quán)值分配也各不相同。因此,筆者下一步將在此基礎(chǔ)上研究如何合理設(shè)置三項(xiàng)融合時(shí)的權(quán)重,來(lái)進(jìn)一步提高檢索的精確度。