999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

優(yōu)化的鄰近支持向量機(jī)在圖像檢索中的應(yīng)用

2014-07-02 00:20:47王華秋王斌
關(guān)鍵詞:分類

王華秋,王斌

(重慶理工大學(xué)計算機(jī)科學(xué)與工程學(xué)院,重慶 400054)

優(yōu)化的鄰近支持向量機(jī)在圖像檢索中的應(yīng)用

王華秋,王斌

(重慶理工大學(xué)計算機(jī)科學(xué)與工程學(xué)院,重慶 400054)

鄰近支持向量機(jī)由支持向量機(jī)衍生而來,它將支持向量機(jī)中二次規(guī)劃問題的求解轉(zhuǎn)換為線性方程組的求解,從而能在保證一定精度的情況下更加快速地得到分類器。傳統(tǒng)的非線性核鄰近支持向量機(jī)不能很好地解決多范圍數(shù)據(jù)的多分類問題。提出了一種鄰近支持向量機(jī)的優(yōu)化方法,并將其應(yīng)用到圖像檢索中。它利用高斯函數(shù)將圖像特征數(shù)據(jù)映射到0~1之間以提高其差異化水平,并將其放入非線性核中,然后以加權(quán)K-means聚類算法選擇最優(yōu)參數(shù),從而提高了非線性核PSVM的分類能力。實驗以coral圖像庫中的4類圖片作為圖片庫,對比了優(yōu)化前后的檢索命中率。實驗結(jié)果表明:優(yōu)化后的檢索效果優(yōu)于優(yōu)化前,說明將優(yōu)化的鄰近支持向量機(jī)應(yīng)用于圖像檢索是有效的。

優(yōu)化的鄰近支持向量機(jī);圖像檢索;高斯函數(shù);加權(quán)聚類算法

SVM最初于20世紀(jì)90年代由Vapnik提出,它能夠很好地解決小樣本、非線性、高維模式識別問題,在解決“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等傳統(tǒng)困難問題方面表現(xiàn)相當(dāng)出色[1-5]。但是SVM需要求解二次規(guī)劃問題,訓(xùn)練時間較長。Fung和Mangasarian[6]于2001年在支持向量機(jī)的基礎(chǔ)上提出了鄰近支持向量(PSVM)這一概念,將支持向量機(jī)中的二次規(guī)劃問題的求解轉(zhuǎn)換為線性方程組的求解,因此該方法能夠在基本不損失精度的情況下提高學(xué)習(xí)速度。近年來,鄰近支持向量機(jī)在理論研究和算法實現(xiàn)方面都取得了突破性進(jìn)展。2005年,莊東和陳英[7]將加權(quán)的鄰近支持向量機(jī)應(yīng)用于文本分類,提高了PSVM對不平衡數(shù)據(jù)的處理能力,實驗結(jié)果證明該方法優(yōu)于傳統(tǒng)的SVM。2006年,Mangasarian和Wild[8]提出通過求解樣本矩陣特征值的方法構(gòu)造分類超平PSVM,有效解決了交叉數(shù)據(jù)的二分類問題。2008年,張曦、閻威武等[9]將小波去噪核主元分析和鄰近支持向量機(jī)結(jié)合起來用于性能監(jiān)控和故障診斷,具有較好的監(jiān)控效果,并提出了核函數(shù)及其參數(shù)的選擇對診斷結(jié)果準(zhǔn)確性具有較大的影響的結(jié)論。2012年,王至超、張化祥等[10]在GEPSVM的基礎(chǔ)上提出了最值間距支持向量機(jī)(TDMSVM),通過計算得到2個最優(yōu)超平面,使超平面滿足到本類樣例的平均距離最小,同時到另一類樣例的平均距離最大,進(jìn)一步降低了時間復(fù)雜度。同年,魯淑霞等[11]提出了增量密度加權(quán)鄰近支持向量機(jī),有效控制了鄰近支持向量機(jī)的稀疏性。

本文以coral圖像庫中4種類型的圖片作為圖片庫,在提取圖片特征時以每張圖片的灰度共生矩陣量化出來的4個標(biāo)量作為特征值,在構(gòu)造分類器時,每張圖片為一類。由于不同類型的圖片量化出的特征值所處范圍不同,而同類型圖片量化出的特征值較為接近,所以在使用統(tǒng)一的非線性核PSVM對這些圖片進(jìn)行分類時往往出現(xiàn)部分類型的圖片分類效果較好,而另一部分分類效果差的情況,導(dǎo)致平均檢索命中率較低。為解決該問題,本文對PSVM算法進(jìn)行了優(yōu)化。首先引入高斯函數(shù)將所有圖片的特征值映射到0~1內(nèi),使特征值差異化分布。結(jié)合數(shù)據(jù)挖掘技術(shù)[12],使用加權(quán)K-means聚類算法將指定范圍內(nèi)的參數(shù)及其對應(yīng)的檢索命中率進(jìn)行聚類,并以檢索命中率最高的類中心所對應(yīng)的參數(shù)作為最優(yōu)參數(shù)。實驗結(jié)果表明優(yōu)化后的鄰近支持向量機(jī)具有較好的多分類效果。

1 PSVM算法及優(yōu)化方法

1.1 PSVM算法

PSVM的基本原理是將每個點歸類于2個盡可能遠(yuǎn)的平行平面中最接近的一個。該問題可以歸結(jié)為

式(1)、(2)中:A∈Rm×n是m個n維的特征矩陣,v為懲罰因子;e為單位列向量;D是m×m的對角矩陣,其對角線上每一行的值對應(yīng)A中樣本所屬的類別1或-1,其余元素為0。其解由拉格朗日泛函:

的梯度置零獲得。

ui為拉格朗日乘子。對wi,γi,yi,ui求導(dǎo)并令其等于0,可以得到如下4個矩陣式表達(dá)式:

由上述4個式子可以得到:

將式(8)~(10)代入式(7)得

將式(11)代入(8)、(9)中得到w,γ。

為了得到非線性分類器,需要把線性分類器中的變量w用其對偶等價w=ATDu替換,并將線性核AAT替換為非線性核k(A,AT),即

滿足約束:

其中:k(A,AT)=(AAT+c)d;c為大于等于0的常數(shù);d原定義為任意正整數(shù),本文將其定義為大于等于0的常數(shù)。當(dāng)c>0時,該核為非齊次多項式核;當(dāng)c=0時,為齊次多項式核。

在使用線性分類器對新樣本進(jìn)行分類時,通過wTx-γ的符號來確定該樣本屬于哪一類。在使用非線性分類器對新樣本進(jìn)行分類時,則通過K(xT,AT)u-γ的符號來確定。在優(yōu)化的PSVM中特征矩陣A中的值A(chǔ)ij=Gauss(Aij),其中Gauss(Aij)表示經(jīng)過高斯函數(shù)處理過的特征值。

1.2 PSVM優(yōu)化方法

1.2.1 最優(yōu)參數(shù)選擇

用于訓(xùn)練的特征值是線性不可分的,這里使用非線性核k(A,AT)=(AAT+c)d。在非線性核中包含2個參數(shù)c,d,為了得到更高的檢索命中率,c,d的確定至關(guān)重要。

為了得到較優(yōu)的參數(shù)c和d,首先獲取在c∈[0,8],d∈[0,8]的范圍內(nèi)以0.2為梯度的所有參數(shù)下的檢索命中率。在候選集合中假設(shè)c=ci,d= di所對應(yīng)的平均檢索命中率為Si,然后用加權(quán)K- means聚類算法將三維向量(ci,di,Si)進(jìn)行聚類,在計算樣本之間相似度時使用了加權(quán)的歐氏距離,其中賦予Si較高的權(quán)值。

這樣就得到了高檢索命中率所對應(yīng)參數(shù)的集中分布情況,有效地區(qū)分了距離較近但命中率差距較大的數(shù)據(jù)。所有類中心中Si最大的中心所對應(yīng)的c,d值能在一定程度上代表檢索命中率最高的參數(shù),本文稱之為最優(yōu)參數(shù)。

1.2.2 特征值預(yù)處理

由于使用非線性核的鄰近支持向量機(jī)不能很好地解決多范圍數(shù)據(jù)的多分類問題,為了減少誤差,引入高斯函數(shù):

式(15)中:z為比較中心;σ為函數(shù)的寬度參數(shù),其值根據(jù)訓(xùn)練特征值及相對差距而定。其中,接近z的特征值在處理過后更接近1,與z差距稍大的更接近于0,σ用來控制相對差距。這樣可以將特征值差異化的分布在0~1之間。該方法不僅能起到擴(kuò)大類與類之間特征值相對差距的作用,而且可規(guī)范化數(shù)據(jù),將所有特征值映射到0~1,從而提高各類圖片的檢索命中率。

1.2.3 多分類PSVM

由于二分類的鄰近支持向量機(jī)往往不能滿足圖像檢索的需求,所以本文引入多分類的鄰近支持向量機(jī)。

多分類鄰近支持向量機(jī)同樣基于二分類鄰近支持向量機(jī),目前常用的有以下兩種:

算法11-a-1(one against one)[10]:假設(shè)有n類樣本,每兩類樣本構(gòu)造一個分類器,則該方法需要構(gòu)造n(n-1)/2種分類器。

算法21-a-r(one against rest)[11]:假設(shè)有n類樣本,則該方法構(gòu)造n個PSVM分類器w,第k個分類器在訓(xùn)練時將第k類定為1,其余的定為-1。

考慮到1-a-r法在類別數(shù)較多的情況下會出現(xiàn)正負(fù)樣本不均衡的情況,本文采用1-a-1多分類方法,這樣就有2種對新樣本分類的決策方法:投票算法、有向無環(huán)圖算法。

2 圖像檢索流程設(shè)計

圖像檢索的一般方法是首先將檢索范圍內(nèi)的圖片特征進(jìn)行提取并存儲,再將檢索樣本的特征提取出來與檢索范圍內(nèi)圖片特征進(jìn)行相似性比對,將相似性最高的圖片返回給用戶[13]。本文將多分類的鄰近支持向量機(jī)用于圖像檢索,不僅要提取圖像的特征信息,還要對這些特征進(jìn)行分類訓(xùn)練,得到若干分類器。當(dāng)對新樣本進(jìn)行分類決策時,則用每個分類器對新樣本進(jìn)行分類決策,最終根據(jù)決策算法得出新樣本所屬類別[14-15]。具體過程如圖1所示。

圖1 圖像識別流程

3 圖像特征獲取方法

由于紋理可以通過研究灰度的空間相關(guān)特性來描述[16],因此本文主要以灰度共生矩陣的方法來獲取圖片的紋理特征。

灰度共生矩陣是對圖像上保持距離d的兩像素分別具有某灰度的狀況進(jìn)行統(tǒng)計得到的。在得到灰度共生矩陣之前首先要將RGB圖轉(zhuǎn)換為灰度圖,轉(zhuǎn)換公式如下:

得到灰度值后為了減少計算量,需要將灰度值(0~255)轉(zhuǎn)換為灰度級(0~15)共16級。

假設(shè)圖片共有M×N個像素點,從某像素點(x,y)開始該像素點的灰度級為i,灰度共生矩陣即統(tǒng)計與其在方向角為θ,距離為d,灰度級為j的像素點同時出現(xiàn)的概率。假設(shè)f(xm,xn)為像素點(xm,xn)所對應(yīng)的灰度級,Count(M)表示M情況出現(xiàn)的次數(shù),由此可將灰度共生矩陣的獲取方法概括如下:

為了更直觀地反映紋理的特征,可以根據(jù)灰度共生矩陣得出一些標(biāo)量來表征灰度共生矩陣的特征。下面是用到的幾種特征值:①能量特征;②對比度;③逆差距;④熵。本文所用的方法是取以上4個特征值分別在θ=0°,θ=45°,θ=90°,θ= 135°的值作為訓(xùn)練集,在對新樣本進(jìn)行分類決策時以新樣本4個方向上各特征值的平均值作為特征向量。

4 實驗過程及結(jié)果

4.1 實驗環(huán)境

本實驗取Coral圖片庫中的100張恐龍類圖片、100張花類圖片、100張汽車圖片、100張馬圖片共400張圖片作為圖片庫。實驗在WIN7操作系統(tǒng)下進(jìn)行,使用Visual Studio 2010開發(fā)環(huán)境進(jìn)行圖像檢索系統(tǒng)的設(shè)計。實驗的硬件環(huán)境為:CPU為Intel酷睿2,2.2 GHz雙核處理器;內(nèi)存為2 G。

4.2 實驗方法及結(jié)果

首先,對圖片庫中所有圖片的特征進(jìn)行提取,并計算出每張圖片所生成的灰度共生矩陣量化出來的4個標(biāo)量。

然后,從每類圖片中隨機(jī)抽取10張作為圖片庫進(jìn)行先驗性測試實驗,獲取各類圖片在c∈[0,8],d∈[0,8]的范圍內(nèi)以0.2為梯度的所有參數(shù)對應(yīng)的檢索命中率。所有圖片在引入高斯函數(shù)前后各參數(shù)的平均檢索命中率等值線如圖2、3所示。

圖2 處理前平均檢索命中率等值線

圖3 處理后平均檢索命中率等值線

圖2、3中:x軸代表非線性核(AAT+c)d中參數(shù)c的值;y軸代表參數(shù)d的值。等值線所代表的檢索命中率從外向內(nèi)依次遞增。對比圖2、3發(fā)現(xiàn),引入高斯函數(shù)后的檢索命中率較高的參數(shù)的范圍明顯大于引入前。

得到各參數(shù)對應(yīng)的檢索命中率后,根據(jù)參數(shù)值及其對應(yīng)的檢索命中率利用加權(quán)的K-means算法進(jìn)行聚類,以得到最優(yōu)參數(shù)。

各類圖片在使用最優(yōu)參數(shù)的PSVM分類后的檢索命中率如圖4所示。

圖4 最優(yōu)函數(shù)下檢索命中率(全部樣本)

從圖4的結(jié)果可以看出,引入高斯函數(shù)的鄰近支持向量機(jī)的檢索效果要優(yōu)于引入前。

表1、2給出了引入高斯函數(shù)前后最優(yōu)參數(shù)(各表中第1行參數(shù))與最優(yōu)參數(shù)附近參數(shù)所對應(yīng)的檢索命中率。對比后發(fā)現(xiàn),最優(yōu)參數(shù)雖然在某一類中的檢索命中率不是最高,但具有最高的平均檢索命中率,能夠較好地滿足各類圖片的需求。

表1 引入高斯函數(shù)前檢索命中率對比(全部樣本)

表2 引入高斯函數(shù)后檢索命中率對比(全部樣本)

在核函數(shù)k(A,AT)=(AAT+c)d中,c值對檢索命中率的影響較小,d值影響較大,且在引入高斯函數(shù)前,選取的參數(shù)略大或略小都會較大幅度地降低檢索命中率。而在引入高斯函數(shù)后,當(dāng)d略小時,對檢索命中率的影響較小。對照圖2、3不難發(fā)現(xiàn)其原因:引入高斯函數(shù)前,檢索命中率的坡度在d值增加和減少方向均較大,而在引入高斯函數(shù)后,檢索命中率的坡度在d值增加方向較大,在減小方向較小。因此,引入高斯函數(shù)很好地擴(kuò)大了非線性核鄰近支持向量機(jī)較優(yōu)參數(shù)的范圍,從而提高了非線性核鄰近支持向量機(jī)在多分類時的分類效果。

5 結(jié)束語

本文對鄰近支持向量機(jī)進(jìn)行了一系列的優(yōu)化并將其應(yīng)用到圖像檢索中。實驗結(jié)果表明優(yōu)化后的PSVM具有更好的多分類效果,將多分類鄰近支持向量機(jī)應(yīng)用于圖像檢索中是有效可行的。

但該方法仍然存在一定的局限性。例如,該算法在數(shù)據(jù)量較小時表現(xiàn)較為出色,具有較高的檢索命中率,但當(dāng)數(shù)據(jù)量變大時,各類圖片的檢索命中率均出現(xiàn)一定程度的降低,且部分類型圖片的檢索命中率下降明顯。這說明該方法對于圖像檢索還不具有普適性。所以若將該方法廣泛應(yīng)用于圖像檢索領(lǐng)域還有很多地方需要改進(jìn),如核函數(shù)的選取及優(yōu)化,分類及決策算法的優(yōu)化、選取更加適合于該方法的特征提取算法等。下一步的研究工作將主要圍繞改進(jìn)PSVM的核函數(shù)和獲取更適合于該方法的圖像特征兩個方向展開。

[1]丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述.電子科技大學(xué)學(xué)報.2011.40(1):2-7.

[2]余珺,鄭先斌,張小海.基于多核優(yōu)選的裝備費(fèi)用支持向量機(jī)預(yù)測法[J].四川兵工學(xué)報,2011(6):118-119.

[3]萬輝.一種基于最小二乘支持向量機(jī)的圖像增強(qiáng)算法[J].重慶理工大學(xué)學(xué)報:自然科學(xué)版,2011(6):53-57.

[4]鄔嘯,魏延,吳瑕.基于混合核函數(shù)的支持向量機(jī)[J].重慶理工大學(xué)學(xué)報:自然科學(xué)版,2011(10):66-70.

[5]崔建國,李明,陳希成.基于支持向量機(jī)的飛行器健康診斷方法[J].壓電與聲光,2009(2):266-269.

[6]Fung G,Mangasarian O L.Proximal Support Vector Machine Classifiers[C]//Knowledge Discovery and Data Mining.New York:Association for Computing Machinery,2001:77-86.

[7]莊東,陳英.基于加權(quán)近似支持向量機(jī)的文本分類[J].清華大學(xué)學(xué)報:自然科學(xué)版,2005,45(S1):1787-1790.

[8]Mangasarian O L,Wild EW.Multisurface Proximal Support Vector Machine Classification Via Generalized Eigenvalues[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28:69-74.

[9]張曦,閻威武,趙旭,等.基于小波去噪核主元分析和鄰近支持向量機(jī)的性能監(jiān)控和故障診斷[J].上海交通大學(xué)學(xué)報,2008,48(2):181-185.

[10]王至超,張化祥.最值支持向量機(jī)[J].計算機(jī)科學(xué),2012.39(4):205-209.

[11]魯淑霞,崔芳芳,忽麗莎.增量密度加權(quán)近似支持向量機(jī)[J].計算機(jī)科學(xué),2012,39(11):194-197.

[12]Han Jiawei.Data Mining:Concepts and Techniques,Third Edition[M].Morgan Kaufmann Press,2011.

[13]劉穎,范九倫.基于內(nèi)容的圖像檢索技術(shù)綜述[J].西安郵電學(xué)院學(xué)報,2012,17(2):1-8.

[14]Glenn Fung,Olvi LMangasarian.Proximal Support Vector Machine Classifiers,proceeding,KKD,2001(8):77-86.

[15]Hsu CW,Lin C J.A comparison ofmethods for multiclass support vector machines[J].PPIEEE Transactions on Neural Networks,2002,13(2):415-425.

[16]劉舒,姜琦剛,邵永社,等.應(yīng)用灰度共生矩陣的紋理特征描述的研究[J].科學(xué)技術(shù)與工程,2012.12(33): 8909-8914.

(責(zé)任編輯 楊黎麗)

Application of Optim ized Proximal Support Vector Machine in Image Retrieval

WANG Hua-qiu,WANG Bin
(College of Computer Science and Engineering,Chongqing University of Technology,Chongqing 400054,China)

Proximal support vectormachine(PSVM)is derived from support vectormachine(SVM) and converts the quadratic programming problem into linear equations,so that it can ensure the classifiermore quickly under the condition of certain precision.The multi-class classification problem of multi range data can notbe solved well by the original nonlinear kernel PSVM.This paper presents an optimization method for PSVM,and applied the optimized algorithm to image retrieval.The Gauss function is used to image feature datamap to the range of0~1 to enhance their difference level,then the different data is put into nonlinear kernel function,finally weighted K-means clustering algorithmis used to select the optimal parameters of PSVM.Experiments are carried out on 4 types of images from coral image database as the picture library,and the hit rate is compared between the original PSVMand the optimized algorithm.Experiments show that the performance of optimized PSVMis better than original algorithm,and it is effective to use the optimized PSVMinto image retrieval.

optimized proximal support vectormachine;image retrieval;Gauss function;weighted clustering algorithm

TP391

A

1674-8425(2014)09-0066-06

10.3969/j.issn.1674-8425(z).2014.09.015

2014-01-07

教育部科學(xué)研究青年基金資助項目(10YJC870037);國家社會科學(xué)基金資助項目(14BTQ053)

王華秋(1975—),男,博士,教授,主要從事數(shù)據(jù)挖掘和智能控制研究;王斌(1991—),男,碩士研究生,主要從事數(shù)據(jù)挖掘研究。

王華秋,王斌.優(yōu)化的鄰近支持向量機(jī)在圖像檢索中的應(yīng)用[J].重慶理工大學(xué)學(xué)報:自然科學(xué)版,2014 (9):66-71.

format:WANG Hua-qiu,WANG Bin.Application ofOptimized Proximal Support VectorMachine in Image Retrieval[J].Journal of Chongqing University of Technology:Natural Science,2014(9):66-71.

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準(zhǔn)備好了嗎
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 国产三级成人| 亚洲男人天堂久久| 久久精品这里只有国产中文精品| a色毛片免费视频| 啪啪永久免费av| 999在线免费视频| 国产免费怡红院视频| 一区二区欧美日韩高清免费| 99久久亚洲综合精品TS| 无遮挡一级毛片呦女视频| 无码电影在线观看| 国产成人成人一区二区| 国产精品太粉嫩高中在线观看| 大香网伊人久久综合网2020| 日本a级免费| 58av国产精品| 国产91精品久久| 在线观看免费黄色网址| 97视频在线精品国自产拍| 欧美一区中文字幕| 国产午夜在线观看视频| 九九精品在线观看| 欧美三级视频在线播放| 亚洲精品国偷自产在线91正片| 日韩精品亚洲人旧成在线| 99re这里只有国产中文精品国产精品 | 国产成人精品免费视频大全五级| 久久毛片基地| 精品伊人久久久久7777人| 亚洲色图在线观看| 日本精品中文字幕在线不卡| 久久无码高潮喷水| 97在线碰| 欧美视频在线不卡| 日本黄色不卡视频| 成年看免费观看视频拍拍| 九九这里只有精品视频| 精品超清无码视频在线观看| 久久国产高潮流白浆免费观看| 青青草a国产免费观看| 欧美另类一区| 欧美笫一页| 欧美一区国产| 三级视频中文字幕| 亚洲永久视频| 99久久性生片| 亚洲成在线观看 | 国产日韩欧美精品区性色| 婷婷六月综合网| 人禽伦免费交视频网页播放| 精品国产成人三级在线观看| 国产又黄又硬又粗| 国产69囗曝护士吞精在线视频| 全部免费特黄特色大片视频| 四虎国产精品永久一区| 四虎亚洲精品| 亚洲人成网站18禁动漫无码 | 午夜欧美在线| 国产成人综合日韩精品无码首页| 国产欧美日韩资源在线观看| 午夜精品国产自在| 国产在线观看91精品| 国产一区二区三区免费观看| 热re99久久精品国99热| 日日碰狠狠添天天爽| 日本黄网在线观看| 亚洲第一成年网| 69精品在线观看| 亚洲综合九九| 国产午夜不卡| 亚洲最新地址| 成人日韩欧美| 国产精品福利在线观看无码卡| 亚洲大尺码专区影院| 免费人成在线观看成人片| 国产精品亚洲专区一区| 高清色本在线www| 伊人色婷婷| 好久久免费视频高清| 中文无码精品a∨在线观看| 亚洲欧美日韩久久精品| 欧美yw精品日本国产精品|