(1.中國礦業大學 機電與信息工程學院, 北京 100083; 2.河南農業大學 信管學院, 鄭州 450002)
摘 要:
針對圖像分類中傳統的特征融合方式所形成的巨大特征空間甚至維數災難問題,提出了一種基于vague融合的圖像分類模型。通過同時給出支持和反對的證據,運用vague集的真假隸屬函數對圖像分類中多特征分類器的分類結果進行決策融合,多特征分類器的分類結果得到優化和綜合,從而獲得更準確、更穩定的決策分類結果。實驗結果表明,運用此決策融合模型是可行的,同時,圖像分類準確率得到了明顯提高。
關鍵詞:信息融合; 模糊集; 維數災難; 隸屬函數
中圖分類號:TP391 文獻標志碼:A
文章編號:1001-3695(2009)02-0787-02
Multi-feature vague fusion model for image classification
HU Xiao-hong1,2, QIAN Xu1, ZHENG Kai-mei1
(1. School of Mechanical Electronic Information Engineering, China University of Mining Technology, Beijing 100083, China;
2.School of Information Management Science, Henan Agricultural University, Zhengzhou 450002, China)
Abstract:For traditional way of image classification, feature fusion scheme would decrease classificatory quality or result in other problems such as curse of dimensionality.This paper proposed a novel approach trying to integrate different features in image classification. Vague set for positive and negativeevidences was applied to analyze and optimize the decisions obtained by multi-classifiers. Through integrating two sides of multiple classification decisions, the classification was optimized and synthesized, thus the processing and the result would be both powerful and stable. Experimental results show that the performance of the classification is greatly improved.
Key words:information fusion; vague set; curse of dimensionality; membership function
隨著互聯網技術及計算機的發展,數字圖像數量的猛增使得對多媒體信息合理地組織成為非常有挑戰性的課題。在醫學、數字圖書館、公安部門等許多應用領域[1]對圖像進行高速、高效的分類、檢索及識別要求愈來愈強;對多級特征描述符進行綜合處理是多媒體、模式識別等領域的關鍵步驟,有效的融合[2]策略能獲得更準確、更穩定的分類或檢索結果。本文提出了在圖像自動分類中的vague集[3]多特征融合模型,采用vague集的真假隸屬度融合圖像的不同物理特征描述符以獲得更高的分類準確率和魯棒性。
1 圖像分類的多特征融合結構
在圖像自動分類中,圖像的不同特征描述符之間存在互補信息,融合不同的物理特征能獲得更高的分類準確率;然而,對圖像各描述符所構成的高維空間進行特征級融合存在的主要問題是巨大的特征空間造成沉重的計算負擔,甚至于所謂的維數災難,尤其在訓練樣本較少的情況下,它極大降低了分類器的魯棒性。據此本文采用由多分類器構成的決策融合結構,由多個分類器分別依據不同的特征描述符對圖像進行分類,其分類結果以概率輸出,由融合器對不同分類器的結果進行融合。其結構如圖1所示。
圖像的顏色、形狀、紋理及位置關系等不同物理特征經過特征提取算法構成相對應的特征空間,通過特征耦合分類器作出獨立特征屬性分類,子分類器的分類結果以概率輸出;然后,基于vague集理論,將特征分類器分類結果轉換為真假隸屬度,圖1中S/Di表示為第i個特征分類器分類后,融合各子分類器分類結果的真假隸屬度;最后通過融合器基于vague集理論對{S/D1,S/D2,…,S/Dn}作出分類融合決策。
2 分類器的學習策略
統計學習理論系統地研究了小樣本情況下的機器學習問題。在這一理論基礎下提出的支持向量機(SVM)較好地解決了小樣本、過學習、維數災難、局部極小等問題,具有很強的泛化能力。據此,本文采用SVM為子分類器。對于樣本集(Xi,Yi)( i=1,2,…, p),向量Xi∈Rq, Yi∈{+1,-1},其SVM分類函數為
f(X)=sgn(g(x))=sgn{∑qi=1a*iYIK(Xi,X)+b*}(1)
其中:a*i為訓練得到的參數。采用文獻[4]對式(1)概率化,得到樣本X被判定為正類的概率P(Y=1|g)。顯然,其被判定為負類的概率1-P。
運用SVM來解決多分類問題,本文中分類器結構以耦合方式構建的多類分類器,將原始的M類分類問題分解為M(M-1)/2個子問題,對其中每兩個類別建立一個子分類器Si(1≤i≤M(M-1)/2)。設待分類的類別集合為O={O1,O2,…, Om},不同特征分類器S={S1,S2,…, Sn}的子分類器Sj={S1j,S2j,…, Slj}。其中m、n分別為集合中待分類別及特征分類器數目。圖像不同物理特征經相應特征分類器分類后,得到的多分類器判別矩陣為A{A1,A2,…,An},分類器Sj的分類結果Aj表示為
[0,1](i=1,2,…,m, j=1,2,…, n)。
3 基于vague集的融合模型
3. 1 Vague集
自從Zadeh等人[5]提出該fuzzy理論以來,該集理論就被用于模糊決策問題。許多學者也有研究[6]。但在實際應用中發現它也存在一些問題,fuzzy集的隸屬度是一個單值,該單值既包含了支持的證據,也包含了反對u∈U的證據,它不可能表示其中的一個,更不可能同時表示支持和反對的證據。為此,Gau等人[3]提出了vague集的概念,用一個真隸屬函數tA和一個假隸屬函數fA來描述vague集(VS),真假隸屬函數形成了隸屬函數μA(u)的界,即tA(u)≤μA(u)≤1-fA(u)。Vague集的主要特征是它同時給出了支持和反對的證據,目前vague集正成為當前模糊信息處理中的一個新興研究課題,在近似推理、模式識別等領域中得到了廣泛的研究與應用[5,6]。
定義1令U是一個點(對象)的空間,其中的任意一個元素用u表示,U中的一個vague集A用一個真隸屬函數tA和一個假隸屬函數fA表示,tA(u)是從支持u的證據所導出的u的隸屬度下界,fA(u)則是從反對u的證據所導出的u的否定隸屬度下界, tA(u)和fA(u)將區間[0,1]中的一個實數與U中的每一個點聯系起來,即
3. 2 基于vague集的融合模型的建立
經特征分類器分類后,特征分類器S對類別Oi的VS表示
4 基于vague集的融合的圖像分類算法
a)依據MPEG-7標準構建特征空間,本文中采用顏色直方圖、邊緣直方圖及紋理共生矩陣。
b)采用多類SVM分類器對各特征向量進行分類,子分類器的分類結果以概率形式輸出,得到式(2)表示分類器分類決策矩陣A。
c)通過設定的決策者滿意和不滿意的上、下界λU,λL,構建支持集H和反對集F,得到式(6)表示的vague融合向量。其中:tij=∑i∈Hμij/∑lj=1μij,fij=∑i∈Fμij/∑lj=1μij,從而構造式(6)表示的vague融合矩陣。
d)運用式(8)確定理想類別O*計算T(Oi,O*)(i=1,2,…,m)[7],T(O,O*)=∑ni=1(wi*|(to(ri)+f*o(ri))-(to*(ri)+f*o*(ri))|)。
其中:wi為特征i權重;f*o(ri)=1-fo(ri), f*o*(ri)=1-fo*(ri)。
e)輸出Tmax(O,O*)也即為融合分類器所判定的類別
Tmin(O,O*)=min{T(O1,O*),T(O2,O*),…,T(Om, O*)}
5 實驗結果及分析
實驗數據集為Corel圖像庫。其中有10類圖像,每類中包含100張圖像,共計1 000張圖像作為實驗數據。為了測試該模型的性能,隨機從每類中分別挑選出30幅圖像為訓練樣本,其余圖像為測試集。特征空間為H(16 bin)、S(4 bin)、V(4 bin)顏色直方圖,0、45°、90°、135°和無方向的邊緣直方圖[f0,f1,…, f4]以及4×4的紋理共生矩陣構成。
表1為Corel圖像庫中的分類性能比較表。其中特征融合采用一對一SVM多類組合方式,特征空間由三個特征277維共同構成,本文方法中特征空間的最大維數為顏色特征空間256維。
表1 Corel 圖像庫分類性能比較表
方法土著人海灣建筑公交車恐龍大象花馬冰川食物平均
特征融合 0.6910.4640.6500.8500.9630.7120.8510.8500.5110.7620.730
本文方法0.7920.5240.7170.8610.9910.7140.8650.8520.5330.7680.760
從實驗結果可以看出,本文用于圖像分類的融合模型的方法是有效的,與特征融合相比,特征空間維數得到改善。本文所提出的融合方法在各個類別上分類準確率均高于特征融合的方法,總平均分類率也提高了3%。
6 結束語
本文提出了一種圖像分類的多特征vague融合模型。通過機器學習得到耦合結構支持向量機的分類結果,為了獲得更好的性能,本文提出了運用vague集的真假隸屬函數對圖像分類中多分類器的分類結果進行決策融合,從而多分類器的分類結果得到優化和綜合。實驗結果表明,本文的圖像分類方法是可行,且提高了分類率。
參考文獻:
[1]YU Hu, LI Yang-sheng. Application of data mining in biomedical engineering[J]. Foreign Medical Sciences Biomedical Enginee-ring, 2003,26(2): 54-59.
[2]康耀紅.數據融合理論與應用[M].西安:西安電子科技大學出版社, 1997.
[3]GAU W L, BUEHRER D J. Vague sets[J]. IEEE Trans on Systems Man Cybernetic, 1993, 23(1): 610-614.
[4]GOH K, CHANG E, CHENG K T.SVM binary classifier ensembles for image classification[C]//Proc of ACM CIKM 2001.New York: ACM Press, 2001:395-402.
[5]BELLMAN R, ZADEH L A. Decision making in a fuzzy environment[J]. Management Science, 1990,17(1):141-164.
[6]LIU Hua-wen. Similarity measures between vague sets and their applications to pattern recognition[J]. Journal of Shandong University, 2004,34(1):110-114.
[7]WANG Jian-hong, LI Xin, DUAN Zhan-sheng. Multi-attribute multi-sensor and multi-targent data fusion based on vague set[C]//Proc of the 4th Intenational Conference on Machine Learning and Cybernetics. 2005:18-21.
[8]ZHANG Xiao-ping. Fuzzy comprehensive evaluation model based on vague sets[J]. Journal of Shandong University of Architecture and Engineering,2004, 19(3):77-80,
[9]路晶,金奕江,馬少平,等.使用基于SVM的否定概率和法的圖像標注[J].智能系統學報, 2006,1(1):62-66.
[10]李凡,田應忠,呂澤華.基于vague集的近似推理方法[J].華中科技大學學報:自然科學版, 2004,32 (4):44-46.