姜 琴(鄖陽師范高等專科學校 計算機科學系,湖北十堰442000)
?
一種改進的FCM算法在手寫數字識別中的應用
姜琴
(鄖陽師范高等專科學校計算機科學系,湖北十堰442000)
摘要:模糊c均值(FCM,Fuzzy c-Means)算法是一種非常實用的模糊聚類算法,在非監督模式分類中占據著重要的地位。而手寫數字識別在現實中也有著非常廣泛的應用,如郵政編碼、統計報表、銀行票據等等。在FCM算法基礎上,加入部分監督信息,并對手寫數字圖像用Zernike矩來篩選特征,最后通過MATLAB編程,驗證了該改進的FCM算法對手寫數字識別具有一定的可靠性。
關鍵詞:FCM算法;手寫數字識別;部分監督
根據是否有教師指導,聚類方法分為無監督聚類和有監督聚類。對于沒有任何先驗知識來指導的分類,稱之為無監督聚類;而有監督聚類,是指事先已知部分樣本的隸屬類別,需用一定的方法再對未知的樣本劃分類別的聚類。
在無監督聚類中,理論上比較完善并且應用非常廣泛的是模糊c均值(FCM,Fuzzy c-Means)[1,2]類型的聚類算法。在實際中,若有一定的先驗知識,即已知某些樣本屬于某個類別時,可以將該先驗知識加入到FCM算法中,從而,人們研究出了多種具有部分監督信息的FCM算法。
設X={X1,X2,…,Xn}?Rn×q為樣本集合,n為樣本數,q為特征空間的維數。記c為類別數,U=[uij]c×n為模糊劃分矩陣:其中uij(1≤i≤c,1≤j≤n)表示第j個樣本Xj屬于第i個類別的隸屬度,uij應滿足以下二個約束條件:

Bezdek定義了模糊c均值聚類算法的一般描述:

(3)式中V=(v1,v2,…,vc)為s×c矩陣,vj(j=1,2,…,c)∈Rs為第j類中心為點xj與第i類中心vi之間的距離公式。m為模糊指數,控制分類矩陣U的模糊程度。目標函數Jm(X,μ,v)是類內加權誤差平方和目標函數,FCM算法就是一個使目標函數Jm(X,μ,v)最小化的迭代求解過程[3,4]。
假設ns為具有先驗知識的樣本個數,未知類別的樣本數為n個,則總共樣本數有ns+n個;其中n1個屬于第一類,n2-n1個屬于第二類,ns-ns-1個屬于第s類。設具有先驗知識的樣本劃分矩陣為U*,分類數依舊為c (s≤c),則劃分矩陣U′=(U*,U),即為

則基于目標函數的改進的具有部分監督的模糊聚類一般描述為:

且滿足下列條件:


其中,W為文獻[5]所描述的特征加權矩陣。
根據拉格朗日乘數法,有如下計算步驟:
首先設定2≤c≤n,迭代停止閥值為ε,初始化聚類原型模式P(0),迭代計數器b=0;
步驟一:用下式計算或更新劃分矩陣U′=(U*(b),U(b)):
(1)對于U*(b)的第k列,其最大隸屬度為:

(2)無監督樣本的隸屬度矩陣U(b)為:

步驟二:用下式更新聚類中心P(b+1):

手寫體數字識別屬于字符識別領域,其主要研究如何利用電子計算機來自動辨認人手寫在紙張上的阿拉伯數字。相較于英文識別,漢字識別,脫機手寫數字則是最難識別的。
在進行手寫數字識別時,需要先對帶有隨機噪聲的字符灰度值數字信號進行預處理。
通過預處理(參見文獻[6],[7]),可將原始圖像轉二值化,并對尺寸和位置進行歸一化處理。一般地,還需在預處理后的圖像上提取特征,可用Zernike矩來篩選特征。
若圖像的密度函數為f(x,y),其n階Zernike矩的定義為

式(15)中,*表示取共軛,Zernike多項式Vnm(x,y)由下式給出:Vnm(x,y)=Vnm(r,θ)=Rnm(r)ejmθ,式中,n為非負整數并滿足為偶數,實半徑多項式Rnm(r)的定義為

Zernike多項式滿足下述正交關系:

Znm在極坐標形式下可表示為:

Znm是一個復數,將實部記為Cnm,虛部記為和Snm,則:

根據正交性,Znm的反變換為

式中,M表示所需使用的矩的最高階數。
考慮一幅圖像,設其以α角度旋轉,旋轉后的圖像用fr表示,則fr(r,θ)=f(r,θ-α)。設θ1=θ-α,旋轉后的圖像的Zernike矩的計算表示為:

令θ1=θ-α,則

可用項Rn-2,m(r)和Rn-4,m(r)來計算Zernike多項式Rnm(r)。迭代關系式的起始項可選Rnm(r)=rm。

這里:k1=(n-1)(n+1)(n-2)/2;k2=2n(n-1)(n-2);k3=-(n-1)3;k4=-n(n-1)(n-3)/2。對于不同的初始值m,都要重復整個過程。
現從UK測試表中截取了5000樣本進行數據處理。先根據上面所說的特征提取方法提取出部分手寫體數字的特征矢量,然后再將同一數字的不同矢量特征表達作為研究對象進行模糊聚類分析。如手寫體的“2”的手寫形式為,其特征矢量為C=[-1 -1 -1 0 -1 -1 -3 1 1 0 3 3 3 0 0];而的特征矢量為C=[-1 -1 0 -1 -2 0 -1 -1 -1 6 3 0 0 0 1]。以此類推。

表1 實驗結果(ε=0.0015)
從上表可以看出,數字“2,3,4,5,8,9”的識別率都比較高,而“0”和“6”,“1”和“7”這兩組數字,因為在字形上有些相近,人們在書寫的時候,由于字跡潦草、習慣等原因,使得識別率相對于其他數字稍低。但總體來講,此算法對手寫數字識別具有一定的可靠性。
[參考文獻]
[1]閔珊華,賀仲雄.懂一點模糊數學[M].北京:中國青年出版社,1985.
[2]Zadeh L A. Fuzzy sets[J].Information and Control,1965,8(5):338~353.
[3]王士同,夏祖勛,陳劍夫.模糊數學在人工智能中的應用[M].北京:機械工業出版社,1991.
[4]Bezdek J C. A review of probabilistic,fuzzy,and neutral model for pattern recognition[J].Journal of intelligent and fuzzy systems,1996,4(1):1~25.
[5]Xiaojun Tong,Qin Jiang,Haitao Gan,Shan Zeng,Kai Zhao. Research on the Calculation Mothod for Weight of the Feature Weight Fuzzy Clustering Algorithm[A]∥DCABES2008:677~682.
[6]夏德深,傅德勝.現代圖像處理技術與應用[M].南京:東南大學出版社,1997.
[7]姜琴.模糊聚類分析及其在數字圖像處理中的應用[D].武漢工業學院,2009.
Application of Improved FCM Algorithm in Handwritten Numeral Recognition
JIANG Qin
(Department of Computer Science,Yunyang Teachers College,Shiyan 442000,China)
Abstract:Fuzzy Means(FCM)algorithm,a practical fuzzy clustering algorithm,plays an important role in the unsupervised pattern classification. The hand -written numeral recognition is widely applied in different fields,such as postcodes,statistics statements,bank bills,etc. Partial supervision information is added in FCM algorithm,and characteristics are selected by Zernike moment with hand-written numeral images,and the improved FCM algorithm is proved to be reliable to the hand-written numeral recognition by means of MATLAB programming.
Key words:FCM algorithm;handwritten numeral recognition;partial supervision
中圖分類號:TP391
文獻標識碼:A
文章編號:2095-8153(2016)02-0105-04
收稿日期:2016-03-27
基金項目:湖北省教育廳2015年度科研計劃項目(Q20156002);鄖陽師范高等專科學校科研基金項目(編號2012B03)階段性成果。
作者簡介:姜琴(1978-),女,鄖陽師范高等專科學校計算機科學系講師,碩士,研究方向:計算機圖形圖像及計算數學方面教學。