余 彪 ,萬水龍,劉 進 ,王強德
(1.中國人民解放軍92493部隊,遼寧 葫蘆島 125000;2.中國人民解放軍91960部隊,廣東 汕頭 515074;3.南京航空航天大學,江蘇 南京 210016)
分類識別是印章圖像處理的最終目的,分類的準確與否、識別率的高低是其中的重要評判標準[1]。只有提取到印章圖像的關鍵特征,才有可能改進分類的準確度,而識別率的提高就要求選擇一款性能良好的分類器。矩函數對圖像形狀能進行有效的描述,因而得到迅速發展,如Tchebichef矩、Krawtchouk矩、Zemike矩和Legendre矩[2],其中Krawtchouk矩是基于離散域的正交矩,不存在數字過程中的近似誤差和計算中的坐標變換問題。參考文獻[3]將Krawtchouk矩用于對運動目標進行分類,有效地提高了分類的準確率。與此同時,人工神經網絡ANN(Artificial Neural Network)自提出以來就得到了快速發展,其中徑向基函數RBF(Radial Basis Function)神經網絡具有良好的非線性映射、自學習能力和收斂性,因此被越來越多地運用于對目標的分類當中,取得了較好的分類效果[4-6]。
基于此,本文提出一種基于Krawtchouk矩和RBF神經網絡的印章圖像分類識別方法。首先提取出標準印章圖像的Krawtchouk矩不變量,將其作為RBF神經網絡的原始訓練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經網絡的輸入量進行分類識別。實驗表明,使用Krawtchouk矩來描述印章圖像的特征并通過RBF神經網絡來對其進行分類識別,相對于參考文獻[4]中的KPCA-RBF法和參考文獻[6]中的Brushlet-RBF法,其分類更準確,識別率更高。
Krawtchouk矩是以Krawtchouk多項式為基礎的一種正交矩。一般來說,n階Krawtchouk多項式定義為:

其中,x,n=0,1,…,N;N>0;p∈(0,1);2F1(a,b;c;z)是超函數。

其中,Krawtchouk多項式的加權表達式為:

其中,

現用 Krawtchouk矩來描述一幅大小為M×N的圖像f(x,y):

其中,

Krawtchouk矩不變量具有平移、旋轉、尺度不變性,可表示為:

其中,


利 用q01、q10、q11、q02、q20、q12、q217 個 不 變 量 構 造 一 個不變向量Q來描述一幅圖像,其中q01、q10與圖像內容無關,所以本文選擇其余5個變量:

通過式(12)構成的特征向量對印章圖像進行特征提取。
RBF神經網絡由輸入端、隱藏段和輸出端3部分組成,具體的結構如圖1所示。輸入端將輸入信號傳輸到隱藏段,隱藏段再通過基函數的響應激烈程度給予輸出端相應的輸出信號。其中,輸入端的節點數對應于輸入向量的維數,隱藏段的節點數要視實際情況而定,輸出端的節點數按分類的類別總數來確定。

圖1 RBF神經網絡結構
一般來說,徑向基函數選取高斯函數,其具體形式為:

其中,Q為輸入向量,ui為隱藏節點i的中心向量,σi為相應的寬度,‖Q-ui‖為歐式范數。
輸出端第j個節點的輸出值yi為:

其中,j=1,…,m為輸出端節點,wij為隱藏段第i個節點到輸出端第j個節點的連接權值。
令d為訓練樣本的期望輸出值,則可知:

RBF神經網絡的學習過程一般分為選取中心、確定寬度和導出連接權值3部分。選取中心的方法通常采用K-means 聚類、ROLS(Recumive Orthogonal Least Square)法和自組織聚類等,然后根據標準樣本來確定寬度,最后通過誤差導出隱藏段各節點到輸出端各節點的連接權值。
本文算法的具體描述如下:
(1)根據印章圖像的特點,對于第一個輸入向量Q1=(q11,q02,q20,q12,q21)來說,此時RBF網絡的隱藏段只有一個節點,中心為Q1。現設定一個參數a(該參數會根據實驗結果進行適當調整),對于第二個輸入向量Q2,計算其與Q1之間的歐氏距離D,若D>a,則 Q2也成為一個中心;若D≤a,則 Q1為此處的中心。對于第n個輸入向量Qn,此時已有M個中心,現分別計算Qn與這M個中心的歐式距離,其中D0為其中的最小值,若D0>a,則 Qn成為新一個中心;若D0≤a,則中心數仍為M個。
(2)因為本文選取的徑向基函數為高斯函數,所以可通過式(16)直接求取寬度:

(3)隱藏段至輸出端的連接權值可直接用ROLS法求得:

算法實現的具體過程如下。
(1)提取標準印章圖像的Krawtchouk矩不變量,將其作為RBF神經網絡的原始訓練樣本。
(2)提取全部待鑒印章圖像的Krawtchouk矩不變量,通過RBF神經網絡對其進行分類。
(3)分類結果分為正確、錯誤和可疑3類,并在實驗中分別用阿拉伯數字1、-1和0表示。
具體的流程圖如圖2所示。

圖2 RBF神經網絡分類流程圖
為了驗證本文提出的基于Krawtchouk矩和RBF的印章圖像分類識別方法的分類識別情況,針對大量不同類型的印章圖像做了實驗,并與參考文獻[4]中的KPCA-RBF法和參考文獻[6]中的Brushlet-RBF法進行了比較,發現本文方法優勢明顯。實驗是在Intel(R)Core(TM)i3 CPU 2.4 GHz/1.92 GB內存/Matlab 2009a環境中運行的。

圖3 印章圖像實驗用圖

表2 RBF神經網絡分類識別結果
印章圖像(323×324)在5種不同條件下所蓋印出來的效果如圖3所示。先進行去噪、分割及配準等預處理,然后通過Krawtchouk矩不變量提取圖像特征,結果數據如表1所示。再利用RBF神經網絡來進行訓練,RBF神經網絡結構中輸入端節點數選為5,輸出端節點數選為3,最后再將所有待鑒印章圖像通過該網絡來分類識別,結果數據如表 2所示,其中 1代表正確,0代表可疑,-1代表錯誤。

表1 印章圖像的特征向量參數
圖4所示印章圖像中后3幅圖像對原圖中的字體、形狀或面積進行了一定的變動,并將得到的印章通過用力過大、用力過小、用力不均、缺上角、缺下角等方式產生實驗用的全部待鑒印章圖像,按照先后順序編號為1~5,6~10,11~15,16~20,然后將其輸入 RBF 神經網絡來對其進行分類識別,結果如表3所示。

圖4 待鑒印章圖像

表3 各類方法效率比較
從表2可以看出,本文方法、KPCA-RBF法和Brushlet-RBF法對于原始印章圖像及變換了圖像形狀的分類均取得了較好的結果,但是對于只改變了字體或字體間間距的圖像來說,本文方法具有明顯的優勢。由表3可以看出,本文提出的Krawtchouk-RBF法相對于KPCA-RBF法和Brushlet-RBF法來說,其分類識別的正確率更高。
本文提出了一種基于Krawtchouk矩和RBF神經網絡的印章圖像分類識別方法。首先提取標準印章圖像的Krawtchouk矩不變量,將其作為RBF網絡的原始訓練樣本;然后提取全部待鑒印章圖像的Krawtchouk矩不變量,將其作為RBF神經網絡的輸入量進行分類識別。針對實際印章圖像做了大量的實驗,并與參考文獻[4]中的KPCA-RBF法和參考文獻[6]中的Brushlet-RBF法進行了對比,結果表明,本文的方法分類更準確,識別率更高。
[1]何瑾,劉鐵根,周怡潔,等.基于邊緣差異的印鑒自動鑒別[J].儀 器 儀 表 學 報 ,2010,31(1):85-91.
[2]CHONG C W,RAVEENDRAN P,MUKUNDAN R.Translation and scale invariants of Legendre moments[J].Pattern Recongniton,2004(37):119-129.
[3]王曉靜,原達,李道凱.基于krawtchouk矩的運動目標分類[J].計算機工程與設計,2012,33(5):1890-1894.
[4]楊俊,陳賢富.基于KPCA和RBF網絡的文本分類研究[J].微電子學與計算機,2010,27(3):122-125.
[5]王行甫,覃啟賢,程用遠,等.一種改進的徑向基神經網絡預測算法[J].計算機系統應用,2012,21(8):214-217.
[6]李曉輝,謝建紅,高鑫.基于 Brushlet和 RBF網絡的SAR圖像分類[J].微計算機信息,2009,25(2-3):295-297.