楚浩宇,高 萌,劉永生
(東北農業大學 電氣與信息學院,黑龍江 哈爾濱 150030)
手寫體數字識別是光學字符識別的一個重要分支,分為聯機手寫體數字識別和脫機手寫體數字識別。在聯機手寫體數字識別中,計算機可以通過與之相連的輸入設備得到關于筆尖運動軌跡和速度的有效信息,所以識別相對較易[1]。由于數字圖像的數據量龐大且書寫風格的迥異等干擾因素對識別會產生很大的影響,因此脫機手寫體數字識別難度較大,但其應用領域更加寬泛。因此這是一項意義重大的研究課題。
鑒于傳統的單一分類器對數字之間差異的敏感性不同,許多學者開始研究組合分類器所產生的效果[2]。文獻[3]使用四種特征和三種傳統分類器構造了九種不同的分類器進行組合。文獻[4]構造了兩級的組合分類器,第一級是最小距離分類器,第二級由三個反向傳播網絡并聯而成。文獻[5]提出了一種基于量子神經網絡的二級識別系統。這些方法雖然在一定程度上提高了識別率與可靠性,但分類器的組合結構卻十分復雜,因此識別速度隨之下降。
文中提出使用一種特征、三種分類器、并行結構組織的組合分類器,與傳統方法相比,在提高識別率與可靠性的同時,極大地減少了算法的時間復雜度。
手寫體數字識別一般包括圖像預處理、特征提取、分類識別等模塊[6],其結構如圖1所示。

圖1 數字識別的步驟
預處理的主要目的是去除字符圖像中的噪聲,并采用灰度化方法處理讀入的圖像,圖像中的每個像素就對應唯一一個灰度值,得到規范化的點陣,為識別做好準備[7]。……