陳 思,張濤川,彭一航
(佛山職業(yè)技術(shù)學院 機電工程學院,廣東 佛山528137)
近年來,光學字符識別技術(shù)被廣泛用于車牌號碼識別、票據(jù)識別、卡片識別等領(lǐng)域[1]。隨著計算機技術(shù)的不斷發(fā)展,市場上不斷推出先進的機器視覺開發(fā)平臺,促進了光學字符識別技術(shù)的發(fā)展及推廣。HALCON平臺提供成熟的圖像處理算法包及大量開放式結(jié)構(gòu)的功能模塊,有助于快速開發(fā)光學字符識別系統(tǒng),具有開發(fā)效率高、開發(fā)成本低廉的特點。
HALCON能夠快速連接圖像采集器,完成圖像采集任務,提供了多種圖像增強和圖像分割的算法[2],用戶根據(jù)實際應用的需要通過選用合適的算子來調(diào)用算法;提供了OCR助手,用戶使用助手能快速制作樣本訓練集文件和對分類器進行訓練,提高了光學字符識別系統(tǒng)開發(fā)的效率。
復雜背景下的光學字符識別,需要適當選用圖像增強方法[3],突出字符區(qū)域空間,抑制不感興趣的背景空間。為了突出圖像中的目標區(qū)域和灰度空間,HALCON平臺提供了大量基于空域的非線性的灰度變換算法包,例如對數(shù)變換、指數(shù)變換算法包等,也提供大量基于頻域的圖像運算算法包,例如頻域低通濾波器、頻域高通濾波器算法包。用戶通過算子輕松調(diào)用復雜的算法包,對圖像進行變換運算。
1.1.1 對數(shù)變換與指數(shù)變換
灰度圖像的對數(shù)變換和指數(shù)變換是典型的非線性變換方法,變換函數(shù)分別如式(1)和式(2)所示,對數(shù)變換方法可以擴張低灰度像素的灰度跨度,壓縮高灰度值像素的灰度跨度,而指數(shù)變換通過設置參數(shù)γ能得到選擇性高灰度值或者低灰度值像素的灰度跨度。

公式(1)中,f0(x,y)是原圖像,g1(x,y)是對數(shù)變換后的圖像。公式(2)中的g2(x,y)是指數(shù)變換后的圖像,γ為伽馬系數(shù),當γ<1時,增大低灰度區(qū)域像素的灰度跨度,當γ>1時,增大高灰度區(qū)域像素的灰度跨度。圖1為對數(shù)變換和指數(shù)變換的示例,對應的灰度直方圖如圖2所示。

圖2 灰度直方圖
1.1.2 頻域高通濾波
圖像的頻域變換方法,需要對原圖像進行傅里葉變換得到圖像的頻譜圖,對頻譜圖進行修改,再通過反傅里葉變換得到空域圖像[4],基于頻域的圖像變換原理示意圖如圖3所示,其中f(x,y)為輸入的原灰度圖像,經(jīng)過傅里葉變換后得到F(u,v),經(jīng)過高通濾波器得到圖像G(u,v),再經(jīng)過反傅里葉變換,得到圖像g(x,y)。由于空域圖像輪廓部分對應于頻域圖像的高頻部分,為了突顯空域圖像的輪廓線,將高通濾波傳遞函數(shù)作用于頻譜圖,再將經(jīng)過高通濾波處理后的頻譜圖還原到空域空間。示例如圖4所示,對圖1(d)的圖片進行頻域高通濾波處理。

圖1 對數(shù)變換和指數(shù)變換示例

圖3 基于頻域的圖像變換原理示意圖

圖4 頻域高通濾波示例
目標提取與字符分割是光學字符識別的重要步驟,主要應用輪廓提取、閾值分割、區(qū)域生長等圖像分割方法。閾值分割是設置灰度閾值將灰度圖像進行區(qū)域分割[5-6],這種方法適用于目標區(qū)域和背景區(qū)域的灰度值都分布比較均勻的情況。如果背景區(qū)域復雜,存在的干擾區(qū)域很多,則不適合使用閾值分割方法。如果目標區(qū)域的輪廓有明顯的特征,如車牌架的輪廓具有邊緣灰度值相近且矩形度較高的特征,可以通過輪廓線特征來分割圖像,提取目標區(qū)域。當提取了目標區(qū)域,減少了背景區(qū)域的干擾后,可以結(jié)合閾值分割法來提取最終的目標區(qū)域[7-8]。對圖4(d)的車牌號碼圖像進行目標提取與字符分割,結(jié)果如圖5所示。

圖5 對圖4(d)進行目標提取與字符分割的結(jié)果
HALCON平臺針對工業(yè)文本、文檔文本、證件文本、點打印文本和手寫文本中的大寫字母和數(shù)字識別[6],提供了的二十多個分類器模板供用戶選擇使用,也提供了開放結(jié)構(gòu)的分類器,如BOX分類器、神經(jīng)網(wǎng)絡分類器、支持向量機分類器等。用戶可以使用開放結(jié)構(gòu)的分類器,通過添加樣本及訓練分類器,能快速開發(fā)識別字母、數(shù)字、中文、日文、德文等文字的光學字符識別系統(tǒng)。基于HALCON平臺提供的OCR訓練器光學字符識別流程如圖6所示。

圖6 基于HALCON平臺OCR訓練器字符識別流程圖
HALCON平臺提供了多種文本字體的OCR分類器模板,供用戶直接使用,能識別多種字體的大寫字母和數(shù)字及手寫數(shù)字,操作方便,有助于快速開發(fā)光學字符識別產(chǎn)品。HALCON也提供了開放式結(jié)構(gòu)的分類器,具有適用范圍廣、二次開發(fā)效率高的優(yōu)點。分類器訓練流程如圖7所示。在HALCON平臺創(chuàng)建的開放式分類器模板,需要經(jīng)過訓練集的訓練,從訓練集中計算字符的特征向量,訓練集是由大量的字符樣本組成。HALCON平臺的字庫提供了簡體中文、繁體中文、希臘文字、日本文字等文字,可以直接在字庫選取字符作為樣本,也可以從圖像上提取樣本,建立的樣本集盡可能代表實際應用中可能出現(xiàn)的情況,有助于提高識別系統(tǒng)的識別精度,缺點是其工作量大。實際上,字符訓練集還應該存在噪音干擾、筆畫尺寸、形狀發(fā)生畸變等情況,HALCON平臺提供的OCR助手具有生成變形樣本字符的功能,減少了制作樣本集的工作量,非常有助于快速開發(fā)光學字符識別系統(tǒng)。

圖7 分類器訓練流程圖
HALCON提供了成熟的光學字符識別系統(tǒng)開發(fā)平臺,具有功能強大、節(jié)約開發(fā)成本及操作簡單的優(yōu)點。HALCON提供的光學字符識別分類器模板對部分打印字體大寫字母和數(shù)字具有較高的識別準確度,提供的OCR助手有助于快速制作樣本訓練集文件,提供的開放式光學字符分類器有助于用戶快速開發(fā)光學字符識別系統(tǒng)。