張忍



摘要:字符識別技術作為自動化領域的熱門話題,在很多行業都發揮著重要的作用。OCR技術的一般由圖像預處理,字符分割,識別三個主要部分組成。然而,此技術在金屬閥門表面的字符識別的應用還很少。對于金屬閥門而言,表面字符的作用是用來標識閥門型號,序列號等重要信息;在生產過程中,對表面字符的檢測構成其生產制造的重要環節。本文中使用圖像處理和OCR技術相結合的方法,實現了金屬閥門表面的字符識別。首先使用工業相機和光源搭建光學系統來拍攝閥門原圖像。之后對獲取的圖像進行預處理,剔除有字符缺陷的閥門。最后基于卷積神經網絡完成字符識別算法。實驗結果表明,用CNN可以實現字符的高識別率。
關鍵詞:字符識別;光學系統;圖像預處理;CNN
1.光學系統設計
1.1光源設計
輔助光源是機器視覺系統關鍵組成部分之一[7],直接從源頭上影響到輸入圖像的質量。圖像的過暗或過亮都會給處 理及識別帶來很大影響,雖然可以通過圖像增強等方式對其進行改善,但有時原圖的曝光不當會直接導致原始信息的缺失,以及圖像局部過亮或過暗的情況,都很難在圖像處理過程中得以校正。由于金屬表面的反光特性,通常所成的圖像都會存在明暗不均的問題,因此選擇合適的輔助光源是至關重要的一步。輔助光源的作用主要在于使物體表面均勻曝光,從而提升原始圖像的質量。根據光源照射形式的不同,主要可以分為面陣光源、條形光源以及環形光源等,如圖2-1所示。
1.1.1打光效果分析
在進行光學實驗時要考慮金屬閥門自身的特點:
(1)圓柱形物體,字符信息分布在曲面上。
(2)金屬表面反光。
兩種打光方式拍攝的圖像如圖 2-1-1所示。圖中A為條光打光效果;B為平行面光源打光效果。
圖A是條形光在側面打光的方式。因為字符在曲面上,所以才造成了光線反射到相機的強度不一致,在圖像上則呈現出明暗不均。這會對字符識別造成干擾。圖B是采用面光源從閥門的正上方進行打光,光線是以一種平行于物體表面的方式打亮閥門工件的表面。可以看出圖像不會出現明暗不均的問題,并且一個面光源就可以覆蓋整個曲面。實驗結果表明,采用一個面光源從閥門正上方進行打光的方式可以拍攝到均勻性較好的圖像。
1.2光學系統
經觀察閥門表面有12個字符信息,經過分析論證,決定采用3個面陣相機進行圖像的采集。通過對各種打光方式的對比,最終選用一個面光源由上至下進行垂直打光。
2字符識別算法
2.1圖像預處理
通過實驗,發現使用尺寸為3×3的中值濾波器可以有效地去除背景噪聲。不同類型的字符圖像及濾波結果如圖2-1所示。圖1(a)-(c)顯示了:表面劃痕,局部凹坑,表面鋼印,3種字符圖像。在每種情況下,A為原始圖像,B為濾波后的圖像,C為提取到的字符信息。
2.2字符分割
將圖像預處理階段提取到的字符信息先進行二值化等處理,之后通過垂直投影法進行分割。
本文中主要通過改變訓練集的字符數量,測試對識別結果的影響。實驗結果統計如表1:
實驗結果表明,改進的LeNet-5卷積神經網絡手寫數字識別模型,在訓練集數據足夠多的情況下,進行金屬閥門表面的字符識別時可以達到99%的識別率。
參考文獻:
[1]郝輝,哈力木拉提·買買提,喬薩礎拉,等.字符識別研究現狀和發展趨勢計量分析[J].現代電子技術,2018,41(22):154-158.
[2]王文華.淺談 OCR 技術的發展和應用[J].福建電腦,2012,28(6):56+92.
[3]陳利.基于深度學習的車牌識別系統設計[J].計算機技術與發展,2018,28(6):85-89.
[4]王志瑜.基于 OCR 成績單錄入系統的設計與實現[D].吉林大學,2015.
[5]索玉秀.基于 OCR 技術的名片識別方法研究[D].哈爾濱理工大學,2015.