陳 煜 李園園
(1、商丘學院 計算機工程系,河南 開封 475006 2、中國聯合網絡通信有限公司開封市分公司,河南 開封 475004)
電子支付的使用范圍和支付方式在不斷增加,并且不斷地沖擊著市面上紙幣的流通量,但是由于人民幣紙幣本身的獨特性和國內當前使用人民幣紙幣群體的特殊性,紙幣仍然在國內占據相當大的支付比例。人民幣在交易和保存的過程中會造成褶皺磨損和污染等等,如果相關機構采用傳統人工的方式對大量的人民幣冠字碼進行識別和統計稍有操作不當往往可能會對紙幣造成二次破損,效率不僅非常低下而且容易出現錯誤,甚至會導致銀行資金周轉困難等問題的發生,鑒于以上因素人工識別紙幣冠字碼的方法幾乎不可能實施。
我們采用對人民幣冠字號碼的追蹤識別定位的方法,建立“錢聯網”更好的掌握其流向。通過識別人民幣冠字號碼,可以實現對人民幣冠字號碼的追蹤,建立人民幣流通管理數據庫。通過數據挖掘和大數據分析技術[1],能夠從宏觀上掌握地區的資金流向,利于宏觀上對市場經濟進行調控。我們主要從圖像采集、圖像預處理、冠字號碼定位、字符分割、字符識別等幾個方面進行詳細的描述對人民幣冠字號碼識別從而實現對人民幣的追蹤過程。
人民幣是中國大陸境內法定的流通貨幣,我們使用的每張紙幣都由兩種類型的字符組成,主要是通過隨機的挑選2 個英文字符和8 個十進制數字隨機的組合生成一系列數字。冠字號碼位于人民幣正面的左下角位置,每張紙幣都有唯一的一系列不重復的字符串組成,由于其本身的獨特性和唯一性,可以用于紙幣的追蹤、管理和鑒偽。識別過程預處理的整體流程圖如圖1 所示。

圖1 人民幣預處理流程圖
人民幣在使用過程中存在不同程度的褶皺、磨損和污染等各種不確定因素造成紙幣的不完整和紙張模糊等,以上不確定因素對人民幣字符串序列的識別與提取會造成不同程度的影響,所以為了減少外界不確定因素的影響我們首先需要相應的處理。其中WR,WG,WB 分別代表R, G, B 的系數。經過大量的數據實驗比對和測試可以得出,當WR=0.30,WG=0.59,WB=0.11 時,即
F(i,j)=0.3R+0.59G+0.11B (1)
時,可以得到最合理的灰度圖像。圖2 為原始圖像,圖3 為灰度處理結果圖。

圖3 為灰度處理圖
為了得到人民幣冠字號碼,我們需要對灰度化處理后的目標區域中的字符串進行作進一步的處理,使復雜的圖片簡單化。我們對圖像進行二值化使目標區域特征明顯化。緊接著對圖像進行邊緣檢測使目標區域從背景當中凸顯出來。邊緣檢測的方法很多通過對不同算法的比對,Roberts 算子是一種利用局部差分算子尋找邊緣的算子,它采用對角線方向相鄰兩像素之差近似梯度幅值檢測邊緣[2]。因此本課題使用了Robert 算子,圖像處理如圖4 所示。

圖4 邊緣檢測效果圖
為了更進一步的對目標區域的識別和有效信息的提取我們對得到的邊緣檢測效果圖像進行相應的腐蝕膨脹處理[3-4]。利用它可以消除小而無意義的部分。其效果圖如圖5 所示。為了減少在處理過程中產生的噪聲將腐蝕膨脹之后的數據進行相應的濾波處理其效果圖如圖6所示。

圖5 腐蝕膨脹后的圖片

圖6 平滑處理
將原圖像預處理后,采用水平垂直雙向投影法,將圖像分別投影到X、Y 坐標軸,然后分別沿X、Y 軸掃描圖像[5]。得到的掃描圖像如圖7 所示。為了得到黑底白字的二進制數據我們對彩色數據進行相應的處理得到的效果圖如圖8 所示。

圖7 冠字號定位圖

圖8 目標字符串
字符的分割與歸一化的流程圖,如圖9 所示。

圖9 字符分割與歸一化流程圖
本文在此基礎上提出了一種基于文本的連續塊的算法,當文本的長度超過設置的臨界點時,可以將其劃分為兩個字符。該系統通過對所分割的文字進行標準化,得到的文字圖像尺寸達到40*20,符合該模板中的文字圖象尺寸。如圖10 所示。

圖10 字符圖像
本系統的模板匹配的字符識別基本過程流程圖如圖11 所示。

圖11 為自動匹配流程圖
在進行了大量的文字辨識和其他文字的比較之后,我們得出了一個結論:“或”是一種更好的識別方式,它可以在模版中找出最接近的字母,并將對應的文字顯示出來。通常情況下,中國貨幣的冠詞編號共有十個,首位為英文,后九個為英文和數字混合組成。本系統的數據模板庫是由26 個大寫字母和10 個數字構成。匹配模板庫如下所示。

首先提取模板庫中的文字,然后將所要辨認的文字與所對應的模板進行比對,最后得出的數字為0,則對應的概率就會更高。將每個相加得到的0 數值的數目保留下來,作為所辨識的結果,并將其存儲到對應的文檔中。在圖12 中顯示了一個字符標識圖。

圖12 為字符識別
本系統的人民幣冠字號碼自動識別是基于MATLAB圖形用戶界面環境(GUI),通過窗口、選單、按鈕、文字說明等對象構成一個美觀的界面,用戶可利用鼠標或鍵盤方便地實現操作。本研究利用GUI 設計了一個友好的界面,實現對人民幣冠字號碼處理,方便直觀,便于用戶操作。在運行界面中,點擊“輸入圖片”按鈕,可以將原始圖片輸入到系統中,再點擊“圖像處理”按鈕,這一系統將依次運行圖像預處理、冠字號定位、字符分割、字符識別四大部分并將其結果在GUI 界面中演示,最后點擊“退出系統”按鈕退出本系統[6]。系統在GUI 界面中演示設計圖和演示結果圖分別如圖13、14 所示。

圖13 演示設計圖

圖14 演示結果圖
該研究主要基于MATLAB 對人民幣冠字號碼號碼序列識別和人民幣的定位綜上所述具備了準確識別冠字號碼的技術,如果將所有驗鈔機進行聯網,就可以追蹤到每張鈔票的蹤跡。冠字號碼的識別和聯網,在反貪、抓逃等方面都能起到難以想象的作用。