賀 輝 劉 琨 肖紅玉
(北京師范大學珠海分校信息技術學院 珠海 519085)
?
銀行票據自動裁剪方案設計與控件開發*
賀輝劉琨肖紅玉
(北京師范大學珠海分校信息技術學院珠海519085)
摘要銀行票據圖片采集過程易受到復雜背景干擾和光照不足或不均等不利影響,使得自動、準確、實時裁剪票據的任務很具挑戰性。在票據自動糾偏基礎上,提出了基于圖像自適應二值化的銀行票據自動、快速裁剪策略。將該策略應用到銀行印控儀進行集成測試,不同成像背景和光照環境下的多組數據結果表明本策略在自然光照環境中,能夠很好地抑制背景干擾,準確裁剪票據,而在背景顏色接近票據底色時或存在明顯光斑干擾情況下,依舊能夠獲得正確結果,總體裁剪正確率達到95%,其自適應性和魯棒性明顯優于基于邊緣提取的方法。且改進了快速中值濾波算法,大大降低了濾波處理時間復雜度,可滿足銀行在線處理的實時性需求。
關鍵詞銀行票據; 自動裁剪; 圖像二值化; 灰度直方圖
Class NumberTP391.41
1引言
銀行每天要處理堆積如山的各類票據,在柜臺及時完成票據圖片的采集和遠程存儲可以極大提高工作效率和確保票據的安全性。而為了操作簡便同時提高采集圖片的質量,高清鏡頭成為首選,這使得采集到的圖像文件大,不利于在線上傳和存儲,這就要求在上傳前給圖像文件瘦身,除了高保真度的壓縮處理,另一個關鍵是裁剪掉票據之外的多余圖像部分,此舉也利于對票據的后續處理,如OCR識別等。而操作人員在鏡頭下擺放票據的位置具有一定的隨意性,使得圖像中票據是傾斜的,需要在進行裁剪處理前進行傾斜糾正處理。因此銀行票據裁剪工作完成主要需要進行兩個處理:票據糾偏和票據目標分割。
在圖像糾偏中,直線的檢測算法是準確糾正傾斜票據的前提,目前較成熟的框線檢測算法有基于Hough變換的方法,連通域分析法及其改進方法,交叉點特征法等。這些方法在特定的約束條件下都能取得一定的效果。其中基于Hough變換的方法因為易于實現而被廣泛使用。
圖像分割算法主要可分為閾值分割法[2~3]和基于邊緣檢測的方法[1~2,7,11]以及基于過渡區技術的分割[12]和基于熵、距離等統計量的方法[4,8]和基于圖譜理論、云等理論的方法[9~10]等。從20世紀60年代開始,國內外學者針對圖像閾值分割進行了廣泛深入的研究和大量的實驗,已提出了數十種閾值選取方法[7~8,14],其中基于直方圖信息的閾值分割方法因其算法簡單、穩定、易于實現自動閾值分割而被廣泛的應用在圖像處理中[15],典型的為各種圖像二值化方法。但至今還未能找到一種對所有圖像都能有效分割的閾值選取法[15~16],也尚未見在票據自動裁剪領域的相關應用研究文獻。
本文研究源于企業生產實際需求,所以算法的穩健、快速和普適性是重點考慮的內容。因此,我們在文獻算法研究和改良基礎上,提出了一種基于自適應圖像二值化的高效、可靠的銀行票據自動裁剪策略,并基于Visual Studio平臺完成了相應的控件開發。
2關鍵技術
2.1基于自適應Canny算子和Hough變換的票據糾偏
因為票據放置的隨意性,在進行票據裁剪前首先要對彩色票據圖像進行傾斜校正。我們采用的方法是先將彩色票據圖像灰度化,以減少計算量。然后在灰度圖像上找出票據的最長邊緣線,并求出該邊緣線的傾斜角,再對彩色圖像進行傾斜校正,具體處理:采用自適應Canny算子[16]的高低雙閾值方法進行邊緣檢測,該算子對細節信息與整理輪廓保留較好,能實現效果較好的邊緣檢測,給Hough變換查找偏轉角度,逆旋轉變換糾偏,提供了較高準確度保障;接下來基于Hough變換找到最長邊緣線,確定傾斜角度,進而完成票據糾偏。
2.2基于自適應二值化的票據目標分割
要實現票據的自動裁剪,必須要自動獲取票據的邊界。因為票據目標與背景在灰度上總體存在著差異,可選用灰度值特征來分割這兩個區域類,票據信息的提取可以通過基于灰度統計特征的圖像二值化實現。很明顯,二值化質量的好壞將直接影響后續的裁剪處理,是系統投入實用的最關鍵一環。因此針對本應用,提出基于自適應直方圖閾值二值化的票據目標分割算法。
首先根據票據圖像直方圖特征確定二值分割閾值。如圖1所示,該歸一化直方圖存在明顯多峰的特點,不過票據目標對應的直方圖在右側比較集中,且與其它部分(桌面等背景)分界較明顯,可以通過搜尋圖1中所示分界點t1和t2來確定閾值。

圖1 灰度化票據圖像的直方圖特征
其中t2通常可設為250以避免強光照射的干擾。而t1的值可通過搜索直方圖極小值對應的灰度值來確定。為避免陷入背景直方圖極值,且減少搜索時間,定義灰度搜索窗如下:
w=[wl,wr]
wl=min+(max-min)/2
wr=max-(max-min)/4
(1)
其中,min和max為p(sk)值小于給定常量θ的sk的最左和最右端點灰度值。本文設θ=0.001,因為票據是圖像中的主體目標,剔除小于θ的部分直方圖可以確保搜索窗的有效性。該搜索窗口將隨著灰度圖直方圖的整體分布而自適應滑動,因此在該窗口中檢測到的二值分割閾值(搜索窗極小值對應的灰度值,記為min_pox)有很好的自適應能力。接下來根據min_pox完成糾偏后票據灰度圖二值化,其中票據區域賦值為0。
由于設備本身性能和光照等環境干擾,圖像經常會受到各種噪聲的干擾,導致二值化結果存在噪聲(一般是椒鹽噪聲),會極大的影響到圖像的后續處理。本文在林清華[17]提出的基于直方圖的中值濾波加速算法基礎上,根據濾波對象為二值圖,即像素值只有0和1的特點,將中值濾波簡化為如算法1所示操作,進一步降低了中值濾波處理的時間復雜度。
算法1
void MedianFilter(LPBYTE data,SIZE sz, int size)
{
int width = sz.cx; int height = sz.cy;//寬度、高度
int left_pox = ((int)sqrt(size * 1.0)) / 2;//計算得到濾波窗口半徑,其中size為窗口面積
for(int i = left_pox;i < height - left_pox;i++)//濾波
{ for(int j = left_pox;j < width - left_pox;j++)
{int val_0 = val_255 = 0;
//逐行統計濾波窗口內值為0和255的像素點個數,分別記為val_0和val_255
for(int m = i - left_pox;m < i + left_pox + 1;m++)
{ for(int n = j - left_pox; n < j + left_pox + 1;n++)
{if(val_0 > size /2 || val_255 > size /2 ) break;
}}
if (val_0 > val_255) data[i * width + j] = 0; //data數組保存濾波結果
elsedata[i * width + j] = 255;}}
}
2.3自動確定裁剪框
此處采取了一個簡單有效的處理,即對上小節得到的結果data,分別從左上方開始,逐行掃描值為255的目標點,并統計每行目標點數,最后只保留目標點數不小于最大值一半的行,以進一步排除由于明顯光斑影響產生的一些干擾。接下來求出剩下候選目標區的列坐標最小值y_min和橫坐標最小值x_min,及列坐標最大值y_max和行坐標最大值x_max,從而得到裁剪框的左上角和右下角坐標(x_min,y_min)、(x_max,y_max),標記坐標點,裁剪框確定。以y_min為例描述其搜尋過程如算法2所示。
算法2
for (int i = 0; i < _h; i++) // _h圖像(data)高度
{
go_on = 1;
for (int j = 0; j < _w; j++) //_w圖像(data)寬度
{if (data[i*(owh+nAdjust24)+j] == 0)
{ y_min = i;go_on = 0;break; }
}
if (!go_on) break;
}
3銀行票據自動裁剪控件實現及測試
為驗證本文自動票據裁剪方案的有效性,自主開發了相關控件(開發平臺為Visual Studio 2010,開發語言為C++),具體技術路線如圖2所示。并對50組印控儀采集票據圖像進行了批量裁剪測試,測試程序主界面如圖3所示。

圖2 總體技術路線

圖3 測試程序主界面
首先利用式(2)將彩色圖像轉換成灰度圖,接著完成基于自適應Canny算子和Hough變換的票據糾偏;針對糾偏結果進行基于自適應灰度閾值的圖像二值分割,并對二值化結果進行快速中值濾波處理以剔除孤立干擾噪點,最終通過設定閾值保留特定目標行,進而求解候選目標區左上角和右下角坐標,確定裁剪框。為避免針對在極端成像條件下獲取得圖像的過裁剪導致系統異常,我們設置了裁剪框尺寸的下限值ε,本應用中設為500個像素(考慮到我們擬裁剪的最小目標為身份證圖片)。當裁剪框小于該限值則直接輸出原票據圖像。
gray=r*0.299+g*0.587+b*0.114
(2)
其中gray為轉換后的灰度值,r,g,b分為別原RGB圖像3個通道的像素值。
為了驗證我們方法的優勢,本文同時進行了基于邊緣檢測方法的票據裁剪對比實驗。
3.1數據描述
本研究工作測試數據為印控儀(附帶6個燈泡點陣補光光源)高清照相機采集圖片,2種分辨率,分別為1600×1200和2592×1944。限于篇幅,本文只給出其中典型的6組數據,如圖4所示,其中圖4(a)背景比較均勻而圖4(b)~圖4(f)背景較復雜,且干擾顯著。

圖4 待裁剪票據圖像
3.2結果和分析
實驗結果表明,在背景較均勻的情況下,兩種種裁剪方法都得到了準確的結果,其中基于邊緣檢測的結果有肉眼可辨識的黑邊,見圖5(a),而本文基于圖像自適應二值分割的結果更為精確,無黑邊,見圖5(b);若背景比較復雜,如圖4(b)~圖4(f)所示,鏡頭采集到了除底座和票據之外的干擾,如棕色的地板(見圖4(b)),緣檢測結果會有偽票據邊界,如圖7(a)橢圓所標示,從而裁剪結果不理想,如圖7(b)所示;而接近票據底色的亮灰色的桌子邊緣(見圖4(c))導致基于邊緣檢測方法的裁剪結果將桌面當作了票據保留,結果如圖7(e)所示;而本文自適應閾值二值分割結果有效抑制了干擾的影響,對圖4(b)二值化結果為完整的票據區域,如圖7(c)所示,最終得到了達到應用要求的裁剪結果,如圖7(d)所示圖,對圖4(c)也得到了理想裁剪結果(見圖7(f)。對于圖4(d)~(f)所示票據圖像,要么票據體光照不均,如圖4(d)~(f),將導致票據目標與背景區分度不夠,從而易導致過裁剪,結果如圖7(g)~(k)所示;要么存在明顯光斑干擾,從而易導致欠裁剪,結果如圖7(i)所示。而本文方案依舊得到了理想的裁剪結果,如圖7(h),圖7(j)和圖7(l)所示,證明了本文票據裁剪方案的高魯棒性和實用價值。

圖5 本文方法處理中間結果示例

圖6 不同方法對背景較均勻的票據(圖4(a))裁剪結果
圖5給出了本文裁剪處理的幾個關鍵中間結果示例,從圖中不難看出,中值濾波對于消除孤立早點的有效性;而最終的消除偽目標行的簡單處理則進一步抑制了較強光斑對裁剪結果的不利影響,從而確保了裁剪結果的正確性。
對于必要的中值濾波處理,統計了改進前后中值濾波時間及完成票據裁剪所需的總體時間,如表1所示,表中Data1對應的時間是對分辨率為1600×1200的20張圖片處理時間的平均值,而Data2對應的時間是對分辨率為2592×1944的30張圖片處理時間的平均值。總耗時1和總耗時2分別為濾波改進前后裁剪所需總時間。結果表明改進后的處理時間大大縮短,尤其是對較高分辨率的圖像,處理時間減幅更大,使得實現實時票據裁剪和遠程存儲成為可能。



圖7 不同方法對背景干擾顯著的票據(圖4(b)~(f))裁剪結果

中值濾波改進的中值濾波總耗時1總耗時2Data13.2030000.2190003.4450001.937000Data2315.4450003.438000318.2380005.948000
4結語
本文針對銀行票據自動裁剪應用需求,在票據傾斜糾正研究基礎上,重點提出了一種高效實用的基于直方圖自適應閾值二值分割算法,同時加入對目標點的簡單實用約束,以最大可能降低光照不均對分割結果的不利影響。并進一步改進了中值濾波方法,以確保票據自動裁剪處理的實時性。多組不同成像環境采集的票據圖像裁剪實驗驗證了本文方法的有效性和實用性。特別是對曝光過度或存在明顯光照不均的圖像,依舊可以取得理想的裁剪結果。如何結合基于邊緣檢測的方法,充分發揮基于圖像二值化和邊緣檢測的圖像分割方法的優勢,進一步增強本自動裁剪策略的普適性是我們下一步工作的重點。
參 考 文 獻
[1] Sauvola J, Pietik?inen M. Adaptive document image binarization[J]. Pattern recognition,2000,33(2):225-236.
[2] 韓思奇,王蕾.圖像分割的閾值法綜述[J].系統工程與電子技術,2002,24(6):91-94.
HAN Siqi, WANG Lei. A Survey of Thresholding Methods for Image Segmentation[J]. Systems Engineering and Electronics,2002,24(6):91-94.
[3] 陳果,左洪福.圖像閾值分割的兩種新技術[J].模式識別與人工智能,2002,15(4):468-473.
CHENG Guo, ZUO Hongfu. Two New Techniques Of Image Thersholding, PR&AI,2002,15(4):468-473.
[4] 向日華,王潤生.一種基于高斯混合模型的距離圖像分割算法[J].軟件學報,2003,14(7):1250-1257.
XIANG Rihua, WANG Runsheng. A range image segmentation algorithm based on Gaussian mixture model[J]. Journal of Software,2003,14(7):1250-1257.
[5] 王曉年,馮遠靜,馮祖仁.一種基于主動輪廓模型的蟻群圖像分割算法[J].控制理論與應用,2006,23(4):515-522.
WANG Xiaonian, FENG Yuanjing, FENG Zuren. Ant colony oPtimization with active contour models for image segmentation[J]. Control Theory & Applications,2006,23(4):515-522.
[6] 劉勍,許錄平,馬義德,等.一種超模糊熵ULPCNN圖像自動分割新方法[J].西安電子科技大學學報:自然科學版,2010,37(5):817-824.
LIU Qing, XU Luping, MA Yide, et al. Automated image segmentation using the ULPCNN model with ultra-fuzzy entropy[J]. Joural of Xidian University,2010,37(5):817-824.
[7] 鄭曉曦,嚴俊龍.圖像分割新方法綜述[J].計算機與數字工程,2007,35(8):103-106.
ZHENG Xiaoxi, YAN Junlong. A Survey Of New Image Segmentation Methods[J]. Computer and Digital Engineering,2007,35(8):103-106.
[8] 許新征,丁世飛,史忠植,等.圖像分割的新理論和新方法[J].電子學報,2010,38(S1):76-82.
XU Xinzheng, DING Shifei, SHI Zhongzhi, et al. New Theories and Methods of Image Segmentation[J]. 2010,38(S1):76-82.
[9] 陶文兵,金海.一種新的基于圖譜理論的圖像閾值分割方法[J].計算機學報,2007,30(1):110-119.
TAO Wenbing, JIN Hai. A New Image Thresholding Method Based on Graph Spectral Theory[J]. Chinese Journal of Computers,2007,30(1):110-119.
[10] 李萬臣,葛秘蕾,井志強.基于云理論的圖像分割新方法[J].應用科技,2010,37(3):45-48.
LI Wanchen, GE Milei, JING Zhiqiang. A new method of image segmentation based on cloud theory[J]. Applied Science and Technology,2010,37(3):45-48.
[11] 林強,董平,林嘉宇.圖割方法綜述[J].微處理機,2015(1):35-39.
LIN Qiang, DONG Ping, LIN Jiangyu. A Survey on Graph Cut Techniques,2015(1):35-39.
[12] 章毓晉.圖像分割中基于過渡區技術的統計調查[J].計算機輔助設計與圖形學學報,2015(3):379-387.
ZHANG Yujin. A Survey on Transition Region-Based Techniques for Image Segmentation[J]. Journal of Computer-Aided Design & Computer Graphics,2015(3):379-387.
[13] 陳強,朱立新,夏德深.結合Canny算子的圖像二值化[J].計算機輔助設計與圖形學學報,2005,17(6):1302-1306.
CHEN Qiang, ZHU Lixin, XIA Deshen. Image Binarization Based on Canny’s Operator[J]. Journal of Computer-Aided Design & Computer Graphics,2005,17(6):1302-1306.
[14] 左奇,史忠科.一種抗干擾的圖像分割新方法[J].計算機工程與應用,2002,(21):52-53.
ZUO Qi, SHI Zhongke. A New Method for Denoising Image Segmentation[J]. Computer Engineering and Applications,2002,(21):52-53.
[15] 劉欣欣,李雪,王瓊.基于灰度直方圖的多閾值分割法[J].計算機應用與軟件,2013,30(12):28-30.
LIU Xinxin, LI Xue, WANG Qiong. A Multi-threshold Segmentation Method Based on Gray-scale Histogram[J]. Computer Applications and Software,2013,30(12):28-30.
[16] 李牧,閆繼紅,李戈,等.自適應Canny算子邊緣檢測技術[J].哈爾濱工程大學學報,2007,28(9):1002-1007.
LI Mu, YAN Jihong, LI Ge, et al. Self-adaptive Canny operator edge detection technique[J]. Journal of Harbin Engineering University,2007,28(9):1002-1007.
[17] 林清華,杜民.新型快速中值濾波算法及在醫學圖像中的應用[J].計算機應用研究,2012,29(9):3584-3587.
LIN Qinghua, DU Min. Novel fast median filtering algorithm and its application in medical image[J]. Application Research of Computers,2012,29(9):3584-3587.
收稿日期:2016年1月7日,修回日期:2016年2月19日
基金項目:國家自然科學基金項目(編號:61272364);廣東省自然科學基金-博士啟動項目(編號:2014A030310415);廣東省教育廳科研項目(編號:2013LYM_0102)資助。
作者簡介:賀輝,女,博士,副教授,研究方向:空間信息智能分析與處理。劉琨,女,碩士,副教授,研究方向:物聯網技術。肖紅玉,女,碩士,副教授,研究方向:軟件工程、分布式水文。
中圖分類號TP391.41
DOI:10.3969/j.issn.1672-9722.2016.07.030
Bills Auto-cropping Based on Adaptive Image Binary Representation
HE HuiLIU KunXIAO Hongyu
(College of Information Technology, Beijing Normal University Zhuhai Branch, Zhuhai519085)
AbstractImaging process for bank bills is vulnerable to the adverse effects for complex background interference or lack of illumination or uneven illumination, which makes the task of accurate auto-cropping for bank bills be very challenging in real-time. After automatic correcting of the deflection angle of the bills, a fast auto-cropping strategy based on adaptive image binarization is presented. The policy is applied to the integration testing with the auto-processing device for bank bills, results show that the policy has a good ability for the suppression to background interference and can obatin accurate cropping results in the environment with natural illumination, expecially when the background color is near to the base color of the bill. The overall correct rate is 95%, indicates that the self-adaptability and robustness of the methodology proposed is superior to that of the method based on edge detection. In addition, the median filtering algorithm was improved, which greatly reduced the time complexity, so as to meet the need of the real-time online processing for bank bills.
Key Wordsbank bill, auto-cropping, image binarization, gray histogram