999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

模糊圖像中的文字信息定位與識別

2019-06-11 11:23:50張偉偉
現代職業(yè)教育·中職中專 2019年2期

張偉偉

[摘? ? ? ? ? ?要]? 基于圖像處理與字符識別技術設計并開發(fā)了一個對模糊圖像中文字信息進行定位與識別的系統(tǒng),系統(tǒng)先對讀入圖像進行灰度化、二值化、濾波、細化等預處理操作,得到含有文字信息的清晰圖像,然后進行字符識別,包括字符定位與分割、字符歸一化處理、字符特征提取、字符匹配識別處理四步。系統(tǒng)采用VC6.0實現人機交互界面友好,通過實驗驗證系統(tǒng)能夠定位和識別出包含純數字或純漢字的圖片,包含各類字符的車牌圖片中的文字信息。

[關? ? 鍵? ?詞]? 圖像處理;字符識別;特征提取

[中圖分類號]? TP391.41? ? ? ? ? ? ? ? ? ?[文獻標志碼]? A? ? ? ? ? ? ? ? ? ? ? [文章編號]? 2096-0603(2019)05-0140-02

社會發(fā)展進入信息時代,以圖像為主的多媒體信息迅速成為重要的信息傳遞媒介,圖像中的文字信息包含豐富的高層語義信息,提取出這些文字,對圖像高層次語義的理解、索引和檢索非常有幫助。圖形圖像文字識別技術早有應用,如對掃描圖片進行OCR(光學字符識別)將包含文本的圖像轉化為文本,文字識別技術還可用于單據、車牌、標牌、銀行卡賬號、信封上字符的識別等。目前,國內外學者對基于機器視覺技術的數字識別做了深入的研究。本文旨在基于已有的文字識別技術設計圖像預處理、字符定位、字符分割、特征提取以及字符識別方法,實現對模糊彩色圖像中印刷體文字(漢字、英文字符)的識別。

論文組織結構如下:第2節(jié)介紹本文采用的圖像預處理方法,第3節(jié)基于本文需求提出一個簡潔有效的字符定位、分割和識別算法,第4節(jié)給出實驗測試結果,最后總結全文。

一、圖像預處理

在對圖像中的文字進行識別之前,首先要對圖像進行預處理,本文的預處理過程為:輸入圖片→灰度化處理→二值化處理→濾波去除噪聲點→細化處理。

(一)灰度化

設原始圖像為BMP(bit map的縮寫)文件,其余格式的可以轉化為BMP格式。BMP是Windows本身可以直接提供讀取支持的位圖文件格式。BMP文件可用每像素1、4、8、16或24位來編碼顏色信息,這個位數稱作圖像的顏色深度,它決定了圖像所含的最大顏色數。根據BMP文件格式可以提取出圖像中每個像素的顏色值,對彩色圖像,每個像素顏色由紅綠藍(R、G、B)3個分量表示,所以能顯示出各種顏色?;叶葓D像沒有這些顏色差異,有的只是亮度上的不同,灰度值大的像素點比較亮(像素值最大為255,為白色),反之比較暗(像素值最小為0,為黑色)。

灰度化處理就是對RGB圖像進行加權求和,得到一個灰度值。本文采用式(1)計算灰度值。定義1基于RGB的灰度值定義為:

灰度值 = 0.299 * Red + 0.587 * Green + 0.114 * Blue + 0.5(1)

(二)二值化

為了更加便利地進行后續(xù)的圖像處理操作,還需要對已經得到的灰度圖像進行二值化處理。圖像的二值化,即根據一定的標準把圖像中的像素分成兩種顏色。本文根據像素的灰度值將圖像處理成黑白兩色。

對含有字符的圖像(如車牌),前景色為字符的顏色,背景像素個數顯然是大于前景像素的個數。所以,可以設置像素個數少的顏色為規(guī)定的前景色,像素個數多的顏色為規(guī)定的背景色。我們采用自適應閾值法,先計算圖像整體灰度的平均值,然后將此平均值作為閾值。如果灰度值大于閾值的像素數多于低于閾值的,則將灰度值大于閾值的像素設為背景色,低于閾值的設為前景色。如果灰度值大于閾值的像素數少于低于閾值的,則將灰度值低于閾值的像素設為背景色,高于閾值的設為前景色。

(三)濾波處理

采用去除雜點的方法進行去噪聲處理。掃描整個圖像,當發(fā)現一個前景色點的時候,就考察并計算和該前景色點間接或者直接相連的前景色點的個數,如果個數小于特定的值,那就說明該點是離散點,將其去掉(變成背景色點)。我們用遞歸調用法考察相連的前景色點。

(四)細化處理

由于需要處理的圖像大多是從印刷出版物上掃描來的或是對印刷文字進行拍照得到的,所以在很多情況下字符會有些模糊,對字符識別造成一定的困難??梢詫D像進行銳化處理,使模糊的圖像清晰。

本文采用Hilditch算法,該算法通過判斷去掉圖像中是邊界點而不是連通點的像素點。對一個矩形區(qū)域,從左上角開始到右下角,每次掃描可以將矩形最外面一層剔去,層層剝離后,最終只剩下最中間的細化圖像。

二、字符識別算法

(一)字符定位與分割處理

本文通過水平方向和垂直方向的投影定位和分割圖像中包含的字符。理論上,水平投影、垂直投影后,所以可以對空白處進行行和列的分割。不過實際應用中還有很多細節(jié)需要考慮,例如左右結構的漢字經過垂直方向的投影,可能被分成兩個甚至三個部分,另外漢字和英文字符混合時實現正確的分割就更為復雜。對于圖像矩陣,從上到下逐行掃描,先設置狀態(tài)為未發(fā)現文字。

Step1:狀態(tài)為未發(fā)現文字且未到圖像末尾時循環(huán)做:如果當前行的前景色像素數為0,則設置該行為一行文字的開始,然后繼續(xù)往下掃描,如果當前行的前景色像素數大于0,則設置狀態(tài)為已發(fā)現文字。

Step2:狀態(tài)為已發(fā)現文字且未到圖像末尾時循環(huán)做:如果當前行的前景色像素數大于0,則繼續(xù)往下掃描,如果當前行的前景色像素數為0,則設置該行為一行文字的結束行,將包含一行文字的數據重新存放在一個數組中,再對這一行文字進行列分割得到一個個漢字或英文字符,之后再進行字符識別,然后將狀態(tài)設為未發(fā)現文字。重復上述兩步。

字符分割復雜之處在于區(qū)分左右結構的漢字和英文字符。自適應的通過列分割提取出一個個文字(字符)分為兩步:

Step1:在分割了行之后,進行一次垂直方向投影,基于投影中的空隙分離出一個個“疑似字符”,計算每個疑似字符的投影寬度,以及疑似字符與疑似字符之間的空隙寬度;從大到小排列空隙寬度,得到空隙寬度中位數,記為gm;漢字是方塊字,從大到小排列疑似字符的投影寬度,取最大的漢字寬度,記為wb。

Step2:使用寬度>=gm的空隙分割一行文字得到若干塊;對其中的某塊ch(左右不含空隙),如果它僅包含一個疑似字符,那么若其寬度接近于wb,則判斷ch為一個漢字否則是一個英文字符;如果ch包含若干疑似字符,那么若其寬度接近于wb,則判斷ch為一個漢字,否ch則若寬度小于wb,則進一步分割成若干英文字符,否則,也即ch寬度大于wb,則用ch中最大空隙將ch分成兩部分,再按照上面方法判斷塊所包含的字符。

(二)字符歸一化處理

首先,可以通過預先設定一個參數進行字符的歸一化處理,即對已經分割好的字符圖片進行放大和縮小,但是處理后會使較大的字符圖像損失較多的信息。因此本文在字符分割之后對字符的大小求一次平均,將圖片歸一化為平均字符大小,以降低字符圖片信息的損失。

計算出歸一化需要的平均字符大小后,對字符圖像用插值法進行放大或縮小。由原字符圖像的寬和高與平均的寬和高,得出要變換的系數,把新圖像里的點按插值法映射到原圖像中,生成新圖像。

(三)字符特征提取

特征提取的方法是自左向右對圖像進行逐列的掃描,統(tǒng)計每列的前景色像素的個數,然后自上而下逐行掃描,統(tǒng)計每行的前景色像素的個數,將統(tǒng)計結果作為字符的特征向量。

我們決定采用一種基于投影歸一化的字符特征提取方法,從行投影到列投影,再加上兩個方向的斜投影,通過歸一化處理將投影統(tǒng)計向量轉化成與字庫中相同的特征向量。

(四)字符識別處理

在字庫中存儲的是每一個字符(包括漢字)的特征向量,一個特征向量對應一個字符,將提取出的待識別字符的特征向量和字庫中字符的進行匹配,搜尋和這個特征向量最接近的字符,也就是采用歐氏距離判別法將距離最相近的字符作為匹配結果。

定義2設待識別字符的特征向量為xf1,xf2,...,xfn,字庫中字符的特征向量記為xh1,xh2,...,xhn,這個字符和字庫中字符之間的距離定義為:

三、實驗測試

本文使用VC6.0的MFC設計實現了簡易的人機交互界面,如圖所示,靠人工輸入待識別圖片。用戶通過點擊預處理,版面分析,字符識別后得到識別結果。

識別軟件可以自動尋找圖片上需識別字符的位置,對含有有效信息字符的區(qū)域進行特征分析(其余部分不再分析)。同時,將區(qū)域中每個字符的特征和字庫中各字符的特征進行對比,選擇與其最相近的字符作為識別結果。程序轉化速度快,內容較準確,結果可以以字符形式顯示在對話框中。

四、總結

本文基于圖像處理與字符識別的相關技術,能夠對圖片上相應的文字進行分割選取并轉化成為文本;能夠識別多種信息類型(如身份證號、車牌號、敏感文字)文字,識別、轉化速度快;使用C++編程,容易改寫為C代碼,方便移植到某些硬件平臺上(如DSP);可以對現有字庫進行特定場合的修改,提高識別速度和效率,減小程序的存儲空間。

本文的設計可以用于網絡圖像中敏感文字的識別(通過字符識別及字符串搜索匹配)與刪除。在物流應用中可以識別身份證復印件上的身份證號碼、電話號碼和快遞單號等,從而幫助快遞員更快更準確地簽發(fā)快遞;在交通管理應用中可以識別車牌號碼,快捷有效地對違章車輛進行處理。

參考文獻:

[1]郭爽.數碼管數字儀表自動識別方法的研究[J].通信技術,2012,45(8):91-93.

[2]李素萍.基于圖像處理的數字儀表識別技術[J].機電一體化,2013,19(6):84-86,90.

[3]魏武,黃心漢.基于模板匹配和神經網絡的車牌字符識別方法[J].模式識別與人工智能,2001,14(1):123-126.

[4]楊枝靈,王開.數字圖像獲取、處理及實踐應用[M].人民郵電出版社,2003.

[5]何斌,馬天予,王運堅,等.VisualC++數字圖像處理[M].北京:人民郵電出版社,2002:465-471.

[6]沈庭芝,方子文.數字圖像處理及模式識別[M].北京:北京理工大學出版社,1998:169-170.

編輯 陳鮮艷

主站蜘蛛池模板: 欧美亚洲日韩不卡在线在线观看| 国产高清无码第一十页在线观看| 亚洲一区色| 国产精品专区第1页| 国产裸舞福利在线视频合集| 亚洲经典在线中文字幕| 成人韩免费网站| 波多野结衣AV无码久久一区| 亚洲91在线精品| 影音先锋丝袜制服| 免费毛片全部不收费的| 99久久免费精品特色大片| 国产又色又刺激高潮免费看| 欧美成人免费一区在线播放| 久草热视频在线| 亚洲爱婷婷色69堂| 亚洲成人77777| 精品视频一区在线观看| 国产成人综合在线视频| 国产精品一区在线麻豆| 成人一级免费视频| 国产在线第二页| 91亚洲免费视频| 国产香蕉在线| 久久精品国产精品一区二区| 国产噜噜噜| 欧美激情网址| 欧美色视频网站| 日韩天堂在线观看| 欧美三级自拍| 成人免费网站在线观看| 九月婷婷亚洲综合在线| 欧美亚洲国产精品第一页| 看看一级毛片| 国产尤物视频网址导航| 亚洲av综合网| 青青草国产精品久久久久| 99精品热视频这里只有精品7| 97国产精品视频人人做人人爱| 露脸真实国语乱在线观看| 国产成人一二三| 亚洲国产精品成人久久综合影院| a级毛片免费播放| 久久久久久久久18禁秘| 国产一级毛片在线| 四虎成人精品| 亚洲av日韩av制服丝袜| 男女男免费视频网站国产| 91外围女在线观看| 欧美不卡视频在线观看| 91视频首页| 国产精品网址你懂的| 中文字幕av一区二区三区欲色| 国产精品三级专区| 国产精品亚洲天堂| 无码AV日韩一二三区| 97在线视频免费观看| 天天综合天天综合| 成人无码一区二区三区视频在线观看| www.亚洲天堂| 国产一级毛片高清完整视频版| 成年午夜精品久久精品| 91亚洲影院| 中文无码精品a∨在线观看| 蝌蚪国产精品视频第一页| 亚洲一区二区在线无码| 亚洲精品午夜天堂网页| 九色免费视频| 国产视频自拍一区| 日韩色图在线观看| 国产高清无码麻豆精品| 久久综合色视频| 亚洲天堂.com| 九九视频在线免费观看| 男人天堂亚洲天堂| 国产区91| 91色国产在线| 无码一区18禁| 无码国内精品人妻少妇蜜桃视频| 久久久受www免费人成| 国产一区二区三区在线观看视频| 婷婷亚洲最大|