馬歌
摘 要:傾斜的證件圖像不利于識別,為此提出一種基于Canny算子和Radon變換的校正方法。該方法首先使用Canny算子進行證件圖像邊緣檢測,然后利用Radon變換計算出圖像的傾斜角度,最后用雙線性插值算法進行圖像旋轉校正。在Matlab平臺對該方法進行了仿真實驗。實驗結果表明,該方法能夠準確、高效地對證件圖像進行校正。
關鍵詞:證件圖像;Canny;邊緣檢測;Radon變換;傾斜校正
中圖分類號:TP39 文獻標識碼:A
1 引言
由于操作原因,利用掃描儀、相機采集各種證件圖像時難免會出現(xiàn)傾斜的問題,這對后續(xù)進行證件圖像的光學字符識別(OCR),快速自動判別證件圖像上的各欄信息,造成了一定的困難。因此,在對證件圖像進行識別之前,為不影響識別效果,對證件圖像進行傾斜校正預處理就顯得尤為重要。
目前,國內(nèi)外學者已經(jīng)提出了多種圖像傾斜校正的方法。Hough變換作為當前應用比較廣泛的傾斜校正方法,可以直接檢測出圖像中的最長直線,并計算傾斜角度,雖然它具有較好的抗噪性,但是計算量過大,執(zhí)行效率不高,很難適應圖像自動識別的實時要求。
為此,本文提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正的方法。
2 Canny算子原理
圖像的邊緣是圖像的重要特征之一。常用邊緣檢測算子包括Prewitt算子、Sobel算子、Roberts算子、Canny算子和Laplace算子。
John Canny于1986年提出的Canny算子,是常用的一種局部極值邊緣檢測方法。相比傳統(tǒng)的微分算子,Canny算子因具有抗噪性強、檢測精度高、能檢測到真正的弱邊緣的優(yōu)點而被廣泛應用。Canny算子的基本思想是首先使用高斯濾波函數(shù)對圖像進行平滑,再由一階微分的極大值確定邊緣點。二階微分的零交叉點不僅對應著一階導數(shù)的極大值,而且也對應著一階導數(shù)的極小值。
圖像f(x,y)進行高斯濾波后得到
,
其中δ為相應的尺度因子。計算其梯度矢量的幅值和方向為
(1)
(2)
圖像的邊緣點就是在方向上使取得局部極大值的點。
3 Radon變換原理
Radon變換是用來計算圖像在某一指定角度射線方向上投影的變換方法,也就是將圖像在某一方向上做線性積分。
如果將圖像看成一個二維函數(shù)f(x,y),則其投影就是在特定方向上的線性積分,比如f(x,y)在垂直方向上的線性積分就是其在x軸上的投影;f(x,y)在水平方向上的線積分就是其在y軸上的投影。通過這些投影,在對圖像進行模式識別時可用于獲取圖像在指定方向上的突出特性。Radon變換的幾何關系如圖1所示,它是圖像f(x,y)平行于y軸的線積分。
圖像f(x,y) 沿角度θ向x軸投影得到
,則
(3)
其中,
(4)
4 證件圖像傾斜校正
4.1 算法流程
Step1:讀入證件圖像;
Step2:把彩色證件圖像轉換為灰度圖像;圖像邊緣檢測通常處理的為灰度圖像,因此如果獲取的是彩色證件圖像,首先就要進行灰度處理。
Step3:利用Canny算子進行證件圖像邊緣檢測;證件圖像是有明顯的邊界的矩形形狀的圖像,所以檢測出它的邊緣就可以找到最大傾斜角。具體步驟如下:
(1)用高斯濾波器平滑證件圖像;
(2)用一階偏導的有限差分計算梯度的幅值和方向;
(3)對梯度幅值進行非極大值抑制;
(4)用雙閾值算法檢測并連接圖像邊緣。
Step4:用Radon變換計算圖像傾斜角度;
計算傾斜角度時,θ表示校正圖像的Radon變換的角度,θ取值區(qū)間為0°~180°,1°的增量。具體步驟如下:
(1)對邊緣檢測得到的Canny圖像進行radon變換;
(2)計算各個方向的Radon變換數(shù)值;
(3)利用求導和累加,找出變換矩陣中數(shù)值最大的;
(4)它所對應的θ值就表示圖像的最大傾斜角。
Step5:利用雙線性插值算法旋轉得到校正后的證件圖像。
研究表明,雙線性插值算法能處理大多數(shù)圖像旋轉的問題,得到的圖像質量高,紋理較清晰,因此,本方法也采用此算法進行證件圖像的旋轉。通常,坐標原點(0,0)為圖像的基點,但是實際應用中,往往是以圖像中心為基點對圖像進行旋轉。具體步驟如下:
(1)將圖像的坐標系從原點(0,0)平移到圖像中心;
(2)將原始圖像按Radon變換計算出的傾斜角度θ,沿著x軸旋轉角度為90°-θ。
(3)利用雙線性插值法,計算旋轉后圖像的灰度級像素值,將圖像平移回原始坐標原點;
(4)通過對超出圖像邊界的區(qū)域進行取模操作,實現(xiàn)校正前后圖像的尺寸保持一致;
(5)輸出校正后的證件圖像。
4.2 實驗結果分析
本實驗是在MATLAB R2007b平臺下完成的,實驗結果如圖2所示。通過實驗可以看出,拍照得到的一卡通彩色圖像本身是傾斜的,先轉化成灰度圖像,再用Canny算子檢測出了清晰邊緣,通過Radon變換計算出它的傾斜角度為-24°,經(jīng)過雙線性插值算法旋轉后,準確地對圖像進行了校正。
結語
提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正方法。通過實驗可以看出,采用該方法實現(xiàn)簡單,執(zhí)行速度快,能準確地對傾斜彩色證件圖像進行校正,具有較好的使用價值,對今后進一步完成證件圖像識別工作起到了輔助作用。
參考文獻
[1]段瑞玲,李慶祥,李玉和.圖像邊緣檢測方法研究綜述[J].光學技術.2005.31(3):415-419.
[2]袁鳳剛,劉建成.不同插值方法實現(xiàn)數(shù)字圖像旋轉研究[J].軟件導刊.2010.9(4):187-189.
[3]曹佃國,陳浩杰,李鵬.基于Matlab的雙線性插值算法在圖像旋轉中的應用[J].中國印刷與包裝研究.2011.2(4):74-78.endprint
摘 要:傾斜的證件圖像不利于識別,為此提出一種基于Canny算子和Radon變換的校正方法。該方法首先使用Canny算子進行證件圖像邊緣檢測,然后利用Radon變換計算出圖像的傾斜角度,最后用雙線性插值算法進行圖像旋轉校正。在Matlab平臺對該方法進行了仿真實驗。實驗結果表明,該方法能夠準確、高效地對證件圖像進行校正。
關鍵詞:證件圖像;Canny;邊緣檢測;Radon變換;傾斜校正
中圖分類號:TP39 文獻標識碼:A
1 引言
由于操作原因,利用掃描儀、相機采集各種證件圖像時難免會出現(xiàn)傾斜的問題,這對后續(xù)進行證件圖像的光學字符識別(OCR),快速自動判別證件圖像上的各欄信息,造成了一定的困難。因此,在對證件圖像進行識別之前,為不影響識別效果,對證件圖像進行傾斜校正預處理就顯得尤為重要。
目前,國內(nèi)外學者已經(jīng)提出了多種圖像傾斜校正的方法。Hough變換作為當前應用比較廣泛的傾斜校正方法,可以直接檢測出圖像中的最長直線,并計算傾斜角度,雖然它具有較好的抗噪性,但是計算量過大,執(zhí)行效率不高,很難適應圖像自動識別的實時要求。
為此,本文提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正的方法。
2 Canny算子原理
圖像的邊緣是圖像的重要特征之一。常用邊緣檢測算子包括Prewitt算子、Sobel算子、Roberts算子、Canny算子和Laplace算子。
John Canny于1986年提出的Canny算子,是常用的一種局部極值邊緣檢測方法。相比傳統(tǒng)的微分算子,Canny算子因具有抗噪性強、檢測精度高、能檢測到真正的弱邊緣的優(yōu)點而被廣泛應用。Canny算子的基本思想是首先使用高斯濾波函數(shù)對圖像進行平滑,再由一階微分的極大值確定邊緣點。二階微分的零交叉點不僅對應著一階導數(shù)的極大值,而且也對應著一階導數(shù)的極小值。
圖像f(x,y)進行高斯濾波后得到
,
其中δ為相應的尺度因子。計算其梯度矢量的幅值和方向為
(1)
(2)
圖像的邊緣點就是在方向上使取得局部極大值的點。
3 Radon變換原理
Radon變換是用來計算圖像在某一指定角度射線方向上投影的變換方法,也就是將圖像在某一方向上做線性積分。
如果將圖像看成一個二維函數(shù)f(x,y),則其投影就是在特定方向上的線性積分,比如f(x,y)在垂直方向上的線性積分就是其在x軸上的投影;f(x,y)在水平方向上的線積分就是其在y軸上的投影。通過這些投影,在對圖像進行模式識別時可用于獲取圖像在指定方向上的突出特性。Radon變換的幾何關系如圖1所示,它是圖像f(x,y)平行于y軸的線積分。
圖像f(x,y) 沿角度θ向x軸投影得到
,則
(3)
其中,
(4)
4 證件圖像傾斜校正
4.1 算法流程
Step1:讀入證件圖像;
Step2:把彩色證件圖像轉換為灰度圖像;圖像邊緣檢測通常處理的為灰度圖像,因此如果獲取的是彩色證件圖像,首先就要進行灰度處理。
Step3:利用Canny算子進行證件圖像邊緣檢測;證件圖像是有明顯的邊界的矩形形狀的圖像,所以檢測出它的邊緣就可以找到最大傾斜角。具體步驟如下:
(1)用高斯濾波器平滑證件圖像;
(2)用一階偏導的有限差分計算梯度的幅值和方向;
(3)對梯度幅值進行非極大值抑制;
(4)用雙閾值算法檢測并連接圖像邊緣。
Step4:用Radon變換計算圖像傾斜角度;
計算傾斜角度時,θ表示校正圖像的Radon變換的角度,θ取值區(qū)間為0°~180°,1°的增量。具體步驟如下:
(1)對邊緣檢測得到的Canny圖像進行radon變換;
(2)計算各個方向的Radon變換數(shù)值;
(3)利用求導和累加,找出變換矩陣中數(shù)值最大的;
(4)它所對應的θ值就表示圖像的最大傾斜角。
Step5:利用雙線性插值算法旋轉得到校正后的證件圖像。
研究表明,雙線性插值算法能處理大多數(shù)圖像旋轉的問題,得到的圖像質量高,紋理較清晰,因此,本方法也采用此算法進行證件圖像的旋轉。通常,坐標原點(0,0)為圖像的基點,但是實際應用中,往往是以圖像中心為基點對圖像進行旋轉。具體步驟如下:
(1)將圖像的坐標系從原點(0,0)平移到圖像中心;
(2)將原始圖像按Radon變換計算出的傾斜角度θ,沿著x軸旋轉角度為90°-θ。
(3)利用雙線性插值法,計算旋轉后圖像的灰度級像素值,將圖像平移回原始坐標原點;
(4)通過對超出圖像邊界的區(qū)域進行取模操作,實現(xiàn)校正前后圖像的尺寸保持一致;
(5)輸出校正后的證件圖像。
4.2 實驗結果分析
本實驗是在MATLAB R2007b平臺下完成的,實驗結果如圖2所示。通過實驗可以看出,拍照得到的一卡通彩色圖像本身是傾斜的,先轉化成灰度圖像,再用Canny算子檢測出了清晰邊緣,通過Radon變換計算出它的傾斜角度為-24°,經(jīng)過雙線性插值算法旋轉后,準確地對圖像進行了校正。
結語
提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正方法。通過實驗可以看出,采用該方法實現(xiàn)簡單,執(zhí)行速度快,能準確地對傾斜彩色證件圖像進行校正,具有較好的使用價值,對今后進一步完成證件圖像識別工作起到了輔助作用。
參考文獻
[1]段瑞玲,李慶祥,李玉和.圖像邊緣檢測方法研究綜述[J].光學技術.2005.31(3):415-419.
[2]袁鳳剛,劉建成.不同插值方法實現(xiàn)數(shù)字圖像旋轉研究[J].軟件導刊.2010.9(4):187-189.
[3]曹佃國,陳浩杰,李鵬.基于Matlab的雙線性插值算法在圖像旋轉中的應用[J].中國印刷與包裝研究.2011.2(4):74-78.endprint
摘 要:傾斜的證件圖像不利于識別,為此提出一種基于Canny算子和Radon變換的校正方法。該方法首先使用Canny算子進行證件圖像邊緣檢測,然后利用Radon變換計算出圖像的傾斜角度,最后用雙線性插值算法進行圖像旋轉校正。在Matlab平臺對該方法進行了仿真實驗。實驗結果表明,該方法能夠準確、高效地對證件圖像進行校正。
關鍵詞:證件圖像;Canny;邊緣檢測;Radon變換;傾斜校正
中圖分類號:TP39 文獻標識碼:A
1 引言
由于操作原因,利用掃描儀、相機采集各種證件圖像時難免會出現(xiàn)傾斜的問題,這對后續(xù)進行證件圖像的光學字符識別(OCR),快速自動判別證件圖像上的各欄信息,造成了一定的困難。因此,在對證件圖像進行識別之前,為不影響識別效果,對證件圖像進行傾斜校正預處理就顯得尤為重要。
目前,國內(nèi)外學者已經(jīng)提出了多種圖像傾斜校正的方法。Hough變換作為當前應用比較廣泛的傾斜校正方法,可以直接檢測出圖像中的最長直線,并計算傾斜角度,雖然它具有較好的抗噪性,但是計算量過大,執(zhí)行效率不高,很難適應圖像自動識別的實時要求。
為此,本文提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正的方法。
2 Canny算子原理
圖像的邊緣是圖像的重要特征之一。常用邊緣檢測算子包括Prewitt算子、Sobel算子、Roberts算子、Canny算子和Laplace算子。
John Canny于1986年提出的Canny算子,是常用的一種局部極值邊緣檢測方法。相比傳統(tǒng)的微分算子,Canny算子因具有抗噪性強、檢測精度高、能檢測到真正的弱邊緣的優(yōu)點而被廣泛應用。Canny算子的基本思想是首先使用高斯濾波函數(shù)對圖像進行平滑,再由一階微分的極大值確定邊緣點。二階微分的零交叉點不僅對應著一階導數(shù)的極大值,而且也對應著一階導數(shù)的極小值。
圖像f(x,y)進行高斯濾波后得到
,
其中δ為相應的尺度因子。計算其梯度矢量的幅值和方向為
(1)
(2)
圖像的邊緣點就是在方向上使取得局部極大值的點。
3 Radon變換原理
Radon變換是用來計算圖像在某一指定角度射線方向上投影的變換方法,也就是將圖像在某一方向上做線性積分。
如果將圖像看成一個二維函數(shù)f(x,y),則其投影就是在特定方向上的線性積分,比如f(x,y)在垂直方向上的線性積分就是其在x軸上的投影;f(x,y)在水平方向上的線積分就是其在y軸上的投影。通過這些投影,在對圖像進行模式識別時可用于獲取圖像在指定方向上的突出特性。Radon變換的幾何關系如圖1所示,它是圖像f(x,y)平行于y軸的線積分。
圖像f(x,y) 沿角度θ向x軸投影得到
,則
(3)
其中,
(4)
4 證件圖像傾斜校正
4.1 算法流程
Step1:讀入證件圖像;
Step2:把彩色證件圖像轉換為灰度圖像;圖像邊緣檢測通常處理的為灰度圖像,因此如果獲取的是彩色證件圖像,首先就要進行灰度處理。
Step3:利用Canny算子進行證件圖像邊緣檢測;證件圖像是有明顯的邊界的矩形形狀的圖像,所以檢測出它的邊緣就可以找到最大傾斜角。具體步驟如下:
(1)用高斯濾波器平滑證件圖像;
(2)用一階偏導的有限差分計算梯度的幅值和方向;
(3)對梯度幅值進行非極大值抑制;
(4)用雙閾值算法檢測并連接圖像邊緣。
Step4:用Radon變換計算圖像傾斜角度;
計算傾斜角度時,θ表示校正圖像的Radon變換的角度,θ取值區(qū)間為0°~180°,1°的增量。具體步驟如下:
(1)對邊緣檢測得到的Canny圖像進行radon變換;
(2)計算各個方向的Radon變換數(shù)值;
(3)利用求導和累加,找出變換矩陣中數(shù)值最大的;
(4)它所對應的θ值就表示圖像的最大傾斜角。
Step5:利用雙線性插值算法旋轉得到校正后的證件圖像。
研究表明,雙線性插值算法能處理大多數(shù)圖像旋轉的問題,得到的圖像質量高,紋理較清晰,因此,本方法也采用此算法進行證件圖像的旋轉。通常,坐標原點(0,0)為圖像的基點,但是實際應用中,往往是以圖像中心為基點對圖像進行旋轉。具體步驟如下:
(1)將圖像的坐標系從原點(0,0)平移到圖像中心;
(2)將原始圖像按Radon變換計算出的傾斜角度θ,沿著x軸旋轉角度為90°-θ。
(3)利用雙線性插值法,計算旋轉后圖像的灰度級像素值,將圖像平移回原始坐標原點;
(4)通過對超出圖像邊界的區(qū)域進行取模操作,實現(xiàn)校正前后圖像的尺寸保持一致;
(5)輸出校正后的證件圖像。
4.2 實驗結果分析
本實驗是在MATLAB R2007b平臺下完成的,實驗結果如圖2所示。通過實驗可以看出,拍照得到的一卡通彩色圖像本身是傾斜的,先轉化成灰度圖像,再用Canny算子檢測出了清晰邊緣,通過Radon變換計算出它的傾斜角度為-24°,經(jīng)過雙線性插值算法旋轉后,準確地對圖像進行了校正。
結語
提出了一種基于Canny算子和Radon變換的證件圖像傾斜校正方法。通過實驗可以看出,采用該方法實現(xiàn)簡單,執(zhí)行速度快,能準確地對傾斜彩色證件圖像進行校正,具有較好的使用價值,對今后進一步完成證件圖像識別工作起到了輔助作用。
參考文獻
[1]段瑞玲,李慶祥,李玉和.圖像邊緣檢測方法研究綜述[J].光學技術.2005.31(3):415-419.
[2]袁鳳剛,劉建成.不同插值方法實現(xiàn)數(shù)字圖像旋轉研究[J].軟件導刊.2010.9(4):187-189.
[3]曹佃國,陳浩杰,李鵬.基于Matlab的雙線性插值算法在圖像旋轉中的應用[J].中國印刷與包裝研究.2011.2(4):74-78.endprint