鄭靜+王騰
摘要:本文針對各種印刷和手寫的紙質材料經過掃描儀掃描后形成的結果圖像,甚至是老舊手寫資料的掃描結果圖像或圖像質量不理想的歷史掃描資料,通過對批量圖像的共同特點進行分析,經算法設計,最終實現了對JPG、PDF等在內的多種格式掃描圖像的批量性角度校正、去黑白邊、高壓縮比壓縮和文檔化歸檔處理,且著重介紹了算法的難點及其解決方案。
關鍵詞:傾斜校正;自動裁剪;自適應閾值分割;高壓縮比壓縮
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)28-0217-03
Abstract:in this paper, a variety of printed and handwritten paper materials by scanning the results after the formation of the image, and even history scans of old handwritten data image or image quality is not ideal, by analyzing the common characteristics of batch image, the algorithm design, the final realization of the JPG, including a variety of PDF the bulk of the image format scan angle correction, go to the black and white edge, high compression ratio and document archiving, and emphatically introduces the algorithm of difficulties and solutions.
Key words: tilt correction; automatic clipping; adaptive threshold segmentation; high compression ratio
1 引言
在將紙質文檔通過圖像掃描設備轉換為文本圖像并進一步進行歸檔的過程中,由于人為因素或機械設備誤差的影響,文檔圖像普遍存在圖像質量不理想的狀況,一般包括圖像有黑邊或白邊、某種程度的傾斜、對比度較差等問題;此外,要符合歸檔要求,圖像文件的壓縮格式和圖像大小也必須符合特定的要求。只有將圖像中存在的問題進行修正后再按要求歸檔,才有利于紙質材料的統一保存和歸檔管理,以進一步實現辦公自動化的要求。
我們在掃描文檔時,會遇到的人為因素中,通常包括紙張放置存在傾角或紙張放置不平整的情況,這些人為因素會導致圖像整體明暗不均或使掃描的圖像在邊緣處留有難看的黑邊,另外,紙張大小不恰當也會使掃描的圖像在邊緣處有黑邊或灰邊。這些黑邊或灰邊與紙張的底色反差很大。
目前,絕大多數的掃描儀都帶有內置的圖像處理模塊。掃描儀自帶的內置圖像處理程序將重點放在圖像清晰度的改善上,并不重視圖像的傾斜校正和黑邊等問題,且對圖像最后的格式和壓縮比采用通用算法設計,用戶只能通過菜單選擇圖像文件的保存格式,而無法決定圖像的壓縮比。這樣的內置圖像處理模塊不但無法完全適應辦公自動化對圖像處理的需要,更無法進行大批量圖像的批量化自動處理,無法提高辦公效率。
目前,存在一些流行的掃描優化軟件,即可以先將掃描圖像保存起來,再安裝此類優化軟件,對圖像進行進一步優化。這一類的優化軟件通常可以對掃描圖像進行基本的修正,如旋轉、黑邊補白、裁剪、改變文件格式等。但是,這些軟件中使用的優化方法,都是利用手動輸入參數的操作方法來實現的,這需要使用者先自行觀察圖像中存在的問題,然后點擊相應菜單并輸入自己估算的參數。例如,圖像旋轉校正的角度是由用戶手動輸入的,如果發現結果不理想,再調整參數。這樣的逐張手動處理的方法是無法實現掃描圖像的自動化和批量化處理的。
目前,還存在少數第三方的硬件驅動程序,可以直接優化底片掃描的結果,但是多數沒有實現自動批量處理。
本文在總結上述軟件優缺點的基礎上,提出了一種新的紙質材料掃描圖像自動化批量處理流程。本文將處理過程分為二值化、傾角檢測、旋轉校正、去邊、壓縮等步驟,使每一步都能自動執行并能夠一次性處理批量圖像。在傾角檢測中,利用Radon變換,快速、準確地計算出對應的文本行的方向角,從而得到整個頁面的傾斜角。通常頁面傾斜旋轉校正采用旋轉變換的方法。
2 二值化
由于原始掃描結果圖像一般保存為JPG格式或PDF等格式,且默認保存為真彩色圖像。首先應該對掃描結果圖像進行二值化處理,將其作為黑白圖像來處理,一方面是可以減少后面幾個計算步驟的數據量,另一方面也有利于后續算法的設計和實施。由于后續的裁剪和傾角檢測等操作對二值化要求并不高,經過實驗對比,常用的二值化方法,如Otsu法、全局閾值法等,都能滿足要求,且效果差別不大。在此,可任選一種即可。
3傾角檢測和旋轉校正
由于掃描儀的掃描頭是在特定背景下獲得的掃描結果圖像,掃描圖像經過二值化后,背景部分有可能全部變黑。由于深色背景的影響,傳統的傾斜校正法,如Hough變換法、投影法都不能準確地進行傾角檢測。
本文的解決辦法是采用Radon變換來進行傾角檢測。一條直線沿它的法線方向投影所得的投影最長,而沿與其平行方向投影則所得的投影最短,Radon變換理論就是這樣一種投影理論。用這種方法可以檢測圖像中的直線,例如紙張的邊緣可以形成直線,紙張中的表格中的線條可以形成直線,稿紙中的線條可以形成直線,通過這些直線,可以確定圖像的傾角大小,進而逆向處理,即可對圖像實現旋轉校正。
文本圖像的傾斜校正可分解為傾角檢測和旋轉校正兩個問題,但重點在于傾斜角的檢測。
目前最常用的傾斜角的檢測有基于Hough變換的方法、基于交叉相關性的方法、基于投影特征的方法、基于Fourier變換的方法、基于 K—最近鄰簇的方法等。
Radon變換與計算機視覺中的Hough變換很相似,我們可以利用Radon變換來檢測圖像中的直線的傾斜角度。利用Radon變換檢測直線傾斜角度的具體步驟為:
1) 用edge函數計算圖像的邊緣二值圖像,檢測出原始圖像中的直線;
2) 計算出邊緣圖像的Radon變換,再對每一個像素為1的點進行運算;
3) 檢測出Radon變換矩陣中的峰值,這些峰值對應原始圖像中的直線。
Radon變換矩陣中的這些峰值的列坐標就是與原始圖像中的直線垂直的直線的傾斜角度,所以圖像中直線的傾角為90°減去峰值的列坐標。
得到頁面的傾角之后,便可對文本圖像進行校正。一般的傾角校正算法都采用逆向旋轉的方法來實現,運算量通常較大。本文采用一種圖像快速高精度旋轉算法來簡化旋轉過程。這種方法只需使用浮點運算計算出第一行第一列像素點的逆向位置,其他像素點的定位可通過判別誤差項大小和位置增量來得到,完全消除了傳統方法中雙層循環內大量浮點乘法運算。因一般嵌入式平臺處理器的浮點運算效率較低,該算法在計算逆向映射點位置時采用的增量定位思想,避免了旋轉過程中的大量浮點運算,提高了圖像旋轉的效率。
4 去邊
旋轉校正后的圖像中,仍然沒有解決掉圖像有效部分之外的黑邊或白邊的問題,本文的解決辦法是,鑒于我們對紙張區域以外的區域并不關心,經旋轉后的紙張的上邊緣是基本水平的,所以,我們可以提取出紙張的有效部分,自然可以將紙張外圍的黑邊或白邊裁剪掉。
對于圖像子區的選擇問題,目前還沒有非常有效的解決辦法。其中一種方法是,對于選取的子區根據其內部的連通區特征來判斷是否為紙張所在的子區,這種方法需要對整個紙張所在子區進行連通域分析,耗時較多。另一種方法是,根據紙張子區的梯度圖統計分析來判定是否為紙張內部子區。這種判定方法無法用數學公式準確表達,過多依靠經驗值來判定,準確率較低。以上兩種方法均采用隨機策略來選擇子區,最壞情況下需要遍歷整幅圖像才能找到合適子區,并且隨機方法并不是全圖最優的選取策略。
本文在總結上述算法的基礎上,提出了一種利用黑邊分布特征的新的子區提取方法,通過對圖像矩陣在四個方向上分別遍歷,在遍歷的過程中對圖像中出現的像素值進行概率統計,當非黑邊像素值出現的概率達到一定比例時,認為已不屬于黑邊范圍,可以進行裁剪的動作。同理,對于白邊的處理也采用統計方法。
5 壓縮和歸檔
此時,圖像經過了二值化、旋轉校正、去黑邊等操作,且這些操作都不需要人為輸入參數或手動操作,全部自行判斷執行,圖像效果已基本達到要求。但是此時的圖像仍然是一個以JPG格式保存的、圖像尺寸較大的、數據量也較大的二值圖像,仍然不符合歸檔和長期保存的要求。
歸檔和長期保存時,應對圖像有統一的大小和壓縮格式的要求。首先,應對圖像的大小進行改變,即對圖像按照要求的尺寸進行相應比例的縮小,在縮小圖像的同時,應注意檢查圖像質量的下降情況。其次,應按照要求的格式對進行壓縮。例如,本文中選擇TIFF格式作為圖像文件的最終保存格式,并且在TIFF的眾多壓縮協議中選擇第四組壓縮協議。
那么,以上的描述過程為對一張掃描結果圖像的優化處理過程,在實際的辦公應用中,通常會遇到批量掃描圖像需要優化的情況。例如,對一本書進行掃描,對一批報表進行掃描等。那么,怎樣實現掃描圖像的批量化優化處理呢?
這樣的情況下,我們通常會先將需要掃描的資料原件進行手動批量掃描,在計算機中會將生成的批量掃描圖像保存在特定的文件夾下。之后,工作人員可以對這些圖片進行分類,并存放在某個特定的文件夾中,也可以在一個文件夾下建立多個子文件夾用于存放不同類別的圖像。
在優化程序啟動時,首先彈出對話框,供用戶選擇要處理的批量掃描結果圖像所在的路徑,然后,程序會對該路徑下的各個文件夾依次進行遞歸遍歷,在遍歷的過程中,對圖像依次優化,直到遍歷到該文件夾的最內層,不再有子文件夾時返回,繼續對下一個文件夾進行遞歸優化。在優化的過程中,根據原先的掃描結果圖像保存的樹形目錄結構,建立相似的目錄結構,將優化后的圖像保存在對應的目錄中。這樣,優化后的圖像的分類存放和優化前的分布結構是相同的,工作人員不需要再對優化后的圖像進行分類整理,且查找相應圖片時會更加便捷。
6 結束語
本文最終能夠實現批量掃描圖像的自動閾值化處理、自動旋轉校正和自動剪取、壓縮等功能,最終的結果可以形成高壓縮比的TIFF圖像文件,還可以進一步形成PDF文檔,實現電子化歸檔。
本文對圖文圖像的傾角檢測和旋轉校正進行了討論和研究,提出了一種新的掃描圖像的傾角檢測方法和一種更加快捷簡便的旋轉校正方法。大量實驗結果表明,新的算法簡單實用,計算時間短,具有較好的性能,同時對今后進行掃描圖像的進一步模式識別奠定了良好基礎。
Radon變換算法的抗噪性能較好,并具有較好的抗干擾性和尺度相關性,適合在有噪聲源的環境中使用,但Radon變換法在線段檢測中仍存在不足,有待改進。
參考文獻:
[1] 鄧白云.二維碼圖像傾斜校正中的算法研究綜述[J].工業控制計算機,2016,29(2):77-78.
[2] 曾凡鋒.一種快速文本圖像傾斜校正方法[J].計算機應用與軟件,2015,32(4):181-185.