





摘 要:文中提出了一種新的基于小波特征聚類的圖像二值化方法,它能有效地解決傳統圖像二值化方法受紋理和光照變化干擾較大的問題。文章首先分析了現有圖像二值化方法的優缺點,提出結合小波變換和拉普拉斯-高斯變換來提取紋理特征,將它們作為像素聚類的輸入向量,以達到更好的二值化效果。此外,通過采樣輸入來代替完整的輸入,顯著提升了算法的計算效率,同時也降低了圖像中極端變化區域對整體二值化效果的影響。經過實驗驗證,所提出的方法運行速度較快;在保留原始圖像信息的同時,能較好地處理紋理和光照信息。與參考基準方法相比,該方法峰值信噪比較高,并且視覺效果有顯著的提升。
關鍵詞:圖像二值化;小波濾波器;小波特征聚類;拉普拉斯-高斯濾波器;紋理特征;K-Means聚類
中圖分類號:TP751.1 文獻標識碼:A 文章編號:2095-1302(2025)03-0-04
0 引 言
隨著科技的發展,數字圖像在計算機視覺領域中變得越來越重要,數字圖像的二值化技術也在圖像處理領域得到了廣泛應用[1-2]。圖像二值化是指將彩色或灰度圖像轉化為二值圖像,由此可以簡化后續的圖像處理過程并提高計算效率,同時也有助于提取關鍵信息。目前圖像二值化技術常用于文檔掃描和識別OCR的預處理,機器視覺中基于輪廓和形狀的目標識別預處理,以及對彩色圖像黑白顯示和打印的優化等領域。圖像二值化算法將圖像中的像素值設定為0或255,從而將圖像處理成黑白兩種顏色。由于現實圖像的多樣性,圖像紋理和光照變化會對當前的主要圖像二值化方法產生一定的影響。如果紋理較為復雜,那么在二值化過程中可能會出現更多的誤判,導致一些重要信息被遺漏。如果光照角度和強度發生變化會影響圖像的整體色調和亮度,導致圖像變得過于明亮或過于暗淡,二值化過程中也會導致一些重要的信息丟失。這是關于圖像二值化的一個重要研究問題,而當前主要的圖像二值化算法并不能很好地處理紋理和光照問題。本文旨在提出一種基于小波變換聚類的圖像二值化方法,以消除紋理和光照變化帶來的干擾。這種方法不僅能夠保持二值化的高效性和準確性,還能夠應對復雜場景下的圖像處理需求。通過對算法的實際應用和性能評估,證實了所提出方法的有效性和優越性。
1 相關研究
OSTU算法[3-4]是一種自適應的全局二值化方法,算法的核心思想是在一個由灰度級數組成的直方圖內,對每個灰度級數計算累積概率,動態地確定最佳閾值,這個最佳的閾值使得圖像中的前景和背景有足夠的區分度。OSTU全局二值化能更好地保留圖像的前景信息,且具有較好的視覺效果。
局部自適應閾值OSTU方法[5-6]在全局二值化和局部二值化之間找到了一種平衡。這種方法的主要思路是對于每個像素,計算其相鄰像素的局部OSTU統計特性,然后根據這些特性來確定局部最佳閾值進行二值化處理,局部自適應閾值OSTU方法能夠在保留圖像結構和細節的基礎上提高二值化的準確性。
基于聚類的圖像二值化方法[7-9]將圖像中的像素聚類成兩個類別,每個類別內部像素點的顏色相近,而類和類之間則差異明顯。這種方法的二值化結果受到聚類算法的選擇、算法輸入數據的選擇等因素的影響,且由于聚類算法具有迭代特征,需要較高的計算成本。
基于深度學習的二值化方法[10-11]采用深度神經網絡來對輸入圖像進行自動特征提取和二值化計算,其大多應用于古籍文本圖像、醫學圖像、二值化等較為抽象的領域。除了底層的二值化操作,更多地考慮了語義的知識,比如對文字和物體的識別,對紋理、光照、噪聲等的抑制,在二值化的同時消除了較多的底層信息。這種方法在進行推理前,需要對不同的應用進行不同的數據處理和網絡訓練。
總體來說,當前使用較為普遍的圖像二值化方法包括全局二值化、局部二值化和基于聚類的二值化,這類方法流程簡潔,計算效率高,并且能夠保留較多的底層信息,所以在實際應用中得到了普及。本文還重點關注作為圖像處理底層操作的圖像二值化方法,并以這類方法作為主要參考對象。
2 小波聚類二值化方法
本文提出的二值化方法主要解決了基于聚類的二值化方法聚類不準確和運算效率不高的問題。影響圖像二值化聚類不準確的原因主要有2個:輸入的聚類數據僅包含顏色或灰度信息,不能較好地表示圖像的復雜特征,比如圖像紋理和光照變化;圖像中劇烈變化的部分,如邊緣和角點像素,在聚類時會傾向于單獨分為一類,從而干擾整體的二分類效果。
紋理特征是圖像或視頻中某一片區域的局部結構信息[2,12]。它反映了圖像中物體的材質、形狀、色彩分布等信息,在通常情況下,光照變化也可當作一種特殊的紋理信息。本文采用LoG變換和Gabor變換提取紋理特征。LoG變換可提取圓形區域的特征,其濾波器定義如下:
(1)
LoG濾波器通常有2個參數:半徑R和拉普拉斯算子σ。
小波變換是一種時頻分析方法,它可以將信號在時間和頻率域上進行分析,同時具有良好的局部化能力和多分辨率分析能力,可以提取不同方向的紋理特征。其中Gabor小波在紋理分析中性能優異,所以本文采用Gabor小波來提取不同方向的紋理特征。Gabor小波濾波器的定義如下:
(2)
x′=xcosθ+ysinθ (3)
y′=-xsinθ+ycosθ (4)
式中:γ表示濾波的波長;θ表示Gabor核的傾斜角度;φ表示相位偏移;σ表示高斯函數標準差;λ表示長寬比,即橢圓度。
小波濾波器提取紋理特征通常調節2個參數:角度θ、高斯函數標準差σ,最終形成包含多個濾波器的濾波器集。
本文將小波特征引入像素聚類的輸入向量F,F定義如下:
F=FilterBank(im)
FilterBank=[f1, f2, f3, f4, f5, f6, f7]
f1=1
f2=LoG(R=3, σ=0.5)
f3=LoG(R=5, σ=1.0)
f4=Gabor(θ=pi/2, σ=2.5)
f5=Gabor(θ=0, σ=2.5)
f6=Gabor(θ=pi/4, σ=2.5)
f7=Gabor(θ=-pi/4, σ=2.5)
引入紋理特征后,可對圖像中所有像素的特征向量進行二分類的K-means聚類,從而將圖中像素分為兩類。在這個過程中,為了消除圖像中的劇烈變化部分,如邊緣和角點像素對聚類的干擾,聚類算法的輸入為從圖像的像素中按位置信息隨機采樣N個像素的特征向量,N約等于全部像素個數的1/400。該操作既能將其中的邊緣和角點像素點減少至忽略不計,同時還能大大縮短聚類算法的運算時間。在通過聚類獲得采樣像素的分類信息后,根據其余像素特征向量的相似度,將它們歸類到最相似的采樣像素的分類中。完整算法的偽碼如下:
算法1 :小波聚類二值化算法
輸入:灰度圖G,長度R,寬度C
輸出:二值化圖像B,長度R,寬度C
1:用濾波器集合FilterBank中的濾波器處理灰度圖得到小波特征向量集F;
2:用大小為7×7的均值濾波器對小波特征向量集F進行均值濾波得到平均小波特征向量集H,H的形狀為(R, C, F=7);
3:在H中增加一個將灰度圖G乘10的特征向量集,H的形狀為(R, C, F=8);
4:將三維(R, C, F)向量集H形狀變換為二維(R×C, F)向量集H2;
5:從(R×C, F)大小的二維向量集H2中隨機選取一個(N, F)大小的子集向量集Hn;
6:對向量集Hn進行分類數為2的K-means聚類,得到每個向量的分類號和每個分類的平均灰度值g1、g2;
7:將平均灰度g1和g2求平均得到全局灰度閾值g;
8:在二值圖像B中,將灰度圖G中灰度大于g的像素點位置設為255,否則設為0;
9:輸出二值化結果圖像B。
3 實驗結果和分析
本文將提出的基于小波特征聚類的二值化方法(小波)和標準OSTU方法[3](OSTU)、自適應閾值OSTU方法[5](OSTU+)和基于顏色聚類的二值化方法[7](顏色聚類)進行了比較。其中基于顏色聚類的二值化方法的輸入為RGB彩色圖像,其他3種方法的輸入均為灰度圖。本文采用二值化圖像和原始灰度圖的峰值信噪比PSNR作為二值化的性能指標,峰值信噪比越高,說明二值化保留的有用信息越多,結果更準確。實驗的測試圖片采用伯克利大學的BSDS500數據集,這個公開數據集包含了較為全面的自然圖像,是業界廣泛使用的測試數據集。采用4種算法分別對每幅測試圖片重復運算100次,記錄其運行結果。為保證實驗的公平性,所有算法均采用同一開發語言實現,實驗平臺為3.2 GHz CPU主頻、32 GB內存的臺式機。不同算法的平均信噪比結果見表1。
由表1可以看出,本文提出方法的PSNR均值非常接近OSTU方法且標準差低于OSTU方法,本文方法的PSNR均值高于OSTU+和顏色聚類方法,這說明本文方法的準確度較高且處理結果較穩定。
統計不同算法與OSTU基準算法的信噪比比率的分布,如圖1所示。
對于OSTU+方法,信噪比比率小于1的較多,說明大部分圖片的信噪比低于OSTU基準;對于顏色聚類方法,信噪比比率大多接近1,且比率低于1的圖片多于比率高于1的圖片,說明大部分圖片的信噪比低于或接近OSTU基準;對于本文提出方法,信噪比比率大多接近1,且比率低于1的圖片和比率高于1的圖片數量差異不大,說明大部分圖片的信噪比接近OSTU基準。
為了對二值化處理后的輪廓信息保留程度進行定量的衡量,本文將原圖的輪廓圖與二值化圖像和原圖與二值化圖像的疊加后的Canny邊緣圖進行比較,計算其邊緣檢測的精確度Precision和召回率Recall,實驗結果見表2。
由表2可以看出,對不加處理的原圖邊緣能夠正確檢測到約81.05%(Recall)的正確輪廓,但在其判定的輪廓中只有12.28%(Precision)是正確的。OSTU方法、顏色聚類方法和小波聚類方法的精確度和召回率接近。OSTU+方法召回率較高,精確度較低。本文提出的方法與對比方法相比,在精確度和召回率方面做了較好的平衡,兩者均無明顯劣勢。
為分析本文方法對紋理和光照的處理效果,將本文的方法與OSTU基準方法處理的結果進行比較,選取其中平均差異大于15的分歧圖片進行人工分析,這些分歧圖片的典型處理結果如圖2所示。
由圖2可以看出,本文提出的方法能較好地處理紋理和光照,并且保留了較多的原始圖像信息,視覺效果明顯優于對比方法。OSTU+方法和圖像聚類方法雖然能處理紋理和光照,但效果并不理想。OSTU+方法對原始圖像信息的改動較大,丟失了較多信息;顏色聚類方法對顏色差異敏感,對結構紋理和光照不敏感。18張分歧圖片的處理結果見圖3。由圖3可以看出,本文提出的方法在大多數情況下都能較好地處理紋理和光照,視覺效果顯著優于對比方法。
本文對幾種算法的運行時間進行了統計。在本文實驗中,OSTU方法的運行速度最快,平均0.01 s處理一副圖片;OSTU+方法的運行速度其次,平均0.02 s處理一幅圖片;本文提出的方法平均0.1 s處理一幅圖片;顏色聚類方法平均0.5 s處理一幅圖片。
4 結 語
本文提出了一種基于小波特征聚類的圖像二值化方法,解決了傳統圖像二值化方法無法有效處理紋理和光照變化的問題。文中分析了現有的圖像二值化方法的優缺點,然后基于小波變換和拉普拉斯-高斯變換提取紋理特征,并將它們引入到像素聚類的輸入向量中,有效地抑制了紋理和光照變化對整體二值化效果的影響。此外,本文以采樣輸入代替完整輸入,提高了算法的計算效率,同時降低了圖中劇烈變換區域對整體二值化效果的影響。經過實驗驗證,相較于其他方法,本文方法能夠以較小的計算代價,較好地處理紋理和光照信息,峰值信噪比較高,同時處理結果保留了更多原始圖像的信息,視覺效果得到明顯改善。
注:本文通訊作者為萬長林。
參考文獻
[1] BURGER W, BURGE M J. Digital image processing: an algorithmic introduction [M]. Cham: Springer, 2022.
[2]高玉凱,劉開緒.小波分析在信號處理中的應用[M].北京:電子工業出版社,2018.
[3] OTSU N. A threshold selection method from gray-level histograms [J].IEEE transactions on systems, man, and cybernetics,1979,9(1):62-66.
[4]梁添才,劉建平,羅攀峰.一種改進拉普拉斯能量的文檔圖像二值化方法[J].計算機仿真,2015,32(9):276-280.
[5] BRADLEY D, ROTH G. Adapting thresholding using the integral image [J]. Journal of graphics tools, 2007, 12(2): 13-21.
[6]劉朋遠,田瑞,周媛奉,等.基于自適應混合閾值的智能電表圖像二值化[J].計算機應用與軟件,2023,40(1):210-215.
[7]任建新,張士雄,李昂,等.基于顏色空間模型的稻谷脫殼率檢測方法研究[J].糧食與油脂,2023,36(12):154-157.
[8]唐濤,覃曉,易宗劍,等.基于k中心點聚類的圖像二值化方法[J].計算機科學與探索,2015,9(2):234-241.
[9]李波,覃征,石美紅.利用小波變換和FCM算法進行多特征紋理分割[J].計算機工程,2005,31(24):148-150.
[10]熊煒,王鑫睿,王娟,等.融合背景估計與U-Net的文檔圖像二值化算法[J].計算機應用研究,2020,37(3):896-900.
[11]吳鑫鑫,肖志勇,劉辰.低尺度血管檢測在視網膜血管分割中的應用[J].計算機科學與探索,2020,14(1):171-180.
[12]李亞標,王寶光,李溫溫.基于小波變換的圖像紋理特征提取方法及其應用[J].傳感技術學報,2009,22(9):1308-1311.