999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于圖像信噪比自適應閾值模型的秦簡文字圖像二值化算法

2023-05-19 12:59:24汪政陽夏蓉陳明陳炳權

汪政陽,夏蓉,陳明,陳炳權

(吉首大學 通信與電子工程學院,湖南 吉首 416000)

在文本圖像的文字識別過程中,二值化算法的優劣,不僅能驗證預處理前期步驟中圖像增強降噪的效果,也為后續的檢測識別打下基礎,因此文本圖像二值化算法研究已成為當前人工智能研究領域的經典問題之一。秦簡文字在保存中難免會遭到人為或非人為的損壞,其圖像的質量不容樂觀,存在諸如噪聲復雜、字跡模糊、簡牘殘缺等質量不均衡現象,這給秦簡文字圖像PSNR值和二值化精確率的提升帶來諸多挑戰,直接影響秦簡文字檢測識別的準確率與速度。

數字圖像二值化算法通常分為全局與局部兩大方法,其中全局二值化算法主要包括OTSU算法,局部二值化算法主要包括Bernsen算法和Niblack算法。一般情況下,局部二值化算法的精確率要高于全局二值化算法。OTSU算法[1]采用基于聚類的思想,根據圖像總的像素點數在全局范圍內實現閾值的最優化計算,使其計算出的二值化閾值可以達到類之間的方差最大化。Bernsen算法[2]在光照欠均衡與噪聲點較多的圖像上的表現效果優于OTSU算法,其算法步驟是首先設置2個默認參數值,其次計算圖中以某一像素點值P為中心,窗口大小設置為k×k的像素參數值,并與預先設置的2個默認參數值進行比較,以數值大小判定選取該像素點處的灰度值。Niblack算法[3]的優勢在于能夠很好地處理光照不均或噪聲點復雜的圖像,使得分割出的字符輪廓和細節可以最大程度得以保留,但缺點在于容易產生偽噪聲,且偽噪聲過度依賴于滑動窗口的大小,過小的窗口便會產生偽噪聲。Sauvola算法[4]是在Niblack算法基礎上進行的改進,將其像素點鄰域內點的均值作為計算標準,輔以局部標準差再對其進行調整,這樣便可以處理掉圖像背景中的噪聲點,但在處理低信噪比圖像時其效果不佳。

國內有關秦簡文字諸如二值化、文本檢測與識別等方面的數字化研究還處于起步階段。陶珩等[5]提出了針對秦簡文字圖像的數字化檢測技術,利用最穩定極值區域算法和非極大值抑制算法來檢測秦簡文字,但在秦簡文字二值化處理方法上并未做深入研究。參照其他古籍圖像與少數民族文字圖像的二值化方法,Lu等[6]提出了基于背景估計和筆畫寬度估計的二值化算法,首先選用一維的迭代高斯濾波算法估計古籍文檔圖像背景,然后利用估計出的背景對不同情況的退化古籍文檔做相應地補償處理,最后根據圖像的像素點平均值與筆畫結果進行二值化處理。熊煒等[7]針對存在墨跡類噪聲點的文檔圖像提出了一種融合背景估計與能量函數的二值化算法,能夠有效地處理文檔中的噪聲點,性能指標均優于OTSU等經典二值化算法。馮炎[8]提出了基于局部對比度和相位保持降噪的古籍圖像二值化算法,在對古籍圖像的局部對比度進行構建時,采用對局部像素值的最大值與最小值做歸一化處理方法;在降噪處理上選用相位信息降噪,得到較好的估計結果;在上述基礎上對古籍圖像做增強處理后得到二值化結果。Howe[9]提出了一種基于拉普拉斯圖像的全局能量函數最優化二值化算法,該方法使用預先訓練好的圖像去選定目標函數,使其圖像二值化結果的精確率較高。但該算法的魯棒性不理想,特別是對于噪聲點嚴重的低信噪比圖像,其二值化仿真結果不理想。

目前大多二值化算法局限于清晰古籍類文字圖像,在解決背景復雜且噪聲點多的秦簡文字圖像時還未取得實質性進展。為解決秦簡文字圖像背景干擾、噪聲點多的問題,也為提高二值化結果的精確率,本文提出一種改進型的二值化算法,首先對秦簡文字圖像做二值化前的預處理,以提高圖像質量,其次根據圖像信噪比自適應閾值模型將圖像采用不同的二值化算法進行二值化,最后依據圖像質量評估指標選取最優的二值化圖像作為秦簡文字二值化圖像的輸出結果。

1 秦簡文字圖像二值化預處理

為提升秦簡文字二值化效果,特別是其二值化的 PSNR值,本文首先針對秦簡圖像光照背景欠均衡和噪聲點多等問題,提出秦簡文字圖像二值化預處理流程,通過平衡背景亮度和降噪,達到提升圖像質量,為提升秦簡文字二值化效果打下前期基礎。秦簡文字圖像處理流程如下:

1)將秦簡文本圖像轉化為灰度圖像;

2)獲取圖像的平均灰度值,判斷圖像的背景亮度,并通過自適應伽馬變換調節圖像背景亮度,使其不會過度灰暗或過度曝光;

3)利用非局部均值濾波算法在保留圖像邊緣細節的同時,達到降低圖像噪聲的目的。

1.1 圖像灰度轉換

為提升文本圖像質量,通常將多通道的圖像變為每個像素點僅由一個灰度值表示的單通道圖像。圖像灰度轉換將能夠滿足多通道的RGB圖像轉換為單通道灰度圖像,由于大多數二值化算法都是基于灰度圖像進行操作,所以要將輸入的彩色圖像進行灰度化處理。其轉換公式[10]為

D=R×0.299+G×0.587+B×0.114,

(1)

式中:D表示轉換后的圖像像素的灰度值;R、G、B分別表示原圖像像素中的紅、綠、藍三基色分量。本文采用經典灰度轉換算法,即OpenCV中封裝的cvtColor()函數,實現彩色圖像的灰度化轉換處理。

1.2 自適應伽馬變換

在復雜環境下,由于受到光照強度、自然侵蝕、拍攝角度或人為損壞等因素影響,導致原始秦簡文字圖像會產生各種復雜的背景與噪聲點,使后續秦簡文字圖像二值化的精確率嚴重下降。因此需對秦簡文字圖像進行增強處理,提高圖像的清晰度,凸顯秦簡文字輪廓和細節。本文結合自建的秦簡文字數據集QBS text dataset中的圖像做背景亮度自適應調整處理。

利用伽馬變換調整秦簡文本圖像亮度背景。具體過程:對輸入圖像每一像素點的灰度值做指數變換,使輸出圖像中像素點灰度值與輸入時的灰度值呈非線性關系,變換公式為

S=crγ,

(2)

式中:r為灰度圖像的輸入值,通常取值為[0,1];S為經過伽馬變換后的灰度輸出值;c為灰度調整系數,通常取1;γ為伽馬因子,控制整個變換的調整程度。本文采用自適應方法調整γ值大小,以使最終圖像的亮度背景處于較為均勻的狀態,更適合人眼的觀察范圍和后續降噪處理,自適應調整γ值為

(3)

1.3 非局部均值降噪

非局部均值濾波(nl-means,簡稱NLM)是目前較為主流的降噪技術之一。采用非局部均值濾波降噪后,不僅能夠提升圖像的清晰度,而且能夠有效地保存文本輪廓和細節。

在非局部均值濾波算法中,采用了均方誤差(MSE)作為判定鄰域塊相似度大小的標準,MSE計算公式為

(4)

式中:m,n表示鄰域塊的行列數;A(i,j)為A鄰域塊中的點(i,j)的像素值;B(i,j)為B鄰域塊中的相同位置點的像素值。

NLM的權重根據鄰域塊相似度大小計算而來,相似度越大則權重越大,計算公式為

(5)

式中:sum是整個搜索框內所有領域窗口的MSE之和;σ是高斯系數權值,其值越大則最終的降噪效果越好。得到了每個像素塊的權重,就可以計算出濾波后新的像素值,其計算公式為

(6)

式中:IP為原像素;Iq為新像素。

本文在對NLM降噪參數設置過程中,將目標像素塊的相似半徑設置為2×2,像素塊的搜索區域半徑設置為5×5,高斯函數平滑參數設置為10。經實驗仿真結果分析,運用NLM算法對秦簡文字進行去噪,可以在降噪聲的同時較好地保留秦簡文字區域的筆畫細節。

為了體現出本文所選用的降噪算法的優勢,文中選取了目前經典降噪算法,如中值濾波[11]、高斯濾波[12]、最值濾波[13]等與NLM算法作對比分析。在選取橫向對比降噪能力的評估指標上,本文采用基準指標即峰值信噪比(PSNR)。

從自建的秦簡文字數據集QBS text dataset中,選取了100幅圖像對其采用各個降噪算法進行處理,單獨計算每幅圖像的PSNR值后再對其整體求平均值,根據計算結果橫向比較它們各自降噪能力的高低。降噪性能對比結果見表1。

由表1可知,相較于其他傳統降噪算法,采用非局部均值濾波降噪后的秦簡文本圖像取得了最高的PSNR均值,證明其能夠最大限度降低秦簡文本圖像噪聲,為后續的二值化處理提供較有利的條件。

表1 降噪性能對比

2 改進的二值化算法

2.1 算法基本思想

OTSU算法的特性導致其在噪聲點過多的低信噪比圖像中,會將大量噪聲點判定為需要提取的前景文本區域,且不能對多個目標進行分割處理,在目標與背景大小呈現不均衡比例的情況下,其類間方差的計算結果會表現為多峰直方圖形態,導致算法二值化效果不好。因此對于存在過多噪聲點的秦簡文字圖像需使用其他二值化算法來進行二值化處理。Bernsen算法在光照欠均衡與噪聲點較多的圖像上的表現效果優于OTSU算法。但Bernsen算法也存在一些不足,在處理高信噪比文字圖像時,不能很好地處理噪聲區域,導致文本區域和噪聲區域產生大量黏連,最終顯示出的二值化效果較差。

兩種算法對于秦簡文字圖像二值化處理的仿真對比如圖1所示。圖1(a)為經過預處理后的較清晰圖像的OTSU算法和Bernsen算法的仿真結果,圖1(b)為經過預處理過后仍存在復雜背景與較多噪聲點圖像的算法仿真結果。由圖1可以看出,OTSU算法在處理高質量圖像時的表現效果普遍優于Bernsen算法,而在處理低質量圖像時Bernsen算法的表現效果則普遍較好。

(a)高信噪比圖像仿真結果

因此,本文將OTSU算法與Bernsen算法進行結合,依據圖像信噪比大小設置自適應閾值進行二值化處理,最后按照評價指標表現性能大小選取最佳二值化圖像。

2.2 SNR閾值的確定

在進行秦簡文字圖像信噪比閾值確定的過程中,判定標準有三項:首先能夠將所需文本區域從背景當中提取出來;其次能夠保留更多的文字細節特征;最后能夠定量分析強度。本文所使用的秦簡文字數據集QBS text dataset中的圖像數據以數碼相機拍攝的方式進行收集,因此采用通用相機的信噪比衡量標準進行閾值選取。信噪比與圖像質量關系見表2。

表2 信噪比與圖像質量關系

在數據集QBS text dataset中,將30 dB≤SNR<50 dB的圖像歸為低信噪比圖像,將SNR≥50 dB的圖像歸為高信噪比圖像。因此本文根據實驗要求,再結合數據集中數據與表2對應關系,將算法自適應閾值設定為50 dB來進行仿真測試。

2.3 算法模型

本文算法將OTSU算法與Bernsen算法結合,通過秦簡文字圖像信噪比設定自適應閾值進行二值化處理。算法流程步驟如下:

1)將輸入的秦簡文字圖像依據信噪比進行高、低信噪比圖像判定,將30 dB≤SNR<50 dB的圖像歸為低信噪比圖像,將SNR≥50 dB的圖像歸為高信噪比圖像;

2)對閾值高于50 dB的高信噪比圖像采用OTSU算法進行二值化處理;

3)對閾值位于30 dB≤SNR<50 dB的低信噪比圖像,首先采用Bernsen算法進行二值化處理,并計算圖像的PSNR值、結構相似性(SSIM)值,再與OTSU算法得到的二值化圖像的PSNR值、SSIM值進行對比,選擇評價指標更優的二值化圖像。

其模型流程如圖2所示。

圖2 秦簡文字圖像信噪比自適應閾值模型流程

3 實驗仿真與分析

3.1 秦簡文字數據集QBS text dataset的構建

由于目前并設有統一的針對秦簡單字文字圖像的實驗測試數據集,因此參考孟一飛[14]對于西夏古文字圖像樣本庫的建立步驟,本文完成了秦簡文字圖像樣本庫的制作與建立。秦簡圖像數據主要來源于湖南省文物考古研究所出版的《里耶秦簡壹》《里耶秦簡貳》以及武漢大學出版社出版的《秦簡牘合集》,具體制作方法如下:

1)截取圖片。將書籍中秦簡圖片進行掃描制作電子掃描件,對掃描圖像中的文字區域進行單個截取。

2)按測試要求分類。根據清晰度與測試需求分為模糊樣本庫、低信噪比樣本庫與高信噪比樣本庫。圖片分類標準參照SNR參數值設置,SNR<20 dB歸為模糊樣本,20 dB≤SNR<50 dB歸為低信噪比樣本,SNR≥50 dB歸為高信噪比樣本。最終取得模糊樣本圖18 057幅,低信噪比樣本圖34 569幅,高信噪比樣本圖11 434幅。本文根據測試需求,選取低信噪比樣本庫中部分典型圖片進行實驗。

3)建立圖像-文釋對照關系。為迅速準確地檢索到圖像所對應的出處位置,在圖像文件的命名規則上采取了歸一化處理,格式統一為:“Unearthed landN_page_Num_Num.jpg”,其中Unearthed landN代表該秦簡書籍上所標注的出土地來源,該書籍的頁編號用page_Num表示,在該頁上所截取的字符編號用Num表示。統一了圖像與文釋對照關系后,就可以建立每幅文字圖像與書籍出處的聯系,再按照歸一化后的文件命名便可以迅速準確地找到圖像來源。

4)劃分測試集和驗證集。測試集中的低信噪比樣本圖像共1 200張,驗證集中的低信噪比樣本圖像共計1 000張。

3.2 實驗環境與評估指標

本文采用自建的秦簡文字數據集QBS text dataset作為文本圖像二值化算法的測試和驗證數據,其中所有圖像像素大小均設置為227×227×3,本次實驗中網絡模型基于OpenCV和TensorFlow框架建立,并將網絡模型加載至GPU上進行,服務器顯卡型號為RTX3070。

為對比本文算法與其他算法的優劣性,選取了二值化主流的4種圖像評估方法:精確率(Precision)、F值(F-measure)、峰值信噪比(PSNR)和結構相似性(SSIM)。精確率體現的是二值化結果的精確度,即算法計算結果中文本像素個數與全部像素個數的比值,比值與精確度呈正比關系。F值是一種集中體現圖像二值化處理結果準確率與召回率的評估指標,在與標準圖像對比過程中,可以表達二值化圖像與標準圖像的誤差大小,其值越大,則表示圖像之間的誤差越小。兩者的計算公式分別為:

(7)

(8)

式中:TP、FP和FN分別表示真實的正值、錯誤的正值和錯誤的負值;召回率(Recall)是評估屬于某類別的查全比例,在二值化中體現為正確召回二值化圖像結果類別的比例,具體計算公式為

(9)

峰值信噪比是衡量圖像降噪性能的重要評價指標,其值直接反映二值化算法處理圖像時的性能高低,其具體計算公式為

(10)

式中:l表示位深度,即圖像某像素點可顯示或打印的色彩信息值,一般取l=8;amax表示圖像像素點顏色的最大數值,在位深度為8時,一般amax= 255。

結構相似性是衡量兩幅圖像像素間關系與結構信息相關性的經典評估指標,其取值區間為[0,1],值越大說明二值化圖像的失真度越小,即與基準圖像越相似。其定義式為

(11)

式中:μx,μy分別代表兩幅圖像x,y的像素平均值;σx,σy分別代表x,y的標準差;σxy代表x,y的協方差;c1和c2為常數。

本文實驗選取了文獻[1-4,15-19]9個有代表性的二值化算法與本文算法進行比較。其中Niblack算法根據實驗需求設置像素閾值與其窗口參數、前景像素值為:k=-0.3,w_size=24,wp_val=255,Sauvola算法中設置修正參數與窗口大小為:k=0.1,kernerl=31。

3.3 實驗結果與分析

為體現本文改進后算法優勢,并尋找與其他二值化算法之間的差別,從驗證集中的不同信噪比樣本圖像庫中選取了10張有代表性的實驗圖像,圖3是本文改進后算法與其他算法的仿真結果展示。

圖3 不同二值化算法對比結果

圖3(a)的原始圖像是較為清晰的高信噪比樣本圖與背景復雜或噪聲點較多的低信噪比樣本圖。文獻[1]和文獻[17]算法對于高信噪比的清晰圖像二值化處理效果較好,但對于帶有復雜背景和較多噪聲點的低信噪比圖像處理沒有達到預期效果;文獻[2]和文獻[15]算法在處理高信噪比圖像時會將大量文本區域錯判為污漬區域而覆蓋掉;文獻[4]和文獻[16]算法盡管在一定程度上降低了噪聲,但對于文本區域的黏連效果處理不太理想;文獻[3]、文獻[18]和文獻[19]算法由于算法特性導致對噪聲點敏感,會將大量的噪聲點判定為需要保留的前景文本區域;本文提出的改進后方法在處理有亮度背景不均衡和噪聲點干擾的秦簡文字圖像問題時,相比其他算法有了較好的改善,在一定程度上本文方法取得了相對滿意的結果。

本文方法與其他二值化算法在自建的QBS text dataset數據集中1 000個驗證數據的各項評估指標平均值對比結果見表3。

表3 各二值化算法在QBS text dataset的評估指標平均值

由表3可知,在F-measure、PSNR和Precision的評估結果中,本文方法都達到了相對最優值。在相較于各項評估指標次優的文獻[16]時,本文方法的F-measure、PSNR和Precision分別提高了5.21%、2.15%和6.81%,但在SSIM值的對比算法數據中還未達到最優,與最優的文獻[4]相差0.15,與次優的文獻[1]持平。

4 結束語

本文依托于自建的秦簡文字數據集QBS text dataset,針對其圖像的復雜背景以及多噪聲點,提出了一種改進后專用于對秦簡文字圖像進行二值化處理的算法。首先將圖像進行灰度轉換、調整亮度和降噪等一系列二值化前的預處理,以最大限度提高圖像質量;然后根據圖像的信噪比進行自適應閾值處理,將高信噪比圖像采用OTSU算法進行二值化處理,將低信噪比圖像采用Bernsen算法進行二值化處理;最后根據其二值化后的PSNR與SSIM值的比較,選擇效果最優的二值化圖像。在測試圖像上的仿真結果表明,本文算法所處理的秦簡文字圖像的精確率達到76.67%,F值達到86.81%,PSNR值為25.61 dB,但仍存在以下不足:QBS text dataset中不同類別的字符類型樣本數據不平衡;本方法對于秦簡文字模糊樣本數據的二值化效果不太理想。這些不足將在后續研究中不斷完善。

主站蜘蛛池模板: 国产欧美日韩va另类在线播放| 午夜高清国产拍精品| 91久久大香线蕉| 九九九久久国产精品| 91欧美在线| 麻豆国产在线观看一区二区| 亚洲国产综合自在线另类| 97精品久久久大香线焦| 国产三级国产精品国产普男人 | 大乳丰满人妻中文字幕日本| 亚洲视屏在线观看| 成人在线天堂| 久久黄色影院| 91精品啪在线观看国产| 波多野吉衣一区二区三区av| 亚洲人成高清| YW尤物AV无码国产在线观看| 色婷婷丁香| 亚洲丝袜第一页| 青青草91视频| 亚洲国产亚综合在线区| 国产综合亚洲欧洲区精品无码| 都市激情亚洲综合久久| 亚洲高清资源| 国产综合另类小说色区色噜噜| 综合亚洲色图| 免费毛片a| 女高中生自慰污污网站| 婷婷色中文网| 国产91丝袜| 五月婷婷欧美| 久久久久九九精品影院 | 国产自在线播放| 亚洲天堂久久新| 97精品伊人久久大香线蕉| 久久久黄色片| 久久一日本道色综合久久| 蜜臀av性久久久久蜜臀aⅴ麻豆| 波多野结衣一区二区三区四区视频 | 日本高清在线看免费观看| 四虎国产永久在线观看| 一本无码在线观看| 99福利视频导航| 99热亚洲精品6码| 亚洲中文字幕在线一区播放| 亚洲精品无码不卡在线播放| 亚洲精品国产成人7777| 国产一级毛片高清完整视频版| 日韩第九页| 国产在线日本| 日韩第九页| 为你提供最新久久精品久久综合| 蜜臀AVWWW国产天堂| 国产JIZzJIzz视频全部免费| 亚洲国产欧美中日韩成人综合视频| 国产永久在线观看| 国产超薄肉色丝袜网站| 色综合中文字幕| 国产网站黄| 免费人成网站在线观看欧美| 国产成在线观看免费视频| 五月婷婷综合色| 青青草原国产| 亚洲高清国产拍精品26u| 亚洲一级无毛片无码在线免费视频| 人与鲁专区| 亚洲激情99| 超碰91免费人妻| 亚洲无码视频图片| 亚洲开心婷婷中文字幕| 欧美成人免费一区在线播放| 国产一级妓女av网站| 国产毛片高清一级国语| 在线免费观看AV| 免费啪啪网址| 日韩精品亚洲人旧成在线| 一本无码在线观看| 亚洲区第一页| www.亚洲天堂| 国产网站免费看| 91精选国产大片| 丁香婷婷在线视频|