999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稀疏編碼和嶺回歸的文本圖像復原算法

2017-11-15 06:12:01王之毅畢篤彥凡遵林張曉瑜
計算機應用 2017年9期
關鍵詞:圖像復原文本

王之毅,畢篤彥,熊 磊,凡遵林,張曉瑜

(1.空軍工程大學 航空航天工程學院,西安 710038; 2.新疆軍區 自動化站,烏魯木齊 830042)(*通信作者電子郵箱1970696669@qq.com)

基于稀疏編碼和嶺回歸的文本圖像復原算法

王之毅1*,畢篤彥1,熊 磊1,凡遵林1,張曉瑜2

(1.空軍工程大學 航空航天工程學院,西安 710038; 2.新疆軍區 自動化站,烏魯木齊 830042)(*通信作者電子郵箱1970696669@qq.com)

為解決現有稀疏編碼方法在文本圖像復原中存在的編碼碼元表述空間有限和計算時間長的問題,提出了一種基于嶺回歸的稀疏編碼文本圖像復原方法。首先,該方法在訓練階段使用樣本圖像塊訓練出用于稀疏表達的字典,并根據樣本圖像塊和編碼碼元之間的歐氏距離對樣本圖像塊進行聚類;其次,在局部流形空間構建低質量文本圖像塊和清晰文本圖像塊之間的嶺回歸,實現對編碼碼元表述空間的局部多線性擴展和快速計算;最后,在測試階段搜索和低質量文本圖像最相近的編碼碼元,計算出近似的清晰文本圖像塊,從而避免計算耗時的低質量文本圖像塊的稀疏編碼。實驗結果表明,所提算法在恢復的圖像質量上相比現有的基于稀疏編碼的算法在峰值信噪比上高0.3~1.1 dB,耗時降低了1~2個數量級,為提高文本圖像復原質量和提升算法運算速度提供了一種解決方案。

文本圖像復原;稀疏編碼;流形空間;嶺回歸;聚類

0 引言

隨著科學技術的進步,獲得圖像和視頻的設備在日常生活中隨處可見,處理圖像和視頻的計算機和移動終端無論是在處理速度還是內存容量上都有了很大的提升,這就催生了光學字符識別(Optical Character Recognition,OCR)、自然場景文本識別、基于文本內容的圖像檢索等一批應用。在自然場景下獲取的含有文本的圖像或者視頻往往因為光照、運動、視角、獲取圖像或者視頻的設備性能等因素的影響導致圖像變形、含有噪聲、運動模糊、分辨率較低,通過掃描舊文件獲得的圖像會有老化、侵蝕、污點等退化現象,有必要對含有文本的圖像進行去除噪聲、消除模糊、超分辨率、消除變形等圖像復原處理。

近年來,文獻[1-4]試圖從不同的角度解決圖像復原的難題,取得了一定的效果。Chiang等[1]統計整理了文本圖像的邊緣信息,融合到該圖像中;該算法對邊緣清晰的圖像效果明顯。Bertalmio等[2]使用基于高階偏微分方程的數字圖像復原算法對圖像受損區域依據邊緣的特點各向異性地向區域內修復,取得了較好的復原效果,但是對含有噪聲、模糊的圖像效果不理想。Thouin等[3]針對單幅文本圖像使用非線性最大化雙峰優化技術,對舊文件中由于老化,油污等產生的退化現象能夠獲得較清晰的圖像。Donaldson等[4]也使用了該技術對文本圖像的分辨率進行增強。

文獻[5-11]是使用稀疏編碼的方法對自然圖像進行復原,該方法基于壓縮感知理論。文獻[12]提出的壓縮感知理論認為由高分辨率圖像經過下采樣得到的低分辨率圖像在一定條件下可以以高概率復原。Sen等[13]利用壓縮感知理論對低分辨率圖像進行超分辨率復原,但自然圖像紋理細節復雜,很難獲得最優的高分辨率圖像。文獻[14-15]將成對的低分辨率圖像和高分辨率圖像以一定的重疊分割成對應的圖像塊,用圖像塊稀疏表示圖像,對高分辨率輸出圖像進行重構,取得了較好的圖像質量,但是算法計算復雜度大。Yang等[16-17]僅利用高分辨率圖像塊訓練字典,降低了該類算法的時間復雜度。

Zeyde等[18]使用最優化方法通過低質量圖像塊訓練出一個稀疏字典,然后通過使低質量圖像塊在低質量圖像塊字典上的稀疏編碼和對應的清晰圖像塊在高分辨率字典上的分解有相同的系數來構建高分辨率字典。對輸入的低質量圖像塊,計算在低質量圖像塊字典上的稀疏編碼,使用該稀疏編碼在在清晰圖像塊字典上構建出近似的清晰圖像塊。該方法利用稀疏編碼計算獲得的少量碼元對整個圖像塊空間進行描述,有效降低了表征空間維數,具有較低的搜索計算復雜度;但同時存在圖像細節損失多,對測試樣本重構計算時間長的缺點。

針對上述問題,本文提出一種碼元嶺回歸方法,利用稀疏編碼獲得的碼元,在每個碼元局部流形空間使用樣本圖像塊構建嶺回歸,從而將整個空間劃分為各個碼元的嶺回歸模型,有效地提高了復原細節,并顯著降低了測試階段的時間復雜度。

1 碼元嶺回歸算法

1.1 稀疏編碼部分

這一步的目的是獲得低質量文本圖像稀疏編碼和字典Db。將每一幅樣本圖像都重疊分割成圖像塊,使用最優化方法對低質量文本圖像塊訓練出一個稀疏字典Db。然后通過使低質量文本圖像塊在該字典上的稀疏表示和對應的清晰圖像塊在相應的字典上的分解有相同的稀疏編碼來構建清晰圖像塊字典Do。訓練低質量圖像塊字典Db的過程可以用式(1)表示:

s.t.‖αk‖0≤L; ?k

(1)

構建好了低質量文本圖像塊字典后,就需要以此為基礎構建清晰文本圖像塊字典,目標是對于清晰文本圖像塊可以通過式(2)得到近似值:

(2)

這樣的清晰文本圖像塊字典需要用以下的優化過程求解來減少恢復出的圖像塊與原始清晰圖像塊之間的誤差:

(3)

Do=PoA+=PoAT(AAT)-1

(4)

1.2 局部碼元回歸

在訓練字典的過程中也將帶噪聲、模糊的圖像塊按照跟字典Db中碼元的歐氏距離進行聚類。由此,字典Db中每個碼元都對應一個帶噪聲、模糊的圖像塊簇。利用帶噪聲、模糊的圖像塊簇和與之對應的清晰圖像簇之間的關系,通過嶺回歸算法訓練出回歸。這個過程可以用式(5)表示:

(5)

這個最優化過程可以得到一個閉合形式的解:

(6)

(7)

完整形式可表示為:

(8)

(9)

1.3 重疊處理

為了消除經過運算得到的近似清晰文本圖像塊邊緣的差異,在訓練階段低質量的文本圖像塊和清晰文本都有重疊,由下式可以得到近似清晰文本圖像:

(10)

1.4 算法步驟

本文算法的步驟可以總結為:

訓練階段(可以離線完成):

步驟5 對每一個低質量文本圖像塊簇和對應的清晰文本圖像塊簇,利用嶺回歸算法,訓練出一個回歸。

測試階段:

2 本文算法實驗結果與分析

正文內容該算法的實驗環境為Inter Core 2 Duo CPU E7200 2.53 GHz,內存4 GB,WIN7 SP1 64位操作系統,仿真軟件為Matlab R2016a。

在字典訓練階段選擇100對樣本圖像,低質量文本圖像由清晰文本圖像經過動感模糊、加噪聲、斷筆處理。圖像塊的大小選取為8×8,從切割好的圖像塊中隨機抽取n(n=5 000 000)塊圖像作為訓練塊,K-SVD的迭代次數設置為60,編碼的稀疏度設置為3,字典碼元數本文中采用1 024,迭代共軛梯度算法的迭代次數設置為50。訓練低質量文本圖像塊字典時正則項的平衡因子設置為0.1,更新迭代次數設置為10。

在訓練回歸階段,利用已經訓練好的字典碼元作為中心,依據歐氏距離對低質量文本圖像塊進行聚類,每一簇的個數是2 048個,使用每一簇中的低質量文本圖像塊和與之對應的清晰文本圖像塊的關系訓練回歸。

在圖像復原質量上除了主觀評價外,還采取了峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)。峰值信噪比和均方誤差(Mean Squared Error, MSE)的關系如式(11)所示:

PSNR=10 lg(2552/MSE);

(11)

在時間復雜度上,采用了算法在測試階段的運行時間。

在本文的實驗中,測試圖像選取10幅不同字體不同字號的低質量文本圖像進行復原,字典采用相同的碼元數量,均為1 024個。將本文實驗結果跟文獻[5]、文獻[14]和文獻[18]方法在復原的圖像質量和時間復雜度上作了比較,實驗結果如表1和圖1所示。其中圖1是從10幅圖中選擇了1幅對復原結果進行了比較。

表1 各種方法對10幅低質量文本圖像復原結果的PSNR和測試階段耗時對比(1 024碼元)

圖1 幾種算法復原圖對比(1 024碼元)

從復原的文本圖像來看,文獻[5]、文獻[14]、文獻[18]的復原圖有偽影,文獻[5]復原圖還有明顯的振鈴現象。這幾種算法對噪聲的消除作用不強,字體與背景的對比不明顯。本文算法能夠有效消除噪聲、偽影,得到比較清楚的圖像;對于降質圖中出現的斷筆現象能夠較好恢復,能從主觀上較好地識別出字符的內容,存在的問題是恢復圖像字符的邊緣不夠清晰。從實驗數據來看,本文算法在恢復文本圖像的質量上更接近原圖(比其他算法高0.3~1.1 dB),在測試階段消耗的時間更短。

以上實驗是將所有算法中訓練的字典碼元數目設定為1 024,本文算法中用于訓練碼元回歸的圖像塊每一簇的個數為2 048,改變參數,會對恢復的文本圖像的質量和算法的運行時間產生影響。圖2、圖3分別顯示了字典碼元數目與恢復的文本圖像質量、測試階段的運行時間的關系。從圖2可以看出本文算法復原圖的質量隨著字典碼元數目的增加逐漸提高,增長速度則逐漸減緩,同時比文中介紹的其他幾種算法有明顯優勢。從圖3可以看出本文算法在測試階段的運行時間比其他幾種算法低一個或者兩個數量級,并且隨著字典碼元數目的增加測試階段的運行時間增加緩慢,而文中介紹的其他幾種算法的運行時間則隨著字典碼元數目的增加變化較快,主要原因是本文算法計算嶺回歸是一種線性運算,求解線性轉換的時間要遠低于求解稀疏編碼所需要的時間。

3 結語

本文針對運動模糊,含有噪聲且有斷筆的低質量文本圖像提出了一種基于碼元嶺回歸的文本圖像復原算法,通過實驗,本文算法對由于模糊,噪聲斷筆等原因退化的低質量文本圖像能夠有效復原,在時間復雜度上有了很大提升。該算法所采取的訓練文本圖像塊以字典碼元為中心進行聚類,更準確地描述了文本圖像塊之間的關系,通過對聚類的文本圖像塊訓練回歸,提升了算法的運算速度。

圖2 字典碼元數目對峰值信噪比的影響

圖3 字典碼元數目對運行時間的影響

References)

[1] CHIANG M C, BOULT T E. Imaging-consistent super-resolution [EB/OL]. [2016- 11- 08]. http://innovation.uccs.edu/~tboult/PAPERS/IUW97-Imaging-Consistent-Super-Resolution-Chiang-Boult.pdf.

[2] BERTALMIO M, SAPIRO G, CASELLES V, et al. Image inpainting [C]// Proceedings of the 27th Annual Conference on Computer Graphics and Interactive Techniques. New York: ACM, 2000: 417-424.

[3] THOUIN P D, CHANG C I. A method for restoration of low-resolution document images [J]. International Journal on Document Analysis and Recognition, 2000, 2(4): 200-210.

[4] DONALDSON K, MYERS G K. Bayesian super-resolution of text in video with a text-specific bimodal prior [J]. International Journal of Document Analysis and Recognition, 2005, 7(2): 159-167.

[5] ZORAN D, WEISS Y. From learning models of natural image patches to whole image restoration [C] // Proceedings of the 2011 International Conference on Computer Vision. Washington, DC: IEEE Computer Society, 2011: 479-486.

[6] CHANTAS G, GALATSANOS N P, MOLINA R, et al. Variational Bayesian image restoration with a product of spatially weighted total variation image priors [J]. IEEE Transactions on Image Processing, 2010, 19(2): 351-362.

[7] 王璐,胡晰遠,彭思龍.基于分塊的空間變化抖動模糊圖像的全局模糊去除[J].計算機輔助設計與圖形學學報,2012,24(6):766-774.(WANG L, HU X Y, PENG S L. Partition-based global deblurring of space-variant shake-blurred image [J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(6): 766-774. )

[8] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(11): 4311-4322.

[9] 陳柘,陳海.基于稀疏表達的圖像去噪方法研究 [J].電子設計工程,2014,22(2):168-170.(CHEN Z,CHEN H. Research on image denoising based on sparse representation [J]. Eletronic Design Engineering, 2014, 22(2): 168-170.)

[10] 姜鵬飛.基于稀疏表示與字典學習的圖像去噪算法研究[D].西安:西安電子科技大學,2011:35-48.(JIANG P F. Image denoising based on sparse representation and dictionary learning [D]. Xi’an: Xidian University, 2011: 35-48.)

[11] 浦劍,張軍平.基于詞典學習和稀疏表示的超分辨率方法[J].模式識別與人工智能,2010,23(3):335-340.(PU J, ZHANG J P. Super-resolution through dictionary learning and sparse representation [J]. Pattern Recognition and Artificial Intelligence, 2010, 23(3): 335-340.)

[12] DONOHO D L. Compressed sensing [J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.

[13] SEN P, DARABI S. Compressive image super-resolution [C]// Proceedings of the 43rd Asilomar Conference on Signals, Systems and Computers. Piscataway, NJ: IEEE, 2009: 1235-1242.

[14] YANG J, WRIGHT J, HUANG T S, et al. Image super-resolution via sparse representation [J]. IEEE Transactions on Image Processing, 2010, 19(11): 2861-2873.

[15] LU J, ZHANG Q, XU Z, et al. Image super-resolution by dictionary concatenation and sparse representation with approximate L0 norm minimization [J]. Computers & Electrical Engineering, 2012, 38(5): 1336-1345.

[16] YANG S, SUN F, WANG M, et al. Novel super resolution restoration of remote sensing images based on compressive sensing and example patches-aided dictionary learning [C]// Proceedings of the 2011 International Workshop on Multi-Platform/Multi-Sensor Remote Sensing and Mapping. Piscataway, NJ: IEEE, 2011: 1-6.

[17] YANG S, WANG M, SUN Y, et al. Compressive sampling based single-image super-resolution reconstruction by dual-sparsity and non-local similarity regularizer [J]. Pattern Recognition Letters, 2012, 33(9): 1049-1059.

[18] ZEYDE R, ELAD M, PROTTER M. On single image scale-up using sparse-representations [C]// Internet Conference on Curves and Surfaces, LNCS 6920. Berlin: Springer, 2010: 711-730.

Textimagerestorationalgorithmbasedonsparsecodingandridgeregression

WANG Zhiyi1*, BI Duyan1, XIONG Lei1, FAN Zunlin1, ZHANG Xiaoyu2

(1.CollegeofAeronauticsandAstronauticsEngineering,AirForceEngineeringUniversity,Xi’anShaanxi710038,China;2.CommandAutomationStation,XinjiangMilitaryArea,UrumqiXinjiang830042,China)

To solve the problem that sparse coding in text image restoration has the shortcomings of limited expression of dictionary atoms and high computation complexity, a novel text image restoration algorithm was proposed based on sparse coding and ridge regression. Firstly, patches were used to train the dictionary for sparse representation at training stage and the sampled image were clustered based on the Euclidean distances between the sampled image patches and the dictionary atoms. Then, the ridge regressors between low-quality text image patches and clear text image patches were constructed in local manifold space to achieve the local multi-linear expansion of dictionary atoms and fast calculation. At last, the clear text image patches were directly calculated at testing stage by searching for the most similar dictionary atoms with low-quality text image patches without calculating the sparse coding of low-quality text image patches. The experimental results show that compared with the existing sparse coding algorithm, the proposed algorithm has improved Peak Signal-to-Noise Ratio (PSNR) by 0.3 to 1.1 dB and reduced computing time at one or two orders of magnitude. Therefore, this method provides a good and fast solution for text image restoration.

text image restoration; sparse coding; manifold space; ridge regression; clustering

2017- 03- 09;

2017- 03- 21。

國家自然科學基金資助項目(61372167, 61379104)。

王之毅(1982—),男,河南鄲城人,助理工程師,碩士研究生,主要研究方向:圖像處理; 畢篤彥(1962—),男,陜西扶風人,教授,博士,主要研究方向:圖像處理、模式識別; 熊磊(1976—),男,江西南昌人,副教授,博士,主要研究方向:圖像處理、計算機視覺; 凡遵林(1991—),男,湖南郴州人,博士研究生,主要研究方向:圖像處理、模式識別; 張曉瑜(1983—),男,河南鎮平人,助理工程師,碩士,主要研究方向:機器學習、人工智能。

時間 2017- 08- 09 10:36:06 。 網絡出版地址 http://kns.cnki.net/kcms/detail/51.1307.TP.20170809.1036.002.html。

1001- 9081(2017)09- 2648- 04

10.11772/j.issn.1001- 9081.2017.09.2648

TN911.73

A

This work is partially supported by the National Natural Science Foundation of China (61372167,61379104).

WANGZhiyi, born in 1982, M.S.candidate, assistant engineer. His research interests include image processing.

BIDuyan, born in 1962, Ph.D., professor. His research interests include image processing, pattern recognition.

XIONGLei, born in 1976, Ph.D., associate professor. His research interests include image processing, computer vision.

FANZunlin, born in 1991, Ph.D. candidate. His research interests include image processing, pattern recognition.

ZHANGXiaoyu, born in 1983, M. S., assistant engineer. His research interests include machine learning, artificial intelligence.

猜你喜歡
圖像復原文本
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
基于MTF的實踐九號衛星圖像復原方法研究
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
一種基于顯著性邊緣的運動模糊圖像復原方法
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
基于MTFC的遙感圖像復原方法
模糊圖像復原的高階全變差正則化模型構建
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 亚洲精品国产综合99久久夜夜嗨| 中文无码毛片又爽又刺激| 亚洲中久无码永久在线观看软件 | 波多野结衣中文字幕一区二区| 精品国产99久久| 国产无码制服丝袜| 欧美国产中文| 黄色网在线| 9cao视频精品| 久久人人97超碰人人澡爱香蕉 | 在线观看免费黄色网址| 国产拍揄自揄精品视频网站| 99ri精品视频在线观看播放| 久热re国产手机在线观看| 在线观看无码av免费不卡网站| 国产视频一区二区在线观看 | 黄色在线不卡| 亚洲国模精品一区| 欧美精品高清| www成人国产在线观看网站| 极品私人尤物在线精品首页| 99久久精品视香蕉蕉| 久久婷婷五月综合色一区二区| 久久久国产精品无码专区| 午夜影院a级片| 69视频国产| 亚洲精品午夜无码电影网| 91探花在线观看国产最新| 欧洲欧美人成免费全部视频| 任我操在线视频| 97视频免费在线观看| 国产欧美日韩精品第二区| 91综合色区亚洲熟妇p| 精品亚洲麻豆1区2区3区| 成人久久18免费网站| 尤物在线观看乱码| 亚洲视频黄| 99re精彩视频| 手机精品视频在线观看免费| 一级毛片在线免费看| 亚洲浓毛av| 久久免费精品琪琪| 波多野结衣国产精品| 55夜色66夜色国产精品视频| 毛片在线播放网址| 欧美激情伊人| 天堂岛国av无码免费无禁网站| 伊人大杳蕉中文无码| 永久成人无码激情视频免费| 亚洲永久免费网站| 国产成人乱无码视频| 国产真实二区一区在线亚洲 | 国产三级韩国三级理| 激情乱人伦| 国产欧美日韩专区发布| 伊伊人成亚洲综合人网7777| 中文成人在线| 亚洲国产天堂久久综合| 国产青榴视频在线观看网站| 欧美啪啪一区| 伊人丁香五月天久久综合| 国产欧美精品一区二区| 99这里只有精品在线| 干中文字幕| 久久99久久无码毛片一区二区| 国产成人免费高清AⅤ| 91色老久久精品偷偷蜜臀| 免费可以看的无遮挡av无码 | 精品欧美一区二区三区久久久| 国产综合在线观看视频| 亚洲人成人无码www| 99人体免费视频| 波多野结衣一区二区三区88| 国产精品嫩草影院av| 26uuu国产精品视频| 2020极品精品国产 | 成人综合久久综合| 国产97视频在线| 欧美成人aⅴ| 亚洲青涩在线| 国产91蝌蚪窝| 久久九九热视频|