李 可, 孫金嶺
(1.廣東開放大學,廣州 510091; 2.蘭州理工大學 經濟與管理學院,蘭州 730050)
新型混合字典學習算法改進圖像超分辨率的研究
李 可1, 孫金嶺2
(1.廣東開放大學,廣州 510091; 2.蘭州理工大學 經濟與管理學院,蘭州 730050)
目前機器學習算法大都采用單層字典的學習訓練設計,現從改進視覺效果、分辨率2個角度,設計了2層字典混合學習算法。采用經典的半耦合字典學習(SCDL)和模糊模型處理結合作為第1層字典學習,第2層則是針對第1層的殘余圖像進行重構,結合K值聚類以及K-SVD算法設計了第2層字典的訓練過程。與經典SCSR、SCDL算法對比實驗結果表明:改進算法的峰值信噪比與其他2種算法有了4%左右的提高,提高值在1 dB以上,表明了算法能夠一定程度的提高重構圖像的分辨率;算法的對比視覺效果看出,改進的算法能夠明顯改進重構質量,實現了圖像視覺效果的改善。由于算法并不是以犧牲算法運算時間、速度為代價,這樣其研究結果對于機器學習在圖像領域的進一步推廣與發展具有一定的參考價值。
字典學習; 2層字典; 半耦合字典學習; 峰值信噪比; 視覺效果
計算機圖像處理學科,改進視覺效果、提高分辨率一直都是研究人員追求的方向之一[1-3]。比較經典的方法和應用廣泛的有圖像恢復和圖像重建,他們都能實現圖像的去噪,改進圖像的視覺效果[4-7]。然而多年來研究發現,上述的方法實質是并未使圖像的分辨率有任何改進[8-10]。此外,比較常見的圖像內插方法也能提高圖像的尺寸,實現改進視覺效果,但其假設原像素與新像素的數學關系的設計,可能會導致圖像的失真。與上述方法不同的是,圖像超分辨率的重建可以實現處理后圖像新信息的增加,不僅可以改進視覺效果,還能提高分辨率[11-13]。圖像超分辨率重建率先是由Tsai等人在頻域進行的數學模型建立,逐漸推廣到如wavelet、contourlet等變換域。而之后在空間域實現的超分辨重建更為直觀、易懂[14-16]。典型的有Hardie團隊提出的改進Gaussian MarkovRandom Field GMRF(高斯馬爾科夫隨機場)的超分辨率算法,以及Huber馬爾科夫隨機場的優化超分辨率算法。近年來,圖像超分辨重建明顯由多幀朝著單幀的超分辨率變化,特別是年初的阿爾法狗贏得李世石的人機圍棋大戰,再度激發以“深度學習”為代表的智能算法的研究熱潮[17-19]。然而目前上述研究大都采用的是單層字典的學習算法,這樣有時會出現失真或者是峰值信噪比(PSNR)較低的現象。基于上述背景和原因,本文采用混合雙層的字典學習算法改進,理論和實驗對比結果表明,改進算法具有較好的視覺效果,PSNR也非常理想,這一研究對于機器學習在圖像領域的進一步推廣與發展具有一定的參考價值。
半耦合字典學習(Semi-Coupled Dictionary Learning,SCDL)是由低、高分辨率圖像的映射組成,通過字典配對圖像塊之間的映射關系,伴隨著字典、映射矩陣等的更新,重構實現高分辨的圖像。SCDL的優化問題可以表示為:
(1)
式中:x、y分別表示高分辨率圖像塊和低分辨率圖像塊,Λx、Λy表示高分辨率圖像塊編碼系數和低分辨率圖像塊編碼系數,Dx、Dy表示高分辨率字典對和低分辨率字典對,其他參數則表示的正則化的參數。SCDL總共涵蓋了稀疏編碼、字典更新、映射更新等3個階段。
第1步稀疏編碼實在初始化映射矩陣Γ以及字典對Dx、Dy之后,可以用以下式表述:
(2)
第2步則用以下表達式實現Dx、Dy的更新:
(3)
第3步更新Γ可以采用下面式子:

(4)
上述問題的解可以表示為:
(5)
其中:I為單位矩陣。進而可以得到SCDΩ= {Dx,Dy,Γ},實現了高分辨率圖像和低分辨率圖像系數的線性化。然而上述單層字典丟失的高頻環節較多,故本文提出SCDL的改進,通過雙層混合學習實現更多高頻環節的恢復,達到低分辨率圖像的復原質量的提高。

(6)

(7)

對于圖像的數學模型采用下式進行分析:
Y=DHX+n
(8)


(9)
式中:Yi代表是設計輸入的低分辨率圖像;Xii代表是設計對應的高分辨率圖像塊,通過變換更替有αx,i1、αy,i1稀疏系數,這樣重構的高分辨率圖像表示為:
(10)
具體的第1層字典學習算法過程見圖1所示:

圖1 第1層字典學習
(11)
對于殘余圖像Xr依然能夠有很多細節圖像信息,第2層字典學習就是對這些豐富的高頻環節進行又一次重構,文中從不增加算法整體運算時間角度出發,采用以下的具體步驟:訓練,通過對殘余圖像Xr進行高通濾波得到第2層字典學習特征,并對應進行分塊處理,分為5×5,這樣得到的高分辨樣本表示為:H={h1,h2,…,hn},對第1層重構后的圖像經過3次濾波后,又獲得第2層學習的低分辨率特征,也相應分塊成5×5,這樣得到的低分辨樣本表示為:L={l1,l2,…,ln};分類,對低分辨率樣本集進行分類處理,當方差大于閾值(本文采用7)的特征Lf,則相應的定義為高分辨率的樣本子集為Hf,采用K值聚類算法,得到m個聚類中心,相應得到高分辨率訓練集和低分辨率訓練集表述為:H={H1,H2,…,Hi,…,Hm,Hm+1},L={L1,L2,…,Li,…,Lm,Lm+1};訓練字典,最后采用經典的K-SVD算法對H、L實現訓練,最終得到m+1的第2層高分辨率以及低分辨率字典對,把其作為第2層的字典。具體的第2層字典學習算法過程見圖2所示。

圖2 第2層字典學習
實驗對第1層字典采用505 000對的5×5 pt大小的高分辨率圖像塊和低分辨率圖像塊,相應的正化參數設定如下:γ=0.2、λx=0.02、λy=0.02、λΓ=0.2、λ=0.21。第2層字典,選擇5×5的圖像塊,而訓練樣本m選擇為300。表1對比了本文算法和經典算法SCSR算法、SCDL算法的PSNR情況。

表1 算法峰值信噪比的對比 dB
表1的結果可以看出,算法的峰值信噪比有了明顯的提高,有4%左右的提高,1 dB以上。說明算法改進了重構圖像的質量,提高了圖像的分辨率,這一數據也驗證了算法是有效、可行的。圖3則相應的給出了3種算法對比視覺情況,從圖中可以看出:SCSR算法盡管清晰度可以,但其邊緣卻表現了一定的振鈴現象,SCDL算法相比有了顯著改進,邊緣振鈴現象已經不明顯了,而本文設計2層學習算法,重構質量相比有了比較明顯的提高。上述結果表明,算法不僅能夠提高圖像分辨率,還能顯著改善的圖像視覺效果。

(a) 原始圖像 (b) 低分辨率圖像 (c) SCSR算法

(d) SCDL算法 (e) 設計的2層字典算法
圖3 視覺效果對比
本文針對單層字典學習算法存在高頻細節丟失過多的問題,提出了2層混合字典學習算法,實現了圖像超分辨率重構,與經典的SCSR、SCDL算法對比驗證了算法不僅可以提高圖像的分辨率,還能顯著改進圖像視覺效果,由于算法并不是以犧牲算法運算時間、速度為代價,結果對于圖像超分辨率重構具有明顯的理論和實際意義。
[1] 李家德,張 葉,賈 平,等.采用非局部均值的超分辨率重構[J].光學精密工程,2013,21(6):1576-1585.
[2] 楊文波,朱 明,劉志明,等.基于3線陣探測器的亞像元成像超分辨率重構[J].光學精密工程,2014,22(8):2247-2258.
[3] 史 郡,王曉華.基于改進K-SVD字典學習的超分辨率圖像重構[J].電子學報,2013,41(5):997-1000.
[4] 常志國,郭茹俠,李 晶,等.基于稀疏表示和近鄰嵌入的圖像超分辨率重構[J].計算機測量與控制,2016,24(5):173-177.
[5] 路錦正,吳 斌,張啟衡,等.正則化恢復聯合稀疏表示的圖像超分辨率重構[J].光電工程,2013(9):1-7.
[6] 李 強,劉 哲,南炳炳,等.改進的基于鄰域嵌入的圖像超分辨率重構[J].激光技術,2015,42(1):13-18.
[7] 劉世瑛,胡江濤,黃 峰,等.復眼圖像超分辨率重構的噪聲分析與消除[J].紅外技術,2015,44(9):746-750.
[8] 管 超,金 波,張愛新,等.基于MCA分解的超分辨率重構算法[J].通信技術,2013,12(3):87-90.
[9] 胡江濤,黃 峰,張 雛,等.下采樣對復眼圖像超分辨率重構效果的影響[J].激光雜志,2014,10(10):43-45.
[10] 朱華生,徐晨光.基于局部約束的人臉圖像超分辨率重構算法[J].激光與紅外,2014,21(2):217-221.
[11] 李 雪,蔣愛民,劉小峰,等.基于稀疏表示的圖像超分辨率重構算法[J].微處理機,2014,35(1):41-45.
[12] 趙 惠,魏靜萱,龐志海,等.波前編碼超分辨成像技術[J].紅外與激光工程,2016,45(4):227-236.
[13] 劉世瑛,黃 峰,劉秉琦,等.復眼圖像超分辨率重構中配準算法研究進展[J].激光與紅外,2015,45(10):1164-1170.
[14] 田浩南.超分辨率重構在航空光電成像系統中的應用?[J].國外電子測量技術,2015,13(2):73-77.
[15] 徐煜明,宋佳偉,肖賢建,等.基于亞像素塊匹配和字典學習的超分辨率算法[J].計算機科學,2016,43(8):304-308.
[16] 王 宏,盧芳芳,李建武,等.結合支持向量回歸和圖像自相似的單幅圖像超分辨率算法[J].中國圖象圖形學報,2016,21(8):986-992.
[17] 李 強,林文曉.基于稀疏表示和自相似學習的圖像超分辨率重構[J].紡織高校基礎科學學報,2013,5(4):548-552.
[18] 王爾卓,張月琴,于 楊,等.基于二維稀疏表示的人臉超分辨率重構算法[J].太原理工大學學報,2015,17(2):183-187.
[19] 梁 玉,王 睿,李 蕊,等.改進邊緣質量和運動估計的超分辨率圖像重構[J].信號處理,2015,21(1):26-33.
AHybridDictionaryLearningAlgorithmforImpromentofImageSuper-resolution
LIKe1,SUNJinling2
(1. The Open University of Guangdong, Guangzhou, 510091, China; 2. School of Economics and Management, Lanzhou University of Technology, Lanzhou 730050, China)
At present the machine learning algorithms mostly adopt single dictionary learning training design. From the perspectives of improving simultaneously resolution and visual effect, a 2-layer dictionary hybrid learning algorithm is designed. The classic coupling half dictionary learning (SCDL) is combined with fuzzy model to use as the first level dictionary learning, the second layer is used to reconstruct the residual image of the first layer. The second level is trained by theKvalue clustering and theK-SVD algorithm. Compared with classical SCSR, SCDL algorithms, experimental results show that the improved algorithm can improve the peak signal-to-noise ratio about 4%, and the value is more than 1 dB. It illustrates that the algorithm can improve the resolution of the reconstructed image and visual effect. Because the algorithm does not increase operation time and operation speed, it has a certain reference value for further promotion and development in the field of machine learning.
dictionary learning; 2-layer dictionary; half coupling dictionary learning; peak signal to noise ratio; visual effect

TP 751
A
1006-7167(2017)11-0118-04
2016-12-18
國家自然科學基金創新研究群體項目(411211;412730)
李 可(1980-),女,廣西柳州人,碩士,講師,研究方向:軟件工程,計算機應用技術。
Tel.:150 1846 7856;E-mail:like@gdrtvu.edu.cn