摘 要:針對傳統神經網絡圖像復原算法在復原過程中模糊圖像邊緣,收斂速度慢等不足,提出一種基于調和模型的快速神經網絡圖像復原算法。在該算法中,圖像復原模型的正則化項采用調和模型,并在每次網絡狀態更新時引入最陡下降方法,使得網絡能量迅速減小。實驗表明,提出的算法能夠很好復原圖像的邊緣特征,并具有快速收斂等優點。
關鍵詞:圖像復原;神經網絡;調和模型;去模糊
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2007)06-0158-03
圖像復原一直是圖像處理與計算機視覺中一個重要的研究課題,多年來頗受學術界的關注。由于采用神經網絡進行圖像復原不需要假設圖像滿足廣義平穩過程,并且易于硬件實現等諸多優點,近年來基于神經網絡的圖像復原方法逐漸成為圖像復原領域研究的熱門課題之一[1-7]。將神經網絡用于圖像復原的模型最早由Zhou等人[1]提出。他們通過能量函數將復原問題與Hopfield神經網絡(HNN)聯系起來,把圖像復原問題轉換為適合神經網絡計算的最優化問題。但Zhou的方法存在網絡模型龐大、網絡狀態更新慢等缺點。針對這些缺點,Paik等人[2]提出了改進的Hopfield神經網絡(MHNN)模型,用于灰度圖像的復原。之后,許多學者從網絡模型,收斂速度等方面對Paik方法進行了改進[3-7]。
在數值實驗中,筆者發現采用Paik[2]方法進行圖像復原時,圖像的邊緣存在不同程度的模糊,極大降低了圖像的視覺效果。其根本原因在于Paik方法采用的正則化算子為Laplace算子,該算子對圖像僅起到平滑作用,沒有考慮圖像的邊緣信息。筆者將采用該算子的神經網絡復原模型稱為傳統神經網絡復原模型。一方面,在Paik[2]方法中,每次神經元狀態更新時,改變量僅存在三種可能,導致網絡收斂十分低效。為了克服這些缺點,給出了一種基于調和模型的快速神經網絡復原算法。該算法采用基于調和模型的正則化項,能夠在去除模糊的同時,保持圖像的邊緣信息;另一方面,通過引入Perry[4]更新規則,使得神經元狀態改變量采用統一表達式,且保證每次網絡能量下降最多,使得網絡能量快速收斂到固定點。
1 基于調和模型的神經網絡復原模型
圖像退化模型可表示為
2 基于調和模型的快速神經網絡復原算法
根據模型(4),可得如下離散形式:
3 實驗結果及討論
在實驗中,分別對三種算法進行測試,即傳統復原模型的Paik算法、基于調和模型的Paik算法和基于調和模型的快速復原算法。傳統復原模型采用正則化算子為
在基于調和模型的復原算法中,梯度算子采用Sobel算子。其對應的水平,垂直模板為
模糊矩陣為1×9運動模糊函數生成的Toeplitz矩陣。采用標準測試圖像,大小為128×128,進行運動模糊,并加入均值為0,標準差σ=5的高斯噪聲。使用信噪比改進(Improvement in SNR)作為衡量圖像恢復效果的客觀標準。圖像降質程度用PSNR(Peak SignaltoNoise Ratio)來衡量。
實驗1 傳統復原模型的Paik算法與基于調和模型的Paik算法對比。兩種復原算法采用相同迭代次數。取λ=0.01。圖1給出了兩種復原模型的實驗結果。從圖中可看出,采用調和模型的Paik算法,恢復的圖像邊緣比較清晰,主觀視覺效果較好。而傳統模型的復原結果比較模糊。但從客觀評價標準來看,基于調和模型Paik算法的ISNR不是很高。其主要原因在于ISNR的計算過程中,平滑效果起到了主要作用。在圖1(c)中,雖然圖像邊緣十分清晰,但仍含有部分噪聲。為了進一步提高圖像復原質量,可以采用現有的保邊去噪方法對其進行后處理,如全變差濾波方法[8]。圖1(d)為圖1(c)經過濾波去噪后的結果。圖2給出了對文字圖像的測試結果。從圖2中看到,基于調和模型的Paik算法在客觀評價指標,以及主觀視覺方面都具有明顯優勢。
實驗2 算法收斂速度對比。測試算法為:傳統復原模型的Paik算法,基于調和模型的Paik算法,以及基于調和模型的快速復原算法。考慮到算法運行時間,截取Cameraman標準灰度圖像中24×24的小圖像進行測試,取λ=0.01。圖3顯示了三種算法隨迭代次數增加,ISNR的增長曲線。橫坐標表示迭代次數,縱坐標為信噪比改進。從圖3可以看出,基于調和模型的ISNR高于傳統復原模型,且快速算法的收斂速度明顯優于其他兩種算法。該實驗中,傳統復原模型的Paik算法,基于調和模型的Paik算法和基于調和模型的快速復原算法達到收斂時分別進行了70、110和10次迭代。因此,可估算快速復原算法的收斂速度與其他兩種算法相比,大約提高了七倍。
圖2 傳統復原模型與調和模型對比圖3 ISNR與迭代次數關系
4 結束語
本文針對傳統神經網絡圖像復原算法的不足,給出了一種基于調和模型的快速神經網絡圖像復原算法。實驗結果表明,該算法具有保持邊緣、收斂快速等優點。
本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。