趙知春
(重慶對外經貿學院 重慶市 401520)
圖像的模糊問題是生活中最的常見問題之一,設備在圖像獲取以及傳輸的過程中都會因為各種各樣的不利因素導致圖像退化和降質,從而導致丟失大量真實有用的信息,大大降低了圖像的科研價值以及有效信息,并有可能造成嚴重的經濟損失。因此,在進行圖像分析處理前為使在后續的圖像檢測中能夠保留足夠的真實信息,在之前需要進行圖像復原。
早期圖像盲復原技術大都采用的是參數估計法,這種方法是先根據圖像或成像環境的先驗信息對PSF 進行辨識,然后再利用所獲得的PSF,采用經典的非盲復原方法,如逆濾波、維納濾波、R-L方法等得到原清晰圖像的估計。與參數估計法相對應的是非參數化約束盲復原技術,1988年,Ayers 和Dainty 通過實驗提出了迭代盲去卷積法,它的基本思想就是在空間域以及傅里葉域交替迭代的過程中施加約束條件,從而最終得到目標圖像理想估計,該算法簡單快速,對噪聲具有較好的魯棒性,但由于沒有客觀的迭代截止準則,很容易產生局部收斂。1992年,Rudin 等首次提出全變差正則化模型,此模型最終將偏微分理論成功地應用到圖像去噪處理中,從而開創了基于全變差正則化模型的圖像盲復原相關方法。1996年,You 和Kareh 利用圖像和PSF 的H1 范數作為正則項引入到代價函數中,該方法可以針對空變退化圖像進行復原。
近年來深度學習的快速發展,很多文獻中應用深度學習算法來評估圖像,深度學習方法即深度卷積神經網絡方法,深度學習具有強大的自動學習對象特征的能力,但需要大量的計算,而隨著硬件技術的發展,計算機的計算能力越來越強大,圖像復原領域也開始大量使用深度學習。Li 等人將模糊核尺寸估計作為回歸問題,通過構建卷積神經網絡實現去模糊。通過大量帶標簽的合成模糊圖像訓練該網絡,最終實現在沒有尺寸限制時估計給定模糊圖像的模糊核大小。實驗結果表明該方法不僅能精確地估計運動模糊核尺寸,并能將該尺寸作為輸入參數生成清晰圖片。Xu 等人通過深度卷積神經網絡學習從模糊圖像中提取銳邊,抑制無關細節和增強銳邊極大地簡化了模糊核估計,該算法對無論是合成模糊圖像或是真實模糊圖像,在視覺效果和運行時間方面,均可達到較高水準。2014年Goodfellow 等提出了生成對抗網絡,它可以從訓練數據中學習并生成新的數據,GAN 由生成器網絡G 和判別器網絡D 構成,G 生成偽造數據,G 和D 通過對抗訓練不斷優化網絡參數,直到D 無法區分出標簽數據和生成器生成的數據為止。GAN 本身就是為端到端圖像生成而設計,對抗訓練方法又使其生成的圖像紋理細節清晰,這些特性使它很快被應用到圖像復原領域的研究中。Radford 等人引入了深度卷積生成對抗網絡,其本身的架構約束使得GAN 在大多情況下能夠穩定,能將GAN 用于圖像分類等,實現了GAN 學習核可視化。

圖1:圖像退化過程

圖2:端到端深度學習網絡模糊圖像復原流程圖

圖3:使用生成對抗網絡的端到端圖像復原流程圖
在圖像處理過程中為了去除模糊圖像的噪聲,首先需要做的是對圖像退化整個過程建立一個合適的數學模型。在現實生活中,能夠造成圖像退化的因素有很多,通過實驗發現,現實中大多數圖像退化的過程都可以近似為一個線性過程,所以工程中往往都用線性空間不變的系統是其疊加上噪聲來模擬圖像的退化過程,如圖1所示。
由線性和移不變性質可以推導得到圖像退化的數學公式:

其中,f(x,y)表示原始清晰圖像,*表示空間卷積,h(x,y)表示公式(1)的退化函數空間描述,也可以稱為點擴散函數;然而n(x,y)表示加性噪聲,通常來說是高斯白噪聲;而g(x,y)表示觀測模糊圖像。式(1)描述了一幅原始圖像f(x,y)在退化函數和加性噪聲的作用下,退化成觀測圖像g(x,y)的過程。
在模糊圖像中,由于在同一幅圖像上模糊核的種類、數量和尺寸都不相同,模糊的情況非常復雜,因此,使用先估計模糊核再進行復原圖像的方法通常難以取得較好的復原效果,傳統圖像復原方法的缺點都會存在。端到端的深度學習方法不需要估計出模糊核,它能夠自動地學習模糊圖像的模糊特征,通過大量的網絡參數在模糊特征和清晰特征間建立用于復原的網絡映射,能夠適應不同的模糊情況,從而在非均勻模糊圖像的復原上也能取得較好的效果。
如圖2所示,典型的端到端圖像復原網絡通常會經過下采樣、特征提取與復原和上采樣幾個過程,在網絡的輸出端直接得到復原圖像。
基于這種方式設計了用于圖像復原的卷積神經網絡,該網絡由下卷積子網絡、去模糊子網絡和輸出層組成,每個子網絡均由多個卷積層構成,圖像輸入到網絡中后依次通過這些子網絡,在輸出層直接輸出復原后的清晰圖像。該網絡組成較為簡單,訓練容易,在散焦模糊圖像復原中取得了較好的效果,但由于網絡簡單、規模較小,并不具備較強的魯棒性。
基于這種方式設計了一個多尺度的端到端圖像復原網絡,模糊圖像分為三個尺度輸入到網絡中,通過下卷積提取模糊特征和上卷積還原圖像,得到每個尺度的潛在清晰圖像,利用長短期記憶模塊的特征記憶功能將三個尺度的網絡連接起來,最后輸出復原的清晰圖像,該網絡在非均勻運動模糊圖像上取得了較好的效果,但是在圖像的細節復原上表現并不理想。
生成對抗網絡是近年以來被提出的專門用于圖像生成的網絡形式,GAN 可以獲得細節更加豐富的圖像。如圖3所示,通常用于生成圖像的生成對抗網絡使用隨機數來生成所需圖像,如果將生成器的輸入修改為模糊圖像,并對生成對抗網絡進行訓練,則可以得到用于復原模糊圖像的網絡模型。
基于GAN 設計了用于非均勻模糊圖像復原的圖像復原網絡,該網絡生成器使用編碼器-解碼器結構,模糊圖像通過下卷積后進行特征提取,再通過上卷積輸出復原圖像,判別器網絡則通過四次下卷積輸出判別為真的概率,從而約束生成器網絡的訓練過程,使生成器網絡生成越來越接近真實的復原圖像,同時,該方法使用了感知損失和內容損失函數,使網絡能夠更順利更有效地進行訓練,避免GAN 網絡自身存在的不穩定性,在非均勻運動模糊圖像的復原效果上取得了較好的效果,而且大大減少了圖像復原所需的時間。但是該網絡結構簡單,感受野較小,導致網絡魯棒性低,也無法在模糊程度較高的非均勻運動模糊圖像上取得較好的復原效果。
現代數字化社會中,圖像信息由于一系列的優點,如信息量大、傳輸速度快等,成為了人類獲取信息的重要來源。統計數據表明,人類從外界獲得的信息中大約有75%是來自圖像信息的,可見圖像已經成為了人們認識客觀世界的主要信息來源,人們對于圖像的質量要求也越來越高。為了獲取盡可能清晰的圖像,人們可以通過改良成像設備來獲取高質量的圖像,但是由于硬件設備技術的發展終究存在著局限性,這種硬件方面的改良往往也難以取得很好的效果。鑒于提升硬件技術來獲得高清晰圖像的種種局限性,通過軟件和算法技術的改進來提高生活中的圖像質量已經成為了人們研究的熱點。人們希望通過對軟件和算法的改進來對圖像進行處理,以此來提高圖像質量,加強對圖像細節方面的處理,從而獲得高質量的圖像。如今,圖像模糊復原技術已經應用在諸如遙感圖像處理、醫學圖像處理、公共安全、軍事科學及天文觀測等眾多領域。模糊圖像復原的研究具有十分重要的意義。