陳逸野 王維東
(浙江大學信息與電子工程學院 浙江 杭州 310000)
壓縮感知理論指出,如果一個信號在某個變換域下是稀疏的,且觀測矩陣和變換基是不相關,即滿足限制等距性(Restricted Isometry Property,RIP)條件下,其可以由低于傳統奈奎斯特采樣定理要求的采樣頻率進行采樣,并通過重建算法高概率地重建出原始信號[1-2]。在該理論框架下,信號的采樣頻率不再完全取決于信號帶寬,而由信號的結構和內容所決定,這為信息的采集和處理提供了新的方向和思路,在信息論、醫學成像、雷達成像、無線通信、圖像處理[3-4]等眾多領域引起了廣泛關注和應用。
重建算法是壓縮感知理論的關鍵,決定了重建圖像的質量。壓縮感知重構問題最早通過求解稀疏域系數l0/l1范數最小化問題進行求解。
(1)
s.t.y=Φx
式中:y為輸入信號x經過觀測矩陣Φ的觀測值,且原信號x在變換Ψ下是稀疏的。式(1)有許多經典的求解方法,包括匹配追蹤法[5-6]、基追蹤法[7]、迭代閾值收縮法[8]等。
隨著研究人員對圖像性質和壓縮感知的不斷深入研究,一些新的圖像壓縮感知重構算法被學者們提出。Candes等最早基于自然圖像的局部光滑特性,采用全變分作為正則項,提出全變分重構算法,在此之后,還發展了TwIST[9]、TVAL3[10]、ReTV[11]等改進的全變分重構算法。圖像塊的稀疏表示模型也被用于壓縮感知重建中[12]。圖像的非局部自相似性也是最為廣泛應用的圖像先驗之一,其在許多圖像恢復任務中有效提高了重建圖像質量,也有部分學者將非局部特性應用于圖像壓縮感知中,提出GSR[13]、TVNLR[14]模型。Metzler等[15]團隊將圖像降噪算法應用于壓縮感知重構中,提出了統一的基于降噪算法的壓縮感知重構算法(Denoising AMP,D-AMP),將降噪算法中采用的圖像先驗和捕捉到的內容結構在D-AMP框架下被壓縮感知重構問題所應用。近年來也涌現了一批基于深度學習的壓縮感知重建算法,如CSNet[16]、ADMM-CSNet[17]、ISTA-Net[18]等,其通過學習的方法找到測量值與原信號之間的映射關系。
自然圖像中通常存在大量的相似結構,這些相似塊列向量化堆疊構成的數據矩陣通常是低秩的。基于非局部低秩特性的加權核范數最小化模型(Weighted Nuclear Norm Minimization,WNNM[19-20])在圖像降噪中達到了state-of-the-art的水平。本文將基于非局部低秩先驗的加權核范數模型引入壓縮感知的稀疏表示模型中,聯合圖像的局部稀疏性質和非局部低秩性質,提出聯合先驗的圖像壓縮感知重建數學模型,利用ADMM算法將原求解問題劃分為多個子問題進行求解。實驗結果表明,該算法在圖像質量客觀評價指標上有一定提升。
自然圖像具有一定的結構模式,使用過完備的冗余函數字典代替傳統的正交基函數,當字典的選擇盡可能地符合被逼近的圖像信號結構時,圖像信號能夠從字典中找到具有最佳線性組合的很少的幾項原子來表示。圖像的自適應字典學習稀疏表示可以描述如下:
(2)
s.t.x=Dα
式中:D為過完備字典;α為該字典下圖像的稀疏系數。實際處理過程中,往往是針對圖像塊進行操作,基于圖像塊的稀疏表示無約束優化方程可描述如下:
(3)
式中:λ為常量調控參數。
稀疏表示模型的三個關鍵問題包括:(1) 如何構建有效的字典D;(2) 如何獲取給定字典下的稀疏分解系數α;(3) 如何將稀疏表示模型用于具體的圖像任務中以及模型求解。通常地,在給定字典情況下通常可以采用貪婪算法計算稀疏系數,對于自適應字典,可以利用K-SVD算法學習過完備字典,并交替更新字典和稀疏系數。壓縮感知建立在圖像信號在變換域下表示是稀疏的,早期的求解是建立在式(1)即稀疏域系數l0/l1范數最小化問題下的。在自適應字典表示下,可以對其進行改進,建立基于自適應稀疏表示的壓縮感知重建模型如下:
(4)
s.t.x=Dα
在自然圖像中,一個圖像塊往往可以在圖像中找到與之相似的其他塊。這些相似塊列向量化堆疊后構成的數據矩陣應該是近似低秩的。記Xi為圖像塊xi通過塊匹配得到的p個相似塊構成的數據矩陣。
Xi=[xi1,xi2,…,xip]Xi∈Rn×p
(5)
將Xi分解為低秩矩陣Li和噪聲矩陣Wi,Xi=Li+Wi,則可以通過對Li的秩rank(Li)進行約束求解低秩矩陣Li:
(6)
絕大多數低秩矩陣都能通過求解核范數最小化(Nuclear Norm Minimization,NNM)問題來復原。對矩陣L進行奇異值分解:
L=UΣσVT
(7)
Σσ=diag(σ1(L),σ2(L),…,σr(L))
(8)
式中:σq(L)表示矩陣的第q個奇異值;U和V為奇異值分解的正交矩陣。則矩陣的核范數表示為:
(9)
低秩特性對于圖像重建有很好的性能,以圖像降噪為例,無周期且隨機的噪聲會影響圖像的低秩特性,圖1表示不同程度高斯噪聲下(標準差為0~50),圖像相似塊數據矩陣奇異值大小。可以看出,當圖像不含噪聲時,相似塊組成的圖像塊組數據矩陣進行奇異值分解之后,大多數奇異值接近于0,只有少數奇異值較大,其對應著圖像塊的主要結構;而隨著噪聲水平增加,奇異值不斷增大。通過該先驗信息對噪聲圖像進行降噪,可有效地恢復無噪圖像,經典的WNNM[19]、MCWNNM[20]圖像降噪算法就利用了圖像的非局部低秩性質,是目前優秀的圖像降噪算法之一。

圖1 不同噪聲水平下圖像相似塊數據矩陣奇異值
壓縮感知重建同樣可以看作降質圖像的恢復過程,通常可用ΦT(Φx)表示壓縮感知初始降質圖像。圖2表示壓縮感知在不同采樣率下(采樣率為0.1~0.5)初始降質圖像,可以看出,隨著采樣率的降低其奇異值不斷升高,并且該現象相比噪聲圖像更為明顯。由此可見,圖像的非局部低秩信息同樣能夠被用于對壓縮感知圖像進行重建。

圖2 壓縮感知不同采樣率下圖像相似塊數據矩陣奇異值
加權核范數最小化模型(Weighted Nuclear Norm Minimization,WNNM)在NNM的基礎上,對不同的奇異值進行區分賦予不同的權重,大奇異值對應圖像的主要結構,權重wq應該更大一些,而奇異值小的對應噪聲或降質紋理,權重應該更小些。加權核范數和加權核范數最小化模型可表示為:
(10)
(11)
圖像的稀疏特性是壓縮感知中最為廣泛應用的先驗,1.1節中基于圖像塊的稀疏先驗考慮了圖像的局部特性,而1.2節中的低秩先驗則利用了圖像的非局部特性。本節將基于圖像塊的局部稀疏特性和非局部低秩特性相結合,提出聯合稀疏和低秩先驗的壓縮感知重構模型。為避免混淆非局部低秩模型中的塊標記符號,式(12)中的稀疏部分簡化為式(2)的形式進行描述,而實際處理過程中通常是以式(3)基于圖像塊的形式進行描述。

(12)
s.t.x=Dα
式中:M為選取的塊數量;η、φ為常量調控參數。聯合先驗模型不存在閉式解,采用分離變量的方法進行求解,引入增廣拉格朗日函數:
(13)
式中:u為常量調控參數。
采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)對其進行求解,分別將式(13)對變量x、Li、a、v進行求導,并令導數為0,通過交替更新變量的方法來逐步優化,將原優化問題轉化為下述4個子問題:
(1) 固定x、α、v,更新Li:
(14)
(2) 固定x、Li、v,更新α:
(15)
(3) 固定Li、α,v,更新x:

(16)
(4) 固定x、Li、α,更新v:
νk+1=νk-u(xk+1-Dαk+1)
(17)
低秩矩陣Li的奇異值σq(Li)可以通過矩陣Xi的奇異值σq(Xi)進行閾值收縮計算得到。該過程可以表示如下:
[U,Σσ,V]=SVD(Xi)
(18)
(19)
Li=US(Σσ)VT
(20)
式中:SVD()表示奇異值分解過程;w為奇異值對應的權重系數構成的對角矩陣。具體地,各權重系數wq為:
(21)
式中:p為相似塊個數;c和ε為常數。
WNNM在進行閾值收縮時考慮了不同奇異值的重要性,認為大奇異值對應于圖像的主要結構,即低秩矩陣Li,其權重應該更大,收縮少一些。而小奇異值對應于圖像的其余部分,可以看作額外噪聲,為得到低秩矩陣Li,這部分權重應該小一些,收縮得更多一些,以盡可能獲得圖像的主要結構。在實際迭代過程中,由于未知真實圖像,采用迭代過程中的恢復的近似數據矩陣來代替。
非局部低秩先驗部分能夠充分挖掘圖像相似塊中的信息,因而對于重復紋理和結構圖像,非局部低秩先驗往往能夠有非常優越的重建性能,彌補基于塊的局部稀疏先驗中未挖掘的信息。
式(15)的稀疏子問題在給定字典的情況下進行優化求解,文獻[21-22]提出通過訓練進行字典學習獲得冗余字典具有自適應性,能夠更好地表示信號結構。在此情況下基于自適應字典學習的稀疏表示表達如下:
(22)
式中:r=x-v/u。
該過程可以通過字典學習與稀疏系數的分解優化交替進行。選用DCT過完備變換基作為初始字典,通過不同的追蹤算法,如匹配追蹤、正交匹配追蹤和基追蹤等,可以求解出字典系數α。
字典學習過程一般用K-SVD算法進行求解,在更新字典D時固定字典系數α,逐列更新字典,即保持其余列不變。將涉及列原子的圖像塊矩陣對應的殘差矩陣進行奇異值分解,通過左矩陣中最大奇異值對應列替換該列實現更新。具體求解過程可以參考K-SVD算法[20]。
將塊匹配過程定義為式(23),則重建過程可重寫為式(24)。
(23)

(24)
式(24)存在閉式解:
(25)

雖然重建子問題存在閉式解,但其中存在大型矩陣求逆過程,編程運算量大,在實際處理過程中通過梯度下降法進行計算更新。聯合先驗模型的整體求解過程如算法1所示。
算法1聯合先驗模型求解過程
輸入:觀測值y,觀測矩陣Φ,參數η、λ、u、φ。
輸出:重建圖像x。
fork1=1:K1


fork2=1 ∶K2

4.利用匹配追蹤法求解圖像塊稀疏系數αk;

6.利用式(17)更新υ;
7.k=k1×K2+k2;
end
end
為驗證模型的有效性,本節應用聯合先驗模型通過對測試圖像進行壓縮感知重建,并與該領域優秀的算法進行對比,包括經典的ALSB[12]、BM3D-AMP[15]、NLRCS[23]、LDAMP[24]重建算法,以壓縮感知重建中常用的隨機觀測矩陣[25]作為統一的觀測矩陣,分別在0.05、0.10、0.15、0.20、0.25、0.30六種不同采樣率下進行壓縮感知重建。此外還與基于深度學習的CSNet[16]和ADMM-CSNet[17]進行對比,其中ADMM-CSNet采用上述統一觀測矩陣,而CSNet由于同時對采樣過程和重建過程進行訓練,其觀測矩陣學習得到的,與上述方法中采用的觀測矩陣有所差異。ADMM-CSNet和CSNet采用作者提供的各采樣率下模型進行預測重建。使用文獻[24]中的標準測試圖像,以PSNR和SSIM兩種圖像客觀評價指標進行評價。其最終平均結果如表1和表2所示,折線圖如圖3和圖4所示。

表1 實驗平均PSNR結果 單位:dB

表2 實驗平均SSIM結果

圖3 不同采樣率下PSNR折線圖

圖4 不同采樣率下SSIM折線圖
整體結果上來看,本文算法在各采樣率上均能得到比較好的結果,尤其在低采樣率下有較大提升,在0.15采樣率下平均結果相比BM3D-AMP、LDAMP和NLRCS在PSNR上分別提高了3.32 dB、1.63 dB和0.55 dB,在SSIM上提高了0.026 2、0.014 9、0.004,而深度學習在壓縮感知重建上表現并不如意。
圖5為Barbara圖片在0.05采樣率下各算法的重建圖和經過對比度拉伸的殘差圖。觀察頭巾紋理部分,尤其是殘差圖上,傳統的優化求解算法ALSB、BM3D-AMP、NLRCS和本文算法一定程度上保持了頭巾的條紋紋理結構,而基于深度卷積神經網絡學習訓練的ADMM-CSNet、CSNet、用DnCNN]26]作降噪器的LDAMP對于Barbara圖片的恢復效果不理想。Barbara圖片是具有代表性的圖片,其有非常明顯的紋理特征,這種有明顯特性的圖片在傳統優化求解模型下都能得到不錯的恢復結果。而從大量圖像數據中訓練的算法并不能很好地學習到這種特征進行表示。

(a) 原圖 (b) ALSB (c) BM3D-AMP (d) NLRCS

(e) LDAMP (f) ADMM-CSNet (g) CSNet (h) Proposed圖5 Barbara圖片在0.05采樣率下的重建圖和殘差圖
圖6為Boat圖片在0.1采樣率下的局部放大圖和其局部放大的殘差圖。Boat圖片中有許多細小的邊緣結構。可以看出,ALSB重構圖在繩索邊緣產生了偽紋理,BM3D-AMP、ADMM-CSNet和LDAMP明顯右側兩條細繩索結構幾乎不可見;CSNet雖然能夠觀察到細繩索結構,但其明顯模糊并擴散開來;NLRCS在十字交叉處左上部分的小段部分被抹去;而本文算法在兩條細繩索結構上更為清晰,對細繩索結構的保留更好。實驗結果表明,聯合圖像先驗的壓縮感知重構算法能更充分利用圖像內容結構信息,進一步提升壓縮感知的重建效果。

(a) 原圖 (b) ALSB (c) BM3D-AMP (d) NLRCS

(e) LDAMP (f) ADMM-CSNet (g) CSNet (h) Proposed圖6 Boat圖片在0.1采樣率下的重建圖和殘差圖(局部放大)
本文將基于非局部低秩的帶權核范數最小化模型引入到經典的稀疏表示壓縮感知重建模型中,提出聯合圖像先驗的壓縮感知重建算法,借助于圖像塊的局部稀疏性質和非局部低秩先驗,建立了聯合求解模型,通過ADMM算法將聯合先驗重構模型分為多個子問題進行求解。實驗驗證了本文算法的有效性,聯合先驗模型更充分地利用了圖像先驗性質,取得了更好的重建效果。然而基于優化求解的壓縮感知重建算法計算量較大,這也是壓縮感知在實際應用中需要解決的問題,如何設計計算復雜度更低的重建算法應用于實際應用中是需要繼續研究的方向。