劉明明
(四川大學電子信息學院,成都610065)
圖像分解的目的是分離圖像中的不同特征。在醫(yī)學圖像處理、遙感、生物計量學等許多實際應用中具有重要的應用價值。圖像可以分解為卡通(分段平滑)和紋理結(jié)構(gòu)的疊加。圖像可以分解為卡通(分段平滑)和紋理結(jié)構(gòu)的疊加。模型化為f=u1+u2,其中f為觀測圖像,u1為卡通部分,由分段光滑的結(jié)構(gòu)和清晰邊緣信息構(gòu)成。u2為紋理結(jié)構(gòu)信息,由圖像的紋理信息或者高斯噪聲構(gòu)成。例如,在遙感中,合成孔徑雷達圖像可以建模為地面反射率場(卡通)與多重反射散斑(紋理)的疊加。
近些年來,基于稀疏表示的方法在圖像處理中得到有效的應用。特別地,Starck 等人[1]提出了一種稱為形態(tài)成分分析(MCA)的方法,該算法在假定不同的形態(tài)學成分是完全不同的,在特定的解析字典下的表示是稀疏的,同時這些字典是毫不相干的,即每個特定字典可將其對應的形態(tài)學成分稀疏表示,而對其他形態(tài)學成分的表示是不稀疏的,通過最小化能量泛函使得結(jié)構(gòu)字典表示卡通結(jié)構(gòu)成分,紋理字典表示紋理成分,最終達到卡通和紋理分離的目的。因此MCA 的性能取決于特定字典的選擇。在實踐中,離散余弦變換(DCT)或離散正弦變換(DST)對應的字典被用來表示紋理成分。由于小波變換、曲線變換和輪廓變換等都能很好地表現(xiàn)出邊緣等幾何特征,因此可以用來表示分段光滑分量。然而,由于這些字典不能自適應地隨圖像的內(nèi)容和結(jié)構(gòu)而改變,圖像恢復和分解的質(zhì)量依賴于這些稀疏域的選擇或字典的構(gòu)造。
直接從訓練中學習字典,而不是使用預先確定的字典(例如DCT 或小波),在許多圖像處理和分類問題中,通常能得到更好的表示,從而提供更好的結(jié)果[2-3]。另外,多數(shù)字典學習方法都是基于圖像塊進行學習的,這就導致這些方法有相同的移位特性,而卷積稀疏編碼(Convolutional Sparse Coding,CSC)方法,可以直接在目標中對平移不變性進行建模[4-5]。CSC 已經(jīng)被證明在廣泛的計算機視覺和圖像處理問題上有重要的應用[6-7]。
總變差[8](TV 模型),因為它很好地刻畫了卡通形象的分段平滑性征。然而,TV 模型基于梯度定義的,因此對于紋理部分不能很好地刻畫,易產(chǎn)生“階梯效應”與細節(jié)模糊等問題。為了解決這一問題,人們提出了許多TV 的變體,比如;自適應二階廣義總變分模型[9](TGV 模型),分數(shù)階變分模型[10-11](FTV 模型)等。目前,F(xiàn)TV 已被用于圖像紋理細節(jié)的提取和增強方面取得了較好的成果[11-12],這些工作也表明了分數(shù)階變分模型能更好地處理紋理等細節(jié)信息。為了取得更好的分離效果,本文中用TV 處理圖像分離中的卡通部分(低頻部分),用FTV 處理圖像分離中的紋理部分(高頻部分)。
CSC 假設圖像可以表示為一組濾波器及其相應的特征映射之間的卷積的和。

這里y表示輸入圖像,*表示卷積算子。表示一組濾波器,表示與濾波器相對應的特征圖。λ表示正則化參數(shù)。文獻[13]提出引入了一種基于傅里葉域交替方向乘法器(ADMM)[14]框架來解決CSC 的優(yōu)化問題。文獻[15]提出了一個能處理適當邊界條件的柔性框架來解決CSC 優(yōu)化問題。另外,文獻[16]提出一種另一種高效的方法,在空間和傅里葉域中處理CSC 的優(yōu)化問題。在本文中,我們采用了文獻[16]中提出的學習卷積濾波器的方法,該方法簡單有效。
TV 模型是的經(jīng)典圖像算法[8],也稱ROF 模型,TV的最小能量泛函可以表示為:

min 表示對此模型求最小解,第一項為正則項,作用是在D?U區(qū)域內(nèi)的圖像總變分求取最優(yōu),第二項為保真項,作用是平滑修復區(qū)域。u為包含噪聲的圖像,u0為原始圖像。λΩ數(shù)據(jù)保真項,當有噪聲存在時用來保持邊緣信息。
(3)式能量泛函的歐拉-拉格朗日方程可以表示為:

其中 |?u|-1為擴散系數(shù),其作用是修復圖像時平衡圖像在不同的像素梯度下的擴散強弱,以此來避免圖像修復后破損區(qū)域與其鄰域之間過度的平滑。TV 模型通過梯度值來確定邊緣和噪聲,僅在圖像的梯度正交方向上進行擴散,從而有效地保留邊緣結(jié)構(gòu)。但在圖像的平滑區(qū)域,TV 模型能有效地逼近分段常數(shù)函數(shù),容易將噪聲誤判為邊緣保留,最終產(chǎn)生分段區(qū)域的“階梯效應”。
分數(shù)階微分實質(zhì)上是整數(shù)階微分的一種推廣形式,研究表明分數(shù)階導數(shù)比整數(shù)階導數(shù)更適合于對于圖像紋理等細節(jié)信息的處理,能有效的抑制圖像的“階梯效應”將文中TV 模型的正則項由一階微分拓展到分數(shù)階微分。這樣就得到了FTV 模型:

通過引入一個人為的時間變量,求解方程(5),得到了梯度流:

其中的參數(shù)含義與TV 模型的參數(shù)含義相同。
蒲[12]等人通過Gru¨nwald-Letnikov(G-L)定義構(gòu)造八個方向的分數(shù)階微分掩模。

s(x)是定義在[a,x] 的連續(xù)信號,α是任意的實數(shù),在區(qū)間[a,x] 上的離散采樣信號。為了簡單起見,我們只介紹四個方向的分數(shù)階掩碼,包括正的x軸和y軸,負的x軸和y軸用于處理對應的四個方向,由圖1 表示。其中的子圖分別表示4 個方向的分數(shù)階微分掩模。

圖1 四個方向上的分數(shù)階掩模
圖1 中分數(shù)階微分掩模的系數(shù)如下:

y為輸入大小為N2的圖片,可以分離為分段光滑的可用卡通圖片yc和紋理圖片yt。假設我們已經(jīng)分別解決了動畫和紋理組件的CSC 問題,學習了對應于yc和yt的卷積濾波器,用學習得到的得到,基于CSC 優(yōu)化框架來優(yōu)化uc,i和ut,i來估計yc和yt。

其中λc,λt是稀疏系數(shù),β,γ是平衡系數(shù)。對于卡通部分uc,用刻畫。對于紋理部分,用刻畫,則(9)式又可以表示為:
為了簡化計算,我們可以在這里先討論除了TV 和FTV 的部分,得到的結(jié)果可以在uc,k和ut,k上進行迭代求解。首先更新uc,k,我們假設初始ut,k是固定的,因此,需要解決以下的優(yōu)化問題:


這里假設dc,k,dt,k和ut,k是確定的,(10)式本質(zhì)上是一個稀疏編碼問題,可以使用[17]中提出的基于DFT的ADMM 的算法來解決。
其次更新ut,k,這里我們假設uc,k事先確定,然后解決如下優(yōu)化問題:

同樣的,(11)式可以基于DFT 的ADMM 的算法來解決。
圖像分解的本文算法:

這里的λc,λt,β是正則化參數(shù),K是總的迭代次數(shù),y為待分離的圖像為處理后的圖像分離卡通和紋理圖像。
這一部分,用我們提出的新的圖像分離算法與基于卷積稀疏編碼的分離算法[18](CSCD)、經(jīng)典的形態(tài)成分分析(MCA)的方法[1]以及一種最新的基于塊的核范數(shù)的圖像分離算法[19](BNN)。在這些實驗當中,我們用峰值信噪比來衡量各自的性能。對于MCA 算法,用小波變換和局部DCT 字典分別表示卡通和紋理成分。為了更好的說明本算法的實驗效果,本文采用與CSCD算法相同的卷積濾波器,采用文獻[20]CSC 算法模型分別進行處理,得到相應的學習濾波器如圖2 所示。

圖2
從圖2(a)可以看出,這些過濾器本質(zhì)上是振蕩的,它們在捕獲訓練紋理的模式方面做得很好。類似地,從圖2(b)中,我們觀察到所學的過濾器與在Gabor 字典中發(fā)現(xiàn)的過濾器相似。此外,它們還可以捕獲在卡通類型圖像(如邊緣)中發(fā)現(xiàn)的特定于域的信息。
在第一組實驗中,我們提出了一種從隱藏的指紋中提取潛在指紋的方法。潛指紋是最有價值和最常見的物證類型之一,從犯罪現(xiàn)場提取的潛指紋可作為法醫(yī)鑒定的重要依據(jù)。參數(shù)的選取經(jīng)常是根據(jù)經(jīng)驗確定的,在該實驗中取λc=max(0.5-0.05?i,0.05)和λt=max(0.55-0.05?i,0.15),在第i 次的迭代當中分數(shù)階的模板大小為N=7,分數(shù)階的階次V=0.6。本文所提出的方法從隱藏指紋中提取潛在指紋。圖3 給出了本文算法的分離結(jié)果。同時與CSCD、BNN、MCA 等算法簡單的對比。

圖3 本文算法與CSCD,BNN,MCA在隱藏指紋圖像上分離效果的對比
在第二組實驗中我們采用貓+籠子圖像原始圖像,為了增加本文算法的說服性,本文選取與CSCD 相同的 參 數(shù)。 取λc=max(0.55-0.05?i,0.005)和λt=max(0.55-0.05?i,0.005)在的第i次迭代中。分數(shù)階模板大小為N=7,分數(shù)階的階次V=0.8。在這兩個圖中,第一列顯示了原始的測試圖像卡通形象和原始紋理形象,第二列顯示本文的圖像分離算法。第三、第四和第五列顯示的結(jié)果對應的分別采用CSCD 算法、BNN 算法、MCA 算法。采用峰值信噪比(PNSR)來比較不同算法的效果。
與其他方法相比,我們的方法能夠較好地從給定的圖像中分離出形態(tài)成分。貓+籠子圖像的實驗可以看出,如圖4 所示,本文算法分離出來的卡通圖像的PNSR 為29.33,與之相對應CSCD 算法,BNN 算法,MCA 算法的PNSR 分別為28.43,28.12,26.82。相應的分離出來的紋理圖像的PNSR 為28.97,與之相對應CSCD 算法,BNN 算法,MCA 算法的PNSR 分別為28.21,26.32,26.47??偟膩碚f,本文的方法在兩種分離后成分相結(jié)合的情況下,得到了38.43dB 的PSNR,略低于CSCD 算法的PSNR,明顯高于BNN 和MCA 的PSNR。

圖4 本文算法與CSCD,BNN,MCA在貓+籠子圖像上分離結(jié)果的對比
本文提出了一種新穎的圖像分離方法,將給定的圖像分解為紋理和卡通部分。我們的方法是直接訓練卡通和紋理過濾器。利用這些學習濾波器,然后基于一個稀疏的圖像分離優(yōu)化框架。通過對一幅圖像進行分解使得其分解為卡通和紋理兩個部分,然后分別對這兩部分進行處理,即卡通對應著目標圖像的低、中頻部分,用變分模型進行處理,而紋理則對應其高頻部分,因此利用對細節(jié)部分有增強效果的分數(shù)階變分模型對其進行處理。實驗結(jié)果表明,由于引入了分數(shù)階變分模型,本文算法成功地將結(jié)構(gòu)、紋理,更好地實現(xiàn)了圖像的分解。