李健宇,趙祥寧,任曉文,王 濤,郭一娜
(太原科技大學 電子信息工程學院,太原 030000)
相位恢復是指通過某種變換重新構造出圖像的相位信息.過去幾十年,許多學者和團隊對相位恢復的問題進行了大量的研究,提出了多種不同算法,主要有經典的GS(Gerchberg-Saxton,GS)算法[1,2],TIE(Transport of Intensity Equation,TIE)算法[3].近來,相位恢復技術一直是光學領域的研究熱點,比如相干衍射波的成像方式,用相干波照射物體來測量遠場衍射波的分布圖.相位恢復算法也被廣泛應用于其它方面,諸如光學圖像的加密和認證[4]、全息技術的攝影成像[5]、合成孔徑雷達的目標重建[6,7]、顯微技術下的生物細胞定量等.
經典圖像相位恢復算法諸如HIO(Hybrid Input-Output,HIO)改進算法、RAAR(Relaxed Averaged Alternating Reflection,RAAR)算法[13]只適合解決凸優化的函數問題,迭代次數少,可以快速實現收斂,但是容易造成局部收斂.相位恢復的非凸算法可以保證算法的全局收斂,提高圖像相位的恢復效果.針對相位恢復的非凸集合的問題,近年來研究人員提出了不少解決辦法,文獻[8]中Candes和Strohmer學者提出了Phase Lift算法,通過某種變換,將原始圖像提升到多維空間,再利用半定松弛(Semi-Definite Program,SDP)算法最小化多維信號的tr(X),將凸優化問題轉化為非凸問題的相位恢復.同樣,文獻[9]作者在Phase Max算法的基礎上,引入一種特定閥值,通過對非凸函數設置特定的迭代次數,提高圖像相位恢復的數值精度,但是上述兩種非凸優化算法需要大量的計算資源,算法穩定性低[10].
文獻[11]已經證明信號的STFT變換可以保證相位恢復的唯一性,文獻[12]學者提出了一種利用STFT幅度測量值恢復相位的非凸優化算法,但是該算法只適合處理一維短信號,當數據量增多的時候,該算法的相位恢復性能較差.本文提出了一種基于STFT幅度測量值的圖像相位恢復的非凸算法(Phase Retrieval of Image based on STFT magnitude,IPR-STFT),本文把原始圖像灰度值矩陣分為多個模塊化矩陣,構造一個基于圖像灰度值模塊矩陣的非凸損失函數,利用最小二乘法(Least Squares,LS)獲取該非凸損失函數的迭代初始值,通過梯度下降法(Gradient Descent,GD)的迭代優化,保證相位恢復的全局收斂,同時IPR-STFT算法對每個模塊化灰度值矩陣進行相位恢復,提高了該算法的計算效率.
假設一幅灰度圖像的灰度值點矩陣為:
將該圖像灰度值點矩陣轉化為若干個灰度值矩陣的集合:
其中Iij={x(i,(j-1)×N+1),x(i,(j-1)×N+2),…,x(i,j×N)},1≤i≤n,1≤j≤n/N,i=1,2,…,n,j=1,2,…,n/N,灰度值矩陣Iij的長度值為N.
針對一幅二維圖像S的短時傅里葉變換(Short-time Fourier Transfer,STFT)Xij∈N,可以被定義為二維圖像S的傅里葉變化乘以一個長度為W的滑動窗口函數g(n),即:
(1)

同時對圖像S進行STFT采樣之后,通過公式(2)變換之后,對圖像S進行了相位信息的消除:
Zij(τ,k)=|Xij(τ,k)|2+Nij
(2)
在公式(2)中,|Xij(τ,k)|2用來消去灰度值矩陣Iij的相位,保證不包含任何原始圖像S的相位信息.同時“Nij”表示在相位恢復過程中引入的虛擬相位.
由于信號在時間移位,共軛轉置,全局相位轉變等過程中可能會改變它的STFT變換的測量值[11],公式(2)中Zij(τ,k)不能保證圖像S相位恢復的獨立性,圖像相位恢復的問題可表示為:
(3)
其中,當W≤l≤N-W時,Yij(τ,l)=0,Yij(τ,l)可被稱作是一個 “W-有限帶寬函數”[12].該公式可以描述為多重線性方程組,即可轉化為:
yij=GlIij
(4)

針對公式(3)中“二元限定”問題,通過一種改進的特定的最小二乘法(Least Square method,LS),把相位恢復的問題轉化為矩陣秩為1的約束映射:
(5)
(6)
通過GD算法最小化上述非凸損失函數,該非凸損失函數的第k次迭代可描述為:

(7)
其中“μ”表示梯度下降步長.參數μ可以根據可選閾值進行選擇,經過多次仿真實驗的測試與觀察,當參數μ=0.05時,圖像相位的恢復質量比較好.
為驗證IPR-STFT算法的恢復質量和魯棒性,該算法的恢復誤差通常定義如下[13]:
(8)
其中i=1,2,…,n,j=1,2,…,n/N,“‖‖2”表示向量2范數.
本文提出的IPR-STFT算法模型如圖1所示,IPR-STFT算法過程的具體流程圖如圖2所示.IPR-STFT算法中GD算法需要對非凸損失函數多次迭代,通過LS目標函數的特征向量獲得的優化后的迭代初始值點,減少迭代次數,提高算法運算效率.

圖1 IPR-STFT算法模型Fig.1 Pattern of the IPR-STFT algorithm

圖2 相位恢復流程圖Fig.2 Flow chart of Phase recovery
為了觀察本文提出的IPR-STFT模型算法的恢復效果和性能,本文采用Lena、Cameraman和Grass的灰度圖像作為實驗標準參考對象,三種圖像的輪廓和紋理信息各不相同,如圖3所示,圖像大小為145*145.文中將Phase Lift和phase Lamp兩種非凸優化算法與本文提出的IPR-STFT算法的進行比較.本次實驗過程中設置三種實驗條件:1)無噪聲干擾;2)高斯噪聲干擾;3)椒鹽噪聲干擾.

圖3 原始圖像 SFig.3 Original image S
本文的第一組仿真實驗是在無噪聲干擾條件下進行的,為保證各種算法實驗結果的精確度,實驗過程中設置最大迭代次數為3000次,采用恢復誤差(Re)、圖像相關性(Correlation Coefficient)、峰值信噪比[14](Peak Signal to Noise Ratio,PSNR)、作為圖像恢復效果的評價指標,客觀衡量IPR-STFT算法的恢復性能.每次仿真實驗獨立運行4次,選取4次實驗結果的平均值作為評價參數.表中數值保留4位有效數字.


圖4 相位恢復后圖像Fig.4 Image after phase retrieval



圖像算法RePSNR(dB)圖像相關性LenaIPR-STFT0.035635.690.9843PhaseLift0.164722.970.8554PhaseLamp0.233421.010.7926Camera-manIPR-STFT0.0442335.030.9803PhaseLift0.121125.040.8927PhaseLamp0.223221.530.8111GrassIPR-STFT0.047535.240.9701PhaseLift0.153623.880.8710PhaseLamp0.208222.520.8263
本文第二組仿真實驗在第一組仿真實驗過程的基礎上,對Lena原始圖像添加高斯噪聲(Gaussian Noise),高斯噪聲是指噪聲的概率密度函數服從高斯分布(即正態分布)的一類噪聲,實驗過程中噪聲強度[15]參數設置分布在0~0.01之間.
第三組仿真實驗在第一組仿真實驗過程的基礎上,對Lena、原始圖像引入椒鹽噪聲,椒鹽噪聲(Salt & Pepper Noise)[16]是由圖像傳輸,信道編碼等過程產生的黑白相間的亮暗點噪聲,是圖像傳送過程中常見的一種噪聲,該實驗仿真過程中噪聲強度參數分布在0~0.10.
第二組和第三組實驗分別在不同噪聲類型和噪聲強度的條件下,通過對IPR-STFT、Phase Lift和Phase Lamp三種非凸優化算法進行相關相位恢復實驗,驗證本文提出的IPR-STFT算法的抗噪聲性能,實驗結果仍將恢復后圖像相關性(Correlation Coefficient)和峰值信噪比PSNR,作為算法抗噪聲性能的評價指標.


噪聲類型噪聲強度(δ)IPR-STFTPhaseLiftPhaseLampPSNR(dB)圖像相關性PSNR(dB)圖像相關性PSNR(dB)圖像相關性高斯噪聲035.690.984322.970.855421.010.76330.00234.940.971822.190.821120.120.71240.00434.520.964321.720.801919.410.69610.00634.280.960021.340.784018.970.66920.00834.070.953420.990.740318.530.65040.01033.960.932020.680.732218.160.6391椒鹽噪聲035.690.984322.970.855421.010.76330.0234.620.965821.340.762619.090.67050.0434.050.941220.580.730918.140.63810.0633.630.920820.060.718117.420.62100.0833.370.914319.550.700616.860.60530.1033.160.885919.100.675016.350.5802


圖5 高斯噪聲下圖像下降值Fig.5 PSNR reduction of image under Gaussian Noise
為了更直觀和準確地描述三種算法的抗噪性能,圖5、圖6是在高斯噪聲或者椒鹽噪聲條件下,隨著噪聲強度增加,基于IPR-STFT、Phase Lift和Phase Lamp算法相位恢復后Lena圖像PSNR值的下降情況,從圖5、圖6中可以看出,隨著高斯噪聲或者椒鹽噪聲強度的增加,相比于Phase Lift和Phase Lamp兩種算法,基于IPR-STFT算法相位恢復后Lena 圖像PSNR值的下降程度更加緩慢,說明隨著噪聲強度的增加,高斯噪聲或者椒鹽噪聲對于IPR-STFT算法的干擾能力逐漸降低.通過上述實驗結果分析,本文提出的 IPR-STFT非凸優化算法的抗噪聲性能優于Phase Lift和Phase Lamp兩種非凸算法.

圖6 椒鹽噪聲下圖像下降值Fig.6 PSNR reduction of image under Salt & Pepper Noise
本文利用秩為1的近似矩陣的特征向量,通過非凸損失函數的迭代優化,提出了一種基于STFT幅度測量值的圖像相位恢復算法.基于圖像若干個小的灰度值矩陣,解決了圖像相位恢復非凸優化的問題,保證了相位的全局收斂.通過多組仿真實驗觀察,IPR-STFT算法的圖像相位恢復性能較好,并且具有較強的抗噪聲性能.在高斯噪聲和椒鹽噪聲的干擾性下,圖像整體輪廓結構比較清晰.在圖像相位恢復過程中,如何減少非凸損失函數的迭代次數,提高算法效率,減少算法的時間復雜度,將是下一步研究的重點.