楊林聰,夏志華
(1.南京信息工程大學 語言文化學院,江蘇 南京,210044;2.南京信息工程大學 計算機與軟件學院,江蘇 南京,210044)
數字隱寫術利用人類的視覺、 聽覺等感知冗余以及多媒體的數據冗余,將秘密信息嵌入到公開的數字媒體中[1-2]。 隱寫分析以檢測和提取秘密信息為目的,判斷隱藏信息是否存在,估計密鑰并提取秘密信息。目前,隱寫分析的研究主要集中于秘密信息存在性的檢測,為此,本文作者對灰度圖像中空域 LSB(least significant bit)匹配隱寫的檢測進行研究。現有的LSB匹配的隱寫分析方法主要分為兩大類∶ 針對型和通用型檢測方法。其中,針對型方法設計1個統計特征,并對此特征設定1個閾值以判斷待檢測圖像是否隱藏信息。通用型方法通常提取對信息嵌入敏感的多維特征向量,然后,用基于學習的方法從大量樣本中學習載體與載密圖像之間的差別,以訓練出1個分類器來對秘密信息進行檢測。在針對型方法中,Harmsen等[3]將信息嵌入看成獨立加性噪聲,提取直方圖特征函數質心檢測隱藏信息。Ker[4]對Harmsen的方法進行了以下改進:(1) 用二維直方圖代替了一維直方圖;(2)用下采樣圖像作為載體圖像的校準版本對特征進行校準。Fridrich等[5]提出了基于最大似然估計的檢測方法,能估計嵌入的信息長度。然而,此算法在檢測未壓縮圖像時效果較差。為解決高噪聲圖像的檢測問題,Zhang[6]利用信息隱藏對圖像直方圖局部極值的影響提取特征,然而,此算法在檢測用 JPEG(joint photographic experts group)壓縮過的圖像時效果不佳。在通用型檢測算法中,Goljan等[7-8]從小波域提取特征來訓練分類器。Pevny[9]根據相鄰像素之間的依賴關系會受到信息隱藏的擾亂,利用馬爾可夫模型提取相應的特征,并用支持向量機對特征進行訓練和測試。Liu等[10]利用圖像最低和次低位平面內部的相關性提取特征,并指出隨著圖像復雜度的提高,其算法的檢測性能降低。許漫刊等[11-12]利用LSB匹配嵌入對直方圖的影響提取多維特征來訓練分類器。對于針對型和通用型檢測方法,其關鍵在于設計具有的區分圖像是否含有隱藏信息的特征。盡管LSB匹配嵌入的信息不會對人類視覺產生影響,但其無可避免地改變了圖像的某些特性,如空域LSB匹配嵌入可被模擬成在圖像中加入獨立噪聲,這會使圖像直方圖變平滑,并擾亂圖像相鄰像素之間的相關性。為此,本文作者針對性地提出基于圖像直方圖與圖像相鄰像素相關性特征的檢測方法。
將隱寫分析看成二類模式分類問題,特征提取是此問題的關鍵。 自然圖像的某些基本屬性會受到信息隱藏的影響如圖像直方圖以及圖像相鄰像素之間的相關性而發生改變。下面提取基于這些圖像屬性的特征。
1.1.1 LSB匹配嵌入策略
將灰度圖像用I表示,則圖像像素點可表示為0≤I(i,j)<2L,0≤i<M,0≤j<N。 其中:L為像素灰度值階數;M和N分別為圖像的高度和寬度。設(i,j)處的載體圖像的灰度為Ic(i,j),嵌入信息后的灰度為Is(i,j),秘密信息比特為b,則LSB匹配嵌入的基本策略如下:

1.1.2 LSB匹配對圖像直方圖的影響
定義圖像的像素直方圖h(n)=|{(i,j)|I(i,j)=n}|。將LSB匹配嵌入模擬成在圖像中加獨立加性噪聲,設嵌入率為p,則LSB匹配嵌入對圖像直方圖的影響可以表示如下:

若忽略直方圖邊界,則LSB匹配可看成用濾波器[p/4,1-p/2,p/4]對圖像直方圖進行低通濾波,這會使得圖像直方圖變平滑。
1.1.3 圖像直方圖特征提取
定義圖像直方圖相鄰元素的絕對差數組如下:

在Dh(i)的元素中,值較大的元素受到 LSB匹配嵌入的影響較大。對圖像Dh(i)中的元素進行排序,取T個最大的Dh(i)的元素作為特征。定義圖像直方圖梯度能量為:

由于LSB匹配會使得圖像直方圖變平滑,LSB匹配嵌入后,載密圖像的Ehg應該比載體圖像的小,因此,Ehg也可作為特征來檢測隱秘信息[11]。
在圖像獲取過程中,相機的顏色插值與校正、降噪及濾波等過程會使相鄰像素有很強的相關性。 由于秘密信息與圖像是相互獨立的,圖像相鄰像素之間的相關性會被秘密信息所擾亂[9]。
圖像相鄰像素之間的相關性可由圖像相鄰像素之間的差來表示。假定存在相鄰像素對(a,b),經過LSB匹配嵌入后,a與b以相等的概率加減1或者保持不變,那么,像素對的差值d=a-b也以一定概率p加減1、加減2或者保持不變,見表1。注意:表1沒有考慮像素為0和255的像素。

圖1 3 162幅圖像水平相鄰像素差的平均分布Fig.1 Average distribution of horizontal difference calculated from 3 162 images

表1 LSB匹配嵌入對相鄰像素差的影響Table 1 Change of difference between adjacent pixels after LSB matching

表2 LSB匹配嵌入對相鄰像素差的各種改變概率Table 2 Change of difference probability caused by LSBmatching
當嵌入率為1 byte/像素時,LSB匹配嵌入會對相鄰像素差按照一定的概率發生改變,如表2所示。由表2可知:不管相鄰像素差是多少,LSB都會按一定比率加減1、加減2或者保持不變。而在自然圖像中,相鄰像素之間的差服從以0為中心的高斯分布,如圖1所示。
經過嵌入后,相鄰像素之間差為0的數量減少,如圖2所示。本文運用共生矩陣模型對圖像相鄰像素之間的差進行建模,以提取圖像相鄰像素相關性特征。首先,沿水平(h)、垂直(v)、斜線(d)及反斜線(m) 4個方向計算相鄰像素差,得到4個差分圖像:

圖2 信息嵌入前后水平相鄰像素差的概率Fig.2 Probability of difference before and after LSB embedding


然后,從上述4個差分圖像分別統計出4個共生參數Ch,Cv,Cd和Cm:

其中:若x=y,則否則,?(x,y) = 0 。
最后,對4個共生矩陣相對應的元素取平均值,構成最終的特征矩陣,此矩陣中的元素可用于檢測秘密信息的特征。

由于自然圖像的多樣性,從自然圖中提取的特征也具有不平穩性,故由信息嵌入造成的圖像特征的變化很可能被圖像特征本身的多樣性所掩蓋。一般地,在原始圖像中嵌入信息對原始圖像的影響較大,而對載密圖像進行信息再嵌入對載密圖像的影響較小,因此,對待檢測圖像進行信息嵌入,構造1幅對應的校準圖像,分別從待檢測圖像和校準圖像提取特征,將對應特征的比值作為最終特征。綜上所述,檢測算法歸納如下:
(1) 對檢測圖像用LSB匹配進行嵌入,嵌入率為100%,得到對應的校準圖像。
(2) 分別從待檢測圖像和校準圖像提取直方圖特征和相關性特征,并用待檢測圖像的特征與校準圖像的特征的比值作為最終特征,組成特征向量。
(3) 在圖像庫中,用支持向量機對特征向量進行訓練和檢測。
在2個圖像庫上對提出的算法進行性能驗證,并與Ker[4]和Liu等[10]的算法進行比較。
NRCS為3 162幅未壓縮的圖像;FREEFOTO為10 408幅JPEG壓縮過的圖像,量化因子為75。 將所有圖像轉變成灰度BMP圖像,作為載體圖像用LSB匹配方法進行嵌入,嵌入比率包括100%,75%,50%和25%。 對于NRCS庫,本文用2 000幅載體圖像和2 000幅相應的載密圖像來訓練分類器。在2 000幅載密圖像中,4種嵌入比率的載密圖像各含500幅;測試圖像庫由1 162幅載體圖像和1 162×4=4 648幅載密圖像組成。對于FREEFOTO庫,用6 000幅載體圖像和6 000幅載密圖像來訓練分類器;測試圖像庫由4 408幅載體圖像和4 408×4=17 632幅載密圖像組成。
在實驗中,本文取T=20個圖像直方圖相鄰元素的絕對差作為圖像直方圖特征。另外,在提取相關性特征時,設定式(7)中的參數s和t,s和t∈{-3,-2,…,2,3}來限定特征維數,提取 7×7=49個圖像相關性特征。聯合直方圖梯度能量Ehg,共提取20+49+1=70個特征,參數通過實驗的方法設定用LIBSVM來訓練和測試分類器。選用RBF核函數,并用Grid搜索來確定核函數參數γ和錯分懲罰因子C。各檢測算法的支持向量機的參數見表3。

表3 支持向量機參數對(lg C,lg γ)Table 3 Parameters of SVM (lg C,lg γ)
采用檢測可靠性ρ來評價檢測方法的性能,其定義如下:

式中:A為ROC曲線下面的面積。 各檢測算法的性能ROC曲線見圖3和圖4,各算法的檢測可靠性ρ見表4。
同一個隱藏算法在不同圖像中隱藏的信息,其隱蔽性是有差異的,而且基于不同特征提取模型設計的隱藏信息檢測算法對不同圖像庫的檢測效果也不盡相同。

圖3 不同嵌入率下3種方法對圖像庫NRCS的檢測性能Fig.3 Performance comparison of methods on the detection of NRCS

圖4 不同嵌入率下3種方法對圖像庫FREEFOTO的檢測性能Fig.4 Performance comparison of methods on detection of FREEFOTO

表4 各檢測算法的可靠性Table 4 Detection reliability of methods
實驗中用了2個圖像庫NRCS和FREEFOTO對本文算法進行測試,其中NRCS包含的是從未經過壓縮的圖像,其圖像紋理豐富,噪聲成分較多;FREEFOTO包含了用JPEG壓縮過得圖像,其圖像所含噪聲成分相對較低。 從整體上來講,含噪聲成分較多的NRCS圖像中隱藏的信息與FREEFOTO圖像相比更難檢測。 這是因為LSB匹配嵌入的信息通常可以看出強度很弱的加性噪聲,此類噪聲很容易被圖像中原有的噪聲淹沒,因此,載體圖像中本來的噪聲能對隱藏信息起到很好的掩護作用。
基于不同特征提取模型設計的隱藏信息檢測算法對不同圖像庫的檢測效果也不盡相同。從表4可知:與比FREEFOTO相比,Ker[4]的特征在檢測NRCS圖像時更具優勢。Ker[4]利用信息嵌入對圖像直方圖的影響檢測隱藏信息。從本文理論推導可知,任何圖像在嵌入信息之后直方圖都會變平滑,因此,Ker[4]的算法在檢測2個圖像庫時都應該有較好的檢測性能。然而,從實驗結果可以看出,Ker[4]檢測圖像庫NRCS時的精度要比檢測 FREEFOTO時精度要高。其原因是圖像經過JPEG壓縮后,其直方圖變平滑,見圖5。因此,LSB匹配嵌入對經過JPEG壓縮過的圖像的直方圖平滑效果,要比未經過壓縮的圖像的平滑效果影響弱。
Liu的檢測方法是基本信息嵌入對圖像相關性的干擾提取特征,而 FREEFOTO中圖像相鄰像素之間的相關性較高,更易受到LSB匹配嵌入的干擾,因此,其算法在檢測JPEG壓縮過的圖像時更有優勢。本文算法全面考慮了 LSB匹配對圖像直方圖和圖像相關性的影響,并用校準圖像對特征進行校準,因而,獲得的檢測效果更好。

圖5 壓縮因子為75時未壓縮過的和JPEG壓縮過的圖像EghFig.5 Egh of Uncompressed and JPEG-compressed when quantization quality is 75
(1) 將LSB匹配嵌入模擬成像圖像中添加獨立加性噪聲,分析了LSB匹配對圖像直方圖和圖像相關性的影響。在檢測LSB匹配算法時,應全面考慮信息嵌入對這2類圖像屬性的影響。
(2) 根據LSB匹配對圖像造成的影響,利用差分模型和共生矩陣,提取了21個直方圖特征和49個相關性特征。運用嵌入信息的方法為待檢測圖像構造校準圖像,減小了圖像內容對隱藏信息檢測算法的負面影響。
(3) 基于圖像直方圖的特征在檢測未壓縮過的圖像時更具優勢,而基于圖像相關性的特征則更擅長檢測含噪聲較少的圖像中的隱藏信息。本文算法全面考慮了LSB匹配對圖像直方圖和圖像相關性的影響,并用校準圖像對特征進行校準,因而獲得了最佳的檢測效果。
[1]Lou D C, Hu C H.LSB steganographic method based on reversible histogram transformation function for resisting statistical steganalysis[J].Information Sciences, 2012, 188(4)∶346-358.
[2]Saha B, Sharma S.Steganographic techniques of data hiding using digital images[J].Defence Science Journal, 2012, 62(1)∶11-18.
[3]Harmsen J J, Pearlman W A.Steganalysis of additive noise modelable information hiding[C]//5th Conference on Security and Watermarking of Multimedia Contents.Santa Clara, Canada,2003∶ 131-142.
[4]Ker A D.Steganalysis of LSB matching in grayscale images[J].IEEE Signal Processing Letters, 2005, 12(6)∶ 441-444.
[5]Fridrich J, Soukal D, Goljan X.Maximum likelihood estimation of length of secret message embedded using +/- K steganography in spatial domain[C]//Security, Steganography and Watermarking of Multimedia Contents VII.Bellingham, 2005∶ 595-606.
[6]Zhang J, Cox I J, Doerr G, Ieee.Steganalysis for LSB matching in images with high-frequency noise[C]//9th IEEE Workshop on Multimedia Signal Processing.New York, 2007∶ 385-388.
[7]Goljan M, Fridrich J, Holotyak T.New blind steganalysis and its implications[C]//Security, Steganography and Watermarking of Multimedia Contents VIII.Bellingham, 2006∶ 7201-7213.
[8]Holotyak T, Fridrich J, Voloshynovskiy S.Blind statistical steganalysis of additive steganography using wavelet higher order statistics[C]//9th International Conference on Communications and Multimedia Security.Salzburg, Austria,2005∶ 273-274.
[9]Pevny T, Bas P, Fridrich J.Steganalysis by subtractive pixel adjacency matrix[C]//11th ACM Workshop on Multimedia Security Princeton, NJ, USA, 2009∶ 75-83.
[10]Liu Q Z, Sung A H, Ribeiro B, et al.Image complexity and feature mining for steganalysis of least significant bit matching steganography[J].Information Sciences, 2008, 178(1)∶ 21-36.
[11]許漫坤, 李天昀, 平西建.基于小波估計和直方圖特征的LSB匹配分析[J].計算機工程, 2009, 35(19)∶ 4-6.XU Mankun, LI Tianyun, PING Xijian.Steganalysis of LSB matching based on wavelet estimation and histogram features[J].Computer Engineering, 2009, 35(19)∶ 4-6.
[12]Cancelli G, Doerr G, Cox I J, et al.Detection of ± LSB steganography based on the amplitude of histogram local extrema[C]//15th IEEE International Conference on Image Processing.San Diego,USA, 2008∶ 1288-1291.