基于多分類器融合的圖像真?zhèn)舞b別方法

2014-08-05 02:40:56侯浩錄

計算機工程與應(yīng)用 2014年24期

關(guān)鍵詞：區(qū)域

邢楠，朱虹，王棟，侯浩錄

西安理工大學自動化與信息工程學院，西安 710048

基于多分類器融合的圖像真?zhèn)舞b別方法

邢楠，朱虹，王棟，侯浩錄

西安理工大學自動化與信息工程學院，西安 710048

1 引言

照片始自于1826年，新聞報道、個人證件、甚至呈堂證供中都少不了它的身影。為篡改事實或者增強視覺效果，被篡改的照片和圖片始終都與人們相伴。當前，由于各種功能強大的圖像處理軟件的廣泛使用，使得制作一張逼真的偽造圖像變得非常簡單，這甚至不需要造假者具有專業(yè)的知識。隨著互聯(lián)網(wǎng)時代的到來，偽造的照片會被迅速傳播到世界的各個角落，產(chǎn)生廣泛的影響。圖1就是兩張著名的涉嫌偽造的照片，而一些被篡改的照片甚至會引發(fā)諸多民事糾紛或法律問題。

針對數(shù)字圖像真?zhèn)舞b別問題，國內(nèi)外已經(jīng)做了一些相應(yīng)的研究，其中根據(jù)圖像中不同景物光照方向是否存在不一致，來檢測圖像的真?zhèn)蝃1]；以及利用雙一致性對拼接的圖像進行檢測[2]；還有根據(jù)單幅圖像中不同色彩之間的邊緣像素反推響應(yīng)函數(shù)，對所得到響應(yīng)函數(shù)的特殊狀態(tài)進行分析，從而判斷圖像是否經(jīng)過合成處理[3]。

為提高圖像真?zhèn)舞b別的準確率和適應(yīng)性，本文通過使用濾波器，將數(shù)碼相機中廣泛存在的一類噪聲檢測出來，使其作為相機的特征信息，通過分類器對其加以區(qū)分，并融合多個分類器的結(jié)果，最終對圖像的真?zhèn)巫鞒雠袛唷?/p>

2 相機噪聲特征的提取

根據(jù)Luká? J，F(xiàn)ridrich J等人的研究[4-5]，在數(shù)碼相機的內(nèi)部普遍存在著一種反映相機本身物理特性的噪聲，被稱為模式噪聲（Pattern Noise），它由固有模式噪聲（Fixed Pattern Noise，F(xiàn)PN）和光響應(yīng)非均勻性噪聲（Photo Response Non-Uniformity noise，PRNU）兩部分構(gòu)成，其中，PRNU是指圖像傳感器中基本單元對光照的不同敏感度，對于不同的圖像傳感器它又存在差異，因此，可以將其看作是圖像傳感器的固有屬性。

圖1 有偽造嫌疑的數(shù)碼照片

對于PRNU這種傳感器采集圖像時引入的微量噪聲，需要性能良好的濾波器才可以獲得。得益于小波變換本身所具有的低熵性、多分辨率、去相關(guān)性等特點，小波濾波器能夠在保持原始圖像特征的基礎(chǔ)上，更加精確地獲得細微的圖像噪聲。因此，本文采用基于小波系數(shù)隨機模型[6]構(gòu)建的小波濾波器。

受噪聲干擾的小波系數(shù)模型如圖2所示。其中，n(k)是均值為0，方差為σn2的高斯白噪聲；X(k)是無噪聲干擾圖像的小波系數(shù)，每個小波系數(shù)都被認為是獨立的，來自一個均值為0，方差為σ2(k)的高斯源；Y(k)表示觀測到的受噪聲干擾的圖像小波系數(shù)。

圖2 受噪聲干擾的小波系數(shù)模型

在上述模型中，小波系數(shù)滿足局部的獨立同分布，而且其方差所在區(qū)域是光滑的，為了獲得“干凈”的小波系數(shù) X(k)，采用最佳線性預(yù)測器進行估計，其表達式如下：

通過對樣本圖像進行五層小波分解，采用db8小波進行小波變換，可以得到各個小波子帶中的HH、HL、LH區(qū)域的小波系數(shù)，采用最大似然估計（ML）的方法，根據(jù)受噪聲干擾的小波系數(shù)周圍的鄰近區(qū)域，對每一個小波系數(shù)的方差進行估計，并通過最小均方誤差估計（MMSE）獲得最優(yōu)解，最終，將它代入公式（2），得到圖像各點小波系數(shù)X(k)的估計值Xˉ(k)，濾掉了樣本圖像的噪聲。圖3所示為小波去噪算法的示意圖。

圖3 小波去噪算法的示意圖

如圖4所示，以標準測試圖LADY為例，將小波濾波器與中值濾波器、空間維納濾波器[7]進行對比測試，可以發(fā)現(xiàn)，只有小波濾波器對正常拍攝的圖像進行處理后得到的殘差圖與原始圖像內(nèi)容不相關(guān)，即：通過濾波器所獲得的噪聲，僅僅反映相機內(nèi)部固有噪聲特性。

圖4 三種濾波器去噪效果的對比

同時，為了更加客觀地比較各個濾波器的性能，引入一系列圖像參數(shù)指標對其進行評判，這些參數(shù)包括：峰值信噪比PSNR，信噪比SNR，均方誤差MSE，相似度FNC等。表1列出了上述三種濾波器各項參數(shù)指標的的對比情況。其中，小波濾波器的各項參數(shù)指標均優(yōu)于其他兩類濾波器。

3 基于多分類器融合的真?zhèn)闻袆e

在獲得圖像固有噪聲之后，通過分類器對噪聲信息進行劃分，以便為鑒別圖像真?zhèn)翁峁┮罁?jù)。在進行真?zhèn)舞b別時，雖然圖像所包含的信息量非常大，但是往往關(guān)注的只是一些局部的區(qū)域，將這些可疑區(qū)域標記出來，對其進行鑒別，可以大大減少運算量。如圖5所示，圖像中包含房屋、綠地、文字等多種信息，而在進行圖像真?zhèn)舞b別時，只有兩個人物頭部特征相同的區(qū)域是最需要關(guān)注的，因此選擇該區(qū)域為可疑區(qū)域，對其真實性進行判別。

表1 各項參數(shù)指標的對比情況

圖5 在待測圖像中選取可疑區(qū)域

3.1 BP神經(jīng)網(wǎng)絡(luò)分類器

本文采用三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建分類器[8]，其拓撲結(jié)構(gòu)包括輸入層、隱層和輸出層。其輸入層為選定的可疑區(qū)域的噪聲圖像，其像素點作為BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點；輸出層節(jié)點數(shù)是2個，由輸出節(jié)點狀態(tài)可以判斷圖像的真和假；而隱層節(jié)點可以由公式（3）確定：

其中，mid表示隱層節(jié)點數(shù)，in表示輸入節(jié)點數(shù)，out表示輸出節(jié)點數(shù)，a取整數(shù)1。

對BP神經(jīng)網(wǎng)絡(luò)進行訓練時，采用不同相機型號來源的樣本圖像共計1 000張，其中真實圖像和偽造圖像所占各半。對所有樣本圖像中與可疑區(qū)域位置相同的部分進行濾波處理，獲得該區(qū)域的噪聲圖像，將其輸入網(wǎng)絡(luò)進行訓練并使網(wǎng)絡(luò)收斂，從而可以進行圖像真?zhèn)蔚呐袆e。

實驗測試表明，BP神經(jīng)網(wǎng)絡(luò)對于真實圖像的識別效果很好，而對偽造圖像識別率則偏低。經(jīng)過分析發(fā)現(xiàn)，這是因為偽造區(qū)域所占可疑區(qū)域的面積比例較小而導(dǎo)致的。如圖6（a）所示，偽造的海鷗只占可疑區(qū)域面積較小的一部分。為了提高偽造圖像的檢出率，本文采用交互的方式，如圖6（b）所示，將待測圖像中可疑區(qū)域的核心目標物框定，將框定范圍內(nèi)的區(qū)域作為BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點，通過網(wǎng)絡(luò)進行判別。即：通過提高可疑目標所占區(qū)域的面積比，來提高BP神經(jīng)網(wǎng)絡(luò)的識別準確率。

圖6 在可疑區(qū)域中框定核心目標物

3.2 廣義高斯特征分類器

其中，R為所選擇的可疑區(qū)域，PC(R)為某相機在R區(qū)域的噪聲圖像，它是相機大量樣本圖像在對應(yīng)可疑區(qū)域噪聲的平均值，n(R)為待測圖像在R區(qū)域的噪聲圖像，(R)和ˉ(R)分別為PC(R)和n(R)的均值，ρ(n(R)，PC(R))為相關(guān)系數(shù)，表示兩者的相關(guān)程度，‖·‖則表示二范數(shù)。

實驗測試表明，通過給相關(guān)系數(shù)設(shè)定一個閾值，對待測圖像加以判斷，其檢出率并不高。由于待測圖像噪聲和某相機圖像噪聲并不滿足完全獨立同分布的高斯模型，它們之間存在一定相關(guān)性，因此，引入廣義高斯分布[9]對噪聲之間的相關(guān)系數(shù)進行判斷。廣義高斯分布的概率密度函數(shù)表達式如下所示：

待測圖像在可疑區(qū)域的固有噪聲與該相機在對應(yīng)區(qū)域固有噪聲的統(tǒng)計規(guī)律的一致性判別，可以通過相關(guān)系數(shù)來實現(xiàn)，以相關(guān)系數(shù)的大小來判斷待測圖像是否系偽造。其計算公式如下：

進而得到判斷真?zhèn)蔚臈l件，也就是得到隨機變量 ρ（即：相關(guān)系數(shù)）在已建立的模型中的概率值P，即P= G(ρ)，通過概率值的大小，可以對待測圖像的真?zhèn)巫鞒雠袛郲11]。該方法相較于對相關(guān)系數(shù)給定閾值，檢測偽造圖像和真實圖像的準確率均有所提升。

由于BP神經(jīng)網(wǎng)絡(luò)分類器以及廣義高斯特征分類器具有各自不同的特點，并且，它們對于真實圖像和偽造圖像的檢測效果也各有側(cè)重。因此，本文將這兩個分類器進行融合，對對分類結(jié)果加以綜合判斷。

其中，參數(shù) μ，σ2，β，α分別對應(yīng)廣義高斯分布的均值，方差，形狀參數(shù)以及尺度參數(shù)。對于一組樣本，其主要參數(shù)α和 β可以利用牛頓迭代法獲得其最優(yōu)解[10]。根據(jù)估計的分布參數(shù)，就可以得到相應(yīng)的廣義高斯分布的概率密度函數(shù)。在已知概率密度函數(shù) f(x，α，β，μ)的情況下，對其積分可以求得分布函數(shù)：

3.3 分類器綜合

使用多個分類器對事件進行分類時，為了實現(xiàn)不同分類器的優(yōu)勢互補，通常是將不同分類器的分類結(jié)果進行融合，以提高分類識別效果以及魯棒性。進行分類器融合時，經(jīng)常會采用“一致通過”準則、“大多數(shù)同意通過”準則等投票組合規(guī)則[12-13]。本文針對兩種分類器的結(jié)果進行融合時，采用了部分投票組合的規(guī)則。

兩個分類器對待測圖像的真?zhèn)芜M行判斷時，如果BP神經(jīng)網(wǎng)絡(luò)分類器和廣義高斯特征分類器的判斷結(jié)果是一致的，則按照“一致通過”準則，接受兩者的判斷結(jié)果。如果BP神經(jīng)網(wǎng)絡(luò)分類器和廣義高斯特征分類器的判斷結(jié)果是相互矛盾的，即：廣義高斯特征分類器判斷待測圖像是假圖，而BP神經(jīng)網(wǎng)絡(luò)分類器判斷是真圖，接受廣義高斯特征分類器的判斷結(jié)果，反之，則接受BP神經(jīng)網(wǎng)絡(luò)分類器的判斷結(jié)果。

4 實驗結(jié)果分析

在BP神經(jīng)網(wǎng)絡(luò)分類器的實驗中，選取五種不同型號相機：佳能A80，佳能IXUS75，柯達LS420，美能達Z6，尼康E2000拍攝的照片作為樣本進行測試。其中，真實圖像500張（來自佳能A80型相機）和偽造圖像500張（其他四種型號相機），合計1 000張樣本圖像。使用上述樣本圖訓練BP神經(jīng)網(wǎng)絡(luò)并使其收斂。隨后，對200張待測圖像進行鑒別，其中，偽造圖像100張，真實圖像100張。實驗結(jié)果顯示，BP神經(jīng)網(wǎng)絡(luò)分類器對于真實圖像具有較高的檢出率，而通過交互方式進行處理后，偽造圖像的檢出率得到大幅提升。

在廣義高斯特征分類器的實驗中，選取10種不同型號的相機：佳能A80，尼康L1，索尼T3，佳能A570，柯達LS420，美能達Z6，尼康E2000，尼康E950，索尼T3，索尼α200，佳能IXUS75。在上述型號相機拍攝的圖像中，共選取1 000張樣本圖像，計算其關(guān)于相關(guān)系數(shù) ρ的廣義高斯分布情況，并利用概率P進行判斷。使用200張待測圖像進行鑒別，其中，偽造圖像100張，真實圖像100張。實驗結(jié)果顯示，采用廣義高斯分布對相關(guān)系數(shù)加以判斷，相較于給定閾值的相關(guān)系數(shù)判斷，偽造圖像和真實圖像的檢出率均有所提升，特別是對于偽造圖像的提升更加明顯。

將兩種分類器進行綜合后，很好地實現(xiàn)了兩種不同分類方法的相互補充。對200張待測圖像進行鑒別，其中，100張偽造圖像的檢出率達到95%，100張真實圖像的檢出率為93%。具體鑒別結(jié)果見表2。

表2 不同方法實驗的結(jié)果（%）

5 結(jié)束語

本文采用小波濾波器提取數(shù)碼相機所固有的噪聲特征，將BP神經(jīng)網(wǎng)絡(luò)和廣義高斯特征兩種分類器的判斷結(jié)果進行融合，對待測圖像的真?zhèn)芜M行鑒別。實驗結(jié)果表明，算法對于采用復(fù)制、模糊等手段得到的偽造圖像均具有較高的檢出率。

[1]Johnson M K，F(xiàn)arid H.Exposing digital forgeries by detecting inconsistencies in lighting[C]//Proceedings of the 7th Workshop on Multimedia and Security，2005：1-10.

[2]Ng T T，Chang S F，Sun Q.Blind detection of photomontage using higher order statistics[C]//Proceedings of the 2004 International Symposium on Circuits and Systems，2004，5：688-691.

[3]Lin Z，Wang R，Tang X，et al.Detecting doctored images using camera response normality and consistency[C]// IEEE Computer Society Conference on Computer Vision and Pattern Recognition，2005，1：1087-1092.

[4]Luká? J，F(xiàn)ridrich J，Goljan M.Detecting digital image forgeries using sensor pattern noise[C]//SPIE，2006：362-372.

[5]Lukas J，F(xiàn)ridrich J，Goljan M.Digital camera identification from sensor pattern noise[J].IEEE Transactions on Information Forensics and Security，2006，1（2）：205-214.

[6]Mihcak M K，Kozintsev I，Ramchandran K.Spatially adaptive statistical modeling of wavelet image coefficients and its application to denoising[C]//1999 IEEE International Conference on Acoustics，Speech，and Signal Processing，1999，6：3253-3256.

[7]Wiener N.Extrapolation，interpolation，and smoothing of stationary time series：with engineering applications[M]. [S.l.]：MIT Press，1964.

[8]Rumelhart D E，McClelland J L.Parallel distributed processing：explorations in the microstructure of cognition，volume 1：foundations[M].[S.l.]：MIT Press，1986.

[9]Chang S G，Yu B，Vetterli M.Adaptive wavelet thresholding for image denoising and compression[J].IEEE Transactions on Image Processing，2000，9（9）：1532-1546.

[10]Do M N，Vetterli M.Wavelet-based texture retrieval using generalized Gaussian density and Kullback-Leibler distance[J].IEEE Transactions on Image Processing，2002，11（2）：146-158.

[11]Birney K A，F(xiàn)ischer T R.On the modeling of DCT and subband image data for compression[J].IEEE Transactions on Image Processing，1995，4（2）：186-193.

[12]Kimura F，Shridhar M.Handwritten numerical recognition based on multiple algorithms[J].Pattern Recognition，1991，24（10）：969-983.

[13]Xu L，Krzyzak A，Suen C Y.Methods of combining multiple classifiers and their applications to handwriting recognition[J].IEEE Transactions on Systems，Man and Cybernetics，1992，22（3）：418-435.

XING Nan,ZHU Hong,WANG Dong,HOU Haolu

College of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China

By applying the filter which is in the wavelet domain,a certain noise is extracted which can reflect the camera physical characteristic and it further serves as the key feature to detect the authenticity of digital image.The noise characteristics of suspicious region in the image are determined and aggregated by the generalized Gaussian classifier and BP neural network classifier,to detect forgeries in digital images.The experimental results show the approach provides a relative high accuracy on detecting digital images that are forged in various ways.

camera noise;wavelet domain filter;generalized Gaussian;Back Propagation（BP）neural network;authenticity of digital image detection

針對數(shù)字圖像的真?zhèn)舞b別問題，通過在小波域上構(gòu)造的濾波器，提取反映相機本身物理特性的某種特定噪聲，將其作為判斷圖像真?zhèn)蔚年P(guān)鍵特征。在待測圖像中選取出可疑區(qū)域，將其噪聲特征通過廣義高斯分類器以及BP神經(jīng)網(wǎng)絡(luò)分類器進行判斷和融合，從而實現(xiàn)圖像的真?zhèn)舞b別。實驗結(jié)果表明，該方法對多種不同偽造方式的數(shù)字圖像均具有較高的識別正確率。

相機噪聲；小波域濾波器；廣義高斯；反向傳播（BP）神經(jīng)網(wǎng)絡(luò)；圖像真?zhèn)舞b別

TP391

10.3778/j.issn.1002-8331.1304-0460

XING Nan,ZHU Hong,WANG Dong,et al.Authenticity of digital image detected algorithm based on multiple classifiers aggregation.Computer Engineering and Applications,2014,50（24）：164-167.

陜西省教育廳科學研究計劃項目（No.11JK1047）。

邢楠（1980—），男，博士研究生，講師，主要研究領(lǐng)域為數(shù)字圖像處理；朱虹（1963—），女，博士，教授，博士生導(dǎo)師，主要研究領(lǐng)域為模式識別、數(shù)字圖像處理；王棟（1979—），男，講師，主要研究領(lǐng)域為數(shù)字圖像處理；侯浩錄（1973—），男，講師，主要研究領(lǐng)域為信號處理。E-mail：sportsman_xing@163.com

2013-05-03

2013-07-17

1002-8331（2014）24-0164-04

CNKI網(wǎng)絡(luò)優(yōu)先出版：2014-03-07,http∶//www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1304-0460.html