趙俊紅
(華南理工大學自動化科學與工程學院,廣東廣州510640)
隨著數字圖像處理技術的飛速發展,人們可以利用各種圖像處理工具(如Photoshop等)對圖像進行篡改而不留下人眼可以觀察到的痕跡.這些篡改有些只是為了娛樂大眾,但也有很大部分會給社會帶來危害(如華南虎事件),因而圖像的真偽鑒別變得非常重要.
依據是否事先往圖像中添加信息,目前的圖像真偽鑒別技術可以分兩大類:主動取證技術和被動取證技術.主動取證技術是往圖像中加入數字水印信息或數字簽名信息,通過判斷數字水印信息和數字簽名信息是否完整來判斷圖像是否被篡改[1].主動取證技術的研究較為成熟,但由于需要事先向原始圖像中加入水印或簽名信息,而實際上需要真偽鑒定的圖像往往只有它本身,很難得到或無法得到原始圖像,因而限制了主動取證技術的使用.數字圖像被動取證不需要水印或簽名信息,直接利用圖像本身信息來判斷圖像的真偽,應用范圍十分廣泛,是數字圖像研究中的新興前沿領域.
篡改圖像的操作方式很多,文獻[2]中將圖像的篡改手段分成6大類:合成、變形、修整、增強、計算機生成、繪制.在這些篡改方法中不可避免地會用到縮放、旋轉、模糊等圖像篡改操作,而且為了掩飾篡改中留下的痕跡,往往會使用模糊操作來潤飾圖像邊緣,如果能夠找出圖像中人工模糊操作的證據,則可以將其作為圖像被篡改的證據,達到圖像被動取證的目的.國內外學者對圖像的模糊操作有了一定的研究.針對高斯模糊,孫堡壘等[3]提出了一種基于Benford定律的高斯模糊取證方法,該方法利用經過高斯低通濾波后的自然圖像紅綠藍(RGB)三通道趨向一致的性質,在大量實驗的基礎上總結出模糊圖像的離散余弦變換(DCT)域交流系數在Benford域的兩個性質,從而構造特征,根據篡改前后差異的顯著性水平來設定閾值,對待檢對象的真實性作出判決.針對人工模糊和離焦模糊,周琳娜[4]利用同態濾波縮小離散模糊邊緣的動態范圍,同時增強人工模糊的拼接邊緣,弱化自然正常邊緣,再通過腐蝕運算排除自然邊緣,提取定位出圖像拼接邊緣;基于在圖像聚焦的區域找到模糊區域,Hsiao等[5]將圖像經DCT變換后的每個DCT塊的能量譜與整個圖像的能量譜進行比較,分別得到模糊區域和銳化區域,如果能在銳化區域找到模糊區域,則認為圖像被篡改過;Sutcu等[6]根據圖像小波變換的規律來估計圖像邊緣的清晰度和模糊度,進而檢測定位圖像篡改區域;王波等[7]認為模糊操作破壞了圖像的局部相關性和局部一致性,提出了一種利用局部異常色調率來對模糊操作進行檢測和定位的方法;陳英等[8]引入“不和諧點”概念,若在待檢測圖像的邊緣找到大量消失的“不和諧點”,則將其作為圖像被篡改的證據.正常聚焦的真實圖像中物體的邊緣一般來說是清晰的,篡改后的圖像為了掩飾新添加的物體痕跡,往往會在新添加的物體邊緣處進行人工模糊操作,使得過渡自然不易被發現.很多圖像處理軟件都提供模糊操作,如Photoshop中提供的各種模糊濾鏡.經過人工模糊操作后的邊緣比正常聚焦圖像邊緣要模糊一些;同時由于模糊后的邊緣在視覺上仍然是肉眼可以明顯區分出來的,因此人工模糊操作后的邊緣比散焦模糊邊緣及平坦區域要清晰一些.
針對篡改圖像的邊緣模糊,文中首先采用圖像模糊增強技術得到人工模糊操作邊緣被增強而其它部分被弱化的圖像;然后對原篡改圖像進行分塊,利用粗糙集對子圖像塊進行分類,排除平坦區域和自然清晰強邊緣后得到另外一個圖像,最后將這兩個圖像融合得到僅保留人工模糊邊緣的結果圖像,從而達到被動取證的目的.
由前面分析可知,人工模糊操作邊緣是介于正常清晰邊緣、散焦模糊邊緣及平坦區域之間的,人工模糊操作邊緣、正常清晰邊緣、散焦模糊邊緣與平坦區域之間的差異不是涇渭分明的,而是具有不確定性和不精確性,在過渡中出現“亦此亦彼”的現象.要想將人工模糊操作邊緣與正常清晰邊緣、散焦模糊邊緣及平坦區域區分開來,需要有一種可以增強人工模糊操作邊緣而弱化正常清晰邊緣和散焦模糊邊緣與平坦區域的方法.模糊數學善于處理“亦此亦彼”的不確定性問題和不精確性問題,因此文中引入模糊數學,對待檢測的圖像進行圖像模糊增強.
1965年,Zadeh[9]提出了模糊數學的概念.20世紀80年代起,模糊數學開始被廣泛應用于數字圖像處理領域,并取得了大量的研究成果,其中之一就是數字圖像的模糊增強[10].
自然界中大量的事件不是簡單的“是”或“不是”就能夠刻畫的,而是具有“亦此亦彼”的模糊現象和模糊概念.普通集合只能夠刻畫某一個元素x絕對屬于(特征函數為1)或不屬于(特征函數為0)集合A.為此,Zadeh[9]提出了模糊集合的概念,將模糊集合記為,并將取值在[0,1]閉區間上的隸屬函數μ~A(x)作為刻畫模糊集合中元素x隸屬于的程度的特征量.
一個M×N的二維圖像I中,設像素點(i,j)隸屬于某一個模糊集合~A的程度為μ(i,j),則矩陣

為圖像I的模糊特征平面.
為了能夠檢測出人工模糊操作邊緣,需要增強人工模糊操作邊緣,則模糊集合~A=“人工模糊操作邊緣”.邊緣的人工模糊操作實質上是一種低通濾波,如Photoshop中的高斯模糊其實就是高斯低通濾波,均值模糊是均值濾波.與真實清晰邊緣相比,人工模糊操作邊緣的像素在灰度上與其周圍的像素點灰度值更趨于一致;但與散焦區域和平坦區域相比,由于人工模糊操作后的邊緣在視覺上仍然是一條較為清晰的邊緣,因此像素點灰度值與周圍像素點的一致性比平坦區域和散焦區域弱.因此設計出一個能準確反映出這三者區別的隸屬函數至關重要,即設計出的隸屬函數能使散焦區域、平坦區域以及真實清晰邊緣的隸屬函數變小,而使人工模糊操作邊緣的隸屬函數變大.因此文中選用中間對稱的隸屬函數,即梯形分布型隸屬函數:式中:μ(i,j)為圖像I中像素點(i,j)對于模糊集合~A的隸屬度;Y(i,j)為圖像I中點(i,j)的灰度值I(i,j)與周圍像素灰度值均值之差的絕對值,即分別為依據具體圖像設定的閾值.從式(1)可知:

(1)如果Y(i,j)≤a-a2,那么μ(i,j)=0,即確定平坦區域和散焦區域的隸屬度為最小;
(2)如果a-a1≤Y(i,j)<a+a1,那么μ(i,j)=1,即確定人工模糊操作邊緣的隸屬度為最大;
(3)如果a-a2<Y(i,j)≤a-a1,那么μ(i,j)=,即確定平坦區域、散焦區域與人工操作模糊邊緣之間過渡像素點的隸屬度,讓二者線性過渡,體現模糊數學的“亦此亦彼”特點;
(4)如果a+a2<Y(i,j),那么μ(i,j)=0,即確定真實清晰邊緣的隸屬度為最小;
(5)如果a+a1≤Y(i,j)<a+a2,那么μ(i,j)=,即確定真實清晰邊緣與人工操作模糊邊緣之間過渡像素點的隸屬度,讓二者線性過渡,體現模糊數學的“亦此亦彼”特點.
根據隸屬函數(1)得到的模糊特征平面X能夠將人工模糊邊緣和自然邊緣、平坦區域、散焦區域的隸屬度明顯地區別開來,前者的隸屬度明顯大于后三者的隸屬度.
經過式(1)的變換,可以得到一個大小為M×N的二維圖像I隸屬于某一個模糊集合~A的模糊特征平面X.此模糊特征平面的特點是:人工模糊操作邊緣像素點處的隸屬度較大,而其它像素點的隸屬度小.選用合適的隸屬度變換函數T(·)對模糊特征平面X中的每個隸屬度進行變換,使得人工模糊操作邊緣處的隸屬度更大,而自然邊緣、散焦區域、平坦區域等隸屬度更小,從而進一步增大它們之間的差別,達到圖像增強的目的.設計函數T(·)時應遵循如下準則:(1)在0≤μ≤1內,有0≤T(μ)≤1,即變換后的新隸屬度仍然在[0,1]內;(2)T(·)應該是單調遞增函數,即變換后新的隸屬度之間的大小次序不變.重復進行隸屬度變換,最終得到一個二值圖像.
文中采用如下的隸屬度變換函數對模糊特征平面X的每一隸屬度μ進行迭代:

式中,μ(i,j)n-1和μ(i,j)n分別是隸屬度μ(i,j)的第n-1次、第n次迭代值.
圖1(a)所示原圖像是一個典型的拷貝-移動型篡改,將別處的犀牛“移花接木”到樹葉上.采用式(1)針對性地對人工模糊操作邊緣進行圖像模糊增強后,所得結果如圖1(b)所示.由圖1(b)中可知,圖1(a)中因散焦而模糊的背景區域、平坦區域(如大片樹葉的中間部分)和大部分自然邊緣(較清晰的樹葉邊緣)被減弱甚至消失,而人工模糊邊緣和區域得到凸顯,取得了比較好的增強效果;但圖像中更清晰的部分(如右下方大樹葉邊緣、犀牛身體上)卻未被減弱,說明這種方法對人工模糊邊緣、散焦區域和平坦區域的區分效果比對人工模糊邊緣和自然清晰強邊緣的效果要好,因為人工模糊邊緣像素點的灰度值與周圍平坦區域或散焦區域像素點灰度平均值的差值較其與自然邊緣像素點的灰度平均值的差值大.此外,這種方法在設計隸屬函數μ(i,j)時,閾值a、a1、a2的選取與具體圖像有關.

圖1 基于模糊增強的圖像取證Fig.1 Image forensics based on fuzzy enhancement
粗糙集是一種處理不完整性和不確定性問題的軟計算方法,在20世紀80年代由Pawlak[11]提出后已經在機器學習、知識獲取、模式識別等領域得到了廣泛的應用.知識簡約是粗糙集理論的核心內容之一.文獻[12]中運用粗糙集的屬性約簡得到子圖像塊的低高頻能量比B、頻域熵H、均值和方差D并作為條件屬性,再用規則約簡獲得判斷圖像塊是平滑區域還是劇變區域的規則.這些粗糙集理論在數字壓縮領域獲得的約簡屬性和約簡規則具有普適性,所以文中將其運用到數字圖像取證中.基于粗糙集的被動圖像取證算法的具體步驟如下:
1)計算4個條件屬性.將圖像劃分成大小為k×k的不重疊分塊,獲得每個圖像塊的DCT系數,然后計算每個圖像塊的低高頻能量比B、頻域熵H、空域屬性均值和方差D,其中

式中:βm為第m個圖像塊經DCT后的系數;r為遠小于k2的正整數,代表包括直流分量在內的前幾個低頻變換系數的數目;B越大說明圖像塊的灰度分布越平滑,B越小說明包含的細節和邊緣等高頻成分越多;H越大,說明圖像塊中包含的細節和邊緣成分越多.
2)根據粗糙集的約簡、合并規則,得到規則1-5.
規則1若(B很大)or(H很小)or(很小)and(D較小),則該圖像塊為平坦區.
規則2若(H很大)and(和D很小)and(B很小),則該圖像塊為強邊緣區.
規則3若(H很大)and(很大),則該圖像塊為強邊緣區.
規則4若(H較大)or(D很大)or(較大),則該圖像塊為強邊緣區.
規則5若(B較小)and(H較大),則該圖像塊為強邊緣區.
按照人的思維習慣,將5條規則中的模糊量“很小”、“較小”、“較大”、“很大”分別定義為:如果x≤Δ×10%,則x∈{很小};如果Δ×10%<x≤Δ×30%,則x∈{較小};如果Δ×70%≤x≤Δ×80%,則x∈{較大};如果x≥Δ×85%,則x∈{很大}.其中Δ=xmax-xmin,xmax和xmin分別為x的最大值和最小值.這樣就可以克服模糊增強中隸屬函數閾值a、a1、a2的選取與具體圖像有關的缺點.
3)根據規則1去除圖像中灰度變化不大的平坦區域,根據規則2-5去掉圖像中清晰的自然邊緣.
利用粗糙集理論對圖1(a)所示篡改圖像進行取證,結果如圖2(a)所示.圖2(a)中顯示了篡改圖像中犀牛的邊緣和自然清晰強邊緣(如圖1(a)右下方大樹葉邊緣和犀牛所處的樹葉邊緣),但圖2(a)下方有很多誤檢測的區域,這些誤檢區域對應于圖1(a)中比較暗的平坦區域.通過對大量自然圖像的計算可知,對于不同的自然圖像,其頻域熵H、均值和方差D都是在一個大致相似的數量級范圍內,而低高頻能量比B的范圍則對于不同的圖像差別較大.所以使用規則1來檢測平坦區域時,因B的數量級差別很大,規則“如果x≥Δ×85%,則x∈{很大}”中的判斷閾值85%應隨不同的圖像而變化.

圖2 基于粗糙集的圖像取證及其融合結果Fig.2 Image forensics based on rough sets and its fusion result
從前面分析可知:經過模糊增強后的圖像能較好地區分人工模糊邊緣與散焦區域、平坦區域,但對人工模糊邊緣與自然清晰邊緣的區分效果略差;經過粗糙集處理后的圖像能較好地辨識出圖像的自然清晰強邊緣.為此,文中將這兩種圖像融合,得到既能區分散焦區域和平坦區域又能區分人工模糊邊緣與自然清晰強邊緣的圖像.3幅篡改圖像經模糊增強、粗糙集處理和融合后的結果如圖3所示.從圖3可知:(1)圖像1的原圖像是將指環王的男精靈的臉換到了一個女性的身體上,可以看到模糊增強后的圖像在平坦區域(如皮膚、衣服、樹木之間的光亮)得到了弱化;高頻細節即身后的樹枝和頭發弱化的程度差一些,仍然保留;當粗糙集處理后,可以看到高頻細節受到抑制,而低頻細節(如衣服)弱化的程度差一些,融合后的圖像就只保留了臉部輪廓即人工模糊的邊緣.(2)圖像2中原圖像是將奇異果的果肉替換到橙子上,模糊增強后的圖像中真實邊緣(如柵欄輪廓、椅子靠背、背景樹葉)和平坦區域(如橙子皮、碟面)得到弱化,但是一些高頻細節(如奇異果肉放射狀的輪廓、橙皮與碟面接觸部分)弱化的程度差一些,仍然保留;粗糙集處理后高頻細節受到抑制,而一些低頻細節(如奇異果肉黑色部分)弱化的程度差一些,融合后的圖像則凸顯出了左面和前面兩個橙子被篡改的奇異果果肉輪廓.(3)圖像3中原圖像是將獅子的頭替換到海豹身上,模糊增強后的圖像在平坦區域(如背景海水)和散焦區域(海豹尾巴)得到了弱化,但高頻細節(如海豹后背曲線)弱化的程度差一些,仍然保留;粗糙集處理后高頻細節受到抑制,但低頻細節(散焦的海豹尾巴)弱化的程度差一些,融合后的圖像則凸顯了獅子的頭.

圖3 3幅篡改圖像的取證結果Fig.3 Forensics results of three tampered images
文中針對圖像篡改中的模糊潤飾進行被動取證,提出了一種新的取證算法.首先采用圖像模糊增強技術對待檢測圖像進行增強,得到人工模糊邊緣被增強而平坦區域被減弱的圖像;再利用粗糙集在數字圖像壓縮應用中得到的約簡屬性和約簡規則,對待檢測圖像子塊進行分類,排除平坦區域和強邊緣而剩下保留有人工模糊邊緣的圖像;最終對兩幅圖像融合得到只有人工模糊操作區域的結果圖像.實驗結果顯示文中算法能較準確地找到篡改圖像中經過人工模糊操作的邊緣.人工模糊潤飾是圖像篡改中的常用手段,所以文中算法可以應用在數字圖像的被動取證中.今后可以對模糊增強中的隸屬函數作進一步研究,采用鈴形隸屬函數來刻畫圖像的模糊性;同時選用左右不對稱的隸屬函數來擴大人工模糊邊緣和自然邊緣、平坦區域、散焦區域之間的差別.
[1]Fridrich J.Imagewatermarking for tamper detection[C]∥Proceedings of International Conference on Image Processing.Chicago:IEEE,1998:404-408.
[2]Farid Hany.Creating and detecting doctored and virtual image:implications to the child pornography prevention act[R].Hanover:Department of Computer Science and Center for Cognitive Neuroscience,Dartmouth College,2004.
[3]孫堡壘,周琳娜,張茹.基于Benford定律的高斯模糊篡改取證[J].計算機研究與發展,2009,46(增刊):211-216.Sun Bao-lei,Zhou Lin-na,Zhang Ru.Forensics of Gaussian blur tempering based on Benford's law[J].Journal of Computer Research and Development,2009,46(Suppl):211-216.
[4]周琳娜.數字圖像取證技術[M].北京:北京郵電大學出版社,2008:103-107.
[5]Hsiao Dun-yu,Pei Soo-chang.Detecting digital tampering by blur estimation[C]∥Proceedings of the First InternationalWorkshop on Systematic Approaches to Digital Forensic Engineering.Taipei:IEEE,2005:264-278.
[6]Sutcu Y,Coskun B,Sencar H T,el al.Tamper detection based on regularity ofwavelet transform coefficients[C]∥Proceedings of IEEE International Conference on Image Processing.San Antonio:IEEE,2007:397-400.
[7]王波,孫璐璐,孔祥維,等.圖像偽造中模糊操作的異常色調率取證技術[J].電子學報,2006,34(12A):2451-2454.Wang Bo,Sun Lu-lu,Kong Xiang-wei,et al.Image forensics technology using abnormity of local hue for blur detection[J].Acta Electronica Sinica,2006,34(12A):2451-2454.
[8]陳英,趙鵬,王瑀屏.基于邊界平滑檢測的虛假圖像盲識別算法[J].軟件學報,2008,19(增刊):59-68.Chen Ying,Zhao Peng,Wang Yu-ping.Exposing digital forgeries by detecting traces of smoothing[J].Journal of Software,2008,19(Suppl):59-68.
[9]Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[10]郭桂蓉.模糊模式識別[M].長沙:國防科技大學出版社,1992:134-159.
[11]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[12]徐立中.數字圖像的智能信息處理[M].2版.長沙:國防工業出版社,2007:42-63.