王 永 飛
(銅陵職業技術學院, 安徽 銅陵 244061)
隨著計算機應用技術的飛速發展,作為信息重要載體的圖像使用越來越普遍,根據實際需要,對圖像進行篡改也越來越普遍。古籍是學術傳承的歷史見證和源頭活水,更是現代科技創新和學術進步的根基和依據。為加強古籍保護工作,2007年國務院辦公廳發布了《關于進一步加強古籍保護工作的意見》,正式實施“中華古籍保護計劃”。古籍圖像是古籍文物中重要的組成部分,且是不可再生的珍貴的歷史文物,若對古籍字畫圖像篡改,將會使這些古籍圖像失去本來的價值和意義,因此對古籍圖像篡改檢測顯得尤為重要。
古籍圖像受長期自然環境和人為因素的影響,大多數已嚴重破損,經過篡改技術處理后,很多篡改后的圖像可以達到以假亂真的地步。當前,圖像篡改檢測技術主要有特征點匹配和塊匹配方法。文獻[1]中提出了超像素分割和SURF特征點圖像復制粘貼篡改檢測算法,該算法以特征點匹配方法實現圖像篡改檢測,在檢測篡改區域時提高了準確率和檢測速度;文獻[2]中提出了低頻快速切比雪夫矩的篡改圖像檢測算法,該算法提取圖像塊特征,實現圖像篡改檢測,對單區域、多區域篡改區域有很好的定位結果;文獻[3]中提出了基于圓域分割耦合法則的圖像篡改檢測算法,該算法利用鄰域圓構建特征點,實現圖像篡改匹配檢測,檢測準確性較高,魯棒性較好。文獻[4]中設計了一種SIFT(Scale Invariant Feature Transform)的復制粘貼篡改檢測算法,但該算法易出現錯誤檢測和漏檢測,且存在計算量大等問題。SURF(Speed Up Robust Feature)算法改進了SIFT算法,提高了運算速度,但其匹配精度不高。針對上述各算法的不足,研究提出了一種改進的SURF算法,該算法準確度高,可快速檢測古籍圖像篡改的信息。
像素、紋理、結構、灰度和顏色是圖像構成的主要信息。特征點是圖像中具有尺度不變性的像素點或像素塊。SURF算法的圖像匹配檢測過程是:先用高斯濾波平滑圖像,找出圖像的特征點,構造Hessian矩陣,定位特征點、確定特征點主方向和特征描述子;再利用歐氏距離最近的最佳匹配原則進行特征點匹配,實現圖像匹配檢測。改進的SURF古籍圖像復制粘貼篡改檢測算法(以下簡稱新算法)的思路是:(1) 以SURF算法為基礎;(2) 分析高斯濾波的不足和像素信息,引入小波變換并改進,對古籍圖像進行濾波,平滑圖像并清除干擾圖像特征點提取的噪聲斑點;(3) 分析SURF算法全圖搜索定位特征點的缺陷和圖像結構、灰度和顏色特征,引入SLIC(Simple Linear Iterative Clustering)算法,對圖像分塊,提高圖像篡改檢測的定位速度;(4) 分析SURF算法特征點匹配時閾值選取方法的不足,將SURF算法特征點歐氏距離最近的最佳匹配原則的閾值選取方式改進為圖像特征點匹配自適應統一閾值選取方法,減小特征點匹配誤差積累;(5) 引入圖像局部色彩方差,提升圖像特征點的匹配準確度;(6) 根據特征點匹配情況,利用形態學腐蝕膨脹操作,實現篡改信息定位。通過上述6個步驟,以快速及準確的方式實現圖像篡改信息檢測。
為驗證新算法的檢測效果,將其與當前主流篡改算法檢測效果比較,進行如下檢測:(1) 對兩幅古籍圖像人為篡改進行檢測;(2) 對兩幅古籍文字篡改和缺少筆畫的圖像進行檢測;(3) 對單幅原始圖像中多出的“鳥”進行篡改檢測;(4) 用主流不同算法對上述各篡改圖像檢測數據進行分析。通過上述實驗,驗證新算法的有效性、實用性、通用性和高效性。
2.1.1 構建Hessian矩陣
Hessian矩陣是一個多元函數的二階偏導數構成的方陣,構建Hessian矩陣是圖像特征提取的起點,這些特征點就是圖像穩定的關鍵點。圖像I上的像素點(x,y)即為函數值f(x,y),因圖像提取的特征點應具備尺度無關性,在Hessian矩陣構造前,圖像中有很多噪聲斑點,需要選用二階標準高斯函數對其進行高斯平滑濾波,消除無關斑點。為加快卷積的速度,采用了方型濾波器(Box Filter)對高斯濾波器二階偏導進行近似求解。濾波后像素點Hessian矩陣為[1]:
(1)
式中:σ表示像素點(x,y)對應的空間尺度;Lxx(x,y,σ)、Lxy(x,y,σ)、Lyx(x,y,σ)、Lyy(x,y,σ)是高斯函數與高斯二階偏導數的卷積。
Hessian矩陣判別式為[1]:
Det(H)=LxxLyy-(ωLxy)2
(2)
式中:ω為加權系數,為平衡方型濾波器近似所帶來的誤差,一般取值為0.9;Lyy、Lxx和Lxy是yy、xx和xy方向上的二階導數值。
2.1.2 確定特征點
在二維圖像空間和尺度空間中,將Hessian與該鄰域內相關性像素點進行比較,根據閾值,濾除能量弱的關鍵點以及定位錯誤的關鍵點,篩選出穩定的特征點;在特征點鄰域內,使用Harr小波,統計60°扇形內水平方向和垂直方向所有點的Harr小波特征值之和,再統計以一定間隔旋轉后該區域內Harr小波特征值,將該值最大的扇形方向確定為該特征點主方向;以特征點為中心,構造一個20 pixels×20 pixels的正方形窗口,再將該窗口劃分為更小的4 pixels×4 pixels子區域,在每個子區域內再按照5 pixels×5 pixels的大小進行取樣,計算子區域內水平和垂直方向Harr小波響應值∑dx、∑|dx|、∑dy和∑|dy|。產生16個子區域,每個子區域4個量值,形成64個特征描述子表達特征點[1]。
2.1.3 特征點匹配
計算兩個特征點間的歐氏距離,歐氏距離越短,兩個特征點匹配度越高;若兩個特征點矩陣跡的正負號一樣,表示該對特征點相同方向上對比度變化相同,則這兩個特征點匹配,否則,即使歐氏距離為0,也認為是誤匹配。
2.2.1 引入并改進提升濾波效果的小波變換
(1) 小波變換簡介
若f(t)∈L2(R),則連續小波變換為:

(3)

傳統小波去噪采用閾值函數選取閾值,常用的硬閾值和軟閾值函數分別為:
(4)
(5)

傳統的小波選取統一閾值,λ取值公式為:
(6)
式中:σ是噪聲標準差;N是圖像大小[5]。
小波重構函數可定義為:

(7)
(2) 改進提升濾波效果小波閾值選取方式
由于各種原因,古籍圖像都包含大量噪聲,而噪聲在圖像中表現為孤立性很強的斑點。在圖像特征點提取過程中,這些斑點容易被視為圖像的特征點提取,影響圖像篡改區域的定位,構建Hessian矩陣過程中需要使用高斯函數對其進行濾波,高斯函數在頻域內具有圖像平滑的作用,且頻率點半徑決定了圖像邊緣信息濾除多少和圖像模糊程度,以及是否出現振鈴現象。新算法引入小波變換算法并進行了改進,以克服高斯濾波的不足。
硬閾值去噪將噪聲小波系數直接清零,容易產生偽吉布斯現象;軟閾值去噪時,估計值與實際值之間存在一定偏差,影響圖像重構效果;另外,還有如折中閾值去噪等方法,圖像中都容易出現斷點,平滑度不夠。
為了更好地實現圖像濾波,改進的小波閾值函數為:
(8)
式中:m是調節閾值函數的常量[5]。
改進的小波閾值選取方式如下:
(9)
式中:Ti是第i層閾值。
通過對圖像添加標準差為1.6的高斯噪聲,利用改進的小波變換濾波和高斯函數濾波,濾波效果圖如圖1所示。

圖1 圖像濾波效果比較
從視覺效果角度看,高斯濾波圖圖像過于平滑,且比較模糊;新算法濾波后,圖像最接近原圖,且圖像信噪比達到75.32 dB,圖像結構相似度為0.91,遠高于高斯濾波后的圖像信噪比64.57 dB和圖像結構相似度0.64,為構建Hessian矩陣提供了更好的基礎。
在二維圖像空間和尺度空間中,將Hessian與該鄰域內相關性像素點進行比較時,也采用上述小波閾值選取方式,濾除能量弱的關鍵點以及定位錯誤的關鍵點,篩選出穩定的特征點。
2.2.2 改進提升檢索效率的超像素分割算法SLIC
將圖像分割的目的是減少檢測時間,提高檢測效率。改進的算法中引入超像素分割方法之一的簡單線性迭代聚類SLIC(Simple Linear Iterative Clustering)算法,由于SLIC分割的超像素塊大小均勻,且分割前需要設定圖像分割數目。圖像分割數量過大或過小,會增加圖像檢索復雜度或降低檢測精度。
(1) SLIC算法簡介
SLIC算法是一種基于網格化針對像素塊K-Means聚類的超像素圖像分割算法。因Lab顏色空間與設備無關,將圖像RGB顏色空間轉換到Lab顏色空間(Lab顏色模型由亮度L、顏色通道a和b組成),每個像素點(x,y)可用5維向量V[L,a,b,x,y]表示。
(2) SLIC算法的改進
為了消除SLIC分割圖像前分割數量假設的不確定性,新算法利用自適應確定超像素圖像分割數量。通過小波變換,提取圖像低頻分量和高頻分量,計算小波對角對比度P[6],計算公式為:

(10)

自適應超像素圖像分割數量為[6]:

(11)
改進后的SLIC算法:在原圖像素中,自適應確定超像素圖像塊分割數量K,選取K個圖像特征點,設為K聚類中心,以每個特征點為中心,搜索全圖歐氏距離最近的像素點,并歸入該類,計算每類像素點平均向量值,重新得到K個聚類中心,再以這K個中心去搜索周圍與其最為相似的像素,反復迭代,直至所有像素都歸類后收斂。若聚類中心在邊緣或是噪聲點,改進為將聚類中心移動到梯度最小的區域。圖2為SLIC算法圖像分割過程和結果。

圖2 改進的SLIC算法圖像分塊
2.2.3 圖像匹配自適應閾值選取
傳統SURF算法采用歐氏距離最近的最佳匹配原則判斷特征點的匹配,判斷公式為:

(12)
式中:l為兩特征點間的距離;n為特征點維數;x1和x2分別為原始圖像和待測圖像特征點描述向量。
以最近特征點和次近特征點的距離比值為閾值,當lmin 改進的SURF算法采用統一閾值法:(1)先分別求出原圖和待測圖像所有特征點;(2)再用循環方式求出原圖所有特征點與待測圖像所有特征點之間的距離,將最近特征點和次近特征點距離值作為閾值。將該閾值作為全圖匹配的統一閾值,以減小匹配過程中閾值變化產生的誤差,提高圖像匹配精度。 將兩幅前景完全相同,背景的色調、對比度和飽和度不同的圖像進行匹配檢測比較。利用傳統的SURF算法和改進后的統一閾值法對兩幅圖像進行篡改檢測,結果如圖3所示。 兩幅圖像只有背景不同,圖3c是利用傳統SURF算法匹配檢測的結果,圖中鳥的特征匹配點只有3對,與事實明顯不符,表明傳統SURF算法匹配檢測存在很大的誤差。圖3d是利用新算法篡改匹配檢測的結果,很明顯該篡改匹配檢測結果更準確。 2.2.4 引入提升匹配檢測準確度的圖像局部色彩方差 目前圖像特征點檢測算法,如Harris、SIFT和SURF等算法均忽視了圖像顏色信息,檢測出的特征點均存在誤差。研究在SURF算法特征點匹配時引入圖像局部色彩方差,除要求歐氏距離越短和兩個特征點矩陣跡的正負號一樣外,還要求判斷對應特征點的局部色彩方差相同,以提升匹配檢測的準確度。 因HSV圖像模式更符合視覺效果,且空間各分量相對獨立,新算法將RGB圖像顏色模式轉換為HSV圖像模式。圖像局部色彩方差反映圖像細節復雜度,將其作為判斷特征點匹配的第三項依據。 超像素塊的局部色彩方差計算公式為[7]: (13) 圖4a是原始圖;圖4b是將原始圖右邊人臉篡改后的圖像;圖4c是利用傳統的SURF算法對篡改后的圖像匹配檢測的結果,圖中明顯出現了肩部誤匹配特征點對應線,且該匹配對應點顏色明顯不一樣;圖4d為新算法的匹配檢測結果,準確度較高。 2.2.5 篡改信息定位 將特征點匹配后的古籍圖像二值化,利用形態學腐蝕膨脹操作填充匹配特征點對之間空隙形成連通區域。選用經典結構元素B,其表達式為: (14) 針對圖像I二值化后的矩陣A,利用式(15)進行篡改區域檢測[1],結果如圖5所示。 圖5 新算法篡改檢測結果 A·B=(A⊕B)ΘB (15) 圖5c是根據特征點匹配后,使用形態學腐蝕膨脹操作篡改定位的圖像,因圖5b中人臉篡改部分和原始圖像圖5a人臉部分有很多像素點完全相同,且信息完全相同部分不認為是被篡改,故圖5c中顯示的是被篡改部分的準確位置信息。 新算法使用的系統平臺為Windows7 32位旗艦版,軟件應用平臺為Matlab2015b。選取真假兩幅古籍圖像和1幅圖中有內容被篡改的圖像為例,篡改方式包括復制、縮放、旋轉、更換背景和刪除等。利用新算法及當前其他主流算法對篡改圖像進行檢測、分析,驗證新算法的實用性、通用性和高效性。 3.1.1 復制篡改匹配檢測 為驗證圖像復制篡改匹配檢測效果,選用兩幅古籍圖像,分別利用新算法、文獻[1]、文獻[2]和文獻[8]中算法對圖像篡改進行匹配檢測。圖6為多種算法對圖像復制篡改匹配檢測結果。圖6a中,右圖人臉部明顯破損,將左圖人臉不作任何調整地復制到右圖人臉處,如圖6b中右圖,利用4種算法對圖像進行復制篡改匹配檢測,結果如圖6c — 圖6f所示。 圖6 多種算法對圖像復制篡改匹配檢測結果 圖6 a中兩個圖從視覺角度上看很相似,但兩個圖的顏色信息完全不同。文獻[1]中的篡改匹配檢測效果明顯優于文獻[2]和文獻[8];文獻[1]和文獻[2]中圖像的匹配均出現多匹配現象,原因是沒有對圖像色彩進行判斷;文獻[8]中的篡改匹配檢測效果圖中人臉匹配對應點很少,這是明顯的匹配錯誤。由此可見,新算法能精準定位匹配,效果最佳。 3.1.2 放大和旋轉篡改匹配檢測 圖7 為多種算法對圖像放大篡改匹配檢測結果對比圖。將兩幅古籍原始圖像圖7a中左圖人臉復制放大20%后移至圖7a中右圖的人臉部,結果如圖7b中的右圖所示。 圖7 多種算法對圖像放大篡改匹配檢測結果 圖8為多種算法對圖像旋轉篡改匹配檢測結果。將兩幅古籍原始圖圖8a中右圖人臉復制后順時針旋轉20°并移至右圖人臉位置,結果如圖8b中的右圖所示。 圖8 多種算法對圖像旋轉篡改匹配檢測結果 由圖7和圖8可知,利用新算法、文獻[1]和文獻[2]中的算法對圖像的匹配檢測結果很穩定,且新算法檢測匹配準確性明顯高于文獻[1]和文獻[2]中算法。此外,就圖像篡改任意比例縮放和任意角度旋轉等情況進行了實驗,實驗結果證明新算法實用性更強。 為了驗證新算法的通用性,在選取單幅古籍字帖圖像時,選取了其中有重復字“樂”的圖,同時,將原始圖像圖9a中的“如”篡改為“何”,利用新算法就篡改文字進行匹配檢測,匹配檢測結果如圖9c所示。 圖9c中,檢測出了圖9a中兩個同樣的字“樂”的匹配,因寫作手法不同,同樣的字只有個別的地方匹配,而篡改后的同樣兩個字“何”完全匹配。表明新算法通用性強。 圖10a中就原始圖中“綠”字少了一橫,從其他圖中復制缺的“橫”圖案粘貼到圖10b中的位置,利用新算法進行篡改檢測,獲得篡改區域信息圖像如圖10c所示。從視覺效果角度分析,篡改區域圖像清晰度非常高,證明新算法通用性強。 圖9和圖10就古籍字帖進行篡改匹配檢測。為進一步驗證新算法的通用性,選用單幅原始圖中有多只鳥的圖像進行篡改,利用新算法進行匹配檢測。 圖9 文字圖像篡改匹配檢測結果 圖10 新算法對圖像篡改匹配檢測結果 圖11a中有多只鳥,復制其最上面的一只鳥并粘貼至圖中間的樹枝上得到圖11b,同時,將粘貼后的圖像縮小5%,利用新算法進行匹配檢測,檢測結果如圖11c所示,匹配準確度非常高。 圖11 新算法對圖像篡改匹配檢測結果 利用新算法、文獻[1]和文獻[2]中算法對圖像10進行篡改匹配檢測,結果見表1。 表1 3種算法篡改匹配數據統計表 文獻[1]中算法匹配準確率較文獻[2]高,但檢測用時較長;文獻[2]中算法檢測用時最短,但準確率不高;新算法檢測準確率最高,檢測用時最少,說明新算法的高效性。 研究提出了一種改進的SURF圖像復制粘貼篡改匹配檢測算法,通過對單幅和多幅圖像進行篡改復制、旋轉、壓縮和部分圖像清除等進行匹配檢測,驗證了新算法比其他算法更具有效性、實用性、通用性和高效性。后繼就圖像單像素篡改檢測算法進行深入研究。

3 實驗與分析
3.1 兩幅古籍圖像篡改匹配檢測



3.2 單幅古籍字帖文字圖像篡改檢測



3.3 準確率和用時

4 結 語