






摘 要:為了增強圖像哈希算法的分類性能并提高拷貝檢測的準確率和效率,提出基于QBFM矩和三維結構的圖像哈希算法。首先對彩色圖像進行規格化處理,并通過多尺度融合得到高斯融合圖像和拉普拉斯融合圖像,再對兩種融合圖像分別提取QBFM特征。同時直接在RGB顏色空間提取高斯融合圖像的梯度圖像并構造三維模型,利用不同視角下梯度峰頂和峰谷曲線的凹凸點信息得到三維局部結構特征;再對三維模型等距切分,統計各切面的像素數和方差作為三維全局結構特征。最后,將圖像的QBFM特征和三維特征結合并置亂構成最終的哈希序列。實驗結果表明,算法在魯棒性和區分性之間有更好的平衡;與現有的哈希算法相比具有較好的圖像分類性能;在拷貝檢測實驗中,算法具有最優的查全率和查準率。
關鍵詞:圖像哈希;多尺度融合;QBFM矩;三維結構;拷貝檢測
中圖分類號:TP391 文獻標志碼:A
文章編號:1001-3695(2022)03-053-0949-07
doi:10.19734/j.issn.1001-3695.2021.08.0309
基金項目:國家自然科學基金資助項目(61802250);上海市科委部分地方院校能力建設資助項目(20020500700);廣西多源信息挖掘與安全重點實驗室開放基金資助項目(MIMS18-04)
作者簡介:馬林生(1996-),男,安徽滁州人,碩士研究生,主要研究方向為圖像哈希;趙琰(1979-),女(通信作者),山西運城人,副院長,副教授,博士,主要研究方向為數字圖像處理、信息安全(yanzhao79@hotmail.com).
Image hashing algorithm based on QBFM moments and three-dimensional structure
Ma Linsheng1,Zhao Yan1,2?
(1.College of Electronics amp; Information Engineering,Shanghai University of Electric Power,Shanghai 200090,China;2.Guangxi Key Lab of Multi-Source Information Mining amp; Security,Guangxi Normal University,Guilin Guangxi 541004,China)
Abstract:To enhance the performance of image classification and improve the accuracy and efficiency of copy detection,this paper proposed an image hash algorithm based on QBFM moments and three-dimensional structure.Firstly,it used normalization to process the color image,and obtained the Gaussian fusion image and Laplace fusion image through multi-scale fusion,then extracted the QBFM features of two fusion images.At the same time,it directly extracted gradient information of the Gaus-sian fusion image in the RGB color space and constructed a three-dimensional model,used the concave convex point information of peak and valley curve of gradient from different perspectives to obtain the three-dimensional local structure features.Then,it disposed the three-dimensional model of gradient image by equidistant segmentation,counted the number of pixels and variance of each section as the three-dimensional global structure features.Finally,it combined the QBFM features and three-dimensional features of the image and scrambled to form the final hash sequence.Experimental results show that the algorithm has a better balance between robustness and discrimination.Compared with the existing hash algorithms,it has good image classification performance.In the copy detection experiment,the algorithm has the best recall and precision.
Key words:image hashing;multiscale fusion;QBFM moments;three dimensional structure;copy detection
0 引言
隨著互聯網科技的迅猛發展,多種圖像編輯處理軟件的廣泛使用,越來越多的圖像和視頻由用戶產生,并被上傳至互聯網社區。人們可以很輕松地從中獲取大量圖像信息,并且可以利用各類軟件如Photoshop等對圖像進行各種編輯操作,如圖像添加文本、改變圖像亮度、對比度以及合成新圖像等。一幅圖像可能會產生許多拷貝版本,如何區分這些圖像至關重要。圖像哈希技術應運而生用于檢測圖像并分類。圖像哈希是指將一幅圖像單向映射為一串簡短的字符串或數字序列,即對圖像進行單向壓縮。圖像哈希應當包含魯棒性、區別性、緊湊性和安全性。目前圖像哈希在圖像檢索、分類、檢測等諸多領域取得了較好的成果。
首先是較早通過圖像變換或者幾種變換方法相結合來構造哈希算法,如離散傅里葉變換[1,2](DFT)、離散小波變換[3,4](DWT)、離散余弦變換[5,6](DCT)、四元數傅里葉變換[7](QDFT)和對數極坐標變換[7](LT)。Lei等人[1]結合Radon變換和DFT變換構建哈希。通過提取圖像變換后特征和DFT變換系數量化得到哈希序列,該算法對伽馬校正和高斯噪聲魯棒性較弱。Qin等人[2]考慮在保持區分性同時增加算法抗旋轉能力,于是提取圖像最大內接圓重構圖像塊,對二次圖像用DFT轉到頻域,利用非均勻采樣從傅里葉系數的幅值矩陣中提取魯棒性特征構成哈希,該算法具有緊湊性和良好的區分性,并可以抵抗任意角度旋轉。Wang等人[3]首先對圖像進行DWT變換獲取其低頻子帶LL,檢測低頻子帶LL的自適應Harris特征點,提取特征點的領域的統計特征生成哈希。文獻[4]提取多級DWT小波變換的特征構造哈希序列。文獻[5]利用圖像的非重疊子塊,對每個子塊提取DCT系數,通過計算和量化得到哈希的魯棒圖像哈希算法,該算法對旋轉魯棒性較差。Qin等人[6]在對圖像運用Canny算子檢測,通過不重疊分塊統計塊中特征點,選取更加健壯的特征塊及其位置信息和兩個主要DCT系數經PCA得到哈希序列,該算法對旋轉攻擊和乘性噪聲魯棒性較弱。Ouyang等人[7]通過LT變換作用于圖像,提取次級圖像的QDFT變換的低頻系數的幅度構成哈希序列,該算法對于旋轉和常見的圖像保持操作是魯棒的。
為了進一步對數據進行處理,在保持良好性能前提下提升序列的緊湊性,涌現了基于數據壓縮的哈希算法。Tang等人[8]對標準化圖像進行偽隨機分塊提取重構矩陣,并通過局部線性嵌入(LLE)進行數據降維、壓縮提取特征,該算法對高斯噪聲魯棒性較弱。文獻[9]通過對圖像基于最大內接圓等面積環分割重新排成列進行非負矩陣分解(NMF)獲取哈希特征,該算法能夠抵抗旋轉攻擊,但是失去了對邊緣處的敏感性。Davarzani等人[10]對圖像進行分塊,提取每個塊的CS-LBP紋理特征,進行壓縮加密形成哈希序列。沈麟等人[11]對多級小波分解后的信息采用CS-LBP和位平面分解的方式提取特征,該算法具有一定的拷貝檢測能力。文獻[12]提出對圖像RGB各分量進行梯度信息提取且提取其能量和多方向變化信息構造哈希序列,該算法具有良好的魯棒性。Tang等人[13]研究張量在圖像哈希中的應用,對圖像進行重疊和非重疊分塊疊加構成三階張量,然后對其進行張量分解獲取正交因子矩陣提取特征。Yang等人[14]在預處理階段對圖像進行低秩分解(LRR),然后分塊進行局部路徑二值模式(pi-LBP)提取基于塊的特征,然后利用直方圖獲取特征再由PCA進行降維壓縮,再利用混沌映射加密得到哈希,該算法對常見攻擊如JPEG,中值濾波魯棒性很好,但是對縮放和旋轉的魯棒性有待提升。
通過圖像矩進行特征提取的算法也不斷被提出,Zhao等人[15]通過提取亮度和色度的Zernike矩特征和亮度的顯著部分構成哈希,該算法具有一定的竄改定位能力。Hosny等人[16]通過高斯赫米特矩(Gaussian-Hermite moment)及其不變量提取圖像特征,從而構成哈希序列比較穩健。文獻[17]通過對圖像進行Itti注意力模型,然后結合亮度分量Y進行二維DWT變換,提取低頻子帶得到新的次級圖像,進行Hu不變矩特征提取形成哈希。
除了以上方案,還有圖像顏色特征被應用到圖像哈希技術中。文獻[18]運用顏色矢量角和Canny算子生成圖像哈希算法,該算法首先對圖像進行預處理,然后計算其顏色矢量角,再將圖像轉換到Ycbcr空間提取亮度分量Y進行Canny邊緣提取含有邊緣的顏色向量角,通過環分割提取每一環的方差得到最終哈希序列,該算法對大角度旋轉抗性較好,但分類性能有待提升且對局特征變化不敏感。文獻[19]通過改進并增加分塊處理提取顏色矢量角的特征構成哈希,該算法相較其他顏色矢量角哈希算法更加具有魯棒性,但是對旋轉攻擊和亮度調節魯棒性較差。文獻[20]通過利用CIEL*a*b*顏色空間生成四元數矩陣,利用四元數奇異值分解(QSVD)的奇異值作為特征構成哈希。文獻[21]利用對立色和四叉樹分解提取哈希序列,該算法由彩色圖像提取紅綠,藍黃顏色對立分量,并進行分塊處理,提取每個塊的顏色變化信息,構成圖像的顏色特征,再對圖像變換到CIE L*a*b空間提取亮度分量L進行四叉樹分解,通過統計不同塊的數目得到結構特征,聯合兩種特征得到最終的哈希序列,該算法不能抵抗大角度旋轉,但對于其他內容保持操作,如亮度、縮放等具有良好的魯棒性。
盡管大多數最先進的圖像哈希算法具有較好的魯棒性,然而除了魯棒性之外,有些方案很難兼顧圖像分類性能并提高拷貝檢測的準確率。因此,本文算法在預處理中融入多尺度概念,得到高斯融合圖像和拉普拉斯融合圖像,從而達到圖像增強的效果。由于四元數貝塞爾傅里葉矩(QBFM)對常見攻擊操作具有良好的魯棒性,將QBFM矩運用至圖像哈希領域對高斯融合圖像和拉普拉斯融合圖像進行特征提取得到全局特征可以有效提高哈希算法的魯棒性。對高斯融合圖像在RGB顏色空間提取梯度圖像,并在三維視角下對梯度圖像進行混合結構特征提取,有利于加強圖像的區別性。實驗結果表明,同其他算法相比,本文算法的哈希序列緊湊、平均運行時間較短、ROC曲線表現力較好,即具有較好的魯棒性和區別性;在拷貝檢測實驗中,通過對比不同算法的查全率和查準率曲線,表明本文算法具有較好的拷貝檢測能力。
1 本文哈希算法
1.1 算法框架
基于QBFM矩和三維結構的圖像哈希框架如圖1所示,主要流程由預處理、特征提取、哈希生成三個部分組成。圖像預處理包括對圖像進行雙線性插值、構造高斯金字塔模型和拉普拉斯金字塔模型,然后分別進行多尺度融合得到拉普拉斯融合圖以及高斯融合圖像。特征提取包括全局特征提取和三維特征提取,全局特征提取是對兩種融合圖像提取QBFM特征。三維結構特征提取是構造全局梯度信息圖像,利用三維模型得到結構特征。哈希生成是對全局特征和三維結構特征進行量化并連接加密得到最終哈希序列。
1.2 圖像預處理
首先通過雙線性內插法將輸入圖像大小規格化為N×N,確保哈希算法可以處理不同分辨率的數字圖像而且有利于增強算法對縮放的魯棒性。對大小調整后的圖像I0進行多級濾波和下采樣,設I1、I2、I3、I4為下采樣的模糊圖像,I′1、I′2、I′3、I′4為對應I1、I2、I3、I4的上采樣圖像,濾波器采用半徑為6的圓盤均值濾波器[22]。式(1)給出了四級拉普拉斯金字塔的計算公式。
圖像金字塔是圖像中多尺度表達的一種,I0、I1、I2、I3構成了四級高斯金字塔,而L1、L2、L3、L4構成了四級拉普拉斯金字塔。考慮到每個尺度都含有重要的圖像信息,多尺度融合可以起到圖像增強的效果。對兩者分別進行多尺度融合得到高斯融合圖像IM和拉普拉斯融合圖像LM,如式(2)所示,大小為N1×N1。
其中:I*i、L*i分別為Ii和Li尺度歸一化為N1×N1的圖像。
1.3 全局特征提取
四元數貝塞爾傅里葉矩[23]在彩色圖像處理具有較好的圖像重建和識別性能,其定義如式(3)所示。
其中:n=0,1,2,…;m=0,±1,±2,…為矩的階數;λn為n階零點;Jv(r)為歸一化常量;f(r,θ)=fR(r,θ)i+fG(r,θ)j+fB(r,θ)k為RGB圖像的四元數表示,an=[Jv+1(λn)2]/2為任意的單位純四元數,取μ=((i+j+k)/3)1/2。
四元數可以在不丟失彩色圖像信息情況下對圖像進行整體表征,對圖像的顏色特征具有很好的描述。彩色高斯融合圖像IM和拉普拉斯融合圖像LM用純四元數表征,并提取其QBFM矩的前n階系數,不同階數n對應的矩如表1所示。
圖像IM和LM計算得到的QBFM矩系數是超復數形式,因此分別對其進行量化求模并排列成行向量,則高斯融合圖像IM和拉普拉斯融合圖像LM的QBFM矩系數分別為G=[g1,g2,…,gn(n+1)/2]和L=[l1,l2,…,ln(n+1)/2],對按式(4)進行二值化得到全局特征H1=[G1,L1],長度L1=n(n+1)。
其中:GM和LM為向量G和L的均值;G1和L1為二值化向量;i=1,2,…,(n(n+1)/2)。
1.4 三維結構特征提取
本文梯度圖像是對預處理后高斯融合彩色圖像IM在RGB彩色空間直接進行梯度求解。使r、g和b為RGB顏色空間中按照R、G和B軸的單位向量,并且定義向量:
由向量之間的點積,設gxx、gyy和gxy如下所示。
其中:R、G和B是彩色圖像的紅綠藍通道圖像,并且gxx、gyy和gxy為關于x和y的函數,θ是梯度計算點處的角度。相關的微分均通過Sobel算子實現。通過計算在這些方向上的最大梯度幅值,從而可得最終全局梯度F[24],如式(11)所示。
圖2為airplane及其直接在RGB顏色空間得到的全局梯度與單獨計算各分量加權的復合梯度圖,由圖2(b)和(c)對比圖可以很明顯地看出全局梯度相較復合梯度圖提取得更好,對圖像顏色信息的表征更優。
本文在三維空間[25]進行結構特征提取。值得注意的是,三維模型的構建方法與文獻[25]有很大不同,文獻[25]主要關注的是曲線之間距離差值以及位置差值作為特征提取哈希碼,而本文在結構特征提取主要是:a)使用彩色圖像全局梯度構造三維模型;b)考慮了梯度圖像反映劇烈的凹凸點特征;c)考慮了全局分割圖的特征,側重于加強圖像的區別性。
以全局梯度圖像F行位置信息作為x軸,列位置信息作為y軸,梯度值作為z軸構造三維空間,其三維曲線特征如圖3(a)所示,并畫出其在兩個視角下投影在xoz和yoz平面的峰頂曲線及其凹凸點和峰谷曲線及其凹凸點圖如圖3(b)和(c)所示;同時將其三維曲線利用平行于yoz面的等距面切分得到分割圖如圖3(d)所示,從而充分提取圖像混合結構特征。具體步驟如下:按照式(12)獲得xoz投影下F的峰頂曲線M1P和峰谷曲線M1V,同理對F按列取最大值和最小值操作可得yoz投影下F的峰頂曲線M2P和峰谷曲線M2V。
其中:max(·,1)和min(·,1)分別表示對矩陣F按行取最大值和最小值操作。
為了增強圖像的分類性能獲取更加豐富特征,對不同投影下的峰頂曲線和峰谷曲線進行凹凸點集求取,即尋找更為突出的點來表征圖像。于是對xoz平面峰頂曲線進行求凹凸點集操作,如式(13)所示。
其中:i為M1P的第i行。當i-1=0 或i=N1時,即該像素點位于邊界時只需和內部相鄰像素點比較大小判斷是否為凹凸點。
同理,可得xoz面的峰谷曲線,yoz面的峰頂曲線和峰谷曲線凹凸點集為M2P1、M1V1和M2V1。經實驗發現,當圖像經過如圖像壓縮、對比度調整和高斯噪聲等內容保持的圖像處理后,其峰頂曲線與峰谷曲線值大小會發生一定程度變化,但是值得注意的是無論像素值如何改變,其曲線凹凸形狀不會改變。因此為了增加圖像的區分度,利用曲線的凹凸點得到魯棒的結構特征點及其位置信息,再進行聯合分割圖的計算,可以在保持魯棒性的同時最大程度地增加區分性。將不同投影下的峰頂曲線凹凸點和峰谷曲線凹凸點進行求并集處理,得到局部結構特征A和B如式(14)所示,聯合起來得到局部結構特征點特征Z1=[A,B]。
由于在不同投影下的特征點不能完備表達圖像結構信息,所以考慮不同投影下凹凸點集的位置信息,構造位置結構特征。具體步驟如下:提取xoz投影下峰谷曲線的凹凸點集M1P1在xoy平面上的位置信息矩陣P=[P1,P2,P3,…,PN1],其中Pi=[p1,p2,p3,…,pN1]T(i=1,2,3,…,N1);與yoz投影下峰谷曲線M1V1在xoy平面的位置信息矩陣U=[U1,U2,U3,…,UN1],其中Ui=[u1,u2,u3,…,uN1]T(i=1,2,3,…,N1);同理,xoz投影下峰谷曲線凹凸點集M2P1在xoy平面的位置信息矩陣Q=[Q1,Q2,Q3,…,QN1] ,其中Qi=[q1,q2,q3,…,qN1]T(i=1,2,3,…,N1);與yoz投影下峰谷曲線凹凸點集M1V2在xoy平面的位置信息矩陣V=[V1,V2,V3,…,VN1],其中Vi=[v1,v2,v3,…,vN1]T(i=1,2,3,…,N1)。
與提取結構特征點特征一樣,將不同視角在xoy平面上的位置信息進行壓縮;矩陣P與U求并集矩陣得D1=P∪U,矩陣Q與V求并集D2=Q∪V。然后對求得的矩陣D1、D2求行和,轉置及二值化操作得到D3=[D13,D23,D33,…,DN13]、D4=[D14,D24,D34,…,DN14],將D3與D4聯合構成位置矩陣Z2=[D13,D23,D33,…,DN13,D14,D24,D34,…,DN14]。
以上是通過對圖像三維特征點和位置矩陣得到局部結構特征,接下來對圖像整體進行提取全局結構特征。首先對三維圖像用平行于xoz軸的平面進行均等切分為N1個切面矩陣。通過統計每個切面所含像素點個數的像素點集S1=[S11,S21,S31,…,SN11],統計每個面矩陣的方差S2=[S12,S22,S32,…,SN12]。利用式(15)(16)對S1和S2分別進行二值化處理后連接起來得到全局結構特征S=[S11,S21,S31,…,SN11,S12,S22,S32,…,SN12]。
通過聯合局部特征包含結構特征點Z1與位置結構特征Z2,與包含每個切面像素點集和方差的全局結構特征S得到混合結構特征H2=[Z1,Z2,S],長度為L2=(6×N1)-2。
1.5 哈希生成
將全局特征H1和三維結構特征H2連接起來可以得到中間哈希序列H3=[H1,H2],因此本算法哈希長度為L=L1+L2=n(n+1)+(6×N1)-2二進制比特位。在安全性方面,本文通過偽隨機發生器生成1 000個偽隨機數序列W的密鑰Key。中間哈希序列經秘鑰重新排序得到最終的哈希序列h,如式(17)所示。
其中:W[i]表示W中第i個元素。
由于算法的哈希序列為二進制序列,選擇漢明距離Dt來衡量。當兩幅圖像的哈希距離小于設置的閾值T時認定為相似圖像,反之為不同圖像。
其中:h1(i)和h2(i)是h的第i個元素;⊕是異或運算;L是哈希長度。
2 實驗結果與分析
實驗主要包含魯棒性實驗、區別性實驗、不同算法性能比較等部分組成。算法參數設置如下:規格化尺寸N=256;圖像融合尺度N1=64,階數n=5,從而哈希長度L=412 bit。2.3節闡述了N1值大小及階數n等因素對算法性能的影響。所有的實驗均通過MATLAB R2019a平臺進行仿真,計算機配置為Intel Core i5-4210U CPU 1.7 GHz和4.00 GB內存。
2.1 魯棒性實驗
選擇20幅彩色圖像進行魯棒性測試,如圖4所示。按照表2對圖像進行魯棒性攻擊,每幅圖像得到66幅相似圖像,彩色圖像和其66幅相似圖像構成相似圖像對。通過式(18)計算得到哈希距離。
表3是20幅圖像經以上12種內容保持操作得到的圖像與原圖的哈希距離統計表,圖5是對圖4前五幅圖像的具體攻擊操作哈希分布圖。從圖5可以看出算法對于以上多種攻擊操作除了旋轉外,其魯棒性較好。由表3可知,除旋轉外這些攻擊操作最小值不超過44,最大值不超過81,均值不超過64,標準差不超過9。說明算法對除旋轉外的攻擊操作的魯棒性較好,且當閾值設定到81以上,理論上可以將全部相似圖像識別出來。
2.2 區別性實驗
區別性實驗圖像庫由數據庫ground truth database[26]中的 700 幅圖像和數據庫 VOC[27]中的300幅圖像構成。通過計算1 000幅圖像之間的漢明距離,得到C21 000=499 500個不同圖像對。從表2中選取11種常用攻擊操作如表4所示,并對1 000幅不同圖像采用表4的所有類別進行攻擊,每幅圖像會得到22幅相似圖像,從而相似圖像對的總數為C223×1 000=253 000。
相似圖像對和不同圖像對的漢明距離分布如圖6所示,橫坐標表示相似圖像對和不同圖像對的哈希距離,縱坐標為該距離數目統計。由圖6可知,不同圖像對漢明距離最大值為177,最小值為96;相似圖像對之間漢明距離最大值為114,最小值為0。可以看出,相似圖像對與不同圖像對在漢明距離96~114重疊,為了獲得最優的閾值來區分相似圖像對與不同圖像對,引入碰撞率PC和檢錯率PE來分析算法的區別,如式(19)所示。由圖6和表5的數據可知,當閾值T=102時,PC為4.00×10-5,PE為1.71×10-4,綜合考慮碰撞率和檢錯率選擇T=102為閾值。
其中:NC為判斷相似圖像的不同圖像的個數;ND為不同圖像的總數;NE為判斷不同圖像的相似圖像的個數;NS為相似圖像的總數。
2.3 不同尺度N1和階數n等對算法性能的影響
為了體現不同N1值以及階數n等對所提哈希算法的性能影響,在不改變其他條件下,設N1=64,n=2,3,4,5,6和N1=32,n=5進行實驗,并通過ROC曲線[28]來分析不同的N1值和階數n對相似圖像對和不同圖像對的區分能力,如圖7所示。
本次實驗采用2.2節中的253 000個相似圖像對和499 500個不同圖像對。評估使用錯誤接受率PFPR和正確接受率PTPR,計算公式如式(20)所示。
其中:n1為不同圖像判定為相似圖像對的數目;n2為正確判定相似圖像對數目;N11和N21為不同圖對總數和相似圖像對總數。
從圖7的ROC曲線可知,在同等尺寸N1=64時,n=5是最優的情況;并且在n=5時,隨著N1值的減少,算法的ROC曲線表現力在下降,同時N1=128時哈希長度高達806 bit,所以不予考慮。并且當N1=64時,隨著n的增大算法性能越好,但是當ngt;5之后開始下降。因此,綜合考慮當N1=64時,n=5為最佳選擇。
另外考慮本文在預處理加入了圖像多尺度融合的思想,將尺度融合到N1=64的融合圖像和直接取尺度為64的不融合圖像進行性能比較如圖8所示。可見尺度融合后算法分類性能得到很大提升,融合操作具有一定的效果。
2.4 與其他算法對比實驗
為考量本文算法的圖像分類性能,將本文算法與文獻[10,12,17,20,25]算法進行比較,為了保證合理及公平性,所有算法都在統一的實驗平臺和設置下操作。均使用2.2節采用的499 500個不同圖像對和253 000個相似圖像對來驗證它們的分類性能,且用式(20)計算不同算法的ROC曲線,對比如圖9所示。
算法的PTPR越大,PFPR越小,該算法性能越好。由表6可知,當PFPR為0時,本文算法的PTPR為0.999 1,而文獻[10,12,17,20,25]的PTPR分別為0.998 5、0.999 9、0.924 5、0.996 4和0.998 8。當PTPR接近1時,本文算法的PFPR為0.002 0,而文獻[10,12,17,20,25]的PFPR分別為0.112 1、6.00×10-6、0.761 1、0.060 4和0.005 4。當PFPR為0時,本文算法僅次于文獻[12]并且是在小數位第四位上;當PTPR為1時,本文算法的PFPR僅高于文獻[12],并且一個整數位至少由7比特位表示,則文獻[10,12,17,20,25]的哈希長度為448 bit、451 bit、1 344 bit、448 bit和156 bit,而本文算法哈希長度為412 bit,僅次于文獻[25],平均所用時間也較短,同時從圖9可知本文算法在除文獻[12]外最接近ROC曲線圖的左上角,即擁有較好的分類性能,即本文算法的綜合性能較好。
2.5 拷貝檢測應用
為了測試算法在拷貝檢測應用方面的性能,從網絡上下載1 000幅圖片,并隨機選擇100幅查詢圖片進行如表7所示攻擊操作得到2 600幅拷貝圖像。將這1 000張圖片加入到2 600幅拷貝圖像中構成拷貝檢測圖像庫,并查詢圖像,即初始選取的100幅圖像進行拷貝檢測實驗。利用查全率P和查準率R[29]來測試算法在多種標準攻擊下的性能,如式(21)所示。
其中:N3是查詢中正確匹配查詢圖像的拷貝圖像的數目;N4是查詢中被認為是拷貝圖像的數目;N5是拷貝檢測庫中所有圖像數目。
表8是取不同閾值下算法的查全率和查準率。當閾值為94時可以在準確率高達94.22%的情況下將全部拷貝檢測圖像檢測出來;當閾值取104時查全率為98.53%并且查準率為95.37%。
通過與文獻[10,12,13,17,25]算法進行拷貝檢測實驗比較,繪制查全率和查準率(P-R)曲線,觀察本文算法與各對比算法的拷貝檢測性能,如圖10所示。從圖10中可以明顯看出,本文算法相較其他算法擁有更好的P-R曲線,即更靠近右上角,并且在保持較高查全率的同時具有更高的查準率。因此,算法在拷貝檢測應用方面具有較好的拷貝檢測能力。
3 結束語
本文提出了一種基于QBFM矩和三維結構的圖像哈希算法。通過將不同尺度圖像融合進行圖像增強,利用QBFM系數提取全局特征,保證了算法良好的魯棒性,對圖像的全局梯度信息進行三維結構特征提取,保證算法的區別性。通過實驗結果可知,算法在魯棒性和區分性有較好的平衡,哈希長度也較為緊湊,平均運行用時較短。與其他算法相比,算法擁有較優的圖像分類性能,在拷貝檢測應用方面相比較其他算法具有最佳的P-R曲線。下一步將在保持良好性能前提下,使得算法增強對大角度旋轉的魯棒性并優化運算時間。
參考文獻:
[1]Lei Yanqiang,Wang Yuangen,Huang Jiwu.Robust image hash in radon transform domain for authentication[J].Signal Processing:Image Communication,2011,26(6):280-288.
[2]Qin Chuan,Chang C,Tsou P.Robust image hashing using non-uniform sampling in discrete Fourier domain[J].Digital Signal Processing,2013,23(2):578-585.
[3]Wang Xiaofeng,Xue Jianru,Zheng Zhenqiang,et al.Image forensic signature for content authenticity analysis[J].Journal of Visual Communication and Image Representation,2012,23(5):782-797.
[4]沈麒,趙琰.基于小波分解的統計特征哈希[J].應用科學學報.2018,36(2):247-254.(Shen Qi,Zhao Yan.Statistical feature ha-shing based on wavelet decomposition[J].Journal of Applied Sciences,2018,36(2):247-254.)
[5]Tang Zhenjun,Yang Fanyang,Huang Liyan,et al.Robust image hashing with dominant DCT coefficients[J].Optik,2014,125(18):5102-5107.
[6]Qin Chuan,Chen Xueqin,Dong Jing,et al.Perceptual image hashing with selective sampling for salient structure features[J].Displays,2016,45:26-37.
[7]Ouyang Junlin,Coatrieux G,Shu Huazhong.Robust hashing for image authentication using quaternion discrete Fourier transform and log-polar transform[J].Digital Signal Processing,2015,41:98-109.
[8]Tang Zhenjun,Ruan Linlin,Qin Chuan,et al.Robust image hashing with embedding vector variance of LLE[J].Digital Signal Proces-sing,2015,43:17-27.
[9]Tang Zhenjun,Zhang Xianquan,Zhang Shichao.Robust perceptual image hashing based on ring partition and NMF[J].IEEE Trans on Knowledge and Data Engineering,2014,26(3):711-724.
[10]Davarzani R,Mozaffari S,Yaghmaie K.Perceptual image hashing using center-symmetric local binary patterns[J].Multimedia Tools and Applications,2016,75(8):4639-4667.
[11]沈麒,趙琰.面向拷貝檢測的圖像哈希算法[J].計算機應用研究,2019,36(2):611-614.(Shen Qi,Zhao Yan.Image hash algorithm for copy detection[J].Application research of Computers,2019,36(2):611-614.)
[12]袁曉冉,趙琰.基于圖像能量的穩健圖像哈希算法[J].計算機應用研究,2021,38(6):1900-1906.(Yuan Xiaoran,Zhao Yan.Robust image hashing algorithm based on image energy[J].Application Research of Computers,2021,38(6):1900-1906.)
[13]Tang Zhenjun,Chen Lyu,Zhang Xianquan,et al.Robust image hashing with tensor decomposition[J].IEEE Trans on Knowledge and Data Engineering,2019,31(3):549-560.
[14]Yang Hengfu,Yin Jianping,Yang Ying.Robust image hashing scheme based on low-rank decomposition and path integral LBP[J].IEEE Access,2019,7:51656-51664.
[15]Zhao Yan,Wang Shuozhong,Zhang Xinpeng,et al.Robust hashing for image authentication using Zernike moments and local features[J].IEEE Trans on Information Forensics and Security,2013,8(1):55-63.
[16]Hosny K M,Khedr Y M,Khedr W I,et al.Robust image hashing using exact Gaussian-Hermite moments[J].LET Image Processing,2018,12(12):2178-2185.
[17]Tang Zhenjun,Zhang Hanyun,Pun C M,et al.Robust image hashing with visual attention model and invariant moments[J].LET Image Processing,2020,14(5):901-908.
[18]Tang Zhenjun,Huang Liyan,Zhang Xianquan,et al.Robust image hashing based on color vector angle and Canny operator[J].Aeu-International Journal of Electronics and Communications,2016,70(6):833-841.
[19]Qin Chuan,Sun Meihui,Chang Chinchen.Perceptual hashing for color images based on hybrid extraction of structural features[J].Signal Processing,2018,142:194-205.
[20]Tang Zhenjun,Yu Mengzhu,Yao Heng,et al.Robust image hashing with singular values of quaternion SVD[J].The Computer Journal,2019(5307):DOI:10.1093/comjnl/bxz127 .
[21]Shen Qi,Zhao Yan.Perceptual hashing for color image based on color opponent component and quadtree structure[J].Signal Processing,2020,166(1):107244.
[22]Hamid H,Ahmed F,Ahmad J.Robust image hashing scheme using Laplacian pyramids[J].Computers amp; Electrical Engineering,2020,84(6):106648.
[23]Shao Zhuhong,Shu Huazhong,Wu Jiasong,et al.Quaternion Bessel-Fourier moments and their invariant descriptors for object reconstruction and recognition[J].Pattern Recognition,2014,47(2):603-611.
[24]Di Zenzo S.A note on the gradient of a multi-image[J].Computer Vision,Graphics and Image Processing,1986,33(1):116-125.
[25]沈麒,趙琰,周曉煒,等.結合結構與梯度的圖像哈希算法[J].浙江大學學報:工學版,2020,54(8):1525-1533.(Shen Qi,Zhao Yan,Zhou Xiaowei,et al.Image hashing algorithm based on structure and gradient[J].Journal of Zhejiang University:Engineering Science,2020,54(8):1525-1533.)
[26]University of Washington.Ground truth database[EB/OL].[2021-07-10].http://www.cs.washington.edu/research/image database/groundtruth/.
[27]Redmon J.Pascal VOC dataset mirrir[EB/OL].(2007)[2021-07-10].https://pjreddie.com/projects/pascal-voc-dataset-mirror/.
[28]Fawcett T.An introduction to ROC analysis[J].Pattern Recognition Letters,2006,27(8):861-874.
[29]Muller H,Muller W,Squire D M,et al.Performance evaluation in content-based image retrieval:overview and proposals[J].Pattern Re-cognition Letters,2001,22(5):593-601.