段明月 李爽 張源策 李麗紅
摘要:隱寫術與隱寫分析是信息安全領域中一個重要的課題。隨著圖像隱寫的不斷發展,為了防止技術被惡意者利用,提出了圖像隱寫分析技術。本文簡單介紹圖像隱寫類別,并根據適用范圍不同將隱寫分析分為專用隱寫分析和通用隱寫分析,總結和歸納各算法的優缺點,探討深度學習在圖像隱寫分析上的研究所面臨的問題及發展趨勢。
關鍵詞: 圖像隱寫; 圖像隱寫分析; 深度學習
中圖分類號:TP18? ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2022)09-0003-03
1引言
隨著網絡的不斷發展,通信加密技術得到了很好的發展,然而簡單的通信加密并不能滿足敏感信息傳遞需求,隨后研究者開始研究信息隱藏技術,簡稱“隱寫術”,通過把秘密信息嵌入多媒體載體盡可能不改變載體的視覺和統計特性, 以達到掩蓋“正在進行秘密通訊”的目的[1]。互聯網中廣泛的多媒體數據可以作為載體,如視頻、音頻、圖像、文本等,其中圖像因其內容廣泛、容易獲取,且人們對圖像的非重點區域不夠敏感等原因,逐漸成為最常見的秘密信息載體形式。近年來,針對圖像的隱寫算法已有較為成熟的算法,并得到了廣泛應用。
然而,“隱寫術”是一把雙刃劍。為了避免不法分子利用“隱寫術”傳播不良信息,研究者提出了隱寫分析技術。隱寫分析的目標是根據載體的統計特性判斷其中是否隱藏有秘密信息, 進而估計嵌入的信息長度、識別隱寫工具、估計隱寫密鑰, 最終提取秘密信息[2],當前的研究重點是檢測載體中是否含有秘密信息。
本文首先對圖像隱寫算法進行簡單介紹,然后分別介紹專用隱寫分析與通用隱寫分析,最后總結當前隱寫分析算法的劣勢,并討論未來發展趨勢。
2圖像隱寫
根據是否改變載體原始數據將圖像隱寫算法分為嵌入型隱寫算法和無載體隱寫算法。嵌入型隱寫算法通過修改載體像素嵌入秘密信息,具有高隱寫量、易于實現等特點,近幾年取得了不錯的成果。根據不同的嵌入策略可將嵌入型隱寫算法分為非自適應隱寫算法與自適應隱寫算法。其中,非自適應隱寫算法主要是通過修改像素值或頻域系數實現秘密信息嵌入,是對載體元素無差別的選擇與修改,包括LSB(Least Significant Bit)算法[4]、[±1]嵌入算法、Outguess、F5[5]等。
針對自適應隱寫算法導致圖像質量大幅下降、統計特征改變過大等問題,研究者提出自適應隱寫算法,選擇合適的載體圖像,通過訓練找到最適合隱寫的位置,得到最小損失函數,常見的自適應隱寫術主要有HILL(High-pass, Low-pass, and Low-pass)、S-UNIWARD、WOW (Wavelet Obtained Weights)、HUGO等。
但是,嵌入型隱寫算法通過直接修改載體圖像隱藏信息的方式,總會影響圖像的視覺效果和統計特征,容易被隱寫分析捕捉到,研究者又提出了無載體隱寫算法。該算法本身不存在修改載體問題,而是通過載體的某些特征屬性隱藏秘密信息,其抗隱寫分析能力更高。無載體圖像隱寫并不是完全不需要載體,而是通過建立圖像的屬性特征與隱秘信息的映射關系來實現隱寫目的,為隱寫提供了新思路。但該方法的隱寫信息量較小,研究難度大,目前的研究成果不多。
3? 圖像隱寫分析
圖像隱寫分析技術主要是對圖像進行檢測,判定其是否含有秘密信息。隨著隱寫術的快速發展,隱寫方法層出不窮,與之相對的隱寫分析也取得了很多成果。圖像隱寫分析主要的步驟分為三步:(1)圖像預處理,將獲取到的圖像進行處理,得到可處理的信息;(2)提取特征,在預處理后的圖像中提取盡可能多且關鍵的特征;(3)判定輸入圖像是否含密。通過使用大量的圖像數據訓練卷積網絡,得到較好的判定效果。圖像隱寫分析方法主要分為兩大類,分別為專用隱寫分析算法和通用隱寫分析算法。
3.1專用隱寫分析算法
專用隱寫分析算法主要針對某種非自適應隱寫算法進行分析。主要是利用該隱寫算法的漏洞,檢測正確率很高,但泛化能力比較差,不適合大規模使用。
LSB替換會使圖像DCT系數值的相鄰對值趨于一致,相鄰對值的接近程度與是否含密成正比,根據這種特性提出了[x2]算法[6],將每組對值的均值與實際分布進行對比,得出含密的概率。根據空域LSB隱寫嵌入秘密信息會降低圖像系數空間相關性的特點提出了RS分析方法[7],通過統計替換前后規則類、異常類和不可使用類的個數變化得出嵌入的秘密信息量。
針對F5算法,提出了一種基于平方誤差最小準則的隱寫分析算法[8],將剪裁后的圖像與載密圖像的DCT系數直方圖進行比較分析,判斷是否含密并計算含密容量。還可以根據0/1系數組合差異對F5算法進行有效檢測,通過提取相鄰塊間0/1系數組合差異特征,用SVM進行分類。
3.2通用隱寫分析算法
通用隱寫分析方法主要是針對自適應隱寫算法和無載體隱寫算法所設計的,能有效識別多種隱寫算法,這種方法相比專用隱寫分析算法識別率稍差,但其泛化能力較強,能有效抵御一些新出現的隱寫算法,因此成為當下研究的熱點。通用隱寫分析方法主要是使用深度學習中的卷積神經網絡,有效獲取圖像中的特征,通過學習大量的數據優化權重和偏移量,使用不同的網絡層和激活函數調整網絡、加速收斂,因此不需要過多的先驗知識就可以完成隱寫分析。根據訓練策略的不同,通用隱寫分析方法又可以分為兩類,分別為半學習隱寫分析方法和全學習隱寫分析方法。
3.2.1半學習隱寫分析方法
半學習隱寫分析模型是指圖像預處理時使用給定的高通濾波器,獲取圖像的殘差信息,輔助卷積神經網絡進行學習。
2016年,Xu等人[10]提出了Xu-Net網絡,預處理時使用中心對稱的KV核,有效保留當前像素點與其周圍像素點之間的關系,獲取像素之間的共生矩陣,該網絡的檢測正確率大幅提高。
2018年,高培賢等人[12]在Xu-Net的基礎上提出SCNN模型,該模型含有七個卷積層和一個全連接層,用兩個3×3的卷積核代替Xu-Net的5×5的卷積核,激活函數全部用ReLU函數,用移動步長為2的卷積層替代池化層,在減少參數的同時提升了準確率,并且加速模型收斂,防止梯度爆炸和梯度消失等問題。同年,又提出S-DCCN模型[13],在每個卷積層后連接一個密集連接模塊,可使最后一層得到原始圖像的特征,防止部分特征丟失,相比Xu-Net,檢測準確率提升了14%,但這也導致模型訓練時間更長,參數更多,不過還是在可接受范圍內。2018年,汪然等人[14]提出了分類與分割相結合的JPEG圖像隱寫分析模型,該模型降低了類內離散度、提升了類間離散度,與“富模型”特征提取相比,檢測性能更加優異。
2021年,黃思遠等人[16]提出了一種基于顯著性檢測的圖像隱寫分析方法,對圖像的復雜區域做重點監測,用BASNet將圖像的顯著性區域提取出來,進行特征提取與學習,該方法的優點是空域與JPEG域通用,將圖像分割融合了隱寫分析領域,但在低嵌入率情況下檢測效果不好。
3.2.2全學習隱寫分析方法
全學習隱寫分析方法與半學習模型最大的差別是預處理結構也要經過網絡訓練,而不是使用固定的濾波器。
2017年,Ye等人[11]提出了Ye-Net網絡,添加了多種濾波核,使用一種新的截斷(truncated linear unit,簡稱TLU)激活函數。Ye-Net首次將通道感知引入隱寫分析中,并且這種技術在紋理復雜處與細節處檢測效果更好,并且能夠提升檢測的準確率。2019年,Zhu等人[15]提出了Zhu-Net網絡,在預處理時將25個5×5的濾波核替換為3×3的濾波核,減小計算量,模型更容易收斂和訓練。
4? 結論與展望
4.1結論
本文對近幾年圖像隱寫分析做了簡單的介紹,通過將深度學習引入圖像領域,已經對隱寫檢測正確率有了較好的提升,并且泛化效果和魯棒性都有了很大的提升。但是,基于深度學習的隱寫分析模型還有很多地方需要改進。
(1)擬合速度慢。模型參數多、層數多、訓練時間長、模型收斂慢。
(2)對預處理層過分依賴。選擇不同的濾波器會得到相差很大的結果。
(3)低嵌入率檢測效果差。當隱寫的數據量很小時,不能有效檢測到嵌入,檢測的正確率較低。
4.2展望
筆者期待的圖像隱寫分析網絡是可以檢測出秘密信息是否存在,并且提取秘密信息,而當下還處于檢測是否存在階段,之后的研究可能集中在以下幾個方向:
(1)加速模型訓練。目前的網絡訓練時長并不理想,訓練時間過長不利于投入使用,尤其是全學習隱寫分析模型。
(2)實現小樣本集訓練。目前的神經網絡主要依靠大量樣本的學習才能訓練出一個較好的結果,而大樣本集難以獲取和訓練時間長都是問題,如果可以實現小樣本訓練,對時間和空間節省都是一項巨大的進步。
(3)進一步提高隱寫分析模型的通用性。使一個模型可以對多種格式的圖像進行分析。
(4)開展針對無載體圖像隱寫的研究。目前無法有效檢測這種隱寫算法,未來有很大的發展空間。
參考文獻:
[1] Cheddad A,Condell J, Curran K, et al. Digital image steganography: survey and analysis of current methods[J].Signal Processing,2010,90(3):727-752.
[2] Nissar A,Mir A H. Classification of steganalysis techniques: a study[J].Digital Signal Processing,2010,20(6):1758-1770.
[3] Hinton G, Osindero S, WellingM, et al.Unsupervised discovery of nonlinear structure using contrastive backpropagation[J].Cognitive Science,2006,30(4):725-731.
[4] Chan C K, Cheng L M. Hiding data in images by simple LSB substitution[J].Pattern Recognition,2004,37(3):469-474.
[5]A Westfeld. F5-A Steganographic Algorithm High Capacity Despite Better Steganalysis[C]// 4th International Workshop on Information Hiding (IH 2001),2001.
[6] Westfeld A, Pfitzmann A.Attacks on steganographicsystems[C]//InformationHiding,2000.
[7] Fridrich J,Goljan M,Du R.Detecting LSB steganography in color,and gray-scale images[J].IEEE MultiMedia,2001,8(4):22-28.
[8] Fridrich J,Goljan M,Hogea D.Steganalysis of JPEG images:breaking the F5 algorithm[C]//InformationHiding,2003.
[9] 韓曉東,平西建,張濤.基于0,1系數組合差異的F5隱寫分析算法[J].信息工程大學學報,2009,10(2):184-187.
[10] Xu G S,Wu H Z,Shi Y Q. Structural design of convolutional neural networks for steganalysis[J]. IEEE Signal Processing Letters,2016,23(5):708-712.
[11] YeJ,Ni J Q,Yi Y. Deep learning hierarchical representations for image steganalysis[J].IEEE Transactions on Information Forensics and Security,2017,12(11):2545-2557.
[12] 高培賢,魏立線,劉佳,等.針對圖像隱寫分析的卷積神經網絡結構設計[J].中國科技論文,2018,13(14):1664-1668.
[13] 高培賢,魏立線,劉佳,等.基于密集連接網絡的圖像隱寫分析[J].計算機工程與應用,2018,54(15):74-77,146.
[14] 汪然,薛小燕,平西建,等.分類與分割相結合的JPEG圖像隱寫分析[J].中國圖象圖形學報,2018,23(10):1472-1482.
[15] Zhang R,Zhu F,Liu J Y, et al. Depth-wise separable convolutions and multi-level pooling for an efficient spatial CNN-based steganalysis[J].IEEE Transactions on Information Forensics and Security,2020,15:1138-1150.
[16] 黃思遠,張敏情,柯彥,等.基于顯著性檢測的圖像隱寫分析方法[J].計算機應用,2021,41(2):441-448.
【通聯編輯:唐一東】