摘要:為了達到更為可靠的檢測,綜合利用現有的檢測算法,根據擇多準則提出了一個擇多分類算法的簡化模型,得到了擇多分類算法的理論錯誤分類概率的表達式,錯誤分類概率的上界和分類效果與檢測算法數目的關系。應用該算法到圖像空域LSB(least significant bit)隱寫的分類問題,得到的實驗結果表明該算法在一定程度上改善了分類效果。
關鍵詞:隱寫分析; 擇多準則; ROC分析
中圖分類號:TP391
文獻標志碼:A
文章編號:1001-3695(2007)09-0118-03
信息安全保障了國家安全和社會穩定。信息隱藏作為新興的技術成為信息安全的熱點問題。數字隱寫(steganography)和隱寫分析(steganalysis)是信息隱藏的重要分支。前者是將秘密消息隱藏在載體中進行傳送而不引起第三方懷疑,達到隱蔽通信的目的;后者是對數字隱寫的攻擊,如對隱秘信息的檢測、提取、恢復和破壞。數字隱寫隱藏了互相通信的事實,成為隱蔽通信的有效方式。盡管如此,數字隱寫可能被不法使用,成為危害國家政治和經濟安全的工具(媒體多有報道)。到目前為止,因特網上有超過200種隱寫軟件,這些均可能被一般人使用。總而言之,隱寫分析是迫切需要研究的領域。
目前,在隱寫分析領域中開展的研究基本上集中于對隱蔽信息的檢測。由于LSB (least significant bit) 隱寫方法使用的廣泛性,針對它的隱蔽信息檢測更是隱寫分析的重點。其中性能較好的算法有RS方法[1]、SPA方法[2]、DIH方法[3]、EsLsb方法[4]、improved SPA方法[5]。D. K. Andrew[6] 則通過大量的實驗評估了Pairs [7]、RS和SPA分析方法的可靠性,并對這三種方法給出了多種改進方案。本文綜合利用已有檢測算法,提出了一種新的隱寫分析方法,筆者稱這種方法為擇多分類方法。
1擇多分類算法的簡化框架
隱蔽信息的檢測可以看做是一個分類問題,即判斷檢測對象是屬于載體對象的集合還是載密對象的集合。錯誤分類是指分類結果與實際不相符,也就是說,檢測對象為載體對象卻被歸類為載密對象,檢測對象為載密對象卻被歸類為載體對象。
設有N個用于分類檢測對象的檢測算法,每個算法的錯誤分類概率均小于1/2。針對每個檢測對象,應用這N個算法進行分類,并統計分類結果。根據擇多準則,出現次數最多的分類結果被認為是檢測對象的類型。這種綜合利用多種檢測算法進行分類的算法稱之為擇多分類算法。下面給出擇多分類算法的簡化模型。
假設一個檢測算法的分類結果只有載體對象和載密對象兩類。設可利用的檢測算法數目為2k+1。其中:k=1,2,3,…。取算法數目為奇數是為了避免擇多準則下討論兩類結果時,出現兩類結果的算法數目相等的情況。
從表1、2可以看出,擇多分類算法的虛警率和檢測率與五種算法中最優值相差不大,尤其是虛警率,幾乎保持與最優的算法相當的水平。往往虛警率的降低是以犧牲檢測率為代價;反之亦然。從表1、2可以看出,擇多分類算法同時改進了虛警率和檢測率,將較優的虛警率和檢測率集中在一個分類算法中。表1的結果利用的是三種檢測算法,表2則是五種檢測算法。比較這兩個表可知,利用五種檢測算法的擇多分類算法的結果要優于只用三種檢測算法的結果。
2.2.2誤差分析和改進
根據建立的擇多分類算法框架,2k+1=3時全局檢測率的理論值是0.966 4,而實際值是0.915 5。2k+1=5時全局檢測率的理論值是0.988 8,而實際值是0.924 8。原因在于,實驗中利用檢測算法的分類結果并不是嚴格滿足相互獨立條件。
實際上,檢測算法的相互獨立條件比較強,可以弱化這個條件,如要求檢測算法兩兩獨立等。除此之外,可以選擇更多的檢測算法應用到新算法中,以彌補條件不嚴格成立的缺陷,并且隨著算法數目的增加,檢測率會快速提高。
3結束語
本文給出了簡化的擇多分類算法框架,得到理論錯誤分類概率,分析了擇多分類算法錯誤分類概率與檢測算法數目的關系。對空域LSB隱寫分類的實驗表明,擇多分類算法同時改進了虛警率和檢測率,提高了全局檢測率。值得一提的是,擇多分類算法同樣適合于針對其他隱寫方法的檢測算法,比如針對±k隨機嵌入的隱寫分析算法。
本文只是給出了一個簡化的擇多分類算法框架,更加實際的模型有待完善。為了進一步提高分類效果,可以通過尋找更多滿足條件的檢測算法進行擇多分類。
新算法模型表明當檢測算法越來越多時,錯誤分類概率會越來越小。由于檢測算法的不斷提出,加上算法獨立性要求的弱化,尋找更多滿足條件的檢測算法是可行的。
參考文獻:
[1]FRIDRICH J,GOLJAN M, DU R. Reliable detection of LSB steganography in grayseale and color images[C]//Proc of ACM, Special Session on Multimedia Security and Watermarking. Ottawa:[s.n.],2001. 27-30.
[2]DUMITRESCU S,WU Xiao-lin,WANG Zhe. Detection of LSB steganography via sample pair analysis[C]//Proc of the 5th International Workshop on Information Hiding, LCNS 2578. Berlin:SpringerVerlag,2002:55-372.
[3]ZHANG Tao, PING Xijian. A new approach to reliable detection of LSB steganography in natural images[J].Signal Processing,Elsevier Science,2003,83 (10):2085-2093.
[4]FRIDRICH J,GOLJAN M. On estimation of secret message length in LSB steganography in spatial domain[C]//Security, Steganography and Watermaking of Multimedia Contents. San Jose:SPIE Press, 2004,5306:23-34.
[5]LU Peizhong, LUO Xiangyang,TANG Qingyang, et al. An improved sample pairs method for detection of LSB embedding[C]// Proc of the 6th International Hiding Workshop.Berlin:SpringerVerlag,2004:116-127.
[6]KER A D. Improved detection of LSB steganography in grayscale images[C]//Proc of the 6th Information Hiding Workshop. Berlin:SpringerVerlag, 2004:97-115.
[7]FRIDRICH J,GOLJAN M,SOUKAL D. Higherorder statistical steganalysis of palette images[C]//Proc of SPIE:Security and Wartemar King of Multicmedia Contents V. 2003:178-190.
[8]GOLDREICH O. Foundations of cryptography[M]. Beijing:Publishing House of Electronics Industry, 2003:11-12.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”