王巖巖 武亞菲
摘要: 介紹了隱寫術和反隱寫術,說明了隱寫術的原理及隱寫術在文本、圖像、音頻中的應用。從隱寫系統(tǒng)的絕對安全性、檢測隱寫消息的低效性和隱寫算法的復雜多變性等方面闡明了反隱寫所面臨的挑戰(zhàn)。最后指出反隱寫術只能證明隱寫信息的存在性而不能破譯隱寫信息的不足;同時簡要闡明了反隱寫的發(fā)展趨勢。
關鍵詞: 隱寫術; 反隱寫; 隱寫系統(tǒng); 隱寫檢驗; 隱寫算法
中圖分類號:TP309文獻標志碼:A文章編號:1006-8228(2012)03-04-03
Application of steganography and its security
Wang Yanyan, Wu Yafei
(College of computer,Dezhou University,Dezhou, Shandong China, 253023)
Abstract: The authors introduce in this paper steganography and anti-steganography and illustrates the principle of steganographic methods and their applications in the text, images, and audio. It is illustrated that anti-steganography faces challenges from absolute safety of hidden writing system, inefficiency of detecting to complexity of steganographic algorithms. The authors point out that the anti-steganography can only prove the existence of the steganographic information, but not crack it. This paper briefly explains the trend of anti-steganography.
Key words: steganography; anti-steganography; hidden writing system; hidden writing tests; steganographic algorithm
0 引言
隱寫術是關于信息隱藏的加密技術。隱寫術的主要功能是提供一種保密通信技術,它將秘密信息隱藏在可公開的普通載體中傳送,實現(xiàn)隱蔽通信。利用信息隱藏技術,可將重要的秘密信息隱藏于公開信息的冗余部分,通過公開信息的傳輸來傳遞秘密信息,從而達到安全傳遞秘密信息的目的。
作為網(wǎng)絡安全基礎之一的隱寫術在各個方面給密碼學的研究帶來很大幫助,但同時,隱寫術也被不法分子所利用,進行危害國家安全、社會穩(wěn)定和經(jīng)濟發(fā)展的活動。因此我們不但要加強隱寫術的安全性,更要看到反隱寫的重要性。
反隱寫是對隱寫術的攻擊,目的是為了檢測秘密消息的存在以致破壞隱蔽通信。它貌似解密技術,但兩者本質(zhì)上不一樣。反隱寫的過程是檢測可疑數(shù)據(jù),確定數(shù)據(jù)是否隱藏了信息,然后進行解密。然而解密隱寫術隱藏的信息是很困難的,后面我們會介紹其原因。
1 隱寫術的原理
隱寫術通用的隱寫過程[1]可表示為:
S=C+f(C,M,R,K)
式中,C代表載體信息,M為待嵌入的隱藏消息,R為隨機數(shù),K為加密密鑰,S為嵌入秘密消息后的隱藏消息。信息隱寫的過程就是通過載體源的選取、嵌入秘密消息來隱藏消息,因此信息隱寫的安全性取決于第三方有沒有能力將載體對象和偽裝對象區(qū)分開來。
如圖1所示為隱寫系統(tǒng)的一般模型。
[嵌入算法][甲][隨機數(shù)R][秘密信息M][密鑰K][秘密信道][提取算法][載密信息S][公開信道][乙][攻擊者] [秘密消息M][丙][載道信息C]
圖1隱寫系列的一般模型
在此模型中主要有嵌入算法和提取算法兩部分。甲將隨機數(shù)R、秘密信息M嵌入算法中,再通過公開信道傳給乙。雖然攻擊者存在于公開信道中,但除乙有密鑰K之外,任何攻擊者都無法輕易解密。乙通過提取算法,可提取出秘密信息M。
2 隱寫術的應用
根據(jù)信息載體的不同,隱寫術的應用可分為隱寫術在文本中的應用、隱寫術在圖像中的應用、隱寫術在音頻中的應用等。
2.1 隱寫術在文本中的應用
隱寫術在文本中的應用就是將所傳達的秘密信息嵌入一篇看似普通的消息中,從而達到信息隱藏的效果。
隨著網(wǎng)絡技術的發(fā)展,越來越多的網(wǎng)絡應用要求對通信內(nèi)容加密,隱寫術也逐漸應用到網(wǎng)絡中的傳輸文本中來。目前基于文本的隱藏技術包括:映射、詞(詞組)替換、字(行)編碼以及字符特征編碼等[2]。其中,映射的思想是將待嵌入信息按一定的規(guī)則與語言空間的元素相對應。詞(詞組)替換是根據(jù)待嵌入信息及預先確定的對應關系,將文檔內(nèi)容中的詞(詞組)用其他不影響意義表達的詞(或詞組,如同義詞、近義詞等)替換。行編碼、字編碼分別是通過行的垂直移動和字的水平移動來表達信息。字符特征編碼利用的是字符特征信息,如對b,d,h,k等字符的垂直線的長度稍作修改,達到隱藏的目的[3]。最近業(yè)界又提出了基于標點的隱寫技術,即在標點全角和半角之分的基礎上,用“0”代表全角標點,“1”代表半角標點,將所傳達的信息用其表示[4]。
2.2 隱寫術在圖像中的應用
隱寫術在圖像中應用就是利用圖像這種載體源本身所具有的數(shù)據(jù)冗余,以及人類感官器官的生理、心理特性,將秘密消息以一定的編碼或加密方式嵌入到公開的圖像中, 對載有秘密信息的圖像進行傳輸,以達到隱蔽通信的目的。
隨著數(shù)字圖像的廣泛使用,以載體為數(shù)字圖像的情況不斷增多。在Internet上的每個網(wǎng)站上,都存在著數(shù)字圖像,所以數(shù)字圖像也成為最有效的隱藏信息的載體。基于圖像中的信息隱藏算法也層出不窮,包括時空域算法、變換域算法和壓縮域算法,現(xiàn)在又出現(xiàn)了頻率域的算法。時空域算法是將秘密信息嵌入載體的時間或空間域中,其特點是易于實現(xiàn)和隱藏容量大,但其穩(wěn)健性較差,適用于隱蔽通信。變換域算法是將秘密消息嵌入數(shù)字作品的某一變換域中。壓縮域算法主要應用于JPEG圖像的壓縮隱寫,其主要嵌入流程是:⑴對JPEG圖像的壓縮數(shù)據(jù)進行解碼,得到量化后的DCT系數(shù)。⑵按照某種隱寫算法的嵌入規(guī)則對DCT量化系數(shù)作些微小的修改,將要隱藏的秘密消息嵌入到量化系數(shù)中。⑶對修改后的量化系數(shù)表進行熵編碼,重新生成壓縮數(shù)據(jù),即載密JPEG圖像。擴頻方法是將水印信息擴展到一個很長的序列上,然后乘以一個縮放因子再通過乘法或加法迭加到載體信號上。
2.3 隱寫術在音頻中的應用
隱寫術在音頻中的應用就是利用音頻中載體源本身所具有的數(shù)據(jù)冗余[5]對加密數(shù)據(jù)進行編碼或加密嵌入到公開的音頻文件中,然后進行傳輸,達到隱蔽通信的目的。
眾所周知,人們對于相同頻率的音頻的敏感度有很大的差異,所以利用隱寫術在音頻中編碼不是那么容易。人們的聽覺系統(tǒng)中存在一個聽覺閾值電平,低于這個電平的信號就聽不到。聽覺閾值的大小隨聲音頻率的改變而改變,每個人的聽覺閾值也不同,大多數(shù)人的聽覺系統(tǒng)對2kHz-5kHz之間的聲音最敏感。一個人是否能聽到聲音取決于聲音的頻率以及聲音的強度是否大于頻率對應的聽覺閾值,因為人類聽覺系統(tǒng)是一個動態(tài)系統(tǒng)。根據(jù)這一特性,將秘密信息隱藏于較弱的音頻中,也就是說在某一的強度之上的聲音,人能聽到,這一強度之下的人就不能聽到。因此可以將相應的時間軸上的信號轉(zhuǎn)換到音頻軸上,計算出各頻率的強度,然后將秘密信息嵌入到比這些頻率強度低的各頻率中去。
3 反隱寫面臨的挑戰(zhàn)
下面從三個方面介紹反隱寫術所面臨的挑戰(zhàn)。
3.1 隱寫系統(tǒng)的絕對安全性
對于隱寫的威脅來自被動攻擊和主動攻擊兩個方面[6]。被動攻擊是指攻擊者對秘密信息的檢測和提取,主動攻擊是指攻擊者惡意篡改或偽裝秘密信息,破壞通信雙方的通信。在被動攻擊中,提取技術基于檢測,而檢測包括視覺檢測和統(tǒng)計檢測,攻擊者通過量化秘密消息嵌入前后載體視覺特征和統(tǒng)計特征的變化來驗證秘密消息的存在性。隱寫的本質(zhì)就是保證秘密信息嵌入載體后不被隱寫分析者成功檢測,因此,隱寫術的理論的安全性主要指對被動攻擊者的檢測的免疫性能[7]。
從被攻擊者使用的檢測手段來看,只要保證視覺的不可見性和統(tǒng)計不可見性對于一個隱寫過程就是安全的。以離散無記憶信源為載體的隱寫系統(tǒng)不可見性的條件是原始載體C和含密載體空間S概率分布的一致性,即PC=PS。這表明原始載體和含密載體空間的大小相等。可令|C|=|S|=n,n為任意的自然數(shù),假設ci和si的概率分布對應相等,即有:
⑴
前面表示了隱寫的過程示意圖,現(xiàn)在我們可以用條件轉(zhuǎn)移概率PS|C來表示這一嵌入過程,
進行歸一化。
根據(jù)圖2所示的轉(zhuǎn)移關系以及全概率公式,任意含密載體的概率Psj,可以表示為:
⑵
從式⑴、式⑵可得隱寫系統(tǒng)統(tǒng)計不可見性的條件為:
圖2隱寫過程的概率表示
由原始載體向含密載體的轉(zhuǎn)化要滿足一定的失真限制,即必須使圖像視覺特征的變化在視覺冗余范圍內(nèi)。用d(ci,sj)表示載體之間的失真度,用Dfl表示在視覺冗余范圍之內(nèi)載體所允許的最大失真,則可將載體視覺特征不可見性的條件描述如下:如果由ci生成sj所引起的失真在視覺冗余范圍之內(nèi),則由載體ci生成含密載體sj是可行的,即;如果由ci生成sj所引起的失真超過視覺冗余范圍,則由載體ci生成含密載體sj是不可行的,即。
當載體為離散無記憶信源時,如果隱寫過程PS|C滿足條件:
則被動攻擊情形下,隱寫系統(tǒng)是安全的。
3.2 檢測出隱寫消息的低效性[8]
設∑是一個對付被動攻擊者為ε一安全的信息偽裝系統(tǒng),則攻擊者檢測不到隱藏信息的概率β和攻擊者錯誤地檢測出一個不是隱藏信息的概率α滿足關系式:,其中d(α,β)是按下式定義的二元關系熵。
特別地,若α=0,則β≥2-ε。
經(jīng)證明,對于α=0的ε一安全的信息偽裝系統(tǒng),我們可以得出結(jié)論:ε→0,則概率β→1;如果ε很小,則攻擊者不能夠以很高的概率檢測出隱藏的信息。
3.3 隱寫術載體和算法的多樣性
上面我們具體介紹了隱寫術在文本、圖像、音頻中三種載體中的應用。除此之外,隱寫術還能應用在通道、視頻、網(wǎng)頁等多種載體中。不同的載體中隱寫術所使用的算法不盡相同,例如,文本中的的隱藏技術包括:映射、詞(詞組)替換、字(行)編碼以及字符特征編碼等;圖像中有時空域算法、變換域算法、壓縮域算法和頻率域的算法。并且同種載體中算法是多種多樣的,例如圖像中的時空域算法包括基于文件結(jié)構法、利用調(diào)色板的冗余隱藏消息法、空間域的LSB(低比特位)隱藏法[9]。隨著科學的發(fā)展,技術的不斷提高,相信隱寫術的載體和算法也會更加豐富。
4 反隱寫的不足
現(xiàn)階段反隱寫技術只能檢測載體中秘密信息的存在性。主要因為隱寫者必須通過修改原始數(shù)據(jù)才能實現(xiàn)秘密信息的嵌入,載體數(shù)據(jù)的統(tǒng)計特性不可避免地會發(fā)生一些變化,暴露了信息的存在。雖然可以根據(jù)隱藏信息的存在性阻斷隱蔽通信并追查秘密信息的收發(fā)雙方摧敗隱寫行為,但其不足是無法破解秘密信息的具體內(nèi)容,因而不能達到完全消除安全隱患。
例如,通信雙方若是達成協(xié)議P,此協(xié)議規(guī)定若是在雙方規(guī)定的時間內(nèi)回復對方,就代表通信的另一方同意所傳消息的內(nèi)容。這樣做可以有效地避免第三方劫獲消息,使得另一方未能收到消息,從而導致消息發(fā)送者不能按時進行所決定的重大事件,如圖3所示。若進行的事件對國家的安全是不利的,則后果是不能想象的。因此,提高反隱寫在破譯隱寫消息方面的技術是目前所要解決的關鍵問題。
[通信雙方達成協(xié)議P][發(fā)送方][嵌入隱藏信息的消息] [通信是否
被攻擊?][接收方][提取隱藏信息] [攻擊者判斷隱藏信息是否存在?] [是否達到協(xié)議時間?][信息未發(fā)送][是] [等待][否][阻斷通信] [否][是][否][回復信息]
圖3反隱寫的不足
5 結(jié)束語
經(jīng)過數(shù)十年的發(fā)展,隱寫術的研究已經(jīng)取得了很大成果,隱寫術在各種載體上都有應用,實現(xiàn)隱寫的算法也是層出不窮,但同時給反隱寫術也帶來不小的挑戰(zhàn)。雖然現(xiàn)在反隱寫術已經(jīng)能檢測隱寫行為,并能阻斷隱寫收發(fā)雙方的通信,但是并不能解密隱寫信息,所以不能完全消除安全隱患。如果能夠解決反隱寫的這個缺陷那將是信息隱寫的一次重大技術飛躍。
參考文獻:
[1] 尚東方.基于圖像融合的數(shù)字水印算法研究[D].河南大學,2009.
[2] 周繼軍.隱寫術與隱寫分析[A].全國網(wǎng)絡與信息安全技術研討會會,2004.
[3] 曹衛(wèi)兵,戴冠中,夏煜等.計算機應用研究[J].基于文本的信息隱藏技術,2003.20(10):39~40
[4] 陳天平,鄭連清,王占峰,尹晨曉.基于中文標點的隱寫術設計與實現(xiàn)[J].計算機安全,2009.2.
[5] 葛秀慧,胡愛華,田浩,王嘉禎.隱寫術的研究與應用[J].計算機應用與軟件,2007.11.
[6] 斯托林斯 (Stalings,W.)著,孟慶樹,王麗娜,傅建明等譯.密碼編碼學與網(wǎng)絡安全-原理與實踐[M].電子工業(yè)出版社,2006.
[7] Cachin,C.Proc.of Workshop on Information Hiding.AnInformation-theoretic Model for Steganography Information Hiding[C].Oregon,porland:1998.306-318.
[8] (英)卡曾被塞(Katzenbeisser,S.),(英)佩蒂科斯勒(Petitcolas F A P)編.吳秋新等譯.信息隱藏技術─隱寫術與數(shù)字水印[M].北京:人民郵電出版社,2001.
[9] Chandramouli,R.Intemationl Confference on image Processing[A].MemonN.Analysis is of LSB Based Image Stenograr phy Techniques[C]. 2001.1019-1022