摘要:根據(jù)人類視覺系統(tǒng)(HVS),利用數(shù)字圖像中的HSI模型,提出了一種基于字符亮度的自適應(yīng)文本信息隱藏算法。該算法引入二次余數(shù)理論隨機(jī)選擇嵌入位置,并且采用了一種擴(kuò)展的編碼機(jī)制動(dòng)態(tài)地隱藏秘密信息。實(shí)驗(yàn)結(jié)果表明這種算法不僅擴(kuò)大了隱藏容量而且改善了文本的隱蔽性,同時(shí)在魯棒性與不可感知性之間取得良好的折中,提高了文本的抗攻擊能力。
關(guān)鍵詞:文本信息隱藏;亮度;自適應(yīng);色調(diào)、飽和度、亮度;二次余數(shù)
中圖分類號(hào):TP391文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2007)05-0130-03
0引言
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展使得處在世界各地的人們進(jìn)行信息交流更加便利方便、直接和經(jīng)濟(jì)。多媒體技術(shù)的發(fā)展為多媒體信息的存儲(chǔ)和傳播提供了極大的便利,同時(shí)也極大地提高了信息表達(dá)的效率和準(zhǔn)確性。但是網(wǎng)絡(luò)在給人們帶來便利的同時(shí)也暴露出越來越重要的安全問題,如媒體作品的版權(quán)侵犯,軟件或文檔的非法拷貝、電子商務(wù)中的非法盜用和竄改等。如何保護(hù)信息在傳輸過程中的安全已經(jīng)成為信息技術(shù)研究領(lǐng)域的重要內(nèi)容。信息隱藏技術(shù)的出現(xiàn)則在某種程度上為這個(gè)問題提供了一種解決方案[1]。
目前的研究主要是利用圖像、聲音等載體來進(jìn)行信息隱藏。這主要是因?yàn)閳D像、聲音等數(shù)字載體自身具有一定的數(shù)據(jù)冗余度,結(jié)合人的視覺特性,可以在這些載體對(duì)象里隱藏信息而不被察覺。而在文本信息隱藏方面,由于文本自身結(jié)構(gòu)的一些特點(diǎn),限制了它的發(fā)展速度,但也涌現(xiàn)了一些信息隱藏的方法。例如Brassil和Maxemchuk等人[2]提出了在Postscript格式中嵌入水印的三種方案,即行移編碼、字移編碼和特征編碼。Purdue大學(xué)的Atallah等人[3]提出一種魯棒性很好的文本水印算法——基于自然語言處理技術(shù)的文本數(shù)字水印技術(shù)。
在本文的研究工作及其相關(guān)文獻(xiàn)中[4],發(fā)現(xiàn)了人眼對(duì)外部對(duì)象亮度的適應(yīng)和鑒別能力存在一定的極限。也就是說亮度在一定的變化范圍內(nèi)人眼對(duì)它并不敏感。筆者借用這種思想設(shè)計(jì)了一種基于字符亮度的自適應(yīng)文本信息隱藏方法。
1算法分析
1.1HSI模型
HSI模型是一種色彩描述模型。其中H表示色調(diào)(Hue),S表示飽和度(Saturation),I表示亮度(Intensity)。色調(diào)描述純色的屬性,是觀察者接受的主要顏色;飽和度是給出一種純色被白光稀釋的程度的度量;亮度是一個(gè)主觀的描述子,它體現(xiàn)了無色的強(qiáng)度概念,并且是描述彩色感覺的關(guān)鍵參數(shù)。它可以通過R、G、B三原色進(jìn)行表達(dá)和描述。其表達(dá)式如下:
表1的編碼機(jī)制就是完成動(dòng)態(tài)嵌入隱藏信息的基礎(chǔ)。通過擴(kuò)展的編碼能夠擴(kuò)大了文本隱藏秘密信息的容量,在一定程度上緩解了載體文本嵌入隱藏信息不足的矛盾,同時(shí)可以根據(jù)當(dāng)前載體文本和隱藏信息對(duì)比關(guān)系選擇合適的編碼方式,避免了隱藏信息過于集中,提高了隱藏信息的隱蔽性和載體文本的抗攻擊能力。
1.4算法描述
由于隱藏信息的提取(或檢測)算法是根據(jù)當(dāng)前編碼方式嵌入算法的一個(gè)逆過程。在這里不詳細(xì)講述提取(或檢測)過程,只著重介紹嵌入過程。
2實(shí)驗(yàn)結(jié)果及其分析
為了驗(yàn)證算法的可行性和動(dòng)態(tài)的適應(yīng)性,下面從三個(gè)方面來進(jìn)行說明:①嵌入隱藏信息后的文本對(duì)比;②在載體文本固定和隱藏信息不同的情況下,自適用算法的參數(shù)比較;③在載體文本不同和隱藏信息固定的情況下,自適用算法的參數(shù)比較。除此之外,為了保證實(shí)驗(yàn)結(jié)果的一致性和可對(duì)比性,采用統(tǒng)一的實(shí)驗(yàn)環(huán)境(Windows 2000 Professional,Visual C++6.0)。
首先,第一種情況的實(shí)驗(yàn)結(jié)果(文本對(duì)比)。在圖2的文本中嵌入隱藏信息“湖南大學(xué)計(jì)算機(jī)與通信學(xué)院”,形成了含有隱藏信息的文本(圖3)。
從圖2和3可以看出,基于字符亮度的文本信息隱藏算法能夠發(fā)揮隱藏秘密信息的作用,在保證原文本的情況下,成功地嵌入了秘密信息。下面從編碼方式的角度分別對(duì)隱藏信息一定的情況下和載體文本一定的情況下兩方面進(jìn)行比較,驗(yàn)證算法的自適應(yīng)性(表2和3)。其中覆蓋率表示嵌入了隱藏信息的字符數(shù)與載體文本的字符數(shù)的比值。
通過實(shí)驗(yàn)結(jié)果證明了該算法能很好地完成文本的隱蔽功能。由于在算法中引入擴(kuò)展的編碼機(jī)制,在一定程度上解決了一般算法嵌入秘密信息較少的問題[4]。除此之外,在隱藏信息嵌入的過程中因?yàn)榫幋a方式的不唯一性,這樣就為人們提供了更多的選擇,避免了隱藏信息在載體文本中過于集中。可以根據(jù)實(shí)際情況中的載體文本與隱藏信息的關(guān)系動(dòng)態(tài)的選擇對(duì)應(yīng)的編碼方式,使得隱藏信息在載體文本中分布更均勻、合理,在一定程度上達(dá)到魯棒性和隱蔽性的統(tǒng)一,提高文本的抗攻擊能力。其具體表現(xiàn)如下:
(1)由于在同一算法中采用了不同的編碼方式和嵌入方式,對(duì)于相同的載體文本嵌入不同的隱藏信息或者對(duì)于不同的載體文本嵌入相同的隱藏信息均會(huì)產(chǎn)生不同的隱藏文本。這樣能夠模糊攻擊者視線,降低了文本被攻擊的概率。
(2)在算法中采用了多種編碼方式,攻擊者可能知道了嵌入方法,但也無法準(zhǔn)確地判斷當(dāng)前的編碼方式,而無法提取(或檢測)出正確的隱藏信息。
3結(jié)束語
本文采用的自適應(yīng)方法背離了常規(guī)文本信息隱藏算法中的單一嵌入方法和編碼方式,這樣不但擴(kuò)大了文本的隱藏信息容量,而且能夠根據(jù)當(dāng)前載體文本與隱藏信息的關(guān)系進(jìn)行嵌入,在一定程度上緩解了隱藏技術(shù)魯棒性和不可感知性要求的矛盾。對(duì)比于其他算法,該算法是從一種新的角度考慮了文本信息隱藏技術(shù)。實(shí)驗(yàn)結(jié)果表明它能夠很好地完成秘密信息的隱藏,具有廣泛的應(yīng)用前景。
參考文獻(xiàn):
[1]王炳錫,陳琦,鄧峰森. 數(shù)字水印技術(shù)[M]. 西安:西安電子科技大學(xué)出版社,2003:1-2.
[2]BRASSIL J T, LOW S, MAXEMCHUK N F. Copyright protection for the electronic distribution of text documents[J].Proceedings of the IEEE,1999,87(7):1181-1196.
[3]ATALLAH M J,RASKIN V, HEMPLEMANN C F,et al. Natural language watermarking and tamperproofing:proceedings of the 5th Information Hiding Workshop[C].[S.l.]:[s.n.],2002:117-123.
[4]BHATTACHARJYA A K,ANCIN H. Data embedding in text for a copier system:proc. of the International Conference on Image Procession[C].[S.l.]:[s.n.], 1999:245-249.
[5]張宇,劉挺,陳毅恒,等. 自然語言文本水印[J]. 中文信息學(xué)報(bào),2004,9(1):56-62.
注:“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”