摘 要:針對(duì)現(xiàn)有數(shù)字音頻水印算法不能同時(shí)滿足隱蔽性與魯棒性的問(wèn)題,在添加水印之前,先將水印的二值圖像與隨機(jī)密鑰進(jìn)行加密操作,再對(duì)載體進(jìn)行三級(jí)小波變化和DCT變換,最后對(duì)比加密后的水印信息與載體信號(hào),得到密鑰值,并將密鑰嵌入到載體音頻的DCT中頻系數(shù)中。實(shí)驗(yàn)結(jié)果表明,該算法能在隱蔽性和魯棒性之間達(dá)到一個(gè)較好的平衡。
關(guān)鍵詞:音頻;小波變換;離散余弦變換;水印算法
中圖分類(lèi)號(hào):TP309 文獻(xiàn)標(biāo)志碼:A
1 引言
數(shù)字水印技術(shù)是將數(shù)字、序列號(hào)、文字、圖像標(biāo)志等信息嵌入到多媒體數(shù)據(jù)中,以起到版權(quán)保護(hù)、秘密通信、數(shù)據(jù)文件的真?zhèn)舞b別和產(chǎn)品標(biāo)志等作用,音頻水印作為數(shù)字水印技術(shù)的一個(gè)重要分支,日益引起了人們的關(guān)注。
目前應(yīng)用較廣的音頻水印算法有最低有效位算法(LSB)和基于DCT變換域的數(shù)字水印算法。LSB是最不重要比特位(Least Significant Bit)的縮寫(xiě),其原理是用秘密信息(水印)直接替換載體數(shù)據(jù)的最不重要比特位,這是一種脆弱水印,但是隱蔽性較好。DCT域水印算法的核心思想是在載體文件的DCT系數(shù)上添加水印信息,而DCT系數(shù)可分為高頻、中頻、低頻三種。其中,與LSB方法等效的做法是把水印嵌入到高頻系數(shù)中。這對(duì)音頻水印載體的聽(tīng)覺(jué)質(zhì)量非常有利,但由于音頻信號(hào)的高頻區(qū)對(duì)常見(jiàn)的信號(hào)處理和噪聲比較敏感,這些算法產(chǎn)生的水印魯棒性較差。為提高魯棒性,Cox等人[1]提出水印應(yīng)放在聽(tīng)覺(jué)系統(tǒng)最重要的分量上(對(duì)應(yīng)于DCT域中的低頻系數(shù)[2]),其理由是聽(tīng)覺(jué)上最重要的分量是音頻信號(hào)的主要成分,攜帶較多的信號(hào)能量,在音頻信號(hào)有一定失真的情況下仍能保留主要成分。綜合以上兩點(diǎn),一些學(xué)者對(duì)其進(jìn)行了折衷[3],把水印放在DCT域的中頻系數(shù)上,文獻(xiàn)[3]將中頻系數(shù)定義為每一段的第2個(gè)DCT系數(shù),但也有人認(rèn)為音頻的中頻分量為第3~6個(gè)系數(shù)。選擇的嵌入分量不同,所產(chǎn)生的水印性能也不相同,而且目前對(duì)于各個(gè)分量具體位置的定義也沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)[4]。
2 現(xiàn)有算法描述
5.逆變換還原載體音頻
對(duì)添加水印后的音頻信息進(jìn)行逆DCT變換和小波逆變換,再將所有分段組合到一起,即可得到添加水印后的音頻文件。
3.4 算法仿真
音頻水印算法可以使用以下三種評(píng)價(jià)方法:
(1)主觀聽(tīng)覺(jué)測(cè)試:使用客觀的Diff級(jí)(SDG)來(lái)判斷該性能,SDG為0.0時(shí)表示水印的不可聽(tīng)性最好,其值越大,算法性能越差,4.0即表示隱蔽性最差,這種情況下,水印基本是不合格的。
(2)信噪比(Signal to Noise Ratio, SNR):信號(hào)的有用成分與噪聲的強(qiáng)弱對(duì)比,這個(gè)一般是用來(lái)衡量數(shù)字信號(hào)的保真程度,其值越大即表示噪聲對(duì)信號(hào)的影響越小。
(3)相似度sim:數(shù)字水印中提取的水印與原始水印的相似程度。通常將sim值與設(shè)定的門(mén)限值T進(jìn)行比較,若sim大于T,則表示該水印是魯棒的,否則即是脆弱水印。
對(duì)本文提出的算法在Matlab環(huán)境下進(jìn)行了編程實(shí)現(xiàn),基本參數(shù)說(shuō)明如下:
(1)選取aud.wav作為載體音頻,比特率為1411kbps,時(shí)長(zhǎng)11秒,量化位數(shù)為16bit,采樣頻率為44.1Hz。
(2)選取 的位圖圖像mark.bmp作為水印圖像,如圖4所示。
(3)嵌入強(qiáng)度D的取值為0.035。
算法仿真結(jié)果如圖5所示,水印嵌入時(shí)間為0.7020秒。
該算法與文獻(xiàn)[11]的性能對(duì)比如表1所示,由此可知,添加水印后,使用客觀的Diff級(jí)(SDG)來(lái)進(jìn)行主觀聽(tīng)覺(jué)測(cè)試,產(chǎn)生的音頻信號(hào)幾乎不存在可感知的差別。同時(shí),由SNR的值可知,該算法的隱蔽性確實(shí)有一定程度的提高。
4 總結(jié)
本文根據(jù)已有音頻水印算法的優(yōu)缺點(diǎn),提出了一種基于小波變換和DCT變換的數(shù)字音頻水印算法。該算法根據(jù)Cox算法魯棒性較好而隱蔽性較差的特點(diǎn),對(duì)其進(jìn)行了修改,將水印信息添加到DCT變換的中頻系數(shù)中,使其在隱蔽性和魯棒性之間達(dá)到一個(gè)較好的平衡,同時(shí),在此基礎(chǔ)上,引入了小波變換和水印圖像預(yù)處理,增加算法的安全性。實(shí)驗(yàn)結(jié)果表明,經(jīng)過(guò)該算法添加水印后,產(chǎn)生的音頻信號(hào)與原始載體幾乎不存在可感知的差別,而且添加水印后的載體音頻對(duì)于添加噪聲、重新量化和重新采樣等攻擊,都具有較好的魯棒性。
參考文獻(xiàn):
[1] I J Cox, J Kilian, T Leighton, T Shamoon. Secure spread spectrum watermarking formultimedia [J]. IEEE Transaction on Image Processing, 1997, 6(12): 1673-1687.
[2] H Tewfik, M Swanson. Data hiding formultimedia personalization, interaction, and protection [J]. IEEE Signal Processing Magazine, 1997, 14(4): 41-44.
[3] 王秋生, 孫圣和. 一種在數(shù)字音頻信號(hào)中嵌入水印的新算法[J]. 聲學(xué)學(xué)報(bào), 2001, 26(5): 464-467.
[4] 馬冀平, 韓紀(jì)慶. DCT域音頻水印:嵌入對(duì)策和算法[J]. 電子學(xué)報(bào), 2006, 34(7): 1260-1264.
[5] 田運(yùn)金, 殷凱, 周輝. 一種基于DCT變換的音頻隱藏算法研究. 裝備指揮技術(shù)學(xué)院學(xué)報(bào), 2006, 17(4): 64-67.
[6] 金燦. 一種基于Cox算法的分塊DCT圖像水印算法研究. 計(jì)算機(jī)安全, 2011(7): 17-19.
[7] B Zhang, S N Srihari, C Huang. Word image retrieval using binary features[J]. Document Recognition and Retrieval, 2004, 43(3): 37-40.
[8] 李慎, 夏良正, 顧宗愨. 一種新的二維最大熵圖像閾值分割方法[J]. 南京航空航天大學(xué)報(bào), 1994, 26(3): 151-157.
[9] M M M Fahmy. Computer Vision Application to Automatic Number Plate Recognition[J]. Proceeding of 26th. International Symposium on Automotive Technology and Automation, 1993, 13(2): 625-633.
[10] 景曉軍, 蔡安妮, 孫景鰲. 一種基于二維最大類(lèi)間方差的圖像分割算法. 通信學(xué)報(bào), 2001, 22(4): 71-76.
[11] 凡超, 王忠, 肖留威等. 改進(jìn)的DCT域音頻水印算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2011, 32(4): 1351-1355.