王曉盼,王 梅,王 潔
(河北科技大學(xué)信息科學(xué)與工程學(xué)院,河北石家莊050000)
數(shù)字音頻水印技術(shù)就是將標(biāo)志版權(quán)所有者信息的標(biāo)識(shí)(如圖像、音頻、文字以及作品的相關(guān)信息),在不影響原始音頻載體的前提下嵌入到數(shù)字音頻載體上,嵌入之后水印信息和音頻信息結(jié)合在一起,通常水印是不可感知的,能夠抵抗各種非正常攻擊的干擾。本文給出了基于DCT域的數(shù)字音頻水印算法,采用擴(kuò)頻技術(shù)對(duì)水印信號(hào)進(jìn)行預(yù)處理,并選用DCT域的中頻系數(shù)作為水印嵌入位置,按照水印和音頻1∶8的比例進(jìn)行水印的嵌入[1],同時(shí)實(shí)現(xiàn)水印的非盲提取。
為了進(jìn)一步提高水印圖像的抗干擾能力,利用偽隨機(jī)序列(PN碼)對(duì)水印圖像進(jìn)行擴(kuò)頻調(diào)制。PN碼的自相關(guān)特性和白噪聲類似,是由0和1組成的編碼序列。
利用擴(kuò)頻技術(shù)的數(shù)字音頻水印算法就是在宿主信號(hào)中傳送水印信息,宿主信號(hào)為音頻,可以把音頻視作寬帶的信道,水印信號(hào)是標(biāo)識(shí)版權(quán)所有者的信息,視為窄帶信號(hào)。數(shù)字音頻水印算法利用了擴(kuò)頻通信的思想,即將水印的頻譜進(jìn)行擴(kuò)展,在一個(gè)寬帶信道中傳送頻譜擴(kuò)展的水印信號(hào)。
音頻信號(hào)是一維的,可以采用一維DCT變換對(duì)數(shù)字音頻信號(hào)進(jìn)行處理。由于DCT變換除了具有正交變換的性質(zhì)外,它的變換域還能很好的描述語(yǔ)音信號(hào)的相關(guān)特性,所以說(shuō)DCT變換被認(rèn)為是準(zhǔn)最佳變換。
在數(shù)字音頻處理中應(yīng)用一維DCT,對(duì)于一維信號(hào)f(x),其DCT和IDCT[2]變換為:
一維DCT變換的正交核定義為:

式中,u,x=0,1,2,…,N-1。
對(duì)應(yīng)的離散余弦變換表示為:

式中,u,x=0,1,2,…,N-1。
一維DCT的逆變換IDCT定義為:

式中,u,x=0,1,2,…,N-1。
可見(jiàn)一維DCT的逆變換核與正變換核是相同的。
數(shù)字音頻水印(Digital Audio Watermarking)算法就是將標(biāo)志版權(quán)所有者的一些隱秘信息(即水印信息)在不影響原始音頻的前提下,通過(guò)一定的方式嵌入到數(shù)字音頻載體上。嵌入的水印信息與數(shù)字音頻載體緊密結(jié)合并隱藏在其中,通常水印是不可感知的且不會(huì)影響原始音頻載體的自身使用價(jià)值,能夠抵抗各種非正常的攻擊,也不容易被非法檢測(cè)和修改重構(gòu),即具有較強(qiáng)的魯棒性和安全性。本文采用大小為64×64的二值灰度圖像作為水印信號(hào),原始音頻信號(hào)為單聲道、長(zhǎng)度為40 s、采樣率為32 k Hz、量化位數(shù)為16 bit。
水印嵌入的步驟如下:
(1)對(duì)大小為64×64的二值灰度水印圖像進(jìn)行降維處理,得到一維水印序列;
(2)為了進(jìn)一步提高抗干擾能力,利用PN碼對(duì)降維后的水印序列進(jìn)行擴(kuò)頻處理;
(3)對(duì)原始數(shù)字音頻信號(hào)作分段處理,即待嵌入水印音頻信號(hào)(Ae)和與水印嵌入無(wú)關(guān)部分(Ar);
(4)在原始數(shù)字音頻信號(hào)中嵌入水印圖像:
a.對(duì)待嵌入水印音頻信號(hào)作離散余弦變換(DCT);
b.在離散余弦變換域內(nèi)確定數(shù)字音頻信號(hào)的中頻系數(shù)[3,7];
c.修改選定的中頻系數(shù),利用加法策略嵌入水印[4,8],按照水印和音頻為1:8的比例進(jìn)行水印的嵌入;
d.對(duì)嵌入水印序列元素的音頻信號(hào)進(jìn)行離散余弦反變換(IDCT),得到含有水印信息的音頻信號(hào)部分;
e.將含有水印信息的音頻信號(hào)部分代替原始的音頻信號(hào),得到了含有水印信息的數(shù)字音頻信號(hào)。
水印提取時(shí)需要原始音頻信號(hào),實(shí)現(xiàn)水印信息的非盲提取:
(1)對(duì)于待提取水印的音頻信號(hào)分段為(Te和Tr)和原始音頻信號(hào)分段為(Ae和Ar);
(2)在離散余弦變換域內(nèi)利用基于閾值的方法提取出水印序列[5];
(3)對(duì)提取出的水印序列進(jìn)行解擴(kuò)頻和解密處理;
(4)將解密后的水印圖像進(jìn)行升維處理,最終得到提取的水印圖像。
圖1、圖2為數(shù)字音頻水印嵌入和提取原理框圖。

圖1 水印圖像的嵌入

圖2 水印圖像的提取
實(shí)驗(yàn)中采用大小為64×64的二值灰度圖像作為水印信號(hào),原始音頻信號(hào)為單聲道、長(zhǎng)度為40 s、采樣率為32 k Hz、量化位數(shù)為16 bit。將水印圖像嵌入到音頻載體離散余弦變換后的中頻系數(shù)上,在Matlab2008a上運(yùn)行,對(duì)于提取出的恢復(fù)水印圖像,用峰值信噪比(PSNR)和歸一化相關(guān)系數(shù)(NC)[6]比較以評(píng)價(jià)文中算法的穩(wěn)健性。PSNR和NC的表達(dá)式分別為:

式中,MAX為圖像灰度級(jí)數(shù),通常為255。

式中,w(i,j)為原始水印圖像;w′(i,j)為提取的水印圖像;M1×M2為水印圖像的大小。
原始音頻信號(hào)和嵌入水印后的音頻信號(hào)以及嵌入和未受攻擊時(shí)提取的水印圖像如圖3所示,此時(shí)PSNR=18.6417,NC=0.9351。實(shí)驗(yàn)中還對(duì)嵌入水印圖像的音頻信號(hào)進(jìn)行常見(jiàn)的攻擊實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖4所示。
通過(guò)實(shí)驗(yàn)檢驗(yàn)水印算法魯棒性,圖4(f)所示為對(duì)嵌入水印后的音頻信號(hào)進(jìn)行攻擊后提取出的水印。攻擊實(shí)驗(yàn)對(duì)應(yīng)的PSNR和NC,說(shuō)明水印的魯棒性,如表1所示。

圖3 原始水印和提取水印以及原始音頻信號(hào)和嵌入水印的音頻信號(hào)的波形圖

圖4 常見(jiàn)的攻擊實(shí)驗(yàn)

表1 攻擊實(shí)驗(yàn)數(shù)據(jù)
從表1中可以看出,NC值接近于1,PSNR值較高,而低通濾波、上采樣還有dct壓縮等攻擊實(shí)驗(yàn)的NC值都接近1,說(shuō)明了文中算法水印的魯棒性好。
綜上所述,在水印嵌入音頻信號(hào)后,人耳感知不到明顯的失真,即具有不可感知性;在水印嵌入前先對(duì)其進(jìn)行擴(kuò)頻加密處理,目的是增強(qiáng)其抗干擾能力;在水印提取時(shí)要正確的密鑰才可以把水印順利地提取出來(lái);對(duì)于攻擊實(shí)驗(yàn)有較好的魯棒性。
本文給出了一種基于DCT域數(shù)字音頻水印算法,采用擴(kuò)頻技術(shù)對(duì)水印圖像進(jìn)行預(yù)處理提高其抗干擾能力,選用DCT域的中頻系數(shù)作為水印嵌入位置,按照水印和音頻1:8的比例進(jìn)行水印的嵌入。實(shí)驗(yàn)結(jié)果表明該算法有較好的不可感知性和魯棒性;同時(shí)對(duì)于水印圖像進(jìn)行擴(kuò)頻加密處理,提高了水印的安全性。
[1]談華斌.數(shù)字音頻水印算法的研究[D].吉林:吉林大學(xué),2004.
[2]姚 磊,王 冰.一種基于DCT中頻的數(shù)字水印算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2008,18(1):192-195.
[3]Mauro B,F(xiàn)ranco B,Vito C,et al.A DCT-domain system for robust image watermarking[J].Singnal Processing,1998,66(3):357-372.
[4]黃繼武,SHI Y Q,程衛(wèi)東.DCT域圖像水印:嵌入對(duì)策和算法[J].電子學(xué)報(bào),2000,28(4):57-60.
[5]李 慧.基于變換域的數(shù)字音頻零水印算法研究[D].江西:江西理工大學(xué),2013.
[6]閆麗君,康寶生,岳曉菊.改進(jìn)的基于DCT的自適應(yīng)水印算法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(8):197-200.
[7]劉雪梅,蘇廣州.基于擴(kuò)頻序列嵌入水印的音頻信號(hào)[J].重慶郵電學(xué)院學(xué)報(bào)(自然科學(xué)版),2006,(1):9.
[8]劉 芳.基于離散小波變換的音頻數(shù)字水印研究[D].北京:北京化工大學(xué),2010.