柏玉保,柏 森,暴晉飛,尤春艷
(重慶通信學院,重慶 400035)
隨著計算機網絡通信技術的發展,人們借助計算機、數字掃描儀等電子設備可以方便、迅速地將數字信息傳輸到所期望的目的地。然而,當人們享受網絡技術帶來的便利的同時,不得不面對隨之而來的負面影響。例如,盜版者通過簡單的操作就可以獲得與正版一樣的復制品,并以此獲取暴利。近年來,音頻水印發展非常迅速,音頻數據的版權保護也顯得越來越重要。通過在音頻載體中嵌入水印,可以實現盜版確認、使用跟蹤等功能。以音頻為載體的經典的信息隱藏算法基本可以分為兩類:時域算法和變換域算法。時域算法的主要代表有LSB算法[1]、相位編碼[2]和回聲隱藏[3],這些算法比較簡單,但是魯棒性差,但也有一些算法具有很好的魯棒性(如時域能量算法[4]等).目前研究的方向主要集中在DFT變換域[5]、離散余弦變換 DCT[6-7]、離散小波變換 DWT[8]及其他正交域。DWT是信號處理中一種非常有力的工具,它是一種信號的時間-頻率分析方法,在時域、頻域內都具有表征信號局部特性的能力,具有良好的魯棒特性等。參考文獻[8]提出了一種基于小波變換的語音信息隱藏算法,算法是對語音分段,在各段小波變換的高頻系數中嵌入密文信息,獲得了很好的隱藏效果。DCT域信息隱藏算法計算量比較小,現在研究得比較多。參考文獻[7]就是利用人耳聽覺的頻率掩蔽效應分析了DCT系數的聽覺容差,發現直流系數具有最大的聽覺容差。通過改變DCT直流系數來嵌入水印,魯棒性和不可感知性都達到很好的平衡。而參考文獻[9]提出了一種基于DCT和DWT域的音頻信息隱藏算法。該算法充分利用了離散小波變換的多分辨率特性和離散余弦變換的能量壓縮能力,具有很好的魯棒性。參考文獻[10]充分利用了DCT和DWT的優點,提出1種混合域盲水印算法,具有很好的魯棒性。參考文獻[11]則根據人耳聽覺的頻率掩蔽效應,選擇對人耳聽覺不敏感的頻帶所對應的小波系數,將小波系數分段進行離散余弦變換,將水印嵌入到DCT直流系數上,都具有非常好的不可感知性和強魯棒性。
本研究結合了DCT和DWT域的算法,將數字水印隱藏到另一個載體音頻中。在實現時,首先對載體音頻進行小波變換,獲取低頻小波系數,然后適當分段并進行離散余弦變換得到直流系數,將得到的直流系數按順序組合成一組向量,對其選取適當的長度進行分段,最后根據其統計特征嵌入水印[12]。實驗結果表明,該算法不可感知性良好,與參考文獻[9-11]的混合域算法相比,本文算法魯棒性有了較大提高。
假設載體語音為 X=(x1,x2,…,xL)。其中 L為載體音頻信號的采樣點數,xi為第i個采樣點的幅度值。
(1)離散小波變換
用 “db2”小波對載體語音X進行離散小波變換(DWT):[S,H]=DWT(X),其中 S 為低頻分量,記為 S=(s1,s2,…,sk),k 為低頻分量長度(低頻系數的個數)。 對低頻分量 S進行分段,每段長度為 N,得到 S1,S2,…,SM,如下:

其中,M為分段數且M≤?k/N」,Si為第i段低頻系數。
(2)離散余弦變換
對 S1,S2,… ,SM分別進行DCT變換 :Di=DCT(Si)為第 i段低頻系數 DCT變換后的系數,且 Di=(di(1),di(2),…,di(N))。提取每段的直流系數組成向量 C,記為C=(d1(1),d2(1),…,dM(1))。 將 C 進行分段,每段長度取 T(不足的用零補齊),記為

其中,n=「M/T ?,「·?表示向上取整。在本文中,T 的取值范圍對算法的魯棒性很重要,實驗表明“T=10”時效果比較好。
(3)采用統計特征的方法嵌入水印
用種子“seed”產生一段二進制偽隨機序列作為水印信息 , 記為 W={m(i)|i=1,2, … , 「M/T?}, 其中 m(i)∈{0,1},表示序列的第 i個值。
在本文中,根據參考文獻[12],找到一種對攻擊不敏感的統計特征,該特征值就是通過計算上述每段直流系數向量Ri求得的平均值。實驗表明,該統計特征值對一般的信號處理(如低通濾波、加噪聲、重量化、重采樣等)具有穩健性。
根據如下步驟修改每段直流系數向量Ri進行水印信息的嵌入。

②如果 W(i)=1,則

如果 W(i)=0,則

其中,Δ表示嵌入強度系數,該值越大,提取水印魯棒性越強,但衡量不可感知性的信噪比越弱,反之則相反。
(4)反離散余弦變換
將嵌入水印后的DCT直流系數段逐個和未改變的其他DCT系數按照原始順序合并,進行反離散余弦變換,得到新的DCT系數。
(5)反離散小波變換
利用新得到的DCT系數進行反離散小波變換,對信號進行重構,得到含有水印的音頻信號。
由于水印嵌入過程中使用了統計特征的方法,所以在信息提取時不需要原始載體語音信號,屬于盲提取算法。提取過程如下:
(1)離散小波變換。使用“db2”小波基對待檢測語音信號序列整體進行小波變換,并提取低頻小波系數,對其按嵌入時的長度值進行分段。
(2)離散余弦變換。對每段低頻小波系數進行DCT變換,提取其各段的直流系數,并按順序組合成向量,同樣對其按嵌入時的適當長度值進行分段。
(3)水印提取。計算各段直流系數的均值。如果該段的均值大于“0”,則提取出 bit為“1”;而該段的均值小于“0”,則提取出 bit為“0”。
(4)將從各個分段中提取的水印信息按順序進行合并,得到完整的水印信息。
為了消除主觀因素的影響,采用歸一化相關系數對提取的水印和原始水印進行客觀評價,歸一化相關系數定義為:

在實驗中,以一段長度為 16 s,抽樣速率為 8 kHz,位速為128 Kb/s,16位量化的語音信號為公開信息,在該段語音中嵌入水印,采用種子“seed”產生一段二進制偽隨機序列作為水印信息,根據上述算法,在低頻小波系數分段階段,取N=64,小波基為“db2”;對直流系數組成的向量,取T=10,嵌入強度系數Δ=3.5。
圖1是原始文件和嵌入水印的音頻文件時域波形圖,從波形圖上可以看到,兩者相似性很高。利用主觀評價方法測試算法的隱蔽性,事先不告知參與測試人哪個是原始音頻哪個是水印音頻,將水印音頻和原始音頻播放給5個人聽,一致辨別不出兩者有何區別;用歸一化相關系數和信噪比對音頻文件進行客觀評價,歸一化相關系數如公式(4)所示。

圖1 原始音頻與含有水印音頻時域圖形
信噪比公式為:

其中 ,x(n)為原始音頻 ,x′(n)為嵌入水印后的音頻。通過計算,嵌入水印信息前后音頻文件的整體信噪比為21.779 8 dB,相關系數為0.996 7。這說明該算法無論在主觀和客觀上都具有很好的不可感知性。
為了檢驗水印的魯棒性,對音頻水印文件做以下信號處理。
(1)低通濾波。低通濾波器為長度為9階、截止頻率為1.5 kHz的巴特沃思低通濾波器。
(2)加高斯白噪聲。均值 u=0,均方差σ=0.01。
(3)回響。將原始信號的延時拷貝疊加到原始信號之上,延時時間為400 ms,延時信號幅度為原始信號10%。
(4)重采樣。將音頻文件用6 kHz重采樣,再重新用8 kHz重新采樣恢復成原始音頻。
(5)MP3壓縮。將含水印音頻壓縮為MP3文件,然后恢復成與原始音頻格式相同的音頻。
(6)重量化。將含水印音頻從16 bit量化為 8 bit,再重新量化為16 bit。
(7)同步攻擊:在含有水印音頻中隨機選取若干個采樣點,然后進行裁剪。裁剪的樣點個數分別是100、300、500個;在原始音頻中每 0.05 s分別連續刪除 1、2、3個點,共分別刪除 100、300、498個采樣點。
(8)時域線性壓縮。用Cool Edit Pro 2.0軟件將含密音頻壓縮1%,即從16 s線性縮短到15.98 s。
(9)時域線性延伸。用Cool Edit Pro 2.0軟件將含密音頻延伸1%,即從16 s線性延伸到16.02 s。
(10)音調改變。不改變信號速度而改變音調頻率。用Cool Edit Pro 2.0軟件將含密音頻進行音調的改變,分別將音調增加為原始音調頻率的102%(Ritio=102%)和減少為原始音頻頻率的98%(Ritio=98%)。
(11)DA/AD轉換。利用Winamp音樂播放器播放原始音頻,利用Windows自帶的錄音機通過線路輸出方式進行錄音。
根據歸一化相關系數定義分別計算各種攻擊下提取水印的相關系數,結果如表1所示。

表1 魯棒性攻擊檢測結果及算法比較
本文提出的基于離散小波變換(DWT)和離散余弦變換(DCT)的混合域音頻信息隱藏算法,首先使用小波將音頻文件整體進行分解,選擇對聽覺不敏感和抗噪抗低通的低頻小波系數部分作為嵌入頻帶;然后適當分段并進行離散余弦變換得到直流系數,將得到的直流系數組合成一組向量,對其選取適當的長度進行分段,最后根據其統計特征來嵌入水印,充分利用了整個音頻文件的冗余空間,使魯棒性和不可感知性達到了比較好的平衡。能抵抗噪聲、低通濾波、重采樣、重量化、回聲、MP3壓縮、樣點裁剪、時間伸長和壓縮等的攻擊,特別是在抗樣點裁剪、時域線性伸長與壓縮、音調改變攻擊方面,相似度都達到0.9以上,幾乎能完全正確提取水印,表現出了非常強的魯棒性。從實驗結果來看,本文所提算法與參考文獻[10,11]提出的混合域水印算法相比,魯棒性有了比較明顯的提高。另外水印文件的不可感知性也比較好,這樣就使魯棒性和不可感知性達到了比較好的平衡。
然而這種信息隱藏算法的缺點在于:一是不能抵抗同步攻擊以及D/A、A/D轉換操作方面比較弱;二是算法的信息容量小。這是下一步算法研究改進的重點。
[1]COOPERMAN M,MOSKOWITZ S.Steganographic method and device[M].USA: Patent, 1997.
[2]BENDER W,GRUHL D,MORIMOTO N,et al.Techniques for data hiding[J].IBM System Journal, 1996, 35: 313-336.
[3]GRUHL D,BENDER W,LU A.Echo hiding[C].Proceedings of the 1 st International Workshop on Information Hiding.[S.1.]: Springer, 1996: 295-315.
[4]WEN Nung Lie,LI Chun Chang.Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification[J].IEEE Transactions on Multimedia,2006, 8(1): 46-59.
[5]SEOK Jong Won,HONG Jin Woo,KIM Jin Woong.A novel audio watermarking algorithm for copyright protection of digital audio[J].ETRI Journal, 2002, 24(3): 181-189.
[6]馬翼平,韓紀慶.DCT域音頻水印:嵌入對策和算法[J].電子學報,2006,34(7):1260-1264.
[7]由守杰,柏森,曹巍巍.魯棒的DCT域音頻盲水印算法[J].重慶郵電大學學報(自然科學版),2008,20(2):206-211.
[8]何琴,鄒華興,白劍.基于小波變換的語音信息隱藏算法[J].計算機應用研究,2005,22(12):118-119.
[9]王先春,郭杰榮,胡惟文,等.基于 DCT和 DWT域的音頻信息隱藏算法[J].計算機工程與設計,2008,29(16):4389-4391.
[10]王向紅,趙紅,崔永瑞.一種新的混合域自適應數字音頻水印算法[J].小型微型計算機系統,2006,27(2):316-319.
[11]由守杰,柏森,曾輝.魯棒的混合域音頻信息隱藏算法[J].計算機技術與發展,2008,18(3):169-172.
[12]LI Wei, XUE Xiang Yang, LI Xiao Qiang, et al.A novel feature-based robust audio watermarking for copyright protection[C].Proceedings of the International Conference on Information Technology: Computers and Communications(ITCC’03)2003 IEEE, 2003.