黃雄華,蔣偉貞
(1.桂林電子科技大學教學實踐部,廣西桂林 541004;2.暨南大學信息科學技術學院,廣東廣州 510084)
計算機技術和通信技術的發展使得數字作品能被方便的復制、篡改和傳輸,數字水印技術作為一種新的保護版權、鑒定作品完整性的有效手段,受到人們的廣泛的關注和研究[1].同時,在需要重播的應用中,數字水印技術是替代密碼學的潛在解決方法之一[2,3].
復倒譜分析是語音信號處理中的一種強有力的分析手段.倒譜分析是同態系統的理論基礎,其在語音識別、地震檢測、聲納分析等方面有廣泛的應用.已有學者在倒譜域中研究倒音頻水印并取得了一些成果,如文獻[4,5]提出的倒譜域統計均值修改算法,文獻[6]提出的倒譜域BCH糾錯碼的魯棒音頻水印算法,以及文獻[7,8]提出的根據人類聽覺感知特性和心理聲學模型定性控制水印嵌入的倒譜域音頻水印算法.這些算法的一個共同問題在于缺乏定量的自適應機制,因為水印的嵌入強度等參數需要反復實驗來獲得,且難以得到最合適的值.基于此,本文提出一種根據SNR來自適應確定水印嵌入強度的音頻水印算法,該算法可根據聽覺要求的SNR自適應確定最大嵌入強度,且水印具有較好的魯棒性.
離散傅立葉變換(DFT)是倒譜分析的核心,本文的自適應算法應用其相關性質.
音頻信號的傅立葉變換及其逆變換可表示為,
并且有下述性質:
(5)式中,I表示單位陣.
其中,~a 表示a的共軛.i×ji×j
音頻信號的復倒譜變換過程如圖1所示.
圖1 復倒譜變換的過程
圖1中,x→={xi|0≤i<N},表示輸入的音頻信號,X→={Xi|0≤i<N},表示經DFT變換后的信號,lnX→={lnXi|0≤i≤N-1},表示取對數后的信號,C→={Ci|0≤i≤N-1},表示倒譜系數.復倒譜域的變換是可逆變換,其逆變換過程如圖2所示.
圖2 復倒譜的逆變換過程
復倒譜統計均值修改(CCSMM)算法[1,3,5]的基本原理為:首先,將音頻數據分幀,對每幀求復倒譜系數;其次,計算每幀的倒譜系數的均值,并將每個倒譜系數減去均值;最后,根據水印比特“1”或“0”,調整統計均值分別為M1或M2,并作逆變換.水印的提取以(M1+M2)/2為門限,倒譜系數均值大于門限提取“1”,否則提取“0”.
顯然,上述算法中M1和M2的確定選擇需要反復實驗以滿足水印的魯棒性和透明性的要求,最佳取值通常難以獲得,M1和M2的取值與音頻信號有關.基于此,本文通過SNR來確定M1和M2的值,提出了一種自適應復倒譜統計均值(ACCSMM)音頻水印算法.
3.2.1 倒譜域與時域的對應變化關系.
以下沿用前述的符號及其意義,并在相應的符號上加“′”號表示倒譜域變化后對應的值(即添加水印后的相應值).若倒譜域每個系數變化量為Δ,倒譜系數可表示為,
那么,倒譜系數經過DFT變換后的表達式為,
其中,T表示轉置(以下同).由式(3)、(4),式(8)可簡化為,
式(9)經過指數化過程,可表示為,
式(11)經過 IDFT變換后,可表示為,
3.2.2 音頻質量評價準則.
目前,音頻水印對嵌入了水印的音頻失真評價標準借鑒了信號處理的方法,即通過峰值信噪比PSNR(Peak Signal to Noise Ratio)和信噪比SNR來衡量嵌入水印后音頻信號的聽覺失真度.
設 x→是含有 N個樣點的原始數字音頻信號, x→={xi|0≤i<N},xi是幅值序列.x→′是嵌入水印后的數字音頻信號,x→′={x′i|0≤i<N},x′是幅值序列.音頻信號,x→′的SNR定義為:
由式(10)、(12),式(13)可表示為,
其中,Ci是xi的函數.式(13)表明,對確定的幀長N,由初始信號和要求的音頻失真度量SNR可以自適應地確定倒譜變化量.
根據上述的原理,我們采用視覺可見的二值圖像作為水印,二值圖像表示為:P={P|pm×n,0≤m<M,0≤n<N},pm×n表示圖像像素,M,N分別為圖像的寬和高;音頻表示為,X={X|xi,0≤i≤L},xi表示音頻幅度,L是音頻長度.算法的具體步驟如下:
首先,將圖像水印經過降維處理,
其次,從音頻起始處開始做分幀處理,每幀長度l=?L/M·N」,?·」表示取整.
然后,對每幀按下述方法嵌入一比特的水印.記,x(j,k),1≤k≤l,1≤j≤M×N,表示第j幀的第 k個數據,并對所有的幀求復倒譜變換,
就研究區域而言,以視域分析為評價標準,制定合理的建筑高度,重組廣場空間序列,通過對其景觀視點與視線的控制,建立良好的視覺廊道體系.圖8是教堂廣場空間現有視覺廊道的示意圖,在實際改造中,可打開作為實際入口空間的肥城支路與中山路交匯處空間,使其落于可見度的核心區域,而實際出口區域(曲阜路東段與浙江路交匯口)應適當縮小占地面積,對人流形成明確指引路線,在整體設計上完善原有視覺廊道體系,形成以天主教堂為統領,各區域層次分明、功能明確的視覺廊道體系.或者直接打開空間,使整個區域形成連貫開放的視覺廊道體系,整體空間以天主教堂為重心,各區域相互呼應,提高整體空間品質及空間使用效率.
>0,設定添加水印后的統計均值門限為“0”,統計均值大于“0”提取比特“1”,統計均值小于“0”提取比特“0”,可以實現水印的盲檢測.同時,為使水印魯棒性較好,δ(j)可選取,
最后,將嵌入水印后的倒譜系數做逆倒譜變換,從而得到含水印的音頻.
根據前面的分析,我們可以實現水印的盲提取:首先,將帶水印的音頻分幀,幀長與嵌入水印時相同;其次,對每幀作倒譜變換,計算其統計均值,并與與門限“0”比較,如果大于“0”,提取比特“1”;否則,提取比特“0”;最后,將水印比特按序排列并升維還原圖像水印.
在實驗中,我們選用了圖3所示的64×64的二值水印圖像,并截取了名為flybird.wav的音頻左聲道前50 s的音頻數據作為載體音頻,采樣頻率為44.1 KHz,16比特量化.預設含水印各幀局部信噪比為60 dB,在未受攻擊的情況下,提取的水印如圖4所示.比較圖3、4可見兩者幾乎無視覺上的差異.
圖3 原始水印圖像
圖4 未受攻擊提取的水印
為了測試算法的魯棒性,本文對水印音頻進行了多種攻擊模擬:包括MP3壓縮,壓縮率為128 kbps;高斯白噪聲,方差為0.01;低通濾波,截止頻率為6 KHz;重采樣,采樣頻率為11 025 Hz.攻擊后提取的水印如圖5所示.
圖5 攻擊模式測試
表1 不同攻擊模式下水印的歸一化相關值表比較
式中,P,Ps分別表示原始水印圖像和提取的水印圖像;p(m,n),ps(m,n)分別表示其像素(m,n)值.
實驗結果表明,本文提出的水印算法在較高的SNR條件下仍具有較好的魯棒性.
本文利用復倒譜域系數的統計均值趨于零的特性,以“0”為水印提取門限,實現了水印的盲提取.同時,為了提高水印的魯棒性,在嵌入水印過程中應用了音頻信號失真評價準則——信噪比來控制水印的不可聽性.在信噪比確定的情況下,按式(14)計算取得最大水印嵌入強度,相應的也就取得了最大水印魯棒性,實驗的結果也表明了水印在不可聽的情況下的魯棒性.
[1]Cox IJ,Miler ML.The First50Years of Electronic Watermarking[J].Applied Signal Process,2002,56(2):225-230.
[2]Arnold M.Audio Watermarking:Features,Applications,and Algorithms[C]//IEEE Multimedia and Expo.NewY ork:IEEE Press,2000:1013-1016.
[3]Swanson M D,Zhu B,Tewfik A H.Robust Audio Watermarking Using Perceptual Masking[J].Signal Process,1998,66(3):337 -355.
[4]Xin L,Heather Y H.Transparent and Robust Audio Data Hiding in Cepstrum Domain[C]//Proceedings of IEEE International Conference on Multimedia and Expro.New Y ork:IEEE Press, 2000:397-400.
[5]K wang L S,Sung H Y.Digital Audio Watermark-ing in the Cepstrum Domain[J].IEEE Trans On Consumer Electronics,2000, 46(3):744-750.
[6]Liu S C,Lin S F.BCH Code-Based Robust Audio Watermarking in the Cepstrum Domain[J].Journal of Information Science and Engineering,2006,22(1):535-543.
[7]G opalan K.Audio Stegnography by Cepstrum Modification[C]// Conference on Acoustice,Speech and Signal Processing.Philadelphia:IEEE Press,2005:481-484.
[8]年桂君,王樹勛,唐笑年.倒譜域自適應音頻水印算法[J].吉林大學學報,2008,26(1):55-61.