唐晗 吉首大學信息科學與工程學院
數字水印技術即特定的信號加密技術,在聲音、圖像處理中嵌入能證明版權歸屬或者可以跟蹤侵權行為的隱蔽信息,以確認內容是否真實完整,其所隱蔽加密信息與被保護的數字對象相關。數字水印的嵌入信息是不可見的,只能被專用監測器或者閱讀器提取。由于攻擊技術與方法的不斷發展,要求數字水印具備較高的魯棒性,因此改善數字水印算法,提高其魯棒性以應對音頻數字水印的抗攻擊性成為亟待解決的問題。
音頻數字水印,分為兩部分,一是嵌入,二是提取。首先,將數字音頻嵌入音頻文件,如WAV、MP3、AVI等,要保證嵌入水印后對原文件無影響。其次,通過閱讀器將音頻數字水印從原文件中文章提取出來。音頻數字水印系統模型,見圖1。

圖1 音頻數字水印系統模型
現行的音頻水印算法大致有時域音頻水印算法、變換域音頻水印算法兩種。其中,時域音頻水印算法又分為最低有效算法、基于回聲的水印算法,變換域音頻水印算法由相位水印算法、擴頻水印算法、離散小波變換域算法、離散傅里葉變換域算法、離散余弦變換域算法、倒譜域水印算法等幾種方法構成。嵌入的水印信號可以定義為:
W={W(k|W(k∈U,k∈o,1,2,M-1}
其中,W為原始水印,M為水印長度,U為水印值域。水印信號可以是二進制形,也可以是高斯噪聲形式。
將數字水印系統的基本框架定義為{X,W,K ,G,E,D}。其中X為要被保護的數字產品。Xo為原始數字作品,Xw為含水印的數字作品,W為水印信號集合,K為水印密鑰集合,G為利用密鑰K和待嵌入水印的X共同生成水印的算法。
G:X×K→W,W=G(X,K)
E為水印W嵌入到數字作品X中的嵌入算法
E: Xo×W →Xw,Xw=E(Xo,W)
D為水印的檢測算法
D: X×K →(0,1)
離散余弦變換(DCT)是目前應用較廣泛數字水印。時域音頻水印計算復雜度較低,其嵌入與提取相對容易,但魯棒性較差。變換域音頻數字水印,透明性、魯棒性強,且能實現盲檢測,但其缺陷是算法復雜,嵌入與提取速度均低于時域音頻水印。離散余弦變換音頻數字水印采用分段求取能量差值并進行比較,結合聽覺系統的時域掩蔽效應實現水印信息的嵌入,可以滿足同時速度與安全性的雙重需求。
比較能量差值[EDx1]和[EDx2],修改相應段中音頻載體信號取樣值的方法實現在音頻中嵌入水印信息。當水印比特為“1”時,通過對比能量差值,[EDx1>EDx2]時不做改變,如果[EDx1≤EDx2]時,要修改取值使其滿足[EDx1>EDx2]。當水印比特為“0”時,通過對比能量差值,時不做改變,如果[EDx1>EDx2],同樣需要修改取樣值使其滿足[EDx1≤EDx2]。可以看出,水印比特為“1”和為“0”,能量差值大小正好相反。
將音頻信號前兩段的能量差值用[ED′x1]表示,后兩段用[ED′x2]表示,在音頻數字水印提取時,只需要比對前兩段與后兩段差值的大小,如提取水印比特為“1”時,提取算法為[ED′x1>ED′x2],提取水印比特為“0”時,其算法正好相反。離散余弦變換算法的音頻數字水印在提取水印序列時不需要原始音頻載體信號,可實現音頻水印序列的盲提取。
用不同格式將音頻進行壓縮,壓縮對音頻質量沒有大的影響,格式的轉換對音頻水印而言就是一種攻擊。比如,原始音頻格式為WAV,轉化為MP3格式后提取水印,水印變模糊,再從MP3轉WAV格式后,水印清晰度仍未改變。這就說明,水印圖像仍然能夠辨析出,水印對格式轉換具有一定魯棒性。
外部攻擊是測試水印魯棒性的最有效方法,水印嵌入后,如果音頻產生噪音,說明水印的透明度存在問題。加入白噪聲來破壞水印,信噪比不斷下降,水印質量會不斷下降。離散余弦變換音頻數字水印,信噪比越高,則水印清晰度越高,隨著信噪比逐漸降低,水印會逐漸模糊,信噪比很小的時候,水印才會失效。因此離散余弦變換音頻數字水印對白噪聲的抗性很高,魯棒性很好。
綜上所述,離散余弦變換音頻數字水印算法,魯棒性與不可覺察性是其基本要求。我國水印技術研究起步較晚,在這一新興領域,基于DCT域的水印嵌入、提取、攻擊等方面還有許多亟待解決的問題。