辛蔚峰
蘇州科技學院傳媒藝術學院,江蘇蘇州 215009
數字音頻水印技術研究
辛蔚峰
蘇州科技學院傳媒藝術學院,江蘇蘇州 215009
本文首先介紹了數字音頻水印的應用與屬性,分別闡述了頻域、時域以及壓縮域的數字音頻水印技術。最后,總結了現有數字音頻水印技術的異同點以及今后的研究方向。
數字音頻水??;版權保護;魯棒性
近年來,隨著數字多媒體作品在互聯網上的傳播和復制變得越來越方便快捷,其版權保護的需求也在不斷增長。這些需求促使研究者去研究阻止版權侵犯的方法。最有希望解決這一挑戰性問題的思路是運用信息隱藏技術。[1]信息隱藏是將信息嵌入到數字媒體中的過程。嵌入的信息應當是不被察覺的;同時,被嵌入信息的數字媒體的保真度必須不受影響。
信息隱藏技術的兩個重要類型是隱寫術與水印。[2]隱寫術的主要目的是隱藏通信的事實(而不僅僅是隱藏通信的內容)。發送者將秘密信息嵌入到數字媒體中,只有特定的接收者才能提取到這個秘密信息。通信信道的監管人也許會察覺到傳輸的媒體,但是他不會察覺到隱藏于其中的秘密信息。
水印和隱寫術的目的都是在載體中隱藏信息。其中,隱寫術應用于兩方之間點對點的秘密通信。因此,隱寫術通常只有有限的魯棒性,它要防止嵌入的信息在傳輸過程中被改動。另一方面,當很多人知道媒體中存在嵌入信息,而且有意圖移除此信息時,就需要使用水印技術而不是隱寫術。因此,水印技術對魯棒性的要求更高。一個理想的水印系統要確保嵌入的信息不能被移除或改變,并且嵌入的信息不能影響載體的保真度。
學術界已經對數字水印技術表現出了極大的研究興趣。然而,大多數的研究都集中在圖像水印和視頻水印方面,有關音頻水印的研究還很少。音頻水印是將水印嵌入到音頻信號中的過程。因為人類聽覺系統(Human Auditory System,HAS)的敏感性,制作音頻水印是一個很困難的過程。
一個數字音頻水印系統包括三個基本模塊:水印生成模塊、水印嵌入模塊和水印檢測模塊。[3]水印信號通過一個不可逆的過程生成。音頻水印生成的時候也會考慮原始音頻信號的特點,這將有助于生成不易感知的水印。
水印嵌入采用某種恰當的嵌入規則(例如,加法或乘法),在時域或頻域中完成。最后,水印檢測可以在借助或者不借助原始音頻信號的情況下,通過某些相關檢波器或統計假設檢驗實現。
對水印系統的要求總是基于它的應用。因此,在研究對數字音頻水印的要求和設計要素之前,我們需要先討論它的應用。[3][4][5]
版權保護是水印技術最重要的應用。目標是嵌入能夠識別數字音頻作品版權所有者的信息,防止發生版權爭議。這個應用需要很高的魯棒性,以確保嵌入的水印不會被移除。
這個應用的目的是傳輸有關合法接收者的信息,確保數字音頻作品每個副本的合法性。這非常類似于軟件產品的序列號。在這個應用中,不同的水印被嵌入到每個副本中。而在版權保護應用中,只有一個水印嵌入到數字音頻作品的所有副本中。與音頻水印的版權保護應用一樣,數字指紋也需要很高的魯棒性。
這個應用的目的是檢測音頻數據的改動。這可以用所謂的脆弱性水印來實現。脆弱性水印對某些修改(例如,壓縮)具有很低的魯棒性。
這個應用試圖阻止數字音頻作品的非法復制??梢岳盟碇甘緮底忠纛l作品的復制狀態(例如,復制一次或者沒有復制過)。同時,用來進行復制操作的軟件或設備必須能夠檢測水印,并且根據作品的復制狀態來允許或者阻止操作請求。
數字音頻作品的制作商希望確保他們的作品能夠在他們購買的時間內按時播出。廣播監控的老辦法是要有人監聽廣播頻道,記錄他們聽到的內容。這個辦法既昂貴而且容易產生誤差。最好的解決方案是自動監控。其中一種自動廣播監控的方法是使用水印技術。我們可以嵌入一個標識碼到要廣播的作品中,通過監控系統來檢測嵌入的水印,以此來確保所購買的廣播時間是否全部得到利用。
數字音頻水印系統具有某些屬性。每一個屬性的重要性取決于對水印應用的需求。[3][6]
水印系統的效率是指輸出音頻信號被嵌入水印的可能性。當輸出信號被檢測器檢測到相應的反應時,才可以說音頻信號已被嵌入了水印。輸出信號被檢測到相應反應的百分比就是音頻水印系統的效率。
一般而言,音頻水印系統的保真度是指數字音頻的原始版本以及嵌入水印版本之間的感知相似度。但是,嵌入水印的音頻有可能在被接收者感知之前在傳輸過程中衰減。因此,需要對保真度有一個更恰當的定義。我們可以將音頻水印系統保真度定義為接收者感知到的未嵌入水印音頻信號和嵌入水印音頻信號之間的相似度。
數據負載是指水印在單位時間內嵌入的比特數。對音頻而言,數據負載是指每秒鐘傳輸的嵌入比特數。不同的水印應用需要不同的數據負載。例如,版權保護應用就只需要在數字音頻中嵌入少量的比特。
我們將需要原始音頻信號的水印檢測稱為知情檢測。知情檢測需要來源于原始信號的信息。與之相對,不需要原始音頻信號的檢測被稱為盲檢測。知情檢測在水印檢測時具有良好的性能,但是這需要存儲大量的原始信號。
魯棒性是指水印不受常用信號處理技術影響的能力。音頻水印需要在時域濾波、數模轉換以及比例縮放等方面表現出魯棒性。并不是所有的水印應用都需要各種形式的魯棒性。這依賴于水印系統的應用性質。
水印的安全性是指對抗惡意攻擊的能力。惡意攻擊是指明確的阻止水印目的的過程。攻擊可以分為三種類型:非法移除、非法嵌入以及非法檢測。
水印系統的成本是指水印嵌入和檢測的速度以及必須部署的嵌入器和檢測器的數量。其他問題還包括檢測器和嵌入器是通過硬件設備、軟件應用,還是通過插件來實現的。
可以根據水印的作用域將數字音頻水印技術分為三類,下面分別進行討論。
頻域音頻水印技術利用HAS的音頻掩蔽特性,將人耳聽不見的水印信號嵌入到數字音頻中。將音頻信號從時域轉換到頻域使得嵌入的水印成為音頻信號重要的組成部分。這使得水印系統具有更高水平的魯棒性,因為任何移除水印的企圖都會對原始音頻信號的保真度造成嚴重的影響。
輸入的音頻信號首先變換到頻域,在頻域中嵌入水印信號,接著,合成的信號通過反頻率變換,最后得到嵌入水印的音頻信號作為輸出。如圖1所示。

圖1 頻域音頻水印
水印可以通過多種方法嵌入到頻域中。例如,在頻域中應用擴展頻譜(Spread Spectrum)技術。[7][8]在擴頻通信中,傳輸信號的帶寬遠大于信號本身的帶寬,以至于在每個頻率上的信號能量幾乎感覺不到。與之類似,水印分布于眾多的頻率分量中,任何分量上的能量都是非常微小的,因此水印信號的隱蔽性很強。在這種方法中,載體信號的頻域被看作是一個通信信道,水印則是通過其傳輸的信號。各種有意或無意的干擾信號就被看作噪聲。水印檢測過程知道水印的位置和內容,它能將許多微弱的信號集中起來形成具有較高信噪比的輸出值,要破壞水印需要很強的噪聲信號加入所有頻率分量中。但是,破壞水印的同時也造成載體信號保真度嚴重下降。因此,利用擴頻技術的數字水印技術具有很高的魯棒性和安全性。
另一種常用的頻域音頻水印技術是采用Patchwork算法,這是一種統計算法,即在原始音頻信號中嵌入特定的統計特性。[3][9]該方法包括兩個主要步驟:(1)選擇兩個偽隨機序列的插入碼;(2)插入碼A加上一小常數d,另一插入碼B減去同一常數d。這樣,原始采樣變量就會略有改變。檢測過程從兩插入碼樣本值的差入手,采樣值的差值期望值決定了是否含有水印信息。由于采用了兩個而非一個插入碼,因此,檢測過程無需原始信號,即可檢測出水印。
在時域水印技術中,水印直接嵌入到音頻信號。在這個過程中不需要域轉換。在嵌入操作之前,水印信號需要整形,以確保信號的透明性,如圖2所示。與頻域水印相比,時域水印相對容易實現且需要較少的計算資源,但對一般信號處理如音頻壓縮和濾波等的抵抗能力較差。[10]

圖2 時域音頻水印
最不重要位(Least Significant Bits,LSB)方法是一種典型的時域水印算法。[4][10]LSB通過將每個采樣值的最不重要位,多數情況下為最低位,用代表水印信息的二進制位替換,以達到在音頻信號中嵌入水印信息的目的。為了提高水印的魯棒性,可以采用一段偽隨機序列來控制嵌入二進制位的位置。偽隨機信號可由偽隨機序列發生器的初始值來產生,這樣在收發雙方只需要秘密地傳送這個初始值作為密鑰,而不需要傳送整個偽隨機序列值。LSB算法簡單易實現,信息嵌入和提取的速度快,數據負載大,但是其安全性很差,攻擊者只需要對信道簡單地加上噪聲干擾或者對數據進行重采樣和壓縮編碼等處理都會造成整個水印信息的丟失。
頻域和時域水印算法大都是直接將水印添加到非壓縮的音頻格式中,由于沒有考慮到音頻編碼中的壓縮系數與水印參數之間的優化匹配,對音頻壓縮的魯棒性一般不高,所以難以起到壓縮音樂版權保護的作用。近年來,針對逐漸成熟的例如MP3、AAC等音頻感知編碼標準,研究者提出了一些MPEG編碼的壓縮域音頻算法,大致分為三類:[8](1)在非壓縮域進行,即先向非壓縮原始音頻中加入水印,然后再壓縮。(2)在壓縮域進行,水印直接加到MPEG音頻比特流上,直接形成含水印的壓縮音頻文件。這使水印嵌入非常迅速,但魯棒性較差,任何解壓縮——再壓縮的處理都可以輕易除去水印。(3)首先將壓縮音頻解壓,然后將水印嵌入到非壓縮域,最后帶水印的音頻內容再被重新壓縮成帶水印的壓縮格式音頻。該方法可以提高水印的魯棒性,但時間開銷太大,因為壓縮過程要花費很長時間,不適合在線交易和分發。
總的來說,壓縮域音頻水印算法的編解碼系統過于復雜,受格式化編碼帶來的限制很大,另外由于在壓縮域已經濾掉了音頻信號的大部分冗余信息,使得水印信息嵌入的難度很大。壓縮域音頻水印技術還有待于進一步的深入研究。
所有的音頻水印系統都被設計來實現同一個目標:在數字音頻中嵌入一個隱蔽的、穩健的水印。音頻水印系統必須滿足兩個相矛盾的設計要求。第一,水印必須要抵抗有意和無意的移除企圖,要具有良好的魯棒性。第二,嵌入水印的音頻信號必須保持良好的保真度,即水印必須是人感知不到的。為了滿足這些要求,不同的方法被開發出來,使用不同的域來實現水印的某種應用,同時提高嵌入水印的音頻信號的保真度和魯棒性。
然而,不同的音頻水印系統也有一些區別。在評價水印系統的效果以及完成某項應用的適用性時,要考慮到這些區別。這些區別包括:
(1)一些音頻水印系統的檢測過程不需要使用原始音頻信號。而另一些音頻水印系統在檢測過程中需要原始音頻信號,這將會導致在檢測過程中需要存儲和搜索大量的原始材料。需要原始音頻信號的系統不適用于某些應用,在這些應用中,檢測過程無法使用原始材料。
(2)在水印嵌入過程中,原始音頻信號被分成不同的幀,然后每一幀被分別嵌入水印。一些水印系統在所有幀中嵌入同樣的水印,以提高水印的魯棒性。但是,在另外一些系統中,每一幀嵌入不同的水印。
(3)因為HAS的敏感性,水印信號應該通過整形來實現透明化。音頻信號的掩蔽特性可以用來實現這個目的。還有一些音頻水印系統采用了不同的技術。這些技術在調制水印時使用了原始音頻信號。因此,水印信號的幅值被音頻信號的幅值所控制。
當前,數字音頻水印的研究已經取得了許多成果,但是數字音頻水印技術仍需要改進和提高,許多研究還有待開展。例如:
(1)目前大多數的音頻水印算法都只針對常見的音頻信號處理手段或者只針對一種或幾種水印攻擊有魯棒性,而在抵抗多重攻擊時,水印性能大大降低。
(2)音頻水印自身的性能還有可提高的空間,例如計算的復雜度、嵌入強度、是否盲檢測、能否做到自適應調整等。
(3)深入研究與新一代壓縮標準如MP3、AAC相適應的音頻水印算法,這樣才能更好地將數字音頻水印技術應用到實際中。
[1]喬明亮,宋莉.信息隱藏技術在通信中的應用研究[J].圖書與情報, 2011(4):62~65.
[2]李友,張定會.基于隱寫術的信息隱藏技術[J].信息技術, 2010(7):119~122.
[3]王向陽,楊紅穎.數字音頻水印技術研究綜述[J].曲阜師范大學學報,2005,31(4):119~125.
[4]方健華.數字音頻水印技術[J].信息技術,2007(4):75~78.
[5]N.Cvejic and T.Seppanen.Digital Audio Watermarking Techniques and Technologies: Applications and Benchmarks[M].IGI Publishing Hershey, PA,USA,2007.[6]吳迪,朱冰蓮.數字音頻水印技術研究綜述[J].電聲技術, 2009(2):55~58.
[7]D.Kirovski and H.S.Malvar.Spread-Spectrum Watermarking of Audio Signals[J].IEEE Transactions on Signal Processing, 2003, 51(4):1020~1033.
[8]李偉,袁一群,李曉強等.數字音頻水印技術綜述[J].通信學報, 2005,26(2):100~111.
[9]劉海燕,鄭雪峰,王穎.數字音頻水印主要算法的研究與比較[J].計算機應用研究,2007,24(9):136~139.
[10]P.Bassia and I.Pitas.Robust Audio Watermarking in the Time Domain[J].IEEE Transactions on Multimedia, 2001,3(2):232~241.
10.3969/j.issn.1001-8972.2012.15.039
蘇州科技學院2010年度科研
數字音頻水印技術研究(XKY201029)
辛蔚峰(1976- ),女,碩士,蘇州科技學院傳媒藝術學院講師,研究方向:數字音頻技術。