摘要:本文提出了一種基于OFDM同步音頻數字水印方案。主要是通過對原始水印進行隨機化處理、編碼調制及正交變換,在時域內嵌入同步碼來確定水印的嵌入位置。實驗結果表明,該算法對DA/AD變換具有良好的魯棒性,同時證明了該算法的可行性和優越性。
關鍵字:正交頻分復用 音頻水印 同步技術 DA/AD攻擊
1.引言
近年來,多媒體技術與數字網絡通訊的迅猛發展,使得數字化音樂制品和音像制品的大量制作和發行變得日益普及化、簡單化,音頻數據的版權保護也顯得越來越重要。數字音頻水印是一種很好的版權保護措施,已經成為數字水印的一個重要研究方向,也是目前信息安全領域中的一個新的研究熱點[1]。
研究音頻水印的同步具有非常重要的意義。首先,進行實時水印檢測時,必須通過檢測同步信號獲取水印嵌入的正確位置,才能提取水印信息;其次,對語音的各種處理往往會造成數據量的變化和數據的位移,這時同樣需要通過同步碼獲取水印的嵌入位置。
2.同步信號
所謂同步信號就是用來標志水印嵌入位置的特征點或特征區域。按照同步信號的來源可以將其分為外同步和自同步[2],本文采用外同步法,即將同步信號如同水印信息一樣需要嵌入和提取過程。到目前為止,人們主要采用四種措施設計抵抗同步攻擊的穩健音頻水印方案,分別為窮舉搜索[3]、擴頻水印擴頻碼相結合、利用原始音頻重要特征、同步碼等。其中,同步碼方案具有較為明顯的技術優勢。按照同步的功用來分,同步可以分為載波同步、位同步(碼元同步)、群同步(幀同步)和網同步(通信網中用)等四種[4]。
在水印系統中,一般使用群同步技術。實現群同步的方法有兩種,即連貫式插入法和間隔式插入法。本文用到的就是連貫式插入法,連貫式插入法就是在每群的開頭集中插入群同步碼字的同步方法。目前最常用的群同步碼組是巴克碼。
3.水印的嵌入算法
3.1水印預處理
本文選取的水印是一幅二值圖像,要將其嵌入到一維的音頻信號中,首先必須進行降維處理,使之成為一維二值序列;然后對一維水印序列進行置亂。具體步驟如下:
(1)水印圖像的降維處理
假設所選取的二值水印圖像為w,那么將其轉換為一維序列w的方法為:
(1)
(2)水印的編碼
水印信號在嵌入音頻文件之前,要進行一系列的變換,以提高它的隨機性和相關性。本文對水印信息首先進行隨機化,然后再對其進行OFDM編碼,最后又進行了一次正交變換,這樣就生成了待嵌入的水印序列。
(3)水印序列置亂處理
上面所提到的隨機化,就是要將水印序列進行置亂處理。首先生成一個混沌序列,其個數與待置亂的一維水印序列相同。按照順序將混沌序列與該水印序列中的元素一一對應,然后將混沌序列按照從小到大排序,那么水印序列就相應的被置亂了。
3.2同步碼的嵌入
同步碼在音頻水印中的作用至關重要。當我們進行水印的實時提取時,必須通過準確的檢測同步碼來確定水印嵌入的正確位置。同步碼能否準確定位水印的嵌入位置決定了音頻水印的實時性、有效性,因此同步碼的穩健性也就成了水印檢測系統的關鍵。
為了減少同步碼的搜索計算量,實現快速重同步,本文將同步信號嵌入在時間域上。同時,為解決好穩健性和不可察覺性相沖突的矛盾,滿足兩者之間的基本要求,同步碼必須是具有尖銳特性的自相關函數且具有較短的碼長。
在選取同步碼時,要正確選取同步碼的長度,如果碼長過長,則在時域內檢索同步信號就需要耗費較長時間,若是過短,則會出現同步碼的重復率過高,在宿主音頻中產生假同步的概率就越大[5]。
把同步碼插人到水印序列里形成新的序列再嵌入到音頻數據里面。同步碼與水印信息的數據結構如表1所示:
表1數據結構圖
…同步碼水印信息同步碼水印信息…
本文選用N=12的巴克碼(Barkcode)111110011010作為同步碼嵌入音頻中,巴克碼是一種常用的群同步碼,它是一種具有非周期序列的二進制碼組[6]。設是同步信號,,則其自相關函數為:
(2)
其中,N為碼元長度,為碼組中第j個碼元的值。
巴克碼在計算自相關函數時,需要轉化為B=[+1,+1,+1,+1,+1,-1,-1,+1,+1,-1,+1,-1]。表示式為:
(3)
3.3水印嵌入
嵌入水印的步驟如下:
步驟一分段
要將水印信息嵌入音頻文件中,首先要對原始音頻進行分段,且每段音頻長度相同。設原始音頻信號為:
,分別對這N個子載波進行調制。選取子載波間隔使各個子載波在周期T內相互正交。取即可滿足此條件,各子載波頻率為,因此,一個周期內OFDM的信號表達式為:
(4)
以間隔對上式進行采樣(采樣頻率),得到:
(5)
由以上兩式可見,和為離散傅里葉變換對(DFT),因此,OFDM信號波形可以由IDFT變換得到。
因此,對音頻段做DFT變換,得到DFT的系數序列,取其中某一頻段作為待嵌入的音頻信號C,假設C序列的長度為N。
步驟二調制
將水印信息轉化為長度為的二值序列w,然后對此二值序列進行MQAM調制,成為復符號W(W的長度為)。QAM調制中,取。本文水印信息選取的是二值圖像。
步驟三量化
對待嵌入的音頻信號C進行量化,也就是將原始音頻信號的第n個頻域樣本量化到復平面中的,經過此變換而引起的失真取決于量化步長。量化步長越小,則隱蔽性就越好。反之,隱蔽性較差而魯棒性較好。
步驟四嵌入水印
將水印信息嵌入到音頻段C中,嵌入式可采用QIM(擾動調制,是量化指數調制的一種具體表現)技術,將水印向量與待嵌入音頻向量相加,得到已嵌入水印的新向量,其表達式為:
(6)
在此過程中,將同步碼與水印信息一同嵌入到音頻段中,且在每一段中都嵌入相同的水印信息和同步碼,重復循環這一操作過程,直到把整個音頻段都用完為止,即在整個音頻段中都嵌入水印信息。水印嵌入的結構如圖2所示:
步驟五逆變換
對已嵌入水印的信號E取其共軛,然后用E及分別替換其在原來音頻信號C中的位置。將得到的音頻段做IDFT,使其恢復到時域,此時生成的音頻信號中已經嵌入了同步碼及水印信息。圖3為基于OFDM同步音頻水印的嵌入流程圖。
3.4同步碼的檢測
同步碼的提取過程是嵌入過程的逆過程。同步碼的檢測方法是采用基于數字通信中的幀同步碼逐位比較技術,從時域提取出已嵌入的同步碼。
搜索同步碼和建立重同步的具體步驟是:
①對整段音頻信號進行檢測,提取與同步碼的自相關函數相比大于一定閾值的碼。
②在上述提取的碼中相鄰兩碼的距離滿足分段要求的被認為是同步信息。
設表示已嵌入音頻信號的一個采樣值,根據下式檢測可能已嵌入的同步信號(P為量化系數):
根據上式搜索其中的同步碼。搜索同步碼和建立重同步是對整段音頻信號進行檢測,使其提取自相關函數大于一定閾值,設是待檢測的音頻序列,若
(8)
那么就認為是一個同步信號,其中M是個設定的閾值。
3.5水印的提取算法
水印提取時基于相關性的盲檢測,無需原始音頻信號。先搜索檢測出嵌入到音頻中的同步碼,然后根據同步碼的位置對水印嵌入位置進行定位,從而建立水印的重同步。
先將待檢測音頻信號進行分段檢測,若每段有A個采樣點,其中B個采樣點嵌入的是同步碼,在確定同步碼位置后,先用帶通濾波器濾除同步信號頻段以外的音頻成分,然后將同步碼與接收端產生的各段的標識信號窗口樣本進行互相關。
取出嵌入水印的音頻段后,將其進行DFT,表示為。然后對其進行量化,得到。為保證嵌入數據提取的準確性,選取量化步長與嵌入時步長一致。
選取第n個音頻段,將音頻數據向量與量化后向量相減,即可得到恢復嵌入的符號流:
(9)
然后,對所有的音頻段重復上述操作,恢復出各段水印信息并將他們組合起來,然后對其進行調制并解密,最后此的二進制水印序列升維,從而恢復出水印圖像。
4.仿真實驗與結果分析
4.1水印嵌入測試
本實驗中,采用一段長為30s、WAVE格式的音頻文件。該音頻為單聲道的音頻,采樣頻率為44.1kHz,量化精度為16bits。同步信號取的是12位Bark碼。水印為大小為32x32帶有“傳媒大學”字樣的二值圖像。將水印信息和同步碼嵌入到這段30s的音頻段中。
水印嵌入前后音頻信號波形圖如圖5所示。
嵌入水印信息前后的音頻信號與原始音頻信號信噪比為SNR=98.56dB,由此可以看出這個信噪比是非常高的,從聽覺上感覺不到任何差異。
4.2水印提取測試
實驗在WindowsXP環境下Matlab7.0平臺上完成的。圖7為原始水印圖像,圖8顯示為未受攻擊時從音頻中提取出的水印圖像。
從圖中可以看出,原始水印與從音頻中提取出的水印從視覺上看不出任何差別,SNR=0,可以對水印信息進行正確提取。
在提取水印圖像時,首先要搜索同步碼,本文在每一音頻段的段前段后都嵌入了相同的同步碼,因此只要檢測到同步碼,就能確定水印的嵌入位置,就可以正確的提取水印信息。在本實驗提取水印過程中,同時把段前段后的同步碼也一起提取顯示出來。下面就是提取的段前段后的同步碼信息。
4.3水印抗DA/AD變換測試
根據音頻水印在DA/AD變換的過程中可能受到在時間軸上的伸縮以及波形失真影響,而在OFDM算法中,同步信號的引入和重定位搜索可以定位水印嵌入位置的開始點,進而可以正確的提取水印信息。
圖9為原始音頻信號與DA/AD變換后的音頻信號波形圖。
本文算法與文獻[3-5]中的算法分別做了DA/AD攻擊實驗,還列舉了抗高斯噪聲的詳細比較。
從圖中可看出,基于OFDM算法經DA/AD攻擊后提取出來的水印圖像和原始水印圖像具有更加明顯的相似性。該試驗結果表明,經DA/AD變換后能夠正確地檢測提取出嵌入到音頻信號中的水印圖像,本文算法不僅有效地提高了抗DA/AD攻擊的性能,同時也說明了該算法具有良好的魯棒性。
結語
本文提出了一種基于OFDM同步音頻數字水印算法。該算法通過對原始水印進行隨機化處理、編碼調制及正交變換,在時域內嵌入同步碼來確定水印的嵌入位置,從而實現了音頻水印的同步性、實時性。本文算法對DA/AD變換具有良好的魯棒性,同時表明了該算法的可行性和優越性。
參考文獻
[1]HVJagadish,Miningdeviantsinatimeseriesdatabase.The1999Int’lConfonVeryLargeDatabases(VLDB’99),Edinburgh,UK,1999.
[2]李偉,袁一群.數字音頻水印技術綜述.通信學報,2005,26(2):100-111.
[3]LieW,ChangL.Robustandhigh-qualitytime-domainaudiowatermarkingsubjeettoPsyehoaeoustiemasking.In:IEEEIntemationalSymposiumonCircuitsandSystetns,2001:45-48.
[4]張國武.同步音頻水印算法的研究[D];中南大學;2008.
[5]周新法.基于小波變換的同步音頻數字水印技術的研究[D];江蘇大學;2005.
[6]HuangJ,WangY,ShiY.AB1indAudioWatermarkingAlgorithmwithSelf-synchronization[c]∥ProcofIEEEIntlSympCircuitsandSysterns,2002:627-630.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文