程格平
摘 要: 在高斯指紋系統(tǒng)中,指紋的嵌入與檢測須服從均方失真限制,以獲得較好的保真度。根據概率統(tǒng)計理論,分析了基于閾值相關檢測的傳統(tǒng)指紋方案中指紋編碼速率、均方失真限制以及共謀人數(shù)之間的關系,并指出閾值相關檢測方法的缺點,即當編碼速率大于容量范圍的某個值時檢測器性能較差。為了解決容量限制的問題,提出一種在限定均方誤差的條件下取得數(shù)字指紋基本容量的高斯指紋方案。利用互信息游戲理論,提出最大懲罰高斯互信息的指紋檢測方法,有效地解決了傳統(tǒng)指紋檢測方法存在的問題。根據指紋容量的數(shù)學模型,推導出指紋容量的表達式。
關鍵詞: 高斯指紋; 互信息理論; 指紋檢測; 指紋容量
中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2014)08-40-03
Gaussian fingerprinting scheme based on mutual information
Cheng Geping
(School of Mathematical and Computer Sciences, Hubei University of Arts and Science, Xiangyang, Hubei 441053, China)
Abstract: In Gaussian fingerprinting system, fingerprinting encoder and decoder must obey mean-squared distortion constraints to obtain better fidelity. According to the theory of probability and statistics, the fingerprinting code rate is analyzed with mean-squared distortion on constraint and the number of colluders on account of the normalized threshold decoder. The disadvantage of traditional fingerprinting decoding method by correlation decoder which has poor decoding performance when code rates greater than some value of capacity is introduced. To solve this problem, a Gaussian fingerprint scheme is proposed to achieve the fundamental capacity limits of digital fingerprint under the definite mean-squared distortion. By means of mutual-information game, the decoding method of maximum penalized Gaussian mutual information is presented. In the end, the expression of fingerprinting capacity is derived from the mathematical model.
Key words: Gaussian fingerprint; mutual-information theory; fingerprinting decoder; fingerprinting capacity
0 引言
數(shù)字指紋能夠用于叛逆者追蹤和版權保護。發(fā)行商將用戶指紋嵌入在數(shù)字產品中,然后分發(fā)給每個授權用戶,然而如果其中一組用戶聯(lián)合起來進行共謀,通過處理他們的合法拷貝就可以生成一個包含共謀用戶弱指紋信息的偽本[1]。為了解決這個問題,COX[2]等首先提出使用隨機選取且服從獨立同分布的高斯指紋作為用戶指紋,檢測時使用不公開的用戶指紋碼來追蹤共謀者,達到抵抗共謀攻擊的目的。
在共謀過程中,共謀者可能對他們的指紋拷貝采用線性攻擊、高斯噪聲和非線性攻擊策略。因此,共謀者檢測的基本問題是如何優(yōu)化指紋系統(tǒng)的檢測性能。為了解決這個問題,本文假設指紋嵌入和共謀引起的失真在一定的限制范圍,有文獻對基于有限字母表[3]和實數(shù)值[4]的指紋信號進行了分析,指出高斯指紋對這些攻擊具有較好的抗共謀能力。文獻[5]利用互信息理論推導了指紋容量的上界,但沒有具體指出如何在歐幾里德集合中獲取這種界限的編碼方案。
基于互信息理論,本文針對高斯指紋模型提出一種指紋編碼方案,對檢測器性能進行優(yōu)化,在可靠檢測基礎上得到指紋編碼速率的范圍。
1 問題模型
假定檢測器已知宿主信號內容和最大共謀人數(shù)Kmax,但不知道共謀者所采用的策略和共謀用戶人數(shù),檢測器能夠檢測出參與共謀的用戶。指紋系統(tǒng)模型可以從以下幾個方面進行描述。
1.1 指紋生成和嵌入
假設宿主信號是實數(shù)空間上長度為N的一個序列,即,且宿主信號對于共謀者未知。M(M?Kmax)個長度為N的用戶指紋形成一個指紋碼本C={(U1,…,UM),C∈N},其中Ui=(u1,…,uN)是服從N(0,D1)的隨機序列,指紋碼的嵌入率為。嵌入指紋后第m個用戶的指紋拷貝可表示為:
Xm=S+Um, m∈{1,…,M} ⑴
碼本C獨立于宿主信號S。由此可得,即指紋信號的均方失真為D1。
1.2 攻擊模型
假定K(K?M)個共謀者選擇的無記憶性共謀通道為A(y|xk),以加入均值為0方差為D2的加性高斯噪聲的平均攻擊為例,共謀者聯(lián)合他們的拷貝經過攻擊通道生成的共謀偽本Y可表示為:
⑵
其中W~N(0,D2)。共謀通道A須滿足式⑶兩個限制條件,即
局部不變限制:A(y|xk)=A(y-s|(x-s)k)
均方失真限制:
⑶
局部不變限制不需要考慮宿主信號S的統(tǒng)計模型,排除對宿主信號的過濾攻擊,簡化了數(shù)學推導過程。如果指紋嵌入在分量近似獨立且與嵌入失真相關的宿主信號變換域,則此限定條件更加寬泛。均方失真限制條件表明失真是度量指紋信號質量的標準,用線性無偏估計量表示,其最大值為D2。另外,最優(yōu)的共謀攻擊須滿足可行性和公平性,即A(y|xπk)=A(y|xk),π為置換不變性因子,這說明共謀集合中所有成員必須承擔同樣的風險。
1.3 檢測器模型
在指紋檢測過程中,宿主信號對檢測器是有效的。指紋檢測器輸出估計的共謀者集合,即:
⑷
其中,gN為獨立于S的檢測函數(shù)。如果檢測器輸出的集合為空集,則表明沒有發(fā)生共謀。現(xiàn)有文獻的指紋檢測器多數(shù)采用閾值檢測統(tǒng)計量進行檢測,但這種檢測器是次優(yōu)的。
1.4 錯誤概率與容量
在共謀攻擊通道,基于局部不變限制和均方失真限制的假設,檢測器的兩種性能標準錯誤肯定概率(控告一個無辜用戶)和錯誤否定概率(不能抓住共謀者)的定義如下:
⑸
在失真限定條件下,如果存在一個碼本序列(N,2NR),當N→∞時,錯誤肯定概率和錯誤否定概率的利益成本函數(shù)近似為零,則指紋容量是所有可得指紋碼率R的最小上界,可靠指紋系統(tǒng)的指紋容量由參數(shù)(N,M,K,D1,D2)確定。
基于互信息理論,對Wang和Moulin[6]提出的碼率公式進行改進,可得到指紋碼率的最大最小值,即:
⑹
其中C1(K)?C(K),當且僅當共謀人數(shù)K=1時兩個值相等。
2 傳統(tǒng)閾值檢測器
在實空間N上兩個隨機序列的歸一化相關系統(tǒng)定義為ρ(x,y)=,閾值為η的閾值檢測器滿足以下條件:
共謀攻擊后指紋信號和共謀偽本的歸一化相關系數(shù)概率收斂于:
⑺
假設對于任意小的正數(shù)ε,存在η=η1(Kmax)-ε。
下面對錯誤肯定概率和錯誤否定概率進行分析。
2.1 錯誤否定概率
根據上述條件可以得到隨機變量和的概率收斂到其期望值,分別為和。在共謀通道A,ρ(Xm,Y)最大值也是概率收斂的,即maxm∈Kρ(Xm,Y)?η1(K)?η+ε。因此,錯誤否定概率的概率分布可表示為:
⑻
2.2 錯誤肯定概率
對于任何不在共謀集中的無辜用戶,Xm和Y相互獨立。由香農公式可得錯誤肯定概率的概率分布:
⑼
其中,。
由于ε是任意小的正數(shù),E(η1(Kmax))=C1(Kmax),當碼率R
3 基于互信息理論的檢測器
閾值檢測器的基本思想是,針對個體共謀成員的決策方式,當R>C1(Kmax)時,滿足條件ρ(Xm,Y)?η1的用戶指紋數(shù)為,導致虛警率的提高,進而影響指紋檢測的可靠性。因此,實現(xiàn)對共謀者集合的聯(lián)合決策是提高指紋系統(tǒng)檢測性能的有效途徑。
根據互信息理論,歸一化相關系數(shù)為ρ的兩個高斯隨機變量X和Y的互信息為。如果Xk服從獨立同分布N(0,D1),W服從N(0,D2)且獨立于Xk,,其中,則指紋Xk與共謀偽本Y序列之間的高斯互信息表示為:
(10)
定義為指紋信號Xk的集合,指紋序列Xk的歸一化相關性滿足以下條件:
(11)
對于固定的K值和任意小ε的隨機球形碼,根據大數(shù)定理,當N→∞時,(11)式具有近似為1的概率。
設τ=C(Kmax)-ε,基于互信息的檢測器可表示為:
(12)
檢測器的輸出值對最大懲罰高斯互信息標準最大化。當N→∞時,隨機變量IG(Xk;Y)收斂于其數(shù)學期望值,即IG(Xk;Y)?KC(K)。τ的最大值為C(Kmax),因此當指紋碼率R小于C(Kmax),檢測器能夠進行可靠檢測。當K→∞時,C1(K)~C(K)~。
結合上述分析,對文獻[7]中的定理進行改進即可以得到指紋容量(即指紋編碼的最大碼率)為KmaxC(Kmax)。
4 結束語
針對指紋編碼和檢測的均方失真限制,本文基于互信息游戲理論,分析了傳統(tǒng)相關性指紋檢測方法的缺點。指紋容量是指紋系統(tǒng)的重要性能指標,針對傳統(tǒng)閾值檢測器存在的容量限制問題,提出一種基于互信息理論的檢測方法。通過理論分析,有效獲得了指紋編碼的可獲得最大碼率,即指紋容量是指紋系統(tǒng)的最大共謀人數(shù)及其互信息值的乘積。可以看出,基于互信息理論的檢測方法推導出的指紋容量要高于傳統(tǒng)閾值檢測器的容量界限。在數(shù)字指紋技術的研究領域,理論分析研究方法通常有一定的條件限制,因此,設計更加具有實效性的抗共謀指紋方案是未來指紋研究的發(fā)展方向。
參考文獻:
[1] 呂述望,王彥,劉振華.數(shù)字指紋綜述[J].中國科學院研究生院學報,
2004.3:289-298
[2] Cox I J, Kilian J, Leighton F T, et al. Secure spread spectrum
watermarking for multimedia[J]. Image Processing, IEEE Transactions on,1997.6(12):1673-1687
[3] Moulin P, O'Sullivan J A. Information-theoretic analysis of
information hiding[J].Information Theory, IEEE Transactions on,2003.49(3):563-593
[4] Kilian J, Leighton F T, Matheson L R, et al. Resistance of digital
watermarks to collusive attacks[C]//IEEE International Symposium on Information Theory. Institute of Electrical Engineers Inc(IEEE),1998:271-271
[5] Somekh-Baruch A, Merhav N. On the capacity game of private
fingerprinting systems under collusion attacks[J]. Information Theory, IEEE Transactions on,2005.51(3): 884-899
[6] Wang Y, Moulin P. Capacity and optimal collusion attack channels
for Gaussian fingerprinting games[C]//Electronic Imaging 2007. International Society for Optics and Photonics,2007:65050J-65050J-9.
[7] Moulin P. Universal fingerprinting: Capacity and random-coding
exponents[C]//Information Theory, 2008. ISIT 2008. IEEE International Symposium on. IEEE,2008:220-224