楊 潔,李松斌,鄧浩江
(1.中國科學(xué)院 聲學(xué)研究所,北京 100190; 2.中國科學(xué)院大學(xué) 電子電氣與通信工程學(xué)院,北京 100049)(*通信作者電子郵箱lisb@dsp.ac.cn)
信息隱藏,亦稱為隱寫術(shù),是一種將秘密信息嵌入到載體中而使秘密信息難于被監(jiān)管者察覺的技術(shù),它通常把秘密信息隱藏在可公開的媒體信息中,如文本、圖像、語音以及視頻等多媒體對象。隨著帶寬的持續(xù)增長以及網(wǎng)絡(luò)融合趨勢的增強(qiáng),基于網(wǎng)絡(luò)數(shù)據(jù)通信的網(wǎng)絡(luò)流媒體服務(wù)得到了空前的發(fā)展,網(wǎng)絡(luò)壓縮語音碼流成為隱蔽通信常用載體之一。它給人們的生活和工作帶來便利的同時,也給犯罪分子帶來了可乘之機(jī)。對于敏感機(jī)構(gòu)而言,需要對機(jī)構(gòu)中的語音碼流進(jìn)行評估審查,確定是否存在隱蔽通信信道進(jìn)行秘密信息的外泄。信息隱藏檢測技術(shù)作為隱蔽通信的對抗技術(shù),能夠有效地監(jiān)控網(wǎng)絡(luò)壓縮語音碼流中的隱蔽通信,實(shí)現(xiàn)對敏感機(jī)構(gòu)中的語音碼流信息隱藏檢測。
網(wǎng)絡(luò)壓縮語音編碼信息隱藏根據(jù)嵌入時機(jī)的不同可分為兩類。第一類是在編碼結(jié)束后直接修改壓縮語音碼流[1-8],該類方法通常基于信噪比(Signal-to-Noise Ratio, SNR)和語音感受質(zhì)量評估(Perceptual Evaluation of Speech Quality, PESQ)選出對語音質(zhì)量影響小的語音碼字中的比特作為秘密信息嵌入載體,并結(jié)合其他的編碼方式或者技術(shù),如覆蓋碼[1]、多進(jìn)制編碼[3]、矩陣編碼和交織技術(shù)[6]來提高嵌入效率和隱蔽性。第二類是在編碼過程中通過調(diào)制編碼系數(shù)進(jìn)行秘密信息嵌入,主要包括基于線性預(yù)測編碼(Linear Predictive Coding, LPC)系數(shù)調(diào)制的信息隱藏方法[9-14]、基于固定碼本系數(shù)調(diào)制的信息隱藏方法[15-19]和基于基音調(diào)制的信息隱藏方法[20-24],相對于第一類方法,該類方法由于是結(jié)合編碼過程進(jìn)行信息隱藏,對語音質(zhì)量影響更小,隱蔽性更高。目前,絕大多數(shù)低速率語音編碼器(如G.729和G.723.1)都基于LPC模型,因此,在LPC過程中進(jìn)行水印信息嵌入具有較高的普適性。此外,基于合成—分析法的LPC模型已被廣泛應(yīng)用于各類低速率語音編碼器,該模型能夠自適應(yīng)地減小LPC系數(shù)矢量量化過程中引入的失真。
量化索引調(diào)制(Quantization Index Modulation, QIM)隱寫算法最早由麻省理工學(xué)院Chen等[25]提出,適用于包含矢量量化過程的圖像、數(shù)字音頻和視頻編碼。該方法對載體信號的失真、信息嵌入率和抗干擾性作了有效的平衡,非常適合在數(shù)字媒體的壓縮編碼過程中進(jìn)行信息隱藏。互補(bǔ)鄰居頂點(diǎn)QIM(Complementary Neighbor Vertex QIM, CNV-QIM)算法[9]是首個在LPC矢量量化過程中進(jìn)行信息嵌入的算法,該算法基于圖論將碼書劃分為兩個部分,保證了每個碼字和其最近鄰碼字被劃分到不同的分組中,嵌入秘密信息比特0和1時分別從這兩個碼組進(jìn)行LPC量化。文獻(xiàn)[12]在CNV-QIM算法的基礎(chǔ)上,提出了一種稱為安全QIM(Secure QIM, Sec-QIM)的隱寫方法,該方法引入了一種遵從柯克霍夫準(zhǔn)則的基于密鑰的碼書劃分策略以提升安全性,并結(jié)合矩陣編碼提高嵌入效率來減少嵌入對語音質(zhì)量的影響并提升算法抗隱寫分析能力。最近,Liu等在文獻(xiàn)[13]和文獻(xiàn)[14]中分別提出了名為矩陣嵌入QIM(Matrix Embedding QIM, ME-QIM)和最近鄰?fù)队包c(diǎn)QIM (Nearest-neighbor Projection Point QIM, NPP-QIM)兩種線性預(yù)測語音編碼信息隱藏方法。ME-QIM方法基于LPC矢量最小距離準(zhǔn)則構(gòu)建映射表進(jìn)行嵌入,并結(jié)合嵌入位置選擇和嵌入模板選擇算法,進(jìn)一步提升算法的隱蔽性。NPP-QIM方法將LPC量化索引集合視為三維LPC量化索引空間中的一個點(diǎn),并基于最近投影點(diǎn)替換方法進(jìn)行信息嵌入,NPP-QIM方法相較于Sec-QIM方法嵌入容量、嵌入效率和隱蔽性都有所提高。
為了檢測QIM信息隱藏方法,Li等[26]發(fā)現(xiàn)QIM信息隱藏算法會導(dǎo)致LPC量化索引取值發(fā)生變化,提出了一種基于索引分布特征(Index Distribution Characteristics, IDC)的方法,該方法以矢量量化(Vector Quantization, VQ)碼字VQ1、VQ2、VQ3直方圖分布和相鄰幀間轉(zhuǎn)移概率作為特征向量,利用支持向量機(jī)(Support Vector Machine, SVM)訓(xùn)練分類器實(shí)現(xiàn)對QIM隱寫算法的檢測。IDC方法在檢測CNV-QIM隱寫算法時具有很高的檢測準(zhǔn)確率,但是在檢測對量化索引分布影響更小的NPP-QIM隱寫算法時檢測準(zhǔn)確率有所降低。其他盲檢測算法如梅爾頻率倒頻系數(shù)(Derivative Mel-Frequency Cepstral Coefficients, DMFCC)[27]方法以時域衍生頻譜和梅爾倒頻系數(shù)作為特征,利用SVM訓(xùn)練分類器實(shí)現(xiàn)壓縮語音信息隱藏檢測,但是DMFCC方法對NPP-QIM隱寫算法檢測準(zhǔn)確率也不高。為了提升對壓縮語音NPP-QIM隱寫算法的檢測準(zhǔn)確率,本文提出了基于碼字貝葉斯網(wǎng)絡(luò)(Codeword Bayesian Network, CBN)的信息隱藏檢測方法,以VQ1、VQ2、VQ3時空轉(zhuǎn)移關(guān)系構(gòu)建CBN,并以Dirichlet分布作為先驗(yàn)分布學(xué)習(xí)網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)對NPP-QIM隱寫算法的有效檢測。不同于現(xiàn)有基于特征提取與SVM分類的信息隱藏檢測方法,本文使用貝葉斯網(wǎng)絡(luò)進(jìn)行隱寫分類,可以避免人工設(shè)計特征帶來的特征維度大及難于表達(dá)復(fù)雜關(guān)聯(lián)的缺陷,同時為信息隱藏檢測的研究提供一種新的思路。
LPC是網(wǎng)絡(luò)壓縮語音編碼中最有效的語音信號分析方法之一,其利用線性預(yù)測模型實(shí)現(xiàn)對語音信號譜包絡(luò)壓縮表示,能夠提供非常精確的語音參數(shù)預(yù)測。LPC合成濾波器為:

(1)
其中a1,a2,…,ap為語音信號的p階LPC預(yù)測系數(shù)。由于LPC系數(shù)波動較大,某個LPC系數(shù)的誤差對信號整個頻域都會產(chǎn)生影響,因此LPC系數(shù)并不適合直接量化,需要進(jìn)一步轉(zhuǎn)換為線譜對(Line Spectrum Pair, LSP)系數(shù)。在G.723.1中,p=10,對每幀中最后一個子幀的LPC系數(shù)進(jìn)行預(yù)測分裂矢量量化,令A(yù)(z)=1/H(z),則A(z)為:
(2)
令A(yù)(z)的和、差多項(xiàng)式分別為P(z)和Q(z),P(z)和Q(z)表示為:
(3)
則A(z)可進(jìn)一步表示為:
A(z)=[P(z)+Q(z)]/2
(4)
當(dāng)A(z)的零點(diǎn)在z平面單位圓內(nèi)時,P(z)和Q(z)的零點(diǎn)都在單位圓上,并且沿著單位圓交替出現(xiàn)。記P(z)和Q(z)的零點(diǎn)分別為e±jωi和e±jθi,則P(z)和Q(z)可因式分解為:
(5)
系數(shù)ωi(i=1,2,…,5)和θi(i=1,2,…,5)稱為LSP系數(shù)。得到當(dāng)前幀LSP系數(shù)后,利用前一幀的LSP系數(shù)預(yù)測得到當(dāng)前幀的LSP殘差矢量,并將殘差矢量按照維度分別為3、3、4分為3個子矢量進(jìn)行量化,量化后的每個子矢量用8比特碼字表示,記為VQ1、VQ2、VQ3。
語音信號的基本組成單位為音素,根據(jù)音素可以將語音信號分為濁音和清音兩種。濁音又稱有聲語音,攜帶著語音中大部分的能量,在時域上具有明顯的周期性;清音類似于白噪聲,沒有明顯的周期性。語音信號是一個非平穩(wěn)信號,但在10 ms至30 ms內(nèi)語音信號是平穩(wěn)的,即短時平穩(wěn)性,因此,語音壓縮編碼之后,語音幀內(nèi)碼字取值具有一定的相關(guān)性。此外,語音信號局部存在周期性,如果不同幀語音信號正好對應(yīng)周期性重復(fù)的信號,那么這些相鄰幀間碼字取值也具有一定的相關(guān)性,因此由碼字VQ1、VQ2、VQ3的幀內(nèi)幀間取值關(guān)系可以構(gòu)建一個碼字時空轉(zhuǎn)移網(wǎng)絡(luò)(Codeword Spatiotemporal Transition Network, CSTN),如圖1所示。
CSTN是由三個碼字作為頂點(diǎn),幀內(nèi)幀間轉(zhuǎn)移關(guān)系作為邊的有向圖,記為D=〈V,E〉,其中V,E具體表示為:
(6)
其中:V表示有向圖D中頂點(diǎn)的集合,VQ1[m]、VQ2[m]、VQ3[m]分別表示第m幀的三個碼字;E表示D中邊的集合,由頂點(diǎn)v1指向頂點(diǎn)v2的有向邊,包含3種幀內(nèi)轉(zhuǎn)移邊和9種相鄰幀間轉(zhuǎn)移邊。當(dāng)表示幀內(nèi)轉(zhuǎn)移邊時,q-p=0;當(dāng)表示幀間轉(zhuǎn)移邊時,q-p=1。為了便于描述,將幀內(nèi)3條邊分別記為a、b、c,幀間9條邊分別記為d、e、f、g、h、i、j、k、l,如圖1所示。

圖1 碼字時空轉(zhuǎn)移網(wǎng)絡(luò)
圖1中的CSTN能夠描述語音中碼字轉(zhuǎn)移關(guān)系,然而該網(wǎng)絡(luò)的結(jié)構(gòu)較為復(fù)雜,且每條邊表示的轉(zhuǎn)移關(guān)系強(qiáng)弱不一樣,可以將轉(zhuǎn)移關(guān)系較弱的邊去掉。在CSTN中,每個頂點(diǎn)的取值范圍為[0,255],則由每條邊的兩個頂點(diǎn)v1和v2取值可生成一個255×255的轉(zhuǎn)移矩陣R,如式(7)所示:
(7)
其中,Pi, j(i,j=0,1,…,255)表示v1=i,v2=j的概率。在轉(zhuǎn)移矩陣R中,共有65 536種取值,這些取值直觀上并沒有明顯的特點(diǎn)。由語音信號具有一定周期性知,碼字間取值也具有一定的周期性。本文統(tǒng)計了12條邊對應(yīng)兩個頂點(diǎn)取值之差的概率,發(fā)現(xiàn)在差值為0時,同一碼字幀間邊的概率明顯高于其他邊;而差值為其他時,并沒有明顯的特點(diǎn)。因此,本文以兩個頂點(diǎn)間取值相同的概率作為CSTN中邊的轉(zhuǎn)移指數(shù),記為RE,用來衡量碼字間的轉(zhuǎn)移關(guān)系強(qiáng)弱程度,兩個頂點(diǎn)間取值相同的概率即為R對角線之和,則RE可表示為:
(8)
壓縮語音進(jìn)行QIM信息隱藏后,VQ1、VQ2、VQ3取值會發(fā)生變化,相應(yīng)的RE也會改變,將根據(jù)轉(zhuǎn)移指數(shù)對網(wǎng)絡(luò)進(jìn)行化簡,本文隨機(jī)選擇了3 000段語音樣本計算12條邊的轉(zhuǎn)移指數(shù),結(jié)果如圖2所示。
在圖2中,“Cover”和“Stego”分別表示未隱寫和使用NPP-QIM隱寫后的轉(zhuǎn)移指數(shù),隱寫使邊d、h、l的轉(zhuǎn)移指數(shù)明顯減弱,而其他邊的轉(zhuǎn)移指數(shù)變化不明顯,因此在化簡CSTN時只保留對隱寫敏感的三條邊d、h、l,化簡后的隱寫敏感碼字時空轉(zhuǎn)移網(wǎng)絡(luò)(Steganography-Sensitive Codeword Spatiotemporal Transition Network, SS-CSTN)如圖3所示。

圖2 碼字轉(zhuǎn)移指數(shù)

圖3 隱寫敏感碼字時空轉(zhuǎn)移網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)是一種概率圖模型,其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是一個有向無環(huán)圖,由網(wǎng)絡(luò)節(jié)點(diǎn)、有向邊和條件概率表(Condition Probability Table, CPT)組成。上述的SS-CSTN與貝葉斯網(wǎng)絡(luò)非常相近,可以利用SS-CSTN進(jìn)一步構(gòu)建碼字貝葉斯網(wǎng)絡(luò)(CBN)分類器進(jìn)行隱寫分析。
QIM隱寫算法以幀為單位進(jìn)行秘密信息嵌入,鑒于此,本文以幀為單位構(gòu)建貝葉斯網(wǎng)絡(luò)。QIM隱寫算法的直接影響是改變了VQ1、VQ2、VQ3的取值,由SS-CSTN知,不同碼字間取值相互獨(dú)立,同一碼字相鄰幀間取值不獨(dú)立,CBN構(gòu)建過程如下。
步驟1 以語音幀類別作為根節(jié)點(diǎn)C,有未隱寫(記為0)和隱寫(記為1)兩種。
步驟2 分別以VQ1、VQ2、VQ3的取值作為節(jié)點(diǎn)C的子節(jié)點(diǎn),構(gòu)成由C到VQ1、C到VQ2、C到VQ3的三條有向邊。
步驟3 分別以VQ1、VQ2、VQ3相鄰幀間取值關(guān)系作為節(jié)點(diǎn)VQ1、VQ2、VQ3的子節(jié)點(diǎn)S1、S2、S3,構(gòu)成由VQ1到S1、VQ2到S2、VQ3到S3的三條有向邊,有取值不同(記為0)和取值相同(記為1)兩種。由于S1、S2、S3的取值與語音幀類別有關(guān)系,因此將有向邊C到S1、C到S2、C到S3添加到貝葉斯網(wǎng)絡(luò)中。
最終所構(gòu)建的CBN如圖4所示,CBN為一個由7個節(jié)點(diǎn)組成的三層網(wǎng)絡(luò),其中第一層包含一個語音幀類別根節(jié)點(diǎn),第二層包含三個碼字節(jié)點(diǎn)VQ1、VQ2、VQ3且相互獨(dú)立,第三層包含三個碼字的幀間關(guān)系節(jié)點(diǎn)S1、S2、S3且相互獨(dú)立。

圖4 CBN碼字貝葉斯網(wǎng)絡(luò)
為了便于描述,圖4中的貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)C、VQ1、VQ2、VQ3、S1、S2、S3分別記為隨機(jī)變量X1、X2、X3、X4、X5、X6、X7,隨機(jī)變量的取值分別記為x1,x2,x3,x4,x5,x6,x7,其中x1,x5,x6,x7∈{0,1},x2,x3,x4∈{0,1,…,255},則網(wǎng)絡(luò)的聯(lián)合概率分布為:
(9)
其中:Pa(Xi)表示隨機(jī)變量Xi的父節(jié)點(diǎn);P(Xi|Pa(Xi))表示隨機(jī)變量Xi的條件概率。P(Xi|Pa(Xi))具體如式(10)所示:
(10)
記隨機(jī)變量Xi共有Ki個取值,θijk表示Xi取其第k個取值,Pa(Xi)取其第j個取值時的條件概率,則θijk可表示為:
θijk=P(Xi=xik|Pa(Xi)=Pa(Xi)j)
(11)
網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)實(shí)質(zhì)上是學(xué)習(xí)各個θijk的取值,貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)通常采用式(12)所示模式:
π(θ)+χ?π(θ|χ)
(12)
其中:π(θ)表示先驗(yàn)分布;χ表示樣本信息;π(θ|χ)表示后驗(yàn)分布,參數(shù)學(xué)習(xí)綜合了它的先驗(yàn)信息和樣本信息。在貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)中,先驗(yàn)分布一般選取共軛分布,即先驗(yàn)分布π(θ)和后驗(yàn)分布π(θ|χ)屬于同一類型分布,本文選用常用的Dirichlet分布作為先驗(yàn)分布,則:
π(θij)=Dir(αij1,αij2,…,αijKi)=
(13)
其中Γ(·)為gamma函數(shù)。設(shè)在樣本χ中滿足Xi=xik且Pa(Xi)=Pa(Xi)j的個數(shù)為βijk,由于后驗(yàn)分布π(θ|χ)也服從Dirichlet分布,則π(θ|χ)可表示為:
π(θij|χ)=Dir(αij1+βij1,αij2+βij2,…,αijKi+βijKi)=
(14)
網(wǎng)絡(luò)參數(shù)θ的最大后驗(yàn)估計為:
(15)
學(xué)習(xí)貝葉斯網(wǎng)絡(luò)參數(shù)后即得到每個節(jié)點(diǎn)處的CPT,在CBN中,節(jié)點(diǎn)C的CPT大小為2,VQ1、VQ2、VQ3的CPT大小均為2×256=512,S1、S2、S3的CPT大小均為2×256×2=1 024。由于條件概率表較大不能直觀顯示,因此本文以圖的形式展示部分節(jié)點(diǎn)在3 000個語音片段上的條件概率,VQ1、VQ2、VQ3在未隱寫和隱寫兩種條件下的概率分別如圖5(a)、5(b)、5(c)所示。

圖5 部分節(jié)點(diǎn)條件概率示意圖
圖5中,“Cover”和“Stego”分別表示在未隱寫條件下和隱寫條件下的概率,可以看出節(jié)點(diǎn)VQ1、VQ2、VQ3在兩種條件下的概率不同,且部分取值概率差異比較大,說明本文構(gòu)建的CBN能夠有效地反映隱寫前后條件概率的變化情況。
貝葉斯網(wǎng)絡(luò)構(gòu)建和CPT學(xué)習(xí)之后,本文采用自下而上的診斷推理對樣本進(jìn)行分類,即已知子節(jié)點(diǎn)參數(shù)分布,來計算父節(jié)點(diǎn)的概率。CBN推理過程為利用隨機(jī)變量X2、X3、X4、X5、X6、X7的取值及相應(yīng)的條件概率來計算語音幀是未隱寫和隱寫的后驗(yàn)概率,其推理公式為:
P(X1=x1|X2,X3,X4,X5,X6,X7)=
(16)
x1=0和x1=1分別表示語音幀在隨機(jī)變量Xi=xi(i=2,3,…,7)時為未隱寫幀和隱寫幀的后驗(yàn)概率。給定一段包含N幀的語音片段,由式(16)可以計算出每一幀為未隱寫幀和隱寫幀的概率,記第i幀為未隱寫幀的概率為pui,為隱寫幀的概率為psi,本文定義語音隱寫指數(shù)J為:

(17)
隱寫指數(shù)J表示了一段語音中所有幀未隱寫概率之和與隱寫概率之和的比值。圖6顯示了50段語音在不同嵌入率下的J值。

圖6 不同嵌入率下的隱寫指數(shù)
由圖6可知,語音進(jìn)行隱寫后隱寫指數(shù)J發(fā)生明顯變化,且嵌入率越大J值越小。本文通過設(shè)置閾值Jthr來判斷語音是否隱寫:當(dāng)J≥Jthr時,判定為未隱寫語音;當(dāng)J CNT(JS:Jsj (18) 其中:CNT(JU:Juj≥Jthr)和CNT(JS:Jsj 首先利用未隱寫和隱寫的語音訓(xùn)練網(wǎng)絡(luò)參數(shù),即學(xué)習(xí)CPT;然后利用CPT分別計算未隱寫訓(xùn)練樣本的隱寫指數(shù)集合JU和隱寫訓(xùn)練樣本的隱寫指數(shù)集合JS;接著從隱寫指數(shù)集合JU和集合JS的并集中找出一個元素作為區(qū)分隱寫樣本和未隱寫樣本的隱寫指數(shù)閾值Jthr,使得在訓(xùn)練樣本中準(zhǔn)確率最高;最后利用CPT和對未知類型的語音隱寫樣本進(jìn)行分類,以判斷其是否為隱寫樣本。 本文從互聯(lián)網(wǎng)上隨機(jī)搜索了10類語音片段組成語音樣本庫,包含了7類人類說話語音和3類樂器音,分別為中文男生、中文女生、英文男生、英文女生、法語、德語、日語、吉他樂、鋼琴樂、交響樂,每類人類說話語音由多個人的語音組成,每類數(shù)據(jù)集包含了1 000段語音,每段語音時長為10 s,采用單通道、8 kHz、16 b量化編碼為脈沖編碼調(diào)制(Pulse Code Modulation, PCM)格式,編碼方式采用G.723.1高速率6.3 kb/s,每類數(shù)據(jù)集按照3∶2的比例劃分為訓(xùn)練集和測試集。本文除了選用嵌入效率最高的NPP-QIM方法外,還選用對語音質(zhì)量影響最小的CNV-QIM方法作為隱寫方法,選用針對QIM隱寫方法進(jìn)行檢測的IDC方法和盲檢測方法DMFCC方法作為對比。本文將從嵌入率、語音時長和網(wǎng)絡(luò)參數(shù)復(fù)雜度三個方面對算法進(jìn)行性能分析。 對語音樣本進(jìn)行秘密信息嵌入時,為了提升安全性能和降低對語音質(zhì)量的影響,可以采用降低嵌入率的方式實(shí)現(xiàn)。本文針對5種嵌入率進(jìn)行了實(shí)驗(yàn),表1列出了3種隱寫檢測方法CBN、IDC和DMFCC在數(shù)據(jù)集中分別使用兩種隱寫方法CNV-QIM和NPP-QIM的檢測準(zhǔn)確率。 由表1知,隨著嵌入率的降低,3種隱寫檢測方法準(zhǔn)確率都會有所下降。當(dāng)嵌入率大于60%時,CBN方法和IDC方法對CNV-QIM隱寫方法都具有很高的檢測準(zhǔn)確率;當(dāng)嵌入率降低到20%時,IDC方法和DMFCC對CNV-QIM隱寫方法檢測準(zhǔn)確率均低于70%,而CBN方法仍有77.59%的檢測準(zhǔn)確率。在檢測NPP-QIM隱寫方法時,IDC方法和DMFCC方法在各種嵌入率下準(zhǔn)確率均低于70%,而CBN方法只有在嵌入率為20%時準(zhǔn)確率才低于70%,且其他嵌入率下檢測準(zhǔn)確率明顯高于IDC方法和DMFCC方法;在嵌入率為100%時,QIBM方法準(zhǔn)確率高達(dá)95.23%。 為了更全面地評估本文提出的隱寫檢測算法性能,本文還評估了語音片段的時間長度對隱寫檢測結(jié)果的影響。在5種時長下進(jìn)行了實(shí)驗(yàn),表2列出了3種隱寫檢測方法對兩種隱寫方法的檢測準(zhǔn)確率。 表2 不同時長下隱寫分析準(zhǔn)確率 % 由表2可知,CBN方法對CNV-QIM隱寫方法和NPP-QIM隱寫方法在不同時長下均具有很高的檢測準(zhǔn)確率,隨著語音時長變短準(zhǔn)確率略微下降。在檢測CNV-QIM隱寫方法時,CBN方法和IDC方法檢測準(zhǔn)確率都大于90%,DMFCC方法檢測準(zhǔn)確率低于70%;在檢測NPP-QIM隱寫方法時,CBN方法在各種時長下準(zhǔn)確率均具有明顯高于IDC方法和DMFCC方法,在語音時長為2 s時,CBN方法對NPP-QIM隱寫方法仍具有85.21%的檢測準(zhǔn)確率,而IDC方法和DMFCC方法準(zhǔn)確率均低于60%。 由前文分析知,CBN中隨機(jī)變量X1的CPT大小為2,X2、X3、X4的CPT大小為512,X5、X6、X7的CPT大小為1 024,X2、X3、X4、X5、X6、X7的CPT大小直接由X2、X3、X4的取值個數(shù)決定。在CBN中,隨機(jī)變量X2、X3、X4的取值分別對應(yīng)VQ1、VQ2、VQ3的取值。為了減小CPT的存儲空間,可以使隨機(jī)變量X2、X3、X4的取值分別對應(yīng)VQ1、VQ2、VQ3的多個取值,即將VQ1、VQ2、VQ3的取值劃分為多個區(qū)間,每個區(qū)間對應(yīng)X2、X3、X4的一個取值。本文定義網(wǎng)絡(luò)參數(shù)復(fù)雜度為VQ1、VQ2、VQ3的區(qū)間劃分個數(shù),記為Rn,且每個區(qū)間取值個數(shù)相同,為256/Rn,則X2、X3、X4的CPT大小為2Rn,X5、X6、X7的CPT大小為4Rn。區(qū)間劃分過程為:首先統(tǒng)計原始載體樣本中VQ1、VQ2、VQ3取值直方圖;然后將直方圖中的取值按從大到小降序排列,最后將排序后的取值化為Rn個區(qū)間,在本實(shí)驗(yàn)中,Rn={4,8,16,32,64,128,256}。不同網(wǎng)絡(luò)參數(shù)復(fù)雜度的隱寫檢測準(zhǔn)確率如圖8所示。 圖8 不同網(wǎng)絡(luò)參數(shù)復(fù)雜度下的檢測準(zhǔn)確率 為了比較本文檢測方法在不同網(wǎng)絡(luò)參數(shù)復(fù)雜度與現(xiàn)有的IDC方法和DMFCC方法的檢測性能,圖8中以IDC-CNV和IDC-NPP分別表示使用IDC方法對CNV-QIM隱寫方法和NPP-QIM隱寫方法的檢測準(zhǔn)確率,DMFCC-CNV和DMFCC-NPP分別表示使用DMFCC方法對CNV-QIM隱寫方法和NPP-QIM隱寫方法的檢測準(zhǔn)確率。由圖8可知,CBN方法的隱寫檢測準(zhǔn)確率隨著網(wǎng)絡(luò)參數(shù)復(fù)雜度增大而變高,這是因?yàn)榫W(wǎng)絡(luò)參數(shù)越復(fù)雜,網(wǎng)絡(luò)越能反映隱寫前后條件概率的變化。當(dāng)網(wǎng)絡(luò)參數(shù)復(fù)雜度等于8時,檢測CNV-QIM隱寫方法準(zhǔn)確率大于85%;當(dāng)網(wǎng)絡(luò)參數(shù)復(fù)雜度等于64時,檢測NPP-QIM隱寫方法準(zhǔn)確率大于85%。在檢測CNV-QIM隱寫方法和NPP-QIM隱寫方法時,IDC方法檢測準(zhǔn)確率和CBN方法分別在網(wǎng)絡(luò)參數(shù)復(fù)雜度為64和16時相當(dāng),CBN方法在每種網(wǎng)絡(luò)參數(shù)復(fù)雜度下均比DMFCC方法檢測準(zhǔn)確率高。 由于網(wǎng)絡(luò)參數(shù)復(fù)雜度只對CPT有影響,檢測時只需查詢CPT,因此網(wǎng)絡(luò)參數(shù)復(fù)雜度對檢測時間基本沒有影響。本文在Inter i7- 4700MQ@ 2.4 GHz、8 GB內(nèi)存的Windows 7系統(tǒng)上使用Microsoft Visual Studio 2010進(jìn)行了檢測時間測試,本文提出的CBN方法檢測一段10 s長的語音平均時間為21 ms,可以達(dá)到實(shí)時檢測的效果。 以上的實(shí)驗(yàn)結(jié)果和分析表明本文提出的CBN方法對QIM隱寫算法具有良好的檢測性能,比IDC方法和DMFCC方法在不同嵌入率下和不同時長下都有更高的檢測準(zhǔn)確率。 針對現(xiàn)有隱寫分析方法對NPP-QIM隱寫方法檢測準(zhǔn)確率不高的問題,本文提出了一種基于貝葉斯網(wǎng)絡(luò)的QIM信息隱藏檢測方法,從時空兩個角度分析了壓縮語音碼字轉(zhuǎn)移關(guān)系,并基于隱寫敏感碼字時空轉(zhuǎn)移網(wǎng)絡(luò)構(gòu)建了碼字貝葉斯網(wǎng)絡(luò),結(jié)合大量樣本學(xué)習(xí)網(wǎng)絡(luò)參數(shù)和訓(xùn)練隱寫指數(shù)閾值,實(shí)現(xiàn)隱寫檢測分類。在不同嵌入率、不同語音時長和不同網(wǎng)絡(luò)參數(shù)復(fù)雜度條件下的多組實(shí)驗(yàn)結(jié)果表明,本文提出的CBN方法能夠有效地檢測QIM信息隱藏,特別是在檢測NPP-QIM時準(zhǔn)確率有了明顯的提升,在網(wǎng)絡(luò)參數(shù)復(fù)雜度較低時,仍然具有較高的檢測準(zhǔn)確率;同時CBN方法檢測所用時間很少,實(shí)現(xiàn)了對QIM信息隱藏的實(shí)時檢測。此外,本文方法的思想可用于檢測其他語言編碼器中的QIM信息隱藏方法,如SILK、iLBC和G.729等。在接下來的工作中,將進(jìn)一步研究貝葉斯網(wǎng)絡(luò)在其他類型的壓縮語音信息隱藏檢測方法中的應(yīng)用。
4 實(shí)驗(yàn)結(jié)果與分析
4.1 不同嵌入率下的檢測性能分析
4.2 不同時長下的檢測性能分析

4.3 網(wǎng)絡(luò)參數(shù)復(fù)雜度性能分析

5 結(jié)語