唐洪瓊 張英男 王澤宇
(中國人民武裝警察部隊工程大學 密碼工程學院,陜西 西安710000)
信息隱藏技術是一種利用載體對象的冗余性,將秘密信息嵌入到載體對象得到載密對象的技術,是對傳統加密技術的重要補充,可以在公開信到進行秘密信息的傳遞而不引起第三方的懷疑和察覺,被廣泛用于隱蔽通信和版權保護等。但隱寫技術容易被犯罪集團和恐怖組織非法使用,對國家安全構成嚴重的威脅。隱寫分析技術作為信息隱藏技術的反制手段,是一種檢測載體對象是否存在隱寫痕跡的技術,對監管部門的有效監管提供了一種技術手段,對網絡和信息安全起著至關重要的作用[1]。
網絡中傳輸的視頻一般是經過壓縮后傳輸的,目前視頻隱寫大多基于壓縮視頻進行展開。壓縮視頻可以為視頻隱寫提供多種嵌入域:幀內預測模式,幀間預測模式,量化參數,變換系數,運動矢量以及熵編碼等。豐富的嵌入域雖然給視頻隱寫提供了充足的嵌入場景,但是給視頻隱寫分析帶來了前所未有的挑戰,因此視頻隱寫分析技術發展緩慢,而且目前的視頻隱寫檢測特征僅針對單一嵌入域進行構造,尚缺乏能有效檢測多嵌入域隱寫的檢測特征。相比于圖像隱寫分析,視頻隱寫分析更加復雜,缺乏理論性的指導,基于單一嵌入域的隱寫分析方法在實際檢測中不具備較強的魯棒性,檢測結果不穩定、不可靠[1]。
目前針對基于運動矢量的視頻隱寫隱藏研究文獻最多,對應的隱寫分析方法也較多。本文研究將對這類隱寫分析特征進行融合,而后使用融合特征進行集成分類器訓練,最后根據子分類器結果進行等權重多數投票綜合決策,提高隱寫檢測的準確率。
如圖1 所示,給出了本文方法的原理框圖。主要包括特征提取、特征融合、特征分類以及分類決策四個部分。
本文使用兩種針對基于運動矢量的視頻隱寫方法的隱寫檢測特征。第一種是基于運動矢量局部最優性判定的分析特征[2],記作f1,能夠有效檢測基于運動矢量域的視頻隱寫算法,但是也具有一定的局限性[1]。第二種是基于運動矢量相關性判定的分析特征[3],記作f2,具有良好的敏感度和分析性能。本文將兩種特征f1和f2進行拼接,融合成新的特征,記作x=[f1,f2],特征維度表示為d。

圖1 本文方法的原理框圖
如圖1 所示,集成分類器有L 個子分類器共同構成,子分類器記作Bl,l=1,…,L,其輸出結果為0 或1,分別代表判定結果為正常視頻和隱寫視頻。本文使用Fisher 分類器作為子分類器,Fisher 分類器是一種線性分類判別器,具有較低的復雜度,其訓練過程的最耗時的操作主要是類內協方差矩陣的計算并求逆,另外,Fisher 分類器具有不穩定性,可以增加判別器的多樣性,提高集成分類器性能。Fisher 線性分類器的廣義特征向量υl可通過正負樣本類計算,如式(1)。

其中μ、μ 為正樣本類和負樣本類的均值,SW為類內散度矩陣,I 為單位矩陣,λ 為穩定參數,可避免實際計算中的數值不穩定。

本文實驗使用34 段352×288 的視頻,以壓縮率為1000 Kb/s 進行壓縮得到正常壓縮視頻。實現文獻[5]的隱寫算法,并以嵌入率為0.2 對視頻隱寫得到隱寫視頻。得到正常視頻和隱寫視頻后,使用文獻[2]和文獻[3]的隱寫特征提取器,對正常視頻和隱寫視頻提取特征f1和f2。對特征f1和f2按前文的融合方法進行融合,得到本文的融合特征。最后,在Matlab 下對樣本進行訓練和測試,訓練和測試樣本各占50%。
視頻隱寫檢測本質上是屬于二分類檢測問題,因此本文使用檢測錯誤率TL進行衡量,定義如式(3):

其中,PFA、PMD分別代表虛警率和漏檢率。每個子分類器的判別閾值PE取值為使得(3)式取值最小的閾值。
為了對模型訓練過程進行定性評價,本文對訓練過程中的預測誤差進行了無偏估計,使用“袋外數據(out-of-bag)”估計,定義為式(4):

其中,n 代表子分類器數量,M為訓練集大小。
除此之外,使用檢測模型的接受者操作特征(ROC)曲線來定性衡量其檢測能力,ROC 曲線下方面積(AUC)用來定量衡量其檢測能力。
根據特征f1、f2和本文的融合特征x 進行檢測模型訓練的結果如圖1 所示,可以看出,在訓練過程中,隨著子分類器數量的增加,相比于單一特征訓練,本文融合特征的預測誤差收斂值更小。相同子分類器下,本文方法誤差更小。

圖2 模型訓練
在測試集上進行檢測模型的測試,得到如圖2 所示的ROC曲線,結果表明,本文方法相比于文獻[2]和文獻[3],ROC 曲線偏離隨機猜測曲線(對角的虛線)程度更大,因此,本文使用融合特征訓練的模型,其檢測效果好于任何單一特征訓練的檢測模型。

圖3 檢測模型ROC 曲線
表1 給出了三種檢測方法的相關實驗結果,雖然融合特征的維度高于單一特征,但其子分類器使用的特征維度卻并未增加,反而明顯降低,因此,模型訓練時間更短,盡管子分類器數量有所增加。AUC 和PE對比結果表明,使用融合特征進行檢測模型訓練,相比于單一特征訓練的檢測模型,檢測效果有明顯的提升,本文方法具有明顯改進。

表1 檢測模型實驗結果
本文提出的基于多特征融合的視頻隱寫分析方法,實驗結果表明,相比于單一特征訓練的檢測模型,準確率有明顯提升,模型訓練更快。本文提供了一種有效解決隱寫檢測準確率不高現狀的思路,對視頻隱寫分析具有一定的參考價值。后續的,我們將嘗試將不同嵌入域的多種特征融合以得到一種通用性的視頻隱寫檢測方法。