魏程程 西安工業大學
隱寫術作為信息隱藏的一個重要分支,現已成為信息安全領域的重要研究內容之一,與密碼學的不同之處在于,隱寫術是把特定的秘密信息隱藏在某個公開的信息(載體信號)里,其中嵌入的秘密信息既不會改變載體信號的視聽覺效果,同時也不會改變載體文件的格式和大小,外觀的表現仍舊是載體信號(公開信息)的內容和特征,有公開的信息作掩護,因此第三方不會覺察出秘密信息的存在,從而實現了隱蔽通信。現實生活中有很多不同的數字載體(圖像,視頻,音頻等)供隱寫術使用,其中最廣泛使用的是數字圖像。隱寫術既可以滿足合法的利益也可能被人們濫用,例如,公眾可以利用其來保護隱私,也可以保障政治、軍事、經濟等重要信息在公共傳輸過程中的安全性和可靠性,而恐怖分子可能用它來在互聯網上傳播恐怖主義的信息,從而隱寫術也成為了犯罪分子進行非法活動的工具和手段。
隨著互聯網的廣泛使用以及日漸發展成熟的信息隱藏技術,大量的隱寫方法如雨后春筍般冒出,用戶通過互聯網可以輕松便捷地獲取多種隱寫工具,其操作簡單,容易上手。如果對這些工具加以濫用,便會對網絡信息安全產生嚴重的威脅 ,因此我們對反隱寫技術的需求在不斷增加。隱寫分析是一項反隱寫術的技術,它具有重要的現實意義, 近年來,正成為信息安全領域一個新的研究熱點。
現有的隱寫分析方法,根據基本原理的不同可以分為三類:感官分析法、基于標識特征分析法和基于統計特征分析法。其中統計特征分析法是隱寫分析領域中大多采用的方法,它是將載體圖像的某一個或多個統計量的理論期望頻率分布和待檢測的隱密圖像分布進行比較,找出兩者的差異,從而設計算法實現兩者的分類。
統計特征分析法根據檢測目標的不同可以分為兩類:特定隱寫分析法和通用盲檢測法。
一般來說,針對性的隱寫分析方法試圖在已知隱寫算法的前提下,判斷待檢測對象是否含有隱秘信息,其檢測性能和可靠性較高,但是靈活性和可擴展性較差。空域的隱寫分析中,針對LSB替換隱寫方法,早期典型的方法是由Westfeld等人提出的基于卡方統計的方法;Fridrich在文獻中提出了基于RS的檢測方法;Dumitrescus等人提出的SPA(Sample Pair Analysis)方法;張濤提出的基于DIH(Differential Image Histogram)的算法。變換域的隱寫分析主要是檢測針對DCT域的信息隱藏,張濤等人提出的快速卡方檢驗法,能夠有效地估計順序JSteg隱寫和隨機JSteg隱寫的信息嵌入比率。
通用的隱寫分析方法也稱為盲檢測方法,就是在隱寫方法未知而只有檢測對象的情況下,對其中是否隱藏秘密信息進行檢測判斷。盡管通用的隱寫分析方法的檢測率并不十分令人滿意,但由于它不需要嵌入操作的先驗知識,因此具有更好的實用價值。典型的通用盲隱寫分析方法有,Avcibas提出的基于圖像質量度量(Image Quality Metrics, IQM)法。Shi YunQ提出了針對擴展頻域隱寫和LSB隱寫的盲檢測方法。
通過對現存的大量隱寫分析算法的研究,發現很多現有算法存在一些負面的問題,例如較低的檢測精度,盡管一些新興的算法具有令人滿意的檢測精度,但是由于高維數的特征向量導致其檢測效率并不令人滿意。因此,本文的工作重點集中在以下兩個方面:一方面致力于提高算法的檢測精度,另一方面試圖減少特征向量的維數以避免“維數災難”,提高算法的效率。
由于共生矩陣能夠有效地描述特定像素對之間聯合概率發生的相關度量,因此可以被用來描述圖像隱寫前后所引起的統計特征的變化。根據這種思想,Abolghasemi等人提出一個基于共生矩陣的LSB隱寫分析方法,在他們的方法中,作者認為自然圖像的相鄰像素之間通常具有很高的相關性,圖像的共生矩陣是趨于對角分布的,然而,在數據嵌入后,由于相鄰像素間的高相關性減弱,導致沿著共生矩陣主對角線方向的高密集分布模式擴散開來。基于這一原理,作者選擇了共生矩陣主對角線上的元素,以及部分次對角線的元素作為特征,使用支持向量機作為分類器進行分類。
文章提出了另外一個基于共生矩陣的LSB隱寫分析算法,在文中,作者計算了水平和垂直差分圖像的共生矩陣,然后提取共生矩陣上三角的180維特征向量,用支持向量機作為分類器進行分類。
在本文中,我們針對“維數災難”以及檢測精度低等問題,利用共生矩陣的性質,提出了一種針對LSB替換攻擊的隱寫分析方法。在我們的方法中,利用了圖像的位平面之間的相關性,在秘密信息嵌入后,這種相關性遭到破壞。據此,我們將灰度圖像分解成8個位平面,分別計算最低位平面與其余七個位平面間的差分矩陣,然后計算差分矩陣的和矩陣,生成和矩陣的共生矩陣,通過研究分析共生矩陣的特性,從中提取統計顯著性特征,使用支持向量機作為分類器來區分載體圖像和隱密圖像。
我們的方法可以分成三個階段:圖像預處理,特征提取和分類。其框架如圖1所示。

圖1 提出算法的框架圖
在我們的方法中,從圖像的位平面間的相關性入手,將灰度圖像分解成8個位平面,然后我們計算位平面的差分矩陣,最后將差分矩陣求和得到一個和矩陣,利用和矩陣的共生矩陣來描述位平面間的相關性,然后利用這種相關性來建立統計顯著性特征。方法的具體步驟描述如下:
對于灰度圖像I,位平面分解可以被公式化如下:

考慮到圖像的位平面間必然存在一定的相關性,我們分別計算了最低位平面與其余七個位平面的差分矩陣,然后我們定義了差分矩陣的和矩陣。由于每個位平面矩陣中的元素值只有0或1兩種,所以差分矩陣中的元素值為-1,0,1。為了更好地描述位平面間的相關性,在差分矩陣加和時,避免-1和1正負抵消的情況是十分必要的。因此,先對每個差分矩陣中的元素進行絕對值操作后再加和,生成和矩陣。方法的具體步驟描述如下:


差分矩陣的和矩陣:

計算共生矩陣:

這里, 當且僅當其后面括號的式子成立。
在我們的方案中,共生矩陣的參數選擇如下,共生矩陣的偏移參數Δx設置為1,Δy設置為0,也就是說,在計算共生矩陣時只考慮水平方向相鄰的元素。我們生成的共生矩陣是非對稱矩陣。
圖2為按照我們的方案中設置偏移量以及矩陣是否對稱,計算一個矩陣的共生矩陣的示例圖:

圖2 矩陣I及其共生矩陣
下面計算MD的共生矩陣G,得到一個8×8的矩陣:

特征提取:
根據圖像相鄰像素間的相關性以及和矩陣的分布特性,G中元素的分布模式是趨于集中分布的,也就是說,中間區域的值比邊緣區域的值大,可以將中間區域的值看作是圖像的主要信息,在隱寫前后圖像本質發生微小變化,圖像的主要信息也隨之會發生變化,進而可以作為統計顯著性特征。也就是說,在秘密信息嵌入到最低位平面后,最低位平面和其余七個位平面之間的相關性發生改變,這種變化可以通過G的中間區域的值來描述。因此,在我們的工作中,我們選擇G的中間區域的16個元素作為特征向量,
如圖3所示:

圖3 特征選擇示意圖
為了說明特征向量f對數據嵌入是敏感的,我們分別測試了1600張載體圖像和1600張隱密圖像,圖4顯示了用上述方法生成其共生矩陣G的統計平均值的分布模式。

圖4 共生矩陣G的統計平均值的分布模式
圖4左圖表示1600張載體圖像分別用上述方法生成共生矩陣G的統計平均值的分布模式,右圖表示1600張隱密圖像分別用上述方法生成共生矩陣G的統計平均值的分布模式。從圖中可以看出,載體圖像和隱密圖像對應的共生矩陣G中間區域的元素是顯著的,并且在數據嵌入前后,中間區域元素的值發生改變。
如果秘密信息嵌入到圖像的最低位平面,位平面之間的相關性將發生改變,這種改變將表現在共生矩陣G上,同時可以作為證據來證明圖像中是否隱藏秘密信息。
我們定義了特征向量f作為分類特征,使用LS-SVM作為分類器來區分載體圖像和隱密圖像,這里選擇徑向基函數(RBF)作為核函數。
實驗中使用的圖像來自http: //www.freefoto.com,哥倫比亞圖像庫和UCID圖像庫。這些測試的圖像包含了不同的明暗度,紋理和細節,如圖5所示:

圖5 測試圖像示例
我們利用它們生成不同嵌入率的隱密圖像以評估提出的方法,樣本集的建立如下:
首先,1600張測試圖像(大小為256×256)被轉化成位圖格式的灰度圖像,生成載體圖像樣本集,定義為IC。
其次,我們在載體圖像的最低位平面嵌入秘密信息生成隱密圖像,嵌入率的大小分別是12%,25%和50%,然后我們得到三個隱密圖像樣本集,定義為IS-1,IS-2和IS-3。
為了定量地分析提出方法的檢測精度,我們公式化定義了假陽性率和假陰性率,內容如下:

為了驗證提出的方法同現有的基于共生矩陣的方法相比,在檢測精度上的優越性,我們設計了比較實驗,實驗在不同嵌入率12%,25%,50%的情況下統計了真陰性率PTN=1-PFP和真陽性率PTP=1-PFN,結果在表1中列出。表1中,PT= (PTN+PTP)/2。
我們從IC中隨機選取400張載體圖像,從IS-1中隨機選取400張隱密圖像作為訓練樣本,然后從IC-{已選取過的400張載體圖像}中隨機選取200張載體圖像作為測試樣本,使用LS-SVM進行分類,得到假陽性率PFP。我們重復這個過程10次,統計實驗結果的平均值作為最終的PFP,表1中顯示的是其對應的真陰性率PTN=1-PFP。對于嵌入率為25%和50%的隱秘圖像,測試過程和上述提到的相同,所有的測試結果都被顯示在表1中。
我們從IC中隨機選取400張載體圖像,從IS-1中隨機選取400張隱密圖像作為訓練樣本,然后從IS-1-{已選取過的400張隱密圖像}中隨機選取200張隱密圖像作為測試樣本,使用同測試PFP一樣的方法得到假陰性率PFN,在表3-1中顯示其對應的真陽性率PTP=1-PFN。

表1 檢測率的比較結果
從表1中可以看出,與方法【3】和【4】相比,我們的方法的真陰性率和真陽性率是令人滿意的。
本文提出了一種新的基于共生矩陣的LSB替換隱寫分析方法,提出的方法利用了圖像位平面間相關性的知識,通過從共生矩陣中提取特征,減少了特征向量的維數,進而有效地避免了“維數災難”,并達到了預期的效果,該算法具有令人滿意的檢測率。