陳 升,李 智
貴州大學 計算機科學與技術學院,貴陽 550025
圖像隱寫術是通信和隱私保護中利用圖像載體進行隱秘通信和保障安全的技術,通常是在圖像空域中對像素值進行修改,進而完成對信息的隱藏,早期的非內容自適應隱寫算法,比如最低有效位替換算法(least significant bit,LSB),不針對載體內容,將嵌入的0、1 bit流對載體圖像像素的最低比特位進行替換。目前,隱寫術的研究熱點是內容自適應隱寫術,內容自適應的圖像隱寫術是將隱藏信息嵌入在內容較為復雜的區域,這些區域很難被人眼所察覺,常見的自適應隱寫術有HUGO[1]、WOW[2]、S-UNIWARD[3]。隱寫分析是應對隱寫術所產生的安全問題并與之對抗的技術,目前研究的熱點是內容自適應隱寫算法的被動隱寫分析,即判斷圖像是否經過隱寫。
在傳統的被動隱寫分析研究中,主要有基于手工構造特征的方案,常見的空域隱寫分析方法有基于構造臨近像素差異矩陣的SPAM[4]、基于構造高維共生矩陣的富模型SRM[5],以及通過估計待測圖像的修改概率圖,為殘差特征分配不同權重,在富模型基礎上改進后的tSRM[6]、maxSRM[7]等。隨著深度學習的發展,利用卷積神經網絡(CNN)完成隱寫分析任務得以實現,Tang等[8]在2014年首次利用CNN進行隱寫分析,有了初始化預處理層卷積核參數的思想,提出一種簡稱TanNet的網絡,性能優于基于手工構造特征的SPAM次于SRM。2015年Qian等[9]提出的隱寫分析網絡GNCNN中,利用固定KV核進行預處理第一層卷積核,卷積層使用高斯激活函數代替ReLU、Sigmoid,實現了與SRM相當的隱寫檢測性能。Xu等[10]在2016年在網絡中引入批歸一化(BN),全局平均池化和絕對值激活函數,提出簡稱XuNet的隱寫分析網絡,首次超過SRM的隱寫檢測性能。2017年Ye等[11]利用SRM中的30個高通濾波器對網絡的第一層卷積核的參數初始化,自定義一種稱為截止線性單元的激活函數,結合傳統隱寫分析的思想,在深度學習中引入選擇通道,提升了對隱寫嵌入的檢測。2018年,Boroumand等人提出SRNet[12],該模型整體由四部分不同作用的卷積層模塊組成,有效地利用BN層和殘差網絡,并且加入通道選擇,提高了模型對隱寫算法的檢測準確率。
被動隱寫分析技術,也是目前隱寫分析研究的熱點,在這一目標并不能對隱匿的信息采取進一步主動的措施,于是許多學者對進一步的隱寫負載定位展開研究,隱寫定位的研究既可判斷圖像是否經過隱寫,也為進一步隱寫信息的提取提供了條件。
在隱寫術負載定位研究中,文獻[13]中,通過分析圖像色調直方圖變化來定位連續嵌入的空域彩色圖負載。2008年Ker等[14]對載體進行線性濾波處理后計算像素平均殘差,成功定位出非內容自適應隱寫算法LSB的隱寫像素。2012年,Quach等[15]基于像素頻數構造權重表,定位出了組奇偶(group-parity)隱寫術的隱寫像素位置。2019年,Sun等[16]利用深度神經網絡,提出了用于定位LSB matching隱寫術[17]的有效負載像素的網絡模型,該網絡通過提取像素的臨近像素差異特征來區分像素和隱寫像素,臨近像素差異特征就是提取紋理區域的特征,而紋理區域中同時包含未經嵌入和經嵌入的像素,致使該方法容易將圖像中紋理區域中未經嵌入的像素混淆造成誤報,該方法中將紋理區域的像素視為無效像素,而內容自適應隱寫術就是對視覺掩蔽效果較好紋理復雜的區域進行嵌入,無視掉紋理區域的像素該方法便對內容自適應隱寫術失效。然而目前,針對內容自適應隱寫術負載定位的研究近乎空白,僅查閱到一篇學位論文[18],該文獻的思想是從嵌入者的思路來預測隱寫后的隱寫像素的位置,用較低嵌入率的隱寫圖像預測二次嵌入的位置,一旦嵌入時的策略不再針對具體區域(傾向紋理區域),或者隨機嵌入至平滑區域,該方法便已失效。
本文針對目前隱寫分析往往只能判別載體圖像中是否存在隱密信息,并不能對隱密信息的具體位置進行標識,為進一步增強隱寫分析的實用性,將隱寫分析的研究目標拓展為自適應隱寫術和非自適應隱寫術LSB matching的負載像素定位,提出一種端到端的圖像隱寫定位網絡PSL_NET,在輸入端輸入一張圖像,輸出端預測得到圖像的負載像素位。基于預測載體圖像每位像素的隱寫概率,最終定位出圖像的隱寫像素。研究的工作中包含以下內容:
(1)利用傳統隱寫分析方法富模型中的30個線性的SRM高通濾波器初始化網絡第一層卷積核的參數,提取出圖像的殘噪圖像,突出局部異常像素。
(2)本文利用深度殘差網絡[19]來提取隱寫特征,通過引入殘差模塊有效緩解網絡模型訓練時反向傳播的梯度消失問題,進而解決深度網絡難以訓練和性能退化的問題。
(3)基于逐像素概率預測來對圖像每位像素進行分析,利用標記出隱寫像素實際位置的掩碼圖像進行有監督地學習,增強網絡對局部隱寫像素的感知能力,無區別對待平滑或者紋理區域的像素,逐一預測圖像每位像素是真實位或是隱寫位的概率。
(4)從目標函數角度解決正負樣本的不均衡問題,訓練時通過使用Focal loss[20]對比使用交叉熵損失提升對負樣本的學習權重,在測試時用于提升檢測精度。
嵌入的隱寫信息對于圖像就像是在圖像上疊加了微弱的噪聲,但這個噪聲改變了圖像像素之間存在的相關性。這些噪聲信號相對載體圖像的內容極其微弱,人眼視覺無法分辨,通常網絡中采用預處理層計算圖像的殘噪圖像,排除圖像內容對隱寫信號的干擾。對于載體圖像X,像素位xij的空間坐標為(i,j),其對應的殘差圖像R中的像素為rij,rij的計算如公式(1):

N(xij)表示像素xij相鄰像素的集合,Pre(?)函數根據相鄰像素集合得到像素的預測值,其對應的殘差圖像的像素值rij,可根據真實像素值與預測像素值的差值得到。
實際計算中,圖像X的殘噪圖像R,由圖像X經預設的濾波K處理后得到,其中*表示卷積操作,如公式(2)所示:

傳統隱寫分析研究中有大量可選的濾波器,其中包括線性和非線性的濾波器,不同的卷積核能夠計算出不同的殘噪圖像。本文中利用富模型SRM中的30個線性的高通濾波器初始化第一層卷積核的參數,這30個濾波器中包含:8個“1st”類、4個“2nd”類、8個“3rd”類、1個“Square3×3”、4個“Edge3×3”、1個“Square5×5”、4個“Edge5×5”。用這30個濾波器的參數初始化5×5卷積核的參數取代隨機產生的參數,提取出圖像的殘噪圖像。
在卷積神經網絡中,網絡結構越深非線性表達能力越好,但當模型效果趨于飽和時,加深網絡不再發揮優勢,甚至出現退化問題。研究學者提出殘差網絡解決這一問題,殘差網絡相比卷積神經網絡,通過在網絡中引入殘差模塊,該模塊在不同層之間加入捷徑連接得以實現。例如第l層的特征圖xl添加一條跳轉連接(shortcut),跳轉連接至第l+1層,兩個緊鄰層之間的殘差模塊求取的映射表示如公式(3)所示:

xl+1表示第l+1層的預測值,xl表示輸入,F(x,{wl})表示殘差映射。殘差學習單元由殘差學習分支和輸入的恒等映射分支組成。殘差模塊結構如圖1所示。殘差模塊的加入有效地緩解了網絡模型訓練時反向傳播的梯度消失問題,進而解決了深度網絡難以訓練和性能退化的問題。

圖1 殘差模塊Fig.1 Residual module
在PSL_NET中,利用深度殘差網絡來提取隱寫特征,通道加深網絡來學習更為抽象、高級的特征,利用殘差模塊的跳轉連接匯集上下層特征,增強模型的非線性表達能力。
在判斷圖像x是否經過隱寫的被動隱寫分析任務中,網絡的末端壓縮得到二維特征經激活函數Softmax處理得到的二維概率,分別代表圖像是真實圖像和隱寫圖像的概率,概率表達式如公式(4),公式中y表示圖像x的預測值,可以等于0或者1,分別表示預測出圖像x是真實圖像和隱寫圖像,P(y)表示預測概率值;y?表示圖像x的實際值,可以等于0或者1,0表示真實圖像,1表示隱寫圖像。

求取概率的極大似然估計如公式(5)所示,通過最大化極大似然估計得到預測概率的最大值,表達式的最大值只需求解表達式負值的最小值得到,即最小化交叉熵損失,損失函數如公式(6)所示:

在本文中,逐一預測圖像x每位像素xij是真實和經隱寫的概率,預測概率的表達式如公式(7)所示,公式中yij表示像素xij的預測值,可以等于0或者1,分別表示預測出像素xij是真實像素或者隱寫像素,P(yij)表示預測概率值;yij表示像素xij的實際值,可以等于0或者1,0表示真實像素,1表示隱寫像素。

像素預測概率的極大似然估計如公式(8)所示,同樣通過最大化極大似然估計得到預測概率的最大值,即通過最小化求取的交叉熵損失,圖像x每位像素的預測損失的平均值如公式(9)所示,其中h、w分別表示圖像x的高度和寬度:

本文的定位網絡中在訓練時,輸入端輸入一張載體圖像、隱寫圖像,讓網絡學習隱寫像素對隱寫前后局部統計特性的改變來判定圖像的真實像素和隱寫像素,而載體圖像中像素位均為正樣本,隱寫圖像中的經隱寫像素為負樣本,未經隱寫位同樣為正樣本,這使得正負樣本出現不均衡問題,因此樣本不均衡問題也是本文研究的內容,學術界中有通過自定義優化的目標函數來解決這一問題,本文的任務重點學習負樣本特征,文獻[20]中的Focal loss用于提升困難樣本的權重,本文的實驗中同時使用Focal loss對比交叉熵損失,提升網絡對負樣本的學習,Focal loss如公式(10)所示,公式中γ為調節系數,通過調節參數γ調節正負樣本的比例,γ大于1時,網絡中負樣本的學習權重增加。

本文提出隱寫定位網絡PSL_NET,網絡模型如圖2所示。網絡由預處理層、深度殘差層、像素預測層組成。預處理層中,采用SRM高通濾波器提取出包含多階隱寫信號的殘噪圖像;深度殘差層中,利用殘差結構的跳轉連接匯集上下層的特征得到組合的特征,增強模型的特征表達能力;像素預測層中,利用標記出隱寫像素實際位置的掩碼圖像進行有監督地學習,加強網絡對局部隱寫像素的感知能力,無區別對待平滑和紋理區域的像素,逐一預測圖像每位像素位是真實像素或是隱寫像素的概率。
預處理層用于提取圖像的殘噪圖像,本文中利用富模型SRM中的30個SRM高通濾波器初始化網絡的第一層卷積核的參數,并伴隨網絡自動化學習,第一層卷積核大小為5×5,padding設置為2,對于1×256×256大小的載體圖像,提取的殘噪圖像大小保持不變,預處理層的高通濾波器充分抑制圖像的內容,捕獲出水平、垂直、不同對角線的領域像素的殘噪信息,提取出包含多階隱寫信號的殘噪圖像,殘噪圖像中凸出局部范圍的異常像素。
經預處理層提取的殘噪圖像,以殘差網絡為主進行隱寫特征的提取,利用殘差網絡保證加深網絡時非線性表達能力更好,同時避免隨著網絡的加深而出現退化的問題,殘差模塊中采用3×3卷積對領域范圍內的隱寫特征進行建模。
本文的深度殘差層中包含13個Group,如圖2中所示,Group1~Group2采用30×3×3大小的卷積核,其中padding等于1,在卷積核之后添加批處理BN層,將分布拉到對梯度更為敏感的正太分布,而Group3~Group13中均采用殘差模塊,每個Group采用兩次30×3×3卷積層和BN層進行隱寫特征的提取,深度殘差層中利用殘差結構的跳轉連接匯集上下層的特征得到組合的特征,增強模型的特征表達能力,不同Group之間采用ReLU非線性變換增強模型特征的非線性表達能力。經Group1~Group13特征提取后的特征圖大小均為30×256×256。

圖2 PSL_NET網絡結構Fig.2 PSL_NET network structure
本文主要利用標記出隱寫像素實際位置的掩碼圖像進行有監督地學習,為網絡提供更多學習的信息,輸入端每張圖像都附帶一張掩碼圖像(Mask),掩碼圖像Mask的獲取策略如公式(11)所示,其中載體圖像IC經某種隱寫算法嵌入后的隱寫圖像IS,像素位置(i,j)一旦嵌入,嵌入前后像素差值的絕對值大于0,則掩碼圖像Mask中對應的像素位標記為1,若未嵌入,像素差值的絕對值為0,則掩碼圖像Mask中對應的像素位標記為0,掩碼圖像反映了隱寫像素的實際分布。網絡包括檢測內容自適應隱寫算法和非自適應隱寫算法LSB matching順序嵌入的圖像,經內容自適應隱寫算法S-UNIWARD和經非內容自適應隱寫算法LSB matching順序嵌入后的隱寫圖像和掩碼圖像可視后如圖3所示,掩碼圖像中標記為1的像素值用灰度值255進行顯示。

圖3 載體圖像、隱寫圖像和對應的掩碼圖像Fig.3 Origin image,steganographic image and corresponding mask image

像素預測層的流程如圖4所示。利用像素預測層對經深度建模得到多維高級特征進行降維壓縮得到二維通道的特征圖,壓縮得到的二維高級特征易于偵查局部異常像素;像素預測層中采用2×3×3卷積層和BN層處理得到二維通道特征,經過Softmax激活函數得到2×256×256的概率圖,“0”“1”通道分別代表預測是未經隱寫的概率分布圖P0和預測是經過隱寫的概率分布圖P1,大小均為1×256×256。輸入端檢測圖像x的每位像素xij經網絡預測得到二維概率,P0ij和P1ij,分別代表像素xij未經改動或者經過隱寫的概率,取二維概率的最大值所在的通道編號“0”或者“1”為預測的隱寫定位圖y中對應像素位yij的值。訓練過程有監督進行,網絡通過最小化交叉熵損失反復迭代優化直至隱寫定位圖無限逼近掩碼圖像,網絡采用的損失函數如公式(9)所示。

圖4 像素預測層的流程Fig.4 Process of pixel prediction layer
在訓練訓練時包含未經改動載體圖像和經隱寫的圖像,而在載體圖像中全部為標記為0的像素,而隱寫圖像中同樣包含標記為0的像素,這使得訓練過程中出現正負樣本不均衡的問題,且本文研究的是隱寫像素的定位問題,隱寫像素作為負樣本是重點學習的內容,因此解決樣本不均衡問題也是本文的研究內容。在研究界中不少學者通過自定義的目標函數解決樣本不均衡的問題。本文在實驗中分別利用Focal loss和交叉熵損失,通過對比像素檢測準確度和負樣本的準確度來選擇最佳的目標函數,Focal loss如公式(10)所示。
網絡包含檢測內容自適應隱寫算法嵌入的圖像。內容自適應隱寫術的策略,是對視覺掩蔽效果較好紋理復雜的區域進行嵌入,從而盡可能地減小圖像質量的損失,減少嵌密引發的異常,根據該原則定位網絡按理應對有限區域進行分析,比如一些紋理區域應具備更高經過隱寫的可能性,而本文網絡的核心是利用實際標注的隱寫位加強網絡對局部異常像素的感知能力,局部領域像素內的隱寫信號對隱寫前后統計特征無規則的改變,是有利于偵破的關鍵,所以本文的網絡對內容自適應隱寫算法的像素定位,不針對像素是否位于平滑或者紋理區域。
同時對非內容自適應隱寫術LSB matching進行像素定位,非自適應隱寫術LSB matching是直接對圖像像素值的最低有效位進行±1,該算法對嵌入的區域進行選擇時,不針對紋理區域與平滑區域。本文對該算法進行檢測時,同樣利用有監督學習加強網絡對局部異常像素的感知能力,定位網絡無區別對待平滑或者紋理區域的像素,使得網絡適用于檢測非內容自適應隱寫術LSB matching。
定位網絡對于隱寫圖像進行檢測的前提是預處理層中利用高通濾波器對圖像的殘留噪聲的提取,高通濾波器一般用于圖像紋理區域的提取,而在隱寫分析或是圖像取證中,更多是捕獲嵌入信息對局部相關性改變的痕跡,因此同樣適用于凸顯圖像平滑區域嵌入的噪聲信息;同時利用深度殘差層加深了網絡對局部異常像素的感知能力,而網絡的關鍵是有監督方式對嵌入前后異同的學習,掩碼圖像標記的實際隱寫像素為網絡提供了更多信息進行學習,使網絡可以遷移至不同嵌入策略的圖像進行檢測,但同樣為內存負載帶來一定的開銷且該策略也具備目前基于深度學習的隱寫分析研究的缺陷,綜述性文章[21]中提到的載體失配問題,大數據時代,數據多源異構,靜態的訓練集始終難以覆蓋動態的檢測對象,一些學者的觀點是不同源數據需分開訓練后再進行檢測,或者通過增加訓練集中的數據來源和樣本數量來緩減該問題。
3.1.1 數據集
本文使用隱寫分析標準數據集BOSSbase v1.01進行評估,該數據集由10 000張512×512的PGM格式的灰度圖構成,考慮到GPU計算限制,以圖像紋理區域為中心的方式裁剪圖像尺寸為256×256,構造出10 000張大小的數據源;采用自適應隱寫算法S-UNIWARD,實驗中驗證網絡在不同負載下的隱寫定位能力,每組訓練集中包含8 000張載體圖像(cover)、隱寫圖像(stego),測試集中包含2 000張載體圖像、隱寫圖像;訓練過程有監督進行,數據集中每張圖像附帶一張二值掩碼圖像,掩碼圖像中真實像素位標記為0,隱寫像素位標記為1。
同時利用經非內容自適應隱寫算法LSB matching順序嵌入后的圖像構造出測試數據集。用Matlab庫中lena.png、coins.png、kobi.png三張嵌入圖像,分別對2 000張測試圖像進行嵌入,共同組成LSB隱寫算法的3組測試集,每組測試集中包含2 000張隱寫圖像,數據集中每張圖像附帶一張二值掩碼圖像(Mask)。
3.1.2 實驗環境
實驗的硬件環境是型號為tesla p40的GPU,網絡模型使用深度學習框架Pytorch實現,CUDA版本為10.1;優化器采用Adam,學習率設置為0.000 1,batch_size設置為2,其中包含1對載體圖像、隱寫圖像,周期epoch設置為50,1個周期迭代8 000次,模型的訓練參數總計197 886。
3.1.3 評估標準
定位能力取決于能夠準確檢測隱寫圖像中的隱寫像素,同時取決于不對未經隱寫的像素造成誤報,根據用于描述圖像像素真實分布的掩碼圖像和網絡模型預測出隱寫像素定位圖,采用像素檢測準確度(pixel accuracy,PA)對PSL_NET的隱寫定位性能進行表征,像素準確度的計算如公式(12)所示:

此外,定位網絡重要的功能是驗證隱寫像素的檢測能力,因此同時采用特異度(FPR)作為評價的指標,特異度的計算公式如公式(13)所示:

TP表示掩碼中標記是0,預測值也是0的像素樣本量;TN表示掩碼中標記是1,預測值也是1的像素樣本量;FN表示掩碼中標記是0,預測值是1的像素樣本量;FP表示掩碼中標記是1,預測值是0的像素樣本量。
3.2.1 PSL_NET在不同負載下的隱寫定位驗證
為了對網絡PSL_NET的隱寫定位進行驗證,首先采用自適應隱寫算法S-UNIWARD在嵌入負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP對網絡的隱寫像素定位能力進行驗證,單位BPP表示平均每位像素嵌入的比特數,訓練過程中采用交叉熵損失作為目標函數。PSL_NET在完成嵌入負載為0.4 BPP任務時,訓練過程中在測試樣本上的損失下降過程如圖5所示,每組測試樣本中包含2 000張載體圖像、隱寫圖像,訓練直至收斂時不同負載下的損失(Loss)、像素準確度(PA)以及特異度(FPR)如表1所示。

圖5 在負載為0.4 BPP的測試樣本上的損失下降過程Fig.5 Loss reduction process on test sample at payload of 0.4 BPP

表1 不同負載下的損失、像素準確度(PA)、特異度(FPR)Table 1 Loss,pixel accuracy and specificity under different payloads
實驗中,PSL_NET對不同負載下的圖像進行檢測時,像素檢測準確度(PA)有著較高的精度,隨機嵌入負載的增加檢測準確度降低,在不同負載下的隱寫圖像檢測時的特異度(FPR)存在一定的提升空間,但隨著負載增加精度保持穩定;在損失下降過程中,80 000次迭代后損失平緩下降;在檢測圖像是否經過隱寫的研究中,有著嵌入負載越大檢測準確度越高的公論,這一目標下的網絡是對隱寫信號分布的全局進行統計,依賴于全局的隱寫區域,負載越大網絡的感知能力越強,而在隱寫定位任務中嵌入負載越大局部范圍內統計特性改變的差異性越大,檢測準確度降低,負載越大網絡對局部隱密信息越敏感,特異度提升,同時從準確度和特異度的差距可知,網絡對隱寫像素漏檢的幾率大于對真實像素造成的誤報率,這是訓練時正負樣本不均衡造成的,本文從目標函數角度解決正負樣本的不均衡問題,在測試時用于提升精度。
3.2.2 采用Focal loss訓練的隱寫定位驗證
從目標函數角度解決樣本不均衡問題,研究本文網絡PSL_NET在使用Focal loss進行訓練時,能否解決正負樣本的不均衡問題并提升像素檢測準確度和特異度。同樣針對內容自適應隱寫算法S-UNIWARD在負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP的圖像進行訓練,訓練過程中采用Focal loss為目標函數,調節系數γ設置為2時為最佳,PSL_NET在完成嵌入負載為0.4 BPP任務時,訓練過程中在測試樣本上的損失下降過程如圖6所示,訓練直至收斂時對不同負載下測試圖像檢測時的損失(Loss)、像素準確度(PA)以及特異度(FPR)如表2所示,每組測試樣本中包含2 000張載體圖像、隱寫圖像。

圖6 采用Focal loss在負載為0.4 BPP的測試集上的損失下降過程Fig.6 Loss reduction process on test set at payload of 0.4 BPP using Focal loss

表2 采用Focal loss在測試集上的損失(Loss)、像素準確度(PA)、特異度(FPR)Table 2 Loss,pixel accuracy and specificity using Focal loss on test set
Focal loss中調節系數γ設置為2時,對于正樣本而已,像素yij為負樣本的概率1-P0ij的γ次方就會變小,這時的損失函數值變得更小,Focal loss中調節系數γ的目的就是減少正樣本在訓練中的權重,從而使得訓練過程網絡更專注于負樣本的學習。在實驗中,PSL_NET對經內容自適應隱寫算法S-UNIWARD在不同嵌入負載下的隱寫圖像使用Focal loss進行訓練后,對測試樣本進行檢測時,相對于使用交叉熵損失訓練的網絡,像素準確度和特異度均得到一定的提升,負載為0.1 BPP提升尤為明顯,由此可見通過改變目標函數提升了網絡對于負樣本的學習。
3.2.3 對非自適應隱寫術LSB matching的隱寫定位驗證
內容自適應隱寫術是對圖像中視覺掩蔽效果較好紋理復雜的區域進行嵌入,從而盡可能地減小圖像質量的損失,減少嵌密引發的異常。非自適應隱寫術LSB matching是直接對圖像像素的最低有效位進行±1,對嵌入的區域進行選擇時,不針對載體圖像的紋理區域與平滑區域,在實驗中利用針對內容自適應隱寫算法S-UNIWARD在負載為0.4 BPP的隱寫圖像采用交叉熵損失已訓練至收斂的網絡,對經過非內容自適應LSB matching隱寫算法分別順序嵌入Matlab庫中lena.png、coins.png、kobi.png三張圖像組成的3組測試數據集進行檢測,每組測試數據集中包含2 000張載體圖像、隱寫圖像,像素準確度(PA)如表3所示。

表3 對LSB Matching隱寫術的像素準確度(PA)Table 3 Pixel accuracy for LSB matching
實驗可知,針對自適應隱寫算法S-UNIWARD在負載為0.4 BPP的隱寫圖像以訓練至收斂的網絡PSL_NET,遷移至檢測非內容自適應隱寫算法LSB經順序嵌入3張不同圖像的測試集時算法仍然有效,LSB matching的嵌入策略不針對載體圖像內容進行嵌入,本文的網絡對隱寫像素進行檢測時,無區別對待平滑或者紋理區域的像素,通過對標記數據的學習增強網絡對局部領域像素內異常隱寫信號的敏感度,使得網絡亦可適用于非內容自適應LSB隱寫算法的隱寫像素,但由于順序嵌入圖像后使載體圖像承受了更大的嵌入負載,檢測難度較大使得準確度下降。
3.2.4 對PSL_NET的對比仿真分析
對本文提出的PSL_NET與文獻[16]中提出的針對LSB matching隱寫術有效嵌入負載像素定位的深度神經網絡(簡稱DNN)獲取圖像隱密信息的效果進行對比仿真和分析,兩種方法針對內容自適應隱寫術S-UNIWARD在負載為0.4 BPP的隱寫圖像進行訓練和測試,在測試集上的像素準確度和特異度如表4所示,測試集中包含2 000張載體圖像、隱寫圖像。以及分別用兩種方法完成內容自適應隱寫術S-UNIWARD在負載為0.4 BPP任務已訓練至收斂的網絡對載體圖像、經內容自適應隱寫術S-UNIWARD在負載為0.4 BPP嵌入后的隱寫圖像進行檢測,以BOSSbase v1.01中第1 108張圖像作為樣張對兩種方法生成的隱寫定位圖像的效果進行可視化對比,該樣張中紋理和平滑區域的分布直觀。如圖7所示,輸入端為載體圖像、經內容自適應隱寫算法S-UNIWARD在負載為0.4 BPP處理后的隱寫圖像,掩碼圖像為預先標注出隱寫像素位置的圖像,隱寫定位圖分別經PSL_NET、DNN預測得到,可視時將DNN獲取的標簽(label)轉換成定位圖對兩種方法的效果進行對比。

表4 兩種方法在測試集上的像素準確度(PA)和特異度(FPR)Table 4 Pixel accuracy and specificity of two methods on test set

圖7 兩種方法獲取的隱寫定位圖Fig.7 Steganographic location map obtained by two methods
DNN中通過提取隱寫圖像中每位像素的臨近像素差異矩陣構造出的72維特征向量作為輸入進行訓練,在預測像素時將紋理區域的像素視為無效隱寫像素,因為臨近像素差異矩陣本質用于提取圖像紋理區域的信息,然而內容自適應隱寫術是對圖像中視覺掩蔽效果較好紋理復雜的區域進行嵌入,如若無視掉紋理區域的像素,該方法便對內容自適應隱寫術的隱寫定位無效,因此本文的對比仿真中采用該方法時將紋理區域的像素視為有效像素。如表4中,兩種方法對測試集中的數據進行檢測時,特異度相當然而像素檢測準確度相差明顯,因為DNN通過手工提取臨近像素差異特征的均方作為輸入,該特征對圖像紋理區域的像素敏感,而測試集中載體圖像與隱寫圖像占比為1∶1,該方法檢測載體圖像時,載體圖像中紋理區域的像素并未經嵌入卻被誤報,導致準確度降低。
如圖7所示,測試樣張中上方為平滑區域,下方為紋理區域,輸入端載體圖像經PSL_NET、DNN預測得到的隱寫定位圖中,DNN方法對載體圖像的紋理區域敏感,標識出了載體圖像中未經隱寫的像素,而PSL_NET中僅極少量未經隱寫的像素被標識,兩種方法對內容自適應隱寫術S-UNIWARD負載為0.4 BPP的隱寫圖像的隱秘信息定位時,對比樣張的上方可知兩種方法都可捕獲部分圖像平滑區域的隱寫信息,DNN基于手工提取的特征對平滑區域的隱秘信息提取更為準確,樣張的隱寫定位圖的下方區域中,兩種方法均能捕獲圖像紋理區域的隱寫信息,但PSL_NET中僅有少量未經隱寫的信息被錯誤地標識。對內容自適應隱寫術的隱寫分析研究中,在特征選取時既要保證可以捕獲出紋理復雜區域的隱秘信息,同時保證不對紋理復雜區域中未經隱寫的像素造成誤報,本文中利用卷積神經網絡(CNN)自動學習抽象的隱寫特征的特點,使得網絡能夠區分出紋理復雜區域中嵌入的隱秘信息,PSL_NET可捕獲平滑區域的隱秘信息亦可證得該方法適用于LSB matching隱寫術的隱寫像素定位。對比仿真可知,本文的方法相對DNN的優勢在于對未經隱寫的像素有更低的誤報率并且完全端到端實現。
本文針對目前隱寫分析往往只能判別載體圖像中是否存在隱密信息,并不能對隱密信息的具體位置進行標識,為進一步增強隱寫分析的實用性,將隱寫分析的研究目標拓展為自適應隱寫術和非自適應隱寫術LSB matching的隱寫定位。提出一種端到端的圖像隱寫分析定位網絡PSL_NET,在輸入端輸入一張圖像,輸出端得到預測的隱寫定位圖。在預處理層中,利用空域富模型的高通濾波器提取殘噪圖像;在深度殘差層中,通過深度殘差學習增強隱寫特征的表達能力;像素預測層中,利用標記出隱寫像素實際位置的掩碼圖像進行有監督地學習,加強網絡對局部隱寫像素的感知能力,無區別對待平滑或者紋理區域的像素,逐一預測圖像每位像素是真實位或是隱寫位的概率。最后,從目標函數層面解決正負樣本的不均衡問題,訓練時通過使用Focal loss對比使用交叉熵損失提高對負樣本的學習權重,在測試時用于提升檢測精度。
在基于隱寫分析標準數據源BOSSbase v1.01的實驗中,網絡對自適應隱寫算法S-UNIWARD在負載為0.1 BPP、0.2 BPP、0.3 BPP、0.4 BPP下的像素檢測準確度均大于0.98,特異度還有一定的提升空間,但是網絡一旦檢測出隱寫圖像的部分隱寫像素就完成了被動隱寫分析的任務,即能判斷圖像是否經過隱寫。本文為解決正負樣本不均衡問題,從目標函數角度提出解決方法,并用實驗驗證了該方法對于精度的提升起到的效用,最后通過與相關研究的對比仿真的可視對比中,驗證網絡同時適用于非內容自適應隱寫術LSB matching的隱寫信息定位。
本文網絡的關鍵是有監督方式利用掩碼圖像對嵌入前后異同的學習,使網絡可以遷移至檢測經非內容自適應隱寫術LSB matching嵌入的圖像,掩碼圖像的利用是有監督學習局部隱寫像素對于隱寫前后統計特性改變的關鍵,本文的主要工作是為隱寫分析定位問題提供一種策略,在圖像分割領域亦有相似策略,掩碼圖像為網絡提供了更多學習信息的同時,給內存負載帶來了一定的開銷,且隱寫定位研究中仍然存在基于深度學習的被動隱寫分析研究中存在的載體失配問題,因為靜態的訓練集中的數據始終不能覆蓋所有的數據源,一些學者的觀點是不同源數據需分開訓練后再進行檢測,或者通過增加訓練集中的數據源和數量來緩減該問題,且本文的研究距離真正準確有效地定位出任意圖像的隱寫像素還有一定差距,未來的工作中將進一步研究以提升檢測精度和增強實用性。