陳 偉, 李圓智, 宋賢睿, 崔春霞
(1. 合肥工業(yè)大學(xué) 過程優(yōu)化與智能決策教育部重點實驗室, 安徽 合肥 230009; 2. 國網(wǎng)安徽省電力有限公司 電力調(diào)度控制中心, 安徽 合肥 230061)
為了實現(xiàn)具備安全性與便利性的隱匿通信,在通信過程中發(fā)送方與接收方均會采用信息隱寫術(shù)。隱寫術(shù)是指將具有高價值的關(guān)鍵信息秘密隱藏于圖像、視頻和音頻等低價值的常見數(shù)據(jù)信息中,并在不引起第三方注意的前提下,實現(xiàn)秘密和隱匿的無損信息傳遞。目前由于計算機(jī)與互聯(lián)網(wǎng)技術(shù)主要將圖像作為信息傳輸?shù)姆绞?所以絕大多數(shù)的信息隱藏算法也以圖像為信息載體。根據(jù)實現(xiàn)方式的不同,圖像隱寫算法主要分為空域及變換域兩種。其中空域方法是指直接將秘密信息嵌入圖像中,該方法的典型代表為最低有效位(least significant bit,LSB)匹配算法[1]。隨著研究的深入,對信息隱藏技術(shù)的研究也逐漸轉(zhuǎn)向變換域方法[2],即利用某種算法變換將秘密信息嵌入到圖像的對應(yīng)變換系數(shù)中,其典型代表為離散余弦變換(DCT)算法[3]。需要說明的是,盡管空域方法的容量較大,但變換域方法的安全性與魯棒性則更為優(yōu)秀,且其還代表著信息隱藏技術(shù)的未來發(fā)展方向。
鑒于在無監(jiān)督學(xué)習(xí)領(lǐng)域的優(yōu)異表現(xiàn),生成對抗網(wǎng)絡(luò)(GAN)吸引了諸多信息隱藏研究者的廣泛關(guān)注[4-6],并逐漸成為了該領(lǐng)域的熱門研究方向。其中,HU等[7]基于深層卷積生成對抗網(wǎng)絡(luò)提出了不依賴于信息載體的隱寫算法,但其信息容量較小;WANG等[8]通過混合隨機(jī)噪聲與秘密信息,提出了具有多樣性及安全性的信息隱寫算法,然而其信息提取的難度與精確度仍有待優(yōu)化。
為了提高信息隱藏算法的提取精度及安全性,文中引入了SE-ResNet塊,并設(shè)計了編碼器與譯碼器的詳細(xì)結(jié)構(gòu)。利用生成對抗網(wǎng)絡(luò)中的四舍五入層及對抗樣本,形成具有強(qiáng)大學(xué)習(xí)能力的端到端圖像隱寫模型,進(jìn)而實現(xiàn)了對信息提取精確度及安全性能的提升。
為了提高隱寫算法的精確度及安全性,本文在生成對抗網(wǎng)絡(luò)的基礎(chǔ)上,設(shè)計了一種由編碼器、譯碼器和判別器等部件組成的隱寫模型。其中編碼器屬于信息的發(fā)送端設(shè)備,主要負(fù)責(zé)將機(jī)密信息嵌入至信息載體的多種紋理區(qū)域中;譯碼器屬于信息接收端設(shè)備,負(fù)責(zé)從信息載體的復(fù)雜紋理中完成重要信息的精確提取;判別器則屬于第三方攻擊者設(shè)備,其可利用傳輸圖像分析隱寫模型中的重要秘密信息。通過利用多種設(shè)備,本文設(shè)計的隱寫模型具體架構(gòu)如圖1所示。

圖1 基于生成對抗網(wǎng)絡(luò)的隱寫模型架構(gòu)Fig.1 Steganography model architecture based on generative adversarial network
由圖1可知,在信息發(fā)送端,設(shè)原始圖像的尺寸(通道數(shù)、高度和寬度)為(v,l,w),機(jī)密信息Mc的尺寸為(1,l,w),其信息的取值值域為二進(jìn)制,即Mc∈{0,1}。在編碼器的作用下,將原始圖像與機(jī)密信息Mc相結(jié)合,再進(jìn)行卷積,便可得到隱寫之后尺寸為(v′,l,w)的圖像。通常而言,隱寫圖像與原始圖像的像素值均為浮點數(shù)值,二者在外觀感知方面并無任何區(qū)別。在四舍五入層的作用下,隱寫模型可將隱寫圖像的浮點數(shù)值轉(zhuǎn)換為整數(shù)值,并將其發(fā)送至接收端。利用接收端的譯碼器,模型首先對隱寫圖像執(zhí)行卷積逆函數(shù)運(yùn)算;然后從卷積結(jié)果中提取與多種噪聲混合的機(jī)密信息M′;最后再進(jìn)行必要的去噪處理,以獲得完整的機(jī)密信息M′c。在判別器部分,第三方攻擊者必須截獲處于傳輸狀態(tài)的隱寫圖像,再利用已知的原始圖像進(jìn)行精確地判定及鑒別,進(jìn)而重建經(jīng)過隱寫的機(jī)密信息。
編碼器和譯碼器是隱寫模型的核心設(shè)備,二者分別位于電網(wǎng)信息的發(fā)送端和接收端。為了盡量保持圖像的原始信息與特征圖大小一致,本文將卷積函數(shù)的核大小設(shè)置為3×3,而步幅與填充則均為1。同時增加編碼器的卷積核數(shù)量,并減少譯碼器相應(yīng)的核數(shù)量,再刪除神經(jīng)網(wǎng)絡(luò)中的池化層,從而提高編碼器的圖像輸出質(zhì)量及譯碼器的信息提取準(zhǔn)確程度。
在編碼器和譯碼器的結(jié)構(gòu)中,本文分別引入了3個具備核心功能的壓縮激勵網(wǎng)絡(luò)。SE-ResNet塊是神經(jīng)網(wǎng)絡(luò)算法中的基本構(gòu)成模塊[9],其具有簡易的結(jié)構(gòu)與實現(xiàn)方式,可廣泛應(yīng)用于圖像的分類及去噪等操作。該模塊的具體結(jié)構(gòu)如圖2所示。

圖2 SE-ResNet塊的具體結(jié)構(gòu)Fig.2 Specific structure of SE-ResNet module
由圖2可知,在SE-ResNet模塊的工作過程中,尺寸為(v,l,w)的原始圖像首先須執(zhí)行兩輪殘差層運(yùn)算,以獲得尺寸為(v′,l,w)的特征圖像;然后利用Global pooling運(yùn)算,對尺寸為(v′,l,w)的特征圖像執(zhí)行擠壓操作,并輸出相應(yīng)的特征圖;接著再利用兩個完全連接層、整流線性單元與Sigmoid函數(shù)的運(yùn)算,完成特征圖的參數(shù)化運(yùn)算;最后采用兩輪殘差層的運(yùn)算結(jié)果,分別與參數(shù)化之后的特征圖進(jìn)行相乘及相加,并獲取尺寸為(v′,l,w)的最終特征圖。在隱寫模型中,SE-ResNet模塊的功能在于將機(jī)密信息融合至圖像信息中,但并不破壞圖像的全局信息。
經(jīng)過信號發(fā)送端的編碼運(yùn)算之后,隱寫圖像Gs處于三通道彩色或單通道灰度圖像的浮點數(shù)值狀態(tài),此時,譯碼器較難執(zhí)行正常的譯碼。為了保證譯碼器中多項運(yùn)算的正常執(zhí)行,編碼器與譯碼器之間必須添加必要的四舍五入層運(yùn)算。令gs表示隱寫圖像Gs中的像素值矩陣,G′s表示四舍五入之后的隱寫圖像,其所對應(yīng)的像素值矩陣為g′s,則四舍五入層的像素值矩陣表達(dá)式為
g′s=gs+|Round(gs)-gs|
(1)
式中:Round為執(zhí)行四舍五入的單像素值操作;“| |”為保留整數(shù)值的矩陣運(yùn)算。在反向傳播的訓(xùn)練過程中,該運(yùn)算將不提供梯度。
`在圖像隱寫模型中判別器屬于第三方攻擊端設(shè)備,主要負(fù)責(zé)鑒別截獲的圖像是否存在隱寫情況。在生成對抗網(wǎng)絡(luò)訓(xùn)練期間,判別器須生成與原始圖像相似度較高的數(shù)字圖像,再利用和編譯碼器結(jié)構(gòu)類似的SE-ResNet塊與4×4最大池化層,對隱寫圖像進(jìn)行精確鑒別,其內(nèi)部架構(gòu)如圖3所示。

圖3 判別器的內(nèi)部架構(gòu)Fig.3 Internal architecture of discriminator
為了進(jìn)一步提升現(xiàn)代隱寫算法在分析時的抵抗能力,本文在生成對抗網(wǎng)絡(luò)的訓(xùn)練過程中添加了一定數(shù)量的對抗樣本,并對編碼器、譯碼器與判別器的子網(wǎng)絡(luò)分別設(shè)置了特定的目標(biāo)損失函數(shù),同時利用梯度下降算法優(yōu)化模型的相關(guān)參數(shù)值。
在信息發(fā)送端,編碼器必須同時執(zhí)行機(jī)密信息的嵌入及隱寫圖像質(zhì)量的提升操作。為了盡可能增強(qiáng)這兩項功能,本文在生成對抗網(wǎng)絡(luò)的訓(xùn)練過程中,利用均方誤差的概念,增加了相應(yīng)的損失函數(shù),即嵌入損失函數(shù)Tc和質(zhì)量損失函數(shù)Tq。令g表示尺寸為(v,l,w)的原始圖像G的像素值矩陣,E和Di分別表示期望函數(shù)與判別器輸出函數(shù),Pd表示編碼器產(chǎn)生的樣本分布,則損失函數(shù)Tc和Tq的表達(dá)式為
(2)
Tq(g,gs)=-Egs-Pd[Di(gs)]
(3)
在信息接收端,譯碼器需要利用隱寫圖像實現(xiàn)機(jī)密信息的重建。針對這一重要功能,本文引入均方誤差的概念,設(shè)置譯碼器的損失函數(shù)為Td。令Mc和M′c分別表示尺寸為(1,l,w)的機(jī)密信息及恢復(fù)后的機(jī)密信息,則損失函數(shù)Td的計算公式為
(4)
令αc、αq和αd分別表示嵌入損失函數(shù)、質(zhì)量損失函數(shù)和譯碼器損失函數(shù)的加權(quán)系數(shù),則隱寫模型的標(biāo)準(zhǔn)損失函數(shù)Tst可表示為
Tst=αcTc+αqTq+αdTd
(5)
而在第三方攻擊端,判別器首先需要鑒別截獲圖像是否存在隱寫,再利用隱寫圖像恢復(fù)機(jī)密信息。本文設(shè)置了具有較高穩(wěn)定性的判別器來訓(xùn)練損失函數(shù),令P表示實際圖像分布,x和Px分別表示圖像中間區(qū)域的像素值及其采樣分布,β表示裁剪率,則判別器訓(xùn)練損失函數(shù)TD的表達(dá)式為
TD(g,gs)=Egs-P{Di(gs)-Eg-P[Di(g)+
(6)
在模型訓(xùn)練過程中,由于添加了對抗樣本,隱寫模型有可能產(chǎn)生一些特殊的變化。針對這一現(xiàn)象,令t表示樣本類別,T表示隱寫模型的標(biāo)準(zhǔn)損失函數(shù),x和σ(x)分別表示圖像中間區(qū)域的像素值及對應(yīng)的嵌入信息,則添加對抗樣本之后的損失補(bǔ)償為
ΔT=E[T(x+σ(x),t)]
(7)
令α和αD分別表示對抗樣本損失補(bǔ)償與判別器損失函數(shù)的加權(quán)系數(shù),則在添加對抗樣本之后,隱寫模型的總損失函數(shù)為
Ttotal=Tst+αDTD+αΔT
(8)
為了驗證信息隱藏模型的可行性與有效性,本文首先設(shè)計了針對譯碼精確度、安全性及時間消耗等指標(biāo)的仿真對比實驗。在具體仿真中,3個通用圖像數(shù)據(jù)集2011BOSSBase、2014COCO和2015celebA的10 000張圖片分別被引入至信息隱藏模型的訓(xùn)練過程中。模型測試過程采用未經(jīng)訓(xùn)練的圖像樣本,同時機(jī)密信息利用隨機(jī)方法生成。
基于同樣的機(jī)密信息、訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)等外界條件,本文提出的信息隱藏方法與其他具有較高性能的信息隱寫算法均得到了實現(xiàn)。其中引用的對比算法主要有兩種:1)HU等[7]提出的DCGANS算法,該算法可將機(jī)密信息轉(zhuǎn)化為噪聲向量,從而實現(xiàn)較高的信息提取能力與隱寫安全性;2)ZHU等[10]提出了深度網(wǎng)絡(luò)隱藏數(shù)據(jù)算法(HiDDeN),該算法通過增加大量的編譯碼器訓(xùn)練,充分提高了編碼圖像的視覺質(zhì)量。
為了實現(xiàn)模型參數(shù)的優(yōu)化,本文使用了梯度下降的方法。在模型初始訓(xùn)練階段,基本的學(xué)習(xí)率設(shè)置為10-3,每批訓(xùn)練樣本的大小均為12(batchsize=12),且所有樣本均被訓(xùn)練了200次(epoch=200)。通過多次實驗,本文選擇了恰當(dāng)?shù)膿p失函數(shù)加權(quán)系數(shù),從而提高了信息隱藏模型的收斂速度與穩(wěn)定程度。其中,質(zhì)量損失函數(shù)加權(quán)系數(shù)αq=10-3,嵌入損失函數(shù)加權(quán)系數(shù)αc=5,譯碼器損失函數(shù)加權(quán)系數(shù)αd=1,判別器損失函數(shù)加權(quán)系數(shù)αD=10-3。此外,執(zhí)行仿真的服務(wù)器采用PyTorch深度學(xué)習(xí)框架,其CPU型號為Intel Core X i9-10980XE,顯卡型號為NVIDIA GeForce RTX 2080Ti。
當(dāng)完成必要的模型訓(xùn)練之后,以3種圖像數(shù)據(jù)集的剩余照片作為測試數(shù)據(jù)集。本文從譯碼精確度、安全性與時間消耗等方面,分別對DCGANS算法、HiDDeN算法和本文所提信息隱藏方法進(jìn)行了詳細(xì)的測試與分析。
1) 在譯碼精確度方面,由于信息隱藏方法添加了四舍五入層,所以該方法僅能對整數(shù)像素值的混合圖像進(jìn)行譯碼,而無法處理浮點數(shù)像素值圖像。譯碼精確度負(fù)責(zé)衡量安全通信中接收信息的成功概率,通過相應(yīng)的測試及分析,本文對3種算法的整數(shù)圖像譯碼精確度進(jìn)行了統(tǒng)計和計算,結(jié)果如表1所示。

表1 三種方法的譯碼精確度Tab.1 Decoding accuracy of three algorithms %
由表1可知,對于BOSSBase、COCO和celebA等通用數(shù)據(jù)集,DCGANS和HiDDeN隱寫算法的譯碼精確度均低于本文提出的信息隱藏方法。
2) 在安全性方面,信息隱藏方法需要具備抵抗隱寫分析檢測的能力。為了衡量算法的安全性能,本文分別選取了兩種具有高檢測能力與低計算復(fù)雜度的隱寫檢測模型,即XuNet[11]和YeNet[12]來對這3種算法的隱寫結(jié)果進(jìn)行反復(fù)分析與檢測,從而實現(xiàn)對不同方法隱寫檢測準(zhǔn)確率的統(tǒng)計[13-15]。在具體檢測中,通過多次運(yùn)行DCGANS、HiDDeN和基于生成對抗網(wǎng)絡(luò)的信息隱藏方法,利用XuNet和YeNet模型對這些信息隱藏方法進(jìn)行檢測,并統(tǒng)計相應(yīng)的檢測準(zhǔn)確率,其結(jié)果如表2所示。

表2 三種方法的隱寫檢測準(zhǔn)確率Tab.2 Steganography detection accuracy of three algorithms %
從表2中可以看到,在隱寫檢測過程中,XuNet和YeNet模型對DCGANS以及HiDDeN算法的檢測準(zhǔn)確率均大于99%,且接近于100%,可知這兩種算法難以抵御XuNet及YeNet隱寫檢測模型的分析。本文方法在一定程度上降低了XuNet和YeNet模型的檢測準(zhǔn)確率,即兩種模型的檢測準(zhǔn)確率下降了約5%和3%。綜上所述,針對高檢測性能的XuNet和YeNet隱寫分析模型,所有的信息隱藏方法在抵抗隱寫檢測能力方面均存在明顯的缺陷與不足。
3) 在時間消耗方面,本文從BOSSBase、COCO和celebA數(shù)據(jù)集中隨機(jī)選取了3 000張圖像。其中celebA數(shù)據(jù)集的圖像大小為128×128,數(shù)量為1 000張;而BOSSBase和COCO數(shù)據(jù)集的圖像大小與數(shù)量相同,均為256×256及1 000張。對于數(shù)據(jù)集中的3 000張圖像,依次利用3種方法進(jìn)行編碼與解碼等操作,同時動態(tài)統(tǒng)計其消耗的平均時間,所得結(jié)果如圖4所示。

圖4 三種信息隱藏方法的平均時間消耗Fig.4 Average time consumption of three information steganography algorithms
由圖4可知,在相同數(shù)量圖像的隱寫過程中,本文方法的時間消耗明顯優(yōu)于DCGANS算法和HiDDeN算法,說明所提方法具有優(yōu)異的實時性,故能以更快的速度執(zhí)行圖像的多種隱寫操作。
通過總結(jié)譯碼精確度、安全性及時間消耗等仿真結(jié)果可知,與經(jīng)典的DCGANS和HiDDeN算法相比,基于生成對抗網(wǎng)絡(luò)的信息隱藏方法具有更加優(yōu)秀的譯碼精確度、安全性及時間消耗。因此,本文提出的信息隱藏方法優(yōu)于DCGANS算法和HiDDeN算法。
在生成對抗網(wǎng)絡(luò)的基礎(chǔ)上,本文利用SE-ResNet塊提出了適用于電網(wǎng)的信息隱藏方法,進(jìn)而優(yōu)化圖像隱寫領(lǐng)域的譯碼精確度、安全性及時間消耗。根據(jù)實際仿真實驗結(jié)果可知,在安全性方面,由于XuNet模型和YeNet模型具有強(qiáng)大的隱寫檢測能力,與經(jīng)典算法相比,本文提出的信息隱藏方法將隱寫檢測準(zhǔn)確率降低約5%,其安全性有所提升,這表明當(dāng)前信息隱寫模型的研究進(jìn)展和水平仍然遠(yuǎn)落后于隱寫分析檢測算法。換言之,信息隱藏方法的安全性水平較低,難以抵抗XuNet模型和YeNet模型的隱寫檢測。因此,如何改進(jìn)信息隱藏方法的計算結(jié)構(gòu),從而提升其抵抗隱寫檢測的能力,已成為信息隱藏研究領(lǐng)域的關(guān)鍵問題,這也是下一步的重要研究方向。