基金項目:國家自然科學基金資助項目
作者簡介:邱楓(1997-),男,河南商丘人,碩士研究生,主要研究方向為信息隱藏;鈕可(1981-),男(通信作者),浙江湖州人,副教授,碩導,博士,主要研究方向為信息隱藏(niuke@163.com);李軍(1987-),男,湖南婁底人,碩士,主要研究方向為信息隱藏;寧志強(1997-),男,內蒙古赤峰人,碩士研究生,主要研究方向為信息隱藏.
摘 要:針對基于直方圖平移的視頻隱寫算法與視頻內容相關性不強進行了研究,提出了一種基于運動矢量多直方圖修正的H.264視頻可逆隱寫算法。該算法通過統計特定幀中宏塊移動的速度特性和散亂度對人眼視覺的敏感程度設計修正參數,再根據修正參數設計多個二維直方圖,最后在非特定幀中通過二維直方圖修正算法嵌入信息。實驗結果表明:與同類型視頻隱寫算法相比,嵌入容量平均提高8.2%,在滿嵌時該算法的PSNR和SSIM的變化值分別平均降低19.9%和17.5%,該算法在保持較低的比特率變化下,具有更好的嵌入容量和不可感知性。
關鍵詞:視頻隱寫;多直方圖修正;運動矢量
中圖分類號:TP309.2 文獻標志碼:A
文章編號:1001-3695(2022)11-044-3470-05
doi:10.19734/j.issn.1001-3695.2022.03.0159
Video steganography algorithm based on motion vector and multi histogram modification
Qiu Feng,Niu Ke,Li Jun,Ning Zhiqiang
(Key Laboratory of Network amp; Information Security under Chinese People Armed Police Force,Engineering University of PAP,Xi’an 710086,China)
Abstract:Aiming at the weak correlation between video steganography algorithm based on histogram translation and video content,this paper proposed a multiple histogram modification H.264 video steganography algorithm based on motion vector.The algorithm designed correction parameters by counting the speed characteristics of macroblock movement and the sensitivity of dispersion to human vision in a specific frame,then designed multiple two-dimensional histograms according to the correction parameters,and finally embedded information in a non-specific frame through the two-dimensional histogram modification algorithm.The experimental results show that compared with the same type of video steganography algorithm,the embedding capacity is increased by 8.2% on average.When fully embedded,the change values of PSNR and SSIM of the algorithm are reduced by 19.9% and 17.5% respectively.The algorithm has better embedding capacity and imperceptibility while maintaining a low bit rate change.
Key words:video steganography;multiple histogram shifting;motion vector
0 引言
近年來,信息隱藏技術發展迅速[1,2],其中可逆信息隱藏技術因為其在經過信息提取后仍能夠無損地將恢復載體,而在軍事、醫療、法律服務等領域得到廣泛應用。從本質上講,可逆信息隱藏的設計主要涉及嵌入特征獲取、可逆修改方式設計、參數確定[3]三個部分。在特征獲取中,主要目標是利用嵌入載體的冗余,提取特征進行數據嵌入,如在以圖像為載體的算法中,這種特征可以是像素差、預測誤差等,在以視頻為載體的算法中,這種特征可以是DCT系數、運動矢量等。
直方圖遷移算法(histogram shifting)是可逆信息隱藏方案中的典型代表之一。Ni等人[4]最早提出該算法,將秘密信息嵌入在自然圖像像素值直方圖的峰值點中,每個像素值最大變化為1,這在一定程度上限制了嵌入信息后載體的失真。Hong等人[5]提出了一種基于預測誤差直方圖的算法,提高了嵌入容量。Efimushkina等人[6]根據率失真理論選擇較小值的系數直方圖進行信息嵌入,進一步減小了失真。Li等人[7]在預測誤差直方圖算法的基礎上對平滑像素和粗糙像素進行分類,再將信息自適應地嵌入其中,提高了算法的性能。李棟等人[8]提出了一種高度對稱的直方圖并對運動矢量隨機取反進行加密算法,實現了視頻加密域的可逆信息隱藏。Xu等人[9]通過對信息嵌入效率的分析,提出了兩種二維直方圖遷移的視頻可逆信息隱藏算法,提高了視頻的視覺效果。Li等人[10]提出了一種基于運動矢量的二維直方圖嵌入信息,提高了嵌入容量。Zhao等人[11]從4×4量化的離散余弦變換亮度塊中使用二維直方圖進行數據嵌入,提高了嵌入容量。這些算法都是基于一維或二維直方圖遷移,其中二維直方圖遷移總體上要優于一維直方圖遷移,但這些方法在信息嵌入方式上與載體內容關聯性不強。
近年來,基于多直方圖修正(multiple histograms modification)的可逆信息隱藏算法被提出。在圖像方面,Li等人[12]提出了一種基于多直方圖修正的算法,該算法計算圖像像素的復雜度度量生成多個直方圖,在每個生成的直方圖中選擇兩個擴展箱實現信息嵌入,能夠較好地利用圖像冗余來提高嵌入性能。Wang等人[13]提出了一種基于多直方圖修正的可逆信息隱藏總體框架,該框架通過優化多特征構建多直方圖,并采用遺傳算法分配直方圖,提高了嵌入容量。Ou等人[3]提出了一種基于多直方圖修正的大容量可逆信息隱藏算法,該算法根據分布的銳度,采用多個預測誤差直方圖以不同的容量進行嵌入,使算法具有高容量的特性。在視頻方面,Chen等人[14]提出了一種基于壓縮感知的視頻多直方圖修正隱寫算法,該算法利用線性感知算法區分宏塊特征,同時保持其統計特性不變,將具有相似特征的宏塊聚類成多個直方圖,提高了視頻質量。本文在上述研究的基礎上提出了一種新的基于運動矢量多直方圖修正的視頻隱寫算法。
1 修正參數選擇
1.1 運動矢量失真分析
H.264是當前使用最為廣泛的視頻壓縮標準之一,具有靈活的預測方式,能夠實現準確的預測,從而在保證圖像較高質量的同時實現高效的視頻壓縮,并在壓縮后有較低的比特率[15]。H.264通過運動矢量降低視頻幀之間的時間冗余,對運動矢量的修改往往會降低視頻質量,因此在秘密信息嵌入時需要選擇合適的運動矢量進行修改。文獻[16]指出,人眼對視頻中移動速度較快的宏塊敏感度要低于移動速度較慢的宏塊,移動速度較快的宏塊其運動矢量值也較大,因此,將秘密信息嵌入到運動矢量值較大的宏塊中能保證更好的視覺質量。文獻[17]指出,人眼對移動散亂宏塊的敏感度要低于移動整齊宏塊,因此,將秘密信息嵌入到移動散亂的宏塊更難以被發現。
1.2 參考幀變換
對運動矢量進行修改會造成圖像失真,當I幀數量較少且后續幀以當前幀作為參考幀時,圖像的失真會一直累積,嚴重影響視頻質量。H.264視頻壓縮標準設有解碼幀緩沖區和相應的參考圖像列表,允許在一定范圍內選擇參考幀[18]。本文靈活設置特定幀為參考幀,設定參考幀后續的普通幀均參考前一幀,參考幀自身均參考前一參考幀。這樣一方面可以有效地提高視頻視覺質量,另一方面可以控制特定幀不被修改,確保秘密信息的正確提取。
1.3 修正參數設計
本文設計修正參數輔助構建多個直方圖。在視頻中,相鄰幾幀的數據有很大的相關性,可以認為在多數情況下當前幀能夠體現其后續若干幀的特性。為提高隱寫算法的不可見性,通過統計特定幀中運動矢量的速度特性和散亂度來設計后續若干幀的修正參數(k,j),用運動矢量大小表示宏塊的速度特性,用區域內運動矢量方向角的方差值表示宏塊的散亂度。
1.4 修正參數構建
a)通過參考幀變換技術選擇輸入視頻的特定幀,并將該幀劃分成互不重疊的M×M區域。其中,M×M區域用于反映該區域內宏塊的特性,當M過大時,會增大算法計算復雜度,當M過小時,又難以充分體現幀與幀之間的差別,因此應取適當的M值,以保證算法的有效性。
b)計算該區域內宏塊的所有運動矢量大小L(i):
其中:L(i)表示該區域內第i個宏塊的運動矢量大??;mvx和mvy分別表示運動矢量的水平和垂直分量。
c)計算該區域內運動矢量大小的平均值(q):
其中:(q)表示該幀內第q個區域的運動矢量大小的平均值;n表示該區域內運動矢量的總個數;i的取值為1~n。
d)計算區域內運動矢量方向角θ:
e) 計算區域內運動矢量方向角q的平均值(q):
其中:(q)表示該幀內第q個區域內運動矢量方向角的平均值;θ(i)表示該區域內第i個宏塊的運動矢量方向角。
f)計算該區域內的運動矢量方向角θ的方差D(q):
其中:D(q)表示該幀內第q個區域的運動矢量方向角的方差。
g)計算當前幀的修正函數H(p):
其中:H(p)是第p個參考幀的修正函數;m是該參考幀內劃分區域的個數;η為比例系數,用于調整宏塊速度特性和散亂度在修正函數H(i)中的占比。通常在視頻序列中有大量運動矢量為0的宏塊,因此相比于D(q),(q)的數值會偏小。當η過大時,會加重宏塊散亂度對H(p)的影響;當η過小時,會加重宏塊速度特性對H(p)的影響。H(p)能夠有效體現幀變化情況,是衡量幀變化的重要函數。本算法選擇合適的η使(q)和D(q)相對平衡,以保證視頻的視覺質量。
h)重復步驟a)~g)直至所有參考幀的H(p)計算完畢,將H(p)按照一定比例分成三份,按照從大到小排序為h(1)、h(2)、h(3)。
i)計算修正參數(k,j):
2 基于運動矢量的多直方圖構建
為提高嵌入容量,本文選擇基于運動矢量的二維直方圖進行信息嵌入,即將運動矢量的水平分量和垂直分量作為一個嵌入對,同時結合修正參數(k,j)將嵌入對分成18個互不重疊的集合A,對每個集合進行相應的修正即可嵌入信息。集合A為
其中:B1、B2分別為運動矢量的水平分量和垂直分量的4倍。
根據嵌入對所屬集合,在修正中盡可能多地嵌入秘密信息,修正過程為:
a)當(B1,B2)∈A1時,修正后嵌入對(B′1,B′2)為
其中:B′1和B′2分別表示修改后的運動矢量的水平分量和垂直分量的4倍,mt和mt+1分別表示第t位和第t+1位的秘密信息。
b)當(B1,B2)∈A2時,修正后嵌入對(B′1,B′2)為
c)當(B1,B2)∈A3時,修正后嵌入對(B′1,B′2)為
d)當(B1,B2)∈A4時,修正后嵌入對(B′1,B′2)為
e)當(B1,B2)∈A5時,修正后嵌入對(B′1,B′2)為
f)當(B1,B2)∈A6時,修正后嵌入對(B′1,B′2)為
g)當(B1,B2)∈A7時,修正后嵌入對(B′1,B′2)為
h)當(B1,B2)∈A8時,修正后嵌入對(B′1,B′2)為
i)當(B1,B2)∈A9時,修正后嵌入對(B′1,B′2)為
j)當(B1,B2)∈A10∪A11∪A12∪A13∪A14∪A15∪A16∪A17∪A18時,修正后嵌入對(B′1,B′2)為
其余的嵌入對保持不變,為保證信息提取和載體視頻的可逆性,僅對非特定幀的嵌入載體進行修正。算法可繪制成移位模式,如圖1所示。
移位模式圖中箭頭起點表示未修改的運動矢量,箭頭終點表示修改后的運動矢量,shift表示運動矢量只位移而不進行信息嵌入。
3 秘密信息的嵌入與提取
秘密信息的嵌入過程如下:
a)解碼H.264視頻,通過參考幀變換技術選擇輸入視頻的特定幀,并將幀劃分成M×M的區域。
b)通過式(1)(2)計算該區域內運動矢量大小的平均值(q)。
c)通過式(3)(4)計算區域內運動矢量方向角q的平均值θ(q)。
d)通過式(5)計算該區域內的運動矢量方向角q的方差D(q)。
e)直至所有參考幀的H(p)計算完畢,將H(p)按照一定比例分成三份,按照從大到小排序為h(1)、h(2)、h(3)。
f)通過式(7)計算修正參數(k,j)。
g)通過式(8)~(18)對非特定幀的嵌入對進行修正,完成信息嵌入。
h)直到所有信息嵌入后,將修改后的視頻進行H.264編碼。
信息嵌入流程如圖2所示。
秘密信息的提取是嵌入的逆過程,信息嵌入時通過參考幀變換技術在特定幀中計算修正參數,在非特定幀中修正嵌入對嵌入信息,嵌入對在修正過程中劃分的集合和位移方向均不重疊,確保了信息的提取和載體視頻的可逆性。
4 實驗結果與分析
本文采用MATLAB 2019進行仿真實驗。實驗選取了7段分辨率為176×144的YUV序列(foreman,mobile,carphone,salesman,coastguard,news,container)。實驗測試中,本文算法參考幀間隔設置為5,比例系數η取0.2,幀劃分區域M取16,H(p)按照3:1:1分成三份。采用與本文算法同類型的二維直方圖修正的文獻[9,10]算法進行對比。為客觀比較算法性能,采用與本文算法相同的參考幀設置,文獻[9]算法對DCT系數和運動矢量通用,將其嵌入位置由DCT系數改為運動矢量。
4.1 可逆性測試
峰值信噪比(peak signal noise ratio,PSNR)和結構相似性(structural similarity,SSIM)是當前最常用的圖像質量評價標準,本文通過對比原始視頻和提取信息并恢復的視頻的PSNR和SSIM測試可逆性。表1為兩者的PSNR和SSIM對比,本文算法下七個視頻序列的PSNR和SSIM最高恢復率均為100%,最低恢復率分別為99.5%和99.4%,平均恢復率均為99.7%,實驗結果中最低恢復率未到100%是由計算機的計算誤差引起,表明算法具有可逆性。
4.2 隱寫容量分析
文獻[9]中提出了兩種二維直方圖算法,一種使用直方圖的原點而另一種不使用,使用原點的算法較不使用原點的算法視頻失真較為嚴重,測試中取不使用原點的算法進行比較。表2為每段測試序列前200幀的嵌入容量,圖3為對比算法對全部視頻序列在不同幀數下的平均嵌入容量與本文算法進行對比。
從表2和圖3可以看出,本文算法在嵌入容量上要優于文獻[9]算法,低于文獻[10]算法。在coastguard視頻序列中本文算法嵌入容量約是文獻[9]算法嵌入容量的4倍,在除去coastguard視頻序列后平均嵌入容量較文獻[9]算法容量增加28.7%,較文獻[10]算法容量降低12.3%,平均增加8.2%。這是因為本文算法在直方圖設計上相較于文獻[9]算法更加集中于坐標原點,嵌入信息的運動矢量數量更多,且對水平的運動矢量有所偏重,所以對如存在大量由左向右水平運動的宏塊的coastguard視頻序列隱寫容量會顯著提高,而本文算法的直方圖與文獻[10]算法的直方圖性質相似,但為保障視頻質量減少了一些幀的運動矢量使用,降低了嵌入容量。
4.3 不可感知性分析
4.3.1 客觀分析
本文用ΔPSNR和ΔSSIM變化值評價視頻質量:
ΔPSNR=PSNRs-PSNRc(19)
ΔSSIM=SSIMS-SSIMC(20)
其中:PSNRs是原始視頻的PSNR值;PSNRc是嵌入信息后視頻的PSNR值;ΔPSNR越小代表嵌入信息后視頻的視覺質量越高;SSIMs是原始視頻的SSIM值;SSIMc是嵌入信息后的SSIM值;ΔSSIM越小代表嵌入信息后結構相似變化越小,視頻質量越高。
本文算法和對比算法均在滿嵌情況下進行。對比每段測試序列亮度分量幀的ΔPSNR和ΔSSIM平均值,測試結果如表3所示。
從表3中可以看出,隱寫后的ΔPSNR和ΔSSIM在大多數視頻中均低于文獻[9,10]所提算法,本文算法的ΔPSNR和ΔSSIM分別平均低于對比算法19.9%和17.5%,在視頻質量上具有更好的不可見性。
4.3.2 主觀分析
圖4所示為部分視頻序列的原始幀和隱寫后的對應幀在亮度分量上的對比。可以看出隱寫后的視頻幀在視覺上的失真幾乎是不可見的,本文算法在主觀感知上具有良好表現。
4.4 比特率分析
將秘密信息嵌入視頻序列后比特率的變化通常用于評估H.264編解碼器的編碼效率。本文通過ΔBR計算比特率的變化:
其中:BRs為嵌入秘密信息后視頻的比特率;BRc是原始視頻的比特率。
表4為本文算法和對比算法在不同視頻序列中嵌入信息后比特率的變化。從中可以看出,本文算法在大部分視頻上比特率變化都較低,平均比特率變化較對比算法降低了6.92%。
5 結束語
本文提出了一種基于運動矢量的多直方圖修正的視頻隱寫算法,該算法利用人眼視覺特性通過特定幀的速度特性和散亂度計算修正參數,并根據修正參數建立多個直方圖,最后在非特定幀中通過二維直方圖修正算法嵌入秘密信息。實驗表明該算法在保持較大嵌入容量下,在不可感知性和比特率變化上都具有較好表現。在下一步研究中,可進行更精細化的直方圖劃分,以獲得更為良好的性能。
參考文獻:
[1]Tew Y,Wong K.An overview of information hiding in H.264/AVC compressed video[J].IEEE Trans on Circuits and Systems for Video Technology,2014,24(2):305-319.
[2]Shi Yunqing,Li Xiaolong,Zhang Xinpeng,et al.Reversible data hi-ding:advances in the past two decades[J].IEEE Access,2016,4:3210-3237.
[3]Ou Bo,Zhao Yao.High capacity reversible data hiding based on multiple histograms modification[J].IEEE Trans on Circuits and Systems for Video Technology,2020,30(8):2329-2342.
[4]Ni Zhicheng,Shi Yunqing,Ansari N,et al.Reversible data hiding[J].IEEE Trans on Circuits and Systems for Video Technology,2006,16(3):354-362.
[5]Hong W,Chen T S,Shiu C W.Reversible data hiding for high quality images using modification of prediction errors[J].Journal of Systems and Software,2009,82(11):1833-1842.
[6]Efimushkina T,Egiazarian K,Gabbouj M.Rate-distortion based reversible watermarking for JPEG images with quality factors selection[C]//Proc of the 4th European Workshop on Visual Information Processing.Piscataway,NJ:IEEE Press,2013:94-99.
[7]Li Xiaolong,Yang Bin,Zeng Tieyong.Efficient reversible watermar-king based on adaptive prediction-error expansion and pixel selection[J].IEEE Trans on Image Processing,2011,20(12):3524-3533.
[8]李棟,馬雙棚,段妍羽,等.基于直方圖修正的H.264視頻加密域可逆信息隱藏[J].科學技術與工程,2019,19(2):126-130.(Li Dong,Ma Shuangpeng,Duan Yanyu,et al.Reversible data hiding for encrypted H.264 video based on histogram modification[J].Science Technology and Engineering,2019,19(2):126-130.)
[9]Xu Yuzhang,He Junhui.Two-dimensional histogram shifting-based reversible data hiding for H.264/AVC video[J].Applied Sciences,2020,10(10):3375-3393.
[10]Li Dong,Zhang Yingnan,Li Xinchao,et al.Two-dimensional histogram modification based reversible data hiding using motion vector for H.264[J].Multimedia Tools and Applications,2019,78(7):8167-8181.
[11]Zhao Juan,Li Zhitang.Reversible data hiding based on two-dimensional histogram shifting[C]//Proc of the 10th International Confe-rence on Software Engineering and Applications.[S.l.]:AIRCC Publishing Corporation Press,2021:53-69.
[12]Li Xiaolong,Zhang Weiming,Gui Xinlu,et al.Efficient reversible data hiding based on multiple histograms modification[J].IEEE Trans on Information Forensics and Security,2015,10(9):2016-2027.
[13]Wang Junxiang,Chen Xin,Ni Jiangqun,et al.Multiple histograms-based reversible data hiding:framework and realization[J].IEEE Trans on Circuits and Systems for Video Technology,2020,30(8):2313-2328.
[14]Chen Yanli,Zhou Limengnan,Zhou Yonghui,et al.Multiple histograms shifting-based video data hiding using compression sensing[J].IEEE Access,2021,10:699-707.
[15]Layek M A,Thai N Q,Hossain M A,et al.Performance analysis of H.264,H.265,VP9 and AV1 video encoders[C]//Proc of the 19th Asia-Pacific Network Operations and Management Symposium.Pisca-taway,NJ:IEEE Press,2017:322-325.
[16]Li Zhi,Chen Xiaowei.Self-adaptive video watermarking based on the motion characteristic detection and the model of entropy[C]//Proc of the 4th International Conference on Intelligent Information Hiding and Multimedia Signal Processing.Piscataway,NJ:IEEE Press,2008:845-848.
[17]Seshadrinathan K,Bovik A C.Motion tuned spatio-temporal quality assessment of natural videos[J].IEEE Trans on Image Proces-sing,2010,19(2):335-350.
[18]畢厚杰,王健.新一代視頻壓縮編碼標準:H.264/AVC[M].2版.北京:人民郵電出版社,2009:114-117.(Bi Houjie,Wang Jian.New generation video compression coding standard:H.264/AVC[M].2nd ed.Beijing:Posts amp; Telecom Press,2009:114-117.)