999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Office XML文檔信息隱藏方法

2017-10-23 02:16:23宇,施勇,薛
計算機技術與發展 2017年10期
關鍵詞:文本信息

郝 宇,施 勇,薛 質

(上海交通大學 電子信息與電氣工程學院,上海 200240)

OfficeXML文檔信息隱藏方法

郝 宇,施 勇,薛 質

(上海交通大學 電子信息與電氣工程學院,上海 200240)

隨著互聯網和通信技術的飛速發展,計算機網絡信息化等方面的發展對信息安全技術提出了越來越高的要求。電子文檔已成為儲存及傳送信息的最常用載體,計算機泄密問題隨之產生,且更具隱密性、潛伏性和危害性,同時也增加了失泄密問題預防難度。Office 2007文檔采用了一種新的默認文件格式,即Office Open XML格式,為在Office文檔中隱藏信息提供了新的思路。為此,結合Office文檔的自身特點和XML格式規范,提出了一種符合Office XML格式規范的信息隱藏方法。該方法針對DOCX、PPTX和XLSX三種不同類型格式文檔,匹配與格式相對應的特定屬性,選取或構建包含該屬性的XML段落,通過替換或構造特有的標識屬性值將隱秘信息嵌入目標文本載體中,以實現信息隱藏的目的。實驗結果表明,該方法使用文本容量大,安全性高,較好地解決了現有方法魯棒性不足的問題。

Office XML;信息隱藏;Excel XML;Word XML ;PowerPoint XML

0 引 言

隨著互聯網電子商務的迅速發展以及電子文檔的廣泛使用,對于涉及私密信息的電子文檔的保護顯得尤為重要。信息隱藏技術[1-3]是實現電子文檔保護的重要手段,目前已成為多媒體信息安全領域的一個重要部分。信息隱藏涉及的方面有很多,如圖像、音頻、視頻等,而且取得了較多研究成果。對于圖像、音頻、視頻,主要利用的是其載體的較大冗余性。與這些載體相比,文本信息的冗余空間非常有限,所以兼顧文本信息隱藏的安全性和魯棒性難度較高,導致文本信息隱藏技術的研究相對滯后。

Office文檔是目前在電子商務、電子政務中使用最為廣泛的文檔之一,因此利用Office文檔進行信息隱藏并實現追蹤文件的目的具有重大意義。針對不同用途,Office有三種主要的文檔格式,即Word,Excel和PowerPoint。目前已有學者提出通過修改Word中文本的字符大小或文本顏色來隱藏信息[4-10]。這些方法主要是針對Word文檔提出的。自Office 2007版起,Microsoft Office采用基于Office Open XML的文檔格式[11],因其可以通過多種方式訪問、降低文件損壞的風險等特點,已被越來越多的用戶使用。目前,已有一些學者針對此版本提出隱藏信息的方案[12-19]。

根據Office XML的特點,在分析Office Open XML文件的構造方法的基礎上,提出了一種適用于Word XML,Excel XML與PowerPoint XML三種文檔格式的信息隱藏方法,給出了相應的實現算法并對其進行了實驗驗證。

1 Office Open XML文件格式

自2007 Microsoft Office系統開始,Microsoft Office使用基于XML的文件格式,例如.docx、.xlsx和.pptx。這些格式和文件擴展名適用于Microsoft Word、Microsoft Excel和Microsoft PowerPoint。Office Open XML (Open XML)是一種國際認可的文件格式標準,Office軟件套件實施這種標準來保存和交換信息。Open XML遵循ECMA-376及ISO/IEC 29500標準,這意味著創建、編輯和保存Open XML文件等操作均需符合標準。Office Open XML格式使用Zip壓縮技術來存儲文檔,這種新的文件格式采用開放打包協議,整個文檔由一個壓縮的Zip包組成,同時減少了文檔的大小。而文件結構則以模塊形式進行組織,從而使文件中的不同數據組件彼此獨立。

圖1 Word XML文檔的層次化文件結構

圖1是一個只包含純文本的Word XML文檔。在該文檔包中,_rels文件夾存儲所有指定部件的關系部件主文檔document.xml;docProps文件夾包含應用程序的屬性部件;而word文件夾存儲著example.docx文件的核心數據。其中document.xml文件則是文件包的主文檔,其記載了Word XML文件的文字內容及其他相關屬性;[Content_Types].xml文件描述了出現在文件中的每個內容類型。PowerPoint XML和Excel XML的文檔包的層次化文件結構與圖1所示相似,其主文檔slide1.xml等文件和sheet1.xml等文件,分別保存在ppt/slides文件夾和xl/worksheets文件夾中。

2 基于“標識屬性”的信息隱藏方案

2.1標識屬性

基于XML的Office Open XML中,最基本的單位是元素,元素可以帶有若干個屬性及屬性值作為附加信息。無論是.docx、.pptx還是.xlsx格式的文件,元素的命名及其屬性值的定義都應遵循Open XML規范,同時每個元素也有其特定的意義及作用。

圖2是某Word XML文檔包中的document.xml文件,其根元素為元素w:document。

圖2 Word XML 主文檔document.xml示例

以w:sectPr元素為例,它定義了文檔最后一部分的屬性,并擁有兩個屬性:w:rsidR(Section Addition Revision ID)和 w:rsidSect(Section Properties Reversion ID)。在微軟官方公開文檔中表明:所有擁有相同值的rsid*屬性的區域均指向同一編輯會話期間。如圖2中w:p 與w:sectPr兩元素,其屬性w:rsidR的屬性值均為“00F04602”,這意味著這兩個元素的修改是在同一編輯會話內完成的。類似于w:rsidR這樣的屬性,稱之為“標識屬性”(Identifier Attribute)。“標識屬性”一般用于區分文本、表格等數據或屬性,其特點是擁有獨一無二且由系統隨機生成的屬性值,并且該屬性值與用戶及修改時間等無任何關系。經研究發現,Office XML各文檔格式中均含有“標識屬性”,研究結果舉例由表1所示。

表1 Office XML各文檔中“標識屬性”舉例

2.2信息隱藏方案

研究表明,對于標識屬性值的修改不會對文本內容造成影響。因此通過將待隱藏信息寫入其屬性值中,可以實現在Office XML文檔中隱藏信息的目的。為了保證安全性,可以先將待隱藏信息轉化為十六進制的Unicode碼,然后選擇加密算法將其進行加密,并添加校驗位以便于之后的隱藏信息提取工作。

對于Word XML中的w:rsidR屬性而言,其出現的次數及頻率較多,因此上述基于替換原有標識屬性屬性值的隱藏方案在Word XML中較易實現。但對于Excel XML和PowerPoint XML格式文檔,在一個簡單的文本文檔中,如x14:id和a:tableStyleId這樣的標識屬性可能不存在,這時則需要通過在特定位置構造Office Open XML元素嵌入隱藏信息。

在PowerPoint XML文件中,a:tableStyleId用于標識表格樣式。當某頁幻燈片中存在一個表格樣式的數據,則相應的slide.xml部件中則會記錄其a:tableStyleId屬性。同時在該文檔的tableStyles.xml部件中也會記錄下該表格樣式信息。tableStyles.xml部件用于記錄PowerPoint XML文檔在整個編輯過程中曾經使用過的表格樣式,無論這些表格樣式目前是否仍在使用。所以若利用替換原有屬性值的方法,則需要同時更新slide.xml與tableStyles.xml部件中的屬性值。若各個slide.xml部件中不存在a:tableStyleId屬性,可以在tableStyles.xml部件中進行添加以達到信息隱藏的目的。例如:待隱藏的已加密信息為“AAAAAAAA-1111-1111-1111-AAAAAAAAAAAA”,則可通過圖3的方式添加元素。圖3(a)中,a:tblStyleLst元素用于記錄表格樣式列表。因此,該方法通過對a:tblStyleLst元素添加子元素a:tblStyle即新的表格樣式來嵌入隱藏信息。值得注意的是,a:tblStyle本身擁有兩個屬性:styleId和styleName,分別用于記錄樣式標識和樣式名稱。而styleName不可省略,否則Office軟件系統會判定該構造元素(a:tblStyle)為無用元素并刪除,導致隱藏信息失敗。

圖3 PowerPoint XML文檔tableStyles.xml部件元素節點添加前后對比

在Excel XML文件中,x14:id 可用于標識條件格式規則(Conditional Formatting Rule)。如圖4所示,條件格式元素x14:cfRule由屬性值為“C5A286DA-8583-446B-B1AC-FC4211EE1663”的標識屬性id標識。圖4中extLst元素用于記錄擴展列表(extension list),且位于worksheet元素節點中,其子元素為ext用于標記擴展(extension)。因此,如果某Excel XML文檔中不存在標識屬性x14:id,同樣可通過在slide.xml部件中對其進行添加,從而實現信息隱藏的目的。

例如:待隱藏的已加密信息為“AAAAAAAA-1111-1111-1111-AAAAAAAAAAAA”,則可通過圖5的方式添加元素。與PowerPoint XML中的方法相比,在Excel XML中使用的方法略有不同,此方法將標識屬性x14:id構造為元素。這是因為在研究的測試中發現,若構造如圖4中所示的含有x14:cfRule元素的ex-tLst元素,則加密信息的魯棒性不能得到保障,加密文檔可以正常打開,但是Office軟件系統無法找到實際的條件規則與構造的x14:cfRule元素相關聯,因此使用文件過程中的任何修改都會導致加密信息的丟失。經研究發現,每個ext元素將uri屬性作為標識符來指示擴展的信息,同時其對于子元素則沒有具體要求。因此,可以通過構造符合已申明的XML命名空間(xmlns:x14)的子元素x14:id來隱藏加密信息,如圖5所示。

圖4 Excel XML文檔slide1.xml部件中的條件格式元素x14:cfRule

圖5 Excel XML文檔slide1.xml部件添加extLst元素

針對Office Open XML的三種不同格式文檔,采用如圖6所示的信息隱藏流程圖。通過在相應xml部件中替換或構造含有標記屬性特征的元素節點來達到信息隱藏的目的。

圖6 Office XML文檔信息隱藏流程

3 基于Office XML的信息隱藏算法

3.1信息嵌入算法

輸入:Office XML文檔T,待隱藏信息M,密鑰K。

輸出:載密文檔T'。

(1)判定文檔T的格式類型x(x∈{.docx,.pptx,.xlsx});

(2)將待隱藏信息M轉為16進制序列(組)S,長度由文檔格式x決定;

(3)對16進制序列(組)S通過密鑰K進行加密并添加校驗碼得到新的16進制序列(組)S';

(4)通過其文檔類型x,遍歷文檔中相對應的部件,尋找可隱藏S'的標記屬性值。結果與S'進行比較,替換或添加對應x格式的標記屬性元素;

(5)保存新文檔T',信息嵌入完畢。

3.2信息提取算法

輸入:載密Office XML文檔T',密鑰K。

輸出:載密信息M。

(1)判定載密文檔T'的格式類型x(x∈{.docx,.pptx,.xlsx});

(2)通過其文檔類型x,遍歷文檔中相對應的部件,遍歷標記屬性值,得到16進制序列組S';

(3)針對S'中每項序列進行校驗,判斷并通過密鑰K解密,得到序列組S;

(4)拼接序列組S,并轉換為字符,得到載密信息M,信息提取完畢。

3.3算法分析

實驗環境是Windows 8,OS X Yosemite,Microsoft Office 2016以及Eclipse 4.5。所使用的實驗文件是從Baidu上搜索并下載的一些Office XML文檔。下面從魯棒性、信息隱藏容量和隱蔽性方面進行分析。

(1)魯棒性:在各式文檔中,隱秘信息嵌入到標記屬性值中。經試驗測試,在Office系統軟件中,對加密文檔進行常用的各種格式設置和內容的添加刪減均不會造成隱秘信息的遺失,因此該算法魯棒性較強。但是若將含有隱密信息的Word文本段落整段刪除,或將含有隱秘信息的Excel整頁表格完全刪除,隱秘信息均會丟失。

(2)信息隱藏容量:針對PowerPoint XML及Excel XML格式文檔,一個標記屬性值允許隱藏長度為16字節即128比特的加密信息。而對于Word XML文檔,一個標記屬性值允許隱藏長度為4字節即32比特的加密信息。而對于一個大小3 MB左右的.docx格式文檔,其存在著大約300個w:rsidR屬性,即約1 200字節。由此可見,該算法擁有較大的信息隱藏容量。

(3)隱蔽性:通過實驗證明,在Office XML文檔中應用該算法,不會引起文檔顯示的任何改變,也不會影響文檔的正常使用。若只采用算法中的替換屬性值方案,則對文本大小不會產生任何改變,因此算法的隱蔽性較好。

4 結束語

為提高計算機電子文檔的安全性,解決計算機失泄密預防難題,提出了一種基于Office Open XML三種不同文檔格式的信息隱藏方法。通過對文檔格式進行深入的研究分析,在歸納總結替換或添加“標識屬性”的信息隱藏思路的基礎上,設計并實現了信息嵌入及提取算法。實驗結果表明,與以往的在Office文檔中通過修改文本顯示格式以隱藏信息的方法相比,該方法較好地解決了傳統方法魯棒性弱及信息隱藏容量較小等問題。隨著Office Open XML文檔的逐漸普及,今后的工作將主要集中于載密Office XML文檔格式轉換中載密信息保留的研究。

[1] 徐獻靈,崔 楠.信息隱藏技術及其應用[M].北京:科學出版社,2007.

[2] 吳樹峰,黃劉生,盧繼軍,等.信息隱藏技術及其攻擊方法[J].計算機科學,2003,30(2):92-96.

[3] Katzenbeisser S,Petitcolas A P F.信息隱藏技術:隱寫術與數字水印[M].北京:人民郵電出版社,2001.

[4] 劉玉玲,孫星明.通過改變文字大小在Word文檔中加載數字水印的設計與實現[J].計算機工程與應用,2005,41(12):110-112.

[5] 莫 佳.基于Word文本的信息隱藏系統的設計與實現[J].計算機應用與軟件,2009,26(12):278-281.

[6] 付 兵,肖小玲.一種基于Word文檔的高隱藏率水印算法[J].長江大學學報(自科版):理工卷,2007,4(2):55-57.

[7] Chandramouli R,Kharrazi M,Memon N.Image steganography and steganalysis:concepts and practice[C]//Proceedings of IDWD.[s.l.]:[s.n.],2015:35-49.

[8] Khan A,Siddiqa A,Munib S,et al.A recent survey of reversible watermarking techniques[J].Information Sciences,2014,279:251-272.

[9] Subhedar M S,Mankar V H.Current status and key issues in image steganography:a survey[J].Computer Science Review,2014,13:95-113.

[10] Murdoch S J,Lewis S.Embedding covert channels into TCP/IP[C]//International workshop on information hiding.Berlin:Springer,2005:247-261.

[11] Microsoft.Office (2007) Open XML 文件格式簡介[EB/OL].[2007-07-06].http://www.microsoft.com/china/msdn/library/office/office/OfficeOpen XMLFormats.mspx?mfr=true.

[12] Park B,Park J,Lee S.Data concealment and detection in Microsoft Office 2007 files[J].Digital Investigation,2009,5(3):104-114.

[13] Garfinkel S L,Migletz J J.The new XML office document files:implications for forensics[J].IEEE Security & Privacy,2009,7(2):38-44.

[14] 劉玉玲,萬 晶,辛國江.Excel2007文檔信息隱藏方法[J].計算機工程與應用,2010,46(28):70-72.

[15] 徐 敏,王衍波,李 濤.Word2007文檔信息隱藏的新方法[J].計算機研究與發展,2009,46:112-116.

[16] 吳 悠,孫星明.基于正弦波的Word文檔數字水印[J].計算機工程,2005,31(24):175-176.

[17] What’s up with all thosersids?[EB/OL].[2006-12-11].https://blogs.msdn.microsoft.com/brian_jones/2006/12/11/whats-up-with-all-those-rsids/.

[18] 耿建勇.XML安全技術的應用研究[D].北京:中國科學院研究生院(計算技術研究所),2005.

[19] Liu T Y,Tsai W H.A new steganographic method for data hiding Microsoft word documents by a change tracking technique[J].IEEE Transactions on Information Forensics and Security,2007,2(1):24-30.

OfficeXMLDocumentInformationHidingMethod

HAO Yu,SHI Yong,XUE Zhi

(School of Electronic Information and Electrical Engineering,Shanghai Jiaotong University, Shanghai 200240,China)

With the rapid development of Internet and communication technology,the computer network pays more and more attention in information,which also emphasizes the increasing importance of information security technology.Electronic documents have become the most commonly used carrier in information storage and transmission and thus the problem of computer file leakage has generated more hidden,latent and harmful properties than other classical methods,increasing the difficulty in prevention of leakage.Since a new default file format is introduced in Microsoft Office 2007 document,which is called Office Open XML format and provides a new ideas for information hiding in Excel documents.An information hiding method based on Office Open XML file format is proposed in investigation of features of Office documents and XML specifications.With different kinds of files,such as DOCX,PPTX and XLSX,it adopts different identifier attribute,which finds or creates a segment with this attribute to hide information by changing the attribute value.Experiment results show that it can hide large capacity information and thus is safety with high capacity and security,which has solved poor robustness of the existing methods.

Office Open XML;information hiding;Excel XML;Word XML;PowerPoint XML

TP301

A

1673-629X(2017)10-0096-05

2016-06-02

2016-10-10 < class="emphasis_bold">網絡出版時間

時間:2017-07-19

公安部信息網絡安全重點課題支持(C14612)

郝 宇(1991-),男,碩士,研究方向為網絡安全、大數據分析;施 勇,博士,講師,研究方向為網絡安全、網絡攻防;薛 質,博士,教授,研究方向為網絡安全、網絡攻防。

http://kns.cnki.net/kcms/detail/61.1450.TP.20170719.1107.002.html

10.3969/j.issn.1673-629X.2017.10.021

猜你喜歡
文本信息
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 国产麻豆91网在线看| 国产主播福利在线观看| 成人无码区免费视频网站蜜臀| 国内精自视频品线一二区| 欧美日本在线播放| 毛片视频网址| 中文字幕人成人乱码亚洲电影| 国产免费一级精品视频| 日韩高清在线观看不卡一区二区| 丁香婷婷激情网| 色婷婷电影网| 一级黄色片网| 久久一色本道亚洲| 性色一区| 人妻丰满熟妇AV无码区| 谁有在线观看日韩亚洲最新视频| 欧美成人日韩| 免费国产福利| 色综合热无码热国产| 国产免费黄| 国产人成在线视频| 成人夜夜嗨| 免费 国产 无码久久久| 欧美亚洲香蕉| 日韩精品高清自在线| 亚亚洲乱码一二三四区| 色丁丁毛片在线观看| 欧美日韩资源| 四虎成人在线视频| jijzzizz老师出水喷水喷出| 亚洲高清在线天堂精品| 91精品久久久无码中文字幕vr| 精品一区二区三区自慰喷水| 久久国产精品嫖妓| 青青草国产一区二区三区| 亚洲视频无码| 欧美另类图片视频无弹跳第一页| 91色在线观看| 国产成人精品亚洲77美色| 国产三区二区| 欧美激情视频二区| 亚洲精品免费网站| 伊大人香蕉久久网欧美| 人禽伦免费交视频网页播放| 亚洲国产欧美自拍| a毛片在线播放| 亚洲精品天堂在线观看| 欧美在线国产| 免费欧美一级| 无码国内精品人妻少妇蜜桃视频| 国产va在线观看| 国产成人无码AV在线播放动漫 | 亚洲第一页在线观看| 国产精品嫩草影院av | 91久久国产综合精品女同我| 美女毛片在线| 亚洲黄色激情网站| 人妻无码中文字幕一区二区三区| 99久久性生片| 亚洲精品福利视频| 国产精品亚洲精品爽爽| 中文国产成人精品久久| 中文字幕久久亚洲一区| 国产白浆在线观看| 国产成人a毛片在线| 亚洲国产天堂久久综合226114| 国产区人妖精品人妖精品视频| 成人在线观看一区| 亚洲AⅤ无码国产精品| 一级毛片中文字幕| 国产专区综合另类日韩一区| 日韩欧美国产综合| 精品国产成人国产在线| 九九九久久国产精品| 国产成人av一区二区三区| 亚洲码一区二区三区| 亚洲伊人电影| 国产成人精品优优av| 最新精品久久精品| 久久免费精品琪琪| 免费高清毛片| 国产成人1024精品|