999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PCA算法的HTML網(wǎng)頁(yè)篡改檢測(cè)定位系統(tǒng)

2014-08-25 01:52:26
關(guān)鍵詞:檢測(cè)信息方法

潘 敏

(湖北師范學(xué)院 現(xiàn)代信息技術(shù)中心,湖北 黃石 435002 )

基于PCA算法的HTML網(wǎng)頁(yè)篡改檢測(cè)定位系統(tǒng)

潘 敏

(湖北師范學(xué)院 現(xiàn)代信息技術(shù)中心,湖北 黃石 435002 )

提出了一種網(wǎng)頁(yè)篡改檢測(cè)定位的方法,該方法首次實(shí)現(xiàn)對(duì)目標(biāo)HTML網(wǎng)頁(yè)被篡改位置的定位。此方法將原始HTML網(wǎng)頁(yè)源代碼的每一列和每一行分別進(jìn)行PCA數(shù)字水印和ULC嵌入處理,通過(guò)對(duì)網(wǎng)頁(yè)源代碼行與列的計(jì)算結(jié)果和抽取出的認(rèn)證信息進(jìn)行比較,實(shí)現(xiàn)對(duì)目標(biāo)HTML網(wǎng)頁(yè)篡改范圍的定位。實(shí)驗(yàn)結(jié)果表明,該方法能檢測(cè)網(wǎng)頁(yè)篡改并較好地定位出篡改范圍。

網(wǎng)頁(yè)篡改;檢測(cè)定位;數(shù)字水印;PCA;ULC

0 引言

互聯(lián)網(wǎng)已經(jīng)成為人們信息獲取和信息交流不可或缺的工具。人們能通過(guò)互聯(lián)網(wǎng)發(fā)布自己的作品,傳遞重要信息等。但是,它在給人們帶來(lái)便利的同時(shí)也暴露出越來(lái)越嚴(yán)重的安全問(wèn)題,利用現(xiàn)有的技術(shù),網(wǎng)頁(yè)很容易被篡改,單純靠人眼很難判斷出網(wǎng)頁(yè)是否被篡改。網(wǎng)頁(yè)的真實(shí)性認(rèn)證和篡改檢測(cè)及定位變得越來(lái)越重要。傳統(tǒng)的基于散列函數(shù)的文件摘要技術(shù)是通過(guò)對(duì)網(wǎng)頁(yè)源文件進(jìn)行散列計(jì)算得出消息認(rèn)證碼,將消息認(rèn)證碼追加在預(yù)保護(hù)的網(wǎng)頁(yè)文件中,通過(guò)對(duì)預(yù)檢測(cè)網(wǎng)頁(yè)進(jìn)行抽取得到消息認(rèn)證碼,將得到的認(rèn)證碼與預(yù)檢測(cè)網(wǎng)頁(yè)生成的消息認(rèn)證碼進(jìn)行比對(duì)來(lái)判斷出網(wǎng)頁(yè)是否被篡改。然而在實(shí)際應(yīng)用中,這種方法往往會(huì)有諸多弊端,例如增加了文件的大小、消息認(rèn)證碼容易被發(fā)現(xiàn)等。數(shù)字水印技術(shù)是直接將消息認(rèn)證碼通過(guò)在行末加入空格、ULC或改變標(biāo)記的屬性的位置來(lái)嵌入到目標(biāo)網(wǎng)頁(yè)本身中,它不會(huì)改變網(wǎng)頁(yè)的功能、不增加文件的大小、容易嵌入和抽取。利用數(shù)字水印對(duì)網(wǎng)頁(yè)的真實(shí)性進(jìn)行認(rèn)證時(shí),通常是將網(wǎng)頁(yè)數(shù)據(jù)的消息認(rèn)證碼或數(shù)字簽名(稱(chēng)之為認(rèn)證信息)直接嵌入在網(wǎng)頁(yè)中。

數(shù)字水印解決了在文件加密后增加了文件的大小、消息認(rèn)證碼容易被發(fā)現(xiàn)的問(wèn)題,但是現(xiàn)有的基于網(wǎng)頁(yè)的數(shù)字水印方案只能實(shí)現(xiàn)真實(shí)性認(rèn)證,而無(wú)法實(shí)現(xiàn)對(duì)篡改位置的定位,其原因在于,消息認(rèn)證碼的獲取算法是逆向的,對(duì)預(yù)檢測(cè)的網(wǎng)頁(yè)中的消息只能判斷是否匹配而無(wú)法還原,即無(wú)法知道何處被篡改,從而無(wú)法定位。

經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),Lu Hong-tao等2007年在Pattern Recognition(模式識(shí)別)期刊第40卷1334-1341頁(yè)上發(fā)表的論文PCA-based Webpage Watermarking(基于PCA的網(wǎng)頁(yè)數(shù)字水印)中提出了一種基于PCA的網(wǎng)頁(yè)數(shù)字水印方案,該方案利用數(shù)字水印技術(shù)可實(shí)現(xiàn)對(duì)HTML網(wǎng)頁(yè)篡改的檢測(cè),其不足在于無(wú)法實(shí)現(xiàn)對(duì)篡改位置的定位。

本文的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提出一種HTML網(wǎng)頁(yè)篡改檢測(cè)與定位方法,使其在對(duì)預(yù)檢測(cè)的網(wǎng)頁(yè)篡改檢測(cè)的同時(shí)能定位出篡改的位置。這種方法的檢測(cè)是盲檢測(cè)(即不需要原有的網(wǎng)頁(yè))。由于這種方法不增加網(wǎng)頁(yè)文件的大小,不影響網(wǎng)頁(yè)文件的功能,同時(shí)由于增加了對(duì)算法的優(yōu)化,使得數(shù)字水印的嵌入、認(rèn)證和網(wǎng)頁(yè)篡改檢測(cè)與定位的運(yùn)算更為高效,可用于實(shí)時(shí)的網(wǎng)頁(yè)安全系統(tǒng)。本文主要用五個(gè)部分來(lái)詳細(xì)闡述基于PCA數(shù)字水印技術(shù)的網(wǎng)頁(yè)篡改檢測(cè)定位系統(tǒng):0.引言;1. 原始HTML網(wǎng)頁(yè)源代碼的預(yù)處理;2. 認(rèn)證信息的產(chǎn)生與嵌入;3. 認(rèn)證信息的提取和篡改檢測(cè)及定位4.對(duì)網(wǎng)頁(yè)篡改檢測(cè)定位方案給出更進(jìn)一步的研究方向。

1 原始HTML網(wǎng)頁(yè)源代碼的預(yù)處理

從HTML網(wǎng)頁(yè)源代碼中的一行(或一列)進(jìn)行字母、數(shù)字、基本符號(hào)的數(shù)值抽取分別得到相應(yīng)的一維數(shù)組,然后將產(chǎn)生的一維數(shù)組依次轉(zhuǎn)換成預(yù)處理的二維矩陣。

以前的技術(shù)對(duì)于預(yù)嵌入數(shù)字水印的網(wǎng)頁(yè)僅僅只提取字母,現(xiàn)在加入對(duì)數(shù)字和一些符號(hào)的提取,因?yàn)樵诰W(wǎng)頁(yè)中數(shù)字和符號(hào)的信息也是非常的重要。實(shí)現(xiàn)的方法如下:將源代碼的每一行中的大寫(xiě)和小寫(xiě)的英文字母按在源代碼中的順序提取出來(lái),然后將所有的字母、阿拉伯?dāng)?shù)字和一些基本符號(hào)轉(zhuǎn)換為數(shù)值,轉(zhuǎn)換規(guī)則為:‘A’和‘a(chǎn)’轉(zhuǎn)換為‘0’,‘B’和‘b’轉(zhuǎn)換為‘1’,‘C’和‘c’轉(zhuǎn)換為‘2’,…,‘Z’和‘z’轉(zhuǎn)換為25,‘0-9’轉(zhuǎn)換為‘26-35’,符號(hào)按ASCII碼表的位置排序后轉(zhuǎn)換為自己的序號(hào)加上35,這樣可以得到一行數(shù)值范圍為[0, 100]的一維數(shù)組。這些數(shù)值將參與數(shù)字水印的生成,從而實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)中的字母、數(shù)字、基本符號(hào)的全面保護(hù),實(shí)現(xiàn)對(duì)純英文網(wǎng)頁(yè)的全部支持。

需要處理的多個(gè)原始方陣Di來(lái)源于網(wǎng)頁(yè)源代碼中的一行或一列,而不是直接來(lái)源于整個(gè)源代碼,具體產(chǎn)生方法如下:

2 認(rèn)證信息的產(chǎn)生與嵌入

對(duì)產(chǎn)生的每個(gè)二維矩陣分別進(jìn)行卷積加密,然后利用PCA技術(shù)計(jì)算其用于真實(shí)性認(rèn)證的認(rèn)證碼,將每行和每列的認(rèn)證碼按照抽取的規(guī)則二位串接起來(lái),得到預(yù)嵌入的網(wǎng)頁(yè)真實(shí)性認(rèn)證信息即數(shù)字水印,采用ULC(Upper-lower coding)數(shù)字水印方法中的嵌入過(guò)程,逐行將認(rèn)證信息每二位分組嵌入到原始的HTML網(wǎng)頁(yè)源代碼每行中。具體實(shí)現(xiàn)步驟如下:

a)通過(guò)方陣Di(Di∈FR×R)與密鑰方陣K(K∈FN×N)的卷積得到方陣I.

I=Di?K,I∈F(R+N-1)×(R+N-1)

(1)

(2)

(3)

c)將V進(jìn)行特征值分解得到特征值λ1,λ2,…,λR+N-1λ和特征向量u1,u2,…,uR+N-1.其中λ1,λ2,…,λR+N-1是按照從大到小的順序排列即λ1≥λ2≥…≥λR+N-1.

V=ULU-1

(4)

d)求出滿足下列不等式的最小x.

(5)

e)得到預(yù)處理的水印Zi,其中Zi是由x個(gè)元素組成的一維向量。

(6)

f)將Zi的每個(gè)元素依次分別轉(zhuǎn)換成二進(jìn)制數(shù)再連接起來(lái)得到一個(gè)二進(jìn)制水印Wi,則可以得到WDi.

WDi=W1W2W3…WR+N-1

(7)

數(shù)字水印依次按每行嵌入,將預(yù)嵌入數(shù)字水印的標(biāo)簽依次按兩個(gè)分為一組,通過(guò)PCA算法得到該分組標(biāo)簽所在行所對(duì)應(yīng)的數(shù)字水印(其中兩個(gè)標(biāo)簽對(duì)應(yīng)一個(gè)數(shù)字水印單位,當(dāng)數(shù)字水印的長(zhǎng)度不夠時(shí)循環(huán)復(fù)制即可),然后得到該分組中第二個(gè)標(biāo)簽所在列所對(duì)應(yīng)的數(shù)字水印,將得到的兩個(gè)水印依次通過(guò)ULC方法嵌入到這組標(biāo)簽中,對(duì)于每行每組標(biāo)簽都按同樣的方法嵌入數(shù)字水印,最終我們得到嵌入后的網(wǎng)頁(yè),至此整個(gè)網(wǎng)頁(yè)的數(shù)字水印嵌入完成。認(rèn)證信息的產(chǎn)生與嵌入過(guò)程如下圖1所示。

3 認(rèn)證信息的提取和篡改檢測(cè)及定位

認(rèn)證信息的提取和篡改檢測(cè)及定位。采用ULC數(shù)字水印方法中的提取和恢復(fù)過(guò)程,逐行每二位分組將數(shù)字水印從預(yù)檢測(cè)的HTML網(wǎng)頁(yè)中提取出來(lái),對(duì)提取出來(lái)的數(shù)字水印進(jìn)行認(rèn)證信息重構(gòu),同時(shí)對(duì)預(yù)檢測(cè)的HTML網(wǎng)頁(yè)采用步驟一和步驟二的方法產(chǎn)生認(rèn)證信息。對(duì)提取的認(rèn)證信息和生成的認(rèn)證信息中的認(rèn)證碼進(jìn)行逐行逐列比較,如果兩個(gè)認(rèn)證碼完全匹配,則表示該認(rèn)證碼所對(duì)應(yīng)的原始網(wǎng)頁(yè)單元數(shù)據(jù)沒(méi)有被篡改;否則表示該單元的數(shù)據(jù)已被篡改,將認(rèn)證碼不同的行列一一標(biāo)示出來(lái),直到所有的認(rèn)證信息比較完畢。

認(rèn)證信息的提取和篡改檢測(cè)與定位實(shí)現(xiàn)過(guò)程是:首先對(duì)目標(biāo)網(wǎng)頁(yè)中的標(biāo)簽字母的大小寫(xiě)進(jìn)行逐行掃描,如果被掃描的標(biāo)簽為大寫(xiě)的話,則得到“1”,否則得到“0”;這樣可以得到一個(gè)元素為“1”或者“0”的二維矩陣P,同時(shí)將目標(biāo)網(wǎng)頁(yè)采用本方案中的數(shù)字水印生成方法(基于PCA技術(shù)的數(shù)字水印生成方法)產(chǎn)生預(yù)嵌入的數(shù)字水印二維矩陣P'(P'的大小與P是匹配的),將P與P'中的元素(“1”或者“0”)進(jìn)行比對(duì),如果P'與P相同則表示目標(biāo)網(wǎng)頁(yè)沒(méi)有被篡改,否則把在兩者中位置相同而元素的值不同的行列坐標(biāo)標(biāo)示出來(lái),那么這些被標(biāo)示出來(lái)的行列的坐標(biāo)就是目標(biāo)網(wǎng)頁(yè)被篡改的位置。篡改檢測(cè)及定位過(guò)程如圖2所示:

圖1 認(rèn)證信息的產(chǎn)生與嵌入過(guò)程

圖2 篡改檢測(cè)及定位過(guò)程

4 對(duì)網(wǎng)頁(yè)篡改檢測(cè)定位方案給出更進(jìn)一步的研究方向

本文在對(duì)嵌入數(shù)字水印的網(wǎng)頁(yè)定位出篡改范圍這個(gè)方面有很大的突破,但是對(duì)于達(dá)到精確的定位還有些距離,則需要對(duì)標(biāo)簽的嵌入策略的改進(jìn)進(jìn)行深入的研究,其中采用對(duì)預(yù)嵌入水印的更好編碼顯得非常重要。再者,作為密鑰的簡(jiǎn)單的二維矩陣該如何選擇,或者說(shuō)該矩陣的元素采用哪種策略產(chǎn)生以便適應(yīng)更大范圍的網(wǎng)頁(yè)將平均的運(yùn)算時(shí)間和空間降到最低,這方面還需要進(jìn)一步的思考。最后,如何將源代碼中的中文進(jìn)行編碼來(lái)生成水印以達(dá)到對(duì)含有中文的HTML進(jìn)行支持,這點(diǎn)也是下一步所要完善的。

[1]Yang Huijuan, KotA C. Text document authentication by integrating inter character and word spaces watermarking [C] Proceedings of IEEE International Conference on Multimedia and Expo, ICME2004. Taipei China, 2004, 2: 955~958.

[2]Zhao Qijun, Lu Hongtao.PCA-based web page watermarking[J]. Pattern Recognition Society, 2007, 40(4): 1334~1341.

[3]Gong Shaogang,Mckenna Stephen J,Alexand ra Psarrou. Dynamic vision: From Images to Face Recognition[J]. Imperial College Press, 2000, 14(6):619~621.

[4]Brassil J, Low S, Maxemchuk N F. Copyright protection for the electronic distribution of text documents[J].Proceedings of the IEEE, 1999, 87(7): 1181~1196.

[5]李慶城,李璦琿.網(wǎng)絡(luò)出版中版權(quán)保護(hù)技術(shù)-文本水印的研究[J].計(jì)算機(jī)工程與應(yīng)用, 2004,(18):163~211.

WebpagepositioningtampereddetectionandlocationsystembasedonPCAdigitalwatermarking

PAN Min

(Modern Information Technology Center,Hubei Normal University,Huangshi 435002,China)

In this paper,a method of detecting and locating a tampered web is proposed, this method realize for the first time the location of the target HTML page tampered. PCA digital watermarking and ULC embedding are separately executed for each column and each row of the original HTML page source code , by comparing the calculation results of web page source code row and column with extracted authentication information, to locate the range of the target HTML page tampered. Experiments show, tampered web is detected and the range of tampered web is located well in this method.

website tampered; detection location; digital watermark; PCA ; ULC

2014—03—10

湖北省教育廳人文社科項(xiàng)目(2012G140)

潘敏(1984— ),男,湖北荊門(mén)人,助理實(shí)驗(yàn)師,研究生,主要研究方向?yàn)樾畔踩?shù)字水印.

TP309.7

A

1009-2714(2014)04- 0021- 04

10.3969/j.issn.1009-2714.2014.04.005

猜你喜歡
檢測(cè)信息方法
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
小波變換在PCB缺陷檢測(cè)中的應(yīng)用
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚(yú)
展會(huì)信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 亚洲天堂久久| 亚洲成a人片| 日韩第一页在线| 2020国产精品视频| 伊人丁香五月天久久综合| 国产毛片一区| 国产精品久久久精品三级| 99热最新网址| 欧美日韩综合网| 亚洲Va中文字幕久久一区| 四虎亚洲国产成人久久精品| 久久国产免费观看| 日韩AV无码免费一二三区| 99热国产在线精品99| 久久99国产综合精品1| 2021精品国产自在现线看| 国产精品99一区不卡| 老司机精品99在线播放| 一区二区三区四区在线| 国产成人精品免费av| 久久国产精品77777| 精品久久777| 亚洲经典在线中文字幕 | 久热这里只有精品6| 欧美日一级片| 高清亚洲欧美在线看| 午夜限制老子影院888| 国产尤物jk自慰制服喷水| 丁香婷婷激情网| 国产一区二区三区日韩精品| 日本欧美成人免费| 国产精品综合久久久 | 青青国产在线| 成年人免费国产视频| 热99精品视频| 一本久道久久综合多人| 91免费片| 激情亚洲天堂| 午夜日b视频| 亚洲国产成人精品青青草原| 中文字幕亚洲精品2页| 91最新精品视频发布页| 性喷潮久久久久久久久| 91亚洲国产视频| 伊人久久综在合线亚洲91| 久久亚洲美女精品国产精品| 亚洲欧美不卡视频| 亚洲欧洲天堂色AV| 国产日韩精品一区在线不卡| 国产美女91视频| 亚洲中文字幕在线一区播放| 久久成人免费| 国产麻豆aⅴ精品无码| 欧美一区精品| 999国产精品| 国产青榴视频在线观看网站| 亚洲最猛黑人xxxx黑人猛交| 全免费a级毛片免费看不卡| 欧美五月婷婷| 欧美激情视频在线观看一区| 亚洲Av激情网五月天| 亚洲床戏一区| 欧美日韩一区二区三区四区在线观看 | 伊人久久综在合线亚洲2019| 精品国产一二三区| 午夜视频在线观看免费网站| 熟妇丰满人妻av无码区| 久草青青在线视频| 日韩专区欧美| 国产精品区网红主播在线观看| 久久精品欧美一区二区| 欧美不卡在线视频| 91精品情国产情侣高潮对白蜜| 中文字幕乱码二三区免费| 国产视频 第一页| 伊人中文网| 久久性视频| 激情视频综合网| 蜜芽国产尤物av尤物在线看| 亚洲一区免费看| 91娇喘视频| 亚洲AV无码久久天堂|