999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

快速排除網(wǎng)站CMS系統(tǒng)中可疑URL地址的實現(xiàn)

2020-06-19 04:09:22玉易鄧學彥
視聽 2020年6期
關(guān)鍵詞:利用方法

□ 玉易 鄧學彥

一、引言

隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和廣泛應用,網(wǎng)絡安全問題也變得越來越嚴重。在日常的網(wǎng)站維護和安全管理中,網(wǎng)站版本每次上線或例行代碼變更時,網(wǎng)站運維人員都必須對網(wǎng)站數(shù)據(jù)進行排查,但網(wǎng)站CMS系統(tǒng)中網(wǎng)頁數(shù)據(jù)量巨大,無法人工一一查看。為提高網(wǎng)站運維人員的工作效率,我們利用Python語言中正則表達式和去重算法編寫程序,對網(wǎng)站CMS系統(tǒng)引用的URL地址進行快速統(tǒng)計,查找可疑地址,排除了風險隱患。

Python是一種高級編程語言,采用解釋運行的方式,編寫后無需編譯即可直接通過解釋器執(zhí)行,編程效率極高,在各編程語言中位居前列。正則表達式是內(nèi)嵌在Python中的編程語言,通過re模塊實現(xiàn),基本功能是匹配、替換和提取。構(gòu)造正則表達式,是通過將元字符與普通字符按各種方式結(jié)合在一起,用事先定義好的規(guī)則來匹配或捕獲那些符合某個模式的文本。正則表達式的形式為/匹配模式/,其中位于定界符之間的部分就是將要在目標對象中進行匹配的模式①。

二、去重算法簡介

利用正則表達式匹配出網(wǎng)站CMS系統(tǒng)引用的URL地址列表數(shù)據(jù)是包含重復信息的,因此需要對其進行去重處理。實現(xiàn)去重的算法常見有如下幾種。

(一)利用字典的fromkeys()和keys()方法②

Python中的字典數(shù)字類型是可變?nèi)萜髂P停艽鎯θ我忸愋蛯ο蟆W值涞拿總€鍵值對用冒號分割,每個對之間用逗號分割,整個字典包括在花括號中。字典的鍵必須是唯一的,但字典的值不必是唯一,可以取任何數(shù)據(jù)類型。字典格式為:Dict1={key1 :value1,key2 :value2}。

1.Python字典fromkeys()函數(shù)用于創(chuàng)建一個新字典,語法為 dict.fromkeys(seq[,value]),其中,seq 為字典鍵值列表,value為可選參數(shù)。用fromkeys()方法去重可得到一個字典實例,去重之后創(chuàng)建了一個以源列表元素為鍵,值為 None的新字典(Dict):

unique_urls=[]

unique_urls.extend({}.fromkeys(total_urls).keys())

2.Python字典keys()函數(shù)以列表返回一個字典所有的鍵,語法為dict.keys(),dict.keys()函數(shù)返回的是一個字典所有的鍵。利用該方法去重能重新創(chuàng)建一個新列表實例,得到去除重復數(shù)據(jù)后的列表。

(二)利用set集合進行去重

在Python中集合有去重的功能,即把一個有重復元素的列表或元組等數(shù)據(jù)類型轉(zhuǎn)變成集合時,其中的重復元素只出現(xiàn)一次,使用set()方法③。舉例如下:使total_urls,unique_urls分別為含有重復元素的列表和元組,使用set()方法后可轉(zhuǎn)變成不含重復元素的集合類型。

unique_urls=set(total_urls)

unique_urls=list(unique_urls)

(三)利用for循環(huán)和in條件判斷去重

在python中,可使用關(guān)鍵字in來判斷特定的值是否存在列表中,使用關(guān)鍵字not in來判斷特定的值不存在列表中。此外,for循環(huán)和關(guān)鍵字in還可遍歷整個list列表,逐一判斷其中元素的唯一性。

經(jīng)過速度對比測試,我們選用keys()方法來進行去重。

三、實現(xiàn)

(一)實現(xiàn)步驟

第一步:創(chuàng)建本地文件夾,用于存放數(shù)據(jù)庫備份文件和導出文件;

第二步:加載數(shù)據(jù)庫導出SQL文件;

e.compile(r'https?://(?:[-w.]|(?:%[da-fA-F]{2}))+');

第三步:統(tǒng)計數(shù)據(jù)庫內(nèi)所有URL出處;

第四步:list列表到dict字典之間互相轉(zhuǎn)換,利用字典key的唯一性去掉了重復的URL地址,將結(jié)果保存至桌面;

第五步:查找可疑的URL地址,越不規(guī)則的URL越可疑。

(二)程序設計(如下圖)

四、結(jié)語

本文通過使用Python編寫程序?qū)W(wǎng)站CMS系統(tǒng)引用的URL進行快速安全排查,利用了正則表達式快速準確的匹配、替換和提取等功能以及去重算法,在實際使用中顯著提高了網(wǎng)站運維人員日常巡檢的工作質(zhì)量和效率,有力保障了網(wǎng)站的安全。

注釋:

①張靜,張妍.正則表達式及其在信息抽取中的應用[J].電腦知識與技術(shù),2009(15):3867-3868.

②花田半畝2091.Python列表的去重方式[EB/OL].博客園,2020-04-02.https://www.cnblogs.com/longyuu/p/10033820.html.

③Allen-Liu.Python中的集合類型及其操作[EB/OL]CSDN,2017 -07 -27.https://blog.csdn.net/bbc955625132551/article/details/76169197.

猜你喜歡
利用方法
利用min{a,b}的積分表示解決一類絕對值不等式
利用倒推破難點
利用一半進行移多補少
學習方法
利用數(shù)的分解來思考
Roommate is necessary when far away from home
利用
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 久久国产乱子| 欧美中文字幕第一页线路一 | 久久91精品牛牛| 天天综合网色| 色噜噜在线观看| 一级香蕉视频在线观看| 五月天综合婷婷| 一级成人a毛片免费播放| 永久免费无码成人网站| 欧美成人午夜影院| 国产在线观看精品| 欧美日韩理论| 91精品国产一区自在线拍| 亚洲日本韩在线观看| 亚洲天堂久久新| 免费人成视网站在线不卡| 青草视频在线观看国产| 欧美成人免费午夜全| 精品五夜婷香蕉国产线看观看| 99热这里只有精品免费国产| 国产91蝌蚪窝| 2020国产免费久久精品99| 99爱在线| 欧美三级日韩三级| 国产乱子伦精品视频| 青青青视频蜜桃一区二区| 午夜天堂视频| 国产成人a毛片在线| 国产日韩欧美精品区性色| 欧美人在线一区二区三区| 精品亚洲欧美中文字幕在线看| 免费女人18毛片a级毛片视频| 一区二区三区毛片无码| 精品伊人久久久香线蕉| 亚洲欧洲日韩久久狠狠爱| 欧洲一区二区三区无码| 在线精品亚洲一区二区古装| 中文字幕调教一区二区视频| 青青青国产免费线在| 国产麻豆91网在线看| 日韩美毛片| 九九久久精品国产av片囯产区| 91九色最新地址| 日韩欧美中文字幕一本| 国产精品人成在线播放| 国产成人综合网| 在线观看无码av免费不卡网站| 五月婷婷亚洲综合| 久久semm亚洲国产| 毛片一区二区在线看| 午夜影院a级片| 国产激爽大片高清在线观看| 日韩欧美高清视频| 亚州AV秘 一区二区三区| 99在线视频免费| 毛片久久网站小视频| 成人在线观看一区| 亚洲精品第一在线观看视频| 国产91丝袜| 国产精品极品美女自在线| 色偷偷男人的天堂亚洲av| 久草美女视频| 国产成人高清精品免费| 国产第一页免费浮力影院| 不卡无码网| 日韩精品资源| 高清无码手机在线观看| 欧美精品v| 亚洲精品片911| 亚洲成人高清无码| 国产精品白浆在线播放| 老司机午夜精品网站在线观看| 欧美日韩中文国产va另类| 久久精品最新免费国产成人| 国产欧美又粗又猛又爽老| 青青青视频免费一区二区| 国产一级毛片高清完整视频版| 国产呦精品一区二区三区网站| 国产H片无码不卡在线视频| 久久成人免费| 在线看片国产| 国产精品9|