999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

敏感數(shù)據(jù)發(fā)現(xiàn)方法的研究與實(shí)現(xiàn)

2019-12-16 02:54:26中國移動通信集團(tuán)重慶有限公司鄧秘密楊翔趙立農(nóng)龍濤
網(wǎng)絡(luò)安全和信息化 2019年12期
關(guān)鍵詞:頁面數(shù)據(jù)庫檢測

中國移動通信集團(tuán)重慶有限公司 鄧秘密 楊翔 趙立農(nóng) 龍濤

隨著互聯(lián)網(wǎng)的迅速發(fā)展,數(shù)據(jù)安全問題引發(fā)了全民的廣泛關(guān)注,個人信息及敏感信息泄露的安全事件,可能引發(fā)嚴(yán)重的網(wǎng)絡(luò)犯罪。

本文針對敏感數(shù)據(jù)的發(fā)現(xiàn)方法進(jìn)行研究,通過頁面采集識別方式、流量內(nèi)容解析方式和多種識別策略實(shí)現(xiàn)對敏感數(shù)據(jù)的發(fā)現(xiàn)。

頁面采集識別方式

通過分析數(shù)據(jù)庫、文件夾和文件中的數(shù)據(jù),分析其中的敏感數(shù)據(jù)匹配度,以得到敏感數(shù)據(jù)資產(chǎn),如圖1 所示。

1.數(shù)據(jù)層資產(chǎn)頁面采集識別工具功能架構(gòu)

本方案采用數(shù)據(jù)資產(chǎn)頁面采集識別工具對數(shù)據(jù)庫、主機(jī)載體承載的數(shù)據(jù)資產(chǎn)實(shí)現(xiàn)自動采集,其功能架構(gòu)如圖2 所示。

圖1 頁面采集識別方式

圖2 頁面采集識別工具功能架構(gòu)圖

該采集識別工具采用松耦合、高內(nèi)聚的方式設(shè)計,分為四套引擎。

數(shù)據(jù)資產(chǎn)建模引擎:構(gòu)建全網(wǎng)資源安全特征模型,基于元數(shù)據(jù)建模方法,構(gòu)建了安全資源模型體系,通過類型維護(hù)、屬性維護(hù)和子對象維護(hù)三個子模塊,實(shí)現(xiàn)任意資源模型的自定義建模。

任務(wù)調(diào)度引擎:實(shí)現(xiàn)數(shù)據(jù)庫表結(jié)構(gòu)遍歷的多樣化調(diào)度,支持按秒、分、小時、天、周、月、年的細(xì)粒度周期性任務(wù)調(diào)度功能,同時支持多個離散時間點(diǎn)的任務(wù)調(diào)度。

配置采集引擎:實(shí)現(xiàn)基于設(shè)備類型的資源配置采集服務(wù),實(shí)現(xiàn)自動在線檢查和半自動離線檢查采集方式,通過多樣化的采集手段支撐數(shù)據(jù)采集。

資產(chǎn)分析引擎:突破傳統(tǒng)的不可修改分析規(guī)則的固化分析模式,解析方式支持正則表達(dá)式和解析類,判斷方法支持等于、大于等于、存在、包含等10 類判斷邏輯。

2.數(shù)據(jù)庫載體的敏感數(shù)據(jù)識別

數(shù)據(jù)資產(chǎn)頁面采集識別工具在檢測到數(shù)據(jù)庫表結(jié)構(gòu)時,首先分析數(shù)據(jù)庫表的字段組成,查找出敏感字段(比如手機(jī)號碼),檢測時可設(shè)置策略,只針對該敏感字段進(jìn)行檢測。一旦發(fā)現(xiàn)新增數(shù)據(jù)中包含敏感數(shù)據(jù)字段類型(比如檢測到某數(shù)據(jù)庫表新增了1000 行數(shù)據(jù),且手機(jī)號碼字段有139 字樣的11 位數(shù)字;或者檢測到新增文件中有身份證號字樣,且該字段是由x 結(jié)尾的18 位數(shù)字),數(shù)據(jù)資產(chǎn)頁面采集識別工具將采集新增的數(shù)據(jù),發(fā)送至系統(tǒng)管理員,由其根據(jù)敏感數(shù)據(jù)識別策略確認(rèn)是否為新增的敏感數(shù)據(jù),若是,采集識別工具將其格式化,并確定為敏感數(shù)據(jù)資產(chǎn)類型。

3.主機(jī)載體的敏感數(shù)據(jù)識別

圖3 流量內(nèi)容解析方式

圖4 日志流量采集識別流程圖

數(shù)據(jù)資產(chǎn)頁面采集識別工具檢測到新增的目錄或文件時,首先分析目錄名或文件名的組成,然后數(shù)據(jù)資產(chǎn)頁面采集識別工具遍歷文件內(nèi)容,查找出敏感字段(比如手機(jī)號碼),檢測時可設(shè)置策略,只針對該敏感字段檢測。一旦發(fā)現(xiàn)新增的數(shù)據(jù)中包含敏感數(shù)據(jù)字段類型(比如檢測到某新增文件中有手機(jī)號碼字樣,并且手機(jī)號碼字段有139 字樣的11 位數(shù)字;或者檢測到新增文件中有身份證號字樣,且該字段是由x結(jié)尾的18 位數(shù)字),數(shù)據(jù)資產(chǎn)頁面采集識別工具將采集新增的文件,發(fā)送至系統(tǒng)管理員,由其根據(jù)敏感數(shù)據(jù)識別策略確認(rèn)是否為新增的敏感數(shù)據(jù),若是,采集識別工具將其格式化,并確定為敏感數(shù)據(jù)資產(chǎn)類型。

應(yīng)用日志流量采集識別方式

利用應(yīng)用日志流量分析技術(shù),通過在應(yīng)用前臺的網(wǎng)絡(luò)必達(dá)通路上部署嗅探設(shè)備,分析應(yīng)用前臺的應(yīng)用流量日志,識別敏感數(shù)據(jù),如圖3 所示。

本方案作為對數(shù)據(jù)庫后臺敏感數(shù)據(jù)采集的補(bǔ)充,針對前臺應(yīng)用采用流量嗅探的方式主動抓取Web 應(yīng)用的流量,通過對HTTP 協(xié)議的解析,還原業(yè)務(wù)訪問流量,從中分析敏感數(shù)據(jù)生成和訪問情況。

本功能針對業(yè)務(wù)系統(tǒng)產(chǎn)生的所有HTTP 流量,均納入采集范疇,實(shí)現(xiàn)采集任務(wù)的全程管理,如圖4 所示。

對業(yè)務(wù)系統(tǒng)所有流量進(jìn)行嗅探,識別Web 應(yīng)用的HTTP流量,丟棄其他協(xié)議流量。

制定采集策略,根據(jù)源地址、目的地址、目的端口等過濾條件抓包。

還原出的協(xié)議信息主要包括:請求方法、請求URL、重要的請求頭域(如Cookie、Host、Referer 和 User-Agent)、請求消息體(POST 數(shù)據(jù))、響應(yīng)狀態(tài)碼、重要響應(yīng)頭域(如Content-Type)、響應(yīng)消息體(應(yīng)答頁面)。

敏感數(shù)據(jù)檢測識別策略

1.基于指紋比對的識別策略

通過指紋對比對存量文件敏感資產(chǎn)的變動情況進(jìn)行識別。基于已識別敏感數(shù)據(jù)的指紋(散列數(shù)據(jù)),與發(fā)現(xiàn)數(shù)據(jù)進(jìn)行二進(jìn)制內(nèi)容比對,確認(rèn)發(fā)現(xiàn)數(shù)據(jù)是否屬于敏感數(shù)據(jù)。

本產(chǎn)品計算指紋時可選擇使用國際通用SHA-1 算法和國家密碼管理局編制的SM3 算法。當(dāng)定期掃描存量敏感資產(chǎn)的變化時,先用文件指紋與待掃描文件指紋對比,將有變化的再通過其他掃描手段掃描差異,并更新指紋信息。

2.基于數(shù)據(jù)屬性復(fù)雜組合的識別策略

(1)數(shù)據(jù)屬性管理

支持基于多個關(guān)鍵字、正則表達(dá)式和數(shù)據(jù)屬性判定的復(fù)雜組合內(nèi)容發(fā)現(xiàn),提高內(nèi)容發(fā)現(xiàn)的準(zhǔn)確性。在組合內(nèi)容發(fā)現(xiàn)中引入評分計算概念:當(dāng)組合中的一條識別特征規(guī)則在待分類數(shù)據(jù)中命中時,會獲得一個與這條識別特殊規(guī)則對應(yīng)的分?jǐn)?shù),當(dāng)獲得分?jǐn)?shù)總和超過預(yù)先定義的閾值,引擎將此數(shù)據(jù)判定為敏感數(shù)據(jù)。

(2)敏感內(nèi)容分析

引擎引入負(fù)分規(guī)則,用戶在規(guī)則組中添加不應(yīng)出現(xiàn)此分類中的識別特征,當(dāng)其被命中時,系統(tǒng)給予負(fù)分,降低待分類數(shù)據(jù)的總分,減少誤報可能性。

例如,經(jīng)分統(tǒng)計分析報告數(shù)據(jù)分類內(nèi)容發(fā)現(xiàn)過程中,待分類數(shù)據(jù)中出現(xiàn)“客戶手機(jī)號碼”時,系統(tǒng)給該數(shù)據(jù)加分,如待分類數(shù)據(jù)中出現(xiàn)“客戶”“資料”時,系統(tǒng)進(jìn)行減分。

還可設(shè)置識別特征至少出現(xiàn)次數(shù)及是否必須出現(xiàn)等屬性,例如,內(nèi)容發(fā)現(xiàn)規(guī)則組中設(shè)置識別特征身份證出現(xiàn)5 次以上才會命中,當(dāng)待分類數(shù)據(jù)中只出現(xiàn)了1 次身份證號,系統(tǒng)判定此規(guī)則沒有命中。

3.基于自然語言處理的識別策略

系統(tǒng)先通過模型訓(xùn)練方式訓(xùn)練相關(guān)模型作為系統(tǒng)初始信息,然后定義自然語言識別的敏感規(guī)則,再建立識別任務(wù),通過識別規(guī)則對文件中文內(nèi)容進(jìn)行識別并輸出敏感識別結(jié)果,結(jié)合業(yè)務(wù)分析進(jìn)一步處理。

傳統(tǒng)的機(jī)器學(xué)習(xí)模型如KNN、SVM、Naive Bayes、決策樹、GBDT、K-means 等,需 注意其過擬合、欠擬合問題,且上線之前要對訓(xùn)練好的模型進(jìn)行評估,讓模型對語料具備較好的泛化能力。

【例:中文文本K-means 聚類分析】

1.使用k-means++初始化模型,也可以選擇隨機(jī)初始 化,即“init="random"”,通過PCA 降維把權(quán)重weight降到10 維,進(jìn)行聚類模型訓(xùn)練。

2.定義聚類結(jié)果可視化函數(shù)plot_cluster(result,newData,numClass),包 含3個參數(shù),其中result 表示聚類擬合的結(jié)果集;newData 表示權(quán)重weight 降維的結(jié)果,這里需要降維到2 維,即平面可視化;numClass 表示聚類分為幾簇,繪制代碼第一部分繪制結(jié)果newData,第二部分繪制聚類的中心點(diǎn)。

3.對數(shù)據(jù)降維到2 維,然后獲得結(jié)果,繪制聚類結(jié)果圖。

4.還可用TSNE 執(zhí)行可視化,保留下的屬性信息更具代表性。

5.為了更好的表達(dá)和獲取更有代表性的信息,在展示高維數(shù)據(jù)時,先用PCA 降維,再使用TSNE。

猜你喜歡
頁面數(shù)據(jù)庫檢測
大狗熊在睡覺
刷新生活的頁面
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
小波變換在PCB缺陷檢測中的應(yīng)用
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 伊人网址在线| 精品视频福利| 久青草国产高清在线视频| 亚洲六月丁香六月婷婷蜜芽| 2021最新国产精品网站| 国产毛片片精品天天看视频| 国产精品专区第1页| 日韩美一区二区| 久久美女精品| jizz亚洲高清在线观看| 国产成人一区二区| 99热这里只有免费国产精品| 黄色网在线| 国产成人亚洲欧美激情| 亚洲精品国产自在现线最新| 欧美精品H在线播放| 国产精品99在线观看| 91在线精品免费免费播放| 一级毛片免费高清视频| 福利一区在线| 日韩精品亚洲人旧成在线| 国产精品成人免费综合| 六月婷婷综合| 国产在线一区视频| 日韩A级毛片一区二区三区| www.国产福利| 国产成人你懂的在线观看| 麻豆精品在线| 亚洲精品无码久久毛片波多野吉| 久久99国产综合精品1| 91小视频在线播放| 久久无码高潮喷水| 无码aaa视频| 国产成人一区在线播放| 亚洲日本在线免费观看| 又黄又湿又爽的视频| 国产一区二区精品福利| 亚洲AV永久无码精品古装片| 免费看美女自慰的网站| 黄色在线不卡| 素人激情视频福利| 国产一级精品毛片基地| 国产精品欧美在线观看| 青青草国产免费国产| 动漫精品中文字幕无码| 高清无码一本到东京热| 一级一毛片a级毛片| 国产91久久久久久| 亚洲六月丁香六月婷婷蜜芽| а∨天堂一区中文字幕| 国产粉嫩粉嫩的18在线播放91| 国产导航在线| 国产精品免费p区| 免费一级成人毛片| 青青草国产精品久久久久| 国产精品视屏| 亚洲an第二区国产精品| 国产成人一二三| 国产呦视频免费视频在线观看 | 亚洲,国产,日韩,综合一区| 免费A∨中文乱码专区| 日韩欧美视频第一区在线观看| a级毛片一区二区免费视频| 毛片视频网| 黄色网页在线播放| 国产91精品调教在线播放| 伊人久久青草青青综合| 国产波多野结衣中文在线播放 | 中文无码毛片又爽又刺激| 三级毛片在线播放| 成人a免费α片在线视频网站| 伊人久久大香线蕉影院| 国产男女免费视频| 一级片免费网站| 国产真实乱子伦精品视手机观看| 国产一级无码不卡视频| 看看一级毛片| 久久久四虎成人永久免费网站| 无码中文AⅤ在线观看| 亚洲AⅤ综合在线欧美一区| 免费av一区二区三区在线| 五月天在线网站|