劉冬蘭,劉 新,張 昊,王 睿,高 通
(1.國網(wǎng)山東省電力公司電力科學(xué)研究院,山東 濟(jì)南 250003;2.山東大學(xué),山東 濟(jì)南 250061)
隨著信息化的快速發(fā)展,數(shù)據(jù)是政府和企業(yè)的核心資產(chǎn)的觀念已被普遍認(rèn)可。隨之而來,如何保護(hù)數(shù)據(jù)資產(chǎn)成為數(shù)據(jù)安全的重中之重。電力行業(yè)是國民經(jīng)濟(jì)的基礎(chǔ)產(chǎn)業(yè),是國民經(jīng)濟(jì)發(fā)展和人民生活極其重要的基礎(chǔ)設(shè)施之一[1-2]。隨著國家電網(wǎng)有限公司電力物聯(lián)網(wǎng)建設(shè)的不斷深入,傳統(tǒng)的業(yè)務(wù)應(yīng)用模式也在發(fā)生巨大的變革,數(shù)據(jù)成為國家電網(wǎng)完成業(yè)務(wù)使命的重要基礎(chǔ)性戰(zhàn)略資產(chǎn)[3]。近年來,在智能電網(wǎng)和全球能源互聯(lián)網(wǎng)背景下,電網(wǎng)信息技術(shù)不斷發(fā)展,各類智能電網(wǎng)業(yè)務(wù)系統(tǒng)數(shù)據(jù)集中存儲越來越多[4-5]。數(shù)據(jù)的不斷集中,增加了很多的潛在風(fēng)險,如:攻擊目標(biāo)的集中、數(shù)據(jù)集中造成的價值集中等,數(shù)據(jù)安全風(fēng)險將成為國家電網(wǎng)有限公司未來長期面臨的主要問題之一[6]。業(yè)務(wù)系統(tǒng)數(shù)據(jù)是組織的重要資產(chǎn),不僅對智能電網(wǎng)發(fā)、輸、變、配、用電各環(huán)節(jié)業(yè)務(wù)具有價值,同時對電網(wǎng)公司的決策、戰(zhàn)略規(guī)劃都具有重要意義。與此同時,我國信息系統(tǒng)的安全漏洞不斷涌現(xiàn),網(wǎng)絡(luò)安全形勢十分嚴(yán)峻,信息安全事件層出不窮,電力行業(yè)的業(yè)務(wù)系統(tǒng)也面臨著嚴(yán)峻的安全威脅[7-10]。電網(wǎng)建設(shè)運(yùn)行過程中產(chǎn)生海量的數(shù)據(jù)信息,這些數(shù)據(jù)信息一旦泄露,將泄露電力用戶個人信息安全,對電力用戶和電力公司造成巨大的經(jīng)濟(jì)損失。因此,將數(shù)據(jù)防泄露技術(shù)應(yīng)用在電網(wǎng)信息化建設(shè)運(yùn)行過程中,可以有效防止數(shù)據(jù)信息的外泄,確保電網(wǎng)運(yùn)行數(shù)據(jù)信息的安全性。
數(shù)據(jù)安全與傳統(tǒng)網(wǎng)絡(luò)安全最大的區(qū)別是,數(shù)據(jù)安全更貼近于業(yè)務(wù)應(yīng)用,其管理建立在數(shù)據(jù)分類分級的基礎(chǔ)上,根據(jù)數(shù)據(jù)的安全級別建立差異化的全生命周期管控措施,以內(nèi)容管控為主,較傳統(tǒng)網(wǎng)絡(luò)安全管理粒度更細(xì)。目前,數(shù)據(jù)安全相關(guān)技術(shù)主要包括業(yè)務(wù)建模分析技術(shù)、數(shù)據(jù)安全風(fēng)險分析技術(shù)、數(shù)據(jù)標(biāo)簽識別技術(shù)、個人隱私保護(hù)技術(shù)及數(shù)據(jù)防泄露技術(shù)等[11-12]。當(dāng)前,國家電網(wǎng)公司在數(shù)據(jù)安全建設(shè)方面已經(jīng)全面開展了體系化建設(shè)工作。在傳統(tǒng)的網(wǎng)絡(luò)安全領(lǐng)域,目前已經(jīng)形成了明確的安全管理規(guī)范及方法,可以有效發(fā)現(xiàn)網(wǎng)絡(luò)中存在的潛在風(fēng)險,但在數(shù)據(jù)安全方面卻缺乏必要的理論依據(jù)及方法論,在數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)流轉(zhuǎn)追蹤控制、數(shù)據(jù)風(fēng)險分析及展示等方面缺乏有效的手段。
為了保障電力物聯(lián)網(wǎng)的安全可靠運(yùn)行,必須找到一種通用性方法用于提高網(wǎng)絡(luò)及數(shù)據(jù)安全分析的效能。通過對業(yè)務(wù)系統(tǒng)進(jìn)行持續(xù)的風(fēng)險評估,找出安全所面臨的主要問題,其前提是能夠深刻理解業(yè)務(wù)及其周圍環(huán)境交互的過程,以及安全防護(hù)的效果。目前,國內(nèi)外網(wǎng)絡(luò)安全防護(hù)及數(shù)據(jù)防泄露技術(shù)已有一定的發(fā)展[13-22]。陳馳等人[13]設(shè)計(jì)了基于分類分級的數(shù)據(jù)資產(chǎn)安全管控平臺,通過將加解密、防泄露、跟蹤取證等不同安全工具集成聯(lián)動、統(tǒng)一配置,實(shí)現(xiàn)了對數(shù)據(jù)資產(chǎn)全生命周期的無縫保護(hù)。趙勇等人[14]提出了一種企業(yè)內(nèi)網(wǎng)安全中的信息泄露防御模型,該模型基于密碼隔離,利用訪問控制和密碼技術(shù)在企業(yè)內(nèi)網(wǎng)中構(gòu)建虛擬涉密網(wǎng)絡(luò)防止內(nèi)網(wǎng)敏感數(shù)據(jù)泄露。同時,各個行業(yè)結(jié)合企業(yè)敏感數(shù)據(jù)防泄露的需求,進(jìn)行了數(shù)據(jù)防泄露及信息安全防護(hù)體系的探究和構(gòu)建[15-22]。
為了應(yīng)對新型網(wǎng)絡(luò)威脅下的敏感數(shù)據(jù)泄露,通過研究基于大業(yè)務(wù)數(shù)據(jù)場景的數(shù)據(jù)安全分析及數(shù)據(jù)防泄露技術(shù),通過對業(yè)務(wù)系統(tǒng)數(shù)據(jù)安全建模,將業(yè)務(wù)的目標(biāo)、過程、資源和所面臨的威脅、脆弱性、安全策略進(jìn)行結(jié)合,設(shè)計(jì)數(shù)據(jù)資產(chǎn)防泄露系統(tǒng)原型,以應(yīng)對當(dāng)前復(fù)雜多變的網(wǎng)絡(luò)威脅形勢。
數(shù)據(jù)資產(chǎn)是指對國家電網(wǎng)公司有價值的數(shù)據(jù),基于國家電網(wǎng)公司數(shù)據(jù)分類分級規(guī)范,建立數(shù)據(jù)資產(chǎn)編目。數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)、識別、分析及編目過程如圖1 所示。

圖1 數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)、識別、分析及編目過程
提出的數(shù)據(jù)資產(chǎn)編目基于主動發(fā)現(xiàn)和被動發(fā)現(xiàn)過程,通過數(shù)據(jù)庫掃描、服務(wù)器掃描、終端掃描、終端監(jiān)控、網(wǎng)絡(luò)監(jiān)控、數(shù)據(jù)庫訪問監(jiān)控等手段,識別各種文件及數(shù)據(jù)庫的元數(shù)據(jù)信息、內(nèi)容及格式,并深入分析業(yè)務(wù)系統(tǒng)的關(guān)聯(lián)性,組織的關(guān)聯(lián)性、數(shù)據(jù)分布情況及數(shù)據(jù)分級,最終建立完善的數(shù)據(jù)資產(chǎn)編目。在當(dāng)前的技術(shù)背景下,數(shù)據(jù)資產(chǎn)編目,需要通過人工方式進(jìn)行確認(rèn),以確保編目的準(zhǔn)確性。
本文使用的威脅分析技術(shù)是“STRIDE 安全威脅模型”。STRIDE 是被廣泛應(yīng)用的系統(tǒng)安全設(shè)計(jì)、分析技術(shù),其具備系統(tǒng)化、抽象化的特征,非常適于和統(tǒng)一建模語言(Unified Modeling Language,UML)業(yè)務(wù)系統(tǒng)建模相結(jié)合[23-24]。STRIDE 充分考慮了威脅源(攻擊者)在進(jìn)行威脅行為(攻擊活動)時所可能采用的方式。STRIDE 覆蓋了假冒、篡改、否認(rèn)、泄露、拒絕服務(wù)和特權(quán)提升等多種安全威脅,對應(yīng)了業(yè)務(wù)系統(tǒng)所需具備的可靠性、保密性、抗抵賴性、完整性、可用性以及授權(quán)等多種安全需要[25-26]。雖然STRIDE 已經(jīng)覆蓋了可能遇到的各種安全威脅,但是由于攻擊行為的多樣性,需要在STRIDE 的基礎(chǔ)上,以威脅樹的形式系統(tǒng)地描述數(shù)據(jù)安全攻擊場景。
圖2 是存儲數(shù)據(jù)泄露STRIDE 威脅樹示例,STRIDE 威脅樹的每個樹都以實(shí)現(xiàn)一種威脅行為為根節(jié)點(diǎn),關(guān)注的是第一階威脅,一旦攻擊者通過各種方式達(dá)到了威脅樹的根節(jié)點(diǎn),即表示攻擊行為會實(shí)時造成對應(yīng)的威脅。任何一種通過威脅樹的一個或多個葉子節(jié)點(diǎn),最終達(dá)到根節(jié)點(diǎn)的過程,可以視為一種攻擊路徑。以威脅樹的形式進(jìn)行安全風(fēng)險分析,較攻擊路徑建模具備更高的概括性,可以降低建模難度、提高分析效率。

圖2 STRIDE 威脅樹示例——存儲數(shù)據(jù)泄露威脅樹
但是,并不是所有的威脅都要包含到威脅樹中,否則將導(dǎo)致威脅樹出現(xiàn)大量的小分支。常見的做法是,對常見的威脅加以展現(xiàn),非主要威脅則統(tǒng)一歸類為“其他”。基于攻擊的不可預(yù)測的本質(zhì),“其他”可以代表未知的所有攻擊可能性,這樣在技術(shù)層面上保證每個樹都是“完整的”。通過深入分析系統(tǒng)所面臨的可能威脅,通過威脅樹的形式將數(shù)據(jù)安全所面臨的各種威脅加以建模,最終形成完善的威脅庫,作為數(shù)據(jù)安全風(fēng)險分析的基礎(chǔ)之一。
在數(shù)據(jù)資產(chǎn)編目及威脅建模的基礎(chǔ)之上,通過綜合判斷業(yè)務(wù)系統(tǒng)所面臨的威脅以及系統(tǒng)自身具備的脆弱性及資產(chǎn)價值,通過公式計(jì)算數(shù)據(jù)安全風(fēng)險R。數(shù)據(jù)安全分析及量化模型如圖3 所示,其中,D 為全網(wǎng)業(yè)務(wù)系統(tǒng)數(shù)據(jù)安全風(fēng)險總和,Di為i 個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)安全風(fēng)險。

圖3 數(shù)據(jù)安全風(fēng)險分析及量化模型
數(shù)據(jù)安全風(fēng)險分析的具體計(jì)算方式及公式,需要基于大數(shù)據(jù)業(yè)務(wù)系統(tǒng)的實(shí)際情況進(jìn)行研究確定。數(shù)據(jù)安全風(fēng)險分析與量化參照了信息安全風(fēng)險評估模型,對應(yīng)到數(shù)據(jù)風(fēng)險則是數(shù)據(jù)的重要性、脆弱性和威脅性三要素。根據(jù)數(shù)據(jù)是否涉敏、所在業(yè)務(wù)系統(tǒng)重要性等評估其價值,按數(shù)據(jù)在使用、存儲及傳輸?shù)拳h(huán)節(jié)的保護(hù)或防護(hù)措施與程度,是否存在違規(guī)操作等因素來評估其脆弱性和威脅性;而數(shù)據(jù)依附于業(yè)務(wù)系統(tǒng),則業(yè)務(wù)系統(tǒng)的風(fēng)險就隨之而出,全網(wǎng)業(yè)務(wù)安全風(fēng)險總值由各業(yè)務(wù)系統(tǒng)風(fēng)險分值加權(quán)平均。
數(shù)據(jù)安全標(biāo)簽基于密碼學(xué)技術(shù),可以實(shí)現(xiàn)非結(jié)構(gòu)化及結(jié)構(gòu)化數(shù)據(jù)的安全標(biāo)簽?zāi)芰Α?蓮V泛用于數(shù)據(jù)訪問控制、數(shù)據(jù)血緣分析、數(shù)據(jù)行為跟蹤、泄露數(shù)據(jù)水印溯源等多種業(yè)務(wù)場景。
圖4 是一種非結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽應(yīng)用場景,采用基于文件指紋的特征識別技術(shù),無須使用密碼技術(shù)對文件本身進(jìn)行修改,性能得到大幅提升。而且避免了密碼技術(shù)對內(nèi)容修改的敏感問題,在數(shù)據(jù)內(nèi)容小幅修改的情況下仍可有效識別。數(shù)據(jù)安全標(biāo)簽管控中心基于文件指紋、數(shù)據(jù)資產(chǎn)信息及安全元數(shù)據(jù)為文檔構(gòu)建唯一的跟蹤標(biāo)簽,并通過技術(shù)手段與文件綁定。當(dāng)文件經(jīng)過數(shù)據(jù)安全控制措施時,比如:數(shù)據(jù)防泄露系統(tǒng),文件標(biāo)簽會被檢測、識別,確定其控制規(guī)則。合法的傳輸可根據(jù)應(yīng)用場景的不同,選擇采取數(shù)據(jù)脫敏、加密、訪問限制等控制動作。而非法的使用行為會被阻斷,并可通過水印溯源、事件告警供管理人員追責(zé)。
結(jié)構(gòu)化數(shù)據(jù)一直以來都是數(shù)據(jù)價值較高的數(shù)據(jù)源,如何針對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)簽管理也是一直在討論的問題。圖5 是結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽的應(yīng)用場景,結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽可以以數(shù)據(jù)集、數(shù)據(jù)記錄為單位進(jìn)行標(biāo)簽綁定。在數(shù)據(jù)的訪問過程中,可基于標(biāo)簽實(shí)現(xiàn)數(shù)據(jù)加解密、數(shù)據(jù)脫敏、數(shù)據(jù)訪問行為控制等操作。對于非法的數(shù)據(jù)操作行為可實(shí)現(xiàn)阻斷、告警,對異常泄露的數(shù)據(jù)可實(shí)現(xiàn)水印溯源。針對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行標(biāo)簽管理,通常按照數(shù)據(jù)源類別的重要性分為文本列和數(shù)字列。文本列采用指紋提取的方式對文本列進(jìn)行內(nèi)容轉(zhuǎn)換,形成文本數(shù)據(jù);再依據(jù)自然語言處理的方式對文本列進(jìn)行歸類識別。在數(shù)字列的識別過程則采用信息論的方式度量信息的重要度,主要運(yùn)用概率論與數(shù)據(jù)統(tǒng)計(jì)的方法,從數(shù)字符號和數(shù)據(jù)屬性進(jìn)行標(biāo)簽歸類。
通過采取主動采集和被動采集方式抽取元數(shù)據(jù),用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)來抽取標(biāo)簽間的語義關(guān)系并進(jìn)行處理。通過業(yè)務(wù)關(guān)聯(lián)分析、組織關(guān)聯(lián)分析、數(shù)據(jù)分布分析、數(shù)據(jù)分類分級等分析能力生成自動標(biāo)簽。數(shù)據(jù)自動標(biāo)注和關(guān)聯(lián)分析過程如圖6 所示。

圖4 非結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽的應(yīng)用

圖5 結(jié)構(gòu)化數(shù)據(jù)標(biāo)簽的應(yīng)用

圖6 數(shù)據(jù)自動標(biāo)注和關(guān)聯(lián)分析
數(shù)據(jù)自動標(biāo)注和關(guān)聯(lián)分析采用了一種面向海量網(wǎng)絡(luò)資源的啟發(fā)式集成學(xué)習(xí)自動語義標(biāo)注策略,通過研究異構(gòu)網(wǎng)絡(luò)中概念性內(nèi)容及關(guān)系在知識表示中的語義映射、加載機(jī)理以及深層復(fù)雜多元關(guān)系的本體自動生成機(jī)制,并設(shè)計(jì)和實(shí)現(xiàn)自動語義標(biāo)注算法及模型。
現(xiàn)有敏感數(shù)據(jù)防泄露技術(shù)方案,通常是使用預(yù)定義的安全策略,比如設(shè)定重要數(shù)據(jù)的關(guān)鍵字,敏感信息的正則表達(dá)式,甚至數(shù)據(jù)指紋,基于分類的機(jī)器學(xué)習(xí)方法等,這些規(guī)則需要預(yù)制規(guī)則。現(xiàn)有技術(shù)的缺陷主要如下。
第一,安全策略需要預(yù)制,在大多數(shù)情況下,企業(yè)并不能清楚地知道所有重要和敏感的數(shù)據(jù),因此,大多數(shù)預(yù)制策略是不完整的。
第二,安全策略更新不及時,即使是采用了比較充分的預(yù)制安全策略,隨著企業(yè)的業(yè)務(wù)發(fā)展,每天都會有新的數(shù)據(jù)產(chǎn)生,安全策略并不能完全覆蓋新產(chǎn)生的數(shù)據(jù)。而隨著時間的推移,有些陳舊的數(shù)據(jù)已不再重要和敏感,也就不需要保護(hù)。
第三,安全策略需要有安全人員來構(gòu)建,安全策略需要有安全人員在充分了解數(shù)據(jù)的分布情況下才能構(gòu)建完善的安全策略。有些數(shù)據(jù)基本上不會被使用,而有些數(shù)據(jù)會經(jīng)常被使用,安全人員并不能知道哪些數(shù)據(jù)應(yīng)該重點(diǎn)保護(hù),安全人員的工作繁重。
第四,預(yù)制的安全策略在實(shí)際應(yīng)用過程中會對數(shù)據(jù)產(chǎn)生誤判 (將非重要數(shù)據(jù)判定為重要數(shù)據(jù)),增加了數(shù)據(jù)防泄露工作的難度。如果對安全策略進(jìn)行調(diào)整,會導(dǎo)致漏判(將重要數(shù)據(jù)判定為非重要數(shù)據(jù))。
基于人工智能AI 技術(shù)的敏感數(shù)據(jù)防泄露技術(shù)通過預(yù)制簡單的安全策略,將對數(shù)據(jù)的檢測結(jié)果和數(shù)據(jù)一起提交給安全管理人員。安全管理人員依據(jù)實(shí)際業(yè)務(wù)情況和數(shù)據(jù)出現(xiàn)的場景,給出檢測結(jié)果是否正確的判分。如果檢測結(jié)果正確,則給予正向判分,如果檢測結(jié)果錯誤,則給予負(fù)向判分。依據(jù)安全檢測人員的判分,使用人工智能算法進(jìn)行自學(xué)習(xí),并將學(xué)習(xí)結(jié)果設(shè)置為安全策略,對后續(xù)檢測生效。
通過構(gòu)建文檔的重要性 (也稱敏感度) 度量模型,建立統(tǒng)一的文檔重要度度量方法,對文檔進(jìn)行重要度度量,給管理人員以清晰地展示數(shù)據(jù),促進(jìn)安全策略的更新。
基于AI 技術(shù)的敏感數(shù)據(jù)防泄露實(shí)現(xiàn)過程:
1)啟動預(yù)制的安全策略。
2)初始化檢測模型,檢測模型不局限于神經(jīng)網(wǎng)絡(luò),也包括機(jī)器學(xué)習(xí)等智能算法。
3) 使用上述預(yù)制的安全策略對數(shù)據(jù)進(jìn)行檢測,獲得檢測結(jié)果。
4)將檢測結(jié)果和數(shù)據(jù)上報,輸出反饋評分結(jié)果。
5)接收對檢測結(jié)果和數(shù)據(jù)的判分。
6)檢測模型根據(jù)檢測結(jié)果、數(shù)據(jù)、判分,采用批量梯度下降算法,得出檢測模型的最優(yōu)解,進(jìn)而生成新的安全檢測策略。
7)將新的安全檢測策略應(yīng)用于數(shù)據(jù)防泄露系統(tǒng)中,對后續(xù)數(shù)據(jù)進(jìn)行檢測。
8)重復(fù)第3)步到第7)步,安全策略可以持續(xù)更新。
文檔比對算法:
1)對經(jīng)過網(wǎng)絡(luò)數(shù)據(jù)防泄露系統(tǒng)中的文檔進(jìn)行內(nèi)容提取。
2)對文檔內(nèi)容進(jìn)行詞法分析和句法分析,比如是以隱馬爾可夫進(jìn)行詞法分析,使用依存樹分析句法,剔除停用詞,比如“的”“了”。
3)采用最大似然估計(jì)算法計(jì)算詞的概率。
4)對每篇文檔采用信息熵算法獲得熵值。
5)對熵值進(jìn)行歸一化。
6)以歸一化的熵值作為文檔的重要度度量值。
根據(jù)上述文檔重要度度量值生成安全策略,比如對敏感度較高的數(shù)據(jù)構(gòu)建指紋,用于安全策略,或者從敏感度比較高的數(shù)據(jù)中抽取出重要的關(guān)鍵詞作為安全策略。
數(shù)據(jù)資產(chǎn)防泄露系統(tǒng)是針對大數(shù)據(jù)環(huán)境下多樣性、異構(gòu)性、應(yīng)用復(fù)雜性的數(shù)據(jù)資產(chǎn)泄露進(jìn)行防范與安全檢測。現(xiàn)有的數(shù)據(jù)存儲與管理方式單一,難以對數(shù)據(jù)泄露行為進(jìn)行有效防范。數(shù)據(jù)防泄露系統(tǒng)及其安全檢測工具,是根據(jù)數(shù)據(jù)分類分級索引,提取數(shù)據(jù)指紋等特征,依據(jù)公司數(shù)據(jù)外泄防護(hù)策略,對企業(yè)統(tǒng)一建設(shè)互聯(lián)網(wǎng)出口外發(fā)數(shù)據(jù)進(jìn)行內(nèi)容審計(jì),對公司的重要數(shù)據(jù)或信息資產(chǎn)以違反安全策略規(guī)定的形式流出公司的行為進(jìn)行安全檢測,從而有效降低公司重要數(shù)據(jù)資產(chǎn)的外泄。
本文設(shè)計(jì)的數(shù)據(jù)資產(chǎn)防泄露系統(tǒng)原型,能夠全視角展示數(shù)據(jù)資產(chǎn)目錄,驗(yàn)證風(fēng)險分析技術(shù)在數(shù)據(jù)資產(chǎn)進(jìn)行集中編目、數(shù)據(jù)風(fēng)險分布可視化展示、基于分類分級屬性的數(shù)據(jù)安全標(biāo)簽技術(shù)等多功能場景下的應(yīng)用效果。
如圖7 所示,原型系統(tǒng)中將實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)風(fēng)險評估的主要能力,將從人、數(shù)據(jù)、應(yīng)用、網(wǎng)絡(luò)及設(shè)備等多個角度采集必要的數(shù)據(jù)、信息,進(jìn)行綜合化分析。具體采集的要素信息如圖8、圖9 所示。

圖7 原型系統(tǒng)數(shù)據(jù)資產(chǎn)風(fēng)險評估關(guān)鍵要素

圖8 原型系統(tǒng)數(shù)據(jù)資產(chǎn)脆弱性評估關(guān)鍵要素
數(shù)據(jù)資產(chǎn)防泄露原型系統(tǒng)實(shí)現(xiàn)能力如圖10、圖11 所示。
通過設(shè)計(jì)的數(shù)據(jù)資產(chǎn)防泄露系統(tǒng)能夠全視角展示數(shù)據(jù)資產(chǎn)目錄。系統(tǒng)將實(shí)現(xiàn)安全元數(shù)據(jù)管理、數(shù)據(jù)資產(chǎn)集中編目、數(shù)據(jù)分布視圖的展示、數(shù)據(jù)的分類分級屬性以及安全標(biāo)簽的設(shè)定能力,并實(shí)現(xiàn)基于數(shù)據(jù)標(biāo)簽的控制技術(shù),自動識別數(shù)據(jù)的敏感性。在實(shí)際應(yīng)用中,可將標(biāo)簽控制技術(shù)與其他數(shù)據(jù)安全技術(shù)相結(jié)合。例如以安全元數(shù)據(jù)為基礎(chǔ),對不同類型、格式、分類及安全等級的數(shù)據(jù)采取不同級別的數(shù)據(jù)動靜態(tài)脫敏方法。

圖9 原型系統(tǒng)數(shù)據(jù)威脅評估關(guān)鍵要素

圖10 原型系統(tǒng)數(shù)據(jù)資產(chǎn)視圖能力內(nèi)容

圖11 原型系統(tǒng)數(shù)據(jù)資產(chǎn)風(fēng)險視圖能力內(nèi)容
將業(yè)務(wù)系統(tǒng)建模與威脅建模技術(shù)相融合,針對數(shù)據(jù)安全面臨的問題進(jìn)行建模分析。一方面,通過業(yè)務(wù)系統(tǒng)建模技術(shù)理清數(shù)據(jù)所依賴的運(yùn)行環(huán)境依存關(guān)系;另一方面,以業(yè)務(wù)建模為基礎(chǔ)將威脅建模元素加入業(yè)務(wù)系統(tǒng)建模之中,以分析數(shù)據(jù)應(yīng)用過程中所面臨的威脅,再結(jié)合數(shù)據(jù)資產(chǎn)價值因素、業(yè)務(wù)系統(tǒng)脆弱性暴露因素,通過計(jì)算得出數(shù)據(jù)安全所面臨的風(fēng)險狀態(tài)。通過將人工智能技術(shù)創(chuàng)新的應(yīng)用于敏感數(shù)據(jù)防泄露領(lǐng)域,實(shí)現(xiàn)對用戶業(yè)務(wù)系統(tǒng)核心和敏感數(shù)據(jù)的采集挖掘、精準(zhǔn)識別,以及內(nèi)容特性實(shí)時分析和數(shù)據(jù)可視化展現(xiàn),并把定位到的敏感信息樣本生成防護(hù)策略,形成準(zhǔn)確的數(shù)據(jù)安全模型,當(dāng)出現(xiàn)敏感信息違規(guī)外發(fā)行為時,能夠及時進(jìn)行記錄、告警和阻斷,最大化保證敏感信息存儲和使用過程的安全,降低數(shù)據(jù)的泄露風(fēng)險。