王東 陳靜
摘 要:在當(dāng)前移動(dòng)互聯(lián)時(shí)代,云計(jì)算、物聯(lián)網(wǎng)等新的信息技術(shù)的發(fā)展,大數(shù)據(jù)逐漸成了通信運(yùn)營(yíng)商關(guān)注的焦點(diǎn)。文章結(jié)合大數(shù)據(jù)的相關(guān)概念,對(duì)大數(shù)據(jù)平臺(tái)建設(shè)中所面臨的安全問題進(jìn)行分析,希望為運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)的安全建設(shè)提供一些借鑒。
關(guān)鍵詞:大數(shù)據(jù);安全;數(shù)據(jù)脫敏;數(shù)據(jù)防泄漏
自移動(dòng)互聯(lián)網(wǎng)、云計(jì)算之后,現(xiàn)在最流行的詞語莫過于“大數(shù)據(jù)”。隨著各種網(wǎng)絡(luò)的融合、移動(dòng)終端設(shè)備便捷消費(fèi)與服務(wù)的興起,所積累的數(shù)據(jù)也在呈幾何級(jí)增長(zhǎng),這些數(shù)據(jù)量大、移動(dòng)速度快,我們通常稱之為“大數(shù)據(jù)”。大數(shù)據(jù)已經(jīng)無處不在,當(dāng)人們晚上在家看電視劇時(shí),拿著手機(jī)在瀏覽新聞頁面時(shí),或是使用各種手機(jī)軟件時(shí),無形中大數(shù)據(jù)已經(jīng)包圍著我們形成了一個(gè)流量的氣場(chǎng)。
1 大數(shù)據(jù)的相關(guān)概念
大數(shù)據(jù),是指由許多不同的數(shù)據(jù)集匯合而成的數(shù)據(jù)集合,規(guī)模極其龐大復(fù)雜,采用當(dāng)前常規(guī)的數(shù)據(jù)處理工具和數(shù)據(jù)管理技術(shù)無法進(jìn)行有效處理。當(dāng)前,業(yè)界廣泛認(rèn)同的大數(shù)據(jù)的特征,主要體現(xiàn)在4個(gè)方面,即容量、類型、價(jià)值以及速度[1]。
(1)數(shù)據(jù)量巨大,數(shù)據(jù)成倍增長(zhǎng)。最近幾年,全球數(shù)據(jù)量呈現(xiàn)出前所未有的增長(zhǎng)趨勢(shì),計(jì)量單位由TB級(jí)別躍升到PB、EB乃至 ZB級(jí)別(1024進(jìn)制),其所帶來的技術(shù)挑戰(zhàn),是巨量數(shù)據(jù)存儲(chǔ)技術(shù)。
(2)數(shù)據(jù)類型多,包括了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),而且數(shù)據(jù)也不再是單一的文本形式,而是包括了日志、圖表、視頻等,對(duì)于數(shù)據(jù)處理能力提出了更高的要求。多樣化的數(shù)據(jù)類型所帶來的挑戰(zhàn),是非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)。
(3)價(jià)值密度低,在龐雜的數(shù)據(jù)中,可能僅僅只有極少的數(shù)據(jù)才有相應(yīng)的價(jià)值,如何對(duì)數(shù)據(jù)進(jìn)行提純和深入挖掘,找出有價(jià)值的信息,是一個(gè)亟待解決的問題。
(4)處理速度快,要求實(shí)現(xiàn)信息的實(shí)時(shí)獲取,其所帶來的挑戰(zhàn)是實(shí)時(shí)數(shù)據(jù)處理技術(shù)。
2 大數(shù)據(jù)的安全
隨著數(shù)據(jù)資產(chǎn)價(jià)值持續(xù)攀升、大數(shù)據(jù)產(chǎn)業(yè)規(guī)模不斷壯大,大數(shù)據(jù)技術(shù)在改善社會(huì)生產(chǎn)生活的同時(shí),其安全問題也逐漸顯現(xiàn)出來。2017年1月,大數(shù)據(jù)基礎(chǔ)軟件陷入一場(chǎng)全球范圍的大規(guī)模勒索攻擊,Hadoop集群被黑客鎖定為攻擊對(duì)象。同時(shí),據(jù)Shodan互聯(lián)網(wǎng)設(shè)備搜索引擎的分析顯示,因Hadoop服務(wù)器配置不當(dāng)導(dǎo)致5 120 TB數(shù)據(jù)暴露在公網(wǎng)上,涉及近4 500臺(tái)HDFS服務(wù)器。同時(shí),近年來全球數(shù)據(jù)安全事件層出不窮,如何在大數(shù)據(jù)時(shí)代處理好數(shù)據(jù)安全問題成為全球普遍關(guān)注的熱點(diǎn)[2]。
下面針對(duì)某運(yùn)營(yíng)商關(guān)于大數(shù)據(jù)安全問題進(jìn)行詳細(xì)介紹。
2.1 大數(shù)據(jù)中心面臨的安全挑戰(zhàn)
大數(shù)據(jù)中心面臨的安全挑戰(zhàn)如圖1所示。
數(shù)據(jù)安全風(fēng)險(xiǎn)分析如圖2所示。
2.2 大數(shù)據(jù)安全發(fā)展的建議
面對(duì)大數(shù)據(jù)時(shí)代嚴(yán)峻復(fù)雜的安全問題,亟需采取針對(duì)性的手段措施,構(gòu)建大數(shù)據(jù)安全保障體系,為大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展保駕護(hù)航[3]。
2.2.1 安全防護(hù)技術(shù)體系架構(gòu)
安全防護(hù)技術(shù)體系架構(gòu)如圖3所示。
可以看出,大數(shù)據(jù)在不斷發(fā)展的同時(shí),也伴隨著巨大的風(fēng)險(xiǎn)。接下來針對(duì)國(guó)內(nèi)某運(yùn)營(yíng)商關(guān)于數(shù)據(jù)安全中的數(shù)據(jù)脫敏以及數(shù)據(jù)防泄漏進(jìn)行詳細(xì)介紹。
2.2.2 數(shù)據(jù)脫敏
數(shù)據(jù)脫敏,又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形。數(shù)據(jù)脫敏的定義為:指對(duì)某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。這樣,就可以在開發(fā)、測(cè)試和其他非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實(shí)數(shù)據(jù)集。
2.2.3 數(shù)據(jù)脫敏系統(tǒng)
針對(duì)敏感數(shù)據(jù)的脫敏工作,建設(shè)數(shù)據(jù)脫敏系統(tǒng)。系統(tǒng)功能架構(gòu)至少包含數(shù)據(jù)源管理、分類分級(jí)、敏感數(shù)據(jù)自動(dòng)發(fā)現(xiàn)、敏感數(shù)據(jù)手工定義、敏感數(shù)據(jù)分布視圖、支持脫敏算法類型、靜態(tài)脫敏、動(dòng)態(tài)脫敏等。
系統(tǒng)架構(gòu)按照“高內(nèi)聚、松耦合”的設(shè)計(jì)原則,脫敏節(jié)點(diǎn)具備良好的可擴(kuò)展性,在數(shù)據(jù)源管理上實(shí)現(xiàn)數(shù)據(jù)庫創(chuàng)建、數(shù)據(jù)庫編輯、數(shù)據(jù)庫列表查詢、數(shù)據(jù)庫聯(lián)通性測(cè)試、數(shù)據(jù)庫刪除等功能[4]。
(1)敏感數(shù)據(jù)分類分級(jí)。
敏感數(shù)據(jù)分類管理,支持將企業(yè)的敏感數(shù)據(jù)分類信息進(jìn)行電子化管理,根據(jù)實(shí)際情況,業(yè)務(wù)上滿足分類信息多層級(jí)聯(lián)。系統(tǒng)主要實(shí)現(xiàn)分類信息的創(chuàng)建、分類信息編輯、分類列表查詢、分類信息刪除等功能。
敏感數(shù)據(jù)分級(jí)管理,支持將企業(yè)的敏感數(shù)據(jù)進(jìn)行敏感定級(jí),根據(jù)敏感數(shù)據(jù)對(duì)企業(yè)的重要程度,來規(guī)劃數(shù)據(jù)敏感級(jí)別,由高到低可以分為:高敏感級(jí)、中敏感級(jí)、低敏感級(jí)。管理上根據(jù)敏感級(jí)別來設(shè)定脫敏策略。系統(tǒng)主要實(shí)現(xiàn)分級(jí)信息的創(chuàng)建、分級(jí)信息編輯、分級(jí)列表查詢、分級(jí)信息刪除等功能。
(2)動(dòng)態(tài)脫敏。
動(dòng)態(tài)脫敏系統(tǒng)包括默認(rèn)脫敏策略管理、代理管理、脫敏特性幾大模塊。
默認(rèn)脫敏策略管理針對(duì)動(dòng)態(tài)脫敏任務(wù),為每種敏感數(shù)據(jù)標(biāo)簽設(shè)定默認(rèn)脫敏算法。如有特殊需求,可以配置例外,即針對(duì)某數(shù)據(jù)庫,根據(jù)訪問用戶的不同,修改脫敏算法配置。
代理管理可配置代理主機(jī)、代理程序、代理端口等內(nèi)容,配置完成后,用戶通過代理通道進(jìn)行數(shù)據(jù)庫業(yè)務(wù)訪問。
關(guān)于脫敏特性,系統(tǒng)將實(shí)現(xiàn)數(shù)據(jù)庫函數(shù)脫敏,函數(shù)包括不限于acos(),asin(),acos(),asin(),acos(),asin();實(shí)現(xiàn)敏感數(shù)據(jù)遷移脫敏,當(dāng)用戶將某張表的敏感數(shù)據(jù)遷移到新表中,隨后用戶對(duì)新表進(jìn)行查詢操作,對(duì)于新表中的敏感數(shù)據(jù)同樣需要進(jìn)行敏感數(shù)據(jù)處理;實(shí)現(xiàn)跨schema訪問脫敏,同一數(shù)據(jù)庫用戶,一次查詢的數(shù)據(jù)來源于多個(gè)schema時(shí),對(duì)多個(gè)schema中存在的敏感數(shù)據(jù)進(jìn)行脫敏;實(shí)現(xiàn)分權(quán)限脫敏,當(dāng)多個(gè)不同數(shù)據(jù)庫用戶訪問同一份敏感數(shù)據(jù)時(shí),可以根據(jù)預(yù)先設(shè)定的規(guī)則,做到不同的數(shù)據(jù)庫用戶查詢到不同的敏感數(shù)據(jù)。
(3)靜態(tài)脫敏。
靜態(tài)脫敏包括默認(rèn)脫敏策略管理、脫敏任務(wù)管理、調(diào)度任務(wù)管理、子集模板管理幾大模塊。
針對(duì)靜態(tài)脫敏任務(wù),為每種敏感數(shù)據(jù)標(biāo)簽設(shè)定默認(rèn)脫敏算法。使用默認(rèn)策略,降低了每個(gè)任務(wù)的配置工作量,提升效率。如有特殊需求,在脫敏任務(wù)中可以修改敏感數(shù)據(jù)的脫敏算法;支持默認(rèn)脫敏策略查詢;支持默認(rèn)脫敏策略列表展示;支持通過標(biāo)簽進(jìn)行條件查詢;支持默認(rèn)脫敏策略編輯。
脫敏任務(wù)管理要求系統(tǒng)在脫敏任務(wù)中配置源庫、目標(biāo)庫、數(shù)據(jù)表范圍、任務(wù)級(jí)脫敏算法等信息。脫敏任務(wù)一次配置,支持多次執(zhí)行。脫敏任務(wù)執(zhí)行過程中提供數(shù)據(jù)表脫敏進(jìn)度條提示。脫敏任務(wù)執(zhí)行后,有詳細(xì)的脫敏任務(wù)報(bào)告。同時(shí)脫敏任務(wù)可兼容執(zhí)行過程中遇到的異常情況,支持跳過異常數(shù)據(jù)繼續(xù)執(zhí)行任務(wù)。
調(diào)度任務(wù)管理需要脫敏任務(wù)按時(shí)間維度配置定時(shí)調(diào)度,解決周期性脫敏工作需要手工執(zhí)行的問題,包括調(diào)度任務(wù)創(chuàng)建、編輯、列表查詢、刪除等功能。
子集模板管理中可以指定從表中抽取固定條數(shù),也可以指定where條件,將滿足條件的數(shù)據(jù)脫敏。同時(shí)系統(tǒng)支持子集模板的創(chuàng)建、子集表的配置、子集模板查詢、子集模板刪除等功能。
2.2.4 數(shù)據(jù)防泄密系統(tǒng)
數(shù)據(jù)防泄密(Data Leak Prevention,DLP)系統(tǒng),將DLP管理平臺(tái)、第三方權(quán)限控制系統(tǒng)實(shí)現(xiàn)無縫結(jié)合,支持大規(guī)模的網(wǎng)絡(luò)快速部署,實(shí)現(xiàn)最完美優(yōu)化整合。
平臺(tái)集中部署,用戶終端設(shè)備通過部署在DMZ區(qū)的認(rèn)證中心對(duì)應(yīng)用進(jìn)行訪問;管理員通過訪問部署在內(nèi)網(wǎng)的核心服務(wù)器、應(yīng)用服務(wù)器核心機(jī)密數(shù)據(jù)進(jìn)行管理。結(jié)合DLP系統(tǒng)平臺(tái)架構(gòu)和模塊特性,考慮到核心業(yè)務(wù)模塊如數(shù)據(jù)庫、應(yīng)用等具備熱備能力,核心服務(wù)器應(yīng)具有負(fù)載均衡能力,進(jìn)行服務(wù)器功能調(diào)整,通過對(duì)物理機(jī)劃分虛擬空間的做法,實(shí)現(xiàn)服務(wù)器劃分主備,從而達(dá)到熱備及容災(zāi)的功能。
DLP系統(tǒng)提供了一整套完整的公鑰、私鑰生成、管理、回收機(jī)制和審計(jì)機(jī)制,可以覆蓋海量用戶管理全生命周期過程。
(1)集中管理、權(quán)限管理。
DLP系統(tǒng)提供完整的配置集中管理功能,管理人員可以通過配置集中管理服務(wù),對(duì)DLP系統(tǒng)進(jìn)行配置的集中管理。
DLP系統(tǒng)提供完整的權(quán)限分類分級(jí)管理功能,管理人員可以通過權(quán)限分類分級(jí)管理服務(wù),對(duì)DLP系統(tǒng)進(jìn)行權(quán)限的集中管理。所有管控權(quán)限均在一套完整的體系系統(tǒng)中實(shí)現(xiàn),具備多層橫縱管控體系設(shè)計(jì),整體權(quán)限管控明晰、隔離、合理。
(2)文件識(shí)別與防護(hù)。
DLP系統(tǒng)具有完善的文件加密功能。
按文件類型分DLP系統(tǒng)支持文件類型包括word,ppt,pdf,excel,txt,常見的功能類文件,設(shè)計(jì)文件和信息系統(tǒng)運(yùn)維類文件。
按文件來源分,DLP系統(tǒng)支持業(yè)務(wù)系統(tǒng)數(shù)據(jù)和后臺(tái)系統(tǒng)數(shù)據(jù)。
業(yè)務(wù)系統(tǒng):業(yè)務(wù)系統(tǒng)數(shù)據(jù)可通過接口方式實(shí)現(xiàn)數(shù)據(jù)重定向,從業(yè)務(wù)系統(tǒng)的下載數(shù)據(jù)轉(zhuǎn)存到數(shù)據(jù)防泄密系統(tǒng)的個(gè)人文件夾中。
后臺(tái)系統(tǒng)數(shù)據(jù)通過運(yùn)維工具的統(tǒng)一管理直接實(shí)現(xiàn)數(shù)據(jù)下載管理。
(3)用戶認(rèn)證。
DLP系統(tǒng)支持多種認(rèn)證實(shí)現(xiàn)方式:支持LDAP認(rèn)證、支持Radius認(rèn)證、支持AD認(rèn)證、支持短信認(rèn)證等各種二次認(rèn)證方式,具有豐富的認(rèn)證對(duì)接經(jīng)驗(yàn)。
支持用戶名密碼認(rèn)證、臨時(shí)用戶認(rèn)證、機(jī)器捆綁認(rèn)證、手機(jī)短信認(rèn)證、AD域認(rèn)證、LDAP認(rèn)證、U-KEY認(rèn)證等;可查看登陸狀態(tài)、登錄時(shí)間等。
(4)數(shù)據(jù)防泄密功能設(shè)計(jì)。
DLP系統(tǒng)要全天候地為用戶提供工程系統(tǒng)故障維護(hù)、故障設(shè)備維修服務(wù)及受理用戶各類投訴,以保證用戶系統(tǒng)能連續(xù)、高效、穩(wěn)定運(yùn)行。
具有完善的防泄密文件服務(wù)管理功能。企業(yè)可通過文件集中存儲(chǔ)服務(wù)器對(duì)企業(yè)數(shù)據(jù)進(jìn)行統(tǒng)一管理,通過對(duì)文件的歸集和管理,實(shí)現(xiàn)對(duì)文件流向的管控和事后審計(jì);通過對(duì)文件的加密、轉(zhuǎn)換實(shí)現(xiàn)對(duì)外發(fā)文件的保護(hù);通過對(duì)文件的備份、打水印等操作實(shí)現(xiàn)對(duì)核心文件的保護(hù);通過提供的在線查閱、在線編輯功能,實(shí)現(xiàn)云端文件保護(hù);通過文件數(shù)據(jù)接口與三方系統(tǒng)和底層存儲(chǔ)設(shè)備通信,達(dá)到文件存儲(chǔ)的適配性以及文件交互的通用性。總之,通過DLP系統(tǒng)文件服務(wù)器,可以實(shí)現(xiàn)文件的集中存儲(chǔ)、統(tǒng)一管理。
擁有完全獨(dú)立且可配置配額的個(gè)人文件夾,以非對(duì)稱加密進(jìn)行加密存儲(chǔ)日常工作中的各種數(shù)據(jù)。
客戶端作為加密客戶端的計(jì)算機(jī),其下載的文檔自動(dòng)加密,加密文檔在內(nèi)部授權(quán)環(huán)境內(nèi)可正常使用,未經(jīng)授權(quán)無法使用。
系統(tǒng)通過透明加密的模式,實(shí)現(xiàn)了電子文件無論是由人工生產(chǎn)還是由應(yīng)用系統(tǒng)生成的,只要寫在磁盤上就是加密存儲(chǔ)的;文件生成的參與者被系統(tǒng)授權(quán)許可使用這些加密的文件,可以接觸操作這些內(nèi)容;如果未經(jīng)合法許可將加密文件數(shù)據(jù)體帶走,加密文件內(nèi)容將不能夠被正常打開,文件內(nèi)容不會(huì)因?yàn)槲募?shù)據(jù)體擴(kuò)散而擴(kuò)散。
系統(tǒng)采用系統(tǒng)內(nèi)核層文件過濾驅(qū)動(dòng)實(shí)現(xiàn)文件的加密、解密,速度快、安全、穩(wěn)定,不易損壞文件。采用符合國(guó)家標(biāo)準(zhǔn)的國(guó)密算法,保證了加密過后的文件的安全性。最大支持1024位的秘鑰長(zhǎng)度,也大幅度提升了加密文件的安全級(jí)別。
2.3 本章小結(jié)
本章節(jié)通過對(duì)國(guó)內(nèi)某運(yùn)營(yíng)商進(jìn)行分析,將其在大數(shù)據(jù)中心實(shí)際運(yùn)營(yíng)中所遇到的問題進(jìn)行列舉,并重點(diǎn)針對(duì)其中的數(shù)據(jù)脫敏與數(shù)據(jù)防泄漏進(jìn)行詳細(xì)介紹,將數(shù)據(jù)脫敏系統(tǒng)與數(shù)據(jù)防泄漏系統(tǒng)的建設(shè)方案與所實(shí)現(xiàn)的功能一一講解。
3 結(jié)語
大數(shù)據(jù)時(shí)代已經(jīng)到來,運(yùn)營(yíng)商在意識(shí)到其中數(shù)據(jù)價(jià)值重要性的同時(shí),關(guān)于隨之而來的大數(shù)據(jù)安全性也應(yīng)該給予重視。在網(wǎng)絡(luò)時(shí)代,犯罪分子能夠更加容易地獲取他人的信息及隱私,犯罪手段和方法也在不斷增加。如何保護(hù)用戶的信息安全是大數(shù)據(jù)時(shí)代一個(gè)很重要的課題。隨著大數(shù)據(jù)的不斷增加,在數(shù)據(jù)存儲(chǔ)安全方面的要求也會(huì)越來越高。總之,運(yùn)營(yíng)商在運(yùn)用大數(shù)據(jù)創(chuàng)造價(jià)值的時(shí)候也要有效地解決好安全問題。
[參考文獻(xiàn)]
[1]趙躍東,王雋峰,曾王平.電信運(yùn)營(yíng)商大數(shù)據(jù)應(yīng)用系統(tǒng)建設(shè)方案研究[J].中國(guó)新通信,2015(4):81-82.
[2]馮明麗,陳志彬.基于電信運(yùn)營(yíng)商的大數(shù)據(jù)解決方案分析[J].通信與信息技術(shù),2013(5):35-40.
[3]趙晶.針對(duì)運(yùn)營(yíng)商的大數(shù)據(jù)建設(shè)方案研究[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2015(3):17-21.
[4]高智衡.運(yùn)營(yíng)商勇闖“大數(shù)據(jù)”機(jī)遇大于挑戰(zhàn)[J].通信世界,2012(29):33.