◆李 曉
淺析大數(shù)據(jù)安全與隱私保護(hù)技術(shù)
◆李 曉
(太原市高級(jí)技工學(xué)校 山西 030021)
大數(shù)據(jù)技術(shù)的研究與開發(fā)是現(xiàn)階段學(xué)術(shù)界的熱點(diǎn)對(duì)象,對(duì)人們的生活與工作有著重要的影響。但大數(shù)據(jù)技術(shù)在當(dāng)前階段下仍存在著較多的弊端,在數(shù)據(jù)收集、數(shù)據(jù)信息存儲(chǔ)及數(shù)據(jù)的使用方面仍有著較多的安全風(fēng)險(xiǎn),隱私信息的泄露問題給用戶的生活和工作帶來了嚴(yán)重的影響,虛假數(shù)據(jù)問題能致使大數(shù)據(jù)分析結(jié)果的錯(cuò)誤,甚至可能因大數(shù)據(jù)分析結(jié)果的錯(cuò)誤造成嚴(yán)重?fù)p失。本文簡(jiǎn)要分析大數(shù)據(jù)的基本概述及特征,分析大數(shù)據(jù)技術(shù)在現(xiàn)階段下的安全問題,研究分析大數(shù)據(jù)安全與隱私保護(hù)的關(guān)鍵技術(shù)。
大數(shù)據(jù);數(shù)據(jù)安全;信息安全;隱私保護(hù)
各行業(yè)領(lǐng)域都有著大量數(shù)據(jù)的統(tǒng)計(jì)與使用,需要大數(shù)據(jù)技術(shù)進(jìn)行科學(xué)的管理與使用。大數(shù)據(jù)技術(shù)是在移動(dòng)互聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)以及物聯(lián)網(wǎng)技術(shù)之后信息技術(shù)領(lǐng)域的重要標(biāo)志。數(shù)據(jù)龐大而且結(jié)構(gòu)復(fù)雜的數(shù)據(jù)管理系統(tǒng),用戶使用其進(jìn)行數(shù)據(jù)信息的研究分析、統(tǒng)計(jì)與使用等有著較大的難度。數(shù)據(jù)龐大、結(jié)構(gòu)復(fù)雜的大數(shù)據(jù)系統(tǒng)的處理及使用管理,不僅要重視數(shù)據(jù)信息的隱私安全問題,也要重視數(shù)據(jù)信息的真實(shí)性問題。大數(shù)據(jù)技術(shù)在當(dāng)前階段下的數(shù)據(jù)信息收集技術(shù)、綜合應(yīng)用技術(shù)等方面尚不成熟,大數(shù)據(jù)技術(shù)的使用存在著較多的安全隱患:缺乏數(shù)據(jù)信息的可靠性保障,用戶隱私信息的泄漏問題等。信息技術(shù)行業(yè)為此需要進(jìn)行不斷的研究與探索以改善問題。
大數(shù)據(jù)的出現(xiàn)是由于現(xiàn)有的數(shù)據(jù)庫管理技術(shù)或數(shù)據(jù)信息處理手段難以滿足相應(yīng)的技術(shù)要求。大數(shù)據(jù)是規(guī)模龐大與結(jié)構(gòu)復(fù)雜數(shù)據(jù)信息的集合。這些數(shù)據(jù)信息的來源途徑可分為:(1)人們自愿分享或發(fā)布的數(shù)據(jù)信息,如人們發(fā)布在互聯(lián)網(wǎng)上的各種圖片信息、文字信息、音頻信息等;(2)機(jī)器運(yùn)行產(chǎn)生的各種數(shù)據(jù)信息, 儲(chǔ)存在計(jì)算機(jī)里的各種類型的日志數(shù)據(jù)、文件信息、數(shù)據(jù)庫信息、媒體資料數(shù)據(jù)等;(3)物品屬性類型的數(shù)據(jù)信息,設(shè)備信息數(shù)據(jù)記錄,如倉庫庫存記錄的各種類型的產(chǎn)品信息數(shù)據(jù)等。
大數(shù)據(jù)的特征:(1)規(guī)模性——大數(shù)據(jù)涵蓋的信息數(shù)據(jù)龐大而且復(fù)雜,根據(jù)相關(guān)的統(tǒng)計(jì)數(shù)據(jù)分析,2012年統(tǒng)計(jì)所得的全球總信息量大約是2.7ZB,而2015年的統(tǒng)計(jì)數(shù)據(jù)分析得出已增加到8ZB;(2)多樣性——為了使信息便于儲(chǔ)存及查看,傳統(tǒng)的手段主要是將數(shù)據(jù)信息以文本的形式存在。而如今社會(huì)發(fā)展的需要,記錄信息數(shù)據(jù)的載體形式呈現(xiàn)多樣化,如圖片載體或音頻載體等非結(jié)構(gòu)化的信息載體在日益增多。(3)價(jià)值性——對(duì)總體數(shù)據(jù)信息進(jìn)行針對(duì)性的分析和科學(xué)統(tǒng)計(jì),從中篩選出有利用價(jià)值的數(shù)據(jù)信息,是大數(shù)據(jù)基本功能之一。(4)高速性——在信息數(shù)量呈爆炸式增長(zhǎng)的時(shí)代,人們對(duì)龐大信息進(jìn)行高效的處理并準(zhǔn)確獲取實(shí)用信息的需求不斷增加。
大數(shù)據(jù)統(tǒng)計(jì)與分析技術(shù)通常用于科學(xué)領(lǐng)域、醫(yī)學(xué)領(lǐng)域、商業(yè)領(lǐng)域等,不同領(lǐng)域涉及的數(shù)據(jù)信息各有不同,大數(shù)據(jù)的用途也有較大的差異。但無論什么領(lǐng)域?qū)?shù)據(jù)分析統(tǒng)計(jì)的目標(biāo)通常是以下三種。
(1)為提取有利用價(jià)值的數(shù)據(jù)信息,原始數(shù)據(jù)信息數(shù)量大多較為龐大,而且較為復(fù)雜,利用大數(shù)據(jù)根據(jù)需要進(jìn)行不同角度的數(shù)據(jù)分析、統(tǒng)計(jì)整合,最后統(tǒng)計(jì)出準(zhǔn)確的信息數(shù)據(jù),人們從而得以清晰知道事物的本質(zhì),把握目標(biāo)事物的發(fā)展運(yùn)作規(guī)律,才能準(zhǔn)備預(yù)測(cè)事物接下來會(huì)如何發(fā)展。例如時(shí)裝銷售企業(yè),其工作人員可對(duì)消費(fèi)者的消費(fèi)數(shù)據(jù)進(jìn)行科學(xué)的分析與統(tǒng)計(jì),便可掌握消費(fèi)者的消費(fèi)習(xí)慣及其消費(fèi)需求,從而銷售對(duì)應(yīng)的產(chǎn)品,迎合客戶的需要提升經(jīng)濟(jì)效益。
(2)對(duì)積累的信息數(shù)據(jù)進(jìn)行多維度的統(tǒng)計(jì)與分析,使人們能清楚大體上的群體特征的同時(shí),還能對(duì)不同個(gè)體之間進(jìn)行差別的描述,企業(yè)能根據(jù)得出的分析數(shù)據(jù)信息為客戶提供更加針對(duì)性的優(yōu)質(zhì)服務(wù)。
(3)在如今的社會(huì)網(wǎng)絡(luò)無處不在,信息能經(jīng)由網(wǎng)絡(luò)迅速傳播到指定地方,數(shù)據(jù)信息真假性的辨認(rèn)識(shí)別尤為重要,需要大數(shù)據(jù)進(jìn)行科學(xué)的分析。決策需要以數(shù)據(jù)為根據(jù),錯(cuò)誤的數(shù)據(jù)信息能使用戶制定錯(cuò)誤的決策,甚至是會(huì)導(dǎo)致難以挽回的損失。
近些年出現(xiàn)了關(guān)于用戶的信息泄露事件,從這些事件來看,用戶隱私的泄露成了用戶的隱患。從保護(hù)用戶隱私的內(nèi)容來看,用戶隱私可以分成以下幾類:對(duì)標(biāo)識(shí)符的匿名保護(hù)、對(duì)未知的隱私保護(hù)、對(duì)連接關(guān)系間的匿名保護(hù)。然而,用戶隱私的泄露并不是用戶的唯一困擾。有些企業(yè)為了得到用戶的喜好、消費(fèi)水平和習(xí)慣等,它們常常利用大數(shù)據(jù)分析來預(yù)測(cè)用戶當(dāng)前的日常行為和生活狀態(tài),并根據(jù)用戶的習(xí)慣等推送廣告,進(jìn)而對(duì)用戶產(chǎn)生困擾。現(xiàn)在,大部分企業(yè)在收集到用戶信息時(shí),只是簡(jiǎn)單地對(duì)用戶隱私做匿名處理,他們覺得只要是不公開用戶的標(biāo)識(shí)符就能夠保護(hù)好用戶的隱私,實(shí)際上并沒有很好地保護(hù)用戶的隱私。關(guān)于用戶信息收集、管理等方面的標(biāo)準(zhǔn)和條例目前尚未形成,企業(yè)在進(jìn)行這些作業(yè)時(shí),主要靠他們的自律。當(dāng)然,用戶有了解自己的信息在商業(yè)活動(dòng)中怎么使用的權(quán)利。
大數(shù)據(jù)里有些數(shù)據(jù)本身具有迷惑性,甚至含有虛假成分。因此需要對(duì)數(shù)據(jù)進(jìn)行認(rèn)真細(xì)致的分析,以防上當(dāng)。這種數(shù)據(jù)之所以會(huì)出現(xiàn),是因?yàn)檫@些數(shù)據(jù)是由那些為了達(dá)到自己目的而隨意編造出來的假數(shù)據(jù);或者這些數(shù)據(jù)在工作人員收集時(shí),由于工作人員的粗心而導(dǎo)致數(shù)據(jù)失真,使得最終收集到的數(shù)據(jù)和實(shí)際信息不同,進(jìn)而影響到數(shù)據(jù)分析的結(jié)果;另外,信息數(shù)據(jù)的傳播過程也可能造成數(shù)據(jù)的失真。因而,數(shù)據(jù)信息的可信度需要得以保證,數(shù)據(jù)信息的使用者要熟悉數(shù)據(jù)信息來自何處、數(shù)據(jù)信息的傳播渠道以及其加工處理經(jīng)過的過程等,謹(jǐn)防得到錯(cuò)誤的結(jié)論。
對(duì)于結(jié)構(gòu)化的數(shù)據(jù)信息來說,要切實(shí)保護(hù)用戶私人數(shù)據(jù)信息的安全,數(shù)據(jù)科學(xué)應(yīng)用匿名保護(hù)技術(shù)是重要的措施,但此項(xiàng)技術(shù)仍存在著不足需要改善。在當(dāng)前階段下的數(shù)據(jù)信息匿名保護(hù)技術(shù)的基本性理論,設(shè)定的環(huán)境基本上是使用者一次性的、靜態(tài)的發(fā)布數(shù)據(jù)。但通常情況下現(xiàn)實(shí)是容易變化的,數(shù)據(jù)信息的發(fā)布基本上是連續(xù)的、次數(shù)較多的。在大數(shù)據(jù)信息龐大結(jié)構(gòu)復(fù)雜的環(huán)境里,數(shù)據(jù)信息發(fā)布匿名保護(hù)技術(shù)的實(shí)現(xiàn)存在較大的難度。攻擊者能從不同地方、不相同的發(fā)布渠道得到各種類型的信息。
有著許多用戶隱私信息的非結(jié)構(gòu)化數(shù)據(jù)大部分是來自于社交網(wǎng)絡(luò),這些類型的數(shù)據(jù)信息最為顯著的特點(diǎn)是圖結(jié)構(gòu),因此數(shù)據(jù)發(fā)布保護(hù)技術(shù)對(duì)這些類型數(shù)據(jù)難以進(jìn)行有效的隱私安全保護(hù)。攻擊者一般情況下會(huì)使用點(diǎn)與邊的一些屬性,經(jīng)過相應(yīng)的分析與信息整合,從而確定出用戶準(zhǔn)確的身份信息。因此,在社交網(wǎng)絡(luò)技術(shù)中要科學(xué)應(yīng)用數(shù)據(jù)安全與信息隱私保護(hù)技術(shù)。要切實(shí)結(jié)合圖結(jié)構(gòu)的性質(zhì)特點(diǎn),將用戶進(jìn)行標(biāo)識(shí)的匿名保護(hù)和屬性的匿名保護(hù),并且要對(duì)用戶間關(guān)系進(jìn)行匿名保護(hù),才能更好的起到隱私保護(hù)作用。
水印技術(shù)的應(yīng)用是在數(shù)據(jù)信息的原始內(nèi)容及其使用不受影響的情況下,將可標(biāo)識(shí)的信息以難以察覺發(fā)現(xiàn)的手段嵌入到相應(yīng)的數(shù)據(jù)載體里。通常是應(yīng)用在媒體版權(quán)的保護(hù)工作里,部分?jǐn)?shù)據(jù)庫技術(shù)和文本文件也利用水印技術(shù)。根據(jù)數(shù)據(jù)水印技術(shù)的應(yīng)用作用可分為強(qiáng)健水印類型和脆弱水印類型,強(qiáng)健水印類型通常是應(yīng)用于證明數(shù)據(jù)信息起源的作用,脆弱水印類型則應(yīng)用于證明數(shù)據(jù)信息的真實(shí)性。
數(shù)據(jù)溯源技術(shù)的研發(fā)與應(yīng)用最初是在數(shù)據(jù)庫技術(shù)領(lǐng)域里,如今被科學(xué)應(yīng)用到大數(shù)據(jù)信息安全與隱私保護(hù)技術(shù)中。為數(shù)據(jù)信息標(biāo)記其來自何處,可有助于用戶對(duì)數(shù)據(jù)真假性的判斷,也有助于用戶檢驗(yàn)數(shù)據(jù)分析結(jié)果的準(zhǔn)確性。
大數(shù)據(jù)技術(shù)的研發(fā)與應(yīng)用,為其他技術(shù)的發(fā)展提供了支持,但同時(shí)也會(huì)面臨更多的新問題、新的挑戰(zhàn),其中大數(shù)據(jù)信息安全與隱私信息保護(hù)技術(shù)的研發(fā)更是其中關(guān)鍵問題。分析大數(shù)據(jù)安全與隱私保護(hù)技術(shù)在現(xiàn)階段的發(fā)展情況,并進(jìn)行具體的研究以及相應(yīng)的技術(shù)挖掘,簡(jiǎn)要分析了匿名保護(hù)技術(shù)、水印技術(shù)以及溯源技術(shù)的研究與應(yīng)用可能對(duì)信息安全和隱私保護(hù)的研究有著重要作用,當(dāng)然仍需要研究開發(fā)更多先進(jìn)的隱私保護(hù)技術(shù),才能更利于大數(shù)據(jù)的發(fā)展和應(yīng)用。
[1]游康澤.大數(shù)據(jù)安全和隱私保護(hù)技術(shù)體系的關(guān)鍵技術(shù)研究[J].電腦知識(shí)與技術(shù),2016.
[2]劉亮.大數(shù)據(jù)安全與隱私保護(hù)技術(shù)要點(diǎn)[J].信息與電腦(理論版),2016.
[3]于仕.大數(shù)據(jù)安全與隱私保護(hù)技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2017.