鄧文宏
【摘要】 大數據的發展與現代人們的生活息息相關。但是,目前大數據的收集、儲存、使用技術不夠完善,信息泄露侵犯用戶隱私,導致大數據使用過程存在較大風險。大數據安全與隱私保護這一課題還有許多問題亟待解決。文章主要探討大數據的基本情況,大數據發展中面臨的技術挑戰,以及大數據安全與隱私保護的相關技術。
【關鍵詞】 大數據 信息安全 隱私保護
互聯網的蓬勃發展使得大數據迅猛增長,大數據已成為近年來的熱門話題。大數據的應用甚為廣泛,無論是在學習、生活中的應用,還是在醫療、交通上的應用,都對我們的生活有很大幫助。但現階段,大數據的發展還處在不完善階段,在為我們帶來便利的同時,它也帶來了很多負面影響,其中,信息安全與隱私保護是亟待解決的問題。如何擴大它的益處,抑制它的弊端,成為我們必須研究的一個課題。
一、大數據綜合敘述
1.1大數據的含義
大數據又叫巨量數據集合,指用新的處理模式才可以處理的規模大并且復雜的數據。具有大規模、高速性、多樣性的特點。大數據一般來源于人、物、機:來源于人的數據主要是人們在使用互聯網時產生的文字、圖畫、視頻等信息數據;來源于物的大數據主要是各類設備采集收集的數據;來源于機的大數據主要是指計算機系統產生的數據。現在,大數據已在多領域進行應用,它的意義不僅在于對大量數據的掌握,更在于如何處理大量信息,使大數據產生更大效益的技術。
1.2大數據的結構特點
大數據與傳統數據庫相比較,大數據的信息量更大,分析查詢更為困難。大數據有五個特征:一是規模大,大數據信息量巨大,2015年已達到8ZB;二是大數據具有多樣性,數據種類多種多樣,例如文本、圖片、音頻、視頻等各種形式;三是大數據處理具有高速性,信息時代,人們對獲取信息的速度要求越來越高,大數據能使你一秒從眾多信息中獲取你想要的信息;四是大數據具有很大價值性,只要人們對其合理準確應用,就會得到很大的價值回報;五是大數據具有雙面性,它是把雙刃劍,既能帶來巨大效益,又存在很多弊端和負面影響。
1.3大數據的應用目標
大數據在科學、商業、醫學等多個領域都有廣泛應用,用途大不相同,但總結起來,其應用目標不外乎三種:(1)幫助人們認識事物,并預測事物的發展,為人們采取措施提供依據。(2)通過大數據,不僅可以掌握群體特征,還可以得知個體特征,方便對用戶進行個性化服務,以滿足個人需求。(3)在信息爆炸的時代,辨別信息真偽尤其重要,錯誤信息的采用可能會導致嚴重后果。目前人們已經采用大數據來辨別信息真假,通過大數據來過濾錯誤信息,為人們篩選出可用的正確信息。
二、大數據目前面臨的挑戰
2.1個人隱私泄露,帶來信息安全隱患
若不能正確處理大數據,就極有可能侵犯顧客隱私,導致個人隱私泄露。因需要保護的隱私內容不同,隱私保護可分為位置隱私保護、標識符匿名保護、連接關系匿名保護等。大數據的錯誤應用不僅會泄露個人隱私,還可以通過已有信息,對人的行為進行預測,能推測出用戶的隱私、興趣、喜好,甚至能準確定位客戶位置。目前,大數據的管理監督體系不完善,搜索和存儲技術有待發展,這使得大量隱私泄露,產生不可挽救的損失。
2.2大數據可信性有待考證,帶來決策失誤
如今大數據已引起熱議,一些人對其稱贊有加,并從預測性的分析中發現了海量的非結構化數據是否完整,也有一些人稱大數據存在很多隱患,不易操控,無法帶來變革性成果,因此大數據的可信性還有待考證。大數據時代伴隨著信息泛濫,很多數據是沒有經過考證的或虛假的,用戶很容易受到欺騙并盲目采用,這會導致事件結果產生嚴重誤差,影響事件的準確性,造成嚴重損失或混亂。
2.3大數據隱私保護技術欠缺,使得大數據的弊端越來越明顯
信息時代,大數據的使用十分廣泛,但缺少相應的監督體系及有效的管理制度,信息真假難辨,可利用性低,相關技術不足,對信息缺乏保護,這些都使得大數據的弊端越來越明顯。一些信息誤傳和隱私泄露,會威脅個人財產安全,甚至影響社會穩定和發展[1]。
2.4數據庫的使用監管有明顯的安全隱患
在互聯網上,用戶有時會被強制要求填寫大量個人信息,而用戶對信息的去處及使用途徑并不清楚。而有關企業或部門對采集到的信息缺乏管理,導致用戶信息泄露。大數據缺乏相關的問責和監督機制。這些都導致數據庫的安全機制存在巨大缺陷。
三、大數據安全和隱私保護的關鍵技術
3.1大數據的發布匿名的保護技術
數據發布匿名保護技術是大數據安全及隱私保護的基本手段及關鍵技術。通過信息發布匿名躲避攻擊者的攻擊行為,從而避免個人隱私泄露。目前,這一技術正在使用并不斷發展與完善。
3.2信息溯源的技術
這種技術最早是應用在數據庫范圍中,后來應用到信息安全與隱私保護上。這種技術使數據可以很快追溯到信息來源,縮短用戶辨別真偽的時間,還可以幫助用戶檢驗結果是否正確及確定數據運算。信息溯源技術中采用最多和最基本的的方法是多位標記法,記錄數據的計算方法(Why)和數據出處(Where)。數據溯源技術現在已取得巨大成就,在對云儲存場景應用、文件溯源和恢復上做出重大貢獻。
3.3角色的挖掘技術
當前使用最為廣泛的訪問控制模型便是基于角色的訪問控制(RBAC),角色訪問控制最早是用“自上而下”的模式,但是現在人們發現此種模式能夠更好的完成算法的編制,有利于角色的自動提取和優化,也就是“角色挖掘”。以整合和分配用戶角色的方式,控制管理用戶相關權限,并且自動實現角色優化和提取。角色挖掘技術不僅可以給用戶提供個性化服務,同時還可以對一些用戶行為進項監控。這一技術的使用,使得大數據的發展更加安全,為人類謀得更多福利。但是目前想要大范圍的使用還需要解決數據集的動態變更等問題[2]。
3.4實行身份認證的技術
身份認證就是在網絡中確認操作人的身份。傳統的技術是通過認證用戶口令或數字憑證等來進行鑒別,但這存在很大弊端,不夠便捷,限制了認證技術的廣泛應用。而在此技術中加入大數據分析則很好的完善了它的不足。身份認證技術通過分析和采集用戶行為來總結用戶的習慣和特點。這不僅可以通過對照這些結果對用戶身份進行驗證,還降低了黑客盜取信息的可能性,極大地促進了大數據的發展,保護了用戶的個人隱私。
3.5其他技術
(1)建設隱私保護機構。目前,很多發達國家都建立了較為完備的用于保護網絡隱私等各種隱私內容的隱私保護機構。這些機構既有執法功能,同時又進行宣傳教育以及普及法律知識。而我國目前雖也有一些機構負責保護隱私,但缺少專門機構來保障和維護個人隱私,無法滿足大數據時代下,人們對個人隱私保護的要求。
(2)引導企業對隱私數據合理利用。強制性的禁止企業及相關組織利用客戶隱私數據反而會適得其反,不如合理引導企業對客戶隱私數據正確利用,這反而會更利于大數據安全和隱私保護。政府應完善相關法律法規,明確數據可使用范圍,劃分隱私安全等級,允許在保障用戶隱私安全的基礎上適當使用隱私數據來獲取一定利益,這既保證了客戶隱私安全又能促進國家經濟發展。
結語:大數據的飛速發展給我們帶來了許多便利,但它也存在大量安全問題。本文主要講述了大數據發展中面臨的一些重要問題,并探究了解決這些問題的相關技術和方法。總的來說還應對相關技術進行進一步研究,來促進大數據發展,解決安全問題,保護個人隱私。相信在社會的不斷進步中,這些問題都會得到很好的解決。
參 考 文 獻
[1] 戈悅迎 . 大數據時代信息安全與公民個人隱私保護 [J]. 中國信息界 ,2014(01):21-23.
[2] 馮登國,張敏,李昊 . 大數據安全與隱私保護 [J]. 計算機學報 ,2014(01):34-42.