應欽
摘 要 隨著大數據時代的到來,“大數據”已然成為廣受社會各界關注的熱點問題。大數據為人們的生活、生產等方方面面帶來了積極的影響,然而也帶來了一定的風險。如何在現有條件下保護大數據的安全與隱私,是一個亟待解決的重要問題。文章簡要介紹了大數據,并結合當前大數據面臨的安全考驗,對大數據安全與隱私的保護技術進行了探究。
關鍵詞 大數據;信息安全;隱私保護
中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)10-0072-01
在大數據時代,信息與數據的分析、研究都更加復雜、繁瑣,并且難以管理。根據相關調查統計,僅過去三年內全球的數據產生量就超過了過去四百年產生的數據總量。隨著數據的不斷增多,企業對數據安全性和隱私性的要求愈加嚴格,大數據的安全與隱私問題也日益凸顯。如何應對大數據時代下的數據安全性挑戰,是全球都應積極思考的問題。
1 大數據綜述
1.1 大數據的特性以及來源
一般來說,大數據指的是難以使用現有的數據處理工具、方法處理,且規模龐大、結構復雜的數據集。其特性可以歸結為四點,即規模性、多樣性、高速性以及價值性。大數據往往需要借助于一些機器才能得以產生,其產生的來源有許多方面,主要有:傳感器、網站點擊、射頻ID以及移動設備等。
1.2 大數據的應用目標
根據大數據的分析現狀來看,其被廣泛應用于商業領域、科學領域、醫藥領域等多個領域中。大數據在各個領域中的用途迥異,但應用目標相似,主要有:1)通過對現有數據進行分析、挖掘,可以及時獲取有價值的信息。這些信息的挖掘有助于人們透過現象看到事物本質,進而更好、更快地把握住其發展規律,實現對事物發展趨勢的預測。2)通過長期的、多角度的對數據進行分析、積累、對比,可以總結出用戶的個性化特征。企業能夠利用這些個性化特征,掌握用戶的行為習慣,對用戶進行定位、分類,進而針對不同群體提供個性化的服務。3)通過對數據進行分析,可以及時辨別出數據的真偽性。網絡是把雙刃劍,它一方面為信息的共享創造了有利的條件,另一方面也使得虛假信息的傳播更為迅速。前文中提到,大數據具有多樣性、高速性,因而可以利用大數據辨別信息的真偽性,有效實現對海量信息的去粗取精、去偽存真。
2 大數據面臨的安全考驗
隨著科學技術的不斷發展,大數據時代已經到來,其帶給我們機遇、價值的同時,還帶來了新的安全挑戰。近年來,大數據的安全與隱私問題廣為關注、擔憂,而“棱鏡門”的曝光更加凸顯了這一問題。不同于傳統的安全性問題,在大數據時代下,數據面臨的安全考驗主要有以下幾個方面。
2.1 用戶隱私保護考驗
事實證明,如果大數據沒有得到妥善的處理,會為用戶的隱私帶來極大的威脅。根據受保護對象的不同,可以將隱私保護分為三類,即位置保護、連接關系保護以及標識符保護。在大數據時代,用戶隱私所面臨的威脅不只是個人的隱私泄露這一方面,還包括大數據對其狀態及行為的分析預測。現在很多企業認為只要將信息進行匿名處理,公布不含有用戶標識符的信息,就能夠實現對用戶的隱私進行保護了,然而事實證明,這種做法取得的保護效果并不理想。總的來說,目前對用戶的數據進行采集、儲存、使用以及管理等工作時,均缺乏相應的標準、規范以及監管,對企業自律性過于自信以及依賴。此外,用戶并不會被告知其隱私信息被用于何處。
2.2 大數據的可靠程度
目前人們普遍認為擺在眼前的數據就是事實,其可以充分證明一切。然而,數據是具有一定欺騙性的,如果不能對其進行甄選,很容易被數據的假象欺騙。大數據的這種欺騙性主要反映在兩個方面,一方面是偽造的數據,另一方面是失真的數據。為了達到某種效果,可能會有人通過偽造數據來制造假象,進而對數據分析人員進行誘導。由于數據的規模性和多樣性,真假信息往往很難被辨別,從而造成錯誤的結論。此外,由于在數據收集、儲存等過程中出現的誤差,很容易造成數據失真,會對其分析結果造成一定的影響。
3 大數據安全與隱私保護技術
3.1 數據溯源技術
該技術在大數據概念形成之前便被廣泛采納,其旨在幫助使用者確定數據的來源,進而檢驗分析結果是否正確,或對數據進行更新。標記法是該技術的基本方法,并且,在實踐過程中逐漸演化為Why和Where兩種形式,側重點分別為計算方法和出處。該技術在文件的溯源以及恢復等工作中發揮著巨大的作用,并且可被運用于云存儲場景之中。2009年,數據溯源技術被相關報告列為三大確保國家安全的重要技術之一,其在未來數據信息安全領域中仍具有很大的發展空間。
3.2 角色挖掘技術
RBAC(以相關角色為基礎進行訪問控制)在早期采用自頂向下的管理模式——以企業角色為依據進行角色分工,后期選用了自底向上的管理模式——根據現有角色自動實現角色的優化與提取,后者即為角色挖掘。通常情況下,使用該技術可以根據用戶的點擊情況,自動對其進行角色生產,不僅能及時完成個性化服務,還可以針對用戶的異常行為發現潛在的危險。
3.3 身份認證技術
該技術通過采集并分析用戶及其使用設備的行為數據,獲取用戶及其使用設備的行為特征,進而可以通過利用獲取的特征信息對操作者及其使用設備的行為進行驗證,以確定其身份。身份認證技術的使用增加了黑客的攻擊難度、減輕了用戶的負擔,并且切實統一了不同系統的認證機制。
4 總結
總而言之,大數據時代的到來不僅為人類社會帶來了發展機遇,也帶來了前所未有的安全挑戰,加強信息安全、保護數據隱私的口號響徹全球。若要真正實現大數據安全與隱私的保護,就應從大數據安全漏洞著手,積極發展、運用數據溯源、角色挖掘、身份認證等保護技術,同時還要建立、健全相關的體制法規,實現一手抓技術、一手抓政策,全面的對大數據安全與隱私進行保護。
參考文獻
[1]戈悅迎.大數據時代信息安全與公民個人隱私保護[J].中國信息界,2014(1).
[2]馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014(1).
[3]謝邦昌,蔣葉飛.大數據時代隱私如何保護[J].中國統計,2013(6).
[4]鄭晨陽.面向大數據的網絡安全策略研究[J].數字圖書館論壇,2014(2).
[5]李珩,武雪芳,張朝亮.信息安全中隱私保護數據挖掘相關技術探究[J].電子制作,2013(24).endprint