劉智勇
【摘要】當前社會,繼移動互聯網、云計算、物聯網之后大數據成為信息技術領域的一大標志。隨著大數據時代的來臨,人們的生活方式、習慣以及思維方式都發生了巨大的變化,大數據給人們的生產和生活帶來了很大的便利,同時,它也帶來了巨大的數據安全與威脅,人們的信息被泄露的情況時有發生,給人們的經濟生活帶來了巨大的損失。因此,現今急需采取相應的措施來確保大數據的安全。本文分析大數據現今所面臨的困境,并提出一些有效措施以提高大數據安全以及信息保護力度和水平。
【關鍵詞】大數據 數據安全 信息保護
前言
現今社會各行各業都逐漸加大對數據的使用,數據系統變得越來越龐大復雜,這對數據安全以及信息保護造成了極大的不便,要處理以及管理如此復雜的數據系統,全面的安全以及信息保護技術是必不可少的,但現在人們面臨著日益嚴峻的信息安全問題,這需要當局正確認識到此項技術的重要性并積極主動解決這一問題。因此,保護信息的安全成為了一項巨大的挑戰。
大數據的概念及特征。大數據,簡單的說,就是數據集,平常的數據存儲和管理工具很難對其進行分類和處理。大數據,字面意思上可以看出其規模龐大,數據的傳輸速度迅速方便,特征明顯呈現多元化。
具體來說,我們平常通過互聯網平臺進行的一切活動產生的各種數據信息,例如圖片、視頻、文字、等常見的數據類型。
大數據具有規模性、多樣性、價值性、高速性的特征。大數據分析用于不同領域用途大為不同,但他們分析目標差別不大,都是通過對大量的原始數據的分析整合從而獲得有價值的信息,再進一步的分析進而預測下一步的發展。
大數據面臨著安全與信息保護的挑戰。
首先,大數據面臨著個人隱私泄露帶來的信息安全隱患。大數據時代有利也有弊,大數據給人們的生產和生活帶來了便利,但同時由于信息處理不當等原因也給用戶的隱私帶來了極大的風險。例如,將客戶信息擴大化,知道一個人的姓名和消費習慣通過數據搜索即可發現客戶的政治觀點等方面的信息,即便很多時候對個人的信息會進行一定程度的匿名處理等信息保護。這些給用戶帶來了極大的經濟與精神損失。
其次,大數據面臨著缺乏可信性的挑戰。數據同樣具有欺騙性,需要我們對其進行有效的識別,很多虛假的信息有可能隱藏在大數據中,這就對人們的判斷造成了一定的誤導,導致人們判斷錯誤。另外,在信息傳遞的過程中,信息有可能會逐漸降的失真,這是因為在信息傳遞采集過程中會有一定的誤差,而這些誤差會導致信息的失真。還有就是數據與現實變更不同步同樣會導致信息的失真。
再者,大數據面臨著技術缺乏,監管不力的挑戰。大數據信息時代,信息傳播速度十分迅猛,很多現實都是通過數據信息反映出來的,而由于技術缺乏以及監管的不力,導致存在大量的虛假信息,或者信息在傳播過程中失真,損失以及用戶信息的泄露等一系列問題給社會或者個人的經濟或者精神方面都會帶來負面的影響,不利于社會的穩定發展。
最后,在訪問控制大數據的時候,同樣面臨著很多的難點,其一是角色的預先設置問題,不同組織或者不同身份的人所運用的數據是不同的,因此需要對其進行角色劃分,但往往是很難實現的。其二是每個角色的實際權限是無法預知的,在現實中很難準確的識別用戶訪問的數據范圍,同時定義所有用戶權限的規則,是一種低效的方法。其三是因為對大數據的訪問是多樣化的,而我們在對其控制處理的時候很難掌握其精度,這同樣是挑戰之一。總之,數據安全面臨著巨大的考研,因此,對大數據安全以及信息保護是十分必要且迫在眉睫。
提高大數據安全與信息保護的方法與措施。
第一,通過對大數據保護技術的創新和靈活運用提高保護力度。大數據保護技術是大數據安全與隱私保護的基礎,能夠有效的保證數據信息在數據庫領域范圍內的存儲和處理。現代科技條件下,我們不僅需要細化數據信息的來源和記錄,而且需要具體形象化數據符號,一定要及時對數據信息進行標記和核實,以便能過高度還原真實的數據信息。而要做到這些就必須強化大數據安全和信息保護,提高大數據保護技術的創新。大數據時代,很多情況下都需要用戶對身份信息進行再三確認,強化數據信息保護技術,用來達到最大化保護用戶隱私的目的,減少不必要的損失和負面影響,避免給用戶帶來經濟損失和個人財產隱患。
第二,抵抗不良的數據壟斷。數據時代的到來,絕大多數的個人和企業都能夠認識到數據信息的重要性,數據作為執行的基礎以及創新的源泉,提高大數據安全以及隱私保護極其重要。很多的數據大亨利用手中的數據信息資源進行不良操作和惡性違規事件,控制著很多信息的傳輸和存儲,極大的影響了人們的正常生活和對數據信息的有效利用,阻礙了其良性發展。因此提高對于數據信息的正確利用,抵抗對數據的壟斷勢在必行,只有這樣才能公平合理的利用數據信息,利用大數據的優勢為社會大眾謀福利,避免因為數據信息的違規使用帶來的不可避免惡性影響。
第三,數據發布匿名保護技術。對于結構化數據來說,想要有效地實現用戶數據安全和信息保護的關鍵是數據發布匿名保護技術。但是這一技術還需要不斷研究和完善。現在的數據發布匿名保護技術的基本理論大部分設定的環境都是用戶一次性、靜態地發布數據。例如通過泛化元組和抑制處理的方式對標識符進行分組,對有共同屬性的集合用k匿名模式進行匿名處理,但這樣的方式容易漏掉一些特殊的屬性。而且現實是多變的,數據發布是連續、多次的。在復雜的大數據環境中,要實現數據發布匿名保護技術還存在一些技術性困難。攻擊者可以獲取各類信息利用不同的發布點、不同的渠道,確定一個相對準確的用戶的信息。這還需要更多的時間和精力去深入研究。
第四,社交網絡匿名保護技術。社交網絡作為大數據的重要來源之一,在社交網絡中包含了大量的個人信息,因此必須做一些匿名保護。一般攻擊者都是利用節點的各種屬性來識別用戶的身份信息,而我們社交網絡匿名保護就是要在用戶發布信息的時候,隱藏起用戶的標示和屬性信息以及用戶之間的關系。這是社交網絡數據安全與信息保護的要點,可以有效的防止攻擊者破解匿名保護。通過用戶在不同渠道發布的數據,或者是用戶之間的邊聯系推測出原本受匿名保護的用戶。另外是通過在完整的圖結構中,利用超級節點對圖結構進行部分分割和重新聚集的操作,這樣就可以實現邊的匿名,但這種方法對數據信息的使用性并不高。
第五,數據水印技術。水印技術是指將可標識信息以一些比較難察覺的方式嵌入到數據載體里當然是要在不影響數據內容和數據使用的情況下。一般用于媒體版權和數據庫、文本文件的保護中。但是在多媒體載體上與在數據庫或者文本文檔上應用水印技術是有很大不同的。因為二者數據的無序和動態性等特點并不一致,數據水印技術從其作用力度可以分為強健水印類和脆弱水印類,強健水印類多用于證明數據起源,保護原作者的原創權;而脆弱水印類則用來證明數據的真實與否。遺憾的是水印技術仍需要改進的就是它并不適應現在快速大量生產的大數據。
總結
大數據時代為我們帶來了方便的同時,也引發了一系列的安全問題,所以,我們要采取積極有效的措施來對其進行切實的保護。
本文提出的一些措施并不能夠充分的保護好大數據安全,仍然需要進一步的研究與探索,以及聯系國家相應的法律法規,才能真正實現大數據的安全與信息保護。