郭麗娟++岳利果
摘 要:大數據通過對海量數理進行分析,獲得有巨大價值的產品和服務,為人們開啟了一次重大的時代轉型的同時,也使得人們應用數據、分析數據的能力出現了質的飛越,但與此同時,大數據安全及個人信息保護也面臨嚴重威脅。因此,無論是從技術層面還是管理層面,如何更好地解決安全問題是推動大數據更好發展的重要課題。
關鍵詞:大數據 網絡安全 應對措施
中圖分類號:TN948.1 文獻標識碼:A 文章編號:1674-098X(2016)08(c)-0078-02
大數據是在網絡時代來臨以來迎來的一項重要技術革新,在大數據逐漸參與到經濟、社會、科技各個方面,并且為之帶來諸多應用便利服務同時,網絡安全問題已成為了制約大數據浪潮發展的重要瓶頸,需要社會經濟、科技各個方面加以研究解決,以期實現更好的服務技術及其應有的更大價值。
1 大數據的特征
大數據通常被認為是指規模大且復雜、很難用現有數據庫管理工具或數據處理應用來處理的數據集。隨著大數據本身規模的不斷擴大和人們對大數據研究的進一步深入,共總結出以下幾個主要特征。
1.1 數據量龐大
當前,隨著大數據時代的到來,社交網絡、電子商務與各種智能終端以及眾多的移動設備無時無刻地不通過網絡產生數據,數量已不是以往的GB、TB級,而是動輒PB級乃至ZB、EB級,統計數據量呈數幾何倍數上升,被稱為數據的“海洋”,即XLDB(extremely large database)。據統計,2015年全球產生的數據量超過8 ZB。
1.2 類型多種多樣
大數據相比較以往的數據庫數據、抽樣數據,增長的不僅僅是數量,更是數據類型的多樣化發展。隨著互聯網及智能終端技術的井噴式發展,數據突破了傳統的二維模式,轉向更加復雜非結構化數據,據統計,非結構化數據將占數據總量的80%。在云計算出現之前,傳統的計算機是無法處理如此量大,并且不規則的非結構數據的。
1.3 運算效率極高
區別于以往的數據庫運算框架,大數據的運算是一種在云計算的基礎上運行出來的Hadoop大數據框架。大數據的分析和運算在原有運算范式的基礎上,需要探索新的數據研究處理方式,例如,在對數據的集成過程中,需要對其進行必要的清洗,以保證數據的高利用率,同時利用其高速的運算存儲能力,通過一種分布式運行系統,以流的形式高效地訪問數據。
1.4 價值不可估量
大數據就像一個神奇的金礦,它最重要的價值不是一次性利用,而是被發掘后仍能不斷地被重復利用,從大數據技術的不斷發展中,可以源源不斷地獲得有價值的信息。特別是在競爭異常激烈的領域,數據已經成為了企業的重要資產,企業都在不斷地努力并借助新一代的方法和工具來實現對數據的挖掘分析以不斷地實現價值。因此,對大數據的發掘分析利用是每個企業都在追求的重點突破。
2 大數據時代所面臨的網絡安全挑戰
近幾年頻繁暴發的如“棱鏡門”之類的網絡安全事件,使得大數據安全也不得不受到更多關注,大數據在為生產率不斷掀起新的利益浪潮同時,其實也正如一柄雙刃劍,一樣帶來了信息安全的挑戰。
2.1 大數據中的用戶隱私容易成為網絡社會的攻擊目標
在網絡社會中,人們時刻都暴露在“第三只眼”的監控之下,大量事實證明,未被妥善處理的數據會對用戶的隱私造成極大的安全隱患。甚至那些人們常常認為經過匿名處理后的信息,在經過精準的分析定位后也會具體到個人,所以,僅通過匿名保護并不能很好地達到隱私保護的目的。目前,關于數據的收集、存儲、管理與使用在其規范及監管方面都缺乏有效的長效機制,特別是針對于大數據數據量大且相互關聯的特性而言,對于攻擊者,付出相對低的成本,就可以獲得成幾何倍的收益,更加容易成為黑客的攻擊對象。
2.2 技術的快速發展增加了安全風險
在計算機網絡技術和人工智能正在日新月益發展的今天,社交媒體、物聯網、電子商務等新應用的興起,使得針對于數據挖掘系統及網絡設備應用系統等技術有了突飛猛進的發展,雖然在很大程度上能夠為大數據自動收集效率以及智能動態分析性提供方便,但是卻對大數據安全防范能力提出了更高的要求。大數據的安全力度仍然不夠,本身的安全防護存在漏洞。特別是大數據打破了原有的數據邊界,使得原有的防護圍墻不能滿足安全需求。而且隨著數據價值也在呈動態地增長,大數據作為一個可持續攻擊的蘊含海量價值的載體,在其被不斷重復利用的同時也會隱藏在大數據中的惡意軟件和病毒代碼長久攻擊。
2.3 多樣化的數據類型對大數據存儲提出新要求
面對當前大數據海量的存儲數量及結構類型的多樣呈現,以往的SQL存儲系統已經不能滿足大數據存儲應用的需求。目前普通采用的是NoSQL存儲技術對大數據中大量存在的非結構化數據完成讀取管理等數據處理工作。NoSQL數據存儲技術作為一種主流的大數據處理系統來說,有著突出的可擴展性和可用性等優點,但仍存在一些安全隱患問題,例如,目前適應NoSQL的存儲模式并不成熟,比起有著嚴格訪問、隱私控制管理技術成熟的SQL技術,仍然存在各種漏洞,而且由于它使用的是新代碼,NoSQL還無法沿用SQL的模式。另外,由于客戶端應用程序由于NoSQL服務器軟件沒有內置足夠的安全,還需要內建安全因素,從而在身份驗證、輸入驗證及授權等一系列環節中產生了大量安全問題。
3 大數據安全的應對策略
面對當前亟待解決的大數據所面臨的用戶隱私保護、訪問控制等安全挑戰問題,大數據技術發展也為數據安全的發展提供了新機遇。隨著數據分析能力的逐步提升,以及通過對海量數據的分析技術的發展,可以實現對網絡異常行為的跟蹤監督,并將實時安全和應用數據結合在一起對數據進行預防性分析,防止黑客的入侵。
3.1 研究保障大數據安全的關鍵技術
保障大數據安全的技術可以從不同層面進行考慮,如存儲安全、物理安全、網絡安全等不同的角度,通過對大數據的產生、存儲、處理、分析等環節進行不同安全技術條件下的保障,例如,大數據的安全存儲即中采用了虛擬化海量存儲技術來存儲數據資源。解決大數據的安全存儲問題通常有以下幾種方案,如在數據存儲過程中,采用數據加密、分離密鑰以及使用過濾器和數據備份等方法,將數據通過存儲空間加密、使用與保管分離和過濾器監控等手段實現對數據存儲的安全保障,確保大數據在無損壞的情況下有備無患和安全管控。而在數據的應用方面主要是采用防止APT攻擊、用戶訪問控制及整合工具和流程等方法來實現數據應用安全,通過對用戶訪問進行嚴格設計具備實時檢測及提醒隱藏病毒等方式對數據應用安全提供保障。
3.2 加強大數據管理安全策略,提高安全意識
提高安全管理制度是在有了安全技術保障基礎上實現大數據安全的重要組成部分。通常,針對于大數據管理安全的策略主要有以下幾種:一是要對大數據建設進行規范。任何機制運行的基礎都是要有規范的機制和標準的建設共享平臺。對大數據建設進行有效的規范可以在規范安全框架及制度的基礎上實現對其管理的有序運行,實現其信息系統的數據集成、網絡互連、資源共享等功能。二是要建立以數據為中心的安全系統。為了大數據的所有者可以對大數據使用進行控制,可以通過建設一個基于異構數據為中心的安全方法來實現。三是要做好大數據安全風險評估,提高安全意識。對于類型不同的數據型態、大數據在不同層面的安全風險等級,可以在細分為安全風險等級的基礎上,對數據安全等級進行不同程度的安全防范,提高防范意識,分析并消除數據安全盲目和誤區。
3.3 社交網絡匿名保護技術為保護用戶隱私提供保障
在社交網絡產生的數據中,往往包含了大量的用戶隱私信息,這是大數據的重要來源之一,也是大數據安全管理的一個重要方面。根據2016年騰訊公司針對微信用戶的統計,截至今年第一季度末,微信每月活躍用戶已達到5.49億,微信支付用戶則達到了4億左右。
社交網絡中的匿名保護通過“點匿名”與“邊匿名”兩種方式進行保護,“點匿名”即是在數據發布之時就隱藏了用戶的標識與各種屬性信息,而“邊匿名”是在數據發布的同時也要相應地隱藏用戶間的關系,即關系匿名,攻擊者若要獲取有價值的數據信息就要利用節點的各種屬性,重新識別出圖中節點的身份信息。然而,這些保護方案也面臨著一系列重要問題,如“邊匿名”方案中,攻擊者可以從其他信息中推測其用戶之間的連接關系,甚至是詳細用戶信息。社交網絡的聚集特征,尤其是其局部連接密度的增強,對于連接預測算法的準確性成正比關系,因此,未來的匿名保護技術應著重增強對于關系預測及關系恢復等方面的技術保障,并且應該可以有效地抵抗這一類型攻擊,實現對社交網絡匿名的有效保護。
參考文獻
[1] 孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[2] 馮國登,張敏,李昊.大數據管理:大數據安全與隱私保護[J].計算機學報,2014(1):246-248.
[3] 陳明奇,姜禾,張娟.大數據時代的美國信息網絡安全新戰略分析[J].信息網絡安全,2012(8):32-35.
[4] 肖新斌,史召臣.云計算引發的安全風險[J].信息安全與技術,2011(6):13-14.