潘峰
摘要:隨著大數(shù)據(jù)技術的不斷發(fā)展,在互聯(lián)網(wǎng)公司的云計算數(shù)據(jù)中,海量數(shù)據(jù)在其中進一步集中,這就使得信息數(shù)據(jù)的安全防護受到了人們的廣泛關注。本文主要圍繞大數(shù)據(jù)安全技術進行簡要的分析。
關鍵詞:云計算;大數(shù)據(jù);安全技術
中圖分類號:TP309 文獻標識碼:A
0 前言
隨著大數(shù)據(jù)時代的來臨,原先的信息資源處理手段已經(jīng)難以適應時代的變化與發(fā)展,難以適應迅速增大的數(shù)據(jù)量級。大數(shù)據(jù)主要是依托于網(wǎng)絡技術, 采用各種技術手段來對海量數(shù)據(jù)進行相應的處理。不管是計算平臺,還是存儲的載體,這些都屬于不同的信息系統(tǒng)。大數(shù)據(jù)使得網(wǎng)絡空間中的防御與攻擊的不對稱性進一步加劇,這就導致大數(shù)據(jù)時代的信息安全遭受了巨大的挑戰(zhàn)。故此,需要加強對大數(shù)據(jù)信息安全技術的分析,以提高信息安全的保障能力。
1 大數(shù)據(jù)安全所帶來的挑戰(zhàn)
1.1 應用安全防護
在大數(shù)據(jù)環(huán)境背景下,應用防護風險主要包括以下幾種:第一,資源濫用;第二,不安全集成模塊;第三,拒絕服務攻擊;第四,API接口以及WEB安全。
1.2 虛擬化環(huán)境安全
云計算中心的存在,為大數(shù)據(jù)提供了一個開放的環(huán)境,這就使得不同地區(qū)的資源能夠實現(xiàn)快速的整合,實現(xiàn)數(shù)據(jù)的集合,進而實現(xiàn)數(shù)據(jù)的共建共享。現(xiàn)如今,在大數(shù)據(jù)時代背景下,網(wǎng)絡訪問變得更為便捷,此外,隨著數(shù)據(jù)流的形成,使得資源的快速彈性推送得以實現(xiàn)。但是平臺的暴露,使得一些潛在價值的大數(shù)據(jù)容易受到黑客攻擊,使得海量的數(shù)據(jù)容易吸引黑客的攻擊。在這種虛擬化的環(huán)境下,大數(shù)據(jù)的安全遭受了較大的威脅[1]。
1.3 移動接入安全
移動接入安全包括以下幾種,第一,身份假冒;第二,信息劫持。
2 大數(shù)據(jù)安全技術體系的分析
2.1 構建云計算數(shù)據(jù)中心大數(shù)據(jù)信息安全體系
大數(shù)據(jù)信息安全建設要想取得更好的發(fā)展,要想使其技術、產(chǎn)品以及操作等發(fā)揮其各自的效力,就需要一個科學、完整的安全體系做指導。大數(shù)據(jù)應用過程應該劃分為以下幾個環(huán)節(jié):采集、存儲 、挖掘、分布等,它們的安全性是否得到保障可以用以下幾方面技術來實現(xiàn):
(1)在數(shù)據(jù)采集階段,其安全問題主要是在數(shù)據(jù)匯聚過程中的傳輸安全問題,需要通過以下幾種安全機制來促使采集過程的安全性得到保證:身份認證、完整性保護、數(shù)據(jù)加密等。傳輸安全主要用到以下幾種技術:虛擬專用網(wǎng)絡技術、基于安全套接層協(xié)議技術。
(2)在數(shù)據(jù)存儲階段,通常都需要確保數(shù)據(jù)的機密性,要為數(shù)據(jù)提供隱私保護,提供備份以及提供恢復技術等等。在這個階段中,有可能會用到以下幾種技術[2]:基于數(shù)據(jù)加密的隱私保護技術、基于數(shù)據(jù)變換的隱私保護技術、靜態(tài)數(shù)據(jù)加密機制、異地備份等等。
(3)在數(shù)據(jù)挖掘階段,需要對挖掘者的身份進行認證,要對挖掘的操作權限進行嚴格的控制,防止出現(xiàn)信息泄露的現(xiàn)象。在這個階段,所涉及到的技術有以下幾種:基于秘密信息的身份認證技術、自主訪問控制、基于角色的訪問控制等等。
(4)在數(shù)據(jù)發(fā)布階段,需要進行安全審計工作,對于有可能出現(xiàn)的機密泄露,一定要進行數(shù)據(jù)溯源。在這個階段,所涉及到的技術主要有以下幾種:基于網(wǎng)絡監(jiān)聽審計技術、基于日志的審計技術、基于代理的審計技術等等。
2.2 基于Hadoop的大數(shù)據(jù)安全架構
Hadoop已經(jīng)成為大數(shù)據(jù)應用最為廣泛的一種技術架構,屬于一種分布式數(shù)據(jù)和計算的框架。現(xiàn)如今,Hadoop應成為學術界進行云計算應用的標準平臺。分布式文件系統(tǒng)的存在,使得大規(guī)模并行計算成為了可能,但是數(shù)據(jù)節(jié)點與客戶端之間的通信,會引入新的安全問題。如下圖是Hadoop核心HDFS的架構,下文就來分析這種架構下所存在的安全問題,并給出相應的解決建議。
在高度分布式數(shù)據(jù)集群中,對于異構平臺之間安全的一致性很 難去進行驗證,與傳統(tǒng)集中式數(shù)據(jù)安全模型相比,在大多數(shù)集群內,其數(shù)據(jù)是流動的,一般會有多個副本,在不同節(jié)點間進行移動,以保證彈性的機制,進而導致數(shù)據(jù)難以及時、準確地定位存儲位置,這樣一來,就使得副本安全保護機制設計難度有所增加。針對數(shù)據(jù)的訪問,大數(shù)據(jù)環(huán)境提供了schema級別的訪問控制,但是沒有更細的粒度,盡管可以借鑒其他高級屬性,或者借鑒安全標簽,但是這些都需要應用設計者在設計過程中將這些功能集成到數(shù)據(jù)存儲之中[3]。對于節(jié)點間的通信,Hadoop與大多數(shù)組件之間的通信不夠安全,它們所使用的遠程過程調用協(xié)議(RPC),沒有嵌入一些安全機制,如安全傳輸層協(xié)議、SSL等。此外,由于客戶端能夠直接與資源管理者以及節(jié)點進行交互,這樣就導致惡意代碼的發(fā)送概率有所增加,從而使得客戶端受到數(shù)據(jù)節(jié)點的攻擊。最后,大數(shù)據(jù)在自身設計時,沒有對安全機制進行深入的研究,這些都導致大數(shù)據(jù)環(huán)境存在著一定的安全隱憂。為了解決這些問題,使其安全機制得到保證,可采用以下幾種的方法:
(1)充分運用Kerberos 來對節(jié)點進行驗證。Kerberos是一個非常有效的安全控制措施,而且可以集成到Hadoop基礎設施之中。它能夠對服務間的通信進行有效的驗證,能夠阻斷一些惡意節(jié)點,阻斷惡意的應用程序,從而使得Web控制臺的訪問得到保護。
(2)對于一些惡意客戶端所發(fā)起的獲取文件的請求,可以采用文件層加密的方法來對數(shù)據(jù)進行有效的保護。
(3)可以使用密鑰管理服務,通過分發(fā)密鑰和證書,為每一個應用程序設置不同的密鑰,這樣能夠防止文件加密的失效,能夠進一步增強密鑰的安全性。
3 結語
綜上,對于社會發(fā)展而已,大數(shù)據(jù)時代的來臨推動了我國社會經(jīng)濟的發(fā)展與進步。大數(shù)據(jù)轉化信息與知識的速度將會對企業(yè)的發(fā)展,對社會的變革產(chǎn)生重要的影響,但是大數(shù)據(jù)所帶來的安全挑戰(zhàn)也需要我們高度重視。現(xiàn)如今,在上網(wǎng)過程中,人們會面臨著個人隱私泄露的風險,另外還會面臨著大數(shù)據(jù)對人們狀態(tài)行為的預測。因此,就需要加強對數(shù)據(jù)安全技術的研究,要保證人們的上網(wǎng)安全。
參考文獻:
[1]張旭輝.關于云計算數(shù)據(jù)中心大數(shù)據(jù)安全技術分析[J].中國新通信,2016,18(17):48..
[2]王書偉.大數(shù)據(jù)時代政府部門間信息資源共享策略研究[D].吉林大學,2013.
[3]周明.云計算中的數(shù)據(jù)安全相關問題的研究[D].南京郵電大學,2013.endprint