張新華
(太原學院 山西 太原 030012)
現如今互聯網信息技術發展迅速,人們對信息保護的要求也在不斷提高,國家也出臺了多項法律法規及相關文件,保護廣大用戶的合法權益。目前大數據技術得到了各行各業的廣泛應用,但是對一些敏感數據的保護仍不完善,需要不斷進行優化。因此對大數據安全與敏感數據保護技術的應用進行研究十分重要。
現如今大數據技術得到了企業的廣泛應用,取得了明顯的成效,Hdaoop屬于一種高效的分布式處理系統,應用十分廣泛。大數據平臺中涵蓋著海量資源數據,基于平臺體系的安全性,平臺安全防護技術需要滿足信任性、可靠性、追溯性、保密性等要求,將安全基線控制點、基線描述情況及檢測作為評估標準,有效提高安全性能[1]。
大數據平臺構件源于開源體系,企業版的安全防護性能較強,但是相較于傳統數據庫安全管理要求,需要重點管理開源構件安全防護的脆弱性,不斷強化安全技術保障工作。
大數據平臺安全防護需要收集的數據較多,并且數據類型豐富多樣,例如文件數據、庫表數據等。需要根據數據類型選擇不同的收集方式。數據進入大數據安全平臺需要通過多項措施確保其安全性,并且整個收集流程均需要通過4A系統加以監管。
2.2.1 數據收集認證健全
工作人員在對數據進行收集的過程中,需要根據不同的收集方法選擇不同的鑒權,主要包括下述幾點。第一,落實Kerberos認證服務對用戶身份認證。第二,使用賬號密碼、短信及口令等認證方法對收集過程的身份進行有效認證。第三,對收集系統的IP地址和端口號進行限制,保證IP和端口的規范性和合格性。
2.2.2 HDFS平臺安全
HDFS平臺應用較為廣泛,具有認證功能和授權功能。認證主要指確保某個用戶為自己的用戶,授權主要指用戶能夠操作全新實體,如果不具備則無法進行操作。在這一前提下增設一些其他方法,例如HDFS透明加密、HDFS快照等,提高安全防護的水平。
2.2.3 多租戶安全
大數據安全平臺在使用過程中不但需要符合內部使用的要求,并且還要符合外部相關要求,提高對不同類型數據存儲的實效性,使用戶和用戶間數據隔離開,并且保證租戶運行不同作業不會互相影響,確保不同業務在平臺的安全運轉。除此之外,還需要為租戶創設或者提供資源,其主要范圍為大數據管理Hadoop集群資源,建立Hadoop用戶,對存儲容量進行分配。
根據外部應用和環境,可以將敏感數據分為以下四大類。第一,A類主要指用戶身份數據,其主要內容包括身份顯示、網絡身份、相關基本資料和身份證明等。第二,B類,主要指的服務及內容相關數據,內容多為訂購內容相關數據信息。第三,C類,通常指服務和衍生數據,其內容多為服務記錄、消費信息及賬單明細等。第四,D類,主要指管理數據。其內容豐富,多為企業管理數據、運維數據以及合作企業數據等。
大數據平臺中體現的數據形式也屬于類別規定的一種,例如原始數據以及脫敏數據等。前者不具有開放性的特點,安全等級較高。脫敏數據具有一定的復雜性,主要指則是將網絡身份標識等一系列敏感特性進行相應處理后,產生無法識別。推算的全新數據,具有一定的安全性。在工作人員匿名化操作或者脫敏數據時,需要嚴格遵守分級安全防護的具體規范,在此前提下結合使用環境,做好準備工作,對敏感風險數據進行全面分析[2]。
3.2.1 動態數據脫敏
動態數據脫敏較為常用,主要指在對敏感數據訪問時進行脫敏,符合生產環境相關要求,同時需要注意,如果需要對同一敏感數據在讀取時進行不同等級的脫敏,對于解決身份訪問問題、靜態數據屏蔽等相關問題具有積極作用。
數據脫敏環境的類型豐富,根據其性質可以對其類型進行合理劃分,主要包括前端展示、外部接口調用以及投訴處理查詢后臺等。對不同的用戶來說,能夠直觀地看到不同敏感數據經過脫敏處理后得到的具體結果。在進行開發測試的過程中,對報表取數的結果進修分析,分析人員可以得到不同的脫敏結果。主要方法包括下述兩點。第一,動態脫敏能夠根據數據訪問用戶名、IP信息等實現脫敏的訪問管控。第二,工作人員還需要加強對生產數據庫中的返回數據的重視,采取動態脫敏的方法效果理想,有助于保證屏蔽、加密等措施的有效實施。
3.2.2 數據匿名處理及敏感信息保護
該項技術的主要內容為分析敏感數據存在的風險,K匿名、等價匿名是較為常用的匿名處理方法,對其進行合理應用能夠在數據分析時減少安全隱患風險問題發生。其中K匿名算法具有實用性,屬于新型算法的一種,能夠在應用過程中強化對用戶位置信息的保護,效果確切。通過對該算法的有效應用對于預防數據脫敏嚴重致使數據價值下滑問題具有積極作用。同時還能夠有效解決敏感數據在準標識符分析環節攻擊鏈數據遺失以及泄露等問題,具有一定的安全性[3]。
綜上所述,目前大數據平臺安全及敏感數據保護已經得到了廣泛的應用,通過實踐證明其作用明顯、效果理想,得到了諸多企業的廣泛應用。萬物連接物聯網未來安全的重心在于基礎設施安全保護和敏感數據保護。隨著科技的飛速發展,大數據安全的內容也會變得愈發豐富多樣,未來發展過程中還需要提高對人工智能等技術的應用水平,加強對大數據海量信息數據的應用,保證安全態勢感知的。