潘積文 陸寶華
摘? 要: 萬物互聯時代,大數據規模空前,數據流動更加頻繁,安全問題也日益突出。現有的信息安全手段已經不能滿足大數據時代的信息安全要求,尤其是對海量數據進行安全防護變得日益困難,數據的分布式處理也加大了數據泄露的風險。文章對數據的產生、采集、傳輸、存儲、共享、挖掘、交換、應用、銷毀全生命周期進行風險分析,提出了大數據安全保障策略,助推大數據產業健康發展。
關鍵詞: 全生命周期; 大數據安全; 風險分析; 保障策略
中圖分類號:TP391? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)07-27-03
Abstract: In the era of interconnection of all things, with the unprecedented scale of big data, more frequent data flow and increasingly prominent security issues, the existing information security means can no longer meet the information security requirements of the era of big data. Especially, the security protection of massive data has become increasingly difficult, and the distributed processing of data has also increased the risk of data leakage. In this paper, risk analysis is carried out to the whole life cycle of data generation, collection, transmission, storage, sharing, mining, exchange, application and destruction etc., and the safeguard strategy of big data is put forward to promote the healthy development of big data industry.
Key words: life cycle; big data security; risk analysis; safeguard strategy
0 引言
大數據已經上升為國家戰略,數據被視為國家基礎性戰略資源,各行各業的大數據應用風起云涌,大數據在國家經濟發展中發揮的作用越來越大[1]。伴隨著大數據的廣泛應用,大數據安全問題也日益突出。數據的進一步集中和數據量的增大,現有的信息安全手段已經不能滿足大數據時代的信息安全要求[2],對海量數據進行安全防護變得更加困難,數據的分布式處理也加大了數據泄露的風險[3]。數據造假、數據泄露、數據買賣、數據詐騙等事件時有發生,大數據面臨的威脅和攻擊種類繁多,有的地方甚至已經形成完整的灰色產業鏈。
大數據安全,主要是保障數據不被竊取、破壞和濫用,以及確保大數據系統的安全可靠運行[4]。面對當前大數據安全日益突出的問題,急需構建包括系統層面、數據層面和服務層面的大數據安全框架,從技術保障、管理保障、過程保障和運行保障多維度保障大數據應用和數據安全。
1 風險分析
大數據的生命周期如圖1所示,數據從產生、采集、傳輸、存儲、共享、挖掘、交換、應用到銷毀全過程的生命周期中,存在的風險有十幾大類,所有的對網絡空間的安全威脅,同樣會威脅到大數據系統,如黑客的入侵、惡意代碼的侵害、數據的泄露、交易中的抵賴問題等。
1.1 數據生成與采集階段的風險
數據生成、采集存在的風險首先是大數據權屬需要確認的問題,目前已經發生了數據資源被復制的情形。任何數據在生成過程中都面臨著被泄露和被未授權改變的風險,還存在數據與元數據的錯位、國家秘密與個人隱私泄露、源數據存在有惡意代碼等問題[5]。
1.2 傳輸風險
大數據的傳輸存在于全生命周期的多個環節,如出現在采集到存儲之間、分類分級過程中、分析挖掘過程中、應用過程中、交換與交易過程中。隨著大數據應用中網絡節點數增加,網絡安全面臨更大的風險,網絡防御形勢更加嚴峻,網絡傳輸過程中的安全性很難得到保證,攻擊者常利用傳輸協議的漏洞進行數據竊取、數據攔截。當前,大數據技術甚至被應用到攻擊手段中,攻擊者通過對大數據技術收集、分析和挖掘情報,使得各種APT攻擊更容易成功。
1.3 大數據存儲安全威脅
海量和多源異構數據的匯聚,對大數據分析平臺提出了更高的要求,主要體現在對結構化和非結構化數據的存儲、海量數據的處理以及大規模分布式數據存儲和集群管理等。復雜多樣的大數據存儲,數據存儲管理安全防護措施難免存在漏洞,造成數據失竊和篡改。同時,各種類型的數據集中存儲,也使得大數據應用系統更容易成為入侵者攻擊的目標。
1.4 共享、交換中的風險
大數據系統根據職責不同,存在相應的六大角色即數據的使用者、數據的提供者、大數據框架提供者、大數據應用提供者、系統協調者、大數據資源的覬覦者。在數據的共享、交換中缺乏數據拷貝的使用管控和終端審計,存在數據泄露、行為抵賴、數據發送錯誤等問題。
1.5 挖掘過程中的風險
在大數據挖掘過程中,主體訪問的不是一個客體的全部,而僅僅是某些客體的某些特征量,這一點與信息系統中的訪問是有區別的。因此主體對客體的訪問也不應該是客體的全部,而只是這些與特征量相關的信息。特征信息之外的信息內容,不應該授權進行訪問,否則就可能出現大數據的濫用問題。
當前可擴展和可組合隱私保護數據的挖掘及其分析、知識控制、機器學習、人工智能技術的研究和應用,使得大數據分析的力量越來越強大,同時也對個人隱私的保護帶了更加嚴峻的挑戰。
1.6 應用過程中的風險
大數據或經過分析挖掘后的數據,其應用價值得到極大的提高,也會產生一系列的應用。在應用環節存在數據的泄露、數據的完整性被破壞、未授權訪問、惡意代碼、元數據完整性被破壞等風險。
1.7 銷毀過程中的風險
與其他的數據一樣,大數據也需要定期的廢棄和銷毀,這樣會騰出相應的存儲空間和計算資。在利用新的數據存儲和應用過程中,會存在錯誤銷毀、數據殘留導致的數據泄露等風險。
2 大數據安全的保障策略
2.1 大數據生命周期各階段的保護目標及策略
2.1.1 數據產生與采集環節的安全目標
數據產生、采集環節,要對數據的真實性、原始性進行確認,并保證數據的完整性。同時,還要對可能涉及到的國家秘密信息進行預警和報警,并能將國家秘密信息分離,不使其混入其他的數據集合,對涉及國家秘密信息進行恰當的保護。
保護策略主要使用區塊鏈技術對源數據進行源認證和完整性保護,使用涉及國家秘密信息的檢測預警工具對采集的數據進行檢測。對于數據的真實性,可利用大數據本身進行真實性檢測,也可以從立法的角度,對偽造數據者根據情節做出必要的處罰,以保證采集數據的真實性。
2.1.2 傳輸環節的保護目標及策略
傳輸環節安全目標是保證信道中所傳輸的數據不泄露、不被未授權的改變,保證通信信道暢通,同時防范可能的重放攻擊等。
保護策略主要使用加密技術對數據進行加密傳輸,也可使用區塊鏈技術對傳輸的數據進行完整性保護。
2.1.3 核心基礎設施的保護目標及策略
存儲、挖掘、交換、應用往往需要有共同的平臺來支撐,大數據保護的核心就在于此。這些環節的保護目標是確保授權訪問,未授權人不能越權訪問目標數據,確保數據的機密性、完整性和可用性。
安全策略要求所有的操作必須是經過授權的,包括讀/寫、復制、傳輸、授權等各類操作。授權人的權限應該遵循最小授權的原則,進行細粒度的劃分并且要有制衡措施。授權人不準許訪問數據,所有角色的操作必須有相應的審計機制。大數據全生命周期保護框架示意圖如圖2所示。
2.2 大數據安全的法律法規體系
大數據是最近幾年才興起的新領域,還沒有相應的法律、法規體系對其進行保護。而法律體系的建立是大數據領域健康發展的必要條件。大數據領域需要調整各類社會關系即數據共享與個人隱私的關系、數據共享與企業商業信息保護的關系、數據共享與政府信息保護的關系、數據共享受益方與供應方的關系、數據的主權歸屬等社會關系。
2.3 大數據安全的標準體系
大數據安全標準體系的建立是保證大數據系統安全的必要條件,應根據大數據的特點、大數據的保護目標要求、已有的國際和國內標準,來制定大數據系統的安全標準。目前,國際上特別美國也正在加緊研究和制定這些相應的標準。
3 結束語
本文從大數據全生命周期的完整性、挖掘中的訪問控制、大數據的濫用、隱私的泄露、國家及企業敏感信息的泄露等方面進行風險分析,并提出保障策略,也從立法、標準等方面提出社會的監管體系,為完善大數據安全保障體系建設提供有力支持,進一步助推大數據產業的健康發展。
參考文獻(References):
[1] 王文超,石海明,曾華鋒.芻議大數據時代的國家信息安全[J].國防科技,2013.34(2):1-5
[2] 孫雪萍,崔久強.大數據助力信息安全研究[J].信息安全與通信保密,2015.3:89-91,96
[3] 陳左寧,王廣益,胡蘇太,韋海亮.大數據安全與自主可控[J].科學通報,2015.60:427-432
[4] 張允壯,劉戟鋒.大數據時代信息安全的機遇與挑戰:以公開信息情報為例[J].國防科技,2013.34(2):6-9
[5] 胡杰.公安領域大數據安全探討[J].網絡安全技術與應用,2017.11:139-140