■ 賽迪智庫
隨著大數據技術的不斷發展,個人數據、工業數據等快速匯聚成為常態,數據泄露、數據竊取呈現出高發態勢,大數據自身面臨的安全風險不斷加大。目前,數據泄露頻發,個人大數據成為數據泄露的重災區。2018年6月,AcFun彈幕視頻網發公告稱,平臺有800萬-1000萬左右的用戶數據被黑客竊取。隨后,該網站用戶數據在暗網中被銷售,共計泄露900萬條用戶數據。2019年2月,深網視界科技有限公司的MongoDB數據庫被發現未做訪問限制,導致超過250萬人的數據可被獲取,數據類型包括人臉識別圖像及圖像拍攝地點等。據統計,2019年第一季度我國累計泄露簡歷數據5.9億份,多是我國企業的MongoDB數據庫和ElasticSearch服務器沒有做訪問限制,或者是防火墻出現錯誤所導致的。
大數據清洗、存儲、分析、挖掘相關的平臺和軟件近年來漏洞頻出,引發安全風險。Hadoop框架核心組件之一YARN曾被發現存在信息泄露漏洞,黑客能夠利用該漏洞獲取用戶密碼。我國研究人員發現,一些黑客曾利用Hadoop Yarn資源管理系統REST API未授權訪問漏洞開展網絡攻擊。2018年11月,研究人員發現Apache Spark中存在安全漏洞,攻擊者可通過發送特制的請求利用該漏洞在服務器上執行惡意代碼。
一是傳統安全防護技術難以滿足大數據時代隱私保護需求。傳統隱私安全保護技術以匿名化技術為主,如K匿名、L多樣性等,但相關技術在大數據挖掘技術下可能失效,大數據挖掘和分析能夠對匿名數據進行重新識別,引發隱私安全擔憂。例如,2019年8月,澳大利亞某政府部門將部分匿名化交通數據向社會開放,但由于安全風險未做到位,導致交通數據經分析和挖掘后被重新識別,個人交通出行隱私因此被泄露,給政府部門敲響了開放數據風險的警鐘。
二是大數據挖掘技術帶來數據濫用風險,如大數據殺熟、價格歧視等。攜程等互聯網公司被質疑利用用戶的行為、喜好等數據,在同一產品上對不同用戶區別定價,由此引來網友一片聲討;滴滴則被網友發現存在同一出發點和目的地,不同賬戶面對的估價不同的現象,因此懷疑滴滴在定價方面存在大數據殺熟和價格歧視,滴滴對此回應稱估價是實時變化,因此出現該現象。