鎮江船艇學院基礎部信息技術教研室 楊 珍 鐘 誠 杜曉靜
淺析大數據環境下的隱私保護問題
鎮江船艇學院基礎部信息技術教研室 楊 珍 鐘 誠 杜曉靜
大數據是當前的研究熱點,正影響著人們日常生活方式、工作習慣及思考模式.但目前大數據在收集、存儲和使用過程中面臨著諸多安全風險,大數據所導致的隱私泄露為用戶帶來嚴重困擾,本文分析了實現大數據安全與隱私保護所面臨的技術挑戰,給出了相應的對策。
大數據;隱私保護
近年來,隨著互聯網、物聯網、云計算等IT與通信技術的迅猛發展,信息社會已經進入了大數據時代,數據的快速增長成了許多行業共同面對的嚴峻挑戰和寶貴機遇。大數據已被美國在內的多國政府視為重要的戰略資源,我國也在抓緊研究并制定相應的大數據戰略。
大數據的特點多總結為“3V”,即,規模性(volume)、多樣性(variety)、高速性(Velocity)[1],還有人提出真實性(Veracity)和價值性(Value)等特征[2]。由于其數據來源及應用涉及廣泛,導致了以往在生產、經濟活動、科學研究甚至日常生活中的很多思維方式發生巨大變化,帶來了無數機遇。但由于網絡大數據具有復雜性、不確定性和涌現性,導致網絡數據安全方面面臨巨大的挑戰,制約大數據未來發展的瓶頸之一就是安全與隱私問題。
在大數據時代,通過對大數據分析、歸納,從中挖掘出潛在的模式,研究社會運行的規律與發展趨勢,可以幫助企業、商家調整市場政策、減少風險、理性面對市場做出決策。隨著新技術的不斷出現,在發現規律的同時,可能會泄漏個人隱私,嚴重威脅到人們的個人信息安全和機構的商業秘密安全。例如,我們的位置信息,每天的行程數據,在大數據時代,通過GPS、手機定位等,可以輕易獲得。
如果僅僅為了保護隱私就將所有的數據都加以隱藏,那么數據的價值無法體現。數據公開是非常有必要的,政府可以利用公開的數據了解整個國民經濟的運行,以便更好地宏觀指導。企業可以利用公開的數據了解客戶的需求,從而推出特色服務。研究者可以利用公開的數據,從社會、經濟、技術等不同的角度來進行研究。但是網絡中大量的公開數據如果缺乏監管,會導致用戶無法確定自己隱私的用途,增大了隱私泄漏的風險。
在網絡上人們為了保護個人隱私,可能采取匿名等方式將自己的行為隱藏起來。但是互聯網尤其是社交網絡的出現,使得人們在網絡中產生越來越多的數據足跡。這種數據具有累積性和關聯性,單個信息可能不會暴露用戶的隱私,但是如果有辦法將某個人的很多行為聚集在一起時,他的隱私就很可能會暴露,因為有關他的信息已經足夠多,這種隱性的數據暴露往往是個人無法預知和控制的。從技術層面來說,可以通過數據抽取和集成來實現用戶隱私的獲取,因此大數據時代的隱私性主要體現在不暴露用戶敏感信息的前提下進行有效的數據挖掘,這有別于傳統的信息安全技術手段。
文獻[3]中提出保護隱私的數據挖掘這一概念,近年來逐漸成為相關領域的研究熱點。主要研究新型的數據發布技術,嘗試在盡可能少損失數據信息的同時最大化地隱藏用戶隱私。Dwork在2006年提出了新的差分隱私方法[4]。差分隱私保護技術可能是解決大數據中隱私保護問題的一個方向,但是這項技術離實際應用還很遠。大數據未被妥善處理會對用戶的隱私造成極大的侵害,根據需要保護的內容不同,隱私保護又可以進一步細分為位置隱私保護、標識符匿名保護、連接關系匿名保護等[5]。根據大數據處理流程,可以分為幾個階段:
(1)數據采集與預處理時的隱私保護,如數據精度處理;
(2)數據共享、發布時的隱私保護,如數據的匿名處理等;
(3)數據分析時的隱私保護;
(4)隱私數據可信銷毀等。
保證用戶個人信息安全是大數據時代可持續發展的重要需求之一,賬戶被盜、資料丟失、隱私被敲詐等等問題,讓我們意識到隱私保護問題是一個綜合性的問題,需要用戶、運營商和監管部門共同協作,從國家、行業和用戶等各個層面來應對大數據環境中出現的安全問題。
1.從法律政策上加強信息保護和管理。“三分技術,七分管理”,大數據下的隱私保護應該是體制和法律的配套過程。數據資源是全民財產,政府在推動數據公開的基礎上,需要對信息的保護范圍和措施從法律角度上限定,如敏感數據的所有權和使用權界定及侵犯他人隱私的處罰問題。2013年3月1日開始實施的《信息安全技術、公共及商用服務信息系統個人信息保護指南》,作為個人信息保護方面的最高國家標準,它對大數據時代如何合理利用個人信息給予界定,以指導和規范利用信息系統處理個人信息的活動。
2.從技術上保護基礎設施和網絡安全。大數據時代下的社交網絡數據的存儲和處理需要大規模基礎設施的支撐,由于大量的數據匯集在一起,敏感數據集中起來會帶來攻擊效益的提高,極易成為黑客們攻擊的目標,基礎設施被攻擊的風險顯著提高,因而托管數據的云的安全非常重要,需要開發相應的反數據挖掘技術手段。
3.從管理上加強運營公司的監控力度。社交網絡運營商應該杜絕公司內部人員對用戶數據的非正當訪問,對外限制第三方公司對平臺內數據的訪問及相應的授權公司能夠訪問到的數據對象范圍,來加強數據的可控性。
4.從認識上提高用戶的隱私保護意識。要讓大眾知道數據有價值,并能意識到數據管理不善可能帶來的危害,提高自身的數據意識。
大數據給人們帶來極大便利的同時,也帶來了新的安全挑戰。本文主要闡述了大數據帶來的個人隱私方面的安全問題。由于基于隱私保護的數據挖掘技術還處于起步階段,進一步地完善基于隱私保護的大數據挖掘技術仍是將來的研究熱點。
[1]Grobelink M.Big-data computing:Creating revoIutionary breakthroughs in commerce,science and society[R/OL].20I2:10-02.
[2]http://wenku.baidu.com/view/abfb3a1552d380e b62946d9d.html:劉念真.利用0racle信息模型駕馭大數據.
[3]Agrawal R,Srikant R.Privacy preserving data mining[C]//Proc of SIGMOD 2000.New York:ACM,2000:439-450.
[4]Dwork C.Differential privacy[C]//Proc of ICALP2006.Berlin:Springer,2006:1-12.
[5]馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014.
book=176,ebook=110