李洋 曹毓青
摘要:隨著互聯網技術的飛速發展,依托互聯網、大數據技術開設的各種平臺等給人們的生活帶來了極大的便利,但同時也存在著許多安全問題,其中以個人隱私安全問題最受人們關注。文章主要對大數據的性質特征及有關個人隱私安全問題防范措施等進行簡要分析,以便幫助大家對大數據有一個更加深刻的認識,對隱私安全問題加以重視和做好防范措施。
關鍵詞:大數據;隱私安全;防范措施
伴隨著云時代的到來,大數據也吸引了越來越多的關注,從而也使得大數據在各個行業都得到了飛速發展,其帶來的便利也體現在生活的方方面面。但任何事物在高速發展的同時,總是不可避免地出現一系列問題。人們的衣食住行,利用大數據都可以分析得很準確,所以說大數據環境下的安全隱私問題也成了當下之急。
1 大數據及其性質特征
1.1大數據的定義 大數據又稱為巨量資料,一般是指通過新的處理模式才能讓它具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。它的特點就在于它的大,從宏觀上來講,大數據其中的數據基本可以包含人們生活中的每一部分[1]。
1.2大數據的性質特征
(l)大數據的主要特征:首先是數據體量大,一般單位都能達到10 TB以上,有的甚至更大;其次,數據類別大,因為它的來源是多元化的,來自于生活的方方面面,而且數據種類和結構種類較多;還有就是數據處理速度比較快,能及時處理和響應請求,從而很大程度上提高了解決問題的效率;最后是數據真實性強,這就使得它更有意義和實用性,因為在現實中像金融、服務、電信、保險等行業,對數據的真實性要求非常高。(2)大數據及時性處理。在對大數據進行處理分析的時候肯定要消耗很多的資源,所以說人是完不成這個計算量的,必須依賴于具有高效率的計算機和云處理技術,采用分布式處理,分布式數據庫,云存儲和虛擬化技術。(3)大數據的應用。隨著互聯網、大數據技術的不斷發展,大數據技術的應用范疇不斷地擴大,尤其是數據格式的多樣化使其能夠適應不同的情景,可以說當今各行各業的發展都離不開大數據,比如在購物時,我們可以通過不同用戶的年齡、性別、所在地區、購物喜好來對用戶進行數據分析,從而給用戶推薦更適合自己的商品,進一步優化用戶的購物體驗。不過由于數據量龐大,這也就得采用大數據技術進行數據比對和分析處理[2]。
2 大數據環境下的隱私安全威脅
伴隨著網絡信息化的發展,在一些社交網站上,人們通過手機、電腦等通信網絡分享自己的所見所聞,奇聞樂事,殊不知這些操作都會被服務器作為一條一條的數據記錄下來。若一些非法分子對這些信息加以利用,進行數據分析處理,就會成為非常有價值的個人信息。所以說當下如何保護個人信息安全及隱私問題已是迫在眉睫。
2.1隱私安全
現在,不管是瀏覽購物網站還是閱讀網站時,都會對用戶停留時間、瀏覽的內容等進行數據分析,然后產生用戶可能會感興趣的內容推薦;雖然方便了用戶在網上進行極強的目標性瀏覽與選擇,但是在獲得方便一且快捷的個性化服務的背后,卻在某種程度上暴露了自己的隱私。我們在使用互聯網時,信息在不知不覺中就會被記錄下來了;如手機通話時,通話的對象與通話的時間,甚至連通話地點也在運營商的掌控之中;當我們在空間或朋友圈等社交網絡中發表言論或者分享照片的時候,互聯網運營商便可以獲得用戶的個人喜好……隨著數據采集技術的發展,大數據時代產生的眾多精細化的數據,可用來描述各種物體,隱私信息可在用戶毫無察覺的情況下被獲取,通過對這些數據進行分析處理,可大大減少社會的復雜度,提高人們認識世界、改造世界的能力。這些信息若被有效地利用,確實可給人類生活帶來諸多方便,可假如要是對其無限制甚至是惡意利用,所造成的后果是無法估量的[3]。
2.2個人信息安全
據法制日報報道,浙江省松陽縣人民法院一審判決一起特大侵犯公民個人信息案,該案涉及7億條公民隱私信息被泄露,8 000余萬條公民信息被販賣。后經查明,涉案的王某于2016年2月入侵某部委醫療服務信息系統,私自將該系統內的部分公民個人信息導出并出售。涉案的庫某于2016年9月入侵某省扶貧網站,竊取該系統數名高級管理員的賬號和密碼,對系統內大量公民的個人信息數據進行下載和販賣。
據外媒報道,網絡安全公司Kromtech的研究人員BobDiachenko發現國際知名退稅公司MoneyBack因運行不安全數據庫,導致400 GB的墨西哥游客個人信息遭到在線泄露,這些泄露的信息包括游客個人的姓名、電話號碼、地址、信用卡等。MoneyBack公司在該事件曝光后,采取了緊急措施,利用修改訪問權限等措施確保用戶數據安全。
3 隱私安全保護技術
3.1基于數據失真的隱私保護技術
基于數據失真的隱私保護技術是通過對原始的數據進行擾動來達到隱私保護的目的。經過擾動的數據要同時滿足以下兩個要求:(l)攻擊者無法獲得真實的原始數據信息,即攻擊者獲得發布的變換后的數據是無法重構出原始數據信息的。(2)變換后的數據與變換前的數據在某些性質上依然具有一致性,即在變換前數據上具有的性質,在變換后依然具有相似的性質。
目前,基于數據失真的隱私保護技術有隨機化、阻塞和凝聚等方法。通過對原始數據進行相應的處理,將經過變換后失真的數據進行發布,從而降低原始數據暴露的風險[5]。
3.2基于數據加密的隱私保護技術
基于數據加密的隱私保護技術是通過將數據加密機制引入到交互計算協議中,從而實現信息保密的安全計算,并能很好地支持在分布式環境中進行的數據挖掘工作。基于數據加密的隱私保護技術中最主要的方法就是安全多方計算( Secure Multi-Party Computation,SMC),其是指相互獨立的多方(兩方以上的)參與者通過合作來得到基于其私有輸入所對應的輸出結果,并且在整個合作計算的過程中,確保各方輸入信息的安全,任何一方不會得到其他參與者的私有數據信息6]。
3.3基于限制發布的隱私保護技術
基于限制發布的隱私保護技術是通過對初始的數據進行選擇性發布,即不發布數據或者改變原有的數據精度,來達到隱藏敏感信息的效果,從而達到隱私保護的目的[7]。
3.4基于數據存儲的隱私保護技術
大數據平臺的特點之一就是利用云計算等技術實現對數據的存儲,依賴于傳統的數據加密手段雖然能夠實現對數據的加密存儲安全。但是由于密鑰管理比較復雜,很難適應大量用戶的要求,因此,構建同態加密算法可以適用于大數據隱私存儲保護系統,避免數據的安全問題出現。當然如果數據存儲在云計算平臺中,因為云計算的特殊特點導致用戶難以對數據進行控制,因此,就可能會出現數據丟失的現象,針對該問題采取審計技術,也會是數據的擁有者對云中的數據完整性進行審計,保證數據不被丟失、篡改等[8-9]。
4結語
總而言之,大數據是對那些對一些比較龐大的數據,經過高速率,超強處理能力,通過一些新型工具和系統進行開發分析,從而獲得有未來價值的信息和結構。大數據時代的來臨,給人們帶來的無與倫比的享受和便利,但其在不斷發展的同時,也出現了一些個人隱私安全隱患問題,我們既要有效利用信息,也應注意加強對信息安全問題的研究力度,才能真正意義上發揮出大數據的真正威力。
[參考文獻]
[1]司若倩.面向數據挖掘的隱私保護方法研究與應用[D].南京:南京郵電大學,2016
[2]馮登國,張敏,李昊.大數據安全與隱私保護[J]計算機學報,2014 (1):246-258
[3]肖杰,袁嵩,譚天.大數據時代數據隱私安全研究[J]計算機技術與發展,2016 (5):91-94.
[4]張春艷.大數據時代下的公共安全治理[J]國家行政學院學報,2014 (5):100-104
[5]王丹,趙文兵,丁志明.大數據安全保障關鍵技術分析綜述[J].北京工業大學學報,2017 (3):335-349
[6]傅長順.大數據隱私保護的應用[J]電子技術與軟件工程,2016 (6):21-24.
[7]查玉祥.論電子支付系統的安全問題分析及技術對策[J]計算機光盤軟件與應用,2011(18):149.
[8l曾巖,孫鳳茹.基于PKI技術的電子支付平臺安全性分析[J].致富時代,2011( 11):170
[9]王萍,楊慶紅,劉超.電子支付安全問題分析與對策[J]江西金融職工大學學報,2010 (1):39-42