●尹 婷 趙思佳 李合軍
現階段,依然有諸多問題存在大數據發展過程中,用戶最擔心的問題就是安全和個人隱私,商家利用互聯網的作用可以熟知人們的網上的各種舉動,例如網購習慣、好友聯系狀況以及閱讀習慣等,通過大量的實際案例得知,就算收集了大量沒有價值的數據信息,也會將用戶的隱私泄露。大數據具有廣泛的安全概念,用戶所面對的風險不單純是隱私的外露,同時還有較多的安全風險存在大數據儲存、處理和運輸等過程中,因此,想利用技術方法阻止商家使用用戶信息也具有一定難度。現有的方法在對用戶隱私信息進行保護的同時增加了設置的復雜性,同時安全性也有待提高。本文選用一種基于大數據分析的隱私信息保護方法,大數據的價值密度很低,在眾多的數據當中有利用價值的數據少之又少,因此在對數據中的價值提取時需要利用大數據的分析技術作為支撐,利用大數據技術可以有效地提高獲取到的信息的價值,同時保證了網絡中用戶隱私信息的安全①。
人們普遍認為大數據十分復雜,并且規模較大,對數據的處理難以使用現有的數據庫管理工作來完成,大數據具有多樣、高速并且規模大的特征。不同來源大數據可以分為三種:(1)來源于人類,人們在使用互聯網的過程中產生文字、圖品以及視頻等不同的信息;(2)來源于計算機,各種不同的數據通過計算機系統而產生,存在的方式則是以文件、數據以及多媒體方式,同時也有審計和日志生成信息;(3)來源于各種物體,比方說攝像頭等設備搜集的數據②。
1.獲得知識與推測趨勢。人們在很久之前就可以對數據進行分析,最初以獲得知識并利用知識為目的,但是有諸多真實信息存在大數據中,個體差異能夠通過大數據分析遺棄,為人們提供更加精準的事物原則,針對自然或是社會現象可以通過挖掘出得到更精準的預測。其中Google 公司的GoogleFluTrends 是經典的案例網站,將人們對流感信息的搜索進行統計分析,利用Google 服務器上的IP 地址獲取來源地址,進而將全世界不同的流感情況的預測公布出來⑤同時,人們對股市行情的預測也可以利用Twitter 來完成③。
2.分析掌握個性化特征。不同群體特征通過個體活動得到滿足,同時也有明顯的個性化特點存在其中,就好比細長的尾巴出現在“長尾理論”中,這些特點或許各不相同,企業完成數據的積累或許需要大量的時間,同時也需要從不同維度進行搜集,這樣就可以將用戶的行為規律分析出來,進行個體輪廓的精準的描繪,讓用戶享受到優質的服務以及個性化的商品,同時可以推薦出更加精準的廣告。比如Google 分析用戶的習慣和個人愛好利用大數據來完成,廣告商可以獲取精準的活動效果④。
現階段,公認為最有效的方式就是大數據進行真實性分析,諸多企業經營開始實施了對大數據真實性的研究,比方說Yahoo 和Thinkmaii 利用大數據科技的優勢,將郵件中的垃圾信息過濾掉;大數據分析也可以完成社交平臺上虛假評論的區分;又比如說新浪等大型社交平臺對不同垃圾信息的分類使用大數據分析來完成,垃圾信息的鑒別能力在大數據的數據真實性分析技術下可以實現一定程度的提高。一方面,利用大數據分析的優勢可以得到更加精準的結果,比如說有虛假信息出現的點評網站中,通過大數據分析就獲取評論者的位置、評論時間以及內容等重要信息;另一方面,將機器學習結束融入到大數據分析中,能獲取大批量的信息,但是有一定的困難存在這種技術中⑤。
針對發生機制和隱私泄露的問題而言,第一步需要建立完善的用戶信息隱私問題機制模型,下圖就完美展示了用戶隱私泄露點和發生機制間的聯系。
第一點隱私泄露為:用戶沒有匿名使用網絡服務,之后又未進行失真處理,因此,造成隱私泄露的問題。
第二點隱私泄漏為:用戶的個人信息被網絡服務方完全掌握的形式下:(1)隱私攻擊者對信息進行了攻擊,導致信息泄露;(2)大數據接受到網絡服務挖掘信息的信號,從而開始挖掘第三方數據,但是信息加密沒有得到有效的結果,從而造成用戶信息泄露。
第三點隱私泄露為:用戶在使用網絡時,留下的信息被隱私攻擊者盜取,而造成隱私信息發生泄露,發生原因主要是用戶沒有較高的隱私保護觀念,以及沒有使用有效的保護方式。
通過以上對用戶信息隱私泄露點和發生機制的分析,用戶隱私信息泄露的原因主要包括四點:(1)用戶自身不具備較高的隱私保護意識,同時也沒有使用有效的保護方式,因此導致用戶泄露隱私信息;(2)網絡服務方內部不具備嚴格的數量管理制度;(3)第三方的隱私保護技術不具備完整有效性,導致用戶的隱私信息被泄露;(4)隱私保護技術漏洞給攻擊者提供了機會,通過非法手段得到用戶信息⑥。
選用一種大數據存儲中的隱私信息保護策略,對大數據的存儲方式進行重新的設計,并對存儲的數據進行完整性檢驗,同時制定控制協議,控制用戶對網絡數據信息的訪問權限,以此保證網絡用戶隱私信息不被泄露,提高數據存儲整體的安全性。
粘性訪問控制策略是專門針對網絡用戶,將傳輸的數據信息制定成一個固定形式的文件,并將數據與文件一同傳輸到模擬服務器當中。當上傳的數據被使用、下載時需要上傳用戶的授權才能夠獲取。同態驗證策略是一種利用同態映射機制的隱私保護策略,這種策略可以實現對上傳數據的求和形式驗證,以此保證了在數據傳輸以及計算的過程中,用戶隱私信息的安全⑦。
通常情況下,數據的存儲主要是由網絡用戶、可信機構、驗證者組成的。網絡用戶通過可信機構將本地的數據信息存儲在云端,以此減輕本地存儲的壓力,同時允許合法的用戶對其數據進行訪問。在對數據進行存儲的過程中,通過可信機構將數據進行分塊處理,并生成密鑰,以此保證后續的數據具有一定的驗證性,再將分塊的數據分配到不同的節點當中,并建立起相應的列表⑧。再通過驗證者對數據的完整性進行檢驗,并向云服務簇發出挑戰,當云服務得出反饋結果后,在對結果進行驗證。若在這一過程中,出現了不能通過驗證的分塊數據,則對其分塊數據的所在位置進行定位,并通過適當的處理對數據進行恢復。再利用上文提到的粘性訪問控制策略對生成的密鑰進行加密,并將加密后的文件與密鑰一同存儲在網絡云端當中,其他用戶想要獲取信息只需提供符合要求的密碼即可解密所需的數據信息⑨。
網絡用戶需要在可信機構中完成信息注冊,再通過機構給予的屬性及密鑰獲取到相應數據信息。數據的擁有者將上傳的信息進行加密從而得到一份文本密文,再通過相應的策略對密鑰進行加密,任何符合屬性要求的用戶都可以獲取到相應的解密密鑰,從而獲取到真正的數據信息,以此完成數據訪問控制協議的設計⑩。
本文選用一種基于大數據分析的隱私信息保護方法,大數據的價值密度很低,在眾多的數據當中有利用價值的數據少之又少,因此在對數據中的價值提取時需要利用大數據的分析技術作為支撐。?通過本文的設計研究已經可以在一定程度上保護用戶隱私信息的安全性,在今后的研究中還將對用戶的個性化隱私偏好進行研究,并設計出更加靈活且實用的保護隱私策略,在保證網絡用戶的隱私信息得到安全保障的同時,靈活地對數據信息進行處理,方便符合用戶屬性以及具有密鑰的用戶更加快速地獲取到相應的信息數據。
注釋:
①張金年.我國大數據時代個人信息研究現狀與熱點分析[J].圖書情報導刊,2020,5(04):56- 66
②張建珍,牛煜艷,李強.大數據背景下在線學習用戶的隱私保護研究[J].智能計算機與應用,2020,10(02):236- 239
③蔣玉婷。基于大數據分析的隱私信息保護方法研究[J].信息記錄材料,2019,20(11):244- 245
④楊朝暉,王心,徐香蘭.醫療健康大數據分類及問題探討[J].衛生經濟研究,2019,36(03):29- 31
⑤王平水,朱新峰.基于大數據分析的移動社交網絡用戶隱私信息關聯關系研究[J].赤峰學院學報(自然科學版),2018,34(08):49- 51
⑥劉凌宇. 個人數據安全的風險控制與保障體系研究 [D]. 山西大學,2018
⑦陸雪梅,古春生.大數據環境下用戶信息隱私泄露成因分析和保護對策[J].現代情報,2016,36(11):66- 70
⑧李鳳華,李暉,賈焰,俞能海,翁健.隱私計算研究范疇及發展趨勢[J].通信學報,2016,37(04):1- 11
⑨馬立川,裴慶祺,冷昊,李紅寧.大數據安全研究概述[J].無線電通信技術,2015,41(01):1- 7
⑩馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014,37(01):246- 258
?張成焉,王繼輝.社交網絡中用戶數據偏好分析[J].電子世界,2018(12)