喬冰
摘 要:社會信息化和網絡化的發展導致數據爆炸式增長,其中的隱私泄露和安全問題也格外引人注目。本文從隱私性、可信性兩個方面闡述大數據的安全問題。其中有四種大數據安全與隱私保護技術:數據水印技術、數據溯源技術、社交網絡匿名保護技術以及身份證認證技術。目前大數據的實際運用非常廣泛,大到交通管理,小到數據分析,都為人們的生產生活提供了專業的理論依據,從而保證數據被合理高效的使用。然而大數據為人們的生活帶來便利的同時,也帶來了安全威脅,由此大數據的安全與隱私保護變得越發重要起來。
關鍵詞:大數據;匿名保護;數據挖掘;隱私保護
一、引言
當今世紀,科技的發展為人們帶來了翻天覆地的變化,從以前的模糊理論,到現在發展的機器人技術。從機構算法、語音、圖像識別、立體跟蹤、AI識別、VI模擬技術,再到無人駕駛、無人機技術。這些都離不開后臺大數據的支持與保障。大數據因其處理數據規模大、速度高、多樣的特點,從而得名??萍及l展讓大數據得以全面鋪展,社會行為的方方面面得到長足的應用。隨著大數據的深入發展,其所帶來的安全問題與市場價值成為人們關注的焦點。
1大數據安全與隱私保護研究背景和研究意義
數據處理不當會給數據管理與收集帶來嚴重威脅,甚至會導致部分數據泄露。例如當健身房推廣業務時,營銷策劃會想方設法找來一些同行業的數據,這過程中如果因為某種原因造成會員的資料泄露,可能會對顧客的隱私造成極大的傷害。如果資料泄露甚至會發生特別嚴重的后果。在商業化應用中,用戶也有權力對自身的隱私進行保護,接洽的商業機構也有責任和義務對其隱私進行保護。
二、大數據帶來的安全與隱私保護的挑戰
2.1大數據中的用戶隱私外泄
隨著計算機的高速發展,虛假信息傳播的速度與日俱增,某些大數據的持有者,像單位和個人在數據挖掘之始,就存在魚目混珠的現象。從而在數據收集的過程中對于數據的泄露持無所謂的態度。他們明知道一部分數據造假,還通過平臺與媒體向社會披露,如果假的數據被認同,那么造成的傷害更大。就商業行為而言,適時變通無可厚非,但有目的性的造假從而獲取私利就是不負責的數據傳播。從而讓需要這些數據的使用者得到錯誤的理論支持,導致數據混淆,造成非常重大的損失。人們使用大數據之前必須要保證數據的真實性,并應該在數據的傳播過程中嚴格控制,提高數據的可信性。
當人們進行數據采集的時候可能會產生誤差,這種誤差應該保持在允許的范圍內,如果影響了最后的準確性,那么就是偽數據。例如,某電視臺在播報體育賽事時,主持人帶情緒性的偏向某一方,這種類型的數據往往回影響最終結果,失去了體育精神中的公平性原則。數據的失真很大程度是由于人為干預所引起,還有一些歷史的早期數據對這些結果也產生深遠影響,從而造成大數據可信性降低的現象。有些是在數據產生的過程中發生不可預支的情況,有些是在發生的過程中有能力控制行為人的舉動,從而導致這些數據偏離預定的軌道,得到了與原來數據截然不同的結果。這些偽數據根本表達不了真實的信息。反而會讓關注的人產生不想預見的結果。
2.2缺失大數據的規范管理
現如今,我國政府和有關部門還沒有制定專門的有關大數據信息安全和用戶隱私保護的法律法規,對于當今大數據的監管主要還依靠企業的自覺和個人的職業道德,當真的出現大數據安全和用戶隱私泄露時又沒有進行及時止損,由此而造成的損失則會越來越大。
三、大數據安全與隱私保護關鍵技術
3.1數據發布匿名保護技術
數據的匿名處理,信息可以公開發布了,事情證明,匿名保護技術這種方法并不能達到對隱私保護的理想效果。隱私識別技術在現在科技發展的過程中也多種多樣,以破解簡單的辦公文檔密碼為例,如果加密者是網站的所有者,那么密碼被撞庫的機率是很大的,偏巧文檔又有商業利益,那么行為人就會拿著現在的文檔在網站的關鍵字是做文章。從網址,網址延伸、再人肉加密者的名字、簡稱。很大機率會因為用心做這件事而使用加密文檔遭到破解。相關的資料是屬于敏感屬性,對識別技術而言,隱私是其需要攻擊的對象也是工作。找到方向破解相關的數據就會事半功倍。但匿名保護而被識別的主體轉移,那么匿名保護的結果又有何意義呢?
3.2社交網絡數據的匿名化隱私保護技術
社交網絡數據的匿名化隱私保護技術指的是在計算機網絡和數據庫中運用對敏感信息進行模糊、隱匿和清洗的過程,從而將用戶隱私的泄露風險降低到最小水平。社交網絡具有圖結構的特征,社交網絡間的數據并非相互獨立,而是存在著某種關聯,或者是協同關系或者是關聯關系,所以數據攻擊者有可能通過一種數據信息推測得出另一種數據信息,也可以通過公開信息去推測隱匿的信息,任何技術都無法保證萬無一失。
3.3數據水印技術
數據水印技術最常用的方法是將來有標識信息的數據嵌入到本體內部,對數據的使用不影響的一種方法。數據水印技術在媒體版權、文本文件和數據庫保護中都有著廣泛的應用。拿電子讀物來說,它是在電腦或手機客戶端建立的一種可視化的應用。里面不缺傳統雜志的圖文并茂,同時又可插入聲音和錄像的一種新媒體媒介。甚至有些還可以二次開發有互動功能。辛辛苦苦做的電子雜志如果不加防偽技術很容易成為被惡意盜版的對象。這時數據水印就派上用場,它可以暗影的形式存在于媒體中間。盜版者要處理掉就需要耗時費力。并且效果不很好。如果不處理在放送的時候很容易就會被識別。從而達到保護版權和合理利益的作用。用于社交的多媒體終端技術層出不窮,像閱后即焚。延時轉移等也越來越人性化。像水印防復制、抗衰減。水印識別技術相同出一轍。
3.4風險自適應的訪問控制
風險自適應的訪問控制主要適用于因為數據安全管理員缺乏專業大數據安全管理知識,缺少為用戶指定訪問數據經驗的大場景中。我們可以提前設置一個訪問的預定門限,當某一位用戶在進行大數據訪問的過程中超過了這一預定門限,就對其采取限制措施,使其不能再繼續訪問,當然這種門限要綜合考慮多方面的因素。
四、總結
雖然大數據給人們生活帶來了便利和效益,也同時有了威脅。要將信息安全放在第一位。實現大數據的安全也隱私保護就需要用數據溯源技術,身份認證技術、數據水印技術、社交網絡匿名保護技術等相關的技術,同時要建立相關的政策法規,只有通過技術手段與政策法規想結合,才能更好對大數據的安全和隱私進行保護。
參考文獻
[1]胡茶升.論大數據安全與隱私保護技術[J].科技與信息,2018,(19).
[2]曾琴.大數據環境下隱私保護及其關鍵技術研究[J].數字技術與應用,2018,(07).