劉洪霞
摘要:在互聯網技術快速普及的影響下,人們已經進入了大數據時代,這對人們的工作、學習與生活產生了顛覆性的影響。以網絡為依托的大數據已經成為了產業界學者研究的焦點。由于網絡所附有的開放性特質,所以我們必須要重視大數據時代下數據的安全性,做好數據的安全管理,采用先進的技術做好隱私保護。降低大數據的風險,才能夠讓其發揮應有的作用。下文中筆者對大數據安全與隱私保護方面的問題進行了總結,旨在對相關工作的落實有所幫助。
關鍵詞:大數據;安全;隱私保護;信息安全;研究
現如今,大數據依托于科技以及相關產業已經逐漸受到了人們的關注,它已經成為“云計算”之后信息產業發展的新的增長點。大數據在創造巨大的經濟效益的同時,其中暴露出來的問題我們也無法忽視。每天都有數以億計的人在依靠大數據獲取互聯網信息,這個過程中他們的個人信息也暴露在了互聯網之上,為了保障用戶的信息隱私,我們需要提高對于安全以及隱私保護問題的重視程度,革新現有的技術。
一、大數據的基本概述
1、來源
從概念層面來說,大數據主要指的是復雜且數量龐大、無法用現有的數據管理工具來進行處理的數據群。大數據的來源渠道主要包括以下幾種:首先人為產生,人們使用計算機網絡在互聯網上發布的圖片、文字、音頻以及視頻等數據信息是大數據的主要來源,人為增加的這類數據信息會對人們篩選獲取信息的過程產生一定阻礙。其次機器產生,存儲在計算機中并且由機器產生的各類日志、數據庫以及文件等數據信息也是大數據的主要來源。最后計算機進行的設備數據記錄也是大數據中非常重要的一部分來源,例如企業倉庫記錄的各類產品信息,天文望遠鏡中計算所得的物品屬性類信息等等。【1】
2、特征
大數據的特征主要體現在以下幾個方面:首先規模性。依托于大數據而集結的信息龐大、復雜,信息總量也一直處在不斷上漲的趨勢之下。綜合相關數據分析,近些年總信息量已經達到了8ZB,因此規模性是大數據最典型的特征。其次多樣性。過去大都依靠文本來完成對于數據的搜集,此種狀態下的數據也大都是結構化的數據,這降低了數據儲存以及查看的難度。【2】現如今在技術發展的影響之下,信息儲存的樣式也在不斷增加,在儲存文本的同時我們也通常需要儲存圖片、視頻以及音頻等資料,如此非結構化的數據越來越多。最后價值性。大數據的價值性主要指的是對儲存的數據信息進行分析統計的過程,提取出其中有價值的信息讓使用者使用,以滿足不同的需求。此外,當前人們對信息處理效率的要求正在不斷提高,對實時信息的需求量也在不斷增加,從某種層面分析,信息的時效性也是其價值的體現。
二、大數據時代所面臨的安全挑戰
1、用戶隱私的保護
因為大數據中的信息量非常龐雜,所以為了保證用戶隱私信息的安全性必須要對其進行妥善的處理。就用戶隱私保護而言,我們可以將其分為未知隱私保護、標識符匿名隱私保護以及連接關系間的匿名隱私保護等類別。企業依托于大數據,對用戶的行為以及生活狀態進行分析預測,更助于企業掌握用戶的生活習慣、愛好以及消費記錄情況。【3】以此為切入點,有針對性的進行廣告推薦取得的效果更好。結合實際分析,“匿名處理”因操作簡便等優勢已經成為了首選的隱私保護手段,但實際工作中,這種方式取得的效果實在非常有限。單純的隱藏用戶的真實姓名根本無法完成對于用戶隱私的保護,若繼續沿用此種模式必然會引發一系列的問題。綜上,大數據時代下我們需要創新用戶的隱私保護模式。
2、大數據的可信度
基于大數據,在人們的認識里逐漸形成了一個錯誤的觀點:數據可以說明一切,數據本身即是事實。殊不知這一觀點不僅片面而且沒有根據,如果不能仔細甄別數據信息,那么即便是大數據也會誘導我們作出錯誤的結論。這就像人如果一味的相信自己的眼睛,必然會在自己“看不到”的地方出錯一樣。
當前大數據可信度的威脅主要包括偽造、刻意捏造數據以及數據在傳播中逐步失真兩部分內容。首先若數據的應用場景已知,那么數據信息的發布者為了誘導信息使用者得出某種有利的結論,便會刻意偽造某些數據來營造出某種“假象”。這些偽造的數據信息會藏在大量真實的數據信息之中,人們在短時間內根本無法鑒別其真偽,此時在這些被偽造的信息影響之下人們往往會得出錯誤的結論。這類問題常見于點評網站之上,某些商品的虛假評論會混在真實評論之中,用戶根本無法分辨,最終有可能會選擇劣質的服務以及商品。互聯網之上虛假信息的產生以及傳播越來越容易,僅依靠現有的信息安全手段想要甄別所有信息的來源是不現實的。此外,人工干預的數據采集過程很容易會出現誤差,由此而導致的數據失真或是出現偏差最終會影響數據分析的準確性。數據版本的變更也有可能會導致數據逐步失真,由此現實情況的變化,早期采集的數據根本無法反映真實的狀況,這也會影響信息使用者的判斷。
綜上,基于大數據時代信息的使用者應該具備判斷數據來源以及傳播途徑真實性的能力,以此來了解各類信息數據的可信度,避免得出有錯或是無意義的結論。
三、大數據安全與隱私的保護措施
1、針對數據發布的匿名保護技術
基于結構化大數據,要想增強用戶數據安全與隱私的保護,就必須強化數據發布匿名保護技術的研究,不斷改進完善匿名保護技術。現階段,國內針對大數據的匿名保護仍處在較為初級的階段,保護的范圍也只是局限在一次性用戶靜態發布的數據之上。今后還需要相關技術人員不斷研究,從而擴大匿名保護的范圍。此外,在數據信息多變性的影響之下,信息的發布大多不是一次性的,所以現有的技術條件根本無法對數據的發布實行匿名措施。
2、針對社交網絡的匿名保護技術
用戶在社交網絡中發布的數據包含大量的隱私信息,現如今這類數據已經成為了大數據的主要來源。因其中圖結構的數據占的比例較重,所以現有的數據保護技術無法對這類數據進行有效的保護。入侵者通過分析點與邊的相關屬性會完成數據的分析整合,這能夠重新鑒定出用戶的身份信息。所以針對社交網絡中的信息所進行的匿名保護,必須依托于圖結構的特征展開,在發布信息時就應該對能夠標識用戶信息的數據進行處理。此外,也應該對用戶間的關系進行匿名處理,以提高用戶信息匿名保護的力度。【4】
3、數據水印技術
所謂數據水印技術就是將那些可以進行標識的信息在不影響正常的數據內容和數據使用的前提下,用相對難以察覺的方式嵌入到數據載體之中,其中在媒體版權維護、數據庫和文本文件的比較中應用的相對廣泛。根據數據水印的作用我們可以將其分為強健水印類和脆弱水印類兩種,強健水印類能夠很好的保護原作者的創作權,而脆弱水印類則能夠確保數據的真實性。不過數據水印技術多是在小范圍內應用,因此需要我們加強對其的研究和應用,更好的發揮其作用。
【總結】
大數據時代下,數據量呈現出了爆炸式的增長。大數據在給用戶帶來便利的同時,也對用戶個人信息的安全帶來了極大的威脅。未來我們必須加強大數據安全技術的運用,以技術為依托,保證信息在儲存、傳遞以及應用環節的安全性。上文筆者對此類問題進行了總結,旨在對相關工作的落實有所幫助。
參考文獻:
[1]曹珍富,董曉蕾,周俊,沈佳辰,寧建廷,鞏俊卿.大數據安全與隱私保護研究進展[J].計算機研究與發展,2016,53(10):2137-2151.
[2]馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014,37(01):246-258.
[3]崔洪剛,唐浩,汪永超.試論大數據安全與隱私保護[J].科技風,2016(07):92-93.
[4]呂欣,韓曉露.大數據安全和隱私保護技術架構研究[J].信息安全研究,2016,2(03):244-250.