文|張營軍
?
大數據安全與隱私保
文|張營軍
在如今這個信息時代中,“大數據”儼然已經逐漸的稱為了廣受社會各界關注的熱點問題之一。不口否認的是,大數據的存在對人們生活生產等多方面都帶來了較為積極的作用,但不可避免的是,大數據的應用依舊存在著諸多的風險。那么,如何利用有效的措施來保護大數據的安全與隱私,顯然已經成為了當下大數據應用領域中最需得到解決的問題。該文基于大數據的應用目標來對大數據安全與隱私的保護技術進行了系統的分析與探究。
在人們對數據使用量日益增加的背景下,繼互聯網、物聯網、云計算過后,大數據已經逐漸的稱為了信息技術領域當中的“標志”。大數據,具備了多樣性、復雜性、高速性等特點,因此人們對其數據信息的分析與研究將不會那么容易。顯然,要想較好的處理與管理這樣復雜的數據系統,需要全面的安全、隱私保護技術。但就目前的情況來看,關于大數據信息安全及隱私的問題并沒有得到實質性的解決。
就目前的情況來看,大數據已經被廣泛的應用于科學、商業、醫藥、教育等多種領域當中。而對于每一個不同的領域而言,雖然大數據的用途也存在著一定的差異,但整個應用目標來說,顯然是極為相似的。具體而言,主要體現在以下幾個方面:一是對數據進行長期性、多角度的分析、對比與積累,即能夠有效的總結出用戶的個性化特征。而對于企業而言,即能夠通過對這些個性化特征的利用,來有效的了解與掌握用戶的行為習慣,從而對用戶進行科學合理的定位與分類,最終為不同的人群提供不同的個性化服務;二是經過對現有數據的深入挖掘與分析,即能夠及時、有效的獲取具有價值的信息。通過信息的挖掘,人們即能透過現象看到事物的本質,從而實現對事物發展趨勢的正確預測,更快、更好的把握事物的發展規律。
數據溯源技術。之前,對于數據溯源技術的研究僅僅針對于數據庫的領域當中,而目前這項技術也被廣泛的應用的到了大數據的安全與隱私保護中。作為數據溯源技術中最為基礎的手段,標記法的作用主要是實現對數據出處及計算方法的記錄。通過對來源數據的標記,不僅能夠幫助使用者對分析的結果進行有效的檢驗,也能夠讓使用在判斷信息真偽的時間得以縮短。同時,數據溯源技術的作用在文件的恢復與溯源中也能夠得到充分的發揮。
數據水印技術。所謂數據水印技術,即是指在不影響數據使用及數據內容的前提下將可標示信息以一些很難察覺的方式嵌入到數據載體當中[1]。這樣的技術一般都用于媒體版權的保護,當然也有一些文本文件與數據庫因員工數據水印技術。但是,在多媒體載體上與文本文檔或數據庫應用數據水印技術卻有著極大的不同,即與這兩者數據的動態性、無序等特點不相一致。從作用的力度來看,可以將數據水印技術劃分為強健水印類與脆弱水印類。一般情況下,強健水印類都用于數據起源的證明上,能夠有效的保護原作者的創作權等。而脆弱水印類則多用于證明數據真實與否。但針對于目前快速大量生產的大數據而言,水印技術明顯還需要在很多地方進行改進與完善。
身份認證技術。所謂身份認證技術,即通過對用戶以及其所使用設備行為數據的采集與分析來獲取行為特征,從而通過利用這些所獲取的特征信息來對相應的操作者、用戶以及所使用的設備的行為進行有效的驗證,最終確定其身份。顯然,通過身份認證技術的應用,黑客入侵攻擊的難度將得到陡增,不僅減輕了用戶的負擔,也讓不同系統的認證機制得到了統一。
數據發布匿名保護技術。以結構化數據的角度來看,數據發布匿名保護技術即是保護數據安全與隱私過程中極為關鍵的部分。但是,就目前的情況來看,這項技術還存在著諸多的問題,需要進行不斷的發掘與完善。目前,在數據發布匿名保護技術的基本理論中,絕大部分在設定環境的時候都是由用戶靜態的、一次性的對數據進行發布。比如:通過抑制處理方式和元祖泛化方式來對標識符進行分組,而針對于具有共同屬性的集合而言,則采用匿名模式來對其進行匿名處理[2]。顯然,這樣的方式很容易將某些特殊的屬性遺漏掉。但現實是多變的,一般情況下,數據發布都是多次的、連續的。在復雜的大數據環境下,要想讓數據發布匿名保護技術得以實現,顯然是較困難的。針對于攻擊者而言,可以通過不同的渠道、不同的發布點來獲取各種數據、信息,從而確定用戶的信息。因此,針對于這一點而言,作為信息領域的相關研究人員,應該投入更多的精力對其進行深入的研究。
總之,就整體來看,國內外針對于大數據安全與隱私保護技術的相關研究而言,明顯還不夠充分。因此,我們不僅要進一步對技術手段進行改善與創新,同時也要建立健全相關的政策法規。只有這樣,大數據安全與隱私的保護問題才能夠得以解決。
(作者單位:空軍指揮學院)