祝朝暉 顏佳偉
江蘇省泰興市廣播電視臺
大數據安全與隱私保護
祝朝暉 顏佳偉
江蘇省泰興市廣播電視臺
隨著計算機及網絡技術的飛速發展,迎來了大數據時代。大數據不論對人們的工作、娛樂還是生活都產生著一定的影響,現已成為人們普遍關注的重點。當前我國的大數據仍舊在發展與完善過程中,大數據在應用中存在著一些安全隱患,經過網絡傳輸的信息嚴重失真,網絡用戶的個人隱私已經不再是秘密。基于此,本文對大數據的安全性與其隱私保護等相關方面做出相關探討。
大數據 安全 隱私保護
大數據在各行各業普及應用,成為21世紀網絡信息技術發展的重要標志。大數據包含著規模巨大且復雜的信息,這增加了數據分析與處理的復雜性。面對這一規模巨大且復雜的數據系統,應加強其安全與隱私保護等相關技術的使用,提升對這一問題的重視程度。
1.1 大數據的起源與基本特征
廣泛的講,大數據即體系巨大且較為繁雜,管理難度大、處理分析難度大的數據信息系統。大數據的基本特征包括:大規模化、高速化和多元化。
按照渠道的劃分,可將大數據分為以下幾種類別:
第一,來自人類。人們在應用網絡中或者開展互聯網工作中會產生不同種類的數據信息,其中包含視音頻、圖片、數字、文字等象征符號。
第二,來自計算機。在不同類別的計算機系統中,因為人類的操作會自動生成數據信息,并且以文件、多媒體等方式存在,同時也包含著日志、審計等內容的數據信息。
第三,來自物。各種不同類型的數字化設備為了方便將視音頻、圖片、數字、文字更好地存儲,將這些內容轉化成不同的數字編號。比如:手機、攝像機等。
1.2 大數據的基本框架
大數據的基本框架基本劃分為數據采集與預處理、數據分析、數據解釋等。如圖1所示:

圖1 大數據的基本框架結構
1.2.1 數據采集與預處理
因為大數據信息來源的渠道不同,存在不同方式的解釋,其中也包含著矛盾,所以,在信息整合過程中要對其內容進行清理,對排除一些相同或是相似以及存在差異的信息尤為重要。
1.2.2 數據分析
這一環節處于中心位置,可以將其按照層次結構分為三種類別:架構、搜索與訪問、分析與處理。例如:我們可以通過對用戶的地點變化、行為等信息進行分析,得出不同國家、不同地區、不同群體的行為差異,進而對全球范圍內不同國家、不同地區、不同用戶群體的具體情況進行預測;再如:我們可以通過對QQ、微信用戶的地點變化分析出節假日期間有多少人外出旅游、有多少人回家探親、有多少人留在原地。
1.2.3 數據解釋
這一環節能夠更好地幫助用戶進行數據處理與分析,并有效使用其結果,主要使用的技術為可視化與人機互動。
2.1 信息發布匿名
針對其中的結構化數據,這一技術占據核心位置,但仍舊處在前進的發展階段。例如:以較為經典的k匿名為案例,初期階段方案借助元祖泛化,加之阻礙處理的方式,將信息符號分組每個組別中至少包含一個帶k的元祖;確定裁剪計劃;采用匿名模型將信息連串發布。
2.2 水印技術
這種處理技術常見于信息數據的版權保護中,將具備識別度的信息經過技術處理以不被人發覺的方式隱藏在載體中,同時對其不產生任何影響。例如:(Agrawal)相關人員不能夠容忍數據庫中存在失誤,將較少的信息融入到大數據當中,選擇合適的位置儲存。
2.3 角色挖掘
考慮到不同角色在數據信息的訪問中受到限制,以對使用用戶分設角色的方式進行銜接與區分,對不同用戶授予不同權限。例如我們對“泰興網(www.taixing.cn)”、“泰興政府網(www. taixing.gov.cn)”的用戶權限進行分類,對不同等級的用戶分別授予不同權限。在大數據形式下,角色挖掘能夠按照不同用戶的訪問情況自動劃分角色,更好地為不同的使用用戶提供個性化服務。
3 結語
面對大數據的到來,技術也提升了發展更新的速度,但新的挑戰與問題也漸趨顯現出來,信息時代中大數據的安全與隱私保護是當前時期的重點問題。未來的大數據極有可能向著服務方向發展,各個企業之間互相合作、依賴,共創具備安全性的服務體系,保證涉及到的行業領域向著健康狀態發展。
[1]張冰,楊靜,張健沛等.面向聚類分析的鄰域拓撲勢熵數據擾動方法[J].哈爾濱工程大學學報,2014(9):1149-1155
[2]周志剛,張宏莉,余翔湛等.面向DaaS應用的數據集成隱私保護機制研究[J].通信學報,2016,37(4):96-106
[3]李千目,李德強,趙健等.基于安全多方求和與可驗證私密分享的位置隱私保護協議[J].南京理工大學學報(自然科學版),2016,40(3):255-261