張維作
摘 要:文章針對目前大數據隱私保護機制具有的局限性,提出了基于模糊評估的現代社會網絡隱私風險,使大數據隱私能夠主動保護。在相關專家及文獻的研究基礎上,分析了大數據環境下社會網絡存在的隱私風險。本研究證明基于模糊評價的社交網絡風險具有良好的實用性,能夠提高大數據環境下社會網絡的服務水平。
關鍵詞:模糊評估;大數據時代;社交網絡;隱私風險
在我國社會不斷進步的過程中,科技也在不斷的發展,現代社會產生的數據極速增長,統計數據量以PB(1024TB)級趨勢不斷增加,人們已經進入到大數據時代。現代社交網絡備受人們喜愛,越來越多的人們喜歡通過社交網絡分享自己的所見所聞、交友、聊天,人們在網絡中的每一步操作都被服務器所記錄。在開發社交網絡個人信息潛在價值的基礎上,如何保證其個人信息的安全性,保證個人信息不被利用及收集,是目前大數據時代要解決的問題。
1 創建隱私風險評估指標體系
1.1 社交網絡的隱私風險因素
現在我們處于大數據時代中,社交網絡也不斷深入對用戶數據的收集、處理及分享,也增加了用戶隱私被侵害及威脅的可能性。社交網絡隱私風險主要分為:
其一,社交網絡較為脆弱。其主要包括軟件缺陷、硬件缺陷、網絡通信協議、用戶隱私安全設置不嚴謹等,這種風險會導致用戶在網絡傳輸過程中的數據被偽造、竊聽及篡改,并且還會使用戶遭到物理破壞。
其二,用戶行為極為脆弱。其主要包括用戶的信息行為疏忽、隱私設置關聯、用戶密碼簡單等。由于用戶能夠通過自己的賬號登錄不同的論壇,用戶在社交網絡中發布的內容會被無意同步到其他網絡,以此泄露隱私,并且還會忽視社交網絡中朋友的身份驗證,導致自己的信息暴漏,被他人所利用。
其三,外部威脅。其主要包括服務崩潰、第三方因素、信息隱私交易及黑客攻擊等。由于用戶的疏忽或者技術的漏洞,能夠使黑客或者其他人盜竊用戶的隱私,將用戶的隱私作為第三方不法使用的對象。
1.2 構建指標體系
通過上述分析,本文中構建指標體系的方法為Delphi,以相關專家的研究及知識對指標進行篩選,主要包括兩輪刪選,從而統一專家意見,以此形成隱私風險評估體系,分為三個以及指標及十三個二級指標。圖1為隱私風險評估指標體系。
1.3 指標的量化處理
由于社交網絡中的隱私風險評估體系并沒有測量數據,都是定性指標,所以社交網絡隱私風險評估體系具有一定的模糊性。那么為了能夠對其進行定量評估和分析,就要通過本文的專家打分的定量化指標。專家打分的方法指的是將定性指標分為多個級別,并且對其賦予量值,以區分精度為基礎,將打分的區間分為五、七及九三個分值,本文中使用五分值,隱私風險可以定義為低、較低、一般、較高、高五種級別,其對應的量值為1,3,5,7,9。隱私評估指標為負向,也就是說指標值越小,評價就越好。通過下式處理初始指標值:
1.4 指標權重的計算
指標權重指的是指標對評估對象的影響程度,其反映了指標之間的差異。在社交網絡隱私風險評估的過程中,不同的風險指標的發生概率和損失也都各不相同,所以要根據其重要性對權重進行設置。為了保證評價指標的科學性及合理性,本文將Shannon信息熵融入到AHP方法中,計算評價指標熵值,通過信息量得出指標權重。[1]步驟為:
首先,處理決策矩陣X=(xij)m*n,得到標準化矩陣Y=(yij)m*n,之后歸一化處理:
其次,將j指標的熵值進行計算,公式為:
另外,計算j指標的差異系數,表示為:
最后,計算j指標的權重,表示為:
評估指標權重向量為:
W=(w1,w2,...wn)
2 基于模糊評價的社會網絡隱私風險
評估社交網絡隱私風險的過程中,要考慮多種內在和外在因素的影響。因為社交網絡自身就較為復雜,尤其是相親交友網站中,涉及了多種隱私風險因素及模糊不確定的因素,所以不能夠使用統計概率量化風險。那么就要基于模糊評價,根據其中的模糊關系合成理論,評估社交網絡隱私風險。
2.1 定義評價語集
評價語集是要根據實際情況制定的,一般將其分為五個等級,以本文中低、較低、一般、較高、高五種級別為例,其等級度量可以表示為:
低:發生風險時對用戶的隱私損害極小;較低:發生風險時對用戶的隱私損害較小;中等:發生風險時對用戶的隱私損害一般;較高:發生風險時對用戶的損害嚴重;高:發橫風險時對用戶的隱私損害非常嚴重。
2.2 評估矩陣的創建
首先對單隱私風險因素進行評估ui(i=1,2,3,...,n),得出其模糊評價語集Ri(ri1,ri2,ri3,...,rim)。
假如某個因素因素ui有qij個vj評語,其隸屬度rij表示為:
2.3 綜合模糊評價
隱私風險因素的權重集W=(w1,w2,...wn)和評估矩陣R兩者相互融合得到綜合模糊評價,結果為:
通過模糊評估向量C判別評估結果,一般標準為最大隸屬度。為了保證評估結果的客觀性,使用加權評估計算,公式為:
通過隱私風險隸屬度等級標準判定社交網絡隱私風險等級。隱私風險隸屬等級標準為:0-0.2分為低風險;0.2-0.4分為較低風險;0.4-0.6分為一般風險;0.6-0.8分為較高風險;0.8-1高風險。[2]
3 結束語
本文分析了大數據背景下社交網絡隱私風險因素,并且創建了評估指標,計算了指標權重,以此模糊模糊評估了社會網絡隱私風險。此方法能夠客觀地描述大數據環境下的社交網絡隱私風險,從而主動規避隱私風險。
參考文獻
[1]張艷欣,康旭冉.大數據時代社交網絡個人信息安全問題研究[J].蘭臺世界,2014(5):24-25.
[2]程燕.大數據時代社交網絡隱私保護問題研究[J].計算機科學,2014(B10):74-78.