999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于瀏覽器指紋差異度的回訪用戶識別算法

2018-03-02 09:23:28馮映燕陳明志許春耀康年華林偉寧
計算機工程 2018年2期
關鍵詞:差異用戶

馮映燕,陳明志,許春耀,康年華,林偉寧

(1.福州大學 a.數學與計算機科學學院;b.網絡系統信息安全福建省高校重點實驗室,福州 350108;2.武警福州指揮學院 研究部,福州 350002)

0 概述

瀏覽器指紋主要用于用戶追蹤、身份認證、用戶識別等領域[1-3]。瀏覽器指紋是一種基于瀏覽器信息組合的識別方法,通過瀏覽器平臺從配置信息、軟件組成以及硬件組成等層次獲取到設備的屏幕信息、插件信息、字體信息等特征參數[4-5]。最后通過哈希函數組合形成可以唯一識別用戶的指紋數據[6-8]。

目前就瀏覽器指紋技術取得了以下研究成果:文獻[9]提出了一種與Cookies功能相似的用戶識別方法,稱之為瀏覽器指紋,并通過實驗驗證了瀏覽器指紋具有較高的識別率。文獻[6,10]對三大商業指紋算法中的特征參數獲取方式進行了對比分析,發現限制Flash與JavaScript的功能能夠有效地抑制指紋生成,進而提出了干擾瀏覽器指紋生成的方法。文獻[11-12]提出了一種結合HTML5的API與Javascript優勢的指紋識別方法,實現了基于HTML5的指紋識別,其中最典型的HTML5指紋方式為帆布指紋。文獻[13-14]提出了JavaScript引擎指紋這一技術,由于不同瀏覽器的JavaScript引擎具有細微的區別,因此可利用微小的差異制作指紋。文獻[15]將現有瀏覽器指紋分為瀏覽器定制指紋、帆布指紋、JavaScript引擎指紋以及跨瀏覽器指紋4大類,同時對4類指紋的工作原理及優缺點進行分析,提出了干擾指紋生成的方法。文獻[9,16]為解決無法完全識別回訪用戶的問題,提出了一種基于瀏覽器指紋相似度的用戶識別方法,通過逐位比較指紋間字符串的相似度,在一定的相似范圍內,則認為指紋為回訪用戶的更新指紋。

當前文獻主要研究不同類型的瀏覽器指紋的工作原理及干擾指紋生成的方法,較少有文獻關注特征參數變化后導致指紋靜態匹配方式無法完全識別回訪用戶的問題。因此,本文提出一種新的基于瀏覽器指紋差異度的回訪用戶識別算法,該算法首先定義8個指紋特征參數的局部差異度計算方法,加權求和得到衡量兩個指紋之間差異度的公式,接著將指紋間差異度值與事先設定的差異度閾值作對比,進而判斷用戶是否是回訪用戶。最后通過實驗評估該算法的執行效果。

1 瀏覽器指紋

瀏覽器指紋是由具有微小差異的特征參數通過哈希函數組合而成。

1.1 指紋特征參數選擇

組成指紋的特征參數信息與用戶個人習慣以及應用環境息息相關,將特征參數組合在一起時能夠有效地區別用戶個體特征,因此可以作為用戶識別的依據。其中指紋的制作過程如圖1所示。

圖1 指紋制作示意圖

由圖1可知,從瀏覽器平臺中的配置信息、軟件組成、硬件組成等層次可獲取特征參數。本文選取的指紋特征參數主要包括以下8個:字體,插件,User agent,屏幕信息,時區,HTTP-Accept,Video,Cookies_enabled(指的是Cookies能否接受設置,返回值為True或False)。上述特征參數的選取沿用了文獻[9]中的特征參數。

1.2 指紋特征參數評估

令一個瀏覽器指紋算法為BF(·),給定一個新的瀏覽器信息x,生成一個瀏覽器指紋BF(x),其離散概率密度函數為P(fn),n∈[0,1,…,N]。首先,引入自信息I的概念,其定義如式(1)所示。

I(BF(x)=fn)=-loga(P(fn))

(1)

其中,自信息量I表征該瀏覽器指紋包含信息的比特數。

P(fn)的信息熵H(BF)為瀏覽器指紋自信息量的期望值,其定義如式(2)所示。

(2)

其中,H(BF)的值越大,區分不同瀏覽器的準確性越高。

瀏覽器指紋由不同的特征參數組合而成,單獨討論每個特征參數的信息量并定義指紋特征參數的信息熵。設某個指紋特征參數為a,其自信息量與信息熵計算方法分別如式(3)和式(4)所示。

I(fn,a)=-loga(P(fn,a))

(3)

(4)

對于兩個相互獨立的特征參數,自信息量計算可根據公式直接線性相加。

2 指紋差異度計算

在大部分指紋算法下,用戶升級瀏覽器版本、更新插件、安裝新的字體等操作都會使原有指紋發生變化,導致指紋的靜態匹配方式無法完全識別回訪用戶。針對該問題,文獻[9,16]提出了基于指紋間字符串相似度的回訪用戶識別方法,通過逐位比較字符串,求兩指紋的相似度,從而判斷用戶是否為回訪用戶。

而針對上述問題,本文提出一種新的基于瀏覽器指紋差異度的回訪用戶識別算法。其中,指紋差異度是用來衡量兩指紋之間的差異程度,差異度越小表示新的指紋是原有用戶的更新指紋的概率越大,即用戶是回訪用戶的概率越大。在該算法中,指紋間差異度計算是最重要的環節。

2.1 全局差異度計算

定義全局差異度函數D(BF1,BF2),用來計算指紋BF1與指紋BF2之間的差異程度,其定義如式(5)所示。

(5)

其中,全局差異度函數D(BF1,BF2)是字體、插件、屏幕信息等8個指紋特征參數差異度值的總和。Wattri為每個特征參數的權重,取值為文獻[9]中8個指紋特征參數的信息熵。指紋差異度函數D(BF1,BF2)的取值區間為[0,1],若指紋完全一致,函數值為0;若兩者完全不同,則函數值為1。

2.2 局部差異度計算

為比較指紋BF1與指紋BF2間8個指紋特征參數的差異程度,分別定義8個特征參數的差異度函數的計算公式。

定義1User agent的差異度

特征參數User agent由瀏覽器相關數據以及設備體系結構相關數據兩部分組成。上述兩部分的差異度分別用Fbr與Farchi表示,兩者定義分別如式(6)與式(7)所示。

(6)

(7)

在式(6)中,指紋間的瀏覽器名稱與版本號完全一致,Fbr取值為0;若瀏覽器名稱相同而版本號不一致,Fbr則取值為0.125;若兩者完全不同,取值為1。在式(7)中,Farchi的取值原理與Fbr相同。

令Fbr與Farchi這兩部分數據權重相等,則指紋與間User agent的差異度函數d(attr1(BF1,BF2))的定義如式(8)所示。

d(attr1(BF1,BF2))=0.5×Fbr+0.5×Farchi

(8)

其中,差異度函數d(attr1(BF1,BF2))取值區間為[0,1]。若指紋與的User agent完全相同,函數值則為0,若兩指紋的User agent完全不同,函數值則為1。

定義2插件信息的差異度

插件信息是由插件名稱與插件版本兩部分組成。令插件列表為LP,指紋BF1的插件列表為LP(BF2),指紋BF2的插件列表為LP(BF2)。指紋BF1與BF2的2個插件列表中的插件總數為FU(兩插件列表中相同的插件只統計一次)。求解過程如下:

FU=|(LP(BF1)(LP(BF1)∩LP(BF2)))∪LP(BF2)|

(9)

對于指紋BF1與BF2,計算兩插件列表中特有插件的比例,其結果分別用F1和F2表示,求解過程分別如式(10)與式(11)所示。

(10)

(11)

計算LP(BF1)與LP(BF2)兩插件列表中插件名稱相同,版本號不同的插件比例并用F3表示,求解過程如式(12)所示。

(12)

計算LP(BF1)與LP(BF2)兩插件列表中插件名稱與版本號都相同的插件比例并用F4表示,其求解過程如式(13)所示。

(13)

對于指紋BF1與BF2,兩插件列表的差異度函數d(attr2(BF1,BF2))的定義如式(14)所示。

(14)

其中,差異度函數d(attr2(BF1,BF2))取值區間為[0,1]。若指紋BF1與BF2的插件列表完全相同,差異度值則為0,若兩指紋的插件信息完全不同,差異度值則為1。

定義3字體信息的差異度

令指紋BF1的字體列表為LF(BF1),指紋BF2的字體列表為LF(BF2)。兩字體列表中的字體總數FU(兩字體列表中相同的字體只統計一次)的計算過程如式(15)所示。

FU=|(LF(BF1)(LF(BF1)∩LF(BF2)))∪LF(BF2)|

(15)

字體列表LF(BF1)中特有的字體比例用F1表示,F1的求解過程如式(16)所示。

(16)

LF(BF2)字體列表中特有的字體比例用F2表示,F2的求解過程如式(17)所示。

(17)

字體列表LF(BF1)與LF(BF2)中具有相同字體的比例用F3表示,F3的求解過程如式(18)所示。

(18)

對于指紋BF1與BF2,字體列表間的差異度函數d(attr3(BF1,BF2))的定義如式(19)所示。

(19)

其中,差異度函數d(attr3(BF1),attr3(BF2))取值區間為[0,1]。

定義4屏幕分辨率、時區、HTTP-Accept、Video以及Cookies_enabled的差異度

上述5個特征參數的差異度定義如下。

(20)

其中,差異度函數d(attrx(BF1,BF2))取值區間為[0,1]。

3 回訪用戶的識別

基于上述指紋差異度計算,本文提出一種能夠高精度地識別回訪用戶的算法,該算法的思路如圖2所示。

圖2 回訪用戶識別流程

圖2中的基于瀏覽器指紋差異度的回訪用戶識別算法的步驟如下:

1)采集指紋特征參數并利用哈希函數制作指紋。

2)判斷新指紋在指紋庫中是否存在,若存在,可判定該指紋是回訪用戶生成的指紋,則無需進行指紋更新操作。

3)若指紋庫中不存在該指紋,則需將該指紋與指紋庫中已有的指紋逐條進行全局差異度計算。

4)與事先設定差異度閾值作比較,若兩指紋之間的差異度值小于已設定的閾值,則認為該指紋是回訪用戶由于特征參數改變后產生的升級指紋,用戶為回訪用戶。最后用升級指紋替代原始指紋,完成指紋的更新操作。

5)若兩指紋之間的差異度值大于或等于設定的差異度閾值,即可判定用戶是首次訪問該網站,最后將該指紋存入指紋庫中。

4 實驗結果及分析

為了測試基于瀏覽器指紋差異度的回訪用戶識別算法的可行性與準確性,設計基于Web的數據采集模塊DeviceFingerprint。該模塊主要用于采集特征參數與制作指紋。不僅通過DeviceFingerprint獲取到每個用戶的Cookies_enabled作為特征參數之一,同時還要獲取Cookies,目的是通過Cookies給每條指紋打上標記,為后續該回訪用戶識別算法執行效果的評估做準備。

實驗通過嵌入網頁中的DeviceFingerprint模塊獲取用戶遞交的HTTP請求,從而獲取了HTTP-Accept;通過執行JavaScript代碼,獲取用戶User agent(包含瀏覽器類型、版本號以及操作系統等信息)、插件、屏幕信息、時區、Video以及Cookies_enabled這些參數;通過JavaScript與Flash結合的方式獲取用戶的字體信息。其中,8個特征參數的獲取方式、數據類型以及變化情況如表1所示。

表1 8個特征參數的獲取方式及特征參數描述

為保證實驗數據的真實性,從2016年12月3日,截止到2016年12月23日,在線收集了共102條不同的指紋數據。其中,102條指紋數據中出現了79個不同Cookies,即對應分別79個不同的用戶。

在本實驗中,根據式(5)可計算2個指紋之間的差異度值。本文采用文獻[9]中的8個特征參數的信息熵,分別作為8個局部差異度函數的權重。因為文獻[9]中采集的指紋樣本數量龐大,以此作為統一的權重標準,可減少誤差。8個特征參數按照信息熵的值從大到小排列情況如表2所示。

表2 8個特征參數的信息熵

如表2所示,插件、字體以及User agent這3個特征參數的信息熵較大,表明插件、字體以及User agent這3個特征參數變化引起的兩指紋間的差異度值變化程度也較大。

以實驗中的2條指紋為例,分析基于指紋差異度的回訪用戶識別算法具有可行性。這2條指紋除了User agent參數之外,其他7個特征參數分別相同。指紋 1的 User agent列表為:Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36(KHTML,like Gecko) Chrome/38.0.2125.122 Safari/537.36。指紋 2的 User agent列表為:Mozilla/5.0 (Windows NT 6.3;WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/45.0.2454.101 Safari/537.36。

根據式(5)~式(8)以及表2中的權重,計算得到指紋1與指紋2的差異度值為0.017。該差異度值接近于0,則表明兩指紋高度相似,可認為兩條指紋來自同一用戶。造成指紋發生變化的原因是由于用戶更新瀏覽器版本所致。

本實驗關鍵的一個環節是差異度閾值的設定,利用差異度閾值可界定指紋是否為回訪用戶生成的指紋。如圖2所示,對新采集的指紋,首先通過字符串匹配方式,初次判斷用戶是否為回訪用戶。若初次匹配失敗,進一步根據差異度計算公式,逐一計算待判定的指紋與指紋庫中已有指紋之間的差異度值。若差異度值小于事先設定的差異度閾值,則認為兩指紋來自用一用戶,即該用戶為該網站的回訪用戶。

將指紋的識別率作為基于瀏覽器指紋差異度的回訪用戶識別算法準確性的評估指標。其中,指紋識別率表示的是能夠正確地識別出回訪用戶的比例。

為了評估該算法的執行效果,設定3個不同的差異度閾值,分別為0.025、0.05以及0.10。在不同差異度閾值下的指紋識別率如表3所示。

表3 不同差異度閾值下的指紋識別率

如表3所示,差異度閾值的設定影響著回訪用戶的識別率。設定的指紋差異度閾值越大,則表示容許的指紋之間的差異程度越大。在上述0.025、0.05以及0.10這3種不同的差異度閾值情況下,指紋的識別率均在86%以上。

綜上所述,基于瀏覽器指紋差異度的回訪用戶識別算法具有一定的可行性且識別回訪用戶的準確率較高。其中,指紋差異度計算以及差異度閾值設定是回訪用戶識別算法中最重要的2個環節。選擇適當的差異度閾值能夠有效地提高回訪用戶的識別率。

5 結束語

針對指紋的靜態匹配方式不能夠完全識別回訪用戶的問題,本文提出了一種基于瀏覽器指紋差異度的回訪用戶識別算法,通過比較瀏覽器指紋之間的差異度,可以有效地識別出網站的回訪用戶。為了驗證該算法的執行效果,在線進行了數據采集與測試。實驗結果表明該算法能夠有效地識別回訪用戶,且在差異度閾值選擇得當的情況下識別的準確率較高。但是由于采集的指紋數據有限,一定程度上影響實驗結果的準確度。因此在后續工作中,將盡可能采集更多的指紋樣本數據,使得實驗結果更精確,同時在指紋特征參數的選擇上會嘗試選擇更多潛在的具體區分性的參數制作指紋。

[1] SAITO T,ISO Y,KIRYU N.A Study of Technical Aspect of Web Browser Fingerprinting[C]//Proceedings of the 31st Symposium on Cryptography and Information Security.Berlin,Germany:Springer,2010.

[2] 張夢媛.瀏覽器的安全訪問及指紋識別技術[D].南京:南京郵電大學,2012.

[3] 吳建濤.瀏覽器指紋技術研究與實現[D].西安:西北大學,2014.

[4] 王研昊,馬媛媛,楊 明,等.基于隱性標識符的零權限 Android智能終端識別[J].東南大學學報(自然科學版),2015,45(6):1046-1050.

[5] 王研昊.Android設備指紋識別技術的研究與實現[D].南京:東南大學,2015.

[6] NIKIFORAKIS N,KAPRAVELOS A,JOOSEN W,et al.On the Workings and Current Practices of Web-based Device Fingerprinting[J].IEEE Security & Privacy,2014,12(3):28-36.

[7] ACAR G,JUAREZ M,NIKIFORAKIS N,et al.Fpdetective:Dusting the Web for Fingerprinters[C]//Proceedings of ACM SIGSAC Conference on Computer & Communications Security.Washington D.C.,USA:IEEE Press,2013:1129-1140.

[8] 張玉清,武倩如,劉奇旭,等.第三方追蹤的安全研究[J].通信學報,2014,35(9):1-11.

[9] ECKERSLEY P.How Unique is Your Web Browser[C]//Proceedings of the 10th Privacy Enhancing Technologies Symposium.Berlin,Germany:Springer,2010:1-18.

[10] NIKIFORAKIS N,KAPRAVELOS A,JOOSEN W.Cookieless Monster:Exploring the Ecosystem of Web-based Device Fingerprinting[C]//Proceedings of the 34th IEEE Symposium of Security and Privacy.Washington D.C.,USA:IEEE Press,2013:541-555.

[11] MOWERY K,SHACHAM H.Pixel Perfect:Fingerprinting Canvas in HTML5[C]//Proceedings of Web 2.0 Security and Privacy Conference.Washington D.C.,USA:IEEE Press,2012:1-12.

[12] TAKASU K,SAITO T,YAMADA T.A Survey of Hardware Features in Modern Browsers:2015 Edition[C]//Proceedings of the 9th International Conference on Innovative Mobile and Internet Services in Ubiquitous Computing.Washington D.C.,USA:IEEE Press,2015:520-524.

[13] MOWERY K,BOGENREIF D,YILEK S,et al.Fingerprinting Information in JavaScript Imple-mentations[C]//Proceedings of IEEE International Conference on Acoustics,Speech & Signal Processing.Washington D.C.,USA:IEEE Press,2013:9-12.

[14] MULAZZANI M,RESCHL P,HUBER M,et al.Fast and Reliable Browser Identification with Javascript Engine Fingerprinting[C]//Proceedings of Web 2.0 Security and Privacy Conference.Washington D.C.,USA:IEEE Press,2013:503-506.

[15] UPATHILAKE R,LI Yingkun,MATRAWY A.A Classification of Web Browser Fingerprinting Techniques[C]//Proceedings of the 7th International Conference on New Technologies,Mobility and Security.Washington D.C.,USA:IEEE Press,2015:1-5.

[16] 王 維,王偉平,王建新.一種基于升級瀏覽器指紋的用戶識別方法[C]//第七屆信息安全漏洞分析與風險評估大會論文集.南京:[出版者不詳],2014:189-197.

猜你喜歡
差異用戶
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
找句子差異
DL/T 868—2014與NB/T 47014—2011主要差異比較與分析
生物為什么會有差異?
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
M1型、M2型巨噬細胞及腫瘤相關巨噬細胞中miR-146a表達的差異
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 日本道中文字幕久久一区| 激情无码字幕综合| 日韩第八页| 亚洲三级成人| 国产成+人+综合+亚洲欧美| 久久久久无码精品| 九九免费观看全部免费视频| 欧美、日韩、国产综合一区| 亚洲欧美自拍视频| 国产SUV精品一区二区| 这里只有精品在线播放| 亚洲AV无码一区二区三区牲色| 久久77777| 亚洲第七页| 自拍偷拍欧美| 在线人成精品免费视频| 国产午夜福利在线小视频| 国产无码制服丝袜| 老司国产精品视频91| 日韩无码视频播放| 91毛片网| 中文字幕亚洲精品2页| 最新国产精品鲁鲁免费视频| a级毛片免费播放| 蜜臀av性久久久久蜜臀aⅴ麻豆| 九九线精品视频在线观看| 日韩精品少妇无码受不了| 欧美激情伊人| 国产黄网站在线观看| 亚洲IV视频免费在线光看| 91色爱欧美精品www| 成人一区专区在线观看| 欧美国产综合色视频| 最新国语自产精品视频在| 最新亚洲人成无码网站欣赏网 | 日韩在线播放中文字幕| 欧洲在线免费视频| av一区二区三区在线观看| 91极品美女高潮叫床在线观看| 国产亚洲成AⅤ人片在线观看| 成人免费网站在线观看| 亚洲视频四区| 欧洲欧美人成免费全部视频 | 欧美乱妇高清无乱码免费| 无码日韩视频| 成年人免费国产视频| 亚洲精品动漫| 在线中文字幕日韩| 无码高潮喷水专区久久| 成人在线不卡| 5555国产在线观看| 激情综合激情| 成人无码区免费视频网站蜜臀| 国产毛片久久国产| 成人综合久久综合| 久久久久亚洲精品成人网 | 国产成人亚洲欧美激情| 欧美午夜性视频| 日韩a级毛片| 1级黄色毛片| 国产精品亚洲一区二区三区在线观看| 色综合成人| 国产黑丝一区| 国产精品lululu在线观看| 国产呦精品一区二区三区网站| a毛片免费在线观看| 日本免费福利视频| 中字无码精油按摩中出视频| 精品国产成人高清在线| www亚洲精品| 国产欧美另类| 亚洲三级影院| 漂亮人妻被中出中文字幕久久| 国产女人综合久久精品视| 免费在线播放毛片| 啊嗯不日本网站| 亚洲综合天堂网| 在线观看国产精品一区| 成·人免费午夜无码视频在线观看| 51国产偷自视频区视频手机观看 | 欧美日韩专区| 国产三级毛片|