技術(shù)宅
小一點(diǎn)的隱私泄露,是類似自己的電話號(hào)碼被惡意外傳,導(dǎo)致我們不停地接到各種騷擾電話。嚴(yán)重的則可能包含身份證、實(shí)際住址、銀行卡號(hào)等等,這類信息的泄露會(huì)給我們帶來(lái)更大的麻煩。
我們的這些隱私信息是怎么被泄露的呢?原因之一是由于內(nèi)部人員或者黑客造成的。比如前段時(shí)間網(wǎng)上流出的某某酒店入住數(shù)據(jù),就是黑客入侵酒店服務(wù)器后導(dǎo)致的泄密,這種類型的泄密,作為用戶基本上是無(wú)法避免的。而隨著大數(shù)據(jù)技術(shù)的發(fā)展,另一個(gè)讓我們防不勝防的隱私泄密原因也逐漸變得常見,這就是一些科技公司通過大數(shù)據(jù)畫像“非法獲取”隱私信息(圖1)。

①大數(shù)據(jù)畫像
日常網(wǎng)絡(luò)生活中,其實(shí)我們經(jīng)常要和一些大數(shù)據(jù)分析技術(shù)接觸,比如使用百度搜索的朋友,會(huì)在搜索框下方看到推薦的新聞資訊,這個(gè)推薦是個(gè)性化的,而且每個(gè)人的推薦資訊內(nèi)容都不相同,它是根據(jù)每個(gè)網(wǎng)友的興趣進(jìn)行推送的(圖2)。

②百度新聞推薦

③淘寶商品推薦
百度的這一個(gè)性推薦功能,背后就是大數(shù)據(jù)分析的結(jié)果。百度根據(jù)用戶的搜索關(guān)鍵字和點(diǎn)擊分析出你的喜好,然后再有針對(duì)性地向你推薦符合你愛好的資訊。類似的還有淘寶、京東等網(wǎng)站,也會(huì)根據(jù)你的購(gòu)物習(xí)慣向你精準(zhǔn)地推薦商品,同樣是基于大數(shù)據(jù)技術(shù)(圖3)。這些公司首先海量收集匿名用戶的各種網(wǎng)絡(luò)行為,如搜索偏好、購(gòu)物習(xí)慣等進(jìn)行群體畫像,然后再通過這些信息分析對(duì)目標(biāo)人物進(jìn)行畫像。不過這些還只是人物的粗略畫像,從隱私角度來(lái)看并不算太過分(圖4)。

目標(biāo)人物畫像
而對(duì)于一些非法公司,則是通過真實(shí)的簡(jiǎn)歷數(shù)據(jù)對(duì)自然人數(shù)據(jù)還原。比如淘寶是匿名收集某某喜歡購(gòu)買數(shù)碼產(chǎn)品,而非法公司則直接根據(jù)簡(jiǎn)歷信息搜索張三的真實(shí)信息,包括他的生活角色(如婚姻狀態(tài)為未婚)、社會(huì)關(guān)系(如父母是張山和李四)、位置信息(如籍貫是西安,在北京某某小區(qū)居住)等等,以此實(shí)現(xiàn)對(duì)自然人的精準(zhǔn)畫像(圖5)。

⑤對(duì)自然人數(shù)據(jù)還原畫像
另外隨著大家參與的網(wǎng)絡(luò)活動(dòng)越來(lái)越多,我們還會(huì)在網(wǎng)上留下自己的郵箱、微信、QQ等社交ID,這些非法公司會(huì)將用戶數(shù)據(jù)和這些社交賬號(hào)關(guān)聯(lián),從而實(shí)現(xiàn)多個(gè)識(shí)別ID關(guān)聯(lián)、多種設(shè)備關(guān)聯(lián)、跨平臺(tái)行為關(guān)聯(lián)、線上線下數(shù)據(jù)互通,將每個(gè)人的各種隱私信息一網(wǎng)打盡。
更為恐怖的是,這些公司通過和第三方交換數(shù)據(jù)獲得其他信息,將各種信息綜合后再對(duì)其他的關(guān)聯(lián)用戶畫像。比如某公司通過各種手段獲得全國(guó)2.2億人的簡(jiǎn)歷數(shù)據(jù)以及全國(guó)10億個(gè)不重復(fù)手機(jī)號(hào)碼數(shù)據(jù),以其為基礎(chǔ),在獲得張三的通訊錄信息后,又可以獲得張三好友李四的電話號(hào)碼,再將李四的號(hào)碼在簡(jiǎn)歷數(shù)據(jù)庫(kù)中檢索后得到李四的所有信息。如此一來(lái),即使李四沒有在該公司投遞過簡(jiǎn)歷,李四的所有信息也會(huì)被該公司通過聚類分析全部獲取(圖6)。
非法公司還會(huì)將以上信息匹配到平臺(tái)的簡(jiǎn)歷庫(kù),最終得出這些自然人及其周邊關(guān)系人的收入水平、潛在需求、關(guān)系影響等要素。所以,只要提供某個(gè)用戶的手機(jī)號(hào)碼,此非法公司就可以將其與自有的簡(jiǎn)歷庫(kù)進(jìn)行匹配,提取出這些自然人的各種隱私信息,包括年齡、性別、行業(yè)、職業(yè)、戶籍、收入、教育經(jīng)歷、工作經(jīng)歷、關(guān)系鏈等等。而且這些隱私信息會(huì)被販賣給各種需要的機(jī)構(gòu),導(dǎo)致我們的隱私連環(huán)泄露。這也就是為什么很多人從來(lái)沒有在房地產(chǎn)公司買過房,從來(lái)沒有參加過教育培訓(xùn),但是卻一直被莫名其妙的房產(chǎn)公司、培訓(xùn)機(jī)構(gòu)的電話騷擾的原因。

⑥聚類分析獲取其他用戶的隱私信息
通過上面的介紹我們知道,隱私的泄露很多是由于我們隨便在網(wǎng)上留下各種信息,被其他有心公司收集而導(dǎo)致的。特別是對(duì)于類似簡(jiǎn)歷、工作經(jīng)歷這些真實(shí)信息,大家在參與這些網(wǎng)絡(luò)活動(dòng)的時(shí)候,盡量選擇大型正規(guī)的公司投遞簡(jiǎn)歷,避免自己的簡(jiǎn)歷被不懷好意的人使用。另外一方面,對(duì)于類似網(wǎng)絡(luò)拉票、各種砍價(jià)活動(dòng)盡量不要參與,因?yàn)檫@些活動(dòng)的最終目的大多是為了獲取我們的微信、QQ等賬號(hào)信息的。另外,需要注意保存好自己的通訊錄,盡量不要使用不安全的在線方式保存通訊錄。