
在公共與私人界限日漸模糊的互聯(lián)網(wǎng)時代,數(shù)據(jù)挖掘的倫理邊界在哪里?
數(shù)據(jù)挖掘本身不存在倫理問題。對個人隱私威脅的產(chǎn)生主要來自于當(dāng)數(shù)據(jù)一旦被編譯,導(dǎo)致數(shù)據(jù)挖掘方或者任何可以接近數(shù)據(jù)集的人,能夠辨別特定的個體,便存在利益侵犯的可能性。
最近QQ圈子(測試版)的問世,讓一些網(wǎng)友強(qiáng)烈懷疑騰訊讀取了自己的聊天記錄和隱私資料,否則QQ圈子不可能突然與自己如此“心有靈犀”。它可以讓多年沒聯(lián)系的初中同學(xué)現(xiàn)身聯(lián)系人名單,讓一位陌生網(wǎng)友準(zhǔn)確地在QQ上叫出你的名字。在一開始的新奇有趣勁兒過去之后,有人猛然醒悟并驚呼——“圈子”成了“圈套”。
你告訴了互聯(lián)網(wǎng)什么
是的,互聯(lián)網(wǎng)已經(jīng)成為現(xiàn)代人生活不可或缺的部分,但人們也許沒有想到,我們在每一次敲擊鍵盤或點(diǎn)擊鼠標(biāo)時所產(chǎn)生的信息都會與ID定義的個體發(fā)生精確的關(guān)聯(lián)。依靠計(jì)算機(jī)強(qiáng)大的存儲和記錄能力,用戶的個體特性、地理位置、好友網(wǎng)絡(luò)、個人資料、瀏覽習(xí)慣、消費(fèi)偏好、購物情況、信用記錄等都會變成信息流為各個互聯(lián)網(wǎng)公司所挖掘和分析。
這時,隱身在各大互聯(lián)網(wǎng)公司的工程師們出動了,他們以精準(zhǔn)算法,一步步把用戶的每次點(diǎn)擊還原成有好友、有愛好、有消費(fèi)偏好的活生生的人!而單就用戶的“好友網(wǎng)絡(luò)”來說,QQ把服務(wù)器里的二度好友關(guān)系、群成員關(guān)系、朋友網(wǎng)班級校友關(guān)系、微博聽眾關(guān)系等等各種關(guān)系鏈資源整合到一起,就把用戶的社交圈完整地勾勒出來。于是,你精準(zhǔn)地被“圈”了。
而這一切之后,必然帶來令人苦惱的隱私問題。
個人隱私被互聯(lián)網(wǎng)泄露的后果在2012年3月美國一個判案中得以極端體現(xiàn)。一位名為克萊曼提的美國年輕人被室友通過網(wǎng)絡(luò)搜索到其登錄同性戀論壇、網(wǎng)站留言“為什么異性喜歡我,我對她們卻沒感覺?不過媽媽喜歡我啊,我也喜歡媽媽啊”等記錄痕跡,確認(rèn)為同性戀,從而遭受了一系列性傾向歧視和網(wǎng)絡(luò)欺凌,克萊曼提最終選擇了跳橋自殺,拉維也因此被判入獄10年。
一開始,只是個體有目的地通過互聯(lián)網(wǎng)挖掘他人隱私數(shù)據(jù)(俗稱“人肉”)帶來了嚴(yán)重后果,緊接著,互聯(lián)網(wǎng)公司的數(shù)據(jù)挖掘行為也漸漸受到重視。
誰有權(quán)挖掘你的隱私
最近很火熱的移動社交應(yīng)用Path捅了婁子——為了幫用戶獲得最優(yōu)的150個好友,Path未經(jīng)用戶批準(zhǔn)掃描手機(jī)通訊錄。Path的創(chuàng)始人出面道歉,并解釋說上傳用戶電話簿的行為是有嚴(yán)格限制的,僅僅用于提高“好友建議”的質(zhì)量。所有用戶在Path上分享的消息都經(jīng)過了加密,這些電話簿的資料同樣也是。
“虛擬社交關(guān)系”入侵“現(xiàn)實(shí)電話簿”牽涉的還有大名鼎鼎的Twitter,其近期承認(rèn)下載存儲用戶通訊錄長達(dá)18個月。KIK、WhatApp、米聊、速聊等一大堆社交應(yīng)用程序也這樣或明或暗地從用戶手機(jī)中吸取數(shù)據(jù)。這些數(shù)據(jù)挖掘行為引起了不少擔(dān)憂和反對聲:用戶的個人數(shù)據(jù)和關(guān)系屬于用戶本人,用戶擁有自己數(shù)字化數(shù)據(jù)的知情權(quán)、擁有權(quán)和絕對控制權(quán),其他公司對這些個人數(shù)據(jù)的追蹤、分析和轉(zhuǎn)讓都是不可容忍的。
而最近另一起與數(shù)據(jù)挖掘有關(guān)的倫理討論則由互聯(lián)網(wǎng)巨頭谷歌引起。2012年1月,谷歌宣布整合包括Youtube、Gmail、Google+等旗下服務(wù)中搜集的用戶個人信息,用戶將因此從根本上失去在無遠(yuǎn)弗屆的谷歌世界里同時管理和擁有多個不同身份的能力。谷歌的這一行為已經(jīng)引起了政府的注意,代表歐盟監(jiān)管機(jī)構(gòu)的法國計(jì)算機(jī)服務(wù)與公民自由國家委員會很快給谷歌寫信,稱初步調(diào)查顯示新的政策不符合歐盟的數(shù)據(jù)保護(hù)指令。
這些爭論無非源自對數(shù)據(jù)源中可能含有的用戶身份、健康狀況、家庭情況、個人收入等關(guān)鍵信息泄露的擔(dān)憂。互聯(lián)網(wǎng)公司通過將所分析的用戶同其所掌握的用戶個人數(shù)據(jù)結(jié)合,進(jìn)而變身“老大哥”對用戶的網(wǎng)絡(luò)活動進(jìn)行監(jiān)控。數(shù)據(jù)挖掘還有可能把原本分散在多個網(wǎng)絡(luò)系統(tǒng)中的用戶數(shù)據(jù)集成、提煉,從而掌握用戶在各個領(lǐng)域的行為,這些行為的匯集可能是用戶不希望外泄的。
因此,面對用戶的不滿,開發(fā)QQ圈子的騰訊工程師不淡定了。他們堅(jiān)決否認(rèn)“圈子讀取了用戶聊天記錄和隱私資料”,聲稱圈子的實(shí)現(xiàn),目前只依賴兩份資料:用戶的分組名,用戶好友給該用戶的“備注名”,“只有在圈子中半數(shù)以上的成員,給該用戶使用了嚴(yán)格相同的備注名,這一備注名才會作為正式名稱向圈子里的其他成員公布”。即便如此,用戶的質(zhì)疑仍沒有完全平息,騰訊只好向用戶表示將對產(chǎn)品持續(xù)進(jìn)行改進(jìn)。
硬幣的兩面
當(dāng)然,就像保護(hù)個人隱私并不阻礙我們愿意在公共場合說話一樣,數(shù)據(jù)挖掘也不總是站在隱私的對立面。仔細(xì)回想一下,我們經(jīng)常會在公開場合,例如餐館、車站,進(jìn)行私人性質(zhì)的談話。我們明白對話內(nèi)容會被服務(wù)員或者路人聽到,但心理學(xué)家歐文·高夫曼所說的“禮貌性疏忽(civil inattention)”會幫到我們,人們一般會選擇過濾掉我們的談話內(nèi)容,即使聽到了也不會加入我們的討論。當(dāng)然我們自己也會通過壓低聲音來限制傳播范圍,談話末了還會加上一句,“千萬不要告訴別人”。
在網(wǎng)絡(luò)這個虛擬公共場合里,用戶也可以對一些信息內(nèi)容采取加設(shè)密碼、“穿上馬甲”等方式來進(jìn)行“竊竊私語”,效果就像在餐館談話時壓低聲音一樣明顯。不過用戶的大多數(shù)數(shù)據(jù)還是會被記錄,然后被使用于商業(yè)目的。現(xiàn)在流行的精準(zhǔn)營銷、社會化營銷、移動廣告等無不是在數(shù)據(jù)挖掘的支持下產(chǎn)生的。
而包括谷歌在內(nèi)的一些互聯(lián)網(wǎng)公司認(rèn)為,適度的隱私出讓可以讓用戶受益并帶來社會效率的提升。如果沒有得到用戶足夠多的數(shù)據(jù)并進(jìn)行分析,Google的搜索結(jié)果可能會像謝耳朵的超嚴(yán)密邏輯分析一樣無厘頭。某種程度上說,正是用戶數(shù)據(jù)的有心搜集,才讓互聯(lián)網(wǎng)提供的各種服務(wù)多了些溫情,少了些死板,“你要讓它為你更好地服務(wù)就不可能不讓它更了解你是誰”。
其實(shí),數(shù)據(jù)挖掘技術(shù)是中立的,對個人隱私威脅的產(chǎn)生主要來自于當(dāng)數(shù)據(jù)一旦被編譯,導(dǎo)致數(shù)據(jù)挖掘方或者任何可以接近數(shù)據(jù)集的人,能夠辨別特定的個體,便存在利益侵犯的可能性。例如公司可以透過訪問醫(yī)療記錄來篩選出那些有糖尿病或者嚴(yán)重心臟病的人,從而意圖削減保險支出。
面對互聯(lián)網(wǎng)公司數(shù)據(jù)挖掘的隱秘性,歐盟正在起草新的數(shù)據(jù)保護(hù)條例,包括將有可能對違規(guī)公司處以其全球收入2%的罰款。2012年2月,奧巴馬政府也定下了新隱私保護(hù)規(guī)范的架構(gòu),此規(guī)范能讓消費(fèi)者更好地控制個人信息的使用。可是,當(dāng)互聯(lián)網(wǎng)巨頭開始統(tǒng)治大多數(shù)網(wǎng)民的數(shù)字生活時,他們也成為重新定義善惡的角色。恐怕用戶再用腳來投票,就等于失去了一切。