□ 靜恩英
2013年6月美國國家安全局雇員斯諾登揭露“棱鏡”監控計劃,引發了人們對監控以及由此帶來的個人隱私保護問題的擔心。其實,相對于這種直接的監控而言,有一種無形的監控更可怕,那就是數據挖掘。早在1966年,美國聯邦政府就提出“中央數據銀行”計劃,即成立統一的“數據中心”,將政府所有部門的數據整合起來,最終建立一個以每個公民為單位的國民數據檔案,每個人的教育、醫療、福利、犯罪和納稅等所有記錄都將納入其中。該方案得到了學界和行政界的一致認同,但經由媒體發布后卻引發強烈的社會反彈,最后導致該計劃流產。2001年9·11事件之后,“中央數據銀行”以“萬維信息觸角計劃”的名字被政府批準。雖然官方人士解釋說,此計劃有利于通過挖掘恐怖分子在信息空間留下的數據印跡對他們進行追蹤,但美國民間質疑和反對之聲仍然不絕于耳。我們必須承認,這種擔心并非杞人憂天,因為“在信息時代,無論是個人的日常瑣碎小事,還是事關健康、教育的重大決策,都會在各種各樣的信息系統中留下‘數據腳印’”,對這些“數據腳印”進行加總分析的數據挖掘不可避免地會觸及每個人的隱私。特別是隨著數據倉庫和數據挖掘技術日臻完善和成熟,出于多種目的,數據挖掘也漸成常態,越來越多的個人數據被采集和分析,導致個人所有生活細節乃至興趣愛好等信息全部暴露在分析者面前。大數據時代成為一個無形的超級監獄,數據挖掘既是挖掘者的監控手段,也是隔絕每個人的壁壘,我們在一個裝著單向鏡的囚室中表演著各自的人生。
2011年5月麥肯錫全球研究所發布《大數據:下一個創新、競爭和生產力的前沿》的研究報告之后,大數據引發了各界的關注。2012年2月12日,《紐約時報》(New York Times)在《媒體》欄目發表《大數據時代》(The Age of Big Data)一文,進一步引發了全球各界對大數據的討論。所謂大數據,是指“用目前數據庫管理和傳統數據處理方法難以獲取、管理和處理的巨大復雜的數據集合”。隨著社會的發展,整個社會產生的數據量越來越多,隨之出現的數據倉庫以及數據多維分析,使數據挖掘逐漸進入人們的視野,并越來越受到重視。
數據挖掘即是基于數據倉庫的知識發現,其前提和基礎是聯機分析(Online Analytical Processing),也稱多維分析,即是把孤立的數據聯結起來進行多維度分析,進而將孤獨數據轉化為知識的過程。比如,1.85米是一個孤立的數據,通過賦予背景信息,我們可以獲知奧巴馬身高是1.85米,通過數據挖掘我們可以提煉出規律:大多數黑人男性的身高超過1.85米,此時孤立的數據就轉化成為知識,這個過程就是數據挖掘過程的簡單呈現。
數據挖掘是企業以及政府提高效率和效益的有力工具。交通數據處理公司Inrix利用收集的歐洲和美洲近1億輛汽車的實時交通數據預測交通狀況;埃森哲通過對安裝在公交引擎上的傳感器收集的數據進行分析,僅2005年便為密蘇里州圣路易斯市節省60萬美元;沃爾瑪超市通過對個人商品購買記錄進行分析發現了尿布與啤酒搭售可以使兩種商品銷量同時提高;美國零售連鎖機構Target利用女性購買行為懷孕期變化模型準確地給一位未婚先孕的17歲女孩兒發送嬰兒尿片和童車的優惠券。由于很多數據挖掘是基于對個人信息的整合與分析,因此,不可避免地會對個人隱私和自由造成侵害。
“四周是一個環形建筑,中心是一座瞭望塔。瞭望塔有一圈大窗戶,對著環形建筑。環形建筑被分成許多小囚室……所需要做的就是在中心瞭望塔安排一名監督者……通過逆光效果,人們可以從瞭望塔上與光源恰好相反的角度,觀察四周囚室里被囚禁者的小人影。這些囚室就像是許多小籠子、小舞臺。在里面,每個演員都是芬芳于立,各具特色并歷歷在目。”這是邊沁描寫的全景敞式建筑(全景監獄)圖景。
全景監獄在結構上存在兩個必要的組成部分:瞭望塔和囚室。瞭望塔可以保證監督者能看到囚室中的囚徒,而囚室內的囚徒則由于逆光效果無法看到瞭望者。同時,囚室的墻壁使他不能與其他人接觸。“他能被觀看,但他不能觀看。他是被探查的對象,而絕不是一個進行交流的主體”,而處于中心瞭望塔的人則能察看一切,但卻不會被看到。為了確保瞭望塔與囚室之間的這種關系,囚室被安排成向心的可見性和橫向的不可見性,而這種不可見性恰恰成為一種秩序的保證。全景監獄“是一種被還原到理想形態的權力機制的示意圖”,是一種權力的象征,是一種獨立于權力行使者的權力關系機制,被囚禁者既受權力局勢(power situation)的制約,又是權力局勢的載體。在這種權力結構中,權力是可見而又無法確知的。
1.大數據時代:全景監獄的變種。
全景監獄是大數據時代的現實素描。大數據時代,我們每個人都會在各種信息系統中留下“數據腳印”:我們輸入的網址、訪問的網站以及停留時間、點擊的位置、輸入的搜索詞、信用卡的消費記錄、銀行登記的個人信息、手機顯示的位置、個人的通話和聊天記錄……這些存在于不同系統中的“數據腳印”會被記錄在各個系統的數據庫中。這些數據庫若彼此孤立,那么其記錄的個人數據的價值不會太大。然而,隨著數據倉庫和計算機算法的發展,數據挖掘使得數據庫間的整合匯總和多維分析成為現實。如此,數據的價值得以充分彰顯。以個人數據挖掘為例,經過數據的整合和信息加總,“各個系統之間的數據可以彼此印證、互相解釋”,點狀分布的個人數據便會匯總成連續的面狀的個人生活記錄,進而拼接出一個完整的甚至包含細節的個體生活圖景。數據挖掘無異于一種監控。那些擁有數據倉庫資源、掌握數據挖掘技術并從事數據挖掘的個體、單位如同站在瞭望塔上的監視者,通過掌握的資源和數據挖掘技術,他們完全可以掌握分析對象的所有信息以及由這些信息拼接著出的個體和生活全景。無怪乎有學者警告說:“大數據就是老大哥。”而那些不擁有數據倉庫也未掌握數據挖掘技術的“我們”自然成了被監視的對象,我們“任何微小的活動都會被監視,任何情況都會被記錄”,所有數據都有可能被分析。與此同時,由于不擁有數據倉庫和數據分析技術,我們完全“看”不到那些可以“觀看”到我們的“監視者”。大數據時代的我們猶如“生活在《一九八四》所描繪的監控當中,唯一不同的是,監控我們的不是電幕,而是數據庫”。大數據時代是全景監獄的“變種”,這里“不再有鐵柵,不再有鐵鐐,不再有大鎖”,不再有直接的視覺監視,但每個人都處在無形的數據監控之下。
2.大數據時代全景監獄的結構特點。
(1)單向監視的封閉囚室。由于被監視者未能掌握數據挖掘技術及其所需的數據,他們彼此之間沒有能力從數據中獲取他人較為細節和全面的信息,他們不僅無法“看到”“監視者”,他們彼此之間亦不“可視”。技術門檻以及數據占有成為無形的囚室之墻。我們近到觸手可及,但永遠無法真正相遇。“囚室之墻”為每個人打造了一個無形的“殘酷而精巧的鐵籠”,它隔離出約哈里關閉的隱秘之窗。
然而,我們彼此不可見的私人領域卻被那些站在“瞭望塔”上的監視者一覽無遺。在這個監獄建制中,我們猶如處于一個裝著單向鏡的封閉囚室之中:監視者透過單向鏡可以看到我們的一舉一動, 而我們既看不到他人,也看不到監視者,被監視者與監視之間的關系是單向的。
(2)“全景”而非“共景”。有學者認為,“傳播的技術革命正在促成一種新的社會結構——‘共景監獄’。與‘全景監獄’相對,‘共景監獄’是一種圍觀結構,是眾人對個體展開的凝視和控制”。從信息對稱與否的視角出發,“共景監獄”的隱喻更為貼切。但從數據挖掘的維度來看,“全景監獄”則是更準確的隱喻。只有那些掌握了數據挖掘技術的少數人才可能成為監視眾人的監視者,而絕大多數人由于不能擁有數據倉庫也未掌握數據挖掘技術只能成為被監視的大多數。這是少數人“監視”多數人且被監視者之間彼此不“可視”的一種結構。
雖然并非所有數據都包含個人信息,但“目前采集的大部分數據都包含有個人信息……甚至有的數據表面上并不是個人數據,但是經由大數據處理之后就可以追溯到個人”,因為數據之間可以進行相互印證和解釋。2006年美國在線公布大量舊的搜索數據供研究人員使用,雖然經過精心匿名,但《紐約時報》幾天內便利用“60歲的單身男性”、“有益健康的茶葉”等搜索記錄的綜合分析,發現數據庫中代號4417749是佐治亞州利爾本一名62歲的寡婦。當記者找到這位老人時,她驚嘆道:“天吶!我真沒想到一直有人在監視我的私人生活。”大數據時代,每個人身后都站著一個“老大哥”。不僅如此,如果利用數據預測犯罪甚至預測未來,那么我們是否可以根據預測逮捕一個尚未實施犯罪的人?如果預測的未來成為現實,那我們是否失去了自由意志和自由選擇生活的權力?大數據時代,個體對監視者的完全敞視“會漸漸蠶食我們的個人自由。這才是真正的危險”。
福柯認為,由于任何人都可以對這種全景結構進行巡視,因此全景監獄“所造成的權力結構不會有蛻化為暴政的危險”。然而,大數據構建的全景監獄卻并非每個人都可以成為巡視者,那些不擁有“數據倉庫”資源也無數據挖掘技術的人很難進行此類“巡視”,只有那些真正擁有數據倉庫并掌握數據挖掘技術的政府、企業和個人才可能成為真正的監視者。這種權力不均衡局勢“史無前例地”獲得一種“重大而嶄新的統治手段”,“其優越性在于它能給予被認為適合應用它的任何機構以極大的力量”。這是一種“不使用任何物質手段卻能直接對個人發生作用”的力量,是精神對精神的統治和控制。這種力量必須得到有效的控制,否則若任由其膨脹,完全有可能蛻化為“精神暴政”。
數據挖掘形塑的這種權力結構雖然基于網絡的虛擬關系,但會產生現實的壓力甚至恐懼。這種虛擬的關系“自動地產生出一種真實的征服……無須使用暴力來強制”。這種基于虛擬關系的精神暴政是大數據時代的典型特征,亦是網絡社會一種新的統治方式。
大數據時代,通過挖掘個人無處不在的“數據腳印”,個體的所有生活細節將暴露無遺。絕大多數未能掌握數據挖掘技術的人成為被監視的對象,我們每個人都是大數據的囚徒。數據挖掘不僅會對個人隱私和自由造成傷害和威脅,這種權力結構形態也可能導致“精神暴政”。立法規范數據使用與挖掘并保護個人信息勢在必行。
[1]涂子沛.大數據[M].廣西師范大學出版社,2013.
[2]Snijders,C.,Matzat,U.,&Reips,U.-D.(2012).‘Big Data’: Big gaps of knowledge in the field of Internet science[J].International Journal of Internet Science, 2012(7).
[3](法)米歇爾·福柯.懲罰與規訓[M].劉北成,楊遠纓(譯).生活·讀書·新知三聯書店,1999.
[4]喻國明.媒體變革:從“全景監獄”到“共景監獄”[EB/OL].人民論壇.http://paper.people.com.cn/rmlt/html/2009-08/01/content_313943.htm,2009-08-01/2013-10-24.
[5](英)維克托·邁克爾-舍恩伯格,肯尼思·庫克耶.大數據時代生活工作與思維的大變革[M].盛楊燕,周濤(譯).浙江人民出版社,2013.