999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

對大數據鴻溝幾個相關問題的思考 *

2020-03-12 15:08:59馬克安德烈赫維奇
國外社會科學前沿 2020年4期
關鍵詞:數據挖掘

馬克·安德烈赫維奇

內容提要 | 大數據技術推動社會生活轉型時,個人數據權益成為了爭論的焦點。本文拓展“大數據鴻溝”的概念,揭示了大數據時代的不平等關系,指出鴻溝主要存在于能夠收集、存儲和挖掘大量數據的人與數據采集目標人群之間,二者在數據思維和使用方式上的差異更進一步地加劇了數字權利的不平等。文章還探討了個人數據權益、大數據挖掘及模式識別、大數據的社會分類,以及當前語境下的隱私悖論等問題。基于這些維度,本文認為,隨著數字技術的普及,不同人群的數字鴻溝有所縮小,但這并不代表大數據鴻溝的彌合。應對大數據鴻溝加劇所帶來的不透明的歧視,將是人類面臨的考驗。

一、個人數據權益與大數據范式

作為“個人數據大革命”的主要參與者,新媒體領域的元老級人物、萬維網創始人蒂姆·伯納斯·李(Tim Berners-Lee)近日呼吁,互聯網用戶應當有權利獲取他們的個人數據。“我的電腦和手機清楚地知道我的健康狀況、飲食習慣、住處、每天做了多少運動、爬了多少級樓梯等各種信息。”伯納斯·李認為所有人都應掌握自己的數據資源。在技術發展過程中,有關技術的話語總是不斷地強調機器已經比人類更加了解自己,如比爾·蓋茨(Bill Gates)1995 年討論的軟件代理,或尼古拉斯·尼葛洛龐帝(Nicholas Negroponte)1996 年討論的數字管家。對此,伯納斯·李將數據庫描繪成一種服務于個人的資源,他描述道:“如果我的計算機了解我的一切,那么它就能幫助我管理生活,預測我的需求來填補生活所需,這會非常有用。比如預測我早上想要閱讀些什么。”

當然,谷歌新聞和許多新聞聚合類平臺在既無用戶參與、也不回收數據軌跡的情況下,已經在積極地為人們提供上述服務。然而來自不同社交網絡“孤島”的數據依然是被孤立地使用,伯納斯·李注意到了這個問題,他倡導有效地匯集個人設備中的數據:

在我電腦上運行的所有程序,都不支持使用其他社交網絡系統形成的數據。這些數據既包含個人日程,也有跑步地圖上記錄的站點數據,還有小健身器存儲的數據等等,如果它們都能真正為我所用,將會提供出色的服務。

現如今,我們通過交互式設備和服務所得到的數據能夠勾勒出活躍用戶的生活狀況,但實際情況卻是用戶正與其數據漸行漸遠。“數據鴻溝”(data divide)不僅指產生數據的群體和收集、存儲、分類數據的群體之間的行為差異,還指這兩個群體掌控數據的能力也有所不同。伯納斯·李就此提出疑問:如果個人生成的數據能有所助益,那我們為什么不能獲取并使用它?另外,為何不能克服用戶與其數據之間的分離,并打破因各種設備和平臺限制所形成的“數據孤島”呢?他的確切中了問題的要害,但這又引出了一個更深的問題:即便用戶擁有訪問自己數據的權限,卻只能獲取孤零零的信息,這與在大量的數據背景下分析個人數據截然不同。舉一個耳熟能詳的例子,伯納斯·李討論過自我數據挖掘(self-data-mining)為新聞推送帶來的好處,其中之一就是當計算機掌握了用戶的閱讀數據時,便能預測可能吸引他們的新聞故事,這與尼葛洛龐帝提出的“我的日報”或“數碼管家”概念不謀而合。然而,在線新聞聚合器不僅要分析個人自身的興趣模式(它不是孤立而形成的),還要分析跟他有共同興趣的其他人還對什么內容感興趣。這些個人和同好圈層的人所提供的數據共同促成了各種形式的“協同過濾”。

從數據挖掘的角度來看,將個體行為模式置于更廣泛的社會模式中去考察,會比僅僅依賴特定的個體數據更為有力。但是,即使允許用戶訪問自己的數據,也并不能完全解決那些因數據鴻溝所帶來的矛盾,因為人們使用數據的能力是有差異的。普通用戶雖然有權限訪問,卻缺乏儲存和處理數據的技能,因而很難從中獲取更多的信息,更不用說為自己所用。更何況他們也并不具備模式識別能力或預測能力,因為這些是挖掘聚合數據庫的人才擁有的。由此可知,“大數據時代”之下,數據所驅動的意義生成的新形式不斷出現,這勢必導致結構性的鴻溝問題越來越凸顯。

為了描述這種大規模數據獲取和使用能力的差異,本文首先將定義“大數據鴻溝”的概念,并解釋關注該問題的必要性,然后探討它如何勾連起公眾所關心的個人信息收集和使用的問題。個體對于當前新型數據采集和挖掘所顯現出的無力感,既反映了數據所有權和控制權的關系正形塑信息資源的獲取,也顯示出人們逐漸意識到他們其實對數據的利用方式知之甚少。本文著重討論的是個人數據,這一數據類型是當前有關在線數據收集監管爭論的核心,而“大數據鴻溝”也正是圍繞于此。

在學術研究層面上,丹娜·博伊德(danah boyd)1丹娜·博伊德(danah boyd)在其個人主頁上解釋了姓名首字母使用小寫的原因,詳見https://www.danah.org/name.html。和凱特·克勞福德(Kate Crawford)指出了存在于“大數據富人”(如能夠生產或購買,且能存儲大數據庫的公司和大學等)和“大數據窮人”(不具備獲取和處理數據等專業知識的人)之間的溝壑,并強調當前大數據的研究議程正被相對較小的利益群體控制。本文拓展了“大數據鴻溝”的概念,將數據思維和使用方式也納入考量。當然,我們首先聚焦“大數據挖掘”,后文將更詳細地展示數據挖掘者們的觀點,揭示了大數據的野心遠不止定向廣告(targeted advertising),還有全方位預測未來的新方式,涉及領域涵蓋醫療保健、警務、城市規劃、財務規劃、工作篩選和教育等方方面面。

本文指出,大數據挖掘能夠識別出人們此前預料之外卻持續存在的社會模式,因而開啟了一個“新興的社會分類”時代。它盡管具有個性化的特點,但其預測的方式是基于概率論的,也因此對個體的生活際遇產生了深遠的影響。再進一步講,大數據范式優先考慮的是發現相關性并加以預測,卻無法提供解釋,這與數字媒體推進民主化進程或發揮賦權的作用背道而馳。另外,數據挖掘的邏輯應用于在線追蹤及其他類型的數據監控,這在很大程度上導致用戶對數據使用的知情權失去了意義。

二、大數據挖掘與大數據鴻溝

若以超越個體或群體所認知的信息范疇作為界定標準,大數據的概念自人類意識誕生之初就已經存在。對于任何具有感知能力的人或物來說,世界乃至宇宙都是難以理解的大數據。然而在當代,這個概念的用法發生了很大變化,它代表了人們想要探索巨量數據資源、挖掘大數據寶藏,并將之投入使用的愿望。更簡單地說,大數據意味著模式識別的自動化形式(即數據分析)能夠與數據收集和存儲的自動化形式相同步。這種數據分析不同于過去長久以來我們對大型數據資源進行簡單搜索和查詢的方式。數據挖掘技術的出現使人類邁向了大數據時代,而大數據規模會不斷擴大,以跟上數據存儲和數據處理能力的增長。國際商業機器公司(IBM)已在數據挖掘和預測分析方面投入了巨資,并指出大數據不僅關乎規模,還涉及數據的生成和處理速度,以及轉儲到組合庫中數據的異質性。簡單來講,三個“V”能夠準確地描述大數據的各項維度:體積(volume)、速度(velocity)和多樣性(variety)。

目前大數據挖掘已著眼于識別不曾預測過的項目,探求意想不到的相關性,它無所不包,發展迅猛。正如IBM 公司所言:“大數據涵蓋各種類型的數據,包括文本、傳感器數據、音頻、視頻、點擊流、日志文件等,結構化和非結構化的數據都在其中。把這些數據放在一起或許能促使新見解的產生。”數據正以前所未有的規模被收集、分類和關聯,這將產生遠超人類大腦所能探測和解釋的有用的信息模式。數據挖掘顧問科琳·姆庫(Colleen McCue)認為:“通過數據挖掘,我們可以利用自動化方法對巨量數據庫進行地毯式的搜索,這遠遠超出了人類分析師甚至分析團隊的能力。”《知識的邊界》描述了這種“新知識”:“它不僅僅需要巨型計算機,還需要一個可以連接這些計算機、向它們輸入信息,并且讓它們的成果得以為人們接受的網絡。因而,這種知識存在于網絡系統的層面,而不是人類的頭腦中。”

以上所述勾勒了“大數據鴻溝”的輪廓,也表明要將數據投入使用,需要獲取并控制昂貴的基礎技術設施、數據庫、配套的分析軟件以及數據處理能力和專業知識等。雖然大數據預言家們認為,大數據將為那些無法訪問、存儲和處理數據的人們提供有價值的決策和預測參考,但在社會實踐的許多領域中,只有那些真正能夠訪問數據庫、具備處理能力和數據挖掘專業知識的人才處于優勢地位。如大衛·溫伯格(David Weinberger)所言,如果在大數據時代中,“房間里最聰明的人就是房間本身”,那么誰擁有房間才至關重要。同樣,只有那些能夠使用機器、數據庫和掌握算法的人才能擁有與大數據挖掘相關的各種能力。當然,大數據鴻溝的爭議不僅停留在是否擁有數據的問題上,它還涉及不平等的分類過程,以及數據如何關聯知識及其應用的不同思考方式。下面幾節將依次討論這些問題。

“沒什么。”我說著,跟著馬老師離開了學校。我們一起走了一段路之后就分開了。我一個人空手走到了車站門口。

三、大數據的社會分類

對于能夠訪問數據的人,抓取和挖掘數據的能力使他們參與到監控的可能性大大提高,這里的“監控”被視為一種“社會分類”的手段。加拿大社會學家大衛·里昂(David Lyon)在奧斯卡·甘迪(Oscar Gandy)的“全景敞視分類”(panoptic sort)概念的基礎上指出:“作為社會分類的監控能夠確認人們的身份,同時也能進行風險的評估和價值的分配。”那些掌握數據、擁有專業知識,并且具有數據處理能力的人能夠參與到日益龐大、復雜且不透明的社會分類排序中,而這是“固化長期存在的社會差異,并創造新區隔的強大手段”。“全景敞視分類”的概念建立在一種權力不平等的基礎上,這種不平等存在于那些能夠影響個人生活際遇的決策者和被動接受決策的人之間,比如甘迪所說的雇主和營銷者。甘迪在之后反思該概念時提到:“這些決策實際上并不是基于對什么人的評估,而是基于他們將來會做什么。‘全景敞視分類’是一種深深依賴于精算假設且具有歧視性的技術。”在數據挖掘和預測分析時代,這些觀察尤為重要。

基于前文我們認識到,盡管當前技術被認為具有個性化的特征,但它終究也只是在概率層面上運作。鑒于此,“未來的數據挖掘技術能夠準確地預測犯罪行為,使嫌疑人在行動前便被緝拿歸案”的說法充滿誤導性。盡管技術被大肆炒作,但預測分析絕不像水晶球那樣能預測一切。如一位評論員所說:

當你正在進行這種被稱為“大數據”的分析時,意味著你的研究對象是數十萬乃至數百萬的人群,你需要計算出他們的平均值。我無法預測一個購物者會做什么,但如果他看起來跟其他一百萬個買家差不多,我便可以有九成的把握預測他準備做什么。

但是把預測視為對未來的斷言卻有可能造成深遠的影響,因為根據概率所做的總體層面上的決策將對個體產生影響,每個人都將牽涉其中。對于那些被剝奪了醫保、就業或信貸權利的人來說,決策者總是把概率預測當成確定性的預言。

甘迪認為社會分類有著悠久的歷史,但在現代官僚理性時代,它作為一種自動計算的形式自成一體。從泰羅制的“科學管理”,到20 世紀中期在銀行、住房和保險業等領域采取的“紅線政策”,人們很容易注意到大數據驅動的社會分類與先前基于數據的決策之間具有的歷史延續性。在早期有關計算機輔助監控的描述中,里昂認為“信息技術造成的差異是程度上的,而非類型上的。新技術只是‘做得更有效、更廣泛,并使已經發生的許多過程更隱秘’”。由于新的數據挖掘過程具有的新興特征,使監控的社會分類由此發生了質的轉變,這些過程正在生成不可預測且無法通過直覺感知的模式。更進一步說,數據挖掘系統性的、結構性的不透明在有權獲取數據和無權獲取數據的人之間割裂出一道知識的分水嶺。

公眾逐漸意識到數據積累和技術運用所帶來的不平等的權力關系,進而開始對個人數據的收集和使用產生擔憂。多份調查結果已經證明了這一點。例如,2012 年皮尤公司在美國的一項調研表明,大多數使用搜索引擎的人(65%)不贊成通過行為數據(behavioral data)來定制搜索結果;同時,超過2/3 的互聯網用戶(68%)反對基于行為跟蹤的定向廣告。同樣,在美國另一項全國性調查中,有66%的受訪者反對基于跟蹤用戶行為的廣告定位。在針對“不跟蹤”(do not track)立法提議的公眾反應研究中,60%的受訪者表示支持廢除在線跟蹤。就筆者于澳大利亞開展的全國性調查而言,人們也強烈地支持對“不跟蹤”進行立法(95%的人贊成),超過一半的人(56%)反對基于線上跟蹤的定制廣告,近六成(59%)的受訪者認為網站收集了用戶過多的信息。然而,學界也關注到了“隱私悖論”的現象,即人們雖對個人信息的收集和使用表示憂慮,卻仍繼續接受攫取他們數據信息的平臺服務。有觀點認為,用戶實際上并不真如調查所呈現的那樣在乎個人隱私。基于早期隱私問題的相關定性研究結果,本文提供了另一種解釋:人們生活在由結構化的權力關系所運作的環境中,雖無不厭惡,卻無力抵抗。從推測來看,部分用戶已逐漸認識到,“大數據鴻溝”的不平等性和不透明性預示著數據挖掘時代的到來,只有能獲取昂貴資源和技術的“寵兒”才享有知識特權,才擁有保障和民主化承諾的信息渠道,而這將加劇人們對數字監控經濟潛在負面影響的擔憂。

四、理論的終結?

《連線》雜志2008 年的一篇文章引起熱議,作者克里斯·安德森(Chris Anderson)聲稱,大數據時代(他稱為“拍字節時代”)將迎來“理論的終結”,未來將是基于模型理解世界的時代。他指出:

在這個世界上,大量的數據和應用數學取代了別的所有可能用到的工具。無論是語言學、社會學,還是分類法、本體論或心理學,關于人類行為的每一個理論都將塵封進入歷史。只要有了足夠的數據,一切將會不言自明。

這一富有宣言意味的聲明顯然是以偏概全的,它需要加以限定:統計模型雖是算法開發所必需的,但還需要其他類型的模型參與,共同塑造由越來越多數據生成的信息。數據科學家強調特定領域專業知識的重要性,這不僅能夠評估挖掘算法所輸入的數據,而且幫助呈現相關的問題。像姆庫在《數據挖掘和預測分析入門》所述:“相關領域的專業知識發揮了重要作用,包括評估輸入、指導流程以及對終端產品的價值和有效性進行評價。”因此,在數據挖掘融合特征的背景之下,突出領域專家這一術語,是為了解決無法從數據內容中找尋意義的問題,這也打破了“將數據分析視為嚴格技術操作”的傾向。

由是觀之,安德森的主張可被勉強地解讀為:數據挖掘所生成的可操作信息既不可預測,也無法解釋,當然它既不需要也不能生成潛在的解釋模型。舉例來說,我們所處的數據挖掘和“微型目標定位”時代,再現了20 世紀70 年代美國共和黨政治顧問的政治智慧——“水星牌車主投票給共和黨人的可能性遠遠高于其他品牌的車主”。正如一位政治顧問所說:“我們從來沒用資金或技術為選舉制造些什么,但現在可以了。”當然,那些致力于將這些信息用于競選目的的人,也并不關心如何對技術驅動下的數據結論進行解釋。安德森指出:“誰知道人們為什么會做這樣或那樣的事情?關鍵是他們這樣做了,而我們可以用前所未有的精確方式來追蹤和測量。”

數據挖掘的目標是對巨大的數據資源加以分類,并監測人類肉眼無法發現或頭腦無法直觀獲取的模式,最終提取的是不可預測、違反直覺的模型。此類知識的重要屬性在于用相關性和預測性來替代解釋性和因果關系,因此人們得到的不是潛在的原因或者解釋,而是一組概率預測。對此持樂觀態度的人不在少數,一本數據挖掘相關的教科書曾提到:“世界的復雜性逐漸超出人類的想象,這中間所產生的數據正要壓倒我們,而數據挖掘是我們解釋這座冰山的唯一希望……數據挖掘被定義為發現數據模式的過程,這個過程必須是自動化的,或更普遍的是半自動化的。被發現的模式一般能夠帶來經濟優勢,所以它具有相當重大的意義。”因此,數據挖掘在商業領域被描述成競爭優勢不足為奇,它在其他方面的優勢也可想而知。姆庫從國家安全和軍事優勢的角度闡明了預測性警務的目標:“如果知識是力量的話,那么通過預測性分析得到的先知先覺,將被視為作戰中強大的力量。”麻省理工學院的大數據專家亞歷克斯·彭特蘭(Alex Pentland)提出了“現實挖掘”(reality mining)這一術語,用來描述新形式的數據捕獲所具備的廣度和深度。他期待通過數據創造一個更加健康、安全和高效的世界:

對于整個社會而言,我們希望通過新的方式來深入理解個人行為,以此提高行業的效率和政府的回應能力。對于個人來說,能生活在一個處處被安排得極為便利的世界,又是多么具有吸引力:在你生病時,健康檢查已神奇地被列上日程;當你剛到站臺上,公交車正好停在你面前;市政廳里從來沒有排隊等候的人群……

人們甚至認為它將帶來新形式的數據透明,幫助公眾很方便地獲取社會不同類型的公共記錄,從而促使公職人員和私人企業更具責任感。但是,這些美好的愿景掩蓋不了網絡數字技術“分層”的情況。大數據挖掘時代掌握在極少數人手中,他們通過特殊的技術便能生成有用的信息(無論是好是壞),以此取得某種優勢,達成具體的目標。誠然,互聯網賦權的本意是促進人們獲取各類知識,理解周圍的世界,從而讓權力不再只服務于少數人群,但現在的知識形式卻將這種愿景拋進塵土中。

安德森在對“理論終結”的敘述中強調:在各種應用程序廣泛使用的拍字節時代,曾經通過對已有信息進行仔細研究來理解世界的方式已作古,而今體量巨大的信息勢必要通過挖掘來發現有用的模式,但這對于普通的個體或群體來說只是令人費解的龐然大物。即使安德森夸大了事實,但這仍是認識數字時代知識獲取的一個重要方面。溫伯格在這個意義上提出,這種“知識優勢”對于絕大多數人來說不僅不可獲取,而且難以想象和理解;而對于那些根本無法訪問數據庫的人來說,更是遙不可及。基于此,用戶很難通過個人信息得出明確的決策參考,例如預測安全風險、信用風險、工作前景或輟學概率等。再比如另一個更極端的例子,研究表明,那些在填寫申請表時,使用非電腦自帶瀏覽器的人工作表現更佳,更換工作的頻率更低。這一無法被解釋的發現連申請者自己都始料未及,但這對他們的生活可能影響深遠。

當然,數據挖掘的野心并不止于掌握事物間直觀的關聯,它還要揭示超出想象邊界的相關性。然而,假使我們要對數據挖掘算法進行反向工程分析,它需要的專業知識和生成時所要求的一樣多,得出的結果卻未必具有直接的解釋力。而當相關性取代因果關系或解釋模型時,其目標是盡可能地積累全面而多樣的數據,以產生真正出人意料、反直覺的結果。

目前,鑒于可用數據的規模、范圍以及技術的復雜性,通過大數據挖掘所構想的數據分類類型也日益模糊。在經濟合作與發展組織(OECD)的一次會議上,一家數據挖掘公司的首席執行官談及數據挖掘時,認為其導致“計算機的決策失去了一定的透明性”,他指出:

機器學習相比人能夠建立更加精細的聯系,也可以校準大量不同信息之間的關系,而這些工作對于人類來說,是不可能完全理解的。

以上討論圍繞數據挖掘的特性展開,并未忽視其善用之下所帶來的潛在益處,然而當前社會生活已被權力不平等所籠罩:按照遺傳特性、人口因素、地理位置和先前意想不到的數據類型,人們生命中的重要時刻被分類排序,而這些對于受影響者卻是晦澀且難以獲取的。當然,在一些情況下它發揮了積極的作用,比如醫院利用數據挖掘的技術及時采取醫療措施,從而干預了更嚴重的并發癥出現。但與此同時,也很容易想到的是,這種預防性的建模可能會被濫用,如設想這樣的場景:私人醫療保險公司通過數據挖掘,及時取消了客戶的保險服務,以避免支付重大醫療費用。

五、大數據鴻溝下的隱私悖論

公眾的“隱私悖論”將在大數據鴻溝及其屬性的討論視角下被解釋。那些只憑用戶行為來做判斷的人可能會得出這樣的結論:“普通的美國人在隱私和方便之間找到了一種可接受的平衡,他們可以為了得到更多的方便放棄一些隱私。”這種判斷預設人們對交易條款清楚明了,并把用戶簽訂的平臺“準入條款”等同于“完全接受條款”。實際上這種結論根本站不住腳,因為在網絡環境中,如何定義“知情同意”是個難題,部分原因在于幾乎沒有人會閱讀在注冊或登錄時所簽署的那份使用條款。研究表明,盡管大家對數據采集技術的擴散表達了較高程度的憂慮,但絕大多數用戶只會略讀隱私政策部分,甚至完全忽略掉,這一事實被視為人們不關心隱私的證據。筆者在澳大利亞開展的個人信息收集和使用的研究,提供了更合理的解釋:在是否保護自己隱私的問題上,人們感到別無選擇,因為無人知道信息會被用到哪里,以及使用后可能帶來什么影響。

在研究中特別引人注目的是,受訪者對個人信息收集和使用的條款表達了無力感。雖然學術研究和大眾媒體持續關注隱私問題,但相對于這種無力感,隱私問題可以說顯得不那么重要。一名受訪者提到:“我失去隱私時最在意的不是別人知道了我的信息,而是信息分享在某種程度上是被迫的,或是在被誘導下進行的。”這一觀點受到普遍認同。換言之,當谷歌用“沒有人會閱讀你的電子郵件和賬戶信息”為其掃描用戶數據做合理化辯護時,它或許曲解了用戶的擔憂。用戶真正擔心的是,這些公司為某種目的來收集用戶信息,卻不為大家所知。

上述焦點小組的研究是圍繞一個澳大利亞全國性電話調查的結果展開討論的。該調查收集了1100 份樣本,涉及人們對個人信息收集和使用的態度,結果顯示,人們對此高度關注,這與在其他國家的發現十分類似。具體而言,有近六成(59%)的受訪者認為網站收集了過多的信息,他們也高度支持對個人信息收集和使用進行更嚴格的控制。在這其中,有92%的人支持設置不跟蹤的選項,95%的人認為應實時發放跟蹤通知,96%的人支持根據需要刪除個人數據,同時有超過半數的回答者反對基于跟蹤的定制廣告。調查結果還發現,人們明確地意識到,他們對自己的信息被如何利用知之甚少,超過七成(73%)的人想了解網站收集和利用個人信息的方式。

這些發現體現了“大數據鴻溝”的一種特殊形式,它存在于數據分類者和被分類者之間,即有一類人能夠提取數據,并有權對不可預測且令人費解的數據結果進行解釋和利用,而另一類人只能接受由前者所做的決策。這種認識有助于思考焦點小組的調查結果,回答為什么隱私討論中占主導地位的框架被挑戰了。埃里克·施密特(Eric Schmidt)對這一框架的概括最為恰當,簡單來說就是“要想人不知,除非己莫為”,或者是“既然沒有什么可隱瞞的,也就沒有什么可害怕的”。而當前多數受訪者的憂慮并不在此框架之內,他們強調的重點不是信息的被分享或是被采集,而是這一過程的被迫性。值得注意的是,即使是對數據收集表示擔憂的受訪者,仍不能說清楚大數據鴻溝下實際所受到的、能夠感知到的或能預期的傷害到底是什么。當被追問擔憂的具體內容時,受訪者往往轉而回答一些常見的隱私問題,比如關于身份盜竊或欺詐的威脅,或是關于數據驅動的目標營銷。總的來說,面對廣泛而日益復雜的數據收集和挖掘,人們因無能為力而感受到的挫敗感遠超過對實際傷害的憂慮。

六、大數據鴻溝的維度

本文的研究表明,人們表達出的無力感至少有兩個維度:第一,對信息和通信資源的所有權和控制權感到無力;第二,對基于知識進行決策的不同路徑感到無知。人們清楚地意識到,強大的商業利益集團正控制著信息的獲取,而用戶要么接受那些條款,要么在許多方面放棄影響個人生活和職業生涯的資源。當然,公眾已開始大聲疾呼,卻難以表明具體擔憂的內容,這種模糊不明未必來自懶惰或無知,而是反映了大數據用戶所依賴的發現結果既不可預測又反直覺,同時數據挖掘技術也難以捉摸。因此,人們很難想象使用某個特定的瀏覽器會對工作機會產生影響,更無法理解由無數變量相互作用所產生的數據模型對社會生活的影響,這些顯然超出了一般人的知識邊界。

在大數據時代,海倫·尼森鮑姆(Helen Nissenbaum)曾極力主張的具有語境化的隱私無疑被挑戰了,人們的數據已被徹底地、不可預測地去情景化使用了。同時,隨著監測追蹤技術的擴散,如車牌讀取器、智能相機、無人機、RFID 掃描儀和音頻傳感器等,數據抓取的范圍不斷在線上和線下擴展,用戶將與自己的數據分離,無權過問和使用,最終被裹挾進大數據鴻溝的分化邏輯里。人們在克服數字鴻溝(digital divide)的同時,往往伴隨著大數據鴻溝的加劇。例如,隨著更多的人有能力使用智能手機和平板電腦,不同人群的數字鴻溝有所縮小,但便利的訪問意味著更多的數據被用于存儲、分類和挖掘,而隨著數據挖掘形式的多樣化,決策制定、信息預測和排序操作將受到更廣泛的影響。雖然本文提及的許多應用尚處起步階段,但變化的速度促使每個人思考大數據鴻溝在社會、文化和政治等各個方面帶來的影響。如何減少大數據分類所帶來的負面影響,消除不透明的歧視,這是我們在大數據時代面臨的考驗。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国禁国产you女视频网站| 久久伊伊香蕉综合精品| www.亚洲国产| 精品伊人久久久香线蕉 | 日本午夜视频在线观看| 亚洲VA中文字幕| 精品无码一区二区在线观看| 熟妇丰满人妻av无码区| 无码人妻热线精品视频| 亚洲色无码专线精品观看| 亚洲电影天堂在线国语对白| 成年看免费观看视频拍拍| 人妻无码中文字幕一区二区三区| AV色爱天堂网| 欧美黄网在线| 亚洲永久免费网站| 网友自拍视频精品区| 又污又黄又无遮挡网站| 伊人狠狠丁香婷婷综合色| 欧美日韩一区二区在线免费观看| 永久在线精品免费视频观看| 老色鬼欧美精品| 国产成人精品亚洲日本对白优播| 奇米影视狠狠精品7777| 九九热视频在线免费观看| 午夜色综合| 日韩欧美色综合| 中文字幕欧美日韩| 中国一级特黄视频| 亚洲色图另类| 亚洲欧美另类中文字幕| 日韩麻豆小视频| 国产丰满大乳无码免费播放| 中文一级毛片| 91久久偷偷做嫩草影院精品| 亚洲精品无码在线播放网站| 久草视频精品| 国产一级毛片yw| 黄色免费在线网址| 91小视频在线播放| 一本久道久综合久久鬼色| 久久精品国产电影| 777午夜精品电影免费看| 四虎永久在线| 国产黄色视频综合| 国产性生大片免费观看性欧美| 精品国产欧美精品v| 亚洲天堂免费在线视频| 免费A∨中文乱码专区| 国产精品无码一区二区桃花视频| 久久黄色小视频| 欧美日韩国产综合视频在线观看| 日韩精品亚洲精品第一页| 国产精品太粉嫩高中在线观看 | 一本大道视频精品人妻 | 免费日韩在线视频| 国产高清毛片| 91免费精品国偷自产在线在线| 嫩草影院在线观看精品视频| 美女一区二区在线观看| 欧美一级高清免费a| 欧美在线三级| 国产偷倩视频| 91丨九色丨首页在线播放| 久久动漫精品| 九九免费观看全部免费视频| 国语少妇高潮| 91av国产在线| 国内精自线i品一区202| 久久免费看片| 欧美成人怡春院在线激情| a色毛片免费视频| 制服丝袜亚洲| 欧美不卡二区| 四虎国产精品永久一区| 黄色成年视频| 精品久久久久久中文字幕女 | 国产精品美女免费视频大全| 国产在线97| 亚洲一级毛片在线观| 3p叠罗汉国产精品久久| 亚洲码一区二区三区|