方適
摘要:大數據技術是數字“爆炸”時代的必然產物,萬物皆數、實時效應、自動化決策是大數據技術的三個主要特征。這些特征使得它在促進社會發展的同時帶來了隱私泄露、社會不公、人的自決權失控和人的主體性缺失等代價問題。問題與解決問題的方法是同時產生的,通過大數據技術發展水平的不斷提升、大數據技術法律法規的不斷完善以及大數據技術倫理道德建設的不斷加強,這些社會代價是可以得到消弭的。
關鍵詞:大數據技術;社會代價;解決途徑
中圖分類號:D6 ? ?文獻標志碼:A ? ?文章編號:1009-3605(2021)04-0089-07
伴隨著科學技術的快速發展,大數據技術因其能夠更好、更快、更細、更準地處理海量數據,已成為世界各國競相發展的一項新興技術,并在社會發展中帶來了巨大的社會價值。與此同時,發展必然與代價相伴相生。大數據技術在促進社會發展的同時,也帶來了一系列問題。所以,從大數據技術自身的特點出發,分析大數據技術社會代價的主要表現及成因、尋求消弭代價的方法路徑,已成為當下理論研究的熱點。
一、大數據技術的本質內涵及根本特征
近年來,隨著經濟社會發展和信息技術進步,信息數據量不斷呈指數增長,不僅顛覆了工業界、學術界對傳統數據技術的認知,同時也推動了大數據技術的發展。目前,盡管大數據及大數據技術已經成為信息時代的熱門產業,引起了各國政府、企業和學者的高度重視,但對于大數據技術的本質以及其對社會發展可能產生的負面影響等問題,尚未形成普遍一致的看法。
關于大數據技術的本質內涵,最具代表性的觀點是國際數據公司IDC在2011年報告中提出的,即“大數據技術描述了新一代的技術和架構體系,通過高速采集、發現或分析,提取各種各樣的大量數據的經濟價值”[1]。該定義之所以得到了廣泛的認同,主要是因為其指出了大數據技術最核心的問題,即它能從類型繁雜的海量數據中快速挖掘價值。正如Facebook的副總工程師杰伊·帕瑞克所言,“如果不利用所收集的數據,那么你所擁有的只是一堆數據,而不是大數據”[2]。因此,大數據技術的本質就在于它是一種能從種類繁多的海量數據中快速提取數據價值的技術,是能將“一堆數據”變為“大數據”的技術。
與傳統數據處理技術相比,大數據技術主要凸顯三大特征:
一是萬物皆數。如果我們把大數據技術出現之前的信息社會稱為傳統數據時代,那么在傳統數據時代,信息技術只能轉化成結構化數據,即能夠用數據或者統一的結構加以表示的數據,信息處理所覆蓋的領域基本限于數字、符號領域。進入大數據時代后,通過非結構化數據,以前被認為無法數據化的文字、圖片、視頻、個人感覺等信息都可以通過數據轉換,還原為由0和1構成的信息。也就是說,世界上的萬事萬物及其關系通過大數據技術皆可以用數據來表征,“萬物皆數”成為大數據技術的獨有特征。
二是實時效應。“關系數據庫”是傳統數據庫的典型代表,它是由二維表及其之間的聯系所組成的一個數據組織,適用于處理永久、穩定的數據,但無法實時處理新的數據。在大數據時代,由于智能技術的發展,人們依靠智能手機、可穿戴設備、傳感器、網絡瀏覽記錄以及攝像頭等工具每時每刻都在采集和接收新的數據。其采集和接收的信息量之大、繁雜程度之高是傳統信息處理技術所無法及時解決的。而時效性是評估數據價值的重要因素之一。在有限的時間內,如果數據不能夠被完全充分地收集,或者收集到完全、充分的數據成本巨大或耗時太長,那么,等收集到足夠的數據時,已錯過了決策的最佳時機。[3]因此,在有限的時間內數據得到有效保存和處理是彰顯數據價值的必要前提。大數據技術依靠數據的批量處理和流處理技術,不僅瞬間即可完成數據的獲取→清洗→建模→可視化的全過程,而且還能同時做到及時存儲、及時分析,并將其納入整個數據分析的結果之中,從而凸顯出實時效應的基本特征。
三是自動化決策。在傳統數據時代,“以數據為中心”是決策的主要方式。決策者通過對數據的整理、抽取,將數據轉化為可讀的知識并形成分析結果,再根據分析結果作出決定。數據為決策者提供了有效數據支撐,但由決策者本身帶來的主觀隨意性無法得到有效控制,這已成為傳統決策方式本身無法克服的“硬傷”。因此,采用數據驅動的決策方式是提高決策的客觀性和及時性的必然要求。數據驅動是指大數據技術根據收集的海量數據進行整合和提煉,并經過訓練和模擬而形成自動化的決策模型。在整個數據驅動的決策過程中,所有環節都將全部由系統自動完成,無需人工輸入數據、篩選數據和作出決策。簡言之,當有新的情況發生、新的數據輸入的時候,大數據技術可根據已有模型對新數據進行處理并自動作出決策。
二、大數據技術發展中帶來的社會代價
大數據技術的發展是應對“數據大爆炸”的必然結果。大數據技術能夠從種類繁多、數量龐大的數據中提取出有價值的信息,其發展促進了新的產業融合和創新,為社會管理、決策和服務提供了新的變革模式,在一定程度上實現了社會生產方式、生活方式和思維方式的革命,印證了馬克思在100多年前所說的“科技是最高意義上的革命力量”。然而,大數據技術對人類社會的作用不是單方面的,而是發展與代價并存。馬克思在《1844年經濟學哲學手稿》中曾指出:“在我們這個時代,每一種事物好像都包含有自己的反面。我們看到,機器具有減少人類勞動和使勞動更有成效的神奇力量,然而卻引起了饑餓和過度的疲勞。新發現的財富的源泉,由于某種奇怪的、不可思議的魔力而變成貧困的根源。技術的勝利,似乎是以道德的敗壞為代價換來的。”[4]大數據技術從本質上說是一項綜合性的技術,“技術所造成的物質利益和對道德、倫理等精神價值造成的影響,作為兩個變量,是不可能達到最優化的,獲取一個目標就要在另一個變量上付出代價”[5]。因此,大數據技術在提高人們的生活效率、創造更高社會效益的同時,也必然要付出一定的社會代價。我們需要做的、必須做的事情,只能是認識代價的主要表現,尋找消弭代價的可行性路徑,將代價對社會發展的制約降到最低。
(一)大數據技術所帶來的社會代價之主要表現
一是個人信息極易泄露。個人、國家以及整個社會的隱私泄露已成為大數據技術發展最顯著的社會代價之一。隱私問題由來已久,20世紀90年代以來,計算機和互聯網的發展加快了隱私傳播的速度、拓寬了隱私傳播的渠道,網絡隱私問題逐漸走進大眾的視野。大數據技術的出現不僅沒有轉變隱私泄露的趨勢,反而通過提高數據信息的轉化率和可讀取性加劇了隱私泄露問題。例如:2018年3月,Facebook被爆出有超過5000萬用戶的信息數據被一家名為Cambridge Analytica的公司泄露;2019年8月,風靡中國的AI換臉軟件ZAO,在用戶個人信息授權時,要求用戶授予其公司全球范圍內完全免費、不可撤銷、永久、可轉授權和可再許可的權利,使人們身體隱私、位置隱私等受到了極大的威脅。事實上,這類事件從2011年起,每年都不斷地在全球各地發生,人們的隱私權因大數據技術的發展而普遍受到損害。之所以如此,一方面是因為大數據技術具有挖掘相關數據信息的能力。單條數據可能不會暴露用戶的隱私信息,但是通過大數據技術處理,與該數據有關的其它數據信息以及多個數據組合而成的新信息中包含的隱私則具有泄露的風險。另一方面是因為大數據技術能夠將非結構化數據中的隱私內容轉化為可讀的數字信息。在現代信息社會,人們的隱私更廣泛地承載于圖像、視頻等非結構化數據中,這些隱私因其無法被傳統數據技術所讀取而免遭泄露,但大數據技術的突破卻使得它們的泄露成為可能。
二是社會不公顯著加劇。數據資源和技術的兩極分化是大數據技術發展過程中不可忽視的負面現象,社會不公顯著加劇是其惡性結果的主要表現。擁有海量數據且具有高水平的大數據技術一方處于發展的有利地位,并占有大部分的社會資源;數據“貧困者”和大數據處理技術落后者則處于數據貧瘠的邊緣地位,無法公平地享受社會資源。從表面看這僅僅體現出數據利用的差距,但其實質則是社會以大數據的獲取、分析和利用等標準作為階層分化的依據。這是因為大數據技術能夠從各式各樣的海量數據中挖掘出數據的價值,誰擁有大量數據并且具備超強解釋數據的能力,就意味著誰能夠創造更大的經濟效益,因而更能在社會中占據優勢地位。在現實生活中,不僅不同國家、不同地區、不同組織、不同群體和不同個體對數據的數量和質量、大數據技術開發和應用程度以及數據接收、數據信息轉化與知識創新能力存在很大差異,而且部分發達國家和企業在數據占有量和大數據技術方面占有絕對壟斷地位。這樣,社會成員之間的差別就隨著數據資源和大數據技術的兩極分化而不斷擴大,社會不公問題顯得越發嚴重。2011年7月19日,推特公司的研究人員林志穎(Jimmy Lin)在一次關于博客和社交媒體的國際會議(ICEWSM)上就曾提出,推特公司旗下的研究人員擁有對其數據的優先獲取權,其他學者卻沒有這樣的權利,因而推特公司不僅在相關問題的研究和創收上更有優勢,而且推特公司也依靠其大數據技術優勢躋身于世界互聯網公司的前列。
三是個人自決權部分失控。自決權即自我決定權,它是哲學和心理學中的一個概念,具體是指一個人在自己生活范圍內具有選擇決定的自由。在大數據時代,人們主要依靠大數據技術的數據驅動決策方式進行選擇和決定。從表面上看,它為人們推送了“精準化”和“個性化”的服務和商品,但實質上,這種自動化決定模式在一定程度上限制了人類進行自我選擇和決定的目的、范圍以及路徑的自由,人們的部分自決權失去了控制。首先,需要作為人的“內心意向”是進行自我決定的“始因”和目的,無論個人是否通過技術途徑進行選擇和決定,其最終目的都在于滿足自己的需要,而大數據技術卻無法基于個人需要作出決策。之所以如此,不僅是因為數據驅動模型對個人需要的認知與個人真實需要之間存在誤差,而且主要是因為在數據驅動決策模型形成的過程中,數據決策考慮的主要因素是大數據技術服務商的利益而不是用戶的需要。由此,個人行使自決權的目的無法通過數據驅動決策方式實現,個人自決權在一定程度上失去了控制。其次,多樣化的選擇是決策的基礎,只有在盡可能多的選擇條件下,人們的自決權才有意義,然而,在大數據技術基礎上,個人只能在數據驅動模型既定的選項范圍內進行選擇和決定,因此,大數據技術的數據驅動決策方式縮小了自我選擇決定的范圍,使得個人自決權具有一定的狹隘性。最后,從個人行使自決權的路徑來看,雖然大數據技術為人們的選擇和決定提供了一定的便利性,但是長此以往,人們將習慣直接接受大數據技術提供的選擇,甚至直接服從于大數據技術作出的決策,從而使得個人行使自決權的路徑具有一定的依賴性,損害了自我選擇和決定的自由。
四是人的主體性嚴重缺失。大數據技術的發展造成了人的主體性的缺失,主要表現為人的主體地位顛倒和人的主體能力無法確證兩個方面。首先,在大數據技術發展的過程中,人與大數據技術之間的主客體關系被顛倒,人成為了大數據技術處理的對象。大數據技術之所以使得人的主體地位客體化,是因為大數據技術將人類社會包括人在內的一切轉化成數據,大數據技術以技術的目的將社會中的人設定為數據來源、以技術處理的方式來認識和處理人類。這樣一來,人在社會中的實踐不是為自我,而是為了數據處理而存在;不是人要求大數據技術為人類社會發展服務,而是大數據技術為了數據“鏡像”世界而要求人不斷提供數據。因此,人在表面上操控著大數據技術的使用,而實質上整個人類都被納入了大數據技術的框架之中,成為了大數據技術流程中的一個環節。其次,人的主體能力無法在大數據技術發展和應用的過程中得以確證。從人類發展的歷程來看,人的主體能力的發揮離不開人的理性對世界的追問。在大數據技術發展過程中,大數據技術將現實世界轉化為數據,并通過數據定量描述現實世界。而在此過程中,大數據技術所得到的知識是暫時的、非至上的真理,它所能理解的只能是現實世界的事實,既無法理解現實世界的存在,也無法追問現實世界的事實背后的歷史意義,更無法幫助人類理解世界和人類的存在。因此,在大數據技術面前,人們無法作為主體完成對這個世界深層次的追問,人的主體性遭受了嚴重的缺失。
(二)大數據技術產生社會代價的主要原因
大數據技術之所以會產生各種社會代價,其背后的原因是多方面的。
從客觀方面來看,任何事物的發展都是一個從不完善到完善的過程,大數據技術的發展亦是如此。
首先,大數據技術作為一項新興的綜合性技術,從概念提出到實際應用的時間并不長,其技術本身還存在很多漏洞和缺陷。例如:在數據采集上,人們還難以實時和精準地將各種視頻、聲音、圖像等非結構化數據轉化為數字,阻礙了數據價值的充分發揮;在數據儲存上,大數據安全技術和保密技術尚不能完全預防和阻止信息偷盜行為的發生。
其次,大數據技術的發展和運用離不開法律法規、制度機制等外在條件的保障,而這些條件的形成也是一個從無到有的過程,在相關保障缺失的情況下,任由大數據技術“野蠻生長”必然產生相應的代價。以中國為例,近些年,中國雖然加快了大數據技術立法和修法的進程,但在相關法律法規方面還存有一定的空白和缺陷。在這種背景下,人們的權利無法得到完全的保障,各種違背市場主體利益的違法行為時有發生。2018年,新浪微博起訴脈脈公司非法抓取和使用其用戶信息,從該案件審理的過程和結果可以看出,導致類似事件發生的最直接原因就在于我國沒有明確劃定數據獲取和轉移的具體條件,也沒有對數據轉移和數據偷盜兩者劃出明確的界限,更沒有對違反相關法律的行為作出處罰的明確條款。
從主觀方面來看,大數據技術發展帶來的社會代價主要是人的價值選擇偏差的結果。正像伯納德·巴伯所說的那樣:“作為一個整體的社會是建立在一系列道德價值之上的,而科學總是在這些價值的范圍之內發揮作用。這些社會價值提出某些非經驗的問題,即意義、邪惡、正義和拯救的問題,只關心經驗問題的科學是不能對這些問題給出答案的。”[6]科學技術本身僅僅是手段,它對社會的影響最終取決于人們在何種價值體系下使用它。以美國數據分析行業為例,有資料顯示,美國部分數據分析師運用大數據技術建立數據模型,用來進行各種形式的市場營銷和詐騙活動,在對弱勢群體進行“轟炸”中,通過機器學習不斷尋找最有效的營銷和詐騙手段。在這樣的技術手段下被定位的潛在受害者幾乎無處可逃,對社會產生了深刻的負面影響。PredPol公司則與洛杉磯警方合作,開發出預測犯罪發生率的算法,在實際運用中,洛杉磯的盜竊罪和暴力犯罪分別下降了33%和21%。這兩個事例充分說明,技術與不同的價值選擇相結合就會產生不同的技術效果,甚至在一定程度上決定了技術研究、開發和應用的全過程。正確的價值選擇促進大數據技術發展,而有偏差的或錯誤的價值選擇則會導致大數據技術發展過程中代價的產生。
三、消弭大數據技術社會代價的主要途徑
大數據技術發展的社會代價是客觀的、不以人的意志為轉移的,但并不是所有的社會代價都是不可避免的,有些代價是完全可以被消弭的。從社會發展現實出發,消弭大數據技術帶來的社會代價的現實途徑主要表現在三個方面。
一是發展高水平的大數據技術。有一種觀點認為,大數據技術之所以會帶來社會代價是由于技術高度發達所致,因此消弭其代價的有效方式是阻止大數據技術的發展。的確,大數據技術所造成的社會代價與大數據技術本身有關,但這并非大數據技術高度發達造成的,恰恰是由于大數據技術欠發達所致。不僅如此,技術的不斷進步在消除技術帶來的負效應中還發揮著重要作用。從人類發展的歷史來看,人類在同自然界交往中所遇到的難題,無不是利用技術的進步來解決的。新技術的開發與應用往往可以促進社會發展,減弱或消除舊技術造成的社會代價。因此,不論是杜絕個人隱私的泄露、凈化大數據技術發展的環境,還是預防大數據技術犯罪,都必須依靠發展更高水平的大數據技術。首先,要建立大數據安全評估技術,降低技術的潛在風險。大數據安全評估技術能夠有效評估大數據環境中潛在的各種風險,提高對各種隱患、威脅的防御能力。大數據安全評估技術不僅以歷史的數據庫作為評估基礎,還能夠利用大數據技術自身的預測功能實時跟進技術的變化及趨勢,對大數據技術開發和運行環境作出安全性和合理性的評估,在代價未發生之前進行有效的預警以及應對。其次,要升級大數據安全防范技術,保護用戶的數據安全。安全防范技術是大數據技術發展的基石。只有不斷提高數據清洗技術、數據脫敏技術、加密和認證技術、防火墻技術、病毒防護技術等等,促進大數據技術的改進和升級,才能確保數據質量以及用戶數據安全。再次,要培養高素質的大數據技術人才,為大數據技術發展提供源源不斷的人才支撐。充足的大數據技術人才是大數據技術發展的重要著力點。高等院校、科研院所要根據大數據技術發展的需求,適時將相關技術學習納入現行的教育課程體系中。同時,政府、高校、企業等相關單位和組織也要建立健全多層次、多類型的大數據技術人才培養體系,實現大數據技術人才“產學研”聯動,保證人才儲備的充足性。
二是完善大數據技術的法律法規。法律法規具有極大的權威性和強制性,因此,除了堅持發展大數據技術之外,還必須不斷完善相關法律法規,用以規范大數據技術的研發和使用。首先,要借鑒國外經驗,填補大數據技術的法律空白。發達國家在大數據技術方面發展較早,在法律方面積累了豐富的經驗。例如:歐盟頒布了《個人數據保護指令》《電子通訊數據保護指令》《私有數據保密法》等法律;德國頒布了《聯邦數據保護法》《信息通訊服務法》;美國、日本等也都頒布了數據保護法案,并已實施多年。這些法律,在保護組織和個人數據信息,避免其被盜用或濫用于政治、經濟、軍事、宗教、商業等領域的非法活動上,起到了非常重要的作用。作為后發國家,我國在專門針對數據獲取、保護、分析等方面的法律還存在一定的空白和欠缺。因此,我們不僅要學習先進的大數據技術,更要借鑒其成功的法律治理經驗。其次,要立足我國國情,完善法律監督體系。鑒于我國的國體、政體以及大數據技術的水平與其他國家有很大不同,因此,我們需要辯證地看待其他國家大數據技術法律體系的建設。要在適應我國國情的基礎上,制定和完善憲法中的相關條款、形成保護個人信息的法律法規群、加強對違法違規行為的打擊力度,不斷合理建構和完善大數據技術相關法律監督體系。
三是加強大數據技術的倫理道德建設。如果說法律法規是解決大數據技術社會代價的“硬”手段,那么加強大數據技術的倫理道德建設就是解決其代價問題不可缺少的“軟”措施。由于大數據技術的發展危害了社會公平、人的自決權和人的主體地位,因而必須從共享精神和人道精神兩個方面入手加強大數據技術的倫理道德建設。首先,要大力弘揚共享精神。大數據資源和大數據技術的兩極分化會造成嚴重的社會不公平,要消弭它,必須在大數據技術的發展中弘揚共享精神。《中共中央關于制定國民經濟和社會發展第十三個五年規劃的建議》明確提出,實施國家大數據戰略,必須實現數據資源開放共享的要求。共享是大數據技術發展的本質要求。在大數據時代,數據資源只有共享,才能使其價值不斷增值;大數據技術發展的結果也只有共享,才能保證大數據技術成為整個社會發展的推動力。其次,要大力弘揚人文精神。弘揚人文精神是消弭人的自決權失控、人的主體性缺失的社會代價的有效對策。只有從人的角度去把握,技術才能在充分發揮其促進作用的同時,最大程度地縮減非人性的代價問題。大數據技術只有朝著人性化方向發展,并將其成果運用到促進人的全面發展這一根本目的上來,大數據技術才不會成為限制人的自由、異化人的本性的手段,大數據技術才能真正開啟顛覆傳統生存方式的新時代。
參考文獻:
[1]Gantz J, Reinsel D. Extracting value from chaos[J].IDC iView,2011:1-12.
[2]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:113.
[3]黃新華.整合與創新:大數據時代的政府治理變革[J].中共福建省委黨校學報,2015(6):4-10.
[4]馬克思恩格斯全集(第12卷)[M].北京:人民出版社,1980:4.
[5]肖峰.從元倫理看技術的責任與代價[J].哲學動態,2006(9):46-51.
[6]伯納德·巴伯.科學與社會秩序[M].北京:商務印書館,1991:265.
責任編輯:曹桂芝