關鍵詞:數據主義;大數據;哲學;技術
中圖分類號:TP311 文獻標識碼:A 文章編號:1004-9436(2021)21-00-03
科學技術的每一次革命都推動生產力發展,促進社會活動,使認知思維發生轉向,引發哲學思考。大數據技術引發的一場技術革命正改變人們對事物的看法。維克托·邁爾-舍恩伯格認為“大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關系的方法”[1],因此可將大數據技術視為方法上的革新。在史蒂夫·洛爾看來,“在實踐中,諸如大數據技術這類創新型技術,不僅有利于經濟發展,還不知不覺重塑我們的世界觀,讓人們作出相關的決策”[2],大數據技術在認識論角度給予我們新的觀念。從認識論及方法上看,大數據技術建立在大量數據集的基礎上,進行感知、分析處理以獲得精準、快速、更有全局性的決策依據,大數據無處不在。然而,赫拉利卻提醒人們要謹慎對待大數據技術數據主義,這是一種“崇拜數據,試圖用數據來取代欲望和經驗的觀念”[3]。如果沉溺于數據主義的思維慣性,大數據將吞噬我們的主體性。
1 大數據的特征
要對大數據的特征進行剖析,首先要了解數據是什么。數據的概念與數和量的概念息息相關。數是人類對外在環境多少、大小等屬性的認識。畢達哥拉斯對數有著濃厚的興趣,由此展開了理性探索,由于長期沉溺其中,認為“數是萬物的本源”,推進了數的發展。而量(amount)是數與各種計量單位的組合。同數與量相比,數據(data)一詞加深了內涵,它除了具有衡量事物多少、大小等數量屬性外,還可區分事物的特性,形成區別事物的標準,已然成為人類生活生產中不可舍棄的重要觀念,是科學研究定性、定量的基礎和依據。從詞源上看,數據的拉丁文有“已知”的意思,隱喻了知識的含義,進一步認識,確定性事物得到證實后,數據也有“事實”之意。
1946年,電子計算機問世后不久,數據被定義為“傳遞和儲存計算機信息”。“數據處理”(data processing)這個計算機專業術語在1954年被提出。1980年,通過計算機數據處理,數據在數量獲取、種類增加、處理速率等方面均超出了之前的成就,數據從簡單的因果性結構形式的數值延伸為文字、圖像、表格和聲音等大量可通過計算機轉化為相關性非結構形式的數據,數據資源在形式上變得更為豐富。如1998年《科學》上刊登的一篇介紹計算機數據處理的文章《大數據的處理程序》[4](A handler for big data),第一次提出大數據(big data)一詞,意味著大數據概念逐步進入社會生活中。
大數據指的是主體所持資料遠遠超出存儲器的容量,無法通過數據處理程序在時效內對數據展開進一步處理和管理,轉而通過大規模的數據處理中心完成分布式數據集的歸類和整理,為個人和決策者提供更為有效的信息。
大數據的特征有以下四點。第一,數據容量大。大數據指的是資料遠超傳統數據載體容量下的收集、儲存、驅動和處理的數據集。第二,數據類型豐富多樣。除單線程處理的因果性結構化類型以外,還涵蓋了并行處理的相關性非結構化的文字、圖像、音頻等類型。第三,由于數據處理速率高,將當前的因果單線程數據處理方式轉變為相關并行處理方式,從而增強了數據處理的協同性和數據共享。第四,單條數據價值低,整體數據商業價值高。因數據容量巨大,稀釋了單條數據的價值,但數據的整體價值增大。
因此,大數據有多種形式結構,通過各級系統的關聯性對復雜的信息進行處理。由于大數據的種種優勢,特別是經驗中具有的優勢,數據主義者拋棄西方理性主義,成為理性的“怪胎”,伴生在大數據技術的變革之中。
2 數據主義的哲學蘊涵
哲學的蘊涵包含了本體論、認識論和方法論三大內容,背離理性主義道路的數據主義則是邏輯經驗主義的拓展與衍生,構成了數據與世界同構的本體觀。在認識論上占據經驗主義立場,是邏輯實證主義認識論的延續。在方法論上,數據主義是工具理性的代言。此時,本體論、認識論以及方法論一脈相承。
首先,從本體上看,數據主義是以數據泛在為本源,以邏輯推理與統計為本然,以數據的展現為本真的形式本體。由此,數據主義視數據為萬物的始基,事物的一切屬性均可通過數據表征,甚至數據就是世界。諸如此類的說法都是數據主義的理性邏輯。滿足這一邏輯,在數據概念出現伊始,數據就用于刻畫行為事理、反映世界的圖景,是認知世界演化的最基本的要素。而通過人為感知自然的數據,科學的意義僅是一種經驗,不存在科學探究,因為自然以及人類社會的一切秩序在這一層面上恒定,這是由于“數據主義的數據流已經不再是人們可以處理的量,人類也無法將數據轉化成為信息,更不可能通過數據轉化成為知識或者智能,大數據和計算機的算法主宰了世界”。此時,人們已不用再考慮自己的心理意義,行動通過記錄自行體驗,將自己所有的數據并入整個數據流當中,由算法找出這些體驗的意義,人們僅通過執行數據就可獲得所有意義。數據主義認為人類的體驗并不比動物的體驗優越,數據的普遍性打破了物種的隔閡。
數據主義誕生于大數據的基礎上,因此,數據主義者認為數據是對世界本源的反映。一方面,世界是一個整體,萬物縈繞在數據之中,其中包括結構性數據和非結構性數據,大數據中的數字、圖片、文字甚至我們的決策都可數據化,世界也成為“數據整體”。另一方面,數據是客觀的,不帶有任何主觀因素。在數據密集型、統計探索和數據采集的基礎上,當今科學已經步入探索性時代。數據主義勾勒了世界大同的圖景。
其次,從認識上看,數據主義興起新的經驗形式。經驗論認為人類知識起源于感覺,感性經驗可以獲得知識,甚至只有通過感性經驗才可獲得知識,這與大數據技術通過相關性取代因果性的邏輯一致。因此,邁克爾·舍恩伯格主張“我們現在擁有如此多的數據,這么好的機器計算能力,因而不再需要人工選擇一個關聯物或一小部分相似數據來逐一分析了”[1]。數據主義是指通過大數據技術的技術方法歸納推理獲得新生事物,強調對數據相關性的運用,人們僅分析數據而不用假設它可能產生或者表征什么,只需要將數據輸入一個足夠大的運算群體中,便會有大量數據計算和統計算法發掘部分科學方法無法發現的事物和規律,從而達成因果性到相關性的替換。此時,數據驅動的科學研究將取代理論驅動的科學研究,理論就此終結,科學研究方法就此終結。
最后,從方法上看,數據具有工具性。數據理性和工具理性是數據主義方法論的兩個基本前提。數據本身是工具理性載體的工具屬性數據理性,蘊含著邏輯理性與統計理性的合理性,即推理過程的邏輯主義,數據采集、分析處理的統計完備性和相關性分析。從工具理性的角度出發,強調生產工具能代替人類改造自然的行為,人類只有依靠計算或控制的工具,才能進一步認識自然、控制自然、改造自然。數據在數據主義的觀點中擁有工具特性,因此,數據主義忽略了數據在事件的歷史條件及其行為事理的或然性和不確定性,引導出機械的、唯一的、絕對的機械決定論的決策問題。工具理性是“通過對環境的情況與他人的舉止的期待,沿用這種期待作為條件或手段,實現自己合乎理性爭取和考慮的目的”[5]。將數據作為功利化產物,作為一種工具,作為一種手段,將目的性和手段嵌入其中,最后對窮盡所有可能的目的作出合乎工具理性的權衡,針對既定目的有效地使用手段和工具。現代科學技術中的大數據技術催生的數據主義,必然無法回避工具理性,表現為對待自然時的客觀性、數學的普遍性形態以及面對自然時的工具理性立場下的經驗認識,通過經驗的科學技術知識使世界徹底“祛魅”。
3 回歸數據主義的理性反思
在數據主義的壓迫下,現代社會價值理性逐漸衰落,數據主義的進擊逐步爭奪人文主義的地盤,妄圖顛覆人文精神與決策主導權,出現了技術的“越界”,從而引發數據主義的理性反思。在馬克斯·韋伯看來,工具理性顯然導致了價值理性的崩塌,那意義的喪失就無法避免。在數據主義的世界觀中,價值理性無法實現,工具理性彌漫在人類社會里,用數據說話突出的客觀性、由數據直接進行的決策正在侵蝕人文主義,康德的“人為自然立法”正成為迷夢。
此時,價值理性者和決策主體支持者站出來指出數據主義的“越界”。一方面,在價值理性者看來,數據主義無法給予我們諸如“我們應該怎么做”“我們應該怎么表達自己的喜怒哀樂”這類問題的答案。科學技術此時不再重視過程,轉而成為結果正義的代名詞,對終極意義進行解釋,每個人都必須根據自己的認識表現出對自我生命意義的闡釋,“要么通過自由意志接受,要么就拒絕”[6]。數據主義只能夠告訴我們世界是什么,而無法告知我們意義存在何方,關于藝術、法律、歷史和文化現象有無價值的問題,數據主義是不能提供答案的,更不會回答是否值得下功夫去了解這些現象[7]。科學技術無法回答世界的意義問題,在科學技術原則下為世界制定一個標準,以說明普遍性。因而價值呈現出多樣性,工具理性的價值是基于制定的標準,不符合標準的就不能夠使用。與工具理性普遍標準對立的則是價值的多元性,社會存在多元化的價值觀沖突,現代社會在獨立的價值領域之間出現了排外現象,而且無法采用一種基于工具理性的普遍標準以阻止這類排外現象。人們也就只能采用人文主義的方法從意義、權力、信仰等價值因素尋求自己遵從的價值原則,數據主義無法衡量人的價值。
另一方面,在人的主體性支持者看來,數據主義相關性追求的極端是因果性,依據一切行為事理必然有其內在的因果關系這一主張,通過歸納和演繹獲得必然決策。然而在楊子飛[8]看來,數據主義宣稱的“大數據”是自然數據的冰山一角,完備數據或全樣本數據注定是一個謊言。此時就預示著數據主義以大數據技術為基礎的主張是站不住腳的,所謂的大數據依然不是自然的所有數據,由于人們的認知有限,只是相對于人類經驗來說是大的數據,數據永遠沒有盡頭。在我們擁抱大數據技術賦予的新生活、新思維的同時,需要清楚地認識大數據。
首先,以數據驅動為基礎的數據主義無法窮盡人類不確定行為事理的全貌,當你通過經驗得知所有的天鵝都是白色,你也無法確定沒有其他顏色的天鵝。其次,我們無法在純粹客觀上對同一張圖片的美與丑達成一致,人對數據的認識依然存在無標準的主觀偏好。最后,數據主義無法制定一種標準主導人們決策。
因此,在不同決策的動機下,人類的行為選擇和決策就已經弱化了數據在社會中的合目的性,人的主觀偏好活動構建出人類可能生活的社會甚至是整個世界。堅持人的道德和決策的主體地位,評估人類社會的風險,在控制風險的前提下,把數據置于其中,并通過數據的作用決策,謹慎、穩妥地推進,這才是面對大數據技術的理性態度,數據主義的主張終成泡影。
4 結語
數據主義是大數據技術背景下產生并符合工具理性的主張,雖然人在數據主義立場下,可將世界簡化成為數據的集合,以達到“祛魅”的作用。但是人們也要對大數據技術持有敬畏之心。人不可因數據具有的強大功能,就把人的一切決策都拋給數據,由數據作決定,這是本末倒置。決策的主體是人,人在展現創造性時并不完全依賴數據,而數據是支持人們決策的事實,人給予了數據含義,數據支撐事實的重量。本質上說,通過數據進行決策預設了數據之所以可能的前提,盲目使用數據是對數據的迷信,人們對數據應持有謹慎態度,數據只是輔助人的決策,而不是主導決策。
參考文獻:
[1] 維克托·邁爾·舍恩伯格.大數據時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012:20,51.
[2] 史蒂夫·洛爾.大數據主義[M].胡小悅,等,譯.北京:中信出版社,2015:4.
[3] 尤瓦爾·赫拉利.未來簡史[M].林俊宏,譯.北京:中信出版社,2017:333.
[4] 托尼·卡斯.大數據的處理程序[J].科學,1998(282):636.
[5] 馬克斯·韋伯.經濟與社會(上卷)[M].林榮遠,譯.北京:商務印書館,1997:56.
[6] 馬克斯·韋伯.學術與政治[M].北京:三聯書店,1998:36.
[7] 蘇國勛.理性化及其限制:韋伯思想引論[M].上海:上海人民出版社,1988:243.
[8] 楊子飛.“第三洞穴”與“數據主義”[J].自然辯證法研究,2016,32(8):63-66.
作者簡介:楊成遠(1994—),男,貴州貴陽人,碩士在讀,研究方向:科學技術哲學。