999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據的結構開放性及其人類發展意義

2022-12-06 10:54:45
關鍵詞:開放性數據庫人類

王 天 恩

(上海大學 哲學系,上海 200444)

作為信息數字編碼發展的產物,大數據為人類發展提供了一個新的平臺,一個不同于作為其物能基礎的新世界。在對物能對象的認識中,對象的結構本身可以看作是固有且封閉的,我們只能去發現它。與此不同,由于信息的感受性關系性質,在基于大數據的創構中,數據結構則是相對于人類需要及其發展生成開放的。由于不同于物能結構的封閉性質,大數據的結構開放性與人類更高層次的發展具有更密切的內在關聯。

一、大數據的結構開放性

在大數據研究中,普遍以“v”打頭的英文單詞表征其基本特征,這種做法開始于大數據的數據量大,因此第一個v打頭的單詞自然是“volume”,與“volume”幾乎一樣得到普遍認可的是另一個“v”打頭的單詞“variety”,一般理解為“多樣”,這個特征表達的是大數據的多樣性,反映了大數據來源和類型的多樣化,因此,數據通常是十分混雜和非結構化的[1]。在小數據時代,數據主要來自專門人員根據預先確定的設計方案抽樣采集,因此樣本數據都是可以用傳統數據庫處理的結構性數據,而在大數據時代,數據來源多樣,擴展至電子郵件、監視設備、智能手機和物聯網等,包括網站日志數據、呼叫中心通話記錄、Twitter 和 Facebook 等社交媒體中的文本數據、智能手機中內置的 GPS所產生的位置信息以及時刻生成的傳感器數據[2]等。數據類型則不僅有數字,還有文本、照片、音頻和視頻等,其形式越來越多樣化。從技術上說數據既有結構化的,更有半結構化的和非結構化的。

用以“v”打頭的單詞表征大數據的基本特征,這是理解大數據基本特征很有特色的起點,同時這也意味著在此基礎上,還有更多的內容需要進一步深化理解。正如“volume”不能只是簡單地理解為數據規模大,“variety”也不能只是簡單地理解為因數據多樣大量出現非結構化數據,而是意味著進一步涉及數據結構本身理解的復雜性。

相對于抽樣具體預設而言的數據結構,其事實上指的是樣本數據的數據結構,這與樣本數據抽樣的具體目的以及相應數據處理技術密切相關。正如新的知識建立在已有知識的基礎之上,對于大數據的理解,理所當然地首先建立在小數據時代數據理解的基礎上。在計算早期,數據總是高度結構化的,所有數據都劃分為字段,字段具有固定長度,并且輸入到每個字段中的數據被限制為一組預定的允許值。數據被輸入預先設置了行和列的穿孔卡片中,由此可見,就樣本數據結構而言,小數據通常包含高度結構化的數據,數據領域僅限于單個學科或分支學科,數據通常以有序電子表格中統一記錄的形式出現[3]3。而大數據則完全不同,由于沒有像抽樣那樣具體的目的和在先預設,就樣本數據的結構而言,其結果存在于各種各樣的媒介中,如文本、視頻和圖像等——有些是結構化的,有些則不是[4]6。正因為如此,就傳統數據庫來說,數據處理面臨完全不同的對象,要處理這些數據只有更新升級處理工具,必須能夠吸收非結構化數據(例如,自由文本文檔、圖像、動畫、錄音和物理對象),資源主題可跨多學科且資源中各數據對象可鏈接到包含于其他看似無關的大數據資源[3]4。由此就存在一個更深層次的問題:在數據結構上,“非結構化數據”意味著什么?對于理解大數據的數據結構,這是具有根本性的問題。

從用傳統數據處理工具處理大數據可以看到回答這一問題的關鍵所在。如今,人類輸入的大多數數據都是非結構化數據,呈現為自由文本的形式。為了從自由文本獲得更多信息價值,有必要強加一些結構[3]16,正是“強加一些結構”足以表明數據結構的賦予性質。不像物能本身的結構,數據結構具有智能體賦予的一面,這一點其實在樣本數據中更為明顯。在小數據情況下,數據結構相對于傳統數據庫而言,而數據庫是人類設計的產物。在大數據情況下,數據結構則超出了傳統數據庫技術,擴展到數據所處的更大關系范圍,因此,從更高層次看,大數據的“variety”特征意味著其結構只能是相對于更高層次的關系而言。

由于出自特定目的取樣,從而具有在先具體預設,取樣目的和在先預設都基于傳統數據庫,因而相對于傳統數據庫,樣本數據本身當然具有特定結構。也就是說,樣本數據的數據結構是就其與傳統數據庫的關系而言的,取樣的在先預設越具體,數據結構越確定。相對于樣本數據與傳統數據庫的關系,來源和類型多樣的大數據絕大部分是非結構化數據和半結構化數據,而關于大數據數據結構的理解,如果超越傳統數據處理工具則顯然必須進入一個更大的語境。由于人的需要的發展是開放的,因此大數據的數據結構具有根本意義上的開放性。

相對于數據處理而言的數據結構,首先與數據處理技術密切相關。實際上,大數據不僅僅是大量的非結構化數據,還包括使處理和分析這些數據成為可能的技術[5]。由于數據處理技術與取樣具體目的的內在關聯,樣本數據的數據結構主要是相對于傳統數據庫而言的。傳統數據庫正是為處理具有特定結構的數據而創建,因此只能處理結構化數據,或者更確切地說,樣本數據之所以是結構性數據就是因為其是相對于特定的數據處理平臺而言的。基于傳統數據庫處理,大數據自然就包含結構化、半結構化和非結構化數據。如果將小數據處理方式用于大數據,按傳統數據庫數據處理的方式,據估計,所有數字數據中只有5%是“結構化的”——即處于一種只適合傳統數據庫的形式。如果不接受混亂,剩下的95%的非結構化數據,比如網頁和視頻,仍然處于不能處理的狀態中[6]47。由此可以更清楚地看到,小數據時代的所謂“數據結構”與其說是數據本身的,莫如說是相對于傳統數據庫的。小數據總是基于特定結構框架,通常駐留于數據庫和其他結構化框架中的常規數據方案[4]8。由于所謂結構性數據其實是就傳統數據庫等處理方式而不只是數據本身而言的,無論“結構性數據”“非結構性數據”還是“半結構性數據”,事實上都與傳統數據庫等數據處理方式有關,一個重要事實就得以清楚呈現:與物質本身的結構不同,數據不存在各組成部分固定嚴格搭配和排列意義上的嚴格結構,而只具有相互關聯意義上的結構。也就是說,只存在數據關系意義上的數據結構,數據關系意義上的數據結構不是完全取決于數據本身,而是同時取決于基于信息處理技術的數據處理方式,而數據處理技術則處于發展過程中。

數據結構與數據處理技術密切相關,大數據發展本身就是集中展示。一方面,隨著數據規模不斷擴大,數據越來越不能用傳統數據庫技術進行處理,數據正變得無法用傳統方法進行指數級分析,這迫使我們重新思考如何利用我們正在產生的大量數據[7]。另一方面,由于數據處理的需要的推進,發生了一種重要變化:人們不僅可以管理比以往大得多的數據量,而且更為重要的是,數據不需要放在整齊的行列或傳統數據庫表格中,新的數據處理技術已問世,這些技術摒棄了過去那種死板的層次結構和同質性[6]6。正是傳統數據庫表格化、嚴格的層次結構和同質性,決定了定義樣本數據結構的傳統數據庫的局限。由于不能用傳統數據庫技術處理,大數據催生了新的數據處理技術。當今最著名的數據模型可能是SQL模型,它基于埃德加·科德(Edgar Codd)在1970年提出的關系模型:數據被組織成關系(在SQL中即表格格式),其中每個關系都是元組(行)的無序集合[8]。與傳統數據庫結構化查詢語言(SQL)完全不同,非關系型數據庫(NoSQL)中不能放進傳統數據庫表格、沒有嚴格層次結構和同質性的數據,在這里,“非關系型”只是相對于傳統數據庫而言的。傳統數據處理中數據的層次結構可以為新技術所消除,大數據結構的開放性由此得以根本展現。

從傳統數據庫技術到新技術的發展可以看到,所謂數據結構之所以與取樣時的預設以及傳統數據庫表格整齊排列密切相關,正是因為它是指數據之間的關系,而不是數據本身內部固定不變的結構,由此可見,數據結構凸顯了信息的關系性。信息是感受性關系[9],作為信息編碼,數據結構指的是數據之間的關系,而不是物質實體意義上的數據內部結構。由于數據之間不可能直接相互作用,因此所構成的不可能是因果關系,而只能是相關關系。數據規模越大,數據之間的相關關系越豐富,這正是大數據相關關系得以空前凸顯的根本原因。也正是在這個意義上,不僅結構和關系的聯系和區別清楚呈現,而且結構就是關系的理解才在更深層次上得到根本說明。由于這種關系不存在關系項,因而意味著關系致思的信息應證。在信息意義上,關系是基礎,結構就是關系。在小數據中,正是基于取樣時的預設,通過數據庫列表確定數據之間的關系,才有了確定的數據結構。人在一定具體使用目的下的數據列表處理所生成的是相對于特定使用目的的有序結構,如果將其視為固定不變的,那從這一范圍之外看,則是死板的層次結構。大數據不是抽樣形成的,其沒有根據具體目的作出具體預設并據此在先確定數據結構,因此不能用傳統數據庫列表處理,從而消除了量化的數據層次結構。大數據技術的發展使我們得以在更高層次鳥瞰大數據存在的更深層次性質,極大地拓展我們關于數據的理解。

在目前關于大數據的討論中,由于數據的結構化、半結構化和非結構化指的是數據關系,而這種數據關系的根據則是傳統數據庫,只有能放進傳統關系型數據庫中的數據才是結構性數據。因此,相對于傳統數據庫而言的數據結構主要是關于大數據中數據結構的技術理解,由于關系具有層次性和開放性,數據關系的理解就有不同的層次。相對于人的需要及其發展而言的數據結構則將關系擴展到數據挖掘,而數據挖掘所涉及的數據處理方式既與技術發展密切相關,又取決于處理數據的人。對于人類來說,大數據完全不同于大自然,基于大數據的創構以人的需要為出發點,以滿足人的需要為最終歸宿[10],而當我們超越傳統數據庫并基于大數據進行創構活動時,對于大數據的數據結構就必定需要有理解層次上的提升,顯然,這與大數據多樣性理解的深化密切相關。很簡單,多樣性代表所有類型的數據[11],而在大數據語境中,數據的多樣性則意味著數據關系的多樣性和層次提升,這也就意味著數據結構涵義的開放性。數據越是多樣化,數據間所構成的關系層次越高,數據結構越具有不同的涵義,因此,當我們說大數據的數據結構時,就會與樣本數據的數據結構有根本的不同,因為數據挖掘以人的需要為出發點、以滿足人的需要為最終目的,面對人的需要及其發展,數據結構就不是封閉而是開放的。

在更高整體層次考察大數據,將數據挖掘者乃至人的需要及其發展納入視野,大數據數據結構實際上的開放性就更是一目了然,這意味著,相對于特定數據處理技術,大數據包含結構性數據、半結構性數據和非結構性數據,因此隨著數據處理技術的發展,數據結構的開放程度將逐漸展開,而且,在更高層次,大數據的結構開放性還包含全部大數據整個發展的無限可擴展性。由于對大數據的理解和處理必須在具體語境中,所以,相對于數據處理方式而言,大數據本身的數據結構實質上也是向數據開發者或理解者開放的。

由此可見,在大數據語境中,數據結構可以在三個層次分析:相對于抽樣具體預設而言的數據結構、相對于數據處理而言的數據結構、相對于人的需要及其發展而言的數據結構,這三個層次數據結構分析的關聯及其性質充分表明了大數據中數據結構在實質上是開放性的。

二、大數據的混雜性展開了人類創構的廣闊空間

關于大數據結構的三個不同層次視域具有重要理論和實踐意義。從包括人的需要及其發展的更高層次看,大數據具有與大自然完全不同的特點,大自然可以滿足我們的生存需要,但我們面對大自然絕不能以人的物能性存在為中心隨心所欲,而大數據則不然,在以人類需要為出發點的大數據挖掘中,作為數據之間的關系,數據結構包含數據的關系層次,數據的關系層次則不僅決定于數據本身,而且取決于數據挖掘者對人類需要及其發展的理解和把握,這既與大數據技術的發展有關也與人的理解和創構能力密切相關。創構是創生性創造,作為信息數字編碼發展的產物,大數據為人類創構提供了廣闊空間。

正是數據結構的開放性,相對于小數據基于取樣的結構性甚至精確性,大數據顯得混雜無序。由此人們發現,對精確的癡迷是模擬時代的產物,模擬時代信息匱乏,當數據稀少時,每個數據點都至為關鍵,因此,要非常小心地避免讓任何點偏離分析,而在大數據時代,情況則全然不同。作為生活在混雜無序環境中的回報,我們得到了非常有價值的服務,在其范圍和規模上,用傳統的方法和工具是不可能的。通過允許不精確,我們打開了一扇通往洞察宇宙的窗戶[6]40,47。在很大程度上,信息的模擬編碼就是信息的物能甚至物體編碼(典型的比如傳統書信),而信息的物體編碼則典型地既費事又不利于傳送,更重要的是難以與信息的觀念編碼(典型的比如抽象概念)直接轉換。事實上,非結構化數據和結構化數據的區分仍然源自大數據和樣本數據的對比,在這方面,大數據和小數據根本不同,遠不只是數據的非結構化和結構化可以說明的問題。大數據和小數據的根本區別在于:小數據是結構化數據,而大數據則是具有結構開放性的數據集合。由大數據的規模整全性和實時流動性[12]可以得到對大數據的進一步理解:具有規模整全性、實時流動性的結構開放數據集合。大數據的實時流動性在更高層次展示了數據類型和數據來源的多樣性,因此在大數據實時流動性基礎上理解大數據的結構開放性具有更深層次的邏輯根據。

大數據的結構開放性對于人類發展具有極為重要的意義。在哲學層次看,大數據的結構開放性具有存在論意義上的認識價值,因此就不用擔心數據量的指數性增加造成結果的不準確,甚至由此可以超越傳統意義上的精確和混雜界分。

面對既存的自然世界,無論在什么意義上理解“符合”,認識都必須以對象為標準,因此,精確性具有根本意義。人類“測量臻于至善”的理想就是由此而生的,隨著工業化和標準化的發展,人們對精確性的要求走向極端。到了19世紀,法國——當時世界上科學發展領先的國家——已經發展出一套精確定義的測量單位系統,用來度量空間、時間等,并開始讓其他國家采用同樣的標準,甚至發展到規定國際接受的原型單位(prototype unites)寫進了國際條約,這是測量時代的頂峰。僅僅半個世紀后,在20世紀20年代,量子力學的創立永遠粉碎了全面和完美測量的夢想[6]33。量子力學凸顯了量子現象的關系性質,作為觀測的結果,量子現象是由觀察者對對象的觀測生成的,量子現象與觀測主體的關系一目了然,而作為人類活動的產物,大數據則進一步凸顯了更廣泛的關系性質。面對人類利用信息技術建立起來的大數據,無論在什么意義上理解主觀性和客觀性,大數據基礎上的創構都必須從人的需要及其發展出發,以人類需要的滿足為最終目的,因此精確性就不如多樣性甚至混雜性重要,由此就可以看到,作為一對二分范疇,精確性和混雜性是內在關聯在一起的,只有互為參照甚至相互結合,才能使認識提升到更高層次。在某種程度上,精確性的重要性源自對凝固對象的認識,而多樣性或混雜性的重要性則源自對對象活生生成長發展過程的把握。至少在某種意義上,越是在活生生的成長發展過程中,精確性越是信息封閉的結果,而混雜性則越是信息開放的產物。傳統數據庫局限下的樣本數據具有精確性,而數據來源越來越廣的多樣性大數據則具有混雜性。正是混雜性意味著更豐富的相關關系,從而意味著大數據與人類創構具有更重要的關聯。

從樣本數據精確性和傳統數據庫關聯還可以進一步看到精確性和混雜性之于人類認識的關系,精確性往往處于已有認識范圍內,而混雜性則往往處于已有認識范圍之外。在認識的天花板之下是精確性,在認識的天花板之上則是混雜性。相對于人類的認識能力和認識目的特別是長期形成的觀念,對人類認識而言,在已知領域和未知世界的交界處甚至未知世界本來就是混雜的,只是人類通過自己的觀念系統看到了“精確”的世界。正是作為包括自己在內的世界的量化反映,大數據使人類看到了世界混雜的層次。大數據將數字轉換成更具概率性而非精確性的東西,這種改變需要花很長時間適應,而且它本身也會帶來一些問題,但目前需要注意,當擴大規模時,我們往往需要接受混雜[6]35。康德的“人為自然立法”在大數據及其基礎上的創構中體現得更為充分,而十分耐人尋味的是,在機器翻譯領域,更高層次的機器理解卻恰恰建立在混雜的大數據基礎之上。機器翻譯的發展過程恰恰與其基礎從精確到混雜的發展過程密切相關,這也表明,大數據的發展使數據結構成了一個必須重新認識的方面。深入到科學技術和哲學機制層面的一體化層次,關于大數據的混雜性以及數據結構與人類認識活動的關系就會有一個更深層次的不同理解。

由于大數據基礎上的創構涉及人的需要及其發展,人類基于大數據的實踐和認識活動涉及科學和哲學機制層面的一體化。在這個一體化層次,數據結構又可以理解為兩個基本層次:一是大數據本身的數據結構,即數據間的關系;二是相對于數據挖掘而言的數據結構,即相對于人的需要及其發展而言的數據結構。在第一個層次,由于作為實時數據流,大數據在不斷擴展中,數據之間的關系也在不斷變化中。就此而言,即使就典型的比如機器采集生成的大數據而言,數據結構也是開放的,因為大數據處于趨向整全的生長過程中,意味著數據結構的過程性。隨著大數據的生長,數據結構甚至會有層次性的展開,而就第二個層次來說,數據結構歸根結底是面對數據理解而言的,在這個意義上,所謂的數據結構決定于數據和創構之間的關系。由于人的需要處于持續發展中,這個意義上大數據結構的開放性實際上決定于大數據與人類創構之間的關系,這無疑對人類發展具有關鍵性意義。

由于大數據的結構開放性決定于數據和創構之間的關系,作為基本的描述方式,結構具有相對性,甚至是否存在結構都是相對而言的,這一點在大數據中最為典型。看似無結構的數據,在更高層次整體觀照中,甚至在不同的背景中或簡單地換一個角度就可以看出結構。由于大數據的理解和數據挖掘相關聯,而數據挖掘又與人的需要及其發展密切相關,大數據的結構典型地是面對人的需要及其發展開放的。信息科技界就有一種“結構相對論”觀點,數據結構的這種相對性,正是相對于對人的需要及其發展的把握而言的。在數據挖掘和算法設計中,對人的需要及其發展的理解在根本上決定預測的準確性,這方面美國奈飛公司(Netflix)取得了最具代表性的成功,提供了諸多典型案例。

作為出租錄像制品的網絡公司,奈飛公司的業務與用戶需要及其發展具有最直接的關聯。正是由于通過大數據對用戶需要及其發展的理解,奈飛公司成功實現從單純出租錄像制品到自己根據用戶需要及其發展生產錄像制品的轉換和升級。美版《紙牌屋》就是最早取得成功的典型案例,奈飛公司將這一成功歸功于他們“不斷改進的內容”,包括《紙牌屋》和《女子監獄》,這一原創內容正在吸引新會員和留住老用戶,事實上,奈飛公司90%的會員都涉及這些原創內容,顯然,奈飛公司的成功在很大程度上取決于其對觀眾將喜愛什么的預測能力[13]20。奈飛公司的這種做法不僅意味著從更高整體層次看,正是相應于人的需要及其發展,大數據的數據結構在根本上是開放的,而且隨著對大數據研究的深化,還可能進一步提升到在一定程度上引導用戶需要發展的層次。

正是大數據數據結構的開放性,為人類創構打開了新的可能性和無限豐富的空間。人類可以在大數據的基礎上,獲得在大自然中所沒有的自由度,完全以自己的需要為出發點,以這種需要的滿足為最終目的,創構自己需要的信息產品以及與之相關的新的物能產品,從而創生以前從來沒有而且很多不可能有的價值。正是在這個意義上說,大數據的結構開放性和混雜性在人類發展中具有特殊地位。大數據的結構開放性以及在此基礎上大數據的混雜性具有重要價值生產意義,由此建立起大數據結構開放性和人類發展之間的更深層次關聯。與此同時,由于隨著信息文明的發展,人越來越主要以信息方式存在,而且人歸根結底是信息方式的存在,信息價值的釋放與人的發展更為內在地關聯在一起。

三、大數據的結構開放性和人類發展的價值生產關聯

大數據的結構開放性為人類在大數據基礎上進行創構提供了無限廣闊的空間,從而為人的解放和自由全面發展提供了重要基礎。

大數據的結構開放性意味著具有與物能不同的價值屬性,它使大數據具有價值生產性[12],而大數據的數據結構相對于人的需要及其發展的性質,則意味著大數據的價值生產性與人類發展的更深層次關聯。大數據價值生產的創生性質,更在數據結構開放性的基礎上,展開了人類發展與以往完全不同的廣闊空間和更深層次。

由結構到關系,凸顯了大數據結構開放性對人的意義。人的本質不是單個人所固有的抽象物,在其現實性上,它是一切社會關系的總和[14],作為一切社會關系的總和,人的發展可以直接與大數據相關關系對接。隨著信息技術特別是人工智能的發展,大數據的結構開放性與人類發展之間的關系將在兩個基本方面日益展開:一方面,大數據價值鏈將不斷延伸;另一方面,隨著大數據處理技術的發展,數據挖掘的門檻越來越低,越來越多人可以進入數據挖掘層面活動。將兩個方面融匯發展,通過大數據基礎上的價值生產大大推進人類發展。

大數據的價值創生不僅決定于對人的需要及其發展的理解,而且也與價值創生者自身的需要層級密切相關。由于大數據的特點,大數據價值鏈具有無限延伸的空間,數據本身的擁有者、大數據開發者以及致力于大數據思維創新者的分工可能會越來越細化。如今,擁有大數據思維的企業家在創業之初往往不擁有數據,但正因為如此,他們也沒有可能會阻止他們釋放自己創意的既得利益或經濟阻礙[6]131,這就會不斷深化大數據的價值創生,大數據價值創生鏈將不斷向縱深基礎延伸,同時不斷深化地曉示這樣一個基本原理:越是基礎性原創,越必須有更高層級內在需要驅動。在經濟利益驅動下,人們利用大數據顯然可以,但由于大數據價值生產和人類存在的信息關聯,越是大數據的深度開發,越是深涉人類需要及其發展的大數據價值生產,就越必須有更高層級的內在需要驅動。只有具有更高層級的內在需要驅動,人類才可能有更長遠的眼光,才可能有更高層次的整體觀照,才可能有人的更自由全面發展。

大數據價值生產不僅意味著必須有內在驅動機制,而且意味著隨著價值創生層次的深入,必須有層次越來越高的整體觀照能力,這將為人類發展提供更深層次的巨大張力。大數據基礎上的價值生產不僅將使意義的分化越來越明顯,而且將出現信息價值生產中的新分化。在信息價值生產中,由于整體把握能力的重要性日益凸顯,整體理解和技術處理兩種不同角色將發生差別越來越大的分化。信息的價值越來越源自更深層次的創生,單純擁有大數據技術會淪落為信息“打工仔”。如今,離岸外包公司已經進一步降低了編程的價值,曾經的高端技術典范成了世界“窮人”發展的引擎[6]134。即使同為創生信息價值的人,不同的創意層次之間的差別也會越來越大,隨著大數據的發展,創意的差別越來越構成人的發展的差別,這與由此而來的人的發展競爭密切相關。“數據中間商”之所以成了發展空間越來越大的職業,就與大數據挖掘的廣度和深度擴展聯系在一起,這也是催生大數據公司多樣性的根本原因。大數據價值創生鏈的可無限延伸性質將催生越來越多的信息價值創生方式,無論什么價值創生方式,都與大數據基礎上的量化整體觀照密切相關。

大數據基礎上的價值生產使整體觀照能力的要求幾乎無所不在,而且要求也越來越高。在大數據的價值創生中,整體觀照能力越來越重要,大數據的信息性質及其價值創生特點決定了跨界是更可能得到創新的方式。在線平臺為開發商和數據科學家提供舉辦機器學習競賽等活動,Kaggle提供了很多案例,從這些案例中發現大數據領域的先驅者通常不是來自他們所在的領域。Kaggle的首席執行官安東尼·戈德布魯姆(Anthony Goldbloom)認為:Kaggle競賽是大數據項目的在線平臺,其獲勝者通常都是在該領域取得成功的新人[6]142。這種運作機制與物種遠緣雜交極為相似,在生物進化中,近緣雜交優勢不明顯,太過遠緣雜交不能成功。只有把握一定區間,才能既確保成功,雜交優勢又最為明顯,這就需要不僅是跨學科,而且是學科一體化的整體把握能力。

對于大數據的價值創生,學科一體化的整體把握能力具有決定性的優勢,這方面有很多具體例子,雖然看上去的表象只是跨學科,但實質上是源自不同程度的學科一體化,如:一位英國物理學家開發了一種近乎成功的算法來預測保險索賠并識別二手車的缺陷;一位新加坡精算師在一場預測生物對化合物反應的競賽項目中取得領先。與此同時,谷歌機器翻譯小組的工程師們慶祝他們翻譯出了辦公室里沒人會說的語言,類似地,微軟機器翻譯部門的統計學家們津津樂道一個老笑話:每當語言學家離開團隊,翻譯的質量就會提高[6]142。這些有趣的案例不但表明了信息價值創生的非同尋常之處,而且表明信息文明時代價值生產的發展新趨勢,還表明大數據時代人類發展的方向是基于學科一體化發展的,無論在專業領域還是在日常生活中,這些都可以為人的發展提供諸多啟示。隨著大數據時代的發展,單一學科領域的專家的確將面臨新的問題,可以肯定的是,學科領域的專家不會消失,但他們的優勢將會減弱,從現在開始,他們必須與大數據極客們分享講臺,就像高貴的因果關系必須與謙遜的相關關系分享聚光燈一樣,這改變了我們評價知識的方式,因為我們傾向于認為深度專業化的人才比通才更有價值——財富更青睞深度[6]142,但這絕不是一個深度和廣度哪個更重要的問題,而是以往二者分離的權衡已經越來越不適用于以大數據為重要基礎的信息文明時代的發展。在信息基礎上,沒有邏輯上的廣度就不可能有真正的深度,反之亦然。在知識的意義上,不僅“專”和“博”的原則具有合理性,而且隨著信息爆炸式發展,百科全書式的“博”早就表明其不僅越來越不可能,而且越來越沒有必要,這種發展形勢給人類發展所展開的是另一種前景:正是知識呈爆炸式發展的形勢,又決定了沒有邏輯把握意義上的“博”,“專”即使可能也會有極大局限甚至很可能迷失。信息文明時代“專”和“博”的邏輯關系,其核心奧秘就在整體觀照,這又涉及大數據價值生產性與人的需要及其發展的更深層次關聯。

大數據的價值生產性和人的需要及其發展之間的更深層次內在關聯,典型地體現在信息產品的生產機制中。以往根據市場需要進行商品生產應當是物能產品生產的基本方式,因為人類的物能需要是明顯的、沒有被遮蔽的,而信息產品的生產就不同了,因為信息需要具有物能需要不同的性質。物能需要都會在一開始就引起相應的意識,而信息需要則往往越是高層級的,其在一開始越是處于無意識狀態,甚至難以意識到[15]。越是深度創新的信息產品,用戶越不可能有對其需要的意識,如所有科幻作品從未預料到智能手機的出現,正因為如此,信息產品生產越來越不能只是根據市場需要的反映而必須開發人們的需要,即傳統意義上的開發市場,這正是喬布斯回答關于推出蘋果iPad前市場調查的問題時,那個著名回答的深層根據。

在蘋果iPad已經發布但還沒有推向市場之際,喬布斯在《紐約時報》大廈展示該款產品時,有記者問到之前有沒有做市場調查,喬布斯回答時說出了那句從信息價值創生性看來內涵極為深刻的話:“知道自己想要什么不是消費者的職責。”[6]168越是創新性強的信息產品創生,創新理念越不可能來自現成的市場,而必須是對消費者需要理解和開發的產物——歸根結底是對人的需要及其發展把握的結果。由于人的需要處于不斷發展中,而且人的需要的發展就是人的發展,因此在大數據的價值創生性與人的發展之間,內在關聯將隨著大數據的發展越來越深化。

在大數據時代,大數據價值生產性和人的需要的發展是一個互動展開的過程。作為價值創生的基礎,大數據的潛在價值與其數據質量密切相關,但是,高質量數據并不能自然而然保證高價值,我們還需要用于價值創生過程的有效算法[4]8。人們不僅發現大數據相關關系,而且采用智能算法尋找大數據中的相關關系,由此不斷深化價值創生,大數據的價值創生性與算法密切相關,算法從大數據中創生價值并且算法設計又與數據挖掘者特別是其對人的需要及其發展的理解關聯在一起。大數據就在那兒,無論你看到與否,大數據所蘊含的相關關系越來越必須通過算法挖掘,而智能算法的發展也表明數據挖掘可以通過機器智能完成,這些數據更多的是被計算機而不是人類使用:被稱為“寬客”(quant)華爾街的數學高手將數據插入他們的算法模型中,以尋找可以轉化為利潤的看不見的相關關系[6]93。人類的工作越來越主要是在機器智能研發等的基礎上,根據自己發展的自我規劃,明確自己的需要及其發展。由此可見,隨著智能化的發展,了解或理解人的需要及其發展,越來越不是一件去被動發現而是必須去主動設計的事情。對于人類發展來說,大數據所敞開的是一個在大自然基礎上更廣闊的上升空間。大自然具有孕育人類的機制,但這并不意味著人類可以為所欲為,作為人類活動的產物,大數據則可以更好地滿足人類為大自然所不能滿足的需要,甚至在不違背自己需要發展要求的前提下“為所欲為”,大數據基礎上人的發展關鍵是對人的需要的把握。

理解和把握人的需要的發展是大數據價值生產性的重要基礎,越來越多的企業認識到了這一點,為了使這些數據可用于計算機分析,從而釋放其價值,必須以某種方式對其進行量化。奈飛公司的做法是付錢給數千名觀眾,讓他們觀看數小時的內容,仔細標記他們在其中發現的要素[13]21。正是由此,奈飛公司的成功主要建立在對用戶需要及其發展理解的基礎之上,正是在此基礎上,構成了用戶需要發展和錄像制品內容生產之間的良性循環,因此,大數據的價值生產性與人的需要的發展構成一個雙向循環,需要人們自己去整體把握和全面負責。隨著大數據的發展,在我們面前所展開的將是一個意義越來越深遠的前景,同時也是一個越來越需要我們不斷展開自己未來的過程。沃爾瑪分析其大數據的舊銷售數據時,發現完全不同類型的商品(如啤酒和尿布)不尋常地頻頻出現在同一購物籃,兩者間在大數據中呈現強相關關系,沃爾瑪將啤酒和尿布這兩種不同類型的商品放在同一貨架,大大提高了這兩種商品的銷售量。啤酒和尿布之間的強相關關系反映了家里添丁,年輕的父親既興奮又辛苦,必須為嬰兒采購的尿布就和犒勞自己的啤酒關聯在一起了。從大數據相關關系捕捉到這種極為隱蔽的需要表現,于是可以通過更方便的方式滿足顧客的需要,銷售業績大大提高,這為利用大數據相關關系提供了一個簡單得令人驚訝的例子,曉示了大數據相關關系的誘人魅力。

奈飛公司通過對大數據的深度挖掘,把握了用戶更深層次的需要,并由此開發出自己的產品,將自身發展提升到一個更高層次,從僅僅出租錄像制品一躍發展為生產自己的錄像制品。奈飛公司從其大數據所反映的用戶租用錄像產品的喜好發現很多用戶喜歡看英國BBC生產的電視劇《紙牌屋》,這些用戶中又有很多人喜歡凱文·史派西(Kevin Spacey)主演的影視作品,而這些既喜歡看英版《紙牌屋》又喜歡凱文·史派西的用戶中又有很大比例喜歡大衛·芬奇(David Fincher)導演的作品,由這三重相關關系,奈飛公司輕松地得到拍攝美版《紙牌屋》的創意,因此從BBC買來《紙牌屋》的版權,邀請大衛·芬奇導演和凱文·史派西主演,通過精準滿足觀眾的需要,該劇毫無懸念地取得巨大成功。無論從“啤酒和尿布”還是美版《紙牌屋》,從越來越多的這類案例中可以看到在大數據基礎上的新的潛在可能性寶藏,一方面可以清楚地看到大數據基礎上的價值創生過程,不創生就不會存在這些價值;另一方面可以看到隨著相關認識和研究的發展,這方面的潛力挖掘會越來越清晰地呈現大數據價值生產性與人類發展的更深層次內在關聯,呈現大數據結構開放性的人類發展重要意蘊。

大數據的結構開放性為價值創生提供了前所未有的平臺,從而為人類發展造就了一個新的信息世界。由于人的發展越來越主要以信息方式進行,作為信息數字編碼發展的產物,大數據將是人類越來越重要的世界層次,隨著大數據的發展,其結構開放性意味著越來越廣闊豐富的人類發展空間。

猜你喜歡
開放性數據庫人類
人類能否一覺到未來?
例析三類開放性問題的解法
初中英語開放性探究式閱讀教學策略
甘肅教育(2020年6期)2020-09-11 07:45:40
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
人類正在消滅自然
奧秘(2015年2期)2015-09-10 07:22:44
主站蜘蛛池模板: 中日韩欧亚无码视频| 伊人色天堂| 免费人成视网站在线不卡| 日本高清免费不卡视频| 97成人在线观看| a级毛片在线免费| 亚洲国产成人久久77| 亚洲成A人V欧美综合| 国产人人乐人人爱| 国产精品专区第一页在线观看| 国产区免费| 久久这里只有精品2| 亚洲AV一二三区无码AV蜜桃| 久久久久久久久久国产精品| 国产精品自在在线午夜区app| 国产v精品成人免费视频71pao| 国外欧美一区另类中文字幕| 久久性视频| 激情视频综合网| AV熟女乱| 1级黄色毛片| 毛片久久久| 欧美亚洲中文精品三区| 亚洲中久无码永久在线观看软件| 亚洲综合在线网| 尤物精品国产福利网站| 国产精品乱偷免费视频| 国产aⅴ无码专区亚洲av综合网 | 中文字幕色在线| 国产福利观看| 热99re99首页精品亚洲五月天| 全部免费特黄特色大片视频| 欧美日韩国产成人高清视频| 91精品福利自产拍在线观看| 亚洲一级毛片免费观看| 欧美日韩激情在线| 她的性爱视频| 免费A∨中文乱码专区| 婷婷久久综合九色综合88| 久久综合伊人 六十路| 中文字幕无码制服中字| 国产精品午夜福利麻豆| 99视频在线免费| 色国产视频| 老司国产精品视频| 欧美国产综合色视频| 免费啪啪网址| 伊人蕉久影院| 国产激情影院| 欧美成人午夜视频| 熟女成人国产精品视频| 亚洲美女一级毛片| 日韩毛片基地| 永久免费无码成人网站| 色综合日本| 亚洲AV无码久久精品色欲| 在线播放精品一区二区啪视频| 2021最新国产精品网站| 999在线免费视频| 亚洲综合专区| 很黄的网站在线观看| 丁香六月激情综合| 玩两个丰满老熟女久久网| 国产后式a一视频| www亚洲天堂| 亚洲无线视频| 亚洲三级视频在线观看| 99热这里只有免费国产精品| 成人午夜免费视频| 国产美女丝袜高潮| 亚洲成肉网| 99伊人精品| 免费毛片全部不收费的| 91视频首页| 欧美精品1区2区| 潮喷在线无码白浆| 制服丝袜一区| 国产成人无码播放| 不卡午夜视频| 亚洲天堂视频在线观看| 国产成熟女人性满足视频| 精品视频在线观看你懂的一区|