摘要:大數據伴隨著技術的演化,一直影響著我們的生活。目前也是一個研究熱點,但是大數據是什么?大數據能否稱之為技術?我們將如何判斷數據能否稱為大數據?本文將大數據與技術的特征進行比較,嘗試判斷大數據即是大數據技術。同時對大數據與傳統數據進行對比,確定大數據的基本判斷標準。
關鍵詞:大數據;技術;在線性
中圖分類號:TP301 文獻識別碼:A 文章編號:1001-828X(2016)022-000-02
一、從大數據到大數據技術
伴隨著時代的發展,大數據逐漸走入我們的生活并且保持具有自我隱藏、自我遮蔽的特性。使我們在不經意間就融入了它的懷抱,當我們停下腳步,立足反思的時候,我們可以清楚的發現,大數據給我們帶來諸多改變的同時,大數據的本質及其一些哲學上思考漸漸被更多的學者所重視。
如果單純從定義的角度,維基百科曾給出在現有工具軟件的基礎上,在可接受的時間范圍內,無法對其記性捕捉、管理和處理的數據的集合,通過這樣的定義,我們可以理解為大數據的實質是數據的集合,但我們清楚的知道在日常生活中對大數據進行收集整理的目的不是在于掌握龐大的數據資源作為資產的一部分,而是希望通過分析、捕捉、管理、處理等手段,對其進行專業化處理,使原本無意義的龐雜數據集合變得有意義。換言之,如果大數據是一種生產資料,那我們現在要討論的就是如何將生產資料轉化為產品的手段,我們能否將這種手段稱之為“大數據技術”?
在判斷某種生產活動能不能稱之為技術之前,我們要首先了解何為技術。《史記·貨殖列傳》:“醫方諸食技術之人,焦神極能,為重糈也。”宋代陸游《老學庵筆記》卷三:“忽有一道人,亦美風表,多技術……張若水介之來謁。”清朝的侯方域《再與賈三兄書》:“蓋足下之性好新異,喜技術,作之不必果成,成之不必果用,然凡可以嘗試為之者,莫不為之。”歸結起來,我國古代認為技術是技藝、法術。
通過綜合其他歷史資料分析,技術在我國古代一直被冠以“奇技淫巧”,這也可能就是日本學者認為技術的本質是手段方法的歷史淵源。在《辭海》中,技術被定義為是人為了滿足自身的需求和愿望,遵循自然規律,在長期利用和改造自然的過程中,積累起來的知識、經驗、技巧和手段,是人類利用自然的方法、技能和手段的總和[1]。現代技術演化,也遵循了這一定義,對方法、技能、手段無所不能及的開發、利用、革新,其代表就是技術革命帶給我們的巨大好處。但以上都是日常生活中我們所談到的對技術的定義,同時在日常生活中,人們習慣用一句話或“種加屬差”的格式來為技術下定義。[2]歸結起來,日常生活中人們認為技術是一種知識經驗和手段,但我們依然不能清楚地了解數據的本質究竟為何。之所以會產生這樣的狀況,是因為人們將技術應用于生產實踐的過程中,不需要弄清楚技術究竟是何物,因為不清楚什么是技術也不會妨礙他們的生產活動,不會影響他們利用、使用技術。作為研究者的我們就要探究一下,技術的本質究竟是什么?
在遠德玉教授的《論技術》、《技術選擇論》[3,4]中他提出,技術是一種過程。同時認為技術是一種動態過程,應把技術作為一個獨立的對象,需要從不同角度開展技術論的研究。其與陳昌曙教授吃有同樣的觀點,不主張給技術下一個明確的定義,而更傾向于描述技術。陳昌曙教授在與陳紅兵研究員《關于“技術是什么”的對話》中提出技術的三個基本特征,即第一,技術是物質、能量、信息的人工化轉換。這是技術的功能特征,是技術的最基本的特征。第二個特征,即技術是人們為了滿足自己的需要而進行的加工制作活動。這是技術的社會目的特征。第三個特征,即認為技術是實體性因素(工具、機器、設備等)、智能性因素(知識、經驗、技能等)和協調性因素(工藝、流程等)組成的體系。[5]雖然上述的討論未能就技術的本質給出定義,但已經大致勾勒出技術的特征,下面我們就其談談大數據是否符合以上特征。
技術是物質、能量、信息的人工轉化。[5]這里我們要討論的是大數據中是否存在人工化的物質、能量、信息。目前,面向大數據的研究多集中于存儲、處理、分析、可視化等。多為研究分析處理數據的手段方法,這不禁讓我們可以聯想起紡紗機等一些列在技術生產中扮演重要角色的機械裝置。工人為紡車提供原料,紡紗機產出人們想要的產品,而這個過程即物質、能量、信息經過人工化轉換的過程。大數據同樣擁有以上的過程,巨量的密集數據經過存儲、處理、分析、可視化等手段加工后,成為人民需要的“產品”。人工化使原本雜亂、繁復的數據變得有意義,從而供下游使用。在這個過程中數據保持了原有的屬性,同樣被人們的實踐行為和過程變得有新的意義。顯然大數據符合這一基本特征。
技術是人們為了滿足自己的需要而進行的加工過程。[5]大數據擁有龐大的數據,人們如何從浩如煙海的數據中,選取需要的數據則必須加入人的主觀意識;例如,新興互聯網公司小橘科技,在完成“滴滴打車”這個產品之后,又為滴滴出行家族增添一員。新的產品名為滴滴巴士,同樣是基于大數據平臺的產品,用戶前期只需提供乘車地址和目的地以及每周的乘車需求。技術人員就可以根據匯總之后的數據制定出合適的巴士路線。那么,如何在眾多的用戶請求中選取最合適的路線,則成為大數據加工過程中最難且最有價值的工作。線路規劃人員在規劃線路的過程中,要考慮乘車人數,乘車時間,線路是否擁堵,線路長度,車輛費用等等因素。從而綜合多方因素制定出符合實際的巴士線路。舉這個例子就是為了說明,大數據在應用的過程中,是為了滿足自己的需要而進行的加工過程,單純的加工時沒有意義的。
技術是實體性因素、智能性因素和協調性因素組成的體系。[5]就目前的研究來看,人們關于大數據的研究往往集中于此,從其內部而言,人們考慮最多的就是如何儲存更多的數據,人們無時不刻的創造數據,促使計算機生產廠商不斷進行技術革新,摩爾的預測早已被超越,生產出能滿足大數據需求的產品早已成為計算機廠商的共識。同時,大數據已經匯聚了一批高技能人才,且不限于計算機領域,這樣才能滿足大數據對智力的需求。協同創造乃至協同創新一直被大數據領域視為第一法則,用戶的需求已經不再是簡單的甲方提出,而是在整個流程中甲方參與。
簡言之,大數據符合技術的基本特征,我們可以認為大數據在理論層面是技術,但在實際的日常應用過程中大數據也需要一系列的技術職稱才能完成其既定的工作目標,因而我們也可以將大數據視為一系列技術的集合。因此,我認為大數據就是大數據技術。
二、大數據技術帶來的變革
經過人類長期的歷史實踐,技術表現出在人類發展的過程中起決定性或基礎性的作用。每一項重大的技術革新都影響人類的生產方式與生活方式,同時也將帶來社會的變革與發展。同樣,我們承認大數據做為一種技術,那么大數據技術將給人類帶來怎樣的一種變革?這種變革是否能影響人類對世界的看法,能否影響人類的生活方式?這些都是人們心中的疑慮,以下將從幾方面對大數據技術發展帶來的變革進行分析。
在人和人交往的層面,大數據技術對我們的信息交換方式提出了巨大挑戰。大數據技術通過對龐雜且體量巨大的數據進行分析與挖掘,從何獲得富含豐富價值,并通過對人們每天時刻生產出來的數據進行分析整理,可以得出社會輿情和金融動向等等內容,故此傳統的政府與社會機構面臨著巨大挑戰。但也要值得注意的是,并不是單一的數據蘊藏很大價值,而是海量數據組成的數據集合,通過合理運用大數據技術手段進行分析整理才能被人們所利用。
在人的思維方面,大數據的時代背景使人們在尋求知識、發現世界和改造世界提供了新方法和新思路,使人們通過分析和挖據更大量的數據,獲得人們想要的內容。傳統人們往往是靠著預言和猜測來推動科技和社會的走向,這樣準確率低且風險高,而利用大數據技術,通過對以往數據的分析和挖據,可以在現在數據的基礎上給未來的發展和走向提供更多的參考依據,從而降低風險。
在人的經濟活動之,傳統商業通過占有生產資料,通過壟斷等手段獲取更多的經濟利益,這些都是傳統對有形資產的占有來獲得利益,而信息和數據最多能夠稱作是交易的附屬品,本身看不到價值。但在當今時代背景下,信息和數據往往要比那些有形的資產來的更加的珍貴,數據本身自帶的價值屬性日益凸顯,由原本交易的對象變為只交易其價值。這樣傳統的商業生態在逐漸被打破,基于大數據技術的生態圈正在被建立,雖然有很多環節尚不完善,但在這個背景下的生態系統終將取代傳統商業經歷百年所建立起來的生態系統。
在人的認識方面,傳統人們嘗試通過抽象的符號系統對世界作出種種解釋,比如萊布尼茨就通過他自己的符號系統對后人產生了深遠影響,但傳統的抽象符號已經不能滿足人們當今對事物描述的需求。如何在大數據的時代背景下對事物進行更加準確的描述稱為目前炙手可熱的研究熱區。從隨機樣本向全體樣本的擴展使人們不能使用從一般到抽象的理論來解決一切問題,數據的繁雜程度越高,越能在使用的過程中反映出事物本身的特殊“氣質”,我們已經從想知道它大概是什么的階段,“進化”到我們要知道它到底是什么的程度。
三、大數據與傳統數據之比較
我們討論了大數據能稱之為大數據技術,而人們也從其他角度討論大數據的影響,但無非都是提出大數據的特征,即3Vs或4Vs[6]甚至更多。傳統研究多認為大數據具有體量大(volume)、速度快(velocity)、模態多(variety)、難辨識(veracity)[7]等特點,較之傳統數據并沒有任何突破。我國擁有眾多的人口數量,身份證件信息儲存在公安部門的系統中,也可謂體量巨大,但是沒有人會稱其為大數據。每天全國的出生死亡信息更新速度也非常之快,但沒人會稱之為大數據。銀行系統中金融數據模態眾多,但我們很難將之稱為大數據。每時每刻流塘在因特網上的數據一般人不加以專業技能的訓練是無法進行辨識的,而專業人員也不會隨意將其稱之為大數據。那么我們如何在磅礴繁雜的數據海洋中識別哪些是大數據呢?則下面我們從技術的角度討論下,大數據之所以能夠快速發展,其與傳統數據本質的區別在哪?我認為有以下幾點區別。
第一,我認為大數據是一種在線的數據,并且是永遠在線的,離開網絡的支撐,大數據就沒有它的使用價值。大數據的使用價值就在于其的實時在線的特性,否則與傳統的被我們分散存儲在各自磁盤中的數據并無它異。同時,作為數據的使用者,也更傾向于大數據的這種使用價值。
第二,能被稱之為大數據的數據應具有及時性。我們在網絡上經常用到的就是數據的檢索功能,當我們輸入相應的關鍵詞進行數據檢索時,數據必須反映迅速且及時,應盡快的將我們需要的檢索內容呈現在人們的面前。假若要等上一個小時才會出現檢索的內容,相比各位將不愿再檢索。同理也可以應用在網絡購物等應用上,能同時滿足更多的人對數據的檢索,并進行迅速反應,這樣的數據我認為才能稱之為“大數據”。
最后,全面性是大數據的一個明顯的存在特征。大數據時代,人們應當拋棄傳統的樣本思維,組織建立完成的全面系統,故而大數據本身帶有的全面性就顯得尤為重要。在資本社會,資本家竭盡所能的占有更多的生產資料,而在大數據時代,我們將獲取更加全面的數據做為“第一要務”。因為傳統數據單一樣本或者抽樣已經不能反映實物的本質,我們能夠利用大數據技術對事物的發展進行“數據畫像”。因此,全面性是判斷數據能否稱之為大數據的標準之一。
四、結論
大數據技術的發展,給我們的生活帶來了巨大的變革。通過比較,我認為大數據符合我國學者所認同的技術的理解,也就是說大數據是一種技術。同時,大數據技術也有其自身性質。與傳統對數據的理解進行比較,若判斷數據是否能被稱為大數據,應該具有在線性、及時性以及全面性這三種性質。
參考文獻:
[1]余在海.技術的本質與時代的命運——海德格爾《技術的追問》的解讀[J].世界哲學,2009(5):153-161.
[2]聶馥玲.技術本質研究綜述[J].內蒙古社會科學(漢文版),2003(S1):78-81.
[3]遠德玉,陳昌曙.論技術[M].遼陽:遼寧科學技術出版社,1986.
[4]陳昌曙,遠德玉.技術選擇論[M].沈陽:遼寧人民出版社,1991.
[5]陳紅兵,陳昌曙.關于“技術是什么”的對話[J].自然辯證法研究,2001(04):16-19.
[6]姜浩端.大數據的本質及其可能的影響[J].中國經濟報告,2013(06):18-22.
[7]馬建光,姜巍.大數據的概念、特征及其應用[J].國防科技,2013(02):10-17.
作者簡介:曹德龍(1988-),男,黑龍江齊齊哈爾人,工程師,就讀于北京化工大學馬克思主義學院科學技術哲學專業,研究方向:技術哲學,科技評估。
項目基金:2016年度北京化工大學馬克思主義學院研究生科研創新資助項目。