郭晨晨
【摘要】 從大數據的提出到現在僅僅幾年時間,但已經成為整個社會各個領域的熱門話題。從事大數據工作的人才更是受到了包括百度、騰訊、阿里巴巴等互聯網掌舵公司的追捧。但是需要注意的是任何技術或者科學成果都有的局限性,讓大數據更好的為人類服務需要我們更多的理性。
【關鍵詞】 大數據 局限性 理性
一、大數據時代的到來
提到“大數據”,需要對“數據”的重要性做簡單的分析。本質上數據都是人創造的,它伴隨人類歷史的發展,從古至今一直影響著人類的思考、行為,改變著人類的世界觀、價值觀。
大數據時代的核心仍然是數據。傳統數據是一個個數字或者可以進行編碼的簡單文本,是一種結構化的信息量,分析起來要簡單很多。
而大數據卻包羅萬象,以文本、圖片、視頻、音頻等等眾多形式出現。它包含很多非結構化數據和半結構化數據。
麥肯錫是研究大數據的先驅,在其報告中給出的大數據定義是:大數據指的是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。但它同時強調,并不是說一定要超過特定TB 值的數據集才能算是大數據。
維基百科對于大數據的描述是在無法容許的時間里,用常規軟件對其內容進行抓取、管理和處理的數據集合。
大數據時代的到來與其說是人類智慧的創造性成果,不如說是對于信息爆炸時代處理海量信息的一種無奈的解決方法。
二、大數據的技術特點
任何一種新技術的應用都是水到渠成的結果,假如環境沒有準備好,無論什么樣的技術想取得預期的效果都是極為困難的,大數據應用對于環境的要求是極其苛刻的。
Volume、Velocity、Variety、Veracity是大數據的4V特點,處理數量巨大、結構復雜、類型眾多數據構成的數據集合自然不能僅僅使用單一簡單的技術來完成。
大數據是基于云計算的移動互聯網、物聯網、社交網絡、電子商務、智慧城市的跨界融合。云計算廣泛應用了分布式技術,它是一個體系架構,包含分布是數據處理技術、分布式文件系統、分布式數據庫等。
正是云技術給了人們廉價獲取海量計算和存儲的能力,使大數據處理技術成為可能。
三、大數據應用的副作用
3.1大數據應用需要更多理性思考
大數據的熱潮其提出之初就被人們所預料到。
麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”
然而,在大數據熱一浪高過一浪之時,很需要給大數據潑一盆涼水降降溫。
信息化宣傳言過其實已經是“新常態”,人們宣傳數據庫、信息共享、物聯網、云計算,發布會和研討會上這些新事物、往往賦予了它超過現實本身的意義。
每次都會描述一個無限樂觀的前景,然而現實的發展和人們本來的預期并不是同樣的軌跡。信息化效益不是一個短期工程,技術亦不是最關鍵的因素,理性的思考才是長久之計。
3.2大數據熱產生的浮躁社會氛圍
縱觀人類歷史,人們對于預測未知的熱衷從未消失過。現實世界中,缺少實時記錄的工具,許多行為看起來是“人似秋鴻有來信,事如春夢了無痕”,互聯網“處處行跡處處痕”的特點確實為人們發現規律,預測未來提供可能。
非理性的宣傳夸張了大數據的成果,增大了大數據的迷惑性,大數據在這種影響下變得無所不能。我們不能盲目神化大數據。
3.3大數據應用的局限性和危害
“大數據”,簡單來說就是無限規模的數據量。需要正確認識的是接收海量的信息帶來的并不一定是可以高效利用的信息。
在這個信息爆炸的時代,整個互聯網充斥著大量負面、虛假的信息。在利用大數據技術分析數據時,這些信息可能會使“規律”變得“非規律”。
例如在教育方式的選擇問題上,如果利用大數據分析,我們貌似從海量數據中把握出了多數人接收知識的“規律”,然而對于那些并不適合的孩子來說就應該被所謂的“規律”所限定發展,被“規律”所拖垮嗎?
數據的增長并不意味著有用信息的增長,更不意味著人們放棄獨立思考、獨立決策的能力。過度膨脹的數據讓人們在遇到具體問題時過分依賴網絡搜索查詢,這在一定程度上限制了人們智慧的創造性。
大數據規律始于分析者的感覺和猜測,是一種人為創新和思想成果,分析結果除了技術層面還受分析者本身文化層次和悟性的影響,規律的主觀性不可避免,大數據的虛假規律也不可避免。
這在很大程度上構成了大數據的局限性。大數據說到底僅僅是一種工具,走向成功,獨立思考,發揮思維的創造性是關鍵問題。