姚哲
摘 要: 隨著信息技術的高速發展,大數據的廣泛應用影響著人類生活的方方面面。從大數據的基本概念入手,探討了大數據的“四V”特征:Volume(大容量)、Variety(多樣化)、Velocity(高速)、Value(價值密度低),闡述了大數據在教育、醫療、零售業方面的應用,并且歸納梳理了國內外的研究現狀。
關鍵詞: 大數據; 應用; 教育; 醫療; 零售業
中圖分類號: G203 文獻標志碼: A 文章編號: 1671-2153(2017)05-0036-05
一、大數據定義
盡管“大數據”一詞已經耳熟能詳,但是在業內還沒有統一的定義。“大數據”研究機構Gartner將“大數據”定義為需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。Viktor Mayer-Sch?觟nberger和Kenneth Cukier在《大數據時代》(Big Data:A Revolution That Will Transform How We Live, Work, and Think)一書中寫道:大數據不用隨機分析法(抽樣調查)這樣的捷徑,對所有數據進行分析處理。麻省理工學院的Cesar A. Hidalgo博士認為大數據是指規模大、內容多、富有深度的數據集[1]。維基百科則將“大數據”定義為所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策目的的資訊。
關于數據密集型科學,著名數據庫專家、圖靈獎的獲得者Jim Gary 博士在《第四范式:數據密集型科學發現》(The Fourth Paradigm:Data-Intensive Scientific Discovery)一書中表示鑒于數據密集型科學研究獨特的技術支持需求和鮮明特點,有必要將數據密集型科學從計算科學中單獨區分開來,這種新的科學研究方式稱之為第四范式(The Fourth Paradigm),即“數據探索”(Data Expiration)[2]。四種科學范式的含義如表1所示。
二、大數據的特征
起初,IBM公司提出大數據具有5“V”的特征,即Volume(大容量)、Variety(多樣化)、Velocity(高速)、Value(價值密度低)、Veracity(真實性)[3]。……