摘 要:隨著移動互聯網、電子商務、物聯網以及社交媒體的快速發展,大數據時代已經來臨,本文從大數據的基本概念出發,嘗試探討大數據的概念、特點和主要應用。
關鍵詞:大數據 數據分析
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2013)07(b)-0029-01
在計算機系統中,各種字母、數字符號的組合、語音、圖形、圖像等統稱為數據,數據是信息的載體。以博客、微博、社會化網絡為代表的新型互聯網的應用,使得用戶成為數據產生的重要來源,數據的規模以前所未有的速度在不斷的積累和增長。谷歌公司每天要處理超過24PB(1PB=250字節)的數據。Facebook公司每天更新的照片數量超過1000萬張。Twitter上的信息量幾乎每年都要翻一番,每天都會發布超過4億條微博。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。毫無疑問,大數據時代已經到來。
1 何為大數據
大數據(Big Data)并非新生事物,2008年9月4日《自然》推出了名為“大數據”的???,其實它在物理學、生物學、環境生態學、自動控制等科學領域,以及軍事、通訊、金融等行業已存在多年。近年來,隨著互聯網行業的蓬勃發展越來越得到人們的關注,開始煥發出勃然生機。
一般認為,大數據又稱巨量資料,是由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的整合共享、交叉復用形成的智力資源和知識服務能力。2012年初,《紐約時報》撰文,宣告“大數據時代”已然降臨。大數據正在對各個領域都造成影響。在商業、經濟及其他領域中,越來越多的決策行為將日益依賴于對數據的收集和分析而做出,在公共衛生、經濟發展和預測等領域中,大數據的預見能力也已經嶄露頭角。
2 大數據的特點
大數據并不是一個確切的概念,甚至人們對它的理解也存在認識上的混淆。
“大”并不能準確的描述大數據的全部特征。大數據具備四個特點,第一,數據體量巨大:從TB級別,躍升到PB級別,甚至EB級別;大數據”龐大很龐大,以至于不能用G或T來衡量,大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。第二,數據類型繁多:數據多樣,包括網絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。第三,價值密度低,不相關信息數量龐大,需要深度挖掘分析。如隨著物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數據的價值“提純”,是大數據時代亟待解決的難題。第四,處理速度快。時效性要求高。這是大數據區分于傳統數據挖掘最顯著的特征。
3 大數據的應用
2012年,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將“大數據戰略”上升為國家意志。奧巴馬政府將數據定義為“未來的新石油”,并表示一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來,對數據的占有和控制甚至將成為陸權、海權、空權之外的另一種國家核心資產。而這些事情在小規模數據的基礎是無法實現的。大數據對于國家來說是一個歷史性的機遇,人們如今可以使用極為豐富的數據資源,來對社會經濟進行前所未有的實時分析,幫助政府更好地響應社會和經濟運行。對于企業來說,海量數據的運用將成為未來競爭和增長的基礎,通過對海量數據進行分析獲得有巨大的價值的產品和服務,數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。
目前,對于大數據的應用研究處在起步階段,隨著互聯網技術的不斷發展,數據即資產,這一觀點在業界已經達成共識。越來越多的政府、企業等機構開始意識到數據正在成為組織最重要的資產,數據分析能力正在成為組織的核心競爭力。對數據的分析,獲得有價值的信息,大數據是為了大智慧。隨著商業環境的變化發展,營銷方式也發生了巨大的變化,例如營銷數據的獲取,過去傳統的市場調研通常采用問卷、用戶走訪的形式,在每個網站、每個頁面以及每個廣告都記錄下每一次用戶訪問的信息,用戶來自哪里,是單次訪問還是重復訪問,每次來駐留的時間有多長,是直接訪問還是通過搜索引擎,看了什么內容、最關注哪些內容等等都一一存在。而這一切的獲取和分析都離不開大數據,對數據分析,要實現較高的精準、細分的數據,必須建立在大數據的基礎上,進行全數據的分析。搜索記錄、Facebook的留言和微博消息使得人們的行為和情緒的細節測量成為可能。挖掘用戶的行為習慣和喜好,在凌亂紛繁的數據背后找到更符合用戶興趣和習慣的產品和服務,并針對產品和服務進行針對性的調整和優化,這就是大數據的價值所在。
4 大數據產業鏈分析
IDC的數據顯示,2015年整個大數據市場將超過170億美元。大數據的商業機會主要在以下幾個方面。第一,數據中心的規劃、建設、運營及優化,三分技術,七分數據,得數據者得天下。隨著未來數據的規模劇增,數據中心的建設與維護是必不可少的。大數據需要在服務器和存儲設施中進行收集,并且大多數的企業信息管理體系結構將會發生重要大變化,需要擴大他們的系統,以解決數據的不斷擴大。第二,數據分析和挖掘,據“棱鏡”計劃顯示,美國政府多年前就開始基于海量數據的大數據技術應用,利用谷歌、雅虎、Facebook等網絡服務公司提供的電郵、即時消息、聊天記錄、社交網絡資料、以及登錄時間等海量數據中挖掘情報信息。第三,在大數據時代,商業智能有望得到迅速發展。商業智能是數據庫技術、人工智能技術、統計技術和軟件技術等的有機結合,根據功能不同,可細分為工具平臺軟件和應用軟件兩大部分。從全球范圍來看,商業智能已經成為軟件市場當前最具發展潛力的領域之一。第四,信息安全,如何處理海量數據,成為未來IT發展的關鍵,而在人們充分享受大數據所帶來的便利的同時,其背后所潛藏著的數據丟失風險不容忽視。故此,數據保護和安全的產業前景也同樣有巨大的機會。
參考文獻
[1]孟小峰,慈祥.大數據管理:概念、技術、挑戰[J].計算機研究與發展,2013,50(1).
[2]張錚.解析大數據[J].電腦開發與應用,2013,2.
[3]袁婕.大數據時代的商機[J].現代商業, 2012,30.