丁云建
摘要:隨著全面數字化時代的到來,我們日常的生活將全面數字化。本文淺談了大數據的概念、大數據的產生、意義或者價值以及未來的發展趨勢。
關鍵詞:大數據;價值;發展趨勢
中圖分類號:TP311 文獻識別碼:A 文章編號:1001-828X(2016)030-000-01
大數據一詞最早出現于1980年,未來學家阿爾文·托夫勒在《第三次浪潮》這本書中首先使用了大數據一詞。然而在技術層面真正提出大數據這個詞是2008年8月由維克托·邁爾-舍恩伯格及肯尼斯·庫克耶兩位數據工程師提出。隨著互聯網及計算技術的發展,今天,大數據已經成為我們日常無時無刻不在制造產生并運用的最重要信息資源。
2015年9月,國務院印發《促進大數據發展行動綱要》(以下簡稱《綱要》),系統部署大數據發展工作。《綱要》明確,推動大數據發展和應用,在未來5至10年打造精準治理、多方協作的社會治理新模式,建立運行平穩、安全高效的經濟運行新機制,構建以人為本、惠及全民的民生服務新體系,開啟大眾創業、萬眾創新的創新驅動新格局,培育高端智能、新興繁榮的產業發展新生態。
一、大數據的概念
大數據這個概念提出并不早,從2008年提出至今,業界還沒有公認的說法。就其定義而言,大數據是一個較為抽象的概念,至今尚無確切的定義。比較典型的有以下幾種。
1.麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
2.維基百科的定義是:大數據是需要處理的資料量規模巨大,無法在合理的時間內,通過當前主流軟件工具擷取、管理、處理并整理的資料,它成為幫助企業決策的的資訊。
3.Gartner研究機構認為:大數據是指需要借助新的處理模式才能擁有更強決策力、洞察發現力和流程優化能力的具有海量、多樣化和高增長率等特點的信息資產。
4.IDC對大數據的定義是:大數據一般會設計兩種或以上的數據形式。它要收集超過100TB的數據量,并且是高速、實時的數據流,或者是從小數據開始,但數據量每年會增長60%以上。
二、大數據的特征
1.數據量巨大
第一個特征是數據量大。隨著互聯網技術的廣泛運用,互聯網的信息急劇增多。大數據已經從TB級別躍升到PB級別。隨著科技的進步,也許大數據的起始計量單位至少是PB(1000個TB)、EB(100萬個TB)或Z(10億個TB)了。
2.數據種類繁多
第二個特征據是數據類型繁多。包括網站日志數據、呼叫中心通話記錄、各類社交媒體中產生的文本數據,各類位置信息數據等等。不僅包括傳統的關系型數據,也包括未加工過的半結構化和非結構化的數據,例如網頁、文檔、視頻、音頻、圖片、郵件等各個形勢存在的數據類型。
3.數據價值密度低
第三個特征是數據價值密度相對較低。數據量在呈幾何級數增長的同時,這些海量數據的背后所隱藏的有價值信息切并沒有呈現出相應比例的增長,反而是因為量的巨大,從而獲取和捕捉到對使用這些數據的使用者有價值和需求的難度成倍增加。
4.數據處理速度快、時效高
第四個特征是處理速度快,時效性要求高。這是大數據區分于傳統數據挖掘最顯著的特征。每一時刻,我們都在產生數據,都在進行數據更新,這就要求處理數據的速度必須快。
三、大數據的產生
大數據的產生是計算機和網絡通訊技術被廣泛運用的必然結果,特別是互聯網、移動互聯網、物聯網、社交網絡等新一代信息技術的發展。數據的產生可歸類為以下四類。
1.由數據庫產生的大數據
由企業內部的辦公自動化(OA)、企業資源計劃(ERP)、物料需求計劃(MRP)等業務及管理和決策分析系統所產生的數據。這些數據通過多年的累計和沉淀形成企業內部的數據,通過多年的管理、清洗、集成、結構化和標準處理,可為企業管理決策提供支持和幫助。
2.由Web記錄產生的大數據
在Web1.0時代,網站為用戶指定了大量的標準化模塊操作,用戶在使用互聯網時,參與度相對較低,對互聯網的貢獻度較低,產生的數據量也較少,進入Web2.0時代,互聯網變成開放式的,用戶的參與度更高,個人從Web1.0時代的數據使用者變成2.0時代的數據制造者,由此帶來了數據量的爆發式增長。每時每刻,個人只要登錄互聯網就在制造產生數據。
3.由移動互聯網產生的大數據
移動互聯網也算是互聯網,所以移動互聯網產生的數據應該歸類在互聯網產生的數據范圍以內,但是隨著智能終端和無線通信技術的不斷發展,移動互聯網正成為每一個用戶采用最多的互聯網參與方式。
四、大數據的價值
在每時每刻產生的海量數據時,我們每一個人,每一個參與者都將自己的實際情況、企業的發展方向、股市的發展趨勢、社會的價值導向、甚至恐怖份子的行動意圖等各個方面。所有的過去和當下都可以用數據表示,我們所有的現象、本質以及未來都完全蘊藏在數據中。
五、大數據未來發展的趨勢
趨勢一:數據的資源化
大數據已成為企業和社會關注的重要戰略資源,并已成為大家爭相搶奪的新焦點。
趨勢二:與云計算的深度結合
大數據離不開云處理,云處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平臺之一。
趨勢三:數據泄露泛濫
未來幾年數據泄露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,每個財富500強企業都會面臨數據攻擊,無論他們是否已經做好安全防范。因為企業的所有信息都包含在企業數據中。
趨勢四:人類通過數據化永生
這個聽起來比較玄乎,但確實是有可能實現并做到的。例如一個人的身體各種特征指標都可以用數據來表示,比如顏值,現今我們去醫院的各種檢查最后都是以數字的形式表示。當科學技術進步到一定程度,我的感情,我們的思維都可以用數字化表示的時候,我們每個人就可以在數字層面下得到永生。
六、結語
隨著大數據時代的到來,我們每一個個體由數據的使用者變成數據的制造產生者,我們的所有完全融入了數字,形成一序列的數據鏈,在數據與數據之間只有充分融入,把握主動,站在數據挖掘的頂端才能更號的掌握未來。此文只是對大數據的一些淺顯概念做了簡單的闡述,不乏錯誤與不足之處,請斧正為謝!
參考文獻:
[1]陳工孟,須成忠.大數據導論-關鍵技術與行業應用最佳實踐.北京:清華大學出版社,2015.