陳勇
(西華大學,四川 成都 610039)
大數據的發展趨勢
陳勇
(西華大學,四川 成都 610039)
隨著網絡信息化時代的日益普遍,移動互聯、社交網絡、電子商務大大拓展了互聯網的疆界和應用領域,我們正處在一個數據爆炸性增長的“大數據”時代,大數據在社會經濟、政治、文化,人們生活等方面產生深遠的影響,大數據時代對人類的數據駕馭能力提出了新的挑戰與機遇。
大數據;云計算;海量;發展;影響
大數據(Big Data)是指那些超過傳統數據庫系統處理能力的數據。它的數據規模和轉輸速度要求很高,或者其結構不適合原本的數據庫系統。為了獲取大數據中的價值,我們必須選擇另一種方式來處理它。數據中隱藏著有價值的模式和信息,在以往需要相當的時間和成本才能提取這些信息。如沃爾瑪或谷歌這類領先企業都要付高昂的代價才能從大數據中挖掘信息。而當今的各種資源,如硬件、云架構和開源軟件使得大數據的處理更為方便和廉價。即使是在車庫中創業的公司也可以用較低的價格租用云服務時間了。對于企業組織來講,大數據的價值體現在兩個方面:分析使用和二次開發。對大數據進行分析能揭示隱藏其中的信息。例如零售業中對門店銷售、地理和社會信息的分析能提升對客戶的理解。對大數據的二次開發則是那些成功的網絡公司的長項。例如Facebook通過結合大量用戶信息,定制出高度個性化的用戶體驗,并創造出一種新的廣告模式。這種通過大數據創造出新產品和服務的商業行為并非巧合,谷歌、雅虎、亞馬遜和Facebook它們都是大數據時代的創新者。
2.1 海量性
企業面臨著數據量的大規模增長。例如,IDC最近的報告預測稱,到2020年,全球數據量將擴大50倍。目前,大數據的規模尚是一個不斷變化的指標,單一數據集的規模范圍從幾十TB到數PB不等。簡而言之,存儲1PB數據將需要兩萬臺配備50GB硬盤的個人電腦。此外,各種意想不到的來源都能產生數據。
2.2 易變性
大數據具有多層結構,這意味著大數據會呈現出多變的形式和類型。相較傳統的業務數據,大數據存在不規則和模糊不清的特性,造成很難甚至無法使用傳統的應用軟件進行分析。傳統業務數據隨時間演變已擁有標準的格式,能夠被標準的商務智能軟件識別。目前,企業面臨的挑戰是處理并從各種形式呈現的復雜數據中挖掘價值。
2.3 多樣性
一個普遍觀點認為,人們使用互聯網搜索是形成數據多樣性的主要原因,這一看法部分正確。然而,數據多樣性的增加主要是由于新型多結構數據,以及包括網絡日志、社交媒體、互聯網搜索、手機通話記錄及傳感器網絡等數據類型造成。其中,部分傳感器安裝在火車、汽車和飛機上,每個傳感器都增加了數據的多樣性。
2.4 高速性
高速描述的是數據被創建和移動的速度。在高速網絡時代,通過基于實現軟件性能優化的高速電腦處理器和服務器,創建實時數據流已成為流行趨勢。企業不僅需要了解如何快速創建數據,還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實時需求。根據IMS Research關于數據創建速度的調查,據預測,到2020年全球將擁有220億部互聯網連接設備。
大數據,其影響除了經濟方面的,它同時也能在政治、文化等方面產生深遠的影響,大數據可以幫助人們開啟循“數”管理的模式,也是我們當下“大社會”的集中體現,三分技術,七分數據,得數據者得天下。
“大數據”的影響,增加了對信息管理專家的需求。事實上,大數據的影響并不僅僅限于信息通信產業,而是正在“吞噬”和重構很多傳統行業,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業中,數據分析的技術與手段更是得到廣泛的應用,傳統企業如沃爾瑪通過數據挖掘重塑并優化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。
大數據在個人隱私的方面,大量數據經常含有一些詳細的潛在的能夠展示有關我們的信息,逐漸引起了我們對個人隱私的擔憂。一些處理大數據公司需要認真的對待這個問題。
趨勢一:成為重要戰略資源。在未來一段時間內,大數據將成為企業、社會和國家層面重要的戰略資源。大數據將不斷成為各類機構,尤其是企業的重要資產,成為提升機構和公司競爭力的有力武器。企業將更加鐘情于用戶數據,充分利用客戶與其在線產品或服務交互產生的數據,并從中獲取價值。此外,在市場影響方面,大數據也將扮演重要角色——影響著廣告、產品推銷和消費者行為。
趨勢二:數據隱私標準將出臺。大數據將面臨隱私保護的重大挑戰,現有的隱私保護法規和技術手段難以適應大數據環境,個人隱私越來越難以保護,有可能會出現有償隱私服務,數據“面罩”將會流行。預計各國都將會有一系列關于數據隱私的標準和條例出臺。
趨勢三:網絡安全問題凸顯。大數據的安全令人擔憂,大數據的保護越來越重要。大數據的不斷增加,對數據存儲的物理安全性要求會越來越高,從而對數據的多副本與容災機制提出更高的要求。網絡和數字化生活使得犯罪分子更容易獲得關于人的信息,也有了更多不易被追蹤和防范的犯罪手段,可能會出現更高明的騙局。
趨勢四:大數據學科誕生。數據科學將作為一個與大數據相關的新興學科出現。同大數據的時代商業模式的創新分析。
[1] 李建義.數據庫原理及開發.北京:中國水利水電出版社,2005.
[2] 維克托·邁爾·舍恩伯格.大數據時代.浙江:浙江人民出版社,2012.
[3] 艾伯特-拉斯洛·巴拉巴西.爆發.北京:中國人民大學出版社,2012.
[4] 大數據時代下的大數據到底有多大?中國大數據,2014-03-6.
[5] 帶您了解大數據.中國大數據,2014-02-26.
陳勇(1994-),男,漢族,四川瀘州人,本科,西華大學,軟件工程專業。
G203
A
1671-1602(2016)24-0258-01