摘 要 “這是最好的時代,這是最壞的時代,”隨著信息時代的進步,近年來信息數據資源已經成為最寶貴的財富。我們正處在一個信息爆炸性增長的“大數據”時代的同時,數據的傳播速度也遠遠超出我們的控制范圍。大數據在政治、經濟、文化都產生著深遠影響,大數據時代也對我們提出了新的機遇和挑戰。
【關鍵詞】時代 大數據 影響 機遇 挑戰
二十一世紀是信息的時代,是數據的時代也是各種新興技術快速發展的時代。我們有幸生于這個偉大的時代,在享受著各種高新技術的同時,你是否有注意到其背后成千上萬的數據帶給我們的便利呢?自人類誕生之初數據就已經存在,而在幾千年以后的今天數據已經越來越廣泛的在生活中被運用和提及。清晨你被鬧鐘叫醒,每天鬧鐘都會根據你的睡眠質量切換不同的鈴聲,吃早飯時電視里智能推送的是你最喜愛的頻道,上班的路上常常擁堵而你也不用擔心因為導航通過分析路況為你制定了最佳路線,到達公司后電腦桌面上已經篩選好了一天需要完成的工作,下班后你去了超市為了了解貨物的信息,你掃了二維碼得知了食品的安全檢驗記錄和消費者對它的評價……有這些聽起來是不是很熟悉?因為這些場景都是我們今天生活中正在發生的。你無法回避也不得不接受的現實,我們每個人都已經不知不覺地卷入了這個“大數據”時代。
1 什么是大數據下的數據認知
“大數據”就是一種流量、存儲量超級大(以TB計算)數據。谷歌地圖街景(圖片)是大數據,每一個微博用戶在微博上產生的全部內容合起來作為一個整體是一種大數據,淘寶店主和每一位淘寶用戶在淘寶這個平臺上產生的所有信息作為一個整體是一種大數據,國內最大的搜索引擎百度里面所有的無數條的類目信息合起來也是一種大數據,這些都是互聯網企業普遍存在的大數據。根據來源的不同大數據大致可分為如下幾類:
1.1 來自于人
人們在互聯網活動以及使用移動互聯網過程中所產生的各類數據,包括文字、圖片、視頻等信息。
1.2 來自機
各類計算機信息系統產生的數據,以文件、數據庫、多媒體等形式存在,也包括審計、日志等自動生成的信息。
1.3 來自于物
各類數字設備所采集的數據。如攝像頭產生的數字信號、醫療物聯網中產生的人的各項特征值、天文望遠鏡所產生的大量數據等。但是相同之處在于大數據具有遠遠超過傳統數據庫存儲及處理的能力,此處之“大”并不是空泛的單指數據容量之大,大數據下對于傳輸速度,數據的復雜程度以及數據的多樣性同樣要求很高。
2 新認知的特性
2.1 海量數據
在這個日新月異的時代,數據的更新正以驚人的速度翻倍增長,大數據也因此應運而生。大數據也擁有多種信息產生渠道,例如:智慧化的三大體系結構——互聯網、物聯網、云計算等。
2.2 數據的多樣性
多樣性作為大數據的結構特征,包括結構化數據和非結構化數據。
2.3 數據的高速處理
大數據通過高處理技術分析處理龐大的數據包,通過快速地檢索、計算、交互來創建實時數據。
2.4 數據價值的稀疏性
我們通過對已經獲得數據的分析處理得到隱藏的潛在信息,才能產生價值。而數據價值的多元化使其內在價值通過多種多樣的產品以及服務得到具體化體現。
大數據最大的特征就是數據量大。因為數據量大,所以才能商業特別是互聯網企業帶來不可估量的現時或潛在的價值,如果百度里面的數據量不夠大,可供網民搜索的類目和條目不夠多,那它毫無可能成為網民的“移動的百科全書”。
3 兩種數據認知差別
現如今大數據理論還是個新興概念,對于它的討論仍處于百家爭鳴的階段,各大學者對于它也是各執一詞。大數據究竟與傳統數據有哪些不同?首先大數據通常是由非人為的自發生成的,不會受到人為的參與或者干擾,一架波音737客機上搭載的傳感器即使沒有人為的操作或者指令也能實時記錄著飛行過程中的各項數據。而傳統數據或多或少都會有人參與到新數據的生成流程中,其次大數據的數據量和分析手段與傳統數據也是大相徑庭,舉個例子在傳統數據處理中對一個學生9年義務教育中可被提取分析再進行量化的數據不足10kb,而其中包含了學生的戶口信息,9年里的學習成績,歷年的獎懲記錄,醫療保險信息,身高體重,興趣愛好等等。
4 大數據對我們生活的影響
這是一個美好而又糟糕的信息化時代,信息化讓我們的生活更加簡便,而龐大的信息量有時又會讓我們無從選擇。攜程旅游APP作為數據搜索一個較為成功的案例,其利用數據分析,瞄準商機,通過精確的數據分析得出每年散客訂房的比例占總比例的95%左右,從而發現電子商務的巨大提升空間,從最初的機票代理業務發展到如今的酒店、票務、度假預訂。相對比而言12306就顯現出其滯后性,不僅搜索方面有待改進也不存在所謂的反饋機制,整個平臺軟件的編寫也較為落后,在購買車票時我們可能要給出無數次大量點擊。
5 人們應該如何面對大數據時代
大數據的前景無疑是光明的,各類依托大數據而發展的行業也呈現出欣欣向榮的態勢。誠然大數據無時無刻不在改變著我們的生活,但它仍然暴露出許多問題,在一方面大數據時代中不可避免的會出現隱私泄露的問題,不只限于個人的隱私泄漏,還在于基于大數據對人們狀態和行為的預測。目前用戶數據的收集、管理和使用缺乏適當的監管,數據的正確使用主要依靠企業自律。在另一方面偽造和刻意制造數據的現象依然存在,而錯誤的數據往往會導致錯誤的預測。而且不可避免的是數據在傳播中的逐步失去準確性。大數據是一把雙刃劍它所帶來新的契機的背后也暴露出許多安全問題,令人可惜的針對用戶隱私泄露法律至今仍不健全。
未來十年,決定中國是不是有大智慧的核心意義標準,就是國民幸福。一體現在民生上,通過大數據讓有意義的事變得澄明,看我們在人與人關系上,做得是否比以前更有意義;二體現在生態上,通過大數據讓有意義的事變得澄明,看我們在天與人關系上,做得是否比以前更有意義。總之,讓我們從前10年的意義混沌時代,進入未來10年意義澄明時代。
參考文獻
[1]李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域[J].中國科學院院刊,2012,27(06):647-657.
[2]劉洋.層次混合存儲系統中緩存和預取技術研究[D].武漢:華中科技大學,2013.
[3]李懷陽.進化存儲系統數據組織模式研究[D].武漢:華中科技大學,2006.
[4]羅東健.大規模存儲系統高可靠性關鍵技術研究[D].武漢:華中科技大學,2011.
作者簡介
殷悅(1995-),女,江蘇省揚州市人。在讀本科學生。研究方向為控制工程、SQL、電力電子技術及電力系統。
鄭鈞文(1995-),男,江蘇省蘇州市人。在讀本科學生,研究方向為電氣工程及其自動化。
作者單位
徐州工程學院信電學院電氣工程及其自動化系 江蘇省徐州市 221000