陳霄健
摘要:本文簡單闡述了大數據的內涵、特點以及對人們思維上的轉變。以氣象數據分析為例,從大數據在氣象數據中的數據采集、存儲、分析幾個方向,具體分析和探討了在大數據時代下的數據分析。
關鍵詞:大數據時代;數據;分析
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)05-0246-01
在大數據的概念中,數據的分析主要分成兩個方面。一方面,是數據處理中,重點在于數據的采集、存儲、處理。另一方面,是對數據進行深入的發掘。尤其是在氣象領域中,應用大數據的方式可以有效的提高氣象數據的分析能力。
1 大數據的概念
1.1 大數據的內涵
在對大數據進行定義中指出,大數據就是用現代信息化技術對信息以數據的形式進行收集、整理、分析、處理并能夠存儲的數據集。在對大數據理解的過程中,推演出大數據的四個明顯特征。分別是:數據量龐大、數據種類多、數據處理速度快、數據價值密度較低。因此在大數據的內容中,其核心并不在于大,而是透過對規模龐大的數據進行分析處理,形成一種新型的信息處理思維,對數據中隱藏的信息、現象等進行綜合性的分析、管理,進而對現實中各個行業的生產、經營、管理、服務等進行創新。因此,在大數據的概念中,是對于大量數據信息、大量處理分析方式、大量數據的使用思維這三者的整合統一[1]。
對于大數據而言,傳統數據在規模上是無法與其相比的,首先在基數的規模上大數據就要比傳統數據高出一個層次,傳統數據是有限的,而大數據的數據基礎是趨于無限的。其次,由于基數的不同,也就使得在不同的數據中,有效數據的種類與數量二者也不相同,在大數據中,有效信息的數量更大、種類更多、涉及范圍更廣。再次,由于大數據在基數上的差別,也使得在大數據分析中,得出的結果更具備不確定性,只有更具當前所得出的數據結果才能推斷出下一次數據分析時可能會得出哪種數據結果。
1.2 大數據的思維轉變
大數據時代的到來給人們從生活以及生產工作上造成了巨大的影響,對人們的思維模式也有著重要的轉變。首先,在對事物進行分析的過程中,人們已經不再是通過簡單少量的樣本進行實驗分析,而是更加注重了事物整體上的特征,即是關注總量大于關注樣本。其次,通過對大量數據進行分析,人們已經接受對于數據多而雜亂的形式,不再著眼于數據信息的準確性,對于數據中的誤差有一定的適應性。再次,對于事物的內容更加重視,而不再只是關注事物的因果聯系,即是指在進行數據分析中,更需要明確“是什么”而并非“為什么”[2]。
2 以氣象數據采集為例——大數據在數據分析上的應用
在大數據的基礎上,應當對氣象部門的傳統數據處理方式進行有效的改革,使得氣象部門的工作能夠適應當前大數據技術的發展需求。
2.1 氣象數據的采集技術
在氣象數據的采集上,傳統數據的采集能力已經無法滿足當前社會對于氣象信息的準確程度,而數據的采集數量也處于不斷上升的趨勢。然而,單純的數據量的增長還不足以形成真正的大數據。因此,在氣象領域中進行大數據的采集就需要進行形成客觀性強、自主性高、單體的信息成本低、實時性強、數據規模大、數據準確度低、有一定間接性等特點。于2011年止,我國一共建立了600個氣象研究項目,其中氣象信息的數據量已經高達117TB,在線可共享信息達到50TB占總數據的43%。
2.2 氣象數據的存儲技術
在大數據發展的過程中,主要存在兩個問題。首先是大數據的存儲問題,由于信息數量的龐大,各個省級的氣象部門在大數據的存儲過程中已經達到了PB級的標準。其次是對存儲數據進行讀取的速度問題,在大數據的分析處理中,需要對氣象數據實現1s輸出結果還存在著一定的難度,而這兩的問題有會互相矛盾,因為在大數據中,數據的數量越大,進行信息讀取的速度也就會越慢。因此在解決這個矛盾的關鍵所在其實并不是增加存儲能力,而是在于優化大數據的系統結構以及數據計算的方式上。
2.3 氣象數據的分析技術
對于氣象數據進行分析在大數據的概念下會有著新的技術,在大數據的分析中,其關鍵的一點就在于對未來事物發展的預判,而大數據的分析能夠推測未來的核心就在于對事物關系的分析。因此在大數據的應用中,更加注重的是與氣象數據看似無關的數據分析,在這些數據量極大的信息中,不斷發掘有價值的信息。所以在當前的氣象部門中進行大數據的氣象分析就需要從其他的方面進行全面的分析。
3 結語
總之,對于大數據在數據分析上有著多種方式的應用,從氣象數據的角度出發,大數據可以實現從氣象數據的采集、存儲、分析等各個環節進行全面型的應用,在大數據時代的背景下,對與人們日常生活以及生產工作,大數據都會起到巨大的變革。
參考文獻
[1]李社宏.大數據時代氣象數據分析應用的新趨勢[J].陜西氣象,2014(02):41-44.
[2]張航.芻議大數據時代下的數據分析理念[J].商,2015(26):196-197.endprint