孟天天
21世紀是大數據時代,物聯網和云技術等高新科技的不斷發展推動著社會不斷向前。在大數據背景下,原有的數據統計和處理方法已經不能適應新時代的要求,統計學在大數據時代機遇與挑戰并存。本文就大數據時代統計學科所面臨的機遇和挑戰作出分析。
在以往的傳統統計學分析應用過程中,數據的數量和儲存大小受到計算機硬盤大小以及儲存方式的限制。而在新時代的機遇下,數據的儲存模式、計算機的硬盤大小以及數據的分析方式等都已被改變。通過云儲存、云計算和大數據技術等,可以對海量的數據進行快速便捷的統計與計算,更新了原本的統計學數據處理方式,大大提高了工作效率。
在大數據時代,數據的預處理已經深入影響人們的生活和工作。全球互聯的網絡使得世界范圍的數據獲取變得簡單快捷,查閱和利用方式也更加高效。傳統統計學的隨機抽樣方法,也可以通過對海量數據進行糾正、清洗和填補來降低誤差[1],數據的預處理使得數據的時效性發揮了最大作用。
在統計學中,支持樣本是應該包含所有數據的,而在大數據技術的運用中,可以利用嚴密的算法,根據數據的特征和科學性隨機抽取有代表性的數據,當需要被處理數據很多時,原本統計學的抽樣方式和方法就被大大簡化。
以往的統計學技術相對落后,面對大量數據時,復雜的運算步驟就很難進行,計算誤差較大。而在大數據時代,計算機技術和云計算等相關技術對統計學來說是一個跨越式的發展。可建立相關的計算機模型和對海量數據進行壓縮、轉換等,將數據處理動態化,使得數據的分析整合高效實用。
在以往的統計學領域,統計學的主要目的是對數據進行收集、整理和分析,得到最終需要的結果。而在大數據時代,信息技術的快速發展為統計學提供了各種技術及衍生功能,在對收集到的數據進行分析時,不局限于得到最終的數據,同時衍生出許多其他具有代表性的相關方面的數據,使得數據的利用性大大提升,同時擴大了統計學所能運用的領域。
在統計學中,樣本統計是非常重要的,樣本統計主要解決統計對象的特點和關系。在大數據時代下,相關的技術模糊了樣本之間的關聯性。并且,海量的數據來源廣泛,可以從多個方面進行驗證,因此要使得統計出來的結果更具說服力,就對當下的統計學學術研究提出了更高的要求。在傳統的統計學知識結構中,數據是結構化的,因此當統計學面臨著非結構化的數據時就難以展開[2],而大數據時代下的計算機技術恰恰可以彌補統計學這一缺點,統計學若無法及時順應時代的發展和大數據的處理要求,相關工作展開就很困難。
在大數據時代下,數據的處理主要是利用云計算技術和計算機技術。但是在計算機處理數據時,需要用到統計學相關的軟件,計算機軟件畢竟沒有人靈活,遇到軟件難以處理的問題時,可能軟件就無法有效處理結果或者處理的結果沒有代表性。大數據的相關技術飛速發展在相關領域產生了許多統計學軟件,但在利用不同的統計學軟件進行數據處理時,根據數據的不同要求仍然有許多的不足且社會的相關企業對統計學軟件的開發興趣不是很高。
時代的發展必然會對計學這一傳統學科提出更高的要求,對傳統的統計學方法來講,新時代下海量數據的出現,迫使統計學也當與時俱進的推陳出新,不斷進行優化和改善來滿足社會的發展需求。
統計學的創新不單單是相關技術的發展,更是科研思維、統計方法的不斷更新。在這個信息爆炸的時代,在對海量的數據進行統計分析時,應當根據所需數據的特點來有效地利用分析方法。因此,在原有的統計學領域,應當及時更新完善優秀的統計學理論體系,創新思維方法。相關單位必須對原有的統計學體系進行完善,以滿足時代的需求。
大數據時代,各種信息技術、互聯網技術和計算機技術的發展使得統計學所面臨的挑戰只是暫時的,沒有什么東西是一成不變的。在面對各種新奇的技術時,相關領域的工作人員要積極培養自己新的思維方法,及思維活躍化,積極提高相關業務水平,在原有的統計學原理體系上進行創新,支持統計學技術的發展。
在當今時代下,統計學科的應用性及應用范圍非常廣泛。為了滿足社會對統計學人才的需求,各高校和相關單位應當積極加強學科建設,加大對統計學科的資源投入和師資團隊建設,采取多樣化的教學方式,為社會和國家培養數據處理的實用性人才。
在大數據時代,統計學所面臨的機遇和挑戰接踵而來,但相關人員應當具備信心來迎接挑戰,積極利用機遇對統計學進行改革發展,只有充分利用新興技術對統計學進行創新,才能使統計學更好地適應時代的發展。