文/曾慶沛
大數據時代對傳統統計學的變革研究
文/曾慶沛
柳南區統計局
隨著大數據時代的不斷發展,我國傳統的統計學得到了有效的改善,促使統計效率得到了提升,本文主要針對大數據時代下對傳統統計學的變革進行深入的研究,促進我國統計學更好發展。
大數據時代;傳統統計學;變革研究
傳統統計學在大數據時代的背景之下得到了發展,而且從整體的含義上來講,大數據時代改變了統計學的方式,不僅給統計學帶來了新的挑戰還促進了統計學的發展。
相對于傳統的統計學,樣本的選擇只能夠進行手工選取,但是隨著現如今大數據時代的不斷發展,樣本的形式也發生了較大的變化,那么相對于樣本的概念也應該隨著時代的進步進行改變,由于網絡數據的不斷擴大,可以把網絡數據劃分成為兩個方面:第一為靜態數據,所謂靜態數據就是指當客戶進行查看數據的時候就已經生成好了,中間是沒有和服務器相互交換的數據,通過客戶端的使用就已經構建完事了,我們稱之為數據的總體,不僅有效的減少了成本,還使總體本身對總體的反映更加精準;第二就是動態數據,也就是說數據隨著時間的變換而變換,但是由于時間方面等影響因素進行變化這就促使了在統計過程當中存在著一定的誤差,但是動態數據對于整體事件的分析是最準確的。
在傳統的統計學當中,對于數據的收集是需要和統計分析的目的一同進行的,在收集的過程當中還包含設計調查方案、嚴格控制調查流程等,所以期間是存在著低效率、高成本的缺點。那么隨著大數據時代的不斷發展,把對于數據的收集大概劃分成為三步,第一是數據預處理、第二是識別和整理、最后的是數據的分析,其中的主要目標就是為了提取出有價值的信息;在把有價值的信息進行數據存儲,那么隨著數據的不斷擴大,同時在存儲能力、分析能力、甄別數據真偽以及確定分析節點等各個方面上,都需要進行深入的分析和研究。
數據的量化是在傳統統計學當中最為常見的方法,而且數據結構也過于簡單,隨著現如今大數據時代的不斷發展,現在已經有很多的數據都呈現著多樣化的特點,而量化方式的變化也是很難進行查詢了,假設在這個時候只是借助于單一的方法是很難得到最終結果的。根據當前我國大數據時代下數據統計并沒有達到統一的階段,還需要依照量的變化進行技術結構上的分析,相對于傳統的統計學標準就是根據大數據的特點在進行分析數據的特點。
相對于傳統的統計學主要是依照所要研究的對象和目的進行收集數據,而且所收集到的數據大部分都是屬于已知數據,很容易的就能夠和客戶的身份進行識別和根據事件進行核對,盡管是所收集到的信息具有較強的目的性,但是內容和數量都是屬于較為閑散的,很難從中識別記錄者的身份。那么在大數據時代下的統計學,則是需要進行創造出新式的統計數據,并在數據當中有明顯的作用性。
根據當前的統計質量情況來看,我國在國際數據標準SDDS中制定了兩條規定作為主要評估統計數據質量的基本標準,那么根據以上兩條規定則是歸納出了三個原則:“適用性、準確性、時效性”,以著三點要求進行統計質量內涵。
2.1.1適用性:所謂適用性就是指能夠把用戶的需求作為收集統計信息的標準,以此來保證所收集到的統計信息適用性較強,能滿足于客戶的需求,隨著大數據的廣泛發展,能在一定程度上滿足于適用性的原則。
2.1.2時效性:時效性就是指能夠從統計調查的全方面進行縮短時間,而且還能夠及時的掌握了解和使用統計信息,能在規定的時間內進行發布,并構建規范的發布制度,傳統的統計數據形式具有著滯后性和低頻率等不足之處,但是隨著大數據時代的發展,有效展現出了及時性和時效性的特點。
統計成本就是指把一項統計調查或者是進行開展的統計工作所實際付出的代價,那么在統計的過程當中是會消耗大量的人力、財力、物力等。隨著大數據時代的發展,數據的主要獲取方式就是通過信息網絡、移動通信等形式,所以在大數據的背景之下統計成本產生了大幅度的下降,不僅擴大了統計數據的規模還促使數據更加的精準,相對于傳統的統計效果,大數據時代下的統計學更加方便快捷。
相對于傳統的統計學方法,有很多的行業和部門都被遭受到了成本、觀念等原因的影響,那么現階段的行業和部門制定主要是進行完善政策服務,在大數據時代的背景之下,統計學不僅能夠應用于統計領域還能把統計的原理和方法運用在其他區域,以此來得到更大的發展,例如可以在金融、醫學以及計算機等形式上來發揮出自身的價值特點。將以計算機為例子進行數據分析,那么計算機就好比數學一樣,數學當中運用統計學是為了能夠加深學生在理論知識上的基礎,而在計算機當中運用統計分析則是能快速的解決計算機當中較為復雜的數據處理等問題。
綜上所述,在大數據時代下進行轉變傳統的統計學,能夠有效的從傳統樣本認識當中進行改變不規范的地方,總結大數據時代的優點找出更多的數據統計方法,在大數據時代下的統計學,不僅能夠加強結構化數據和非結構化數據之間的關系,還能夠促使大數據時代下的數據統計具有合理性和高效性。
[1]劉旭. 探析大數據時代對傳統統計學變革的思考[J]. 才智, 2016(35).
[2]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,33(2):3-9.