李宏偉
摘 要:隨著大數據時代的到來,大數據技術對社會各行各業的發展都產生了一定的影響,傳統統計學已經難以適應社會發展的需求,呈現出轉型發展態勢。本文對大數據時代傳統統計學的轉型發展進行分析,希望能夠為新時期統計學的發展形成客觀認識。
關鍵詞:大數據時代 傳統統計學 轉型發展
中圖分類號:C82 文獻標識碼:A 文章編號:1003-9082(2018)03-0-01
統計學主要是對社會上所有領域中涉及到的數據信息進行統計、分析、篩選和研究的工作,新時期在大數據時代的影響下,統計學工作向社會的各行各業延伸,對社會的建設和發展產生了一定的影響。同時,借助大數據技術的支持,統計學發展過程中能夠更為準確的獲取和分析數據信息,為企業提供有效的信息支持,確保企業可以更為高效精準的完成相關工作,大數據時代統計學工作的重要性日漸突顯出來。
一、大數據時代下傳統統計學的轉型
大數據時代的到來給傳統統計學的發展造成了巨大的沖擊,促使傳統統計學在當前社會背景下呈現出全新的變化,因此在研究中,應該聯系大數據時代的影響,對傳統統計學的轉型發展情況進行系統的分析。
其一,樣本概念進一步深化。受到大數據技術的影響,統計學的概念不再簡單,在靜態數據方面樣本等同于數據的整體,因此不需要提取樣本或是對樣本的可用性進行檢測,能夠實現對成本的控制,提高數據的準確性[1]。而對于動態數據,數據隨著時間的變化發生動態的變化,在統計中需要將分析的對象作為樣本,主要指在統計中所選定的、與分析數據存在緊密聯系的數據。
其二,數據類型得到了適當的拓展。傳統統計學中的數據主要是結構化的數據,而大數據時代,統計學中的數據在結構化數據的基礎上還增加了非結構化數據和半結構化數據以及存在一定特殊性的異構數據,所有的數據都能夠作為記錄信息和存儲信息的信號,在實際統計應用時表現出明顯的多樣化特征。
其三,收集概念不斷擴展。傳統統計學統計工作中需要按照統計目的對數據進行有針對性的收集和分析,統計效率低,并且會產生較大的成本消耗。而受到大數據技術的影響,統計工作中對數據的收集細化為三個部分,即數據預處理、數據分析和數據存儲工作,可以針對所需數據進行有針對性的搜集和處理。但是需要注意的是,大數據時代數據收集工作也面臨著成本高和安全性不足的問題[2]。
其四,數據來源發生變化。傳統統計學工作中數據來源往往具有一致性的特征,便于事后核對數據。但是大數據時代卻難以對數據來源進行有效的追溯,并且對數據記錄者身份的識別也存在一定的困難,因此數據時代統計學工作中更為關注對數據來源第二軌的打造。
其五,量化方式進行了調整。傳統統計學中針對結構化的數據已經能夠實現成熟的數據量化處理,并且數據結果可以直接得出。而在大數據時代,對數據進行量化處理的難度增加,并且無法直接從非結構化的數據中得出結論,要求統計人員從統計角度對非結構化數據進行處理。可見,大數據時代統計學量化方式的變化相對較為明顯。
其六,統計軟件的廣泛應用。傳統統計學在對數據進行處理時往往將統計模型和軟件作為基礎,能夠建構數據之間的數量關系,保證統計分析結果的客觀性。而大數據時代統計分析技術呈現出非關系性的特征,在數據分析時需要將數據中心作為基礎,對統計軟件進行廣泛應用簡化統計分析的過程,提高統計分析的效率。
研究發現,大數據時代對統計學工作產生了極大的影響,傳統統計學發展過程中樣本的定義到數據的分析都呈現出轉型發展態勢,在統計學研究中,數據分析的主動權更為明顯,對我國統計學工作的全面發展也產生著相應的積極影響。
二、大數據時代統計學深化發展的建議
在對大數據時代統計學轉型發展情況形成初步認識的基礎上,要想保證統計學轉型發展取得理想的效果,還應該結合大數據時代的特點對統計學工作進行適當的調整,突出統計學工作的時代性,確保統計學發展取得理想的發展成效。下面本文就針對大數據時代統計學轉型方面的幾個點對統計學深化發展提出幾點建議,希望可以支持大數據時代統計學的高效穩定發展。
1.對統計學中總體、個體和樣本的定義方式進行完善
基于大數據時代統計學樣本定義的轉型,要想保證樣本定義的科學性,就應該對總體、個體和樣本的定義方式進行完善[3]。應該明確認識到,在大數據時代的統計分析中要先有數據,后形成總體,并且數據個體存在不確定性特征,難以依靠數據庫單位對數據個體進行有效的識別和編制,因此結合大數據時代數據分析的特殊性,需要借助總體孔徑完成對個體身份的識別,轉變傳統統計學意義上的總體和個體的定義方式,在確保總體和個體定義科學性的基礎上,選擇任意一個截面確定截面樣本,展開深入的統計和分析工作。
2.調整抽樣調查功能,對應用空間進行拓展
傳統統計學中數據收集的主要方式就是抽樣調查,但是抽樣調查的數據畢竟不夠全面,難以將數據的總體特征全面的反映出來。因此基于大數據時代統計工作的便利性,可以對抽樣調查功能進行適當的調整,將數據整體智能化分析和抽樣調查進行有機結合,將權威性的抽樣調查結果作為對大數據分析結果的驗證依據和對照基礎,實現大數據統計分析和抽樣調查的優勢互補,確保統計學數據收集的客觀性和可靠性。
3.創新數據梳理和分類方式,提高數據處理效果
傳統統計學研究工作中往往按照事先確定的方法對數據進行有效的分類和梳理,數據分析呈現出結構化的特征,并且數據分類和梳理是數據預處理的主要手段。而進入到大數據時代,可以對數據梳理和分類方式進行改革創新,在摒棄傳統數據梳理和分類預處理方法的基礎上,采用與大數據時代信息處理方式相適應的方法進行簡單的處理,并將工作中心放置到后期,結合數據本身特征對數據進行補充和完善,增強數據信息的系統性,切實保證數據處理工作的實際效果。
結語
綜上所述,在大數據時代的影響下,我國傳統統計學研究工作發生了極大的變化,統計學的方方面面都做出了適當的調整,確保統計工作能夠與大數據時代的發展需求相適應。因此大數據時代對統計學進行研究的過程中,應該重點把握統計學的轉型發展,在明確其轉型發展方向的基礎上探索相應的應對措施,為統計學工作的全面優化提供相應的支持和保障。
參考文獻
[1]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,33(2):3-9.
[2]田茂再.大數據時代統計學重構研究中的幾個熱點問題[J].統計研究,2015,32(5):3-12.
[3]周茂袁.大數據時代統計學專業教學改革的初步探索[J].教育教學論壇,2015(35):105-106.