鄧施明
摘 要:在信息化時代的背景下,信息數據在獲取和處理上面都產生了巨大的進步,這在一定程度上也推動了統計學的發展,并且促使統計學方法在各個領域范圍內都有廣泛應用。通過探討統計學方法的發展趨勢以及統計學方法在大數據中的具體應用,對于未來的統計學研究發展方向具有重要意義。因此,本文也將圍繞統計學方法的發展歷程展開論述,并在此基礎上探討和研究統計學方法在大數據中的應用,希望通過本文分析,能為相關研究人員提供可供參考的價值。
關鍵詞:統計學方法;大數據;發展及應用
前 言
統計實踐活動最初只是方便人們計數和描述,隨著經濟的發展以及科學技術的進步,統計學方法也在不斷發展壯大,作用也不僅僅是用來計數和描述,涉及的范圍更加豐富多樣。并且,經過相關專家的深入研究和分析討論,統計學方法也得以完善和改進,更好地發揮其本身的價值。由此可見,在當前大數據時代背景下,深入研究統計學的發展史以及實際應用,對于未來統計學的發展有著至關重要的作用。
一、統計學方法的發展概述
(一)概率論是統計學發展的基石
概率論是數學家通過解答賭博中的大量問題而誕生出來的一門學科,這門學科使得概率計算從最初的簡單計數進入到較為精細的階段。早期概率論與統計學的關系還沒有十分密切,隨著數學理論的完善,概率論才有了更為嚴謹的數學基礎,加深了與統計學的交集。而大數定律的提出,為統計方法和理論提供了基礎,隨后又提出了中心極限定理,這也是概率論研究的中心,這個定理是數理統計學中大樣本方法的基礎。之后誕生的隨機過程,將隨機變量從靜態轉到動態,極大地拓寬了概率論的應用及研究范圍。
(二)數理統計是統計學與實踐結合的開始
數理統計也就是逆概率,是指用結果推原因,為了研究統計推斷問題,各個統計學專家由此產生了兩個體系,分別是頻率學派和貝葉斯學派。在某些特定情況下,貝葉斯學派的方法會比較方便,而在一些非參模型下,則是頻率學派的方法更為便捷,兩者是相互補充的關系。由此來看,數理統計是統計學與實踐結合的開始,是統計學發展歷程中非常重要的環節,同時也為未來的統計學預測、控制等功能奠定了基礎。
(三)回歸分析的提出與發展
回歸分析是生物學家將理論與實踐相結合的成果,對于統計學的發展具有重要意義。高爾頓運用統計學方法研究遺傳學,并從中發現了非常重要的統計學方法與理論。這些理論對于實際生活都有非常大的促進作用,通過運用回歸分析,探索數據之間的相互關系,能對生產生活中的事物進行預測和判斷,促進相關工作的有效開展。由此可見,回歸分析的提出使得統計學的內容和應用范圍更加廣泛。
(四)多元統計分析的提出與發展
多元統計分析的方法對于統計學的發展也具有重要作用,其主要應用在多個對象和多個指標的情況下。多元統計分析包含的內容非常多,比如聚類分析、因子分析以及多元回歸分析等等。隨著科技的不斷進步,多元統計分析的方法也越來越受到重視,被廣泛地應用到各個學科和生產當中。并且,在信息化時代的背景下,多元統計分析還能與數據庫技術相結合,使得海量數據的處理效率大大提升。
二、統計學方法在大數據中的應用
(一)“大數定律”在大數據分析中的應用
隨著信息技術與互聯技術的普及,互聯網平臺的交易活動也越來越頻繁,這就使得海量的數據信息被生產出來。有調查發現,就某個單一品種的商品而言,其每秒所產生的數據就有12個,按照這樣的速度下去,則1個小時就能產生43200個有效數據信息,如果沒有統計學思想的指導,僅僅依靠大數據分析,則會降低數據分析效果。而將“大數定律”的統計學方法運用到大數據分析當中,就能很好地提升工作效率,并且還可以避免不必要的資源浪費。比如,將該定律中的“收斂值”運用到大數據分析中,就能讓相關人員有一個明確的分析目標,排除一些干擾選項,使得分析人員用較短的時間就能分析出其中的規律,極大地提高了工作效率。此外,利用“大數定律”還可以實現事物未來發展狀況的預測。
(二)多元統計分析在大數據分析中的應用
多元統計分析方法在大數據中的應用主要包括兩方面:主成分分析和聚類。主成分分析方法是將多個指標轉為幾個綜合指標,這在大數據分析中通常被當作是一種降維方法。在大數據背景下,相關技術人員在海量數據的處理過程中,由于變量個數過多,會嚴重影響和干擾模型的運行效率,而運用主成分分析方法,能有效減少變量的個數,并且還能避免數據信息的遺漏,得到更多的信息。這種方法適用于處理海量數據的情況,不僅能減輕工作量,將數據化繁為簡,并且還能減少模型的運算消耗。其次是聚類,這種方法正處于發展階段,其主要表現形式就是將一些沒有標記的變量進行分類,有不同的分類方法。在大數據分析中,運用聚類方法,能將大量未知標注的數據集進行分類處理,既能區分類別內的數據信息,也能區別不同類別的數據信息,極大地提高了工作效率,對于數據的預處理發揮了至關重要的作用。
(三)概率論在大數據分析中的應用
在大數據時代,數據對于經濟的作用是非常巨大的,尤其是對于經濟數據的分析,能有效促進社會經濟的發展。經濟數據通常是以低密度形式存在的,在進行數據分析時難度較大,而運用概率論與數理統計的方法,能有效提升數據分析效率。比如,利用正態分布概率來分析經濟數據,能夠有效預測連續性隨機變量的概率,并對相關信息進行快速高效的分析,同時還能根據最終的分析結果掌握市場經濟的發展狀況,幫助人們更快地了解市場經濟規律,并且從中獲取的信息還能幫助后續的計劃進行合理的調整。
結束語
綜上所述,有數據的地方就會有統計學,隨著科學技術的發展,統計學與大數據的有效結合必然是順應時代發展的方向,不僅能促使統計學的應用范圍更加廣泛,同時也能產生新的大數據算法,促進大數據分析的進一步發展。因此,在當前時代背景下,應當積極鼓勵統計學方法的研究,并且促進統計學方法與大數據分析的有效結合。這樣才能促使統計學方法的進一步發展,為社會貢獻其最大的效用和潛力。
參考文獻
[1] 游士兵,徐小婷.統計學方法的發展及其在大數據中的應用[J].統計與決策,2020,36(04):31-35.
[2] 王路,王茜茜.大數據及互聯網時代統計學課程教學改革新思路及新方法[J].高教學刊,2019(10):130-132.
[3] 吳東武,王潤良.大數據背景下統計學教學方法研究[J].高教學刊,2017(15):76-78.