張世文
摘要:新興科學技術的發展帶領我們進入數據大時代的環境中,大數據如“一口新興石油”,一定會引領科技和經濟的大發展。我們了解大數據需要一定的時間,大數據的研究對于我們有非常重要的意義,可能會激發出一個新興的產業,我們應該將大數據的研究上升為國家的呼聲和意志,以舉國之力來研究它,發展它。本文就從大數據時代統計學重構的價值和意義出發,談一談在大數據時代統計學重構研究中的幾個熱點問題。
關鍵詞:大數據;統計學;重構研究
中圖分類號:C81 文獻識別碼:A 文章編號:1001-828X(2017)015-00-01
引言
進入21世紀以來,科學技術尤其是互聯網和計算機技術的迅猛發展,促使大數據時代快速到來,大數據是堪比黃金石油的致富新思路,會給社會方方面面帶來很深遠的影響和變化,在生活中,農業工業等很多領域都會運用到統計學,統計學之于現代社會有著較為重要的意義,因此,在這種情況下,對大數據時代背景下統計學重構進行研究是非常必要也是非常重要的。
一、大數據時代統計學重構的價值與意義
1.是前沿科研領域
伴隨著科學技術的發展,大數據時代科研的進步會帶來很多領域的發展和超多超復雜的數據,面對這樣的挑戰,我們應該不斷增強自身獲取信息的能力,就統計學而言,這門學科應該具有分析這些龐大數據的能力,并且通過分析能夠研發出合理的分析工具以及相應的分析研究理論,來通過科學的理論解決一些更為前沿、復雜的現實問題[1]。顯而易見,當前很多造詣深厚的學者都將研究領域轉向了數據分析上來。
2.是交叉科研領域
統計學是一個與眾多學科都有交叉的一個學科,比如與數學有交叉關系,與經驗科學如天文學中假設估計參數有關系。在現代社會,統計學的使用已經不止局限在政府或者國家事務中使用,而將應用領域延伸到了商業、社會科學以及自然科學中來,由于統計學具有廣泛的應用性和深厚的歷史,因此,它不只是與數學有親密的關系,更是與數學本身的哲學有著親密的聯系。伴隨著領域的增多和數據的復雜程度的加重,統計學家一直進行著跨領域、跨學科的研究,隨著研究數據的不斷增多,所研究的領域也在不斷拓寬,統計學家面臨著越來越多的機遇,統計學的發展也面臨著越來越多的機遇,同時,統計學的發展也推動著很多前沿科學的發展。
3.具有非常重大的意義
我們可以在進行統計學研究時形成一套完整的統計學研究理論和方法,推動大數據時代多元復雜數據分析朝著國際化方向發展;可以將數據化研究理論成果運用到經濟和社會發展中去,比如可以運用在金融風險管理與控制上;還有很多金融領域的人運用大數據分析可以挖掘出市場信息,據此判斷市場走勢,會獲得高收益,這些都是大數據時代中統計學在發揮作用[2]。
4.搶占制高點
國外很多研究表明,大數據時代統計學工程需要從各個領域挖掘有用的信息,并將這些信息融合,提取出有用的因素,發展相應的研究理論。目前,已經有很多研究結果表明,現如今的大數據研究方法和理論已經相對成熟,我們應該牢牢把握住這次機會,不畏挑戰,迎難而上,盡快研究出具有獨立知識產權、具有創新性的數據分析理論和軟件,為我國的數據分析發展提供動力。
二、大數據時代統計學重構的熱點問題研究
1.大數據統計學的理論和方法
過去的統計主要將重心放在概率分布的指數族方面,在上世紀70年代以來,指數族分布研究及其在高維貝葉斯和像圖模型的應用中的研究居多,我們知道,由于指數族包括了所有已知概率的分布,因此,指數組的應用十分廣泛,它是統計學的核心,并且在概率論方面的作用也在不斷加強。這一研究方向旨在運用指數族來對龐大的數據進行初步的簡化,利用Bootstrap方法對大多數統計和概率方面的貝葉斯數據進行應用[3]。
2.大數據數據建模
隨著大數據的不斷變化和發展,線上算法被研究出來,大數據的形式多種多樣,因為多樣化的應用、龐大的數據和針對大數據所開發的技術,這項研究會產生深遠廣泛的影響。該研究的方向是將數據建模相應的領域進行推廣,將這些數據能夠統一運用在大數據中,運用理論和公式對實際應用進行輔助。
3.并行迭代蒙特卡羅方法
日常生活和科學研究與計算機技術的結合讓大數據的收集不再是幻想,要想分析這些數據,要運用并行和分布結構。并行和分布結構是擁有存儲和處理大數據功能的,但是目前的技術還不能將現代的統計算法應用到大數據中去,并且在日益增多的數據中,我們需要更加復雜的結構和模型來進行解釋。盡管迭代蒙特卡羅方法已經被相關研究證明是非常強大的,但是它仍然不能夠用于大數據的分析,該研究旨在將迭代蒙特卡羅方法融入到一個通用理論中去發展,另其適應大數據的發展環境,并且讓其也能夠適用并行和分布結構,即從并列的樣本中算出蒙特卡羅值,一這個數值來近似最初需要的數據量,這個理論能夠有效避免在算法迭代中的重復掃描數據問題,與此同時,這一算法的應用也可以另數據研究中的問題得出具有統計學意義的解[4]。
三、結語
大數據時代下統計質量得到提高,統計成本降低,統計學發揮作用的領域增多,并且讓統計學能夠發展延伸,提高了統計學的地位,面對統計學發展過程中可能遇見的問題,要通過大數據的時代背景,順應當今的發展潮流,不斷進行思維和技術上的進步與提升。
參考文獻:
[1]大數據時代統計學的重構與創新——首屆“大數據與應用統計國際會議”述評[J].統計研究,2015,2(10):3-9.
[2]田茂再.大數據時代統計學重構研究中的幾個熱點問題[J].統計研究,2015,5(1):3-12.
[3]王燕,李彥.大數據時代下的統計學重構研究[J].中國林業經濟,2016,3(4):48-49.
[4]王愛慧.大數據時代下統計學的重構與創新[J].經營管理者,2017,3(3):245.