●楊瀟偉
隨著全面4G 通訊的成熟與5G 通訊的普及化開展,我們的生活已經不知不覺地依附于互聯網了,生活習慣也因為互聯網發生了巨大改變,而每當我們在互聯網上留下一個足跡,就會以數據的形式保存在互聯網上,并最終被收集分析,收集的數據的總稱就是大數據,而分析則一般由統計學完成。沒有被分析的數據是無用的,沒有數據也無法進行統計學分析,因此統計學和大數據的關系是相依相村的。統計學是基于數據的基礎上進行的對數據的采集、整理與分析處理的一門學科,其核心就是對數據進行分析處理,而隨著大數據的逐漸成熟,大數據對傳統的統計學教育也產生了巨大影響。
在互聯網大數據出現前,傳統統計學的數據采集是非常被動的。傳統的統計數據采集一般是根據各種報表、統計年鑒等書面資料進行的人工采集,其數據來源存在著不穩定性,數據可靠程度一般。舉個簡單例子,某產品需要對自身產品購買人群的年齡進行統計時,一般需要對消費者進行以問卷調查的形式采集消費者的年齡數據,但是部分消費者并不愿意提供自己的真實信息,或者提供虛假的個人身份信息,給數據采集工作帶來諸多不便,對統計結果的影響也比較明顯。而在大數據的數據采集上,數據采集變得客觀主動,能動性非常高。當消費者在網上購物時,我們就能夠根據消費者留存的賬號信息,收集到患者年齡、收入、愛好范圍等一系列數據信息,非常方便快捷并且具有較高的準確性①。
在大數據出現前,當我們對某項數據的具體信息有需求,需要進行分析時,才會主動地發起對這項數據的調查,并人工進行數據收集,由于人工數據采集消耗的時間資源、人力資源和物資資源較大,因此數據的采集量一般不會太大,收集的數據類型也比較具有針對性。而互聯網大數據的數據收集一般是建立在網民在互聯上留存的信息以及網民在互聯網上的瀏覽操作記錄進行的數據分析,這就像對我們的出生信息、生活方式與攝入信息進行全方位的數據采集,比人工進行的具有較高局限性的數據采集有更高的數據價值,主要體現在數據類型上的全面與精準。
我們說對某一項數據進行統計分析時,收集的數據越多,對這項數據的統計分析得出的結果也就更精準,而人工采集的數據一般由于人力資源與物力資源有限導致采集數量也十分有限,而大數據的數據采集一般由電腦AI 完成,只需要人工設定數據收集的程序即可,這種數據收集具有持續性、全面性,能夠對全部網民進行數據收集,收集的數據量十分龐大,統計分析的結果也更精確一些②。
大數據的出現對傳統統計學的數據采集具有里程碑式的影響,它為統計學數據收集提供了一個更加便捷、更加全面、更加精確的數據采集方式,大數據對統計學的影響就如同人類有了火,使統計學在數據收集上的時效性、精準性、全面性有了質的提升。
在大數據出現之前,數據分析一般指的就是通過統計分析對收集到的數據進行整合消化,但由于數據采集方式有限,收集到的數據往往并不能全面正確地展示真實的數據信息,因此數據分析具有較高的錯誤性,需要人為地進行辨別有用信息和無用信息,給統計分析工作帶來了極大的不便。大數據的出現,優化了數據采集的效果,為數據分析提供了良好的數據基礎,使統計分析能夠多方面同時進行,對分析對象的了解情況更明確,從而能夠更好地對分析對象進行畫像,掌握分析對象的變化規律。
統計學中有一個重要的概念叫作畫像,即通過統計分析的結果對分析對象進行畫像,例如如今比較火熱的互聯網自媒體粉絲畫像,就是通過對自媒體的粉絲群體的年齡、愛好、瀏覽時間、打賞能力等進行分析畫像,然后通過畫像區分分析群體從而對這些用戶進行某一類視頻的推送。在大數據出現之前,這類統計分析的畫像工作一般比較難展開,因為這需要十分充沛的數據作為支持,才能夠得到具有使用價值的畫像。而隨著大數據的出現,數據采集變得更加簡單,統計分析畫像也變得更加簡單了③。
大數據的出現對傳統統計學的統計分析具有分析結果更直觀、更準確的影響,它建立在大數據提供的充沛的數據支持上進行的分析,對反映當下網民的各項數據有著更具有時效性的統計分析結果。
值得一提的是,數據和分析的關系是相依相存的,有海量的數據信息如果不進行分析的話,那也只是儲存盤里的KB,而分析如果沒有數據支持,也只是紙上談兵罷了,而大數據為統計學分析提供了充足的數據資料,因此,數據分析的發展也變得更加精準直觀具有時效性了。
傳統的高職院校統計學教育,更多的是停留在理論知識的教育,且由于教學材料的更新速度慢,對統計學教育的與時俱進的要求產生了非常大的不利影響,很多統計學教育甚至停留在幾十年前的水平水準,造成長期原地踏步現象。
高職院校的統計學教育受教材影響,教學時間一般比較緊湊,因此很難有機會進行社會實踐,應用教育非常少,老師在進行統計學教育時,往往教授的只是理論知識。但統計學是一門實踐性要求非常高的學科,對使用者的數據采集、數據分析的實際操作經驗要求非常高。這一點是非常容易理解的,傳統的統計學由于其數據收集的信息普遍存在虛假性和欺騙性,需要統計人員人為地對數據的有效性進行判斷,才能得到更精準的結果,而如果統計人員實踐經驗較少,就很有可能造成這些虛假信息被當作真實信息進行統計分析,使分析結果不準確。
長期接受理論知識教育而沒有進行實踐操作,漸漸地會使高職院校的統計學專業學生對統計學的興趣降低,純理論知識教育會提高專業的難度,造成學生知道理論,卻不知道該在什么時候運用理論的現象出現,打擊學生自信心。而當學生進入工作崗位后,一般需要從零開始獲取實踐經驗,造成高職院校統計學專業的學員流失率較大。
大數據的出現,極大地避免了這些不良現象的發生。統計學有一個基礎的理念,那就是從數據中看問題,即通過數據了解一個事物。互聯網是非常能夠吸引人注意力的一件事情,因為其包羅萬象,每個人都能夠在互聯網上找到自己感興趣的東西,因此每個人都會在互聯網上留下痕跡,AI 就可以進行數據收集。這種數據收集的方式非常簡單且快捷,使高職院校也能夠具備課堂實踐的條件與能力,能夠很大程度上提高高職院校學生的實踐能力,使學生從數據中看問題的能力得到充足的鍛煉。
而大數據的出現對統計學來說具有跨時代的意義,基本將統計學區分為傳統統計學和與互聯網結合的大數據統計學兩種,使高職院校的教材能夠得到更新以方便學生能夠緊隨時代的步伐。教學材料不再局限于基本概念、基本公式,而是結合實踐對符合互聯網大數據環境的各種數據進行分析,通過這種方式獲取教學材料,加上一部分傳統統計學中不可拋棄的教材進行綜合教育,最終達到調整教學重點、提高實踐教育、提高學生主觀能動性的目的。
高職院校的統計學專業教育,是培養新一代大數據統計學專業從業人員的重要場所,是保證對將來不斷發展的互聯網大數據進行有效分析的重要前提。隨著互聯網大數據提供的更多、更廣泛、更精準、更具有時效性的數據,統計學教育也存在著培養出對大數據分析能力更高的人才的要求。因此對于高職院校來說,只有掌握好機會,跟上大數據發展的腳步,提高教學質量和實踐能力,才能夠培養出綜合能力更強的學生,以促進統計學的發展。
注釋:
①王麗偉. 大數據背景下高職院校統計學教學改革研究[J].今日財富,2019(21):209- 210
②時光. 大數據背景下高職統計學教學改革研究[J].現代職業教育,2018(36):252- 253
③祁艷艷,張晶晶,張晉.大數據背景下高職院校統計學教學改革研究[J].農村經濟與科技,2018,29(06):289