李賓 周俊
摘要:隨著大數據時代的到來,數據從獲取的途徑、特征到分析方法,都發生或正在發生巨大的變化。經管類本科統計學作為學習數量分析的傳統基礎課程,也急需進行相應的變革。
關鍵詞:大數據;統計學;挑戰;變革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2019)06-0245-01
一、引言
統計學是一門科學地搜集、處理、分析和解釋數據的學科[1]。統計分析的目的在于挖掘大量社會經濟現象背后隱藏的數量特征和聯系,揭示客觀現象的一般規律性,進而對相關社會經濟問題做出經驗判斷和預測。
二、大數據時代經管類統計學面臨的挑戰
1.數據的搜集方式的變化。一方面,數據來源極其大量豐富。互聯網時代的信息聯系密切通暢,數據直接來源遍及個體和社會經濟活動的方方面面;且隨著大量專業統計數據庫的建立,間接數據來源也更加豐富。另一方面,數據的收集和獲取手段快速高效。
2.數據類型的變化。首先,數據類型由結構化數據向半結構、非結構數據的轉變。而其中非結構化數據所占比例將越來越多。其二,數據由低頻低維數據向高緯高頻數據的轉變。海量的高頻高維半結構化數據交錯復雜,既隱藏著豐富的價值,也模糊了數據背后的邏輯特征。這對從信息中提取關鍵信息要素,挖掘數據背后的邏輯機理,增加了難度。
3.數據處理和分析方法的轉變。根據維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》,大數據指不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理。
三、經管類統計學課程傳統教學內容和模式的不足
1.教學內容的滯后。首先,在數據的收集階段,現有統計學教材鮮有涉及大數據內容,也幾乎沒有介紹網絡數據采集和挖掘,還停留在傳統的抽樣調查階段;學生也不了解有哪些專業的大數據資源可以作為間接來源。其次,缺少對半結構、非結構數據進行質量分析和清洗過濾知識的系統介紹。第三,統計描述分析部分極少有介紹不同問題背景下數據的處理和篩選;統計推斷部分也多是以簡單低維數據的正態性特征作為先驗假設。
2.教學模式的碎片化。碎片化問題體現在統計學實訓教學環節上,第一,實訓內容不能與實際問題相結合;學生只會按部就班進行單個知識點驗證性的實驗操作和解讀,不善于主動發現問題,也不會熟練利用數據庫資源搜集相關數據。第二,分析能力的欠缺;操作只停留在窗口工具條階段,不會針對具體問題運用軟件進行數據的靈活處理和個性開發。
四、經管類統計學課程教學的改革思路
1.教學內容的調整。統計學內容調整的總體思路是,將傳統統計分析擴充到一般化的數據處理。這樣做可以在本科傳統統計學和大數據分析之間形成一個有效鏈接。具體來說可包含以下幾個方面:(1)補充計算機算法和探索性程序開發的基礎知識。經管類本科生如果能掌握一定的計算機技術和程序開發技能,熟悉數據抓取和挖掘技法,將在大數據分析時代占有先機。(2)注重數據質量和數據清洗的相關內容。數據質量包括完整性、準確性、一致性等幾個方面,只有高質量的數據才能挖掘出真正隱藏的信息,數據清洗是進一步數據處理的基礎。(3)重視多元統計和貝葉斯統計分析方法。基于數據的多元多層次和高維高頻特點,變量間的關聯性也變得更加復雜,數據分析離不開數據和變量的降維等分析方法。
2.教學模式的變革。改碎片式的教學模式為問題導向的進程式教學模式。問題導向的進程式教學模式基于一個典型的社會經濟問題,從數據采集到統計分析,讓案例貫穿整個教學進程。通過這樣的方式,學習如何針對具體問題搜集數據、處理數據和研究數據,以及如何綜合數據信息來解讀所隱含的現實邏輯。與理論教學相聯系,實訓教學部分也改驗證性模式為探索性自主研究模式。
五、小結
本文基于經管類統計學課程的培養要求和大數據發展的現實背景,分析了當前經管類統計學面臨的挑戰和統計學課程教學內容和教學模式的不足,提出了經管類統計學課程教學的改革思路。
參考文獻:
[1]賈俊平,何曉群,金勇進.統計學[M].第六版.中國人民大學出版社,2015.
[2]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,(02).
[3]程園園.大數據時代大數據思維與統計思維的融合[J].中國統計,2018,(1).