胡云霞
摘 要:2017年12月17日國家統計局與貴州省人民政府簽署共辦大數據統計學院戰略合作協議,開創了大數據統計學人才培養新模式。大數據時代下,統計數據由格式化、標準化的結構型樣本數據變為非結構型總體數據,數據特征的變化,對傳統統計學理論知識和教學方式方法提出了挑戰。大數據背景下,統計學課程要及時引入大數據思維,修訂傳統統計學教學內容,創新教學方法,鍛煉學生大數據搜集、篩選、分析和挖掘等實踐操作能力,探索理論與實踐相結合的綜合考核體系,以提高大數據背景下統計學的教學效果和水平,增強學生自主學習、綜合運用理論知識和實踐創新能力。
關鍵詞:統計學;大數據;教學改革;創新
中圖分類號:G4 文獻標識碼:A doi:10.19311/j.cnki.1672-3198.2018.35.086
十九大報告中,習近平主席兩次提及“大數據”和“數字中國”,2017年12月8日在中共中央政治局就實施國家大數據戰略進行的集體學習中進一步指出,要推動國家大數據戰略,加快建設數字中國,以數據為紐帶促進產學研深度融合,打造多層次、多類型的數據人才,推動實體經濟與數字經濟融合發展,因此,大數據已經提升到國家戰略高度。統計學作為一門提供搜集、整理、展示和分析統計數據內在規律的方法論學科,在大數據時代發揮著不可低估的作用。大數據具有數據全面、數據流龐大、類型繁雜、價值密度較低、動態性和高時效性等特點,這對以傳統統計數據為研究對象的統計學提出了挑戰,統計學理論知識和教學方式方法亟待更新和改進。
1 大數據對統計學教學的影響
1.1 研究對象和內容發生變化
傳統統計學中,受搜集數據的條件和方法限制,統計數據往往是通過抽樣調查獲得的樣本和結構數據。大數據背景下,統計數據主要基于現代信息技術與工具自動記錄、儲存、動態連續擴充的各種類型的數據,包括所有格式的辦公文檔、圖片、文本HTML、各類圖像和音頻、視頻信息等,數據大多屬于非結構型、半結構型或異構型,難以用傳統的統計方法加以分析和表現。不同的網絡信息系統也沒有統一的數據識別方式和數據分類標準。大數據是全面、復雜、多層次、多類型、良莠不齊的,統計學的研究對象從樣本數據,格式化、標準化的結構型數據擴充到了總體數據和所有類型數據。
1.2 數據處理方法和手段發生變化
傳統的統計學是針對樣本容量不大的部分數據,對其進行收集、整理和分析的。大數據因其數據規模巨大,目前主流統計軟件工具很難在合理時間內實現數據獲取、整理、分析并獲得洞見。大數據是對痕跡的自動記錄,本身不具有甄別和篩選功能,會受到大量沒有實際意義、無價值甚至虛假信息的干擾,如果處理不當就會得出錯誤結論。不同于傳統統計數據的固定性,大數據是連續動態擴充的,具有階段性特征,同樣的關聯物在不同時間段結論會有偏差。大數據時代獲得的是總體數據而非樣本數據,傳統的推斷統計學方法中的假設檢驗和參數估計,對大數據不再適用。雖然諸如因子分析、聚類分析、相關與回歸分析等傳統統計分析方法仍然可以應用與大數據領域,但它們在處理規模較大的數據集合時,效率無法達到用戶預期,且難以處理復雜的數據。這些都對統計數據的處理方法和手段提出了挑戰。
1.3 對學生自主學習、實踐操作應用能力提出更高要求
目前統計學教材里主要運用已經加工整理過的二手數據進行統計分析,學生無需自己搜集反映實際問題的原始數據,被動盲目地學習理論知識,對數據背后的實際問題了解也只流于表面。大數據背景下,數據的搜集、分類、篩選、分析更具有挑戰性。掌握如何獲得海量數據并進行整理分析,要求學生具有更強的自主學習和應用操作能力。一是要求學生具有隨時從現代信息網絡和數據源接口獲得即時數據的能力,變被動給予為主動獲取。大數據時代,數據流轉更新迅速,用二手數據難以及時準確反映現象本質規律。二是要求學生在掌握傳統統計分析方法的同時,還要及時關注前沿非結構型數據分析理論和方法,打下扎實的整理分析數據的理論知識基礎。三是要求學生不僅要掌握主流的統計分析軟件,如excel、spss、eviews等,還要掌握處理大數據的計算機編程軟件。
1.4 傳統的統計學教學方式弊端凸顯
傳統統計學教學方式是以“老師”為中心,“重理論,輕應用”,老師在課堂內講,學生通過課后復習和作業實現知識的內化。這種教學模式下,教師和學生“各自為政”,隔離式地完成教與學的任務。老師是課堂內的主人,負責將統計學知識以填鴨、滿堂灌的方式進行講解,學生沒有積極主動參與其中,對所學知識也似懂非懂,知其然不知其所以然。學生的自主學習能力沒有得到很好地培養和鍛煉,難以適應大數據時代主動學習的要求。現有統計教學內容偏重理論,過多的時間花在解決“三多兩難”,即概念多、原理多、公式多、難理解、難記憶問題上。教材的案例也更新不及時,缺乏新意和吸引力。
2 大數據背景下統計學教學改革
2.1 將大數據思維引入統計學課堂
大數據是信息網絡時代必然趨勢,大數據時代,數據的體量、結構與傳統數據明顯不同,其搜集、整理、分析方法也隨之變化,統計學教學中應與時俱進,引入大數據思維,增強學生大數據意識。
傳統統計數據收集是根據研究目的,科學設計調查方案,精心組織和實施各個環節,有針對性地收集數據,投入成本高且所獲數據量有限。大數據時代,給我們提供了巨量、全方位的數據,我們的重心從如何獲得有限數據,轉移到如何從海量數據中,利用統計方法分類、篩選,剔除垃圾數據、無價值或不重要數據。傳統的統計學理念是“獲得”數據,大數據時代是“篩選”、“刪除”數據。
傳統的統計分析思維是從“假設”到“驗證”,即根據研究目標提出相應假設,再通過實證分析驗證假設的準確性,這種假設和驗證受限于研究者的思路和數據質量,結論的科學性和可靠性值得商榷。大數據背景下,分析思維變為“探索”到“總結”,它可以不受任何假設限制,直接從數據中探索規律,再加以總結,得出結論。這些轉變極大地拓寬和豐富了統計分析理論和思路。
當然,大數據時代,并不意味著傳統的統計方式方法就不重要,從必要性、安全性及經濟性角度考慮,并不是所有數據都可以或有必要從大數據中獲得的,即使是大數據也必須輔之以統計分析才能得出相應結論。這就要求我們在統計教學中既要夯實傳統統計學基礎,又要傳遞大數據思想,鍛煉學生利用互聯網信息技術和各種數據源收集數據,探索從大數據中進行再篩選、再選擇的統計方法。
2.2 調整更新教學內容
統計學是以數據為研究對象,大數據時代顛覆了傳統數據概念,統計學教學內容必須適應時代要求,與時俱進,適時調整和更新教學內容。
2.2.1 修訂傳統統計學教學內容
多數傳統統計理論是在樣本數據的基礎上提出的,而大數據時代的數據屬于總體數據,傳統的統計學內容側重點應做相應調整。例如,在總體數據下,抽樣分布、假設檢驗與參數估計等基于樣本數據理論的重要性明顯減弱,而數據梳理和分類方法,結構化數據與非結構化數據如何對接,以及如何發現高維數據中的結構模式和相關關系將越來越重要。傳統統計學中關于抽樣誤差的界定也應重新描述。傳統抽樣數據中既包括抽樣誤差又包括非抽樣誤差,抽樣誤差是可以根據抽樣分布理論進行計算和控制,非抽樣誤差通過科學合理的組織方式可以得到較好的制約和防范。大數據屬于總體數據,不存在抽樣誤差,只有非抽樣誤差,但因體量龐大,繁雜多樣,其非抽樣誤差較難控制。對傳統統計學教學內容進行調整是不置可否的,但具體調整哪些,如何調整,調整程度都有待進一步探討。
2.2.2 增加與大數據分析相關的計算機內容的學習
EXCEL、Eviews、SPSS等是當前統計學課程采用的主要教學軟件,它們能較好地對傳統數據進行建模、分析、預測,但難以對大數據進行分析和挖掘。在統計軟件的學習上除了要求學生掌握基本的統計軟件操作外,應考慮先修與大數據分析有關的計算機專業課程,如數據庫開發與設計、Hadoop、Hive等計算工具處理大規模多源異構數據和腳本語言Python。同時,要隨時引導學生關注前沿大數據分析方法和理論,增強大數據分析能力。
2.2.3 轉變教學方式方法
大數據時代對學生自主學習和綜合應用能力提出了更高要求,以往機械的、以教師為中心、“填鴨式”的教學方式已經不適合。統計學課程的教學要充分利用網絡資源,發揮學生的自主性,創新教學方式。《國家教育事業發展“十三五”規劃》明確提出,全力推動信息技術與教育教學深度融合,鼓勵教師利用信息技術提升教學水平、創新教學模式,利用翻轉課堂、混合式教學等多種方式用好優質數字資源。統計學課程教學中,教師可以通過慕課、微課的形式對各章內容進行梳理,引導學生學習、復習。利用微課實現統計學與其他相關課程及當前經濟熱點的對接,如金融學、投資學、市場營銷、電子商務等都涉及統計學知識,在統計學教學中,可結合學生專業背景,將相關專業課程案例以微課的形式展示出來,提高學生學習興趣,引導學生思考。教師以項目為載體,布置任務,學生 以團隊的方式,通過網絡搜集數據,合作完成數據的分類、篩選、分析,最終得出結論,讓學生實實在在地接觸實際問題背后的數據,掌握統計學解決問題的方式方法,實現以“學生為中心”的教學方式的轉變,增強學生自主學習和綜合應用能力。
2.2.4 注重實踐操作教學
統計學是一門實踐性較強的學科,大數據背景下,要求學生有較強的動手和創新能力。針對統計學教學中普遍存在的“重理論,輕應用”問題,一方面適當增加實驗課時,讓學生熟練掌握軟件操作,提高數據分析能力;另一方面,課堂之外結合當前經濟熱點和大數據概念,組織學生開展各種專題研究和調查活動,指導學生單獨或合作完成軟件的選擇、數據的搜集、數據的篩選與分析、結果的總結與展示等全過程,鍛煉學生動手能力、實踐操作能力、溝通能力和組織合作能力。
2.2.5 創新課程考核方式
建立合理有效的統計學課程考核體系,既有利于學生在學習中積極性的提高,又能幫助教師明確教學目標,提高課堂教學效果。在統計學課程考核中,要改進傳統的只注重理論知識,靠死記硬背,考后即忘的應試考核方式。考核既要考查學生對基礎知識和計算技巧的掌握,又要反映學生綜合應用理論知識解決大數據實際問題能力和創新能力。因此,統計學課程考核可以從理論和實踐兩方面反映。其中理論成績包括平時作業,章節測驗與期末考試,章節測驗和期末考試可采用開卷形式,以應用分析題為主。實踐成績包括實驗報告,案例分析,論文寫作等,側重考查學生大數據綜合應用與實踐創新能力。
3 結束語
數據作為統計學研究的主體,在大數據背景下已發生了顛覆性的變化,給統計學課程的教學提出了新的要求。大數據時代下,統計學課程的教學思維、教學內容、教學方式和考核方法都需要調整更新,以適應新時代的發展。通過改革創新,提高大數據背景下統計學的教學效果和水平,增強學生自主學習、綜合運用理論知識和實踐創新能力。
參考文獻
[1]朱懷慶.大數據時代對本科經管類統計學教學的影響及對策[J].高等教育研究,2014,(3):35-37.
[2]張引,陳敏,廖小飛.大數據應用的現狀與展望[J].計算機研究與發展,2013,(50):216-233.
[3]周曉宏.管理專業統計學教學模式研究[J].價值工程,2009,(2):123-125.
[4]孟生旺,袁衛.大數據時代的統計教育[J].統計研究,2015,(4):3-7.
[5]潘保國.大數據時代地方高校統計學專業實踐教學體系的構建[J].高教學刊,2016,(19):46-47.