薛艷
摘要:大數據時代的到來對統計學提出了新的要求。本文從統計學專業發展的新特點出發,剖析了現有教學體系中存在的問題,提出了明確專業培養目標,重新設計主干課程內容;轉變固有思維方式,推進統計學教學改革;創新實踐教學模式,加強實踐教學開展等統計學專業教學體系改革的發展方向。
關鍵詞:大數據;統計學;教學體系改革
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2015)04-0110-02
一、大數據時代統計學專業發展的新特點
(一)數據化的信息收集
傳統的統計研究主要是對已收集的數據進行各種技術分析,包括描述性分析、推斷性分析、截面分析、時間序列分析等,側重點在于技術分析手段的使用上。然而大數據時代,關注的是信息本身。現代信息系統的使用使大數據成為可能,文字、地理方位、溝通等,任何事物都可以量化,一切現象都可以用數據或表格來詮釋。因此,大數據背景下世界是由各種信息和數據所構成的。
(二)全數據模式的研究對象
在信息處理能力受限制的過去,人們缺少用來分析所收集數據的工具,因此產生了隨機抽樣。隨機抽樣法的目的是用最少的數據獲得最多的關于總體的信息,從而使用樣本對總體進行推斷。然而,在大數據時代,數據處理的方式和技術發生了巨大的改變,人們可以通過互聯網、數據庫以及各種通訊工具獲得海量數據,這時隨機抽樣就失去了它原來的意義。簡單廉價的數據收集方法,足夠的數據處理和存儲能力,使得全數據模式成為可能。因此,大數據背景下樣本即為總體。放棄隨機抽樣分析的捷徑,采用所有數據的方法,可以發現一些隱藏在海量數據下的細節。
(三)混雜性的數據處理思維
傳統的統計學處理數據的步驟是首先對數據進行整理和清洗,剔除不完整的或者異常值,然后再利用樣本信息,在允許的誤差范圍內對總體進行推斷和分析,即通過調整精確度的大小來對總體進行研究和分析。然而,在大數據背景下,來自各個時間和空間的數據來源紛雜,格式廣泛,在萃取或處理數據的時候,很難做到把所有的數據都進行仔細地清洗。這種情況下,必須接受數據的混亂和不確定性,因為數據多比少好,因此更多的數據信息比更加智能、更加精確的算法系統還重要。當擁有大量數據的時候,可以忽略一部分精確性,但并不是說不需要精確性,而是數據規模不斷擴大時,確切的數量已經不再那么重要了,可以通過大規模的數據來發現事物背后的規律。
(四)相關關系的基礎分析方法
傳統的統計中,大部分相關關系分析僅限于尋求線性關系,或是在建立假設的基礎上揭示數據相互之間的因果關系,例如Granger檢驗就是依據時間序列數據對變量之間的因果關系進行的判斷,但往往會產生一些虛假的因果關系。這是因為統計關系并沒有蘊含多少真實的因果關系。在大數據背景下,數據點以數量級方式增長,用數據驅動的相關關系分析不再需要建立在假設的基礎上,所以相關關系分析不容易受偏見的影響而發生錯誤。大數據時代相關關系通過回答“是什么”的問題,為人們認識世界提供了一種新的視角。因此,相關關系統計分析是大數據預測的基礎。
二、統計學專業教學體系中存在的問題
大數據背景下傳統的統計學專業教學體系存在的問題凸顯,具體體現在以下幾個方面。
(一)培養目標無法適應大數據時代的社會需求
傳統的統計學專業教學體系的培養目標是通過統計專業核心課程內容的介紹,鍛煉學生收集、整理和分析數據的能力,培養“應用型”統計專業人才。然而,大數據的出現,使得通過數據分析獲得知識、商機和社會服務的能力,從以往局限于少數的學術精英圈子擴大到了普通的社會機構、企業和政府部門,各行各業對統計數據、統計分析的需要使得統計學專業受到了前所未有的關注。大數據背景下,要求統計學作為一種分析工具,能夠與其他專業相互銜接,相互服務,培養“復合型”專業人才。因此,傳統的統計學專業教學體系培養目標存在兩個方面的挑戰:第一,如何協調統計與其他專業之間的關系;第二,如何從“應用型”向“復合型”人才進行轉變。
(二)忽視數據的收集和創新
傳統的統計學專業教學體系重視數據的分析技術,更多的課程設置是圍繞著數據分析方法和技術展開的,例如多元統計分析、時間序列分析、統計預測與決策分析等。基礎的數據收集部分只在統計學原理中有一章的內容介紹,而且是作為非重點一帶而過的。大數據以海量的數據為分析研究的對象,將一切社會經濟現象進行量化,重視的是信息的收集和數據的創新,包括數據的再利用,數據的重組,數據的擴展,數據的折舊以及數據的開放等各個方面。這些內容在原有的教學體系中是沒有體現的。
(三)與大數據時代脫節的教學內容
傳統的統計學專業教學體系仍然固守著原有的教學內容,在近二十年內變化不大。專業的主干課程有統計學原理、國民經濟核算、計量經濟學、抽樣技術與方法等。而在大數據背景下,教學內容以全數據模式為研究對象,強調對所有的數據進行分析,而不是開展隨機抽樣;允許不精確的存在,而不是在給定的精確程度下對總體進行推斷和分析;關注海量數據之間的相關關系,而不是強調數據之間的因果聯系。這些內容都無法在現有的教學體系中體現,因此,傳統的專業教學體系與大數據時代是脫節的。
(四)實踐教學環節薄弱
隨著“應用型”統計專業人才培養目標的提出,學校對實踐教學的重視增強,與過去相比,現有的專業教學體系中已經增加了實踐教學環節。但是,在大數據背景下,實踐教學仍然是統計學專業教學體系中的薄弱環節。主要表現在兩個方面:(1)以模型驅動為主的實踐教學模式已不適應大數據時代的要求。現有的實踐教學內容并不是從數據出發,而是通過尋求一些適合模型的數據來“證明”這個模型的確有意義。這種思維方式與大數據時代的要求是不適應的,因為創造模型的目的是適應現實數據,而不是由模型驅動。(2)以SPSS、Eviews為主的軟件教學已無法處理大數據。現有的實踐教學中,主要講授的是傳統的統計分析軟件SPSS和Eviews,因為這兩種軟件發展成熟,操作簡單,可以處理一般的計量模型和時間序列。但是,大數據時代數據是海量的、復雜的,用簡單的軟件已無法處理和實施。endprint
三、統計學專業教學體系改革的方向
根據以上分析,時代的發展對統計學專業提出了更高的要求,現有的教學體系中存在的各種問題即為統計學專業教學體系改革的方向。
(一)準確定位統計學專業的人才培養目標,重新設計主干課程的教學內容
大數據時代要求培養“復合型”統計專業人才,因此教學體系的培養目標要從簡單的“應用型”向“復合型”轉變。“復合型”統計專業人才要求學生除了具備數據收集、處理和分析的能力外,還要對統計學應用領域的背景知識有一定的了解。因此,按這個培養目標,需要對現有教學體系中的主干課程重新進行調整和設計。專業主干課程分為方法和應用兩個方面。方法類的課程除了原有的計量經濟學、時間序列分析、多元統計分析等外,又增加了機器學習、模擬算法、數據挖掘、R軟件分析(或SAS軟件分析)等處理復雜大數據的方法的課程。應用類課程在保留原有的國民經濟核算,金融統計,證券投資,會計學基礎外,增加一些統計學應用領域的基礎知識課程,例如商業統計、生物統計、保險與精算統計等。此外,適當調整各專業主干課程的課時,一些課程可以增加課時,如軟件分析、數據挖掘等,一些課程可以縮減課時,僅作一些簡單的介紹,如抽樣技術等。
(二)轉變固有的思維方式,在大數據背景下積極推進教學改革
大數據時代,數據更多、更雜,傳統統計學思維方式受到了極大的挑戰。因此,以大數據為背景,轉變固有的思維方式,從以統計技術方法為中心轉換到以信息數據為中心,推進統計學專業教學改革十分重要。具體來說,可以弱化傳統的推理論證的教學模式,強化數據收集、數據處理和數據分析的能力培養;強調數據本身的價值,讓數據說話,用簡單的方法了解數據背后所隱藏的信息和規律;使用項目式訓練,讓學生從項目中真正體驗數據化處理的整個過程,達到理論和方法的結合;加強課堂教學與實驗教學的統一和貫通,如在傳統的教學過程中,將統計學原理、多元統計分析結合SPSS軟件介紹,而時間序列分析又采用Eviews進行介紹,造成學生疲于學習各種軟件,實際上SAS、R等統計軟件可以實現所有的功能,用一種軟件與課堂教學融合貫通能幫助學生更好更深地掌握軟件的使用。
(三)創新實踐教學模式,加強實踐教學的開展
從以模型驅動的實踐教學模式轉變為以數據驅動的教學模式,構造課堂案例教學、實驗教學、課后項目式訓練、校外實習基地鍛煉四位一體的創新型實踐教學模式。計算機快速發展的今天使得大數據成為現實,在處理數據的時候,根據數據的特征創造出新的計算方法來滿足實際需要,這就是數據驅動模式。在實踐教學的過程中,要強調統計數據、計算機編程以及統計分析軟件的結合。目前,R軟件和SAS軟件顯示出了強大的數據處理和數據分析功能,實踐教學環節中可以把這兩種中的一種融入到專業課程中去,將計算機軟件與課堂教學結合起來。此外,課后的項目式訓練和校外實習可以帶動學生了解和掌握整個數據分析實踐的流程,激發學生學習的興趣,在實踐教學的過程中要多鼓勵、多開展。
參考文獻:
[1]曾五一,等.經濟管理類統計學專業教學體系的改革與創新[J].統計研究,2010,(2).
[2]陳倩.大數據背景下對統計學課程教學模式的思考[J].科技資訊,2013,(21).
[3]岑仲迪,徐愛民,奚李峰.服務創新能力培養的統計學專業實踐教學體系的探索與實踐[J].高等理科教育,2012,(5).
[4]雷敏.統計學專業實踐教學體系的改革與實踐——以南京人口管理干部學院為例[J].科教文匯,2012,(10).endprint