崔玉杰 劉喜波
[摘 要] 隨著大數據時代的到來,大數據已經滲透到社會生活中的多個方面。2015年我國首次提出國家大數據戰略。研究國內外統計大綱及人才培養的基礎之上,結合國內的實際情況,以數理統計課程為例,具體研究了教學內容變革的原因、傳統知識拓展與新知識的融合并重,結合教學目標分析了基于python的編程軟件等在教學中的具體設計、考核評價以及新的培養模式對教師的要求,這對于建設一流統計學科有一定的借鑒意義。
[關鍵詞]大數據; 數理統計; 教學改革; 編程軟件
[基金項目] 2020年度北方工業大學教育教學改革重點項目“統計學一流專業建設研究”(207051360020XN135)
[作者簡介] 崔玉杰(1966—),男,山東聊城人,經濟學碩士,北方工業大學理學院副教授,主要從事金融、統計等研究;劉喜波(1962—),男,河北張家口人,理學博士,北方工業大學理學院教授,北京市教學名師,北京市中青年骨干教師,主要從事金融數學、統計等研究。
[中圖分類號] G642.0? ?[文獻標識碼] A? ?[文章編號] 1674-9324(2021)08-0064-04? ?[收稿日期] 2020-10-17
一、大數據時代國內外統計學教學改革研究
(一)大數據國家戰略的提出
2015年11月3日,《中共中央關于制定國民經濟和社會發展第十三個五年規劃的建議》首次提出推行國家大數據戰略[1]。大數據時代對統計專業的學生提出了更高的要求,他們不僅需要掌握統計理論、統計方法和專業統計軟件的應用,還要懂得如何提出問題、如何進行數據操作、如何判斷數據質量、如何評價模型和方法的有效性,以及如何準確清晰地呈現分析結論。國內諸多學者對此進行了探索[2-5]。
(二)美國的做法
從美國的大學教學要求看,美國統計協會早在2014年在其“統計學本科專業課程設置指導綱要”對統計課程設置及其配套提出了指導意見,充分強調了在大數據時代必須具有編程能力、訪問并利用數據庫的能力。要求學生能使用一種或多種統計專業軟件如R、Python、SAS等編程語言進行數據分析。
要求教師具備豐富的數據處理經驗;會利用真實案例以激發學生的積極性,并注重實際數據分析;培養學生將所學的統計理論與方法、統計計算技術用于解決實際問題,使學生通過團隊訓練及職業道德培訓進一步掌握統計處理實際問題的能力,讓學生學會溝通技巧、通過好的反饋機制檢驗教學效果,全面培養學生的數據處理能力[6]。
(三)其他國家的做法
英國倡導大學要更加重視數學和統計學的教學。皇家統計協會的“數據宣言”報告建議提升國民的數學和統計學知識技能,以應對數據經濟時代。政府倡導“更多16歲以上青年人學習數學和統計學”。英國教育部制定了“未來數學支持計劃”,此外,日本、印度等國家也提出了相應的促進措施[7,8]。
二、站在大數據時代理解統計學深刻含義
計算機和互聯網技術尤其是人工智能的快速發展,使得大數據時代成為必然。日常社會經濟活動或客觀現象的記錄、監測是大數據的來源,這樣的超級數據只有通過快速發展的信息技術才能量化、存儲,進而從中獲取很多有價值的數據信息,恰當地運用這些數據才能使各種管理及經營活動更加有效。
統計學從產生開始就是從數量規律上去認識客觀世界、理解客觀世界、把握客觀世界。大數據分析借助統計學的基本思想與方法更能快速把握客觀世界的變化規律。同時,大數據時代也對統計學提出了更高的要求,統計學要通過各種教學改革適應新的要求,作為第一基礎課程的數理統計改革[9]首當其沖,本文以數理統計為例進行研究分析。
三、教學改革的內容分析
(一)大數據時代要求教學內容跟上時代的節奏,呼喚教學內容的改革
數理統計是統計學的理論基礎,是推斷統計的重要內容,在進行小樣本推斷時表現出了強大的功能,被廣泛應用于各行各業。隨著大數據時代的來臨,數據的采集方法及采集數據的量已經達到非常大的級別,如果僅僅用傳統方法進行估計、檢驗、方差分析、回歸分析可能遠遠不夠。
首先,采集數據的方式由手工變為自動化,觀測采集數據更加細致、更加密集,這種變化要在教學中有所體現。也就是說在學好基本統計理論的同時,要加大編程軟件及相應的實驗教學以快速適應時代的需求。
其次,數據的分析方法也要變革,通過統計理論進行建模,再借助計算機編程實現批量數據統計檢驗和分析,當然教學中計算思維的引入不可忽視。
再次,統計數據可視化也成為時代發展的需求,學習者如果能“看得見”“摸得著”“用得上”才能理解得更加深刻,這樣的要求對統計一流學科的建設提出了要求。
(二)傳統統計理論與新知識的拓展并重
傳統統計理論與新知識的拓展并重在教學內容中要有具體體現,重視傳統統計理論同時還要善于融入新知識,使二者有機地結合起來。比如,傳統知識引入推斷統計的三大分布后,我們巧妙地運用軟件R或Python實現三大分布密度曲線和分布曲線的可視化,這樣既可以幫助同學們理解三大分布,同時引導同學們對編程軟件產生興趣,從而避免了枯燥的簡單說教式的教學方法。由于編程手段在課堂教學或實驗教學中的運用,從根本上改變了教學手段的落后,提升了同學們的應用和創新能力。對統計學教師提出了較高的要求,不僅要有豐富的教學經驗,還要對專業知識的理解把握。通過可視化增強學生學習數理統計知識的興趣,加深學生對數理統計知識的理解與運用,進而改變用一面黑板或一張PPT講到底的落后局面,激發學生學習數理統計理論知識,運用現代編程技術實現更復雜的統計數據分析的興趣。
(三)基于大數據時代背景,緊密結合人才培養目標確定教學內容
人才培養是最終目標。從國際上看,美國統計師協會(ASA)早在2014年就在統計課程設置及其配套的指導意見中強調了大數據時代必須具有編程能力、訪問并利用數據庫的能力。要求學生會使用一種或多種統計專業軟件如R、Python、SAS等,并會使用“腳本”等輔助文本編程工具,學會統計理論知識,學會計算和分析數據,并具有解決實際問題的能力。同時英國、日本、印度等國家都提出了類似的要求。我國在建設一流學科時也提出了同樣的要求,從2015年我國首次提出推行國家大數據戰略起,對人才的培養便寫入了教學目標中。
為了實現人才培養目標,數理統計課程在教學中除了夯實基本理論知識,還要在數理統計基礎、估計理論、檢驗理論、方差分析、回歸分析的基礎之上引入三次或四次試驗,具體實驗可以包括如下內容(當然也可以結合教學實際情況做出更加靈活的符合學生需求的其他形式內容安排)。
第一次實驗課,可以安排在理解數理統計中三大基本分布的基礎上,使用Python、R、SAS等編程軟件實現三大分布密度曲線及分布曲線的可視化、分位點的查詢、分布函數的可視化等。①編寫或調用命令畫出三大分布密度曲線及分布曲線,使理論形象化,幫助學生理解三大曲線;②用實驗輔助設計高爾頓實驗板,幫助學生形象化的理解正態密度曲線及正態分布等內容;③通過改變t分布的自由度讓學生動態地看到,隨著自由度增加t分布逐漸近似為正態分布的過程;④通過統計軟件的語句查詢正態分布、卡方分布、t分布、F分布的下分位數及上分位數的具體值,進一步理解顯著性水平的含義,這對全面理解把握數理統計基礎知識會起到事半功倍的作用。
第二次實驗課,在有了統計推斷知識基礎后,利用Python、R等編程實現具體案例的點估計、區間估計,這部分內容是推斷統計的重要內容。①使學生通過編程語言理解如何利用學過分位點、拒絕域得出點估計及區間估計的上限、下限。②用編程作圖,讓學生看到隨著置信水平的變化,區間估計的上限、下限是如何變化的,這就避免了讓學生死記硬背公式,進而使學生在理解基礎知識的基礎上用編程語言解決具體問題。③結合區間估計讓學生知道假設檢驗的基本內容,讓學生知道通過樣本對總體做出判斷時并不保證百分百正確;通過顯著性水平的變化讓學生通過軟件結合可視化理解在較大α水平下拒絕,同樣的樣本在較小α水平下就不能拒絕,從而使學生理解區間估計和假設檢驗是同樣抽樣問題的兩個方面,它們解決實際問題的目標是一致的。學生通過結合估計原理和假設檢驗原理運用編程解決實際問題,這就加深了對知識的理解和運用,不再是簡單的機械的去記憶。
第三次實驗課,在學習完方差分析原理后,用Python、R等編程實現具體案例的方差分析解決實際問題。①結合實際問題,讓學生理解方差分析的適用條件,理解實際問題中理論適用條件的含義,比如實際中怎樣結合軟件設定在方差相等的條件下,對總體均值是否相等進行檢驗。②學生在實驗設計過程中必須思考為什么提出方差分析;當出現多個總體時,對總體均值的檢驗用原來的單正態總體方差總體均值的檢驗方法及雙總體均值是否相等的檢驗是否合適。③通過思考學生認識到對多總體均值是否相等的方差分析方法是解決這類問題必須掌握的有力工具。④學生會理解和使用方差分析表解決實際問題,最后理解方差分析表在解決實際問題中的重要意義,最后全面掌握方差分析內容。
第四次實驗課,在學習完回歸分析的原理后,用Python、R等編程完成具體案例的線性回歸分析,讓學生歸納線性模型中的原理及解決實際問題時應該注意的問題,進而全面理解和掌握線性回歸分析的主要內容。這部分內容以簡單線性回歸分析為起點,使用軟件畫散點圖,通過坐標平移后各個象限散點的多少理解皮爾遜相關系數的實際意義,進而引導學生在許許多多的直線中找到最能“代表”這些散點的最優的直線,這就理解了當初高斯提出最小二乘法的原理。結合軟件讓學生從原理上去學,學生才能學會用線性回歸的基本理論解決實際問題,既做到了夯實理論基礎同時又和現代技術相融合,為進一步學習其他統計學內容打下良好的基礎,在具體的教學中實現了培養人才的目標。
由此可見,一流學科的建設離不開基礎課程金課課程建設。數理統計作為統計學專業的最重要的專業課程之一,要善于激發學生的學習積極性與創造性,借助于現代信息技術培養學生由“要聽課”向“愛聽課”到“想聽課”的轉變。要做到這一點,統計編程軟件起到關鍵作用,結合具體的三次到四次統計實驗課使學生獨立編程認識正態分布、卡方分布、t分布、F分布,從編程實現的可視化上幫助學生去理解復雜的統計基本理論,使學生“看得見”“摸得著”“用得上”,從而激發學生從“愛思考”“想思考”到“深思考”的轉變,讓學生理解基本定理,利用基本定理解決疑難問題,進而讓學生在解決實際問題中激發學生“敢質疑”“敢批判”到“超越創新”的轉變,這些轉變作為新的學習動力激發學生積極性,為實現全面培養學生各方面的能力奠定堅實的基礎。
(四)教學考核評價的改革
教學效果的檢查除了對基本理論知識的考核外,要著重增加過程考核的內容和方式,充分利用現有的大數據手段快速,比如課堂上讓學生利用手機等基本通信工具在線完成重點概念、知識點、公式的復習、理解和掌握,并及時給出評價,最后納入總成績的評定之中,不再僅僅依賴最后期末考試試卷確定課程成績;同時,要把平時的實驗課成績也納入課程總成績中,線上交流、隨機提問、及時復習多種方法實現數理統計理論知識的全面掌握與評價。
(五)高校統計教師在建設一流學科中應該如何做才能符合要求
一流學科建設同樣對教師提出了更高的要求。首先,在熟悉基本理論知識基礎上,需要掌握編程語言處理理論及應用,并使二者恰當融合在一起,以有利于學生消化吸收。設計好師生互動的每一個環節,利用線上平臺及時檢查學生效果,激發學生學習的積極性和創造力,進行統計實驗課時更要引導和激發學生的編程能力,通過編程使學生對基本知識、基本概念理解得更加深刻,充分利用編程軟件的強大計算功能實現統計數據的可視化,讓理論、方法、圖形全方位在學生頭腦中扎根,對培養時代急需的統計人才打下堅實的基礎。
四、結語
總之,大數據時代吹響了統計學教學改革的號角,作為統計學專業的重要基礎課,數理統計責無旁貸地站在了教學改革的前沿。在教學實踐中把信息技術的編程語言引入到課堂中,在金課建設中實現學生為主體,教師為主導,師生全面互動,面向能力培養,實現學生從“要聽課”向“愛聽課”到“想聽課”的轉變,激發學生從“愛思考”“想思考”到“深思考”的轉變,激發學生向“敢質疑”“敢批判”到“超越創新”的轉變。要以編程新技術為新動力激發學生積極性,全面培養學生各方面的能力,這是作為一流統計學科建設及其重要金課建設都必須認真思考的教學改革問題。
參考文獻
[1]高亢,趙曉輝.我國首次提出推行國家大數據戰略[EB/OL].http://www.xinhuanet.com/politics/2015-11/03/c_1117030186.htm
[2]曾五一.統計學類專業教學質量國家標準解讀[J].中國大學教學,2019(11):6-9.
[3]祝丹,陳立雙.大數據驅動下統計學人才培養模式研究[J].統計與信息論壇,2016,31(12):102-107.
[4]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,33(2):3-9.
[5]邱東.大數據時代對統計學的挑戰[J].統計研究,2014,31(1):16-22
[6]龔鳳乾.關于美國三份統計學評估和教育指導綱要的簡介與思考[J].統計研究,2017,34(6):124-128.
[7]黃孔雀,許明.英國高校數據能力培養策略研究[J].中國大學教學,2018(8):91-96.
[8]劉大北,賈一葦.日本《大數據時代的人才培養》倡議:制定背景、研究方向、計劃及舉措[J].電子政務,2015(10):85-95.
[9]唐琳.大數據背景下“數理統計”課程的教學改革研究[J].云南大學學報(自然科學版),2020,42(S1):61-64.