馬艷萍
(北京交通大學 理學院,北京 100044)
隨著大數據時代的到來,統計學已經成為數據科學、人工智能、公共衛生和精準醫療等領域的理論基礎和重要工具。加強統計學的教育不僅成為社會共識,而且在國家層面也得到了高度重視。當前在中小學數學教學中就引入了統計學的內容,概率統計成為高考數學的必考知識點。在高等教育中,2011年國務院學位委員會把統計學從數學和經濟學中獨立出來,設立為一級學科。
普通高校中,依據對統計學學習目標和需求的不同,教學可以分成兩個層次:(1)統計學本科生和研究生的專業教學,其目標是培養統計學科研、教學和應用的專門人才。(2)作為本科生數學類基礎課,面向全校理工類和經管類學生的“概率統計”課程的教學,其目標是培養學生概率統計的思維模式,為學生進一步學習專業知識和進行科學研究提供必需的基本數學工具。
本科階段的“概率統計”公共課和統計專業的專業課教學,全國范圍內經過多年探索和實踐,課程體系日趨成熟完善,也有諸多這方面的教學改革論文。例如:彭江濤和孫芳(2016)提出在公共基礎課“概率論與數理統計”的課程教學中結合專業特點的案例教學法[1]。何芳麗和曾祥艷(2018)針對經管專業“概率統計”課程探討了利用互聯網豐富的教學資源輔助教學的教改方法[2]。胡瑞香(2020)提出在講授“統計學基礎”課程時,把課程思政理念融合在教學過程中[3]。陳聰和陳超英等(2019)提出“數理統計”課程教學從教學內容、教學方法、教學手段等方面一系列的改革研究和實踐探索[4]。曾祥艷和李向利(2020)針對“數理統計”課程提出了以提高學生應用能力為目的的教學內容和教學模式的改革措施[5]。
然而,面向理工類和經管類研究生的統計學教學活動在國內高校并未普及,文獻中更少討論。但對這方面的教學需求日益增長,例如,近幾年北京交通大學“統計方法與計算”課程的選課人數每次都有300—500人之多。在“統計方法與計算”的教學中,北京交通大學教學團隊不斷探索嘗試,積累了較豐富的經驗。本文結合北京交通大學的教學實踐,拋磚引玉,探討新時代大數據背景下理工類和經管類研究生統計學教學改革有關問題。
據了解,北京交通大學是國內高校中較早對研究生開設統計類課程并一直堅持下來的高校之一。2000年之前,北京交通大學理學院就開設了面向全校研究生的“應用數理統計”課程(2006年更名為“統計方法與計算”),這說明了北京交通大學理學院開設這門課程的超前意識。理工類和經管類研究生的統計學課程教學,主要面臨以下三個問題:
該課程是公共限選課,授課對象是全校理工類和經管類研究生。最初設立課程教學內容時,考慮到當時北京交通大學本科公共課程“概率論與數理統計”的授課內容,以及部分研究生是由外校考入的,本科所學的“概率論與數理統計”課程內容與北京交通大學不一致,學生的數理基礎也參差不齊,所以“應用數理統計”課程內容設置主要包括概率論的復習與補充、數理統計的基本概念以及抽樣分布、參數估計、假設檢驗、回歸分析、方差分析六部分。這些均是數理統計的傳統教學內容。
近年來,隨著數據科學和人工智能的興起,統計學發展迅速,理論和方法都有了較大的變化,而且在各個學科中起到越來越重要的作用。這些都體現在教與學兩方面。教師在自己的科研與教學以及參與的應用項目中接觸到越來越多統計學新的進展,需要把這些新的方法、思想和理論提煉總結出來教授給學生;越來越多的研究生實際上是帶著科研論文和項目中遇到的統計學相關問題來上這門課的,而經典的統計學內容已經不能很好地適應大數據時代的發展,也不能滿足學生對統計學從理論到方法再到應用多方位的需求。
為了適應新的形勢,2017年北京交通大學本科生“概率統計”課程做了相應調整。例如,增加了正態總體參數的假設檢驗等內容。因此,研究生的“統計方法與計算”課程也需要隨之調整。此外,近年來為了使理工類和經管類的研究生在校所學知識更適應用人單位的需求,擴大就業面,這些專業在制訂培養方案時,都增加了專業課的課時,壓縮了公共課的課時。“統計方法與計算”的課時已從原先的40課時調整為32課時,如何利用有限的課時讓學生掌握盡量多的統計知識和統計方法是我們面臨的挑戰。
針對以上問題,結合理工類和經管類研究生的需求以及統計學學科本身的特點,我們明確了該課程教學改革的指導思想。
1.正如《中國大百科全書·數學卷》給出的統計學定義,統計學不僅有嚴謹的理論體系,而且在實踐應用中有一整套科學的數據處理過程。我們在課程中力求展示統計學方法論的整個過程,而不是采用傳統的知識點講授的教學模式。這需要對現有的統計學知識體系進行整合優化,對優秀案例加以總結提煉,以適應該課程的教學。
2.當前海量數據的出現以及對數據信息的深度挖掘使統計學研究模式產生了深刻變化。例如,傳統數學理論的推導與證明,已經轉變為理論分析結合利用高性能計算技術驗證的方式,教學中需要與時俱進予以體現。
3.課堂教學課時縮短,并不意味著教學內容的縮減和教學質量的降低。針對研究生的特點,轉變“課上講授+課下習題”的教學模式,將課堂教學、案例先導、課下自學、課后互動交流和考核方法多元化當作有機的整體考慮,以期增進教學效果,提升學生的應用能力。
4.利用新的教學方法和技術提高教學質量。在此指導思想下,我們將在下文具體闡述北京交通大學已進行的教學改革實踐以及計劃進行的嘗試。
近幾年,北京交通大學對本科生公共必修課“概率論與數理統計”教學內容進行了調整,同時加強了基礎課的考核力度,學生的數理基礎明顯提高。因此,可以適當減少“統計方法與計算”中對概率論的復習部分的教學內容,僅保留本科課程中沒有講授的條件數學期望和特征函數部分,及順序統計量與樣本極差的內容。
2017年起,正態總體參數的假設檢驗內容已經調整到本科課程中。因此,“統計方法和計算”中不再講授這部分的基礎內容,擬增加假設檢驗p值的定義和應用,這在處理實際數據的檢驗問題中經常用到。對于有些外校考入北京交通大學的研究生,如果對這部分內容不熟悉,我們會建議其通過自學以及與老師課后交流的方式進行學習補充。進行這些調整后,可以為增加新的教學內容進行教學改革提供更多的課時。
數據預處理的難度并不是太大,所以在以往的教學中常被忽視。但它是利用統計方法進行數據分析過程中非常關鍵的步驟,特別是非統計專業的科研工作者和工程技術人員,他們往往是第一時間收集到第一手數據,需要盡快給出數據大致屬性以便進行更深入的分析。因此,近幾年我們在教學中增加了探索性數據分析內容,引入了幾種對數據進行分析的圖表方法,以及產生隨機數的內容,通過圖表對數據進行初步分析,為之后引入各種統計模型和方法進行實證分析做準備。這部分內容的教學取得了學生很好的反饋。
根據調研以及與學生的交流,我們了解到在理工類和經管類問題研究中,無論是研究生還是科研人員最常見的統計課題大都是與多元和高維數據處理相關的問題。多元統計與高維數據分析已成為數據科學和人工智能領域的基本方法和重要工具。因此,強化多元統計分析內容的教學是非常必要的。
我們計劃將多元正態分布作為教學重心,并討論其參數估計、假設檢驗等問題,這是多元統計分析的理論基礎;引入用于處理多元數據分類問題的聚類分析和判別分析;處理高維數據降維問題的主成分分析和因子分析也扮演著不可或缺的角色;增加回歸分析中逐步回歸的內容,這是處理多元數據建模中篩選變量的重要方法,由此可以將回歸分析和多元統計的想法有機結合在一起,在較短的篇幅內多角度展現統計學的方法應用。
我們更強調統計思想的培養、統計方法原理的介紹和計算技術的應用,因此只簡略教授數學理論的推導,爭取在有限的課時中給學生更多統計思維的訓練和方法的綜合應用。
對“統計方法和計算”教學內容進行較大幅度的整合優化,可以借鑒的資料不多。我們也深知教學改革不可能一蹴而就,將本著循序漸進的原則,根據學生的反饋,逐步將我們的教學理念和對課程體系的思考付諸實踐,以期取得更好的效果。
“統計方法與計算”這門課程主要是向理工類和經管類研究生講授統計方法。由于課時緊張,課上主要以教師講解為主,學生只是被動學習,效果并不是很好。隨著網上教學資源的豐富,以及各種教學平臺和軟件的開發,大學本科的各門學科開展了各種教改嘗試,我們也希望借鑒本科的教學改革,進行研究生公共課程的教改實踐。
研究生有一大部分來自外校,本科階段學習的“概率論與數理統計”知識與北京交通大學的不盡相同,內容偏簡單。即使研究生是在北京交通大學讀的本科,由于是在大二學習的“概率統計”,到了研究生階段,間隔時間較長,對課程內容可能有些生疏。為了推進課程內容,以往我們不得不在課堂上給學生復習本科學習的“概率統計”中的部分內容。隨著互聯網教學資源的豐富,這部分短板完全可以讓學生通過網上“概率統計”的慕課資源來復習和補充,北京交通大學“概率論與數理統計”課程組所錄制的慕課也于2018年年底在中國MOOC網上線。另外,因課時的關系在課堂上僅能介紹多元統計方法的應用部分,若有學生想了解各多元統計方法的理論推導,由北京交通大學錄制的“回歸分析“和“多元統計分析”慕課已于2020年7月在學堂在線網上線,這些都會給學生進一步的學習提供幫助。此外,互聯網上還有很多其他高校錄制的優秀慕課,這些都可以供學生按需選擇,在課余時間針對自己欠缺的知識點進行學習和補充。
“統計方法與計算”是應用性很強的課程,案例教學是其重要的教學方式。我們通過與學生交流和查閱文獻,結合當前講授的內容,從中篩選出若干典型案例,進行案例教學平臺的建設,也亟待在后續的教學中不斷增加更具有應用背景的多維數據分析的教學案例。案例教學中,主要以統計軟件的演示為主,向學生介紹如何利用統計軟件進行各統計方法的應用,進一步引導學生正確解讀和分析統計軟件輸出的結果。
研究生選修“統計方法與計算”往往是帶有科研項目或論文中的問題,課堂的知識傳授和被動學習并不能滿足學生的需求。部分學生非常有意愿與老師就具體問題進行課后交流。因此,任課老師需要在課堂之外,加強與學生的討論。事實上,這是對教學雙方都大有裨益的教學模式。一方面,學生通過與老師課后的討論,學到更多的知識,對解決問題很有幫助;另一方面,學生帶來的統計問題無論大小難易都是現實中鮮活的例子和真實的數據,這對從事統計科研與教學的人員來說是非常好的案例和數據資源。其實,我們已有的一些教學案例就是與學生在互動中提煉總結出來的。在現有的課程設置和教學管理模式下,怎樣更有效地進行互動,是非常值得探討的。
“統計方法與計算”課程現在的總評成績是由作業和期末閉卷考試成績兩部分按照一定比例構成的。這主要是對學生理論知識掌握情況的考核,并沒有很好體現出學生的統計方法應用能力。
例如,如果教學內容增加了多元統計分析部分,因為這部分著重介紹統計方法的應用,并不適用于期末卷面的考核,需要增加實例分析來考核學生對此內容的掌握情況,那么這門課程的總評成績需要由平時作業、實例分析和期末試卷三部分組成,各部分所占的比例需要在教學實踐中不斷調整,以達到合理的標準。
我們也一直在探索實例分析的考核方式。現在有一些備選方案,例如,各自對某個具體問題討論然后以小論文的形式完成;借鑒數學建模競賽的方式,以3—5人組成小組完整地完成從數據收集、預處理、統計建模分析的整個過程,最后提交綜合報告。我們期待在今后的教學中實踐這些想法,不斷提高學生的學習興趣,提升教學的品質。
隨著大數據時代的來臨,人工智能以及計算機技術飛速發展,統計學作為這些學科的理論基礎和重要工具,其教學面臨很大的挑戰,同時也為教學的改革創新提供了巨大機遇。本文以面向理工類和經管類研究生“統計方法與計算”為例,探討了統計學教學當前面臨的主要問題,闡述了進行教學改革嘗試的指導思想,并從教學內容的調整、教學模式的轉變和考核方式的變化等方面討論了教學改革已采取的措施以及未來的思路和方向。
通過分析和討論,對于“統計方法與計算”這門課,我們認為還需進一步解決如下問題:
1.與新課程內容相契合的案例發掘、收集、提煉和總結。特別是能反映國家各行業蓬勃發展、與時俱進的應用實例,應進行提煉總結,引入課堂。同時,在專業知識教學的同時,也要將思政教育更好地融入課程建設。
2.一門優質課程,一定需要好的教材相配套,方便學生學習,利于課程普及。目前雖然也有部分高校出版面向非數學類研究生使用的“數理統計”教材,并增加了部分多元統計方法內容,但是其內容選取的思路與我們的指導思想有較大差異,這些教材并不適合直接作為北京交通大學“統計方法與計算”課程教材使用。這就需要我們整理多年來的教案,增加新的內容和案例,盡快編寫更適合北京交通大學“統計方法與計算”教學內容的教材,完成教材的建設。
3.引入先進的教學技術。在課時短、內容多、理論難度大和應用背景強的情況下,將案例教學實驗化、可視化,激發學生學習興趣,提升學生參與性、互動性,增強學生靈活運用知識的能力。這是我們下一步要探討并實踐的課題。
我們相信,在大數據時代隨著統計學理論和應用的飛速發展,會有越來越多的人參與到統計學課程教學改革的嘗試與探索中,期待統計學的教學能為國家的發展和建設作出更大的貢獻。