田露
南京理工大學紫金學院 南京 210046
概率論與數理統計(簡稱概率統計)是高校理工科以及經管專業學生的必修課程,對后續專業課學習和實踐應用非常重要。該課程由概率論和數理統計兩部分組成,概率論主要包含(多維)隨機變量及其分布、隨機變量的數字特征、大數定律等內容;數理統計主要包含參數估計、假設檢驗、方差分析等內容。這些內容,一方面對學生的高等數學功底有一定的要求,另一方面概念多且抽象、公式繁且難以理解。所以,雖然這本來是一門應用性的課程,但是學生學習時仍然感覺偏理論輕應用,不了解課程內容與自己專業學習的聯系,因而缺乏學習興趣與動力。因此,如何激活概率統計的教學課堂,如何激發學生的學習興趣,是教師們一直需要思考、探索的問題[1]。
為了激活概率統計的教學課堂,筆者順其自然地想到,在教學過程中引入更具有科研熱點的應用實例,使得學生了解到所學知識與當前科技熱點問題的聯系,提高學生應用數學來分析問題、解決問題的能力。當然,教師們也要清醒地認識到,不能為了改革而改革,現有教學課件中一些簡單而又便于理解的實例,還是可以有一部分保留的,而不是全盤否定刪除。比如“拋硬幣觀察正反面”“抽簽問題”“分組問題”等一些經典的古典概率例題仍然可以適當保留[2]。
一方面,鑒于筆者所在學校是應用型的工科院校,工科生占很大比例,在如今深度學習流行的時代,很多人工智能相關的工科專業會開設深度學習這門課程,而這門課程與概率統計課程交叉的知識點很多[3];另一方面,由于筆者近年來一直從事應用深度學習相關的科研工作,在做科研過程中,經常遇到概率統計中一些基本的知識點,比如條件概率、全概率公式、貝葉斯公式、最大似然估計等,大量的概率統計知識用于深度學習中模型的建立,損失函數的設計等很多方面。所以筆者有意識地去收集一些深度學習與概率統計交叉的知識點,很自然地將這些科研熱點問題或者實踐應用問題引入到概率統計課程的實例中,讓學生真正地看到數學的應用,提高學生的學習興趣以及主觀能動性,當然從教師的角度來說,這也讓科研與教學相輔相成。下面詳細地展示兩個實例。
實例研究舉例1
筆者在講授隨機變量這一章節中常見的隨機變量分布時,首先會先講0-1分布(或兩點分布):
若隨機變量X只取0、1兩個值,且其分布律為
P{X=k}=pk(1-p)1-k,k=0,1 (0
則稱隨機變量X服從參數為p的0-1分布或兩點分布。
關于兩點分布,教學過程中重點在于強調隨機變量X取值只能有兩個。一般以往教學中,都以拋硬幣觀察正反面作為實例。這個例子雖然簡單,但是很難與現實實際問題相結合。尤其是講完兩點分布后,會講二項分布,而二項分布就是n重的兩點分布,所以為了讓學生能充分理解兩點分布,可以找一些更直觀的例子。筆者注意到,其實深度學習中二分類的問題其實就是兩點分布的應用,比如Logistic回歸是一種常用的處理二分類問題的線性模型,也是深度學習中最簡單的分類模型。接下來可以先適當的介紹Logistic回歸的背景知識[4]。
給定N個樣本的訓練集,其中y(n)∈{0,1}稱為類別標簽。在二分類問題中,線性模型的關鍵之處在于需要找到一個線性判別函數f(x;ω)=ωTx+b。特征空間中所有滿足f(x;ω)=0的點組成一個分割超平面(二維情況下就是分割線),稱為決策邊界或者決策平面。決策邊界將特征空間一分為二,劃分為兩個區域,每個區域對應一個類別。Logistic線性回歸模型試圖學習到參數ω*,使得每個樣本(x(n),y(n))盡量滿足
f(x(n);ω*)>0 ify(n)=1
f(x(n);ω*)<0 ify(n)=0
上面兩個式子也可以合并,即參數ω*盡量滿足
對于二分類問題,最簡單直接的損失函數就是0-1損失函數,即
L(y,f(x;ω))=I(yf(x;ω)>0)
其中I(.)為示性函數。但是0-1損失函數的數學性質并不好,它關于參數ω的導數為0,從而導致算法去做梯度下降時無法優化參數ω。
在Logistic回歸中,很顯然會使用Logistic函數作為激活函數(把線性函數非線性化),目的是把線性函數f(x;ω)的值域從實數空間“擠壓”到(0,1)之間,可用來表示概率。
Logistic回歸模型預測條件概率
從而由上面第一個等式進行變換后得到
在這個例子中,一方面涉及了概率統計中的兩點分布、條件概率、對立事件等知識點,另一方面也解釋了為什么將Logistic回歸也稱為對數機率回歸這個事實。當然分類問題不止Logistic回歸線性模型一個例子,比如還可以將機器學習中的貝葉斯分類器作為實例,讓學生看到由概率知識設計的模型,可以解決科研實踐中的一類問題。
實例研究舉例2
在概率統計的參數估計這章中,最大似然估計是非常重要的知識點,同時在數據建模、機器學習中使用廣泛。機器學習中的一個熱門研究問題,無監督學習,其涉及的參數密度估計,恰好就是根據先驗知識假設隨機變量服從某種分布,再利用訓練樣本來估計未知分布中的參數[4]。
使用最大似然估計(MLE)來尋找θ使得logp(D;θ)最大。這樣參數估計問題就轉化為最優化問題:
假設樣本x∈R服從正態分布
其中μ和σ2分別為正態分布的均值和方差。
分別求上式關于μ,σ2的偏導數,并令其等于0,可得:
在這個例子中涉及了概率統計中最大似然估計這個重要的知識點,同時也看到在處理海量的大數據時,數學這個基礎學科發揮的重要作用。然后還可以把上面的正態分布換成多項分布,類似的可以求得參數的估計。
在機器學習中還有很多以概率統計的知識為背景的算法,可以嘗試作為教學案例,比如樸素貝葉斯分類器就是基于貝葉斯定理與特征條件獨立假設的分類方法,而且發源于古典數學理論,需要堅實的數學基礎理論,當然分類效果也很穩定,也有一定的數學理論的解釋。當然機器學習不僅應用了概率統計理論,還有數學中其他分支的理論。比如主成分分析法,是一種常用的無監督學習方法[5],主要用于發現大量數據中的基本結構,對數據進行降維,消除冗余的數據。而該方法主要思想就是,利用正交變換把由線性相關變量表示的觀察數據轉換為由線性無關變量表示的數據。學過線性代數都知道,線性無關的變量本質上取自于原線性相關變量中的部分變量,所以數據量就會大大減少,使得數據變得更易使用,并且還能去除數據中的噪聲。主成分分析可以從數據中識別主要特征,選擇方差最大的方向作為第一條坐標軸,后續坐標軸則與前面的坐標軸正交。所以可以看到,這一個算法中應用到了線性代數、概率統計、高等數學知識,這對學生的綜合分析能力、應用數學能力有很大的提高。
此外,教學模式也應該改革,目前比較流行的是混合式教學模式,其優點是可以運用多種教學資源,尤其是豐富的網絡教學資源與多種技術手段相結合,改變傳統的“填鴨式”教學,提高學生的學習興趣。但是,在實踐中,混合式教學模式改革存在著幾個難點:1)一些基礎的定義、定理抽象復雜,學生自學效果差;2)傳統的面授教育習慣下,學生可能難以適應教學模式的改變;3)公共基礎課受眾面廣,保證每一個學生的學習效果有難度;4)學生基礎參差不齊,采用“一綱一本”的教學方式無法有效銜接;5)一味地追求技術手段的運用,為了“翻轉”而“翻轉”。
所以,任課教師不能盲目地尋找科研熱點作為概率統計中的案例。根據不同難度級別的知識點,教學大綱中對這些知識點掌握程度的不同要求以及針對不同層次基礎的學生,設計不同的案例以及不同的教學形式和評價機制,這樣配合新的教學案例才能有更好的教學效果。關于知識點級別劃分標準如下[6]。
1)一級知識點:具有豐富的數學歷史背景,易于激發學生的學習興趣,并且在教學大綱中要求學習了解或掌握的知識點。在概率統計中有諸如“賭博中止”“抽簽策略”等經典案例,了解這些案例,既有助于學生了解這門學科發展的歷史,追本溯源,又能增加學生的學習興趣。對于這一類知識點,教師可以結合科研熱點,作為引例來介紹對應的基本概念,使得原本枯燥的數學定義盡可能地直觀,便于理解。當然,如果教師時間充裕的話,還可以將科研熱點結合的案例制作成視頻,上傳至學習平臺上,這樣一方面便于統計學生的觀看時間與次數,同時也不占用面授學時數。
2)二級知識點:基于學生前面課程學習,完全有能力理解,并且在教學大綱中要求學生熟練掌握的知識點。以概率論中的“數學期望”為例來說明,該知識點以學生掌握的積分知識為前提,要求學生能夠求解離散型和連續型隨機變量的數學期望。這個知識點的理論并不復雜,積分也是學生在高等數學課程中學習過的知識,但是以往的案例經常停留在計算的層面,學生不免覺得枯燥,體會不到應用性。那么前面提到的機器學習,包括現在很火的深度學習中比如Loss函數、隨機梯度下降等等,很多地方應用到期望這個知識點。所以教師可以結合科研熱點,或者設計一個教學案例,或者也可以作為一個引入期望概念的案例,或者也可以在學完期望后設計一個開放式的小論文,也就是說結合科研熱點設計的方式可以多樣化。
3)三級知識點:非常抽象復雜,學生難以理解的定義、定理。例如概率論中的分布函數、多維隨機變量中的聯合分布律、邊際分布等,一直是學生學習的難點。這類知識點建議仍然以面授為主,以視頻等線上資源為輔,盡量將教學案例設計得更直觀易懂。
任課教師實施教學改革時,經常會面臨課時有限的局限。很多教改的想法很好,但是實現起來往往由于課時緊張,很難執行。筆者之前在做高等數學教改時,探索出可以借鑒數學建模競賽的規則,由教師出三個問題,讓學生課后三人一組,以寫論文的形式提交解決思路,這個方案仍然可以在概率統計這門課程的教學改革過程中嘗試探索。當然最后的期末考核方式也應該多樣化,不要局限于卷面成績,平時成績的比例可以適當地提高一些,增加學生參與的興趣。同時任課教師也可以與專業課教師多溝通交流,更精準地了解數學與學生所學專業課之間交叉融合的知識點,可以引入更多更實用的教學案例[7]。
作為一名培養應用型人才的工科院校的基礎學科教師,可以從自己的科研工作出發,有意識地搜集科研工作中遇到的最新的科研熱點作為應用實例,或者作為數學知識背景進行介紹,或者作為課后延伸的小課題。總之,結合科研熱點的形式不能僅拘泥于教學中的例題,形式應該多樣化。為了保證更好的教學效果,教學模式也采用了混合式的教學模式。將傳統的面授模式結合線上教學平臺,將課堂延拓到課后,把課堂內和課堂外激活后,適當地再在課外仍然不占用課堂時間的前提下,激發學生學習的自驅力,使其主動參與到翻轉課堂中來。
另外,評價機制也要多樣化,不能依賴于最終的期末卷面成績評價,更應該提高平時成績的比例,促使學生功夫下在平時,而不是在期末考試前突擊復習只是為了不掛科,學完就全部忘光,沒有得到任何提高。使得學生能真正感覺到數學的有用性,化抽象為直觀,化枯燥為有趣,提高學生學習數學的興趣和應用數學的意識與能力,使學生在今后的工作中能經常想到用數學去解決問題,為學生將來學好自己的專業打下堅實的數學基礎。此外對于教師而言,借此也認識到,科研和教學并不矛盾,將科研中的實際問題作為背景知識引入教學中,也可以借助教學,對科研問題中所需的數學知識有更深一步的了解,讓科研服務教學,讓教學輔助科研。